CN109034454B - 路线挖掘方法、装置、计算机可读存储介质和计算机设备 - Google Patents

路线挖掘方法、装置、计算机可读存储介质和计算机设备 Download PDF

Info

Publication number
CN109034454B
CN109034454B CN201810663726.1A CN201810663726A CN109034454B CN 109034454 B CN109034454 B CN 109034454B CN 201810663726 A CN201810663726 A CN 201810663726A CN 109034454 B CN109034454 B CN 109034454B
Authority
CN
China
Prior art keywords
positioning
user
points
fragment
point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810663726.1A
Other languages
English (en)
Other versions
CN109034454A (zh
Inventor
孙福宁
孟凡超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Tencent Dadi Tongtu Beijing Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Tencent Dadi Tongtu Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd, Tencent Dadi Tongtu Beijing Technology Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810663726.1A priority Critical patent/CN109034454B/zh
Publication of CN109034454A publication Critical patent/CN109034454A/zh
Application granted granted Critical
Publication of CN109034454B publication Critical patent/CN109034454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Navigation (AREA)

Abstract

本申请涉及一种路线挖掘方法、装置、计算机可读存储介质和计算机设备,所述方法包括:获取移动轨迹定位点;确定所述移动轨迹定位点所属的定位分片;按照所述移动轨迹定位点所对应定位时间的时序,对所述移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;从所述定位分片序列中搜索目标分片序列;根据所述目标分片序列确定相应的路线。本申请提供的方案可以挖掘出准确且完整的用户出行路线。

Description

路线挖掘方法、装置、计算机可读存储介质和计算机设备
技术领域
本申请涉及计算机技术领域,特别是涉及一种路线挖掘方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着计算机技术的发展,出现了与定位或导航等相关的智能交通技术,使得人们在出行时可方便的通过随身携带的计算机设备进行地理位置的定位和导航。并且,随着经济的发展,人们外出的频率也在不断增加。如果根据用户的出行数据,挖掘出或还原出用户经常使用的路线,以便进行相应轨道交通规划或出行交通的安排,将会给人们的生活带来极大的便利。
传统的用户出行路线的挖掘通常都是基于用户的导航数据,根据用户的导航数据挖掘出用户的出行路线。然而传统的基于用户导航行为的轨迹,挖掘用户出行路线的方式覆盖的用户群体不全面,无法覆盖那些选择熟悉或固定路线出行的用户,使得根据用户出行数据挖掘出的用户出行路线不够准确。
发明内容
基于此,有必要针对基于用户连续导航行为而挖掘出的用户出行路线不准确的技术问题,提供一种路线挖掘方法、装置、计算机可读存储介质和计算机设备。
一种路线挖掘方法,包括:
获取移动轨迹定位点;
确定所述移动轨迹定位点所属的定位分片;
按照所述移动轨迹定位点所对应定位时间的时序,对所述移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;
从所述定位分片序列中搜索目标分片序列;
根据所述目标分片序列确定相应的路线。
一种路线挖掘装置,包括:
获取模块,用于获取移动轨迹定位点;
确定模块,用于确定所述移动轨迹定位点所属的定位分片;
组合模块,用于按照所述移动轨迹定位点所对应定位时间的时序,对所述移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;
搜索模块,用于从所述定位分片序列中搜索目标分片序列;
所述确定模块还用于根据所述目标分片序列确定相应的路线。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述路线挖掘方法的步骤。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述路线挖掘方法的步骤。
上述路线挖掘方法、装置、计算机可读存储介质和计算机设备,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
附图说明
图1为一个实施例中路线挖掘方法的应用环境图;
图2为一个实施例中路线挖掘方法的流程示意图;
图3(1)、图3(2)、图3(3)、图3(4)和图3(5)分别是不同移动轨迹周期内用户定位点累积的示意图;
图4为一个实施例中用户常驻点、用户偶然点、用户出行点和用户停留点的分布示意图;;
图5为一个实施例中根据聚类密度和聚类距离区分用户偶然点、用户常驻点、用户停留点以及用户出行点的界面示意图;
图6为一个实施例中不同象限空间中的轨迹簇的界面示意图;
图7为一个实施例中确定移动轨迹定位点所属的定位分片的界面示意图;
图8为一个实施例中表示单个定位分片的出入度信息的示意图;
图9为一个实施例中从用户定位点中,按照相应的聚类特征,确定两个聚类中心点的步骤的流程示意图;
图10为一个实施例中计算定位分片序列对应的分值的步骤的流程示意图;
图11(1)为一个实施例中将用户通勤轨迹定位点进行分片化的结果示意图;
图11(2)为一个实施例中单个定位分片的局部分布界面图;
图11(3)为一个实施例中用户通勤路线的展示图;
图12为又一个实施例中路线挖掘方法的流程示意图;
图13为一个实施例中路线挖掘装置的结构框图;
图14为一个实施例中计算机设备的结构框图;
图15为另一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中路线挖掘方法的应用环境图。参照图1,该路线挖掘方法应用于路线挖掘系统。该路线挖掘系统包括终端110和服务器120。终端110和服务器120通过网络连接。路线挖掘方法可以在终端110或服务器120中完成,终端110可采集相应的用户定位数据后在终端110采用上述路线挖掘方法以进行路线的挖掘。或者终端110可采集相应的用户定位数据后,通过网络连接将用户定位数据发送至服务器120,服务器120采用上述路线挖掘方法以进行路线的挖掘。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑和笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
如图2所示,在一个实施例中,提供了一种路线挖掘方法。本实施例主要以该方法应用于上述图1中的终端110或服务器120来举例说明。参照图2,该路线挖掘方法具体包括如下步骤:
S202,获取移动轨迹定位点。
其中,移动轨迹定位点是用户在出行过程中表征移动轨迹的定位点。移动轨迹是人类生活模式的外在表现,刻画了个体在不同生活区域(如公司、住宅、娱乐地等)间的切换模式。
具体地,计算机设备可获取本地采集的移动轨迹定位点,或者通过网络连接获取来自于用户所携带的移动终端的移动轨迹定位点。用户在出行过程中,可通过随身携带的移动终端获取用户当前的定位数据。其中定位数据包括移动轨迹定位点和相应的定位时间等。
在一个实施例中,用户可通过终端上的应用程序触发定位动作,终端通过内置的GPS(Global Positioning System,全球定位系统)芯片或基于移动运营网的基站进行定位。在一个实施例中,可将定位sdk(Software Development Kit,软件开发工具包)嵌入到应用程序中,通过用户主动触发的方式获取的终端采集的定位数据。
在一个实施例中,终端可采集定位数据,并将定位数据发送至服务器,在服务器端执行路线挖掘的方法。或者,终端在采集定位数据后,直接在终端本地执行路线挖掘的方法。
在一个实施例中,获取移动轨迹定位点的步骤包括:获取多个移动轨迹周期内累积的用户定位点;从用户定位点中筛选表征移动轨迹的移动轨迹定位点。
其中,用户定位点是用户通过终端触发定位动作时的定位点。移动轨迹周期,比如一天、一周或一个月等。具体地,计算机设备可获取多个移动轨迹周期内累积的用户定位点。比如,可以一天为一个移动轨迹周期,计算机设备获取用户一个月内的历史用户定位点。根据用户定位点进行聚类计算,从用户定位点中筛选表征移动轨迹的移动轨迹定位点,过滤掉用户偶然点等噪音数据。
在一个实施例中,如图3所示,图3(1)-图3(5)分别是不同移动轨迹周期内用户定位点累积的示意图。图3(1)所示为1个工作日内用户定位点累积叠加的示意图;如图3(2)所示为5个工作日内用户定位点累积叠加的示意图;如图3(3)所示为15个工作日内用户定位点累积叠加的示意图;如图3(4)所示为30个工作日内用户定位点累积叠加的示意图;如图3(5)所示为根据用户30天内的用户定位点,从统计角度还原出的用户出行路线,特别是用户通勤路线。从上图中可知,通过1天,5天,15天,30天的用户定位点的轨迹可以看出,单日用户定位点是非常离散的,也不具备位置簇的特征,但是通过多日的叠加之后,就可以看出这个用户的出行路线了,具有统计意义。
在一个实施例中,计算机设备在获取移动轨迹定位点时可获取如下格式的数据:uid,lng,lat,daytime,timestamp。例如:用户标识X,116.4356,39.2345,2018-01-02,12:13:11。表示用户X,在2018年的1月2日,12点13分11秒钟的时刻上,出现在经度116.4356,纬度为39.2345的位置上。
上述实施例中,通过从多个移动轨迹周期内累积的用户定位点中,筛选表征移动轨迹的移动轨迹定位点,可从多个移动轨迹周期内累积的用户定位点中筛选出符合出行语义特征的定位点作为移动轨迹定位点,过滤了噪音数据,使得移动轨迹定位点都是有效的,且是多个移动轨迹周期内累积的,可以更好的挖掘出用户出行路线。
在一个实施例中,获取移动轨迹定位点的步骤包括:获取用户定位点;确定每个用户定位点相应的聚类特征;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
其中,聚类特征是表征用户定位点的聚类特性的特征,比如聚类密度和/或聚类距离等。聚类密度是用户定位点的局部密度,当用户定位点的局部密度越大,表示在该用户定位点周围的点越多。聚类距离是指用户定位点到最近密度更高点的距离,聚类距离越大,表示该用户定位点与其他密度更大的用户定位点之间的“距离”相对更大。
具体地,计算机设备可获取用户定位点,根据用户定位点的坐标或各用户定位点间的距离,通过聚类算法计算每个用户定位点相应的聚类特征。从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。聚类算法,比如,k-means(基于划分的聚类方法)、fuzzy cluster(模糊聚类算法)、DBSCAN(Density-Based Spatial Clusteringof Applications with Noise,基于密度的聚类算法)或Fast Search and Find ofDensity Peaks(快速搜索和发现密度峰的聚类算法)等聚类算法。
在一个实施例中,通过聚类算法对用户定位点进行聚类计算,得到用户定位点相应的聚类密度和聚类距离。根据用户定位点的语义特征,可将用户定位点划分为用户常驻点、用户偶然点、用户出行点,以及用户停留点。由用户定位点的聚类特征可知,用户常驻点是聚类密度和聚类距离都较大的点;用户偶然点是聚类密度较小、聚类距离较大的点;用户出行点是聚类密度较小、聚类距离较小的点;用户停留点是聚类密度较大、聚类距离较小的点。因此,如图4所示,图4示出了一个实施例中用户常驻点、用户偶然点、用户出行点和用户停留点的分布示意图。比如,可以聚类密度为横坐标,聚类距离为纵坐标建立用户定位点的二维坐标系,可得到四个象限空间。根据四个象限中用户定位点所具有的语义特征,将落入第一象限内的用户定位点作为用户常驻点;将落入第二象限内的用户定位点作为用户偶然点;将落入第三象限内的用户定位点作为用户出行点;将落入第四象限内的用户定位点作为用户停留点。
进一步地,可根据图5来更好的区分不同象限空间中的用户定位点。图5示出了一个实施例中根据聚类密度和聚类距离区分用户偶然点、用户常驻点、用户停留点以及用户出行点的界面示意图。用ρ表示聚类密度;δ表示聚类距离,如图5左上的坐标系所示,以聚类密度为横轴,聚类距离为纵轴,建立直接坐标系,在坐标系中表示用户定位点,可以看出较分散的点为用户偶然点。如图5右上的坐标系所示,以聚类密度和聚类距离的乘积作为y轴,以用户定位点的标号为x轴,在坐标系中表示出用户定位点。其中,纵坐标取值较大的点为用户常驻点。如图5左下的坐标系所示,以ρ/(1+δ)为y轴,以用户定位点的标号为x轴,在坐标系中表示出用户定位点。其中,y值较大的用户定位点为用户出行点。如图5右下的坐标系所示,以1/((1+ρ)(1+δ))为y轴,以用户定位点的标号为x轴,在坐标系中表示出用户定位点。其中,y值较大的用户定位点为用户停留点。
进一步地,如图6所示,图6示出了一个实施例中不同象限空间中的轨迹簇的界面示意图。可对上述图3(4)中30天内累积叠加的用户定位点根据语义上的区分度,用不同象限空间的轨迹簇作为定位分片序列中的定位分片的表示。
上述实施例中,通过每个用户定位点相应的聚类特征,从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点,可从用户定位点中筛选出符合出行语义特征的定位点作为移动轨迹定位点,过滤了噪音数据,使得移动轨迹定位点都是有效的,提高了路线挖掘的准确性。
S204,确定移动轨迹定位点所属的定位分片。
其中,定位分片是对地理空间按一定的分片精度进行分片划分得到的分片。比如,当分片精度为200米时,可将200*200米的空间区间作为一个分片,当分片精度为1000米时,可将1000*1000米的空间区间作为一个分片。具体地,计算机设备可根据移动轨迹点所对应的坐标,确定移动轨迹定位点所属的定位分片。
在一个实施例中,确定移动轨迹定位点所属的定位分片的步骤包括:获取分片精度;根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。
具体地,计算机设备可获取分片精度,根据分片精度确定预先划分的定位分片。根据移动轨迹定位点,确定移动轨迹点所属的定位分片。
在一个实施例中,根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片的步骤包括:将移动轨迹定位点的坐标除以分片精度并取整,获得分片标识;分片标识表示移动轨迹定位点所属的定位分片。
具体地,计算机设备可将移动轨迹定位点的坐标除以分片精度后取整,根据取整后的数值确定分片标识,该移动规定定位点所属的定位分片就是确定的分片标识所对应的定位分片。
在一个实施例中,为避免经纬度在计算过程中的浮点数,可将移动轨迹定位点的经纬度转换成墨卡托坐标。对于移动轨迹定位点的经纬度的墨卡托值除以分片精度,向下取整数,分别获得经纬度的标识。对经纬度标识进行运算,以得到包含经纬度标识信息的分片标识。与经纬度坐标所对应的分片标识可以清楚地表示出该定位分片在地里空间中所处的地里位置。
举例说明,计算机设备可对移动轨迹定位点的经纬度的墨卡托值除以分片精度,如200,后向下取整数,分别获得经纬度的标识,如lng_id,lat_id。针对lng_id进行位运算左移8位,然后与lat_id进行或运算,最后得到一个64位的整形数字作为该移动轨迹定位点所属的分片标识,可以叫做grid_id。
在一个实施例中,可直接对移动轨迹定位点所对应的经纬度或墨卡托坐标除以分片精度并取整后,再进行计算,比如直接对经纬度进行MD5(Message Digest Algorithm,消息摘要算法第五版)运算,或者hashcode运算(哈希码值运算,根据地址或者字符串或者数字计算出对应的整型的数值)等,将计算结果作为分片标识。
如图7所示,图7示出了一个实施例中确定移动轨迹定位点所属的定位分片的界面示意图。参照图7,当用户的移动轨迹被分片化之后,呈现在地图上就是一个个小方格。图7中的小方格是分片精度为200米的定位分片,图7中的大方格是分片精度为1000米的定位分片。图7中在地图中的连线,连接了具体用户某一次出行的起始点,由此可以看出,用户在单次出行中的移动轨迹定位点并不连续,但是通过多个移动轨迹周期内的移动轨迹定位点,就可以较丰富的还原出整条路线了。
在一个实施例中,计算机设备可按照移动轨迹定位点的定位时间的时序,对移动轨迹定位点进行排序,以保障用户出行的顺序的正确性。再对每个移动轨迹定位点进行分片化,也就是确定每个移动轨迹定位点所属的定位分片。计算机设备确定了移动轨迹定位点所属的定位分片后,离散的移动轨迹定位点可以更加集中的在各个定位分片上有了统计上的含义。比如,每个定位分片都会有定位的次数,也就是移动轨迹定位点的出现次数,定位分片的出度及入度的次数,以及出度和入度的定位分片信息。其中,出度是定位分片的出边条数;入度是定位分片的入边条数。
参考图8,图8为一个实施例中表示单个定位分片的出入度信息的示意图。对单个定位分片进行局部放大,如图8所示,对于当前定位分片A而言,有5分出度下一跳转的定位分片,分别是从定位分片A跳转至定位分片B、定位分片C、定位分片D、定位分片E以及定位分片F。并且,定位分片B、定位分片C、定位分片D、定位分片E和定位分片F在方向上并不区域一致,也就是说,定位分片A是一个很重要的定位分片,在用户的一次出行中,这个定位分片是一个往返都经过的位置。
S206,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。
具体地,计算机设备可按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合排序,以得到多个不同组合的定位分片序列。
在一个实施例中,计算机设备可通过dfs(Depth First Search,深度优先遍历)搜索方式对所有的移动轨迹定位点进行遍历,按照移动轨迹定位点所对应定位时间的时序,枚举所有定位分片跳转的可能性,组合定位分片得到定位分片序列。比如,用grid_id表示定位分片的标识,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列:grid_sequence={[grid_id1,grid_id2,…,rid_idN],[gird_id1,grid_id5,gri d_id3,…,grid_idM]…}。grid_sequence可由多个定位分片序列组成。
其中,定位分片跳转具体指的是,从一个定位分片跳转到另一个定位分片,也就是这两个定位分片中存在时序上相邻的移动轨迹定位点。举例说明,比如定位分片A中存在定位时间为10:00的移动轨迹定位点a,定位分片B中存在定位时间为10:05的移动轨迹定位点b,对移动轨迹定位点按照时序进行排序时,移动轨迹定位点a和移动轨迹定位点b相邻。则,可以认为在用户的出行过程中,是从移动轨迹定位点a移动到移动轨迹定位点b,也就是从定位分片A跳转至定位分片B。将此次跳转过程记为(A,B),则在(A,B)中A是上一跳,B是下一跳。其中,(A,B)即为一个定位分片二元组,可以分别用相应的定位分片的分片标识表示,比如(g_cur,g_next)。
S208,从定位分片序列中搜索目标分片序列。
其中,目标分片序列是符合目标条件的定位分片序列。目标条件,比如出现概率最高或预设前几名,出现次数做多或达到预设次数等。具体地,计算机设备可从定位分片序列中按目标条件搜索符合目标条件的目标分片序列。
在一个实施例中,计算机设备可计算各定位分片序列出现的次数,将出现次数最高的定位分片序列作为目标分片序列。或者,计算机设备可计算各定位分片出现的概率,将最大概率对应的定位分片序列作为目标定位分片序列。还或者,计算机设备可获取预先设置的目标条件,将满足目标条件的定位分片序列作为目标分片序列。
S210,根据目标分片序列确定相应的路线。
具体地,当计算机设备从定位分片序列中搜索出目标分片序列后,可根据目标分片序列确定相应的路线。
在一个实施例中,计算机设备可确定目标定位序列中的各定位分片的中心点,将中心点连接的线作为与目标定位分片相应的路线。或者,计算机设备也可确定目标定位序列中的各定位分片的预设位置点,比如左上角或右上角的定位点,将各定位分片中的预设位置点连接的线作为与目标定位分片相应的路线。
在一个实施例中,计算机设备可根据目标定位序列中的各定位分片在地图中的位置,确定与目标分片序列重合度最高的交通路线作为与目标定位分片相应的路线。
上述路线挖掘方法,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
在一个实施例中,移动轨迹定位点包括用于确定路线端点的用户常驻点;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤包括:从用户定位点中,按照相应的聚类特征,确定两个聚类中心点;将两个聚类中心点分别确定为用户常驻点。
具体地,计算机设备可获取用户定位点,根据用户定位点的坐标或各用户定位点间的距离,通过聚类算法计算每个用户定位点相应的聚类特征。从用户定位点中,按照相应的聚类特征,确定两个聚类中心点,并将两个聚类中心点分别作为用户常驻点。用户定位点中的两个聚类中心点相对其他定位点而言存在聚类密度更大的特点。对于用户在出行中进行定位时的用户定位点,在统计上来说,用户的出发点和到达点通常是聚类中心点。特别是当用户定位点是统计用户在工作日出行的定位点,所需挖掘的路线为用户通勤路线时,聚类中心点必然是用户的常驻点,比如用户的工作地和居住地的地址等。对于用户的出行路线而言,用户常驻点可以认为是用于确定路线端点的移动轨迹定位点。
上述实施例中,按照用户定位点相应的聚类特征,确定两个聚类中心点,并将两个聚类中心点分别确定为用户常驻点,可以根据用户定位点的聚类特征,方便快捷地确定用户常驻点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;从用户定位点中,按照相应的聚类特征,确定两个聚类中心点的步骤包括:
S902,确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数。
其中,目标函数是用设计变量来表示所追求的目标形式,所以目标函数就是设计变量的函数,是一个标量。在本实施例中,设计变量具体可以是聚类密度和聚类距离。目标函数则是用于确定用户定位点相应的聚类密度和聚类距离最大化的函数。建立目标函数的过程就是寻找设计变量与目标的关系的过程,目标函数和设计变量的关系可用曲线、曲面或超曲面表示。假设用ρ表示聚类密度,δ表示聚类距离,目标函数具体可以是表示为y=f(ρ,δ),比如可以是y=ρ*δ这样的形式,或者是y=aρ+bδ这样的形式,其中,a和b都为常量。
在一个实施例中,将用户定位点组成的数据集作为
Figure GDA0003582938910000111
IE={1,2,…,N}为相应地指标集,dij=dist(Xi,Xj)表示用户定位点Xi和Xj之间的距离。对于数据集E中的任何一个用户定位点Xi,可以定义ρi和δi
其中,聚类密度ρi包括Cut-off kernel(截断核)和Gaussian kernel(高斯核)两种计算方法。对于Cut-off kernel的计算方法:
Figure GDA0003582938910000121
其中,函数
Figure GDA0003582938910000122
其中,参数dc>0为截断距离,可预先设置。由上述计算公式可知,ρi表示E中与Xi之间距离小于dc的数据点的个数。
对于Gaussian kernel的计算方法:
Figure GDA0003582938910000123
对于聚类距离而言,设
Figure GDA0003582938910000124
表示
Figure GDA0003582938910000125
的一个降序排列下标序,即它满足
Figure GDA0003582938910000126
则可定义
Figure GDA0003582938910000127
至此,对于由用户定位点组成的数据集E中的每一个用户定位点Xi,都可计算相应的聚类密度ρi和聚类距离δi
具体地,计算机设备可预先设置用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数,比如,y=ρ*δ。
S904,筛选使得相应目标函数的值按降序排前两位的用户定位点。
具体地,计算机设备可以根据各用户定位点相应的聚类密度和聚类距离,计算目标函数的值,根据目标函数的值降序排列用户定位点。筛选排名在前两名的用户定位点,筛选出的两个用户定位点可以认为是聚类密度和聚类距离都相对较大的点,也就是用户定位点的聚类中心点。比如,如图5右上角的坐标图所示,筛选虚线框中的两个用户定位点。
S906,将筛选出的用户定位点确定为聚类中心点。
具体地,计算机设备可将筛选出的用户定位点作为聚类中心点,也就是用户常驻点。
上述实施例中,确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数,筛选使得相应目标函数的值按降序排前两位的用户定位点作为聚类中心点,通过目标函数可以方便快捷地筛选聚类中心点。
在一个实施例中,移动轨迹定位点包括有效用户出行点;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤包括:从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
其中,有效用户出行点条件是用户定位点符合出行语义特征的条件。第一有效用户出行点条件主要针对的是用户出行点;第二有效用户出行点条件主要针对的是用户停留点。
具体地,移动轨迹定位点包括有效用户出行点。计算机设备可从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
在一个实施例中,计算机设备可根据用户定位点的聚类特征,比如聚类密度和聚类距离,从用户定位点中筛选出有效用户出行点。
在一个实施例中,对于用户定位点中的用户出行点而言,可以根据用户出行点相应的聚类密度和聚类距离,筛选出符合出行语义特征的有效用户出行点。比如筛选出聚类密度相对较小、且聚类距离相对较大的用户定位点作为有效用户出行点。
在一个实施例中,计算机设备还可确定用于筛选有效用户出行点的目标函数。对于用户出行点和用户停留点而言,可以采用不同的目标函数。同样地,目标函数也是关于聚类密度和聚类距离的函数。比如,对于用户出行点而言,计算机设备可将y=ρ/1+δ作为用户出行点的目标函数,计算机设备可筛选y>a1所对应的用户出行点作为有效用户出行点。对于用户停留点而言,计算机设备可将y=1/((1+ρ)(1+δ))作为用户停留点的目标函数,计算机设备可筛选y>a2所对应的用户停留点作为有效用户出行点。其中,a1和a2分别是预先设置的阈值。
在一个实施例中,聚类特征包括聚类密度和聚类距离;计算机设备可通过以下公式表示第一有效用户出行条件:
Figure GDA0003582938910000141
其中,ρ表示聚类密度;δ表示聚类距离;a1表示第一阈值。具体地,对于第一阈值a1的取值,可根据经验法则选择0.8。
在一个实施例中,聚类特征包括聚类密度和聚类距离;计算机设备可通过以下公式表示第二有效用户出行条件:
Figure GDA0003582938910000142
其中,ρ表示聚类密度;δ表示聚类距离;a2表示第二阈值。具体地,对于第二阈值a2的取值,可根据经验法则选择0.2。
在一个实施例中,计算机设备可通过以下公式表示第二有效用户出行条件:
Figure GDA0003582938910000143
此时,对于第二阈值a2的取值,可相应的调整为0.25。同样地,
上述实施例中,从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。可以全面准确地筛选满足出行语义特征的有效用户出行点,过滤掉干扰数据,大大提高了路线挖掘的准确性。
在一个实施例中,步骤S208,即从定位分片序列中搜索目标分片序列的步骤具体包括以下步骤:计算定位分片序列对应的分值,分值表示定位分片序列中的定位分片按时序组合的概率;筛选所对应分值最大的定位分片序列,得到目标分片序列。
具体地,计算机设备可计算各定位分片序列对应的分值,将对应分值最大的定位分片序列作为目标分片序列。其中,分值表示定位分片序列中的定位分片按移动轨迹定位点所对应定位时间的时序进行组合的概率。
在一个实施例中,计算机设备可根据单个定位分片序列出现的次数,和有所由定位分片序列组成的定位分片序列集合所对应的总次数,计算定位分片序列对应的分值。
在一个实施例中,计算机设备可根据定位分片序列中单个定位分片出现的概率,以及多个定位分片同时出现的概率,计算定位分片序列对应的分值。
在一个实施例中,计算定位分片序列对应的分值的步骤包括:
S1002,获取定位分片序列中首个定位分片对应的第一出现概率。
具体地,定位分片对应的第一出现概率可以根据该定位分片出现的次数,以及由所有定位分片组成的定位分片集合所对应的总次数进行计算。其中,定位分片出现的次数是指,定位分片中出现的移动轨迹定位点的次数的和。
S1004,获取定位分片序列中各定位分片二元组对应的第二出现概率;定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。
具体地,定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。计算机设备可以根据定位分片序列中各定位分片二元组出现的次数计算相应的第二出现概率。
在一个实施例中,计算机设备可针对每个定位分片序列及相应的定位分片,进行最大概率的匹配。假设在定位分片序列中,下一个定位分片的出现依赖它前面的一个定位分片,则可通过计算最大似然估计(Maximum Likelihood Estimate)构造模型,进行最佳估计。可采用如下公式计算:
p(wi|wi-1)=count(wi-1,wi)/count(wi-1)
其中,wi-1和wi分别是同一个定位片序列中时序相邻的两个定位分片,也就是一个定位分片二元组。定位分片wi-1的排序在前,定位分片wi的排序在后。p(wi|wi-1)表示该定位分片二元组出现的概率。count(wi-1,wi)表示该定位分片二元组出现的次数,count(wi-1)表示定位分片wi-1出现的次数。
S1006,根据第一出现概率和第二出现概率计算定位分片序列对应的分值;第一出现概率和第二出现概率均与分值正相关。
具体地,计算机设备可根据第一出现概率和第二出现概率计算定位分片序列中的定位分片按时序组合的概率所对应的分值。
在一个实施例中,计算机设备可根据如下公式计算定位分片序列中的定位分片按时序组合的概率:
p(S)=p(w1)p(w2|w1)p(w3|w1,w2)…p(wn|w1,w2,…,wn-1)
=p(w1)p(w2|w1)p(w3|w2)…p(wn|wn-1)
其中,p(S)表示定位分片序列S出现的概率;p(w1)表示定位分片w1对应的第一出现概率;p(w2|w1)表示由定位分片w2和定位分片w3所组成的定位分片二元组对应的第二出现概率;p(w3|w2)表示由定位分片w3和定位分片w2所组成的定位分片二元组对应的第二出现概率;p(wn|wn-1)表示由定位分片wn-1和定位分片wn所组成的定位分片二元组对应的第二出现概率。在一个实施例中,为了避免数据溢出、提高性能,通常会使用取log后使用加法运算替代乘法运算。比如,可通过
Figure GDA0003582938910000161
的运算规律对p(S)进行log运算,以得到定位分片序列对应的分值。
在一个实施例中,可用通过以下公式计算定位分片序列对应的分值:
Figure GDA0003582938910000162
其中,a为常数,且a>0,a≠1;w1、w2、w3…wn-1至wn是定位分片序列S中按时序进行组合的定位分片;p(w1)表示定位分片w1对应的第一出现概率;p(w2|w1)表示由定位分片w2和定位分片w3所组成的定位分片二元组对应的第二出现概率;p(w3|w2)表示由定位分片w3和定位分片w2所组成的定位分片二元组对应的第二出现概率;p(wn|wn-1)表示由定位分片wn-1和定位分片wn所组成的定位分片二元组对应的第二出现概率。
上述实施例中,根据定位分片序列中首个定位分片对应的第一出现概率,以及定位分片序列中各定位分片二元组对应的第二出现概率,共同计算定位分片序列对应的分值,可以用分值表示定位分片序列出现的概率大小,以便快速地根据分值的大小来挖掘出最合适的路线。
在一个实施例中,移动轨迹定位点包括用户通勤轨迹定位点;路线包括用户通勤路线。
具体地,在移动轨迹中最频繁的模式,是用户通勤路线,也就是用户从工作地到居住地的路线。当移动终端采集用户的用户定位点中,可根据定位时间筛选用户在工作日进行定位的用户通勤轨迹定位点,以便更准确地挖掘出用户通勤路线。
在本实施例中,计算机设备可通过用户非连续的离散轨迹,筛选出用户通勤轨迹定位点,并基于用户通勤轨迹定位点进行路线挖掘,以还原用户通勤路线。
参考图11(1)、图11(2)和图11(3),图11(1)、图11(2)和图11(3)完整地诠释用户通勤路线挖掘的过程。图11(1)为一个实施例中将用户通勤轨迹定位点进行分片化的结果示意图。图11(1)右侧图片中通过圈圈中的移动轨迹定位点连接的线条表示出了该用户某一天的定位行为,可以看出是非常分散的,只有6-7个定位点信息,虽然在通勤路线上有所表示,但是通勤路线并不完整。图11(2)为一个实施例中单个定位分片的局部分布界面图,该定位分片有可能为用户通勤路线中的一个分片。图11(3)是通过上述路线挖掘方法挖掘出的用户通勤路线的展示图。从图11(3)可以看出,通过执行上述路线挖掘方法,可以准确地还原出用户通勤路线。
上述实施例中,通过用户通勤轨迹定位点可以挖掘出用户通勤路线。
在具体应用场景中,移动终端可采集用户在工作日出行过程中的移动轨迹定位点。根据移动轨迹定位点挖掘出用户最长使用的通勤路线。这对于交通拥堵预测及出行路线规划上,能起到很大的作用。比如,当还原出用户通勤路线后,对于目标用户群在上下班期间的途中,能够有针对性的进行推广信息的投放。并且,同时针对用户途径中的不同站点,也可以进行与站点相应的推广信息的投放。还比如,基于用户通勤路线,可以更好的挖掘出使用频繁的路线,为班车的路线规划和运营提供更好的规划建议。
如图12所示,在一个具体的实施例中,路线挖掘方法包括:
S1202,获取多个移动轨迹周期内累积的用户定位点。
S1204,确定每个用户定位点相应的聚类特征,其中,聚类特征包括聚类密度和聚类距离。
S1206,确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数。
S1208,筛选使得相应目标函数的值按降序排前两位的用户定位点。
S1210,将筛选出的用户定位点确定为聚类中心点。
S1212,将两个聚类中心点分别确定为用户常驻点。
S1214,从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点。
S1216,从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
S1218,获取分片精度。
S1220,将移动轨迹定位点的坐标除以分片精度并取整,获得分片标识;分片标识表示移动轨迹定位点所属的定位分片;其中,移动轨迹定位点包括用户常驻点和有效用户出行点。
S1222,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。
S1224,获取定位分片序列中首个定位分片对应的第一出现概率。
S1226,获取定位分片序列中各定位分片二元组对应的第二出现概率;定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片。
S1228,根据第一出现概率和第二出现概率计算定位分片序列对应的分值;第一出现概率和第二出现概率均与分值正相关;分值表示定位分片序列中的定位分片按时序组合的概率。
S1230,筛选所对应分值最大的定位分片序列,得到目标分片序列。
S1232,根据目标分片序列确定相应的路线。
上述路线挖掘方法,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
图12为一个实施例中路线挖掘方法的流程示意图。应该理解的是,虽然图12的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图12中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
如图13所示,在一个实施例中,提供了一种路线挖掘装置1300,包括:获取模块1301、确定模块1302、组合模块1303和搜索模块1304。
获取模块1301,用于本获取移动轨迹定位点。
确定模块1302,用于确定移动轨迹定位点所属的定位分片。
组合模块1303,用于按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。
搜索模块1304,用于从定位分片序列中搜索目标分片序列。
确定模块1302还用于根据目标分片序列确定相应的路线。
在一个实施例中,获取模块1301还用于获取多个移动轨迹周期内累积的用户定位点;从用户定位点中筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,获取模块1301还用于获取用户定位点;确定每个用户定位点相应的聚类特征;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,移动轨迹定位点包括用于确定路线端点的用户常驻点;获取模块1301还用于从用户定位点中,按照相应的聚类特征,确定两个聚类中心点;将两个聚类中心点分别确定为用户常驻点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;获取模块1301还用于确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数;筛选使得相应目标函数的值按降序排前两位的用户定位点;将筛选出的用户定位点确定为聚类中心点。
在一个实施例中,移动轨迹定位点包括有效用户出行点;获取模块1301还用于从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;获取模块1301在执行从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点的步骤时,还用于用以下公式表示第一有效用户出行条件:
Figure GDA0003582938910000201
其中,ρ表示聚类密度;δ表示聚类距离;a1表示第一阈值。
在一个实施例中,聚类特征包括聚类密度和聚类距离;获取模块1301在执行从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点的步骤时,还用于用以下公式表示第二有效用户出行条件:
Figure GDA0003582938910000202
其中,ρ表示聚类密度;δ表示聚类距离;a2表示第二阈值。
在一个实施例中,确定模块1302还用于获取分片精度;根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。
在一个实施例中,确定模块1302还用于将移动轨迹定位点的坐标除以分片精度并取整,获得分片标识;分片标识表示移动轨迹定位点所属的定位分片。
在一个实施例中,搜索模块1304还用于计算定位分片序列对应的分值,分值表示定位分片序列中的定位分片按时序组合的概率;筛选所对应分值最大的定位分片序列,得到目标分片序列。
在一个实施例中,搜索模块1304还用于获取定位分片序列中首个定位分片对应的第一出现概率;获取定位分片序列中各定位分片二元组对应的第二出现概率;定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片;根据第一出现概率和第二出现概率计算定位分片序列对应的分值;第一出现概率和第二出现概率均与分值正相关。
在一个实施例中,搜索模块1304在执行根据第一出现概率和第二出现概率计算定位分片序列对应的分值的步骤时,还用于通过以下公式计算定位分片序列对应的分值:
Figure GDA0003582938910000211
其中,a为常数,且a>0,a≠1;w1、w2、w3…wn-1至wn是定位分片序列S中按时序进行组合的定位分片;p(w1)表示定位分片w1对应的第一出现概率;p(w2|w1)表示由定位分片w2和定位分片w3所组成的定位分片二元组对应的第二出现概率;p(w3|w2)表示由定位分片w3和定位分片w2所组成的定位分片二元组对应的第二出现概率;p(wn|wn-1)表示由定位分片wn-1和定位分片wn所组成的定位分片二元组对应的第二出现概率。
在一个实施例中,移动轨迹定位点包括用户通勤轨迹定位点;路线包括用户通勤路线。
上述路线挖掘装置,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
图14示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110。如图14所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现路线挖掘方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行路线挖掘方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
图15示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器120。如图15所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器以及网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现路线挖掘方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行路线挖掘方法。
本领域技术人员可以理解,图14以及图15中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的路线挖掘装置可以实现为一种计算机程序的形式,计算机程序可在如图14或图15所示的计算机设备上运行。计算机设备的存储器中可存储组成该路线挖掘装置的各个程序模块,比如,图13所示的获取模块、确定模块、组合模块和搜索模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的路线挖掘方法中的步骤。
例如,图14或图15所示的计算机设备可以通过如图13所示的路线挖掘装置中的获取模块执行步骤S202。计算机设备可通过确定模块执行步骤S204和S2010。计算机设备可通过组合模块执行步骤S206。计算机设备可通过搜索模块执行步骤S208。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中储存有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:获取移动轨迹定位点;确定移动轨迹定位点所属的定位分片;按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;从定位分片序列中搜索目标分片序列;根据目标分片序列确定相应的路线。
在一个实施例中,计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤:获取多个移动轨迹周期内累积的用户定位点;从用户定位点中筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤:获取用户定位点;确定每个用户定位点相应的聚类特征;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,移动轨迹定位点包括用于确定路线端点的用户常驻点;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤:从用户定位点中,按照相应的聚类特征,确定两个聚类中心点;将两个聚类中心点分别确定为用户常驻点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,确定两个聚类中心点的步骤时具体执行以下步骤:确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数;筛选使得相应目标函数的值按降序排前两位的用户定位点;将筛选出的用户定位点确定为聚类中心点。
在一个实施例中,移动轨迹定位点包括有效用户出行点;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤:从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;用以下公式表示第一有效用户出行条件:
Figure GDA0003582938910000241
其中,ρ表示聚类密度;δ表示聚类距离;a1表示第一阈值。
在一个实施例中,聚类特征包括聚类密度和聚类距离;用以下公式表示第二有效用户出行条件:
Figure GDA0003582938910000242
其中,ρ表示聚类密度;δ表示聚类距离;a2表示第二阈值。
在一个实施例中,计算机程序使得处理器在执行确定移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤:获取分片精度;根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。
在一个实施例中,计算机程序使得处理器在执行根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤:将移动轨迹定位点的坐标除以分片精度并取整,获得分片标识;分片标识表示移动轨迹定位点所属的定位分片。
在一个实施例中,计算机程序使得处理器在执行从定位分片序列中搜索目标分片序列的步骤时具体执行以下步骤:计算定位分片序列对应的分值,分值表示定位分片序列中的定位分片按时序组合的概率;筛选所对应分值最大的定位分片序列,得到目标分片序列。
在一个实施例中,计算机程序使得处理器在执行计算定位分片序列对应的分值的步骤时具体执行以下步骤:获取定位分片序列中首个定位分片对应的第一出现概率;获取定位分片序列中各定位分片二元组对应的第二出现概率;定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片;根据第一出现概率和第二出现概率计算定位分片序列对应的分值;第一出现概率和第二出现概率均与分值正相关。
在一个实施例中,计算机程序使得处理器在执行根据第一出现概率和第二出现概率计算定位分片序列对应的分值的步骤时具体执行以下步骤:通过以下公式计算定位分片序列对应的分值:
Figure GDA0003582938910000251
其中,a为常数,且a>0,a≠1;w1、w2、w3…wn-1至wn是定位分片序列S中按时序进行组合的定位分片;p(w1)表示定位分片w1对应的第一出现概率;p(w2|w1)表示由定位分片w2和定位分片w3所组成的定位分片二元组对应的第二出现概率;p(w3|w2)表示由定位分片w3和定位分片w2所组成的定位分片二元组对应的第二出现概率;p(wn|wn-1)表示由定位分片wn-1和定位分片wn所组成的定位分片二元组对应的第二出现概率。
在一个实施例中,移动轨迹定位点包括用户通勤轨迹定位点;路线包括用户通勤路线。
上述计算机设备,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现以下步骤:获取移动轨迹定位点;确定移动轨迹定位点所属的定位分片;按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;从定位分片序列中搜索目标分片序列;根据目标分片序列确定相应的路线。
在一个实施例中,计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤:获取多个移动轨迹周期内累积的用户定位点;从用户定位点中筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,计算机程序使得处理器在执行获取移动轨迹定位点的步骤时具体执行以下步骤:获取用户定位点;确定每个用户定位点相应的聚类特征;从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
在一个实施例中,移动轨迹定位点包括用于确定路线端点的用户常驻点;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤:从用户定位点中,按照相应的聚类特征,确定两个聚类中心点;将两个聚类中心点分别确定为用户常驻点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,确定两个聚类中心点的步骤时具体执行以下步骤:确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数;筛选使得相应目标函数的值按降序排前两位的用户定位点;将筛选出的用户定位点确定为聚类中心点。
在一个实施例中,移动轨迹定位点包括有效用户出行点;计算机程序使得处理器在执行从用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点的步骤时具体执行以下步骤:从用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
在一个实施例中,聚类特征包括聚类密度和聚类距离;用以下公式表示第一有效用户出行条件:
Figure GDA0003582938910000261
其中,ρ表示聚类密度;δ表示聚类距离;a1表示第一阈值。
在一个实施例中,聚类特征包括聚类密度和聚类距离;用以下公式表示第二有效用户出行条件:
Figure GDA0003582938910000271
其中,ρ表示聚类密度;δ表示聚类距离;a2表示第二阈值。
在一个实施例中,计算机程序使得处理器在执行确定移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤:获取分片精度;根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片。
在一个实施例中,计算机程序使得处理器在执行根据分片精度和移动轨迹定位点的坐标,确定在按照分片精度进行分片划分时移动轨迹定位点所属的定位分片的步骤时具体执行以下步骤:将移动轨迹定位点的坐标除以分片精度并取整,获得分片标识;分片标识表示移动轨迹定位点所属的定位分片。
在一个实施例中,计算机程序使得处理器在执行从定位分片序列中搜索目标分片序列的步骤时具体执行以下步骤:计算定位分片序列对应的分值,分值表示定位分片序列中的定位分片按时序组合的概率;筛选所对应分值最大的定位分片序列,得到目标分片序列。
在一个实施例中,计算机程序使得处理器在执行计算定位分片序列对应的分值的步骤时具体执行以下步骤:获取定位分片序列中首个定位分片对应的第一出现概率;获取定位分片序列中各定位分片二元组对应的第二出现概率;定位分片二元组包括在定位分片序列中按时序相邻的两个定位分片;根据第一出现概率和第二出现概率计算定位分片序列对应的分值;第一出现概率和第二出现概率均与分值正相关。
在一个实施例中,计算机程序使得处理器在执行根据第一出现概率和第二出现概率计算定位分片序列对应的分值的步骤时具体执行以下步骤:通过以下公式计算定位分片序列对应的分值:
Figure GDA0003582938910000281
其中,a为常数,且a>0,a≠1;w1、w2、w3…wn-1至wn是定位分片序列S中按时序进行组合的定位分片;p(w1)表示定位分片w1对应的第一出现概率;p(w2|w1)表示由定位分片w2和定位分片w3所组成的定位分片二元组对应的第二出现概率;p(w3|w2)表示由定位分片w3和定位分片w2所组成的定位分片二元组对应的第二出现概率;p(wn|wn-1)表示由定位分片wn-1和定位分片wn所组成的定位分片二元组对应的第二出现概率。
在一个实施例中,移动轨迹定位点包括用户通勤轨迹定位点;路线包括用户通勤路线。
上述计算机可读存储介质,确定移动轨迹定位点所属的定位分片,按照移动轨迹定位点所对应定位时间的时序,对移动轨迹定位点所属的定位分片进行组合,得到定位分片序列。可根据用户的移动轨迹定位点,组合出多种用户可能的出行路线所对应的定位分片序列。再从定位分片序列中搜索目标分片序列,以确定相应的路线。这样,通过移动轨迹定位点进行用户出行路线的挖掘,可充分利用用户的定位数据而不仅仅局限于用户的导航数据。根据用户的移动轨迹定位点,挖掘出用户经常使用的出行路线,具有更高的用户覆盖度和场景覆盖度,使得挖掘出的用户出行路线准确且完整。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户定位信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (28)

1.一种路线挖掘方法,包括:
获取移动轨迹定位点;
确定所述移动轨迹定位点所属的定位分片;
按照所述移动轨迹定位点所对应定位时间的时序,确定各定位分片发生跳转的可能性,并基于各定位分片发生跳转的可能性对所述移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;其中,若两个定位分片中存在时序上相邻的移动轨迹定位点,则表征发生了定位分片跳转;
对于每个定位分片序列,根据定位分片序列中单个定位分片出现的概率,以及多个定位分片同时出现的概率,计算相应定位分片序列对应的分值,所述分值表示所述定位分片序列中的定位分片按所述时序组合的概率;
基于各所述定位分片序列分别对应的分值的大小,从所述定位分片序列中搜索目标分片序列;
根据所述目标分片序列确定相应的路线。
2.根据权利要求1所述的方法,其特征在于,所述获取移动轨迹定位点,包括:
获取多个移动轨迹周期内累积的用户定位点;
从所述用户定位点中筛选表征移动轨迹的移动轨迹定位点。
3.根据权利要求1所述的方法,其特征在于,所述获取移动轨迹定位点,包括:
获取用户定位点;
确定每个用户定位点相应的聚类特征;
从所述用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
4.根据权利要求3所述的方法,其特征在于,所述移动轨迹定位点包括用于确定路线端点的用户常驻点;所述从所述用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点包括:
从所述用户定位点中,按照相应的聚类特征,确定两个聚类中心点;
将所述两个聚类中心点分别确定为用户常驻点。
5.根据权利要求4所述的方法,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述从所述用户定位点中,按照相应的聚类特征,确定两个聚类中心点包括:
确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数;
筛选使得相应目标函数的值按降序排前两位的用户定位点;
将筛选出的用户定位点确定为聚类中心点。
6.根据权利要求3所述的方法,其特征在于,所述移动轨迹定位点包括有效用户出行点;所述从所述用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点包括:
从所述用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;
从所述用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
7.根据权利要求6所述的方法,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述第一有效用户出行点条件为:
用以下公式表示第一有效用户出行条件:
Figure 269728DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示聚类密度;
Figure 44786DEST_PATH_IMAGE004
表示聚类距离;
Figure DEST_PATH_IMAGE005
表示第一阈值。
8.根据权利要求6所述的方法,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述第二有效用户出行点条件为:
用以下公式表示第二有效用户出行条件:
Figure DEST_PATH_IMAGE007
其中,
Figure 703300DEST_PATH_IMAGE003
表示聚类密度;
Figure 337544DEST_PATH_IMAGE004
表示聚类距离;
Figure 11977DEST_PATH_IMAGE008
表示第二阈值。
9.根据权利要求1所述的方法,其特征在于,所述确定所述移动轨迹定位点所属的定位分片包括:
获取分片精度;
根据所述分片精度和所述移动轨迹定位点的坐标,确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片。
10.根据权利要求9所述的方法,其特征在于,所述根据所述分片精度和所述移动轨迹定位点的坐标,确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片包括:
将所述移动轨迹定位点的坐标除以所述分片精度并取整,获得分片标识;所述分片标识表示所述移动轨迹定位点所属的定位分片。
11.根据权利要求1所述的方法,其特征在于,所述基于各所述定位分片序列分别对应的分值的大小,从所述定位分片序列中搜索目标分片序列包括:
筛选所对应分值最大的定位分片序列,得到目标分片序列。
12.根据权利要求11所述的方法,其特征在于,所述根据定位分片序列中单个定位分片出现的概率,以及多个定位分片同时出现的概率,计算相应定位分片序列对应的分值包括:
获取所述定位分片序列中首个定位分片对应的第一出现概率;
获取所述定位分片序列中各定位分片二元组对应的第二出现概率;所述定位分片二元组包括在所述定位分片序列中按所述时序相邻的两个定位分片;
根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值;所述第一出现概率和所述第二出现概率均与所述分值正相关。
13.根据权利要求12所述的方法,其特征在于,所述根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值,包括:
通过以下公式计算定位分片序列对应的分值:
Figure 48066DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
为常数,且
Figure 736536DEST_PATH_IMAGE012
Figure DEST_PATH_IMAGE013
Figure 858076DEST_PATH_IMAGE014
Figure DEST_PATH_IMAGE015
Figure 696719DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE017
Figure DEST_PATH_IMAGE019
是定位分片序列
Figure 665943DEST_PATH_IMAGE020
中按所 述时序进行组合的定位分片;
Figure DEST_PATH_IMAGE021
表示定位分片
Figure 197419DEST_PATH_IMAGE014
对应的第一出现概率;
Figure 665309DEST_PATH_IMAGE022
表 示由定位分片
Figure 573222DEST_PATH_IMAGE015
和定位分片
Figure 318324DEST_PATH_IMAGE014
所组成的定位分片二元组对应的第二出现概率;
Figure DEST_PATH_IMAGE023
表示由定位分片
Figure 20701DEST_PATH_IMAGE016
和定位分片
Figure 228085DEST_PATH_IMAGE015
所组成的定位分片二元组对应的第二出现概 率;
Figure 674110DEST_PATH_IMAGE024
表示由定位分片
Figure 273718DEST_PATH_IMAGE017
和定位分片
Figure 146996DEST_PATH_IMAGE019
所组成的定位分片二元组对应的第 二出现概率。
14.一种路线挖掘装置,其特征在于,所述装置包括:
获取模块,用于获取移动轨迹定位点;
确定模块,用于确定所述移动轨迹定位点所属的定位分片;
组合模块,用于按照所述移动轨迹定位点所对应定位时间的时序,确定各定位分片发生跳转的可能性,并基于各定位分片发生跳转的可能性对所述移动轨迹定位点所属的定位分片进行组合,得到定位分片序列;其中,若两个定位分片中存在时序上相邻的移动轨迹定位点,则表征发生了定位分片跳转;
搜索模块,用于对于每个定位分片序列,根据定位分片序列中单个定位分片出现的概率,以及多个定位分片同时出现的概率,计算相应定位分片序列对应的分值,所述分值表示所述定位分片序列中的定位分片按所述时序组合的概率;基于各所述定位分片序列分别对应的分值的大小,从所述定位分片序列中搜索目标分片序列;
所述确定模块,还用于根据所述目标分片序列确定相应的路线。
15.根据权利要求14所述的装置,其特征在于,所述获取模块,还用于获取多个移动轨迹周期内累积的用户定位点;从所述用户定位点中筛选表征移动轨迹的移动轨迹定位点。
16.根据权利要求14所述的装置,其特征在于,所述获取模块,还用于获取用户定位点;确定每个用户定位点相应的聚类特征;从所述用户定位点中,按照相应的聚类特征,筛选表征移动轨迹的移动轨迹定位点。
17.根据权利要求15所述的装置,其特征在于,所述移动轨迹定位点包括用于确定路线端点的用户常驻点;所述获取模块,还用于从所述用户定位点中,按照相应的聚类特征,确定两个聚类中心点;将所述两个聚类中心点分别确定为用户常驻点。
18.根据权利要求17所述的装置,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述获取模块,还用于确定用于将用户定位点相应的聚类密度和聚类距离最大化的目标函数;筛选使得相应目标函数的值按降序排前两位的用户定位点;将筛选出的用户定位点确定为聚类中心点。
19.根据权利要求16所述的装置,其特征在于,所述移动轨迹定位点包括有效用户出行点;所述获取模块,还用于从所述用户定位点所包括的用户出行点中,筛选符合第一有效用户出行点条件的用户出行点,并作为有效用户出行点;从所述用户定位点所包括的用户停留点中,筛选符合第二有效用户出行点条件的用户停留点,并作为有效用户出行点。
20.根据权利要求19所述的装置,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述第一有效用户出行点条件为:
用以下公式表示第一有效用户出行条件:
Figure 730424DEST_PATH_IMAGE002
其中,
Figure 839195DEST_PATH_IMAGE003
表示聚类密度;
Figure 558889DEST_PATH_IMAGE004
表示聚类距离;
Figure 603068DEST_PATH_IMAGE005
表示第一阈值。
21.根据权利要求19所述的装置,其特征在于,所述聚类特征包括聚类密度和聚类距离;所述第二有效用户出行点条件为:
用以下公式表示第二有效用户出行条件:
Figure DEST_PATH_IMAGE025
其中,
Figure 408213DEST_PATH_IMAGE003
表示聚类密度;
Figure 71407DEST_PATH_IMAGE004
表示聚类距离;
Figure 645608DEST_PATH_IMAGE008
表示第二阈值。
22.根据权利要求14所述的装置,其特征在于,所述确定模块,还用于获取分片精度;根据所述分片精度和所述移动轨迹定位点的坐标,确定在按照所述分片精度进行分片划分时所述移动轨迹定位点所属的定位分片。
23.根据权利要求22所述的装置,其特征在于,所述确定模块,还用于将所述移动轨迹定位点的坐标除以所述分片精度并取整,获得分片标识;所述分片标识表示所述移动轨迹定位点所属的定位分片。
24.根据权利要求14所述的装置,其特征在于,所述搜索模块,还用于筛选所对应分值最大的定位分片序列,得到目标分片序列。
25.根据权利要求24所述的装置,其特征在于,所述搜索模块,还用于获取所述定位分片序列中首个定位分片对应的第一出现概率;获取所述定位分片序列中各定位分片二元组对应的第二出现概率;所述定位分片二元组包括在所述定位分片序列中按所述时序相邻的两个定位分片;根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值;所述第一出现概率和所述第二出现概率均与所述分值正相关。
26.根据权利要求25所述的装置,其特征在于,所述搜索模块在执行根据所述第一出现概率和所述第二出现概率计算所述定位分片序列对应的分值时,还用于通过以下公式计算定位分片序列对应的分值:
Figure 860689DEST_PATH_IMAGE010
其中,
Figure 153130DEST_PATH_IMAGE011
为常数,且
Figure 603703DEST_PATH_IMAGE012
Figure 297989DEST_PATH_IMAGE013
Figure 683971DEST_PATH_IMAGE014
Figure 463708DEST_PATH_IMAGE015
Figure 593338DEST_PATH_IMAGE016
Figure 142131DEST_PATH_IMAGE017
Figure 338495DEST_PATH_IMAGE019
是定位分片序列
Figure 339949DEST_PATH_IMAGE020
中按所 述时序进行组合的定位分片;
Figure 273270DEST_PATH_IMAGE021
表示定位分片
Figure 410990DEST_PATH_IMAGE014
对应的第一出现概率;
Figure 669933DEST_PATH_IMAGE022
表 示由定位分片
Figure 283317DEST_PATH_IMAGE015
和定位分片
Figure 754750DEST_PATH_IMAGE014
所组成的定位分片二元组对应的第二出现概率;
Figure 12556DEST_PATH_IMAGE023
表示由定位分片
Figure 442400DEST_PATH_IMAGE016
和定位分片
Figure 152867DEST_PATH_IMAGE015
所组成的定位分片二元组对应的第二出现概 率;
Figure 303357DEST_PATH_IMAGE024
表示由定位分片
Figure 681249DEST_PATH_IMAGE017
和定位分片
Figure 750836DEST_PATH_IMAGE019
所组成的定位分片二元组对应的第 二出现概率。
27.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至13中任一项所述方法的步骤。
28.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至13中任一项所述方法的步骤。
CN201810663726.1A 2018-06-25 2018-06-25 路线挖掘方法、装置、计算机可读存储介质和计算机设备 Active CN109034454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810663726.1A CN109034454B (zh) 2018-06-25 2018-06-25 路线挖掘方法、装置、计算机可读存储介质和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810663726.1A CN109034454B (zh) 2018-06-25 2018-06-25 路线挖掘方法、装置、计算机可读存储介质和计算机设备

Publications (2)

Publication Number Publication Date
CN109034454A CN109034454A (zh) 2018-12-18
CN109034454B true CN109034454B (zh) 2022-07-08

Family

ID=64610266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810663726.1A Active CN109034454B (zh) 2018-06-25 2018-06-25 路线挖掘方法、装置、计算机可读存储介质和计算机设备

Country Status (1)

Country Link
CN (1) CN109034454B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111380541B (zh) * 2018-12-29 2022-09-13 沈阳美行科技股份有限公司 兴趣点确定方法、装置、计算机设备和存储介质
CN111380547B (zh) * 2018-12-29 2022-05-17 沈阳美行科技股份有限公司 熟路轨迹确定方法、装置、计算机设备和存储介质
CN109788438A (zh) * 2019-02-11 2019-05-21 胡金星 一种基于大数据的智能导航车联网系统
CN109934265B (zh) * 2019-02-15 2021-06-11 同盾控股有限公司 一种常驻地址的确定方法和装置
CN110046218B (zh) * 2019-05-13 2021-05-07 东软集团股份有限公司 一种用户出行模式的挖掘方法、装置、系统和处理器
CN111429220B (zh) * 2020-03-25 2024-04-05 西安交通大学 基于运营商大数据的旅游路线推荐系统及方法
CN112118535B (zh) * 2020-08-12 2021-08-17 深圳技术大学 车辆漫游区域预测方法及系统
CN113570635B (zh) * 2021-06-03 2024-06-21 浙江大华技术股份有限公司 目标运动轨迹还原方法、装置、电子设备、存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN104239556A (zh) * 2014-09-25 2014-12-24 西安理工大学 基于密度聚类的自适应轨迹预测方法
CN107766808A (zh) * 2017-09-30 2018-03-06 北京泓达九通科技发展有限公司 道路网络空间中车辆对象移动轨迹聚类的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509170A (zh) * 2011-10-10 2012-06-20 浙江鸿程计算机系统有限公司 一种基于历史轨迹数据挖掘的位置预测系统及方法
CN104239556A (zh) * 2014-09-25 2014-12-24 西安理工大学 基于密度聚类的自适应轨迹预测方法
CN107766808A (zh) * 2017-09-30 2018-03-06 北京泓达九通科技发展有限公司 道路网络空间中车辆对象移动轨迹聚类的方法及系统

Also Published As

Publication number Publication date
CN109034454A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN109034454B (zh) 路线挖掘方法、装置、计算机可读存储介质和计算机设备
CN109033011B (zh) 计算轨迹频繁度的方法、装置、存储介质及电子设备
CN105043400A (zh) 路径规划方法及装置
Xu et al. DESTPRE: a data-driven approach to destination prediction for taxi rides
CN114065364B (zh) 基于无人机遥感测绘的城市工程规划方法及系统
Cesario et al. An approach for the discovery and validation of urban mobility patterns
CN110263840B (zh) 一种线路分析方法、装置及程序产品、存储介质
Li et al. Hierarchical route planning based on taxi GPS-trajectories
CN112788524A (zh) 对象查询方法、装置、设备及存储介质
CN110598917A (zh) 一种基于路径轨迹的目的地预测方法、系统及存储介质
CN111831769A (zh) 轨迹处理方法、装置、电子设备及存储介质
CN113239089A (zh) 路径识别方法、装置、电子设备、存储介质及程序产品
CN111931077A (zh) 数据处理方法、装置、电子设备及存储介质
Wu et al. GLUE: a parameter-tuning-free map updating system
CN110275911A (zh) 基于频繁序列模式的私家车出行热点路径挖掘方法
Qian et al. Detecting taxi trajectory anomaly based on spatio-temporal relations
Amirat et al. Nextroute: a lossless model for accurate mobility prediction
CN108520028B (zh) 基于dpi数据的用户地理位置特征提取方法及系统
Chandio et al. An approach for map-matching strategy of GPS-trajectories based on the locality of road networks
CN110909037B (zh) 一种频繁轨迹模式的挖掘方法及装置
CN112985440A (zh) 行驶轨迹偏移的检测方法、装置、存储介质及程序产品
CN115209429B (zh) 定位基站信号覆盖率评估方法、装置、设备及存储介质
CN108810036B (zh) 地理位置信息的处理方法、装置与系统
Jeong et al. TravelMiner: on the benefit of path-based mobility prediction
CN111831765B (zh) 数据处理方法、装置、电子设备和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant