CN109388757B - 一种热门轨迹提取方法与装置 - Google Patents

一种热门轨迹提取方法与装置 Download PDF

Info

Publication number
CN109388757B
CN109388757B CN201811176587.6A CN201811176587A CN109388757B CN 109388757 B CN109388757 B CN 109388757B CN 201811176587 A CN201811176587 A CN 201811176587A CN 109388757 B CN109388757 B CN 109388757B
Authority
CN
China
Prior art keywords
track
tracks
hot
similarity
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811176587.6A
Other languages
English (en)
Other versions
CN109388757A (zh
Inventor
杨铖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Lizhi Network Technology Co ltd
Original Assignee
Guangzhou Lizhi Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Lizhi Network Technology Co ltd filed Critical Guangzhou Lizhi Network Technology Co ltd
Priority to CN201811176587.6A priority Critical patent/CN109388757B/zh
Publication of CN109388757A publication Critical patent/CN109388757A/zh
Application granted granted Critical
Publication of CN109388757B publication Critical patent/CN109388757B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Abstract

本发明提供了一种热门轨迹提取方法与装置,涉及导航技术领域。该热门轨迹提取方法通过获取历史轨迹数据,然后依据历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度,再依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度,最后依据每条轨迹的热度选取热门轨迹。本发明提供的热门轨迹提取方法与装置具有确定热门轨迹时更加精确的优点。

Description

一种热门轨迹提取方法与装置
技术领域
本发明涉及导航技术领域,具体而言,涉及一种热门轨迹提取方法与装置。
背景技术
随着互联网的发展与个人大数据不断被挖掘,不少手机软件均已能获取用户的各种信息,其中就包括GPS地理位置信息,而GPS地理位置信息在一些城市规划,地图导航,旅游规划方面显得尤为重要,其中从批量的用户轨迹中精准快速提取热门的轨迹,是一项由来已久的技术难题,目前已知的关于GPS轨迹相似计算的比较常用的技术大概有Euclideandistance,Dynamictimewarping(下称DTW),Longestcommonsubsequence(下称LCS),Editdistance(下称ED)等算法,该些算法基本能做到在小数据量下得到比较粗糙的计算结果,对于比较大数据量的计算,或者对结果精度要求比较高时,则体现不出太大优势。
有鉴于此,如何解决上述问题,是本领域技术人员关注的重点。
发明内容
有鉴于此,本发明的目的在于提供一种热门轨迹提取方法,以解决现有技术中对热门轨迹的计算不够精确的问题。
本发明的另一目的在于提供一种热门轨迹提取装置,以解决现有技术中对热门轨迹的计算不够精确的问题。
为了实现上述目的,本发明实施例采用的技术方案如下:
一方面,本发明实施例提出一种热门轨迹提取方法,所述热门轨迹提取方法包括:
获取历史轨迹数据;
依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度;
依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度;
依据所述每条轨迹的热度选取热门轨迹。
另一方面,本发明实施例还提出一种热门轨迹提取装置,所述热门轨迹提取装置包括:
信息获取单元,用于获取历史轨迹数据;
相似度计算单元,用于依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度;
热度计算单元,用于依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度;
热门轨迹选取单元,用于依据所述每条轨迹的热度选取热门轨迹。
相对现有技术,本发明具有以下有益效果:
本发明提供了一种热门轨迹提取方法与装置,通过获取历史轨迹数据,然后依据历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度,再依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度,最后依据每条轨迹的热度选取热门轨迹。由于本发明提供的热门轨迹提取方法能够计算每两条轨迹之间的相似度,通过相似度再进行热度的确定,在确定热门轨迹时更加精确。同时,由于利用预设定的阈值计算每条轨迹的热度,因此可通过改变阈值的方式改变热门轨迹的精度,更能满足人们的需要。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明的实施例提供的服务器的功能模块示意图。
图2示出了本发明的实施例提供的热门轨迹提取方法的流程图。
图3示出了本发明的实施例提供的图2中的步骤S104的子步骤的流程图。
图4示出了本发明的实施例提供的图2中的步骤S105的子步骤的流程图。
图5示出了本发明实施例提供的热门轨迹提取装置的模块示意图。
图6示出了本发明实施例提供的热度计算单元的子模块示意图。
图7示出了本发明实施例提供的热门轨迹选取单元的子模块示意图。
图标:10-服务器;12-存储器;13-存储控制器;14-处理器;100-热门轨迹提取装置;110-信息获取单元;120-编码计算单元;130-相似度计算单元;140-热度计算单元;141-相似度计算模块;142-数量获取模块;143-热度生成模块;144-热度计算模块;150-热门轨迹选取单元;151-轨迹列表生成模块;152-热门轨迹选取模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语 “相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
第一实施例
如图1所示,是本发明提供的服务器10的功能模块示意图。该服务器10包括如图1所示,是本发明提供的服务器10的功能模块示意图。该服务器10包括热门轨迹提取装置100、存储器12、存储控制器13以及处理器14。
所述存储器12、存储控制器13以及处理器14各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述热门轨迹提取装置100包括至少一个可以软件或固件(firmware)的形式存储于所述存储器12中或固化在所述服务器10的操作系统(operating system,OS)中的软件功能模块。所述处理器14用于执行存储器12中存储的可执行模块,例如所述热门轨迹提取装置100包括的软件功能模块或计算机程序。
其中,存储器12可以是,但不限于,随机存取存储器12(Random Access Memory,RAM),只读存储器12(Read Only Memory,ROM),可编程只读存储器12(Programmable Read-Only Memory,PROM),可擦除只读存储器12(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器12(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器12用于存储程序,所述处理器14在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的服务器10所执行的方法可以应用于处理器14中,或者由处理器14实现。
处理器14可能是一种集成电路芯片,具有信号的处理能力。上述的处理器14可以是通用处理器14,包括中央处理器14(Central Processing Unit,简称CPU)、网络处理器14(Network Processor,简称NP)等;还可以是数字信号处理器14(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器14可以是微处理器14或者该处理器14也可以是任何常规的处理器14等。
请参阅图2,是本发明较佳实施例提供的应用于图1所示的调峰供电控制方法的流程图。下面将对图2所示的具体流程进行详细阐述。
步骤S101,获取历史轨迹数据。
在本实施例中,当需要提取热门轨迹,以达到帮助用户有效的制定路线的目的,需要先获取历史轨迹数据,其中,历史轨迹数据为服务器10记录的所有用户的历史轨迹信息,即在每次用户从任意一条路径中由起点运动至终点时,服务器10均会记录其运行路径并存储。由于每个用户均可能在不同的路径上进行运动,因此在历史轨迹数据中会记录多条数据,当然地,在历史轨迹数据中的多条轨迹数据中,也存在相同或者相似的路径。
步骤S102,依据预设定的索引算法计算每条轨迹的编码。
由于本实施例中提取人们轨迹的方式为先计算每两条路径的相似度,然后再利用相似度获取热门轨迹,由于在历史轨迹数据中包括多条路径,因此若直接采用计算没两条路径的相似度,则计算量较大,对服务器10的运行造成巨大负荷。同时,对于两条相隔较远的路径,即使求出其相似度,在热门轨迹的选取中也并无实际意义,因此在计算两条轨迹的相似度之前,会
在获取了历史轨迹数据后,服务器10会利用利用索引算法计算每条轨迹的编码,在本实施例中,采用geohash算法计算每条轨迹的编码,其中,geohash算法的具体操作包括:
1、将经度纬度各自转换成01编码。
2、将转换得到的经度纬度编码混合,再每5位转成10进制数字。
3、将该10进制数字查base32表得到编码字母。
通过geohash算法能够计算出每条轨迹的编码,当然地,在其它的实施例中,也可采用其它的算法计算每条轨迹的编码,例如采用其他hash算法求取每条轨迹的编码,本实施例对此并不做任何限定。
步骤S103,当两条轨迹之间的编码中至少有一个编码相同时,计算所述两条轨迹之间的相似度。
在计算了每条轨迹的编码后,服务器10可比较每两条轨迹的编码,两条轨迹的编码中,至少有一个编码相同时,则表示两条轨迹可能相同或者相似,此时则需要计算该两条轨迹之间的相似度,而对于两条轨迹中无任意编码相似时,则表示该两条轨迹既不相同也不相似,无需计算该两条轨迹之间的相似度,从而减少了服务器10的计算负荷。
具体地,在本实施例中,依据历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度包括:
依据公式
Figure DEST_PATH_IMAGE002
及公式
Figure DEST_PATH_IMAGE004
计算矩阵A与矩阵B,其中,lineX和lineY表示轨迹X与轨迹Y,i表示轨迹X的第i个点,j表示轨迹Y的第j个点;
然后依据公式
Figure DEST_PATH_IMAGE006
计算两条轨迹之间的相似度,其中,
Figure DEST_PATH_IMAGE008
表示两条轨迹之间的相似度,
Figure DEST_PATH_IMAGE010
表示轨迹X的长度,
Figure DEST_PATH_IMAGE012
表示轨迹Y 的长度。
需要说明的是,在本实施例中,在进行计算之前,服务器10会将所有数据广播到每个节点。由于数据量较大,为了加快计算,因此计算均在集群上处理,即本实施例中,服务器10位于服务器10集群中,该服务器10集群还包括其它的服务器10,计算操作放在多台服务器10上运行。当需要进行计算时,服务器10会将数据分别传输到其它的服务器10上,然后在每台服务器10上分别通过相似度计算算法计算每两条轨迹之间的相似度。
步骤S104,依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度。
在计算了每两条轨迹之间的相似度后,即可计算出每条轨迹的热度,其中,请参阅图3,步骤S104包括:
子步骤S1041,以任意一条轨迹为待计算轨迹,计算所述待计算轨迹与其余的每条轨迹之间的相似度。
其中,在确定每条轨迹的热度后,以任意一条轨迹为待计算轨迹,计算所述待计算轨迹与其余的每条轨迹之间的相似度。其中,本实施例由于在步骤S103中已经计算出了每两条轨迹之间的相似度,因此本步骤中所述的计算实际为直接提取与待计算轨迹相关联的相似度,即获取待计算轨迹与其余的每条轨迹之间的相似度。
子步骤S1042,获取相似度大于所述预设定的阈值的轨迹数量。
当两条轨迹的相似度大于预设定的阈值时,即表示两条轨迹之间相同或者相似,其中,该预设定的阈值可根据实际需求进行调节,从而更能满足用户的实际需要。例如,轨迹X与待计算轨迹之间的相似度为90%,而预设定的阈值为80%,则记录轨迹数量为1,当有其它的轨迹与待计算轨迹之间的相似度大于阈值时,记录轨迹数量为2,以此类推。
子步骤S1043,依据轨迹数量生成所述待计算轨迹的热度。
在获取相似度大于所述预设定的阈值的轨迹数量后,依据该轨迹数量能够生成待计算轨迹的热度,其中,与该待计算轨迹的相同或者相似的轨迹越多,则表示该条待计算轨迹的热度越高,即更多的游客选择该条路线。因此,在本实施例中,服务器10能够依据轨迹数量生成热度,其中,本实施例采用一一对应的方式生成热度,例如,相似度大于所述预设定的阈值的轨迹数量为10条,则该待计算轨迹的热度为10;相似度大于所述预设定的阈值的轨迹数量为100条,则该待计算轨迹的热度为100,以此类推。当然地,在其它的一些实施例中,也可能采用其它的方式生成轨迹热度,例如采用一定比例的方式生成热度,本实施例对此并不做任何限定。
子步骤S1044,依次以其余每条轨迹作为待计算轨迹,并依次计算每条轨迹的热度。
在以其中一条轨迹作为待计算轨迹后,还要依次计算剩余轨迹的热度,即依次以其余每条轨迹作为待计算轨迹,并依次计算每条轨迹的热度,以求取出每条轨迹的热度。
步骤S105,依据所述每条轨迹的热度选取热门轨迹。
在获取了每条轨迹的热度后,则需要根据每条轨迹的热度获取最热门的轨迹,以方便用户在使用时观看。
具体地,请参阅图4,步骤S105包括:
子步骤S1051,将轨迹热度从高至低进行排列,以生成轨迹列表。
在获取每条轨迹的热度后,可依据轨迹热度的从高至低的方式将轨迹进行排列,从而生成轨迹列表。
子步骤S1052,从所述轨迹列表中依次选取一条热门轨迹,并删除所述轨迹列表中与所述热门轨迹关联的轨迹。
在实施例中,当生成轨迹列表后,由于轨迹列表由轨迹热度从高至低进行排列,则在选取热门轨迹时,从轨迹列表中依次选取一条热门轨迹,且本实施所述的依次选取指服务器10从热度最高的轨迹先选取。
例如,轨迹列表中第一条轨迹的轨迹热度为200,第二条轨迹热度为190,第三条轨迹热度为150,则在选取热门轨迹时,选取的第一条热门轨迹即轨迹列表中的第一条轨迹。
同时,还是要说明的是,由于在实际中,轨迹之间具有关联性,例如,现有轨迹A、B、C、D,其中,当A作为待计算轨迹时,A与B、A与C、A与D之间的相似度均大于阈值,而当B作为待计算轨迹时,B与A、B与C之间的相似度均大于阈值,即在轨迹列表中,有多条相似或者相同的轨迹,例如,第一条轨迹的轨迹热度为200,第二条轨迹热度为190,第三条轨迹热度为150,且第一条轨迹与第二条轨迹之间为相似轨迹,在选取了第一条轨迹作为热门轨迹后,由于第一条轨迹与第二条轨迹之间实质上区别较小,若将两条估计均作为热门轨迹,则意义较小,因此在选取了第一条轨迹作为热门轨迹后,服务器10会删除第二条热门轨迹,以保证热门轨迹中不会存在相同或者相似的轨迹。
即从轨迹列表中依次选取一条热门轨迹后,会同时删除轨迹列表中与该热门轨迹关联的轨迹。且本实施例所述的关联指相似度大于阈值的轨迹。
子步骤S1053,循环执行选取热门轨迹的步骤,直至选取出目标数量的热门轨迹。
作为本实施例的一种实现方式,在确定一个热门轨迹后,会继续确定另一个热门轨迹,直至确定出目标数量的热门轨迹,例如目标数量为50个,则需要循环选取热门轨迹的步骤,直至选出50个热门轨迹。其中,热门轨迹逐个确定,以防止出现热门轨迹中存在相同或者相似的轨迹。例如,第一条轨迹的轨迹热度为200,第二条轨迹热度为190,第三条轨迹热度为150,且第一条轨迹与第二条轨迹之间为相似轨迹,在选取了第一条轨迹作为热门轨迹后,服务器10会删除第二条轨迹,直接将轨迹列表中的第三条轨迹确定为第二条热门轨迹,以此类推,直至选取出50个热门轨迹,从而使得50个热门轨迹之间无相互关联。
作为本实施例的第二种实现方式,在确定一个热门轨迹后,会继续确定另一个热门轨迹,直至将轨迹列表中的所有轨迹均确定完,且并不限制热门轨迹的数量。
第二实施例
请参阅图,5,本发明较佳实施例提供的图1所示的热门轨迹提取装置100的功能单元示意图。需要说明的是,本实施例所提供的热门轨迹提取装置100,其基本原理及产生的技术效果和上述实施例相同,为简要描述,本发明实施例部分未提及之处,可参考上述的实施例中相应内容。热门轨迹提取装置100包括:
信息获取单元110,用于获取历史轨迹数据。
可以理解地,通过信息获取单元110可执行步骤S101。
编码计算单元120,用于依据预设定的索引算法计算每条轨迹的编码。
可以理解地,通过编码计算单元120可执行步骤S102。
相似度计算单元130,用于当两条轨迹之间的编码中至少有一个编码相同时,计算所述两条轨迹之间的相似度。
可以理解地,通过相似度计算单元130可执行步骤S103。
热度计算单元140,用于依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度。
可以理解地,通过热度计算单元140可执行步骤S104。
其中,请参阅图6,热度计算单元140包括:
相似度计算模块141,用于以任意一条轨迹为待计算轨迹,计算所述待计算轨迹与其余的每条轨迹之间的相似度。
可以理解地,通过相似度计算模块141可执行子步骤S1041。
数量获取模块142,用于获取相似度小于或等于所述预设定的阈值的轨迹数量。
可以理解地,通过数量获取模块142可执行子步骤S1042。
热度生成模块143,用于依据轨迹数量生成所述待计算轨迹的热度。
可以理解地,通过热度生成模块143可执行子步骤S1043。
热度计算模块144,用于依次以其余每条轨迹作为待计算轨迹,并依次计算每条轨迹的热度。
可以理解地,通过热度计算模块144可执行子步骤S1044。
热门轨迹选取单元150,用于依据所述每条轨迹的热度选取热门轨迹。
可以理解地,通过热门轨迹选取单元150可执行步骤S105。
其中,请参阅图7,热门轨迹选取单元150包括:
轨迹列表生成模块151,用于将轨迹热度从高至低进行排列,以生成轨迹列表。
可以理解地,通过轨迹列表生成模块151可执行子步骤S1051。
热门轨迹选取模块152,用于从所述轨迹列表中依次选取一条热门轨迹,并删除所述轨迹列表中与所述热门轨迹关联的轨迹。
可以理解地,通过热门轨迹选取模块152可执行子步骤S1052。
热门轨迹选取模块152还用于循环执行选取热门轨迹的步骤,直至选取出目标数量的热门轨迹。
可以理解地,通过热门轨迹选取模块152可执行子步骤S1053。
综上所述,本发明提供了一种热门轨迹提取方法与装置,通过获取历史轨迹数据,然后依据历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度,再依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度,最后依据每条轨迹的热度选取热门轨迹。由于本发明提供的热门轨迹提取方法能够计算每两条轨迹之间的相似度,通过相似度再进行热度的确定,在确定热门轨迹时更加精确。同时,由于利用预设定的阈值计算每条轨迹的热度,因此可通过改变阈值的方式改变热门轨迹的精度,更能满足人们的需要。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

Claims (8)

1.一种热门轨迹提取方法,其特征在于,所述热门轨迹提取方法包括:
获取历史轨迹数据;
依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度;
依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度;
依据所述每条轨迹的热度选取热门轨迹;其中,
所述依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度的步骤包括:
依据公式
A(i)(j)=min(A(i-1)(j)+d(lineX(i-1),lineX(i)),B(i-1)(j)+d(lineY(j),lineX(i)))
及公式
B(i)(j)=min(A(i)(j-1)+d(lineY(j),lineX(i))),B(i)(j-1)+d(lineY(i-1),lineY(i)))
计算矩阵A与矩阵B,其中,lineX和lineY表示轨迹X与轨迹Y,i表示轨迹X的第i个点,j表示轨迹Y的第j个点;
依据公式
s(lineX,lineY)=2*min(Amn,Bmn)/(length(X)+length(Y)-1
计算两条轨迹之间的相似度,其中,s(lineX,lineY)表示两条轨迹之间的相似度,length(X)表示轨迹X的长度,length(Y)表示轨迹Y的长度。
2.如权利要求1所述的热门轨迹提取方法,其特征在于,在所述依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度之前,所述热门轨迹提取方法还包括:
依据预设定的索引算法计算每条轨迹的编码;
当两条轨迹之间的编码中至少有一个编码相同时,计算所述两条轨迹之间的相似度。
3.如权利要求1所述的热门轨迹提取方法,其特征在于,所述依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度的步骤包括:
以任意一条轨迹为待计算轨迹,计算所述待计算轨迹与其余的每条轨迹之间的相似度;
获取相似度大于所述预设定的阈值的轨迹数量;
依据轨迹数量生成所述待计算轨迹的热度;
依次以其余每条轨迹作为待计算轨迹,并依次计算每条轨迹的热度。
4.如权利要求1所述的热门轨迹提取方法,其特征在于,依据所述每条轨迹的热度选取热门轨迹的步骤包括:
将轨迹热度从高至低进行排列,以生成轨迹列表;
从所述轨迹列表中依次选取一条热门轨迹,并删除所述轨迹列表中与所述热门轨迹关联的轨迹;
循环执行选取热门轨迹的步骤,直至选取出目标数量的热门轨迹。
5.一种热门轨迹提取装置,其特征在于,所述热门轨迹提取装置包括:
信息获取单元,用于获取历史轨迹数据;
相似度计算单元,用于依据所述历史轨迹数据与预设定的相似度算法计算每两条轨迹之间的相似度;
热度计算单元,用于依据每两条轨迹之间的相似度与预设定的阈值计算每条轨迹的热度;
热门轨迹选取单元,用于依据所述每条轨迹的热度选取热门轨迹;其中,
所述相似度计算单元包括:
矩阵计算模块,用于依据公式
A(i)(j)=min(A(i-1)(j)+d(lineX(i-1),lineX(i)),B(i-1)(j)+d(lineY(j),lineX(i)))及公式
B(i)(j)=min(A(i)(j-1)+d(lineY(j),lineX(i))),B(i)(j-1)+d(lineY(i-1),lineY(i)))
计算矩阵A与矩阵B,其中,lineX和lineY表示轨迹X与轨迹Y,i表示轨迹X的第i个点,j表示轨迹Y的第j个点;
显示度计算模块,用于依据公式
s(lineX,lineY)=2*min(Amn,Bmn)/(length(X)+length(Y)-1
计算两条轨迹之间的相似度,其中,s(lineX,lineY)表示两条轨迹之间的相似度,length(X)表示轨迹X的长度,length(Y)表示轨迹Y的长度。
6.如权利要求5所述的热门轨迹提取装置,其特征在于,所述热门轨迹提取装置还包括:
编码计算单元,用于依据预设定的索引算法计算每条轨迹的编码;
相似度计算单元还用于当两条轨迹之间的编码中至少有一个编码相同时,计算所述两条轨迹之间的相似度。
7.如权利要求5所述的热门轨迹提取装置,其特征在于,所述热度计算单元包括:
相似度计算模块,用于以任意一条轨迹为待计算轨迹,计算所述待计算轨迹与其余的每条轨迹之间的相似度;
数量获取模块,用于获取相似度大于所述预设定的阈值的轨迹数量;
热度生成模块,用于依据轨迹数量生成所述待计算轨迹的热度;
热度计算模块,用于依次以其余每条轨迹作为待计算轨迹,并依次计算每条轨迹的热度。
8.如权利要求5所述的热门轨迹提取装置,其特征在于,所述热门轨迹选取单元包括:
轨迹列表生成模块,用于将轨迹热度从高至低进行排列,以生成轨迹列表;
热门轨迹选取模块,用于从所述轨迹列表中依次选取一条热门轨迹,并删除所述轨迹列表中与所述热门轨迹关联的轨迹;
热门轨迹选取模块还用于循环执行选取热门轨迹的步骤,直至选取出目标数量的热门轨迹。
CN201811176587.6A 2018-10-10 2018-10-10 一种热门轨迹提取方法与装置 Active CN109388757B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811176587.6A CN109388757B (zh) 2018-10-10 2018-10-10 一种热门轨迹提取方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811176587.6A CN109388757B (zh) 2018-10-10 2018-10-10 一种热门轨迹提取方法与装置

Publications (2)

Publication Number Publication Date
CN109388757A CN109388757A (zh) 2019-02-26
CN109388757B true CN109388757B (zh) 2021-11-02

Family

ID=65426657

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811176587.6A Active CN109388757B (zh) 2018-10-10 2018-10-10 一种热门轨迹提取方法与装置

Country Status (1)

Country Link
CN (1) CN109388757B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859167B (zh) * 2019-04-29 2024-04-30 北京四维图新科技股份有限公司 路径获取方法、装置、系统和存储介质
CN110334171A (zh) * 2019-07-05 2019-10-15 南京邮电大学 一种基于Geohash的时空伴随对象挖掘方法
CN111831769A (zh) * 2020-06-18 2020-10-27 汉海信息技术(上海)有限公司 轨迹处理方法、装置、电子设备及存储介质
CN113657177A (zh) * 2021-07-22 2021-11-16 北京百度网讯科技有限公司 数据处理方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103323018A (zh) * 2013-06-21 2013-09-25 广州市香港科大霍英东研究院 基于时段的热点路径的特征识别与快速搜索方法
CN104794494A (zh) * 2015-04-30 2015-07-22 中国地质大学(武汉) 一种可扩展快速的轨迹聚类方法
CN105409306A (zh) * 2014-06-11 2016-03-16 华为技术有限公司 移动终端位置预测方法及装置
CN108268597A (zh) * 2017-12-18 2018-07-10 中国电子科技集团公司第二十八研究所 一种动目标活动概率图谱构建及行为意图识别方法
CN108303108A (zh) * 2017-12-05 2018-07-20 华南理工大学 一种基于车辆历史轨迹的个性化路线推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7979462B2 (en) * 2006-09-29 2011-07-12 Apple Inc. Head-to-head comparisons

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103323018A (zh) * 2013-06-21 2013-09-25 广州市香港科大霍英东研究院 基于时段的热点路径的特征识别与快速搜索方法
CN105409306A (zh) * 2014-06-11 2016-03-16 华为技术有限公司 移动终端位置预测方法及装置
CN104794494A (zh) * 2015-04-30 2015-07-22 中国地质大学(武汉) 一种可扩展快速的轨迹聚类方法
CN108303108A (zh) * 2017-12-05 2018-07-20 华南理工大学 一种基于车辆历史轨迹的个性化路线推荐方法
CN108268597A (zh) * 2017-12-18 2018-07-10 中国电子科技集团公司第二十八研究所 一种动目标活动概率图谱构建及行为意图识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于GPS数据的用户轨迹相似性分析;曹静;《中国优秀硕士学位论文全文数据库·基础科学辑》;20160815;全文 *

Also Published As

Publication number Publication date
CN109388757A (zh) 2019-02-26

Similar Documents

Publication Publication Date Title
CN109388757B (zh) 一种热门轨迹提取方法与装置
US11222285B2 (en) Feature selection method, device and apparatus for constructing machine learning model
JP6474895B2 (ja) 適用可能なジオフェンスの判定のためのタイミング決定
US11861516B2 (en) Methods and system for associating locations with annotations
US20140164391A1 (en) Data block saving system and method
CN106776763B (zh) 目的地搜索方法及装置
EP2601622A1 (en) Predicting a user behavior number of a word
EP3425530A1 (en) Target location search method and apparatus
CN110888866B (zh) 数据扩充方法、装置、数据处理设备及存储介质
CN110704677B (zh) 一种节目推荐方法、装置、可读存储介质及终端设备
EP3308559A1 (en) Method and system for determining a positioning interval of a mobile terminal
WO2016171860A1 (en) Computerized system and method for performing a location-based search
RU2605041C2 (ru) Способы и системы для отображения тем микроблогов
CN105824827A (zh) 一种文件路径的存储和本地文件的访问方法及装置
WO2020000715A1 (zh) 基于指数特征提取的股指预测方法、服务器及存储介质
CN111369313A (zh) 订房失败订单的处理方法、装置、计算机设备及存储介质
CN109800360B (zh) 小区查询方法、装置、电子设备及存储介质
CN108932525B (zh) 一种行为预测方法及装置
CN109658187A (zh) 推荐云服务商的方法、装置、存储介质及电子设备
CN108345607B (zh) 搜索方法和装置
US11023465B2 (en) Cross-asset data modeling in multi-asset databases
CN110322139B (zh) 策略推荐方法及装置
US10082956B2 (en) Method and apparatus for downloading data including a progress bar indicating progress of downloading
CN110059097B (zh) 数据处理方法和装置
CN112182107B (zh) 名单数据获取方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant