CN113342905B - 一种停留点确定方法及装置 - Google Patents

一种停留点确定方法及装置 Download PDF

Info

Publication number
CN113342905B
CN113342905B CN202110632294.XA CN202110632294A CN113342905B CN 113342905 B CN113342905 B CN 113342905B CN 202110632294 A CN202110632294 A CN 202110632294A CN 113342905 B CN113342905 B CN 113342905B
Authority
CN
China
Prior art keywords
track
point
points
target
track points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110632294.XA
Other languages
English (en)
Other versions
CN113342905A (zh
Inventor
李莉
苏璐敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202110632294.XA priority Critical patent/CN113342905B/zh
Publication of CN113342905A publication Critical patent/CN113342905A/zh
Application granted granted Critical
Publication of CN113342905B publication Critical patent/CN113342905B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Abstract

本发明实施例提供了一种停留点确定方法及装置。方案如下:获取目标用户的运动轨迹,对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且该轨迹序列中的轨迹点按照采集时间顺序排列,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类,选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类,将停留点聚类的中心位置确定为目标用户的停留点。通过本发明实施例提供的技术方案,提高了停留点确定的准确性。

Description

一种停留点确定方法及装置
技术领域
本发明涉及数据挖掘技术领域,特别是涉及一种停留点确定方法及装置。
背景技术
随着智能化移动设备的普及,每天智能化移动设备都会根据用户的运动轨迹,生成大量的轨迹数据。面对指数式增长的轨迹数据,如何从这些轨迹数据中挖掘出有用的用户信息成为轨迹数据分析的重要研究部分。例如,通过对用户的运动轨迹进行轨迹数据分析,可以为该用户提供人群拥塞预警、网络资源分配或移动性管理等服务。
目前,在轨迹数据分析过程中,主要是在时间维度和空间维度进行处理,从中发现对用户具有一定意义的场所或地点,也就是发现用户停留时间较久的停留区域或停留点。在确定停留区域或停留点时,往往采用多重聚类的方法从用户的运动轨迹中获取多个轨迹点,从而确定用户的停留区域或停留点。其中,聚类的方法主要可以分为基于启发式的固定阈值进行聚类处理的方法,以及基于聚类算法进行聚类处理的方法。
在采用基于启发式的固定阈值进行多重聚类时,固定阈值主要包括的时间阈值和距离阈值,而固定阈值的准确性对聚类结果影响较大,从而影响确定的停留点的准确性。另外,在采用基于聚类算法进行多重聚类时,往往会忽略不同轨迹点之间的时间一致性对聚类结果的影响。因此,在对用户的运动轨迹进行轨迹数据分析时,确定的停留点不够准确。
发明内容
本发明实施例的目的在于提供一种停留点确定方法及装置,以提高停留点确定的准确性。具体技术方案如下:
本发明实施例提供了一种停留点确定方法,包括:
获取目标用户的运动轨迹;
对所述运动轨迹进行抽样处理,得到轨迹序列,所述轨迹序列中包括多个轨迹点,且所述轨迹序列中的轨迹点按照采集时间顺序排列;
利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类;
选取包括的轨迹点的数量大于预设数量阈值的聚类,作为所述目标用户的停留点聚类;
将所述停留点聚类的中心位置确定为所述目标用户的停留点。
可选的,所述对所述运动轨迹进行抽样处理,得到轨迹序列的步骤,包括:
按照预设时间间隔,对所述运动轨迹进行抽样处理,得到轨迹序列;
或,按照预设距离间隔,对所述运动轨迹进行抽样处理,得到轨迹序列。
可选的,所述利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类的步骤,包括:
从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点;
以所述目标轨迹点为预设时间窗口的滑动起点,根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点,所述相关轨迹点为未被聚类的轨迹点;
若存在所述相关轨迹点,则将所述相关轨迹点归属于所述目标聚类;
将所述预设时间窗口向后滑动预设滑动间隔,返回执行所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤;
若不存在所述相关轨迹点,则返回执行所述从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
可选的,所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤,包括:
根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,所述一致性权值用于衡量不同轨迹点之间是否满足时空一致性;
判断所述预设时间窗口中是否存在与所述目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点;
若存在,则确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点;
若不存在,则确定所述预设时间窗口中不存在所述目标轨迹点的相关轨迹点;
若确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点,则所述方法还包括:
将与所述目标轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的轨迹点,确定为所述目标轨迹点的第一相关轨迹点;
将与所述第一相关轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的其他轨迹点,确定为所述目标轨迹点的第二相关轨迹点。
可选的,所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值的步骤,包括:
针对所述预设时间窗口中每两个轨迹点,利用以下公式,确定每两个轨迹点间的一致性权值coh(p,q):
Figure BDA0003104141670000031
p为所述预设时间窗口中的轨迹点p,q为所述预设时间窗口中的轨迹点q,函数exp为底数为自然常数e的指数函数,s(p,q)为所述轨迹点p与所述轨迹点q之间的距离,δ为调整距离参数的预设权值,t(p,q)为所述轨迹点p与所述轨迹点q间的采集时间差。
可选的,在将所述停留点聚类的中心位置确定为所述目标用户的停留点之后,还包括:
针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定所述目标用户在该停留点的停留时段;
针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠;
若重叠,则对该相邻的两个停留点对应的停留点聚类进行合并处理;
若不重叠,则判断该相邻的两个停留点间的距离是否小于预设距离阈值;
若小于所述预设距离阈值,则对该相邻的两个停留点对应的停留点聚类进行合并处理;
利用合并后的停留点聚类的中心位置对所述目标用户的停留点进行更新。
本发明实施例还提供了一种停留点确定装置,包括:
获取模块,用于获取目标用户的运动轨迹;
抽样模块,用于对所述运动轨迹进行抽样处理,得到轨迹序列,所述轨迹序列中包括多个轨迹点,且所述轨迹序列中的轨迹点按照采集时间顺序排列;
聚类模块,用于利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类;
选取模块,用于选取包括的轨迹点的数量大于预设数量阈值的聚类,作为所述目标用户的停留点聚类;
第一确定模块,用于将所述停留点聚类的中心位置确定为所述目标用户的停留点。
可选的,所述抽样模块,具体用于按照预设时间间隔,对所述运动轨迹进行抽样处理,得到轨迹序列;或,按照预设距离间隔,对所述运动轨迹进行抽样处理,得到轨迹序列。
可选的,所述聚类模块,包括:
选取子模块,用于从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点;
第一确定子模块,用于以所述目标轨迹点为预设时间窗口的滑动起点,根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点,所述相关轨迹点为未被聚类的轨迹点;
归属子模块,用于在所述第一确定子模块的确定结果为是时,将所述相关轨迹点归属于所述目标聚类;
第一执行子模块,用于将所述预设时间窗口向后滑动预设滑动间隔,返回执行所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤;
第二执行子模块,用于在所述第一确定子模块的确定结果为否时,返回执行所述从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
可选的,所述第一确定子模块,包括:
第一确定单元,用于根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,所述一致性权值用于衡量不同轨迹点之间是否满足时空一致性;
判断单元,用于判断所述预设时间窗口中是否存在与所述目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点;
第二确定单元,用于在所述判断单元的判断结果为是时,确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点;
第三确定单元,用于在所述判断单元的判断结果为否时,确定所述预设时间窗口中不存在所述目标轨迹点的相关轨迹点;
若确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点,则所述装置还包括:
第二确定子模块,用于将与所述目标轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的轨迹点,确定为所述目标轨迹点的第一相关轨迹点;
第三确定子模块,用于将与所述第一相关轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的其他轨迹点,确定为所述目标轨迹点的第二相关轨迹点。
可选的,所述第一确定单元,具体用于针对所述预设时间窗口中每两个轨迹点,利用以下公式,确定每两个轨迹点间的一致性权值coh(p,q):
Figure BDA0003104141670000061
p为所述预设时间窗口中的轨迹点p,q为所述预设时间窗口中的轨迹点q,函数exp为底数为自然常数e的指数函数,s(p,q)为所述轨迹点p与所述轨迹点q之间的距离,δ为调整距离参数的预设权值,t(p,q)为所述轨迹点p与所述轨迹点q间的采集时间差。
可选的,所述装置还包括:
第二确定模块,用于针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定所述目标用户在该停留点的停留时段;
第一判断模块,用于针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠;
第一合并模块,用于在所述第一判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
第二判断模块,用于在所述第一判断模块的判断结果为否时,判断该相邻的两个停留点间的距离是否小于预设距离阈值;
第二合并模块,用于在所述第二判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
更新模块,用于利用合并后的停留点聚类的中心位置对所述目标用户的停留点进行更新。
本发明实施例还提供了一种电子设备,所述电子设备包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的停留点确定方法步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的停留点确定方法步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一所述的停留点确定方法。
本发明实施例有益效果:
本发明实施例提供的一种停留点确定方法及装置,可以获取目标用户的运动轨迹,对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且该轨迹序列中的轨迹点按照采集时间顺序排列,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类,选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类,将停留点聚类的中心位置确定为目标用户的停留点。通过本发明实施例提供的技术方案,利用预设时间窗口对轨迹序列中的轨迹点进行聚类处理,得到多个聚类,使得每个聚类中的每一轨迹点满足时空一致性,进而使得根据每一聚类确定的停留点更加准确,提高了停留点确定的准确性。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的停留点确定方法的第一种流程示意图;
图2为本发明实施例提供的相关轨迹点确定过程的一种示意图;
图3为本发明实施例提供的停留点确定方法的第二种流程示意图;
图4为本发明实施例提供的对运动轨迹进行预处理后的轨迹序列的一种示意图;
图5为本发明实施例提供的抽样处理后的轨迹序列的一种示意图;
图6为本发明实施例提供的停留点聚类的一种示意图;
图7为本发明实施例提供的停留点的一种示意图;
图8为本发明实施例提供的停留点确定装置的一种结构示意图;
图9为本发明实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在基于启发式固定阈值进行多重聚类,确定停留点时,利用预设的时间阈值和距离阈值,将目标用户的运动轨迹中查找在距离阈值内超过时间阈值的区域,确定为停留区域,进而确定停留点。以时间阈值为10分钟,距离阈值为100米为例,从运动轨迹的第一个轨迹点处查找与该轨迹点距离100米的后续轨迹点,确定第一个轨迹点和该后续轨迹点之间的时间差是否大于10分钟,若是,则根据第一个轨迹点与该后续轨迹点对应的区域,确定目标用户的停留区域,以及停留点。由于时间阈值和距离阈值的准确性对聚类结果影响较大,从而影响确定的停留点的准确性。
另外,在基于聚类算法进行多重聚类,确定停留点时,往往是基于密度的噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise DBSCAN)算法进行聚类处理的,但是由于忽略了不同轨迹点之间的时间一致性对聚类结果的影响,也使得聚类结果不够准确,进而导致确定的停留点不够准确。例如,目标用户在上午10:00从P点出发,11:00到达距离P点较远A点。下午3:00从A点出发,3:55到达距离P点较近的Q点。因此,该目标用户正是的停留点为P点、A点和Q点。但是采用DBSCAN算法确定该目标yogh用户的停留点时,由于P点与Q点之间的距离较近,P点和Q点将被聚类到一起,导致确定的停留点出现偏差。
为了解决现有停留点确定不够准确的问题,本发明实施例提供的一种停留点确定方法。该方法适用于任一电子设备。获取目标用户的运动轨迹,对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且该轨迹序列中的轨迹点按照采集时间顺序排列,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类,选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类,将停留点聚类的中心位置确定为目标用户的停留点。
通过本发明实施例提供的方法,利用预设时间窗口对轨迹序列中的轨迹点进行聚类处理,得到多个聚类,使得每个聚类中的每一轨迹点满足时空一致性,进而使得根据每一聚类确定的停留点更加准确,提高了停留点确定的准确性。
下面通过具体实施例,对本发明实施例进行说明。
如图1所示,图1为本发明实施例提供的停留点确定方法的第一种流程示意图。该方法包括以下步骤。
步骤S101,获取目标用户的运动轨迹。
在本步骤中,当目标用户进行运动时,如目标用户进行跑步或步行等运动时,电子设备或电子设备中的某些应用程序可以记录该目标用户的运动轨迹。电子设备获取该运动轨迹。
一个可选的实施例中,在获取到目标用户的运动轨迹后,电子设备可以对运动轨迹进行一定的预处理。在此,对预处理的方法不作具体限定。
步骤S102,对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且轨迹序列中的轨迹点按照采集时间顺序排列。
在本步骤中,电子设备可以对目标用户的运动轨迹进行抽样处理,得到多个轨迹点。电子设备根据每一轨迹点对应的采集时间,按照每一轨迹点对应的采集时间对抽样得到的多个轨迹点进行排序,得到该目标用户的轨迹序列。
一个可选的实施例中,电子设备可以按照预设时间间隔,对目标用户的运动轨迹进行抽样处理,得到轨迹序列。例如,预设时间间隔为5秒,电子设备可以根据上述运动轨迹中每一轨迹点对应的采集时间,每间隔5秒对运动轨迹进行抽样处理,得到轨迹序列。
另一个可选的实施例中,电子设备可以按照预设距离间隔,对目标用户的运动轨迹进行抽样处理,得到轨迹序列。例如,预设距离间隔为5米,电子设备可以根据上述运动轨迹中每一轨迹点间的距离,每间隔5米对运动轨迹进行抽样处理,得到轨迹序列。
在本发明实施例中,上述预设时间阈值和预设距离阈值可以根据实际使用的场景确定。例如,可以根据基站收集目标用户的运动数据的方式确定上述预设时间阈值和预设距离阈值。在此,对上述预设时间阈值和预设距离阈值的确定方法不作具体限定。
另外,在本发明实施例中,上述轨迹序列中的每一轨迹点存在对应的轨迹点数据,该轨迹点数据包括但不限于该轨迹点对应的采集时间、维度、经度以及海拔高度。
通过对运动轨迹的抽样处理,可以很好的控制轨迹序列中轨迹点的数量的同时,使得抽样得到的轨迹点可以体现出运动轨迹在时间维度或空间维度中特性,降低了轨迹点的数量,提高了停留点确定的效率。
步骤S103,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类。
在本步骤中,电子设备利用预设时间窗口在上述轨迹序列上滑动,并在滑动过程中,根据该轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类。关于聚类处理的具体过程可参见下文描述,在此,不作具体说明。
步骤S104,选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类。
在本步骤中,针对聚类处理后得到的每一聚类,电子设备可以统计该聚类中包括的轨迹点的数量,并将轨迹点数量大于预设数量阈值的聚类确定为目标用户的停留点聚类。
一个可选的实施例中,在确定目标用户的停留点聚类之后,电子设备可以该停留点聚类,确定目标用户的停留区域。一个实施例中,目标用户的停留区域可以为该停留点聚类中每一轨迹点所在位置所构成的区域。
一个可选的实施例中,针对聚类处理后包括的轨迹点的数量不大于上述预设数量阈值的聚类,电子设备可以丢弃该聚类。例如,电子设备可以从聚类后得到的聚类中,删除包括的轨迹点的数量不大于预设数量阈值的聚类。或者,电子设备可以在轨迹序列中,删除包括的轨迹点的数量不大于预设数量阈值的聚类中的每一轨迹点。
步骤S105,将停留点聚类的中心位置确定为目标用户的停留点。
在本步骤中,电子设备可以根据停留点聚类中每一轨迹点的位置信息,确定该停留点聚类的中心位置,并将该中心位置确定为目标用户的停留点。
一个实施例中,针对每一停留点聚类,基于每一轨迹点对应的轨迹点数据,电子设备可以根据该停留点聚类中每一轨迹点的经度和纬度,确定该停留点聚类的中心位置,得到目标用户的停留点。
一个可选的实施例中,针对每一停留点,电子设备可以根据该停留点所对应的停留点聚类中轨迹点的最早采集时间以及最晚采集时间,确定目标用户在该停留点的停留时段。
综上所述,通过本发明实施例提供的方法,利用预设时间窗口对轨迹序列中的轨迹点进行聚类处理,得到多个聚类,使得每个聚类中的每一轨迹点满足时空一致性,进而使得根据每一聚类确定的停留点更加准确,提高了停留点确定的准确性。
一个可选的实施例中,上述步骤S103,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类,具体可以包括以下步骤。
步骤一,从轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点。
在本步骤中,电子设备可以根据轨迹序列中每一轨迹点对应的采集时间,将采集时间最早且未被聚类的轨迹点确定为目标轨迹点,并将该目标轨迹点归属于目标聚类。
步骤二,以目标轨迹点为预设时间窗口的滑动起点,根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点,该相关轨迹点为未被聚类的轨迹点。若是,在执行步骤三。若否,则执行步骤五。
在本步骤中,电子设备可以将目标轨迹点所在的位置作为预设时间窗口的滑动起点。电子设备根据预设时间窗口中每两个轨迹点之间的距离以及采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点。目标轨迹点的相关轨迹点与该目标轨迹点之间满足时空一致性。
步骤三,将相关轨迹点归属于目标聚类。
在本步骤中,在确定预设时间窗口中存在目标轨迹点的相关轨迹点时,电子设备可以将相关轨迹点归属到目标聚类中,也就是将相关轨迹点聚类到目标聚类中。
步骤四,将预设时间窗口向后滑动预设滑动间隔,并重新确定预设时间窗口中是否存在目标轨迹点的相关轨迹点。
在本步骤中,电子设备可以将预设时间窗口向后滑动预设滑动间隔,并返回执行上述根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点的步骤。也就是电子设备在轨迹序列中,将预设时间窗口向采集时间较晚的方向滑动预设滑动间隔,并重新确定预设时间窗口中是否存在目标轨迹点对应的相关轨迹点。
步骤五,重新确定目标聚类中的目标轨迹点。
在本步骤中,当确定预设时间窗口中不存在目标轨迹点的相关轨迹点时,电子设备可以重新确定目标轨迹点以及目标聚类。电子设备可以返回执行上述步骤一,从轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
一个可选的实施例中,上述步骤二中的根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点的步骤,具体可以包括以下步骤:
步骤A,根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,该一致性权值用于衡量不同轨迹点之间是否满足时空一致性。
在本步骤中,电子设备可以根据预设窗口中每两个轨迹点之间的距离和采集时间差,确定每两个轨迹点间的一致性权值。两个轨迹点之间的一致性权值越大,这两个轨迹点之间的时空一致性越强。两个轨迹点之间的一致性权值越小,这两个轨迹点之间的时空一致性越弱。
一个可选的实施例中,上述根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值的步骤,包括:
针对预设时间窗口中每两个轨迹点,电子设备可以利用以下公式,确定每两个轨迹点间的一致性权值coh(p,q):
Figure BDA0003104141670000131
p为预设时间窗口中的轨迹点p,q为预设时间窗口中的轨迹点q,函数exp为底数为自然常数e的指数函数,s(p,q)为轨迹点p与轨迹点q之间的距离,δ为调整距离参数的预设权值,t(p,q)为轨迹点p与轨迹点q间的采集时间差。
步骤B,判断预设时间窗口中是否存在与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点。若是,则执行步骤C。若否,则执行步骤D。
在本步骤中,电子设备将预设时间窗口中的每一轨迹点与目标轨迹点间的一致性权值与预设一致性权值阈值进行比较,确定是否存在与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点,即目标轨迹点的相关轨迹点。
步骤C,确定预设时间窗口中存在目标轨迹点的相关轨迹点。
在本步骤中,当存在与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点时,电子设备可以确定预设时间窗口中存在目标轨迹点的相关轨迹点。
步骤D,确定预设时间窗口中不存在目标轨迹点的相关轨迹点。
在本步骤中,当不存在与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点时,电子设备可以确定预设时间窗口中不存在目标轨迹点的相关轨迹点。
根据上述步骤A-步骤D提供的相关轨迹点的确定方法,在预设时间窗口滑动过程中,当确定预设时间窗口中存在目标轨迹点的相关轨迹点时,还可以包括以下步骤。
步骤E,将与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点,确定为目标轨迹点的第一相关轨迹点。
步骤F,将与第一相关轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的其他轨迹点,确定为目标轨迹点的第二相关轨迹点。
为方便理解,若目标轨迹点为轨迹点1,预设时间窗口中与目标轨迹点间的一致性权值大于预设一致性权值阈值的轨迹点有轨迹点2和轨迹点3,也就是目标轨迹点的第一相关轨迹点包括轨迹点2和轨迹点3。若轨迹点4与轨迹点2间的一致性权值大于预设一致性权值阈值,但轨迹点4与轨迹点1间的一致性权值不大于预设一致性权值阈值,则电子设备可以确定轨迹点4为目标轨迹点的第二相关轨迹点。以此类推,与第二相关轨迹点间的一致性权值大于预设一致性权值阈值的轨迹点,可以确定为目标轨迹点的相关轨迹点,即第三相关轨迹点。
为方便理解,以图2为例对上述步骤一-步骤五进行说明。图2为本发明实施例提供的相关轨迹点确定过程的一种示意图。其中,P1至Pn为一轨迹序列中包括的多个轨迹点。
通过对目标用户的运动轨迹进行抽样处理,得到过程1所示的轨迹序列,该轨迹序列中包括n个轨迹点,每一轨迹点按照采集时间的先后排序,即是P1的采集时间最早,Pn的采集时间最晚。
在第一次聚类过程中,如过程2所示,以P1为目标轨迹点,将P1归属于目标聚类,如聚类1。此时,电子设备可以P1与预设时间窗口2中的其他轨迹点之间的一致性权值,确定预设时间窗口2中是否存在目标轨迹点的第一相关轨迹点,即P1的第一相关轨迹点。
当预设时间窗口2中存在的第一相关轨迹点时,如第一相关轨迹点为P3和P4。此时,电子设备可以将P3和P4聚类到聚类1中,并将预设时间窗口2向后移动预设滑动间隔,如过程3所示。此时,电子设备可以根据P1与预设时间窗口2中其他轨迹点之间的一致性权值,和预设时间窗口2中P3和P4与其他轨迹点之间的一致性权值,确定是否存在P1的第一相关轨迹点或P1的第二相关轨迹点。若存在,则继续将滑动预设时间窗口2向后滑动预设滑动间隔。重复上述过程,确定是否存在P1的相关轨迹点,直至预设时间窗口中不存在P1的相关轨迹点时,滑动预设时间窗口2,如过程4所示,此时,预设时间窗口2中包括的轨迹点为Pi-1、Pi、Pi+1和Pi+2。若Pi-1、Pi、Pi+1和Pi+2均不是P1的相关轨迹点,则电子设备可以停止滑动预设时间窗口2。此时,电子设备可以聚类1中包括的所有轨迹点为P1以及P1至Pi-2中所有P1的相关轨迹点。
在停止滑动预设时间窗口2之后,电子设备进行第二次聚类过程。电子设备可以重新确定目标轨迹点和目标聚类,也就是重新将采集时间最早且未被聚类的轨迹点确定为目标轨迹点,即P2,并将P2归属于目标聚类,如聚类2。电子设备以P2为预设时间窗口2的滑动起点,如过程5所示,参照上述滑动过程,确定聚类2中包括的所有轨迹点。以此类推,直至轨迹序列中不包括未被聚类的轨迹点为止,得到多个聚类。
在上述预设时间窗口2滑动过程中,如过程2所示,若P2、P3和P4,在将预设时间窗口2向后滑动后,如过程3所示,若P5也不是P1的相关轨迹点,此时,预设时间窗口2的轨迹点P2、P3、P4和P5均不是P1的相关轨迹点,电子设备可以确定聚类1中包括的轨迹点有且仅有P1
在本发明实施例中,上述在确定目标轨迹点对应的相关轨迹点时,通过预设时间窗口中每两个轨迹点间的距离和采集时间差确定。为减少数据的计算量,电子设备也可以利用目标轨迹点以及预设时间窗口中未被聚类的轨迹点,根据每两个轨迹点间的距离和采集时间差,确定目标轨迹点对应的相关轨迹点。在此,对相关轨迹点的确定过程不作具体说明。
另外,在本发明实施例中,当预设时间窗口中不存在目标轨迹点的相关轨迹点时,停止滑动预设时间窗口,缩短了目标轨迹点的相关轨迹点的确定时长,提高了相关轨迹点确定的效率。并且,降低与目标轨迹点距离较近但采集时间差较大的轨迹点对相关轨迹点确定的影响,提高了相关轨迹点确定的准确性,进而提高了停留点确定的准确性。
一个可选的实施例中,根据图1所示的停留点确定方法,本发明实施例还提供了一种停留点确定方法。如图3所示,图3为本发明实施例提供的停留点确定方法的第二种流程示意图。该方法具体包括以下步骤。
步骤S301,获取目标用户的运动轨迹。
步骤S302,对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且轨迹序列中的轨迹点按照采集时间顺序排列。
步骤S303,利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类。
步骤S304,选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类。
步骤S305,将停留点聚类的中心位置确定为目标用户的停留点。
上述步骤S301-步骤S305与上述步骤S101-步骤S105相同。
步骤S306,针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定目标用户在该停留点的停留时段。
在本步骤中,针对每一停留点,电子设备可以根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定为目标用户在该停留点的停留时段。例如,某一停留点对应的停留点聚类中轨迹点最早的采集时间为10:00,最晚的采集时间为10:30,电子设备可以确定该停留点的停留时段为10:00到10:30之间,表示为:10:00-10:30。
步骤S307,针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠。若否,则执行步骤S308。若是,则执行步骤S309。
在本步骤中,针对相邻的两个停留点,电子设备将该相邻的两个停留点对应的停留时段进行比较,确定该相邻的两个停留点在停留时段上是否重叠。具体可以包括以下情况。
步骤S308,针对每相邻的两个停留点,判断该相邻的两个停留点间的距离是否小于预设距离阈值。若是,则执行步骤S309。
在本步骤中,针对每相邻的两个停留点,电子设备可以将该相邻的两个停留点间的距离与预设距离阈值进行比较,确定该相邻的两个停留点间的距离是否小于预设距离阈值。
针对上述相邻的两个停留点间在停留时段上重叠的现象进行举例说明。若相邻的两个停留点为停留点A和停留点B,且停留点A的停留时段为:10:30-11:30,停留点B的停留时段为:11:25-12:00,则停留点A和停留点B在11:25到11:30时段上重叠,则电子设备可以确定停留点A和停留点B在停留时段上重叠。
步骤S309,对该相邻的两个停留点对应的停留点聚类进行合并处理。
在本步骤中,当相邻的两个停留点间在停留时段上重叠时,或当相邻的两个停留点间在停留时段上不重叠,且该相邻的两个停留点间的距离小于预设距离阈值时,电子设备可以对该相邻的两个停留点对应的停留点聚类进行合并处理。也就是当满足下面情况一、情况二和情况三中的任意一种情况,电子设备都可以对该相邻的两个停留点对应的停留点聚类进行合并处理。
情况一,该相邻的两个停留点间在停留时段上重叠,且该相邻的两个停留点间的距离小于预设距离阈值。
情况二,该相邻的两个停留点间在停留时段上重叠,但该相邻的两个停留点间的距离不小于预设距离阈值。
情况三,该相邻的两个停留点间在停留时段上不重叠,但该相邻的两个停留点间的距离小于预设距离阈值。
一个可选的实施例中,当相邻的两个停留点间在停留时段上不重叠,且该相邻的两个停留点间的距离大于等于预设距离阈值时,电子设备可以对该相邻的两个停留点不作合并处理,该相邻的两个停留点仍为目标用户的停留点。
在本发明实施例中,仅以步骤S307在步骤S308之前执行为例进行说明,除此以外,上述步骤S308也可以在上述步骤S307之前执行,在此,对上述步骤S307与步骤S308的执行顺序不作具体限定。
步骤S310,利用合并后的停留点聚类的中心位置对目标用户的停留点进行更新。
在本步骤中,电子设备可以根据合并后的停留点聚类中的每一停留点的经度和纬度,确定该合并后的停留点聚类的中心位置,从而利用该中心位置对上述步骤S305所确定的目标用户的停留点进行更新。也就是利用合并后的停留点聚类的中心位置替换合并后的停留点聚类中的每一停留点,得到目标用户的停留点,实现对目标用户的停留点的更新。
为便于理解,对目标用户的停留点的更新过程进行说明。若上述步骤S305所确定的目标用户的停留点有10个,分别为点1-点10。根据上述步骤S306-步骤S309,电子设备可以对点1-点4,点5-点9进行合并处理,得到点1-点4对应的停留点聚类1以及点5-点9所对应的停留点聚类2。在确定停留点聚类1的中心位置1和停留点聚类的中心位置2后,电子设备可以利用中心位置1和中心位置2对目标用户的停留点进行更新。也就是将目标用户的停留点中的点1-点4更新为中心位置1,将点5-点9更新为中心位置2,此时,电子设备可以确定为目标用户的停留点有3个,分别为中心位置1、中心位置2和点10。
通过图3所示的停留点确定方法,电子设备对聚类处理后得到的多个停留点进行再聚类处理,使得再聚类后的停留点在满足时空一致性的同时,减少了停留点的数量,进一步提高了确定的停留点的准确性。
为方便理解,下面以图4-图7为例进行说明。
电子设备获取目标用户的运动轨迹,并对获取到的运动轨迹进行预处理得到如图4所示的预处理后的轨迹序列。图4为本发明实施例提供的对运动轨迹进行预处理后的轨迹序列的一种示意图。
由于预处理后的轨迹序列中包括大量的轨迹点,为提高停留点确定的效率,电子设备可以对预处理后的运动轨迹进行抽样处理,得到如图5所示的轨迹序列,图5为本发明实施例提供的抽样处理后的轨迹序列的一种示意图。
在得到图5所示的轨迹序列后,电子设备可以利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类。电子设备从聚类处理得到的多个聚类中,选取包括的轨迹点的数量大于预设数量阈值的聚类,得到如图6所示目标用户的停留点聚类,图6为本发明实施例提供的停留点聚类的一种示意图。
在得到图6所示的停留点聚类后,电子设备可以对根据图6中的停留点聚类确定每一停留点聚类的中心位置,得到如图7所示的3个停留点,也就是停留点701,停留点702和停留点703。图7为本发明实施例提供的停留点的一种示意图。
基于同一种发明构思,根据上述本发明实施例提供一种停留点确定方法,本发明实施例还提供了一种停留点确定装置。如图8所示,图8为本发明实施例提供的停留点确定装置的一种结构示意图。该装置包括以下模块。
获取模块801,用于获取目标用户的运动轨迹。
抽样模块802,用于对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且轨迹序列中的轨迹点按照采集时间顺序排列。
聚类模块803,用于利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类。
选取模块804,用于选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类。
第一确定模块805,用于将停留点聚类的中心位置确定为目标用户的停留点。
可选的,上述抽样模块802,具体可以用于按照预设时间间隔,对运动轨迹进行抽样处理,得到轨迹序列;或,按照预设距离间隔,对运动轨迹进行抽样处理,得到轨迹序列。
可选的,上述聚类模块803,可以包括:
选取子模块,用于从轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点。
第一确定子模块,用于以目标轨迹点为预设时间窗口的滑动起点,根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点,该相关轨迹点为未被聚类的轨迹点。
归属子模块,用于在第一确定子模块的确定结果为是时,将相关轨迹点归属于目标聚类。
第一执行子模块,用于将预设时间窗口向后滑动预设滑动间隔,返回执行根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定预设时间窗口中是否存在目标轨迹点的相关轨迹点的步骤。
第二执行子模块,用于在第一确定子模块的确定结果为否时,返回执行从轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
可选的,上述第一确定子模块,可以包括:
第一确定单元,用于根据预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,该一致性权值用于衡量不同轨迹点之间是否满足时空一致性。
判断单元,用于判断预设时间窗口中是否存在与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点。
第二确定单元,用于在判断单元的判断结果为是时,确定预设时间窗口中存在目标轨迹点的相关轨迹点。
第三确定单元,用于在判断单元的判断结果为否时,确定预设时间窗口中不存在目标轨迹点的相关轨迹点。
若确定预设时间窗口中存在目标轨迹点的相关轨迹点,则上述停留点确定装置还可以包括:
第二确定子模块,用于将与目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点,确定为目标轨迹点的第一相关轨迹点。
第三确定子模块,用于将与第一相关轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的其他轨迹点,确定为目标轨迹点的第二相关轨迹点。
可选的,上述第一确定单元,具体用于针对预设时间窗口中每两个轨迹点,利用以下公式,确定每两个轨迹点间的一致性权值coh(p,q):
Figure BDA0003104141670000201
p为预设时间窗口中的轨迹点p,q为预设时间窗口中的轨迹点q,函数exp为底数为自然常数e的指数函数,s(p,q)为轨迹点p与轨迹点q之间的距离,δ为调整距离参数的预设权值,t(p,q)为轨迹点p与轨迹点q间的采集时间差。
可选的,上述停留点确定装置还可以包括:
第二确定模块,用于针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定目标用户在该停留点的停留时段。
第一判断模块,用于针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠;
第一合并模块,用于在第一判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
第二判断模块,用于在第一判断模块的判断结果为否时,判断该相邻的两个停留点间的距离是否小于预设距离阈值;
第二合并模块,用于在第二判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
更新模块,用于利用合并后的停留点聚类的中心位置对目标用户的停留点进行更新。
通过本发明实施例提供的装置,利用预设时间窗口对轨迹序列中的轨迹点进行聚类处理,得到多个聚类,使得每个聚类中的每一轨迹点满足时空一致性,进而使得根据每一聚类确定的停留点更加准确,提高了停留点确定的准确性。
基于同一种发明构思,根据上述本发明实施例提供一种停留点确定方法,本发明实施例还提供了一种电子设备,如图9所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信;
存储器903,用于存放计算机程序;
处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:
获取目标用户的运动轨迹;
对运动轨迹进行抽样处理,得到轨迹序列,该轨迹序列中包括多个轨迹点,且轨迹序列中的轨迹点按照采集时间顺序排列;
利用预设时间窗口以及轨迹序列中每两个轨迹点间的距离和采集时间差,对轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类;
选取包括的轨迹点的数量大于预设数量阈值的聚类,作为目标用户的停留点聚类;
将停留点聚类的中心位置确定为目标用户的停留点。
通过本发明实施例提供的电子设备,利用预设时间窗口对轨迹序列中的轨迹点进行聚类处理,得到多个聚类,使得每个聚类中的每一轨迹点满足时空一致性,进而使得根据每一聚类确定的停留点更加准确,提高了停留点确定的准确性。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
基于同一种发明构思,根据上述本发明实施例提供一种停留点确定方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一停留点确定方法的步骤。
基于同一种发明构思,根据上述本发明实施例提供一种停留点确定方法,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一停留点确定方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、计算机可读存储介质及计算机程序产品等实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (8)

1.一种停留点确定方法,其特征在于,包括:
获取目标用户的运动轨迹;
对所述运动轨迹进行抽样处理,得到轨迹序列,所述轨迹序列中包括多个轨迹点,且所述轨迹序列中的轨迹点按照采集时间顺序排列;
利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类;
选取包括的轨迹点的数量大于预设数量阈值的聚类,作为所述目标用户的停留点聚类;
将所述停留点聚类的中心位置确定为所述目标用户的停留点;
所述利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类的步骤,包括:
从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点;
以所述目标轨迹点为预设时间窗口的滑动起点,根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点,所述相关轨迹点为未被聚类的轨迹点;
若存在所述相关轨迹点,则将所述相关轨迹点归属于所述目标聚类;
将所述预设时间窗口向后滑动预设滑动间隔,返回执行所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤;
若不存在所述相关轨迹点,则返回执行所述从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
2.根据权利要求1所述的方法,其特征在于,所述对所述运动轨迹进行抽样处理,得到轨迹序列的步骤,包括:
按照预设时间间隔,对所述运动轨迹进行抽样处理,得到轨迹序列;
或,按照预设距离间隔,对所述运动轨迹进行抽样处理,得到轨迹序列。
3.根据权利要求1所述的方法,其特征在于,所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤,包括:
根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,所述一致性权值用于衡量不同轨迹点之间是否满足时空一致性;
判断所述预设时间窗口中是否存在与所述目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点;
若存在,则确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点;
若不存在,则确定所述预设时间窗口中不存在所述目标轨迹点的相关轨迹点;
若确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点,则所述方法还包括:
将与所述目标轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的轨迹点,确定为所述目标轨迹点的第一相关轨迹点;
将与所述第一相关轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的其他轨迹点,确定为所述目标轨迹点的第二相关轨迹点。
4.根据权利要求3所述的方法,其特征在于,所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值的步骤,包括:
针对所述预设时间窗口中每两个轨迹点,利用以下公式,确定每两个轨迹点间的一致性权值coh(p,q):
Figure FDA0003773214940000021
p为所述预设时间窗口中的轨迹点p,q为所述预设时间窗口中的轨迹点q,函数exp为底数为自然常数e的指数函数,s(p,q)为所述轨迹点p与所述轨迹点q之间的距离,δ为调整距离参数的预设权值,t(p,q)为所述轨迹点p与所述轨迹点q间的采集时间差。
5.根据权利要求1所述的方法,其特征在于,在将所述停留点聚类的中心位置确定为所述目标用户的停留点之后,还包括:
针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定所述目标用户在该停留点的停留时段;
针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠;
若重叠,则对该相邻的两个停留点对应的停留点聚类进行合并处理;
若不重叠,则判断该相邻的两个停留点间的距离是否小于预设距离阈值;
若小于所述预设距离阈值,则对该相邻的两个停留点对应的停留点聚类进行合并处理;
利用合并后的停留点聚类的中心位置对所述目标用户的停留点进行更新。
6.一种停留点确定装置,其特征在于,包括:
获取模块,用于获取目标用户的运动轨迹;
抽样模块,用于对所述运动轨迹进行抽样处理,得到轨迹序列,所述轨迹序列中包括多个轨迹点,且所述轨迹序列中的轨迹点按照采集时间顺序排列;
聚类模块,用于利用预设时间窗口以及所述轨迹序列中每两个轨迹点间的距离和采集时间差,对所述轨迹序列中的多个轨迹点进行聚类处理,得到多个聚类;
选取模块,用于选取包括的轨迹点的数量大于预设数量阈值的聚类,作为所述目标用户的停留点聚类;
第一确定模块,用于将所述停留点聚类的中心位置确定为所述目标用户的停留点;
所述聚类模块,包括:
选取子模块,用于从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点;
第一确定子模块,用于以所述目标轨迹点为预设时间窗口的滑动起点,根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点,所述相关轨迹点为未被聚类的轨迹点;
归属子模块,用于在所述第一确定子模块的确定结果为是时,将所述相关轨迹点归属于所述目标聚类;
第一执行子模块,用于将所述预设时间窗口向后滑动预设滑动间隔,返回执行所述根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定所述预设时间窗口中是否存在所述目标轨迹点的相关轨迹点的步骤;
第二执行子模块,用于在所述第一确定子模块的确定结果为否时,返回执行所述从所述轨迹序列中选取采集时间最早且未被聚类的轨迹点,作为目标聚类中的目标轨迹点的步骤。
7.根据权利要求6所述的装置,其特征在于,所述第一确定子模块,包括:
第一确定单元,用于根据所述预设时间窗口中每两个轨迹点间的距离和采集时间差,确定每两个轨迹点间的一致性权值,所述一致性权值用于衡量不同轨迹点之间是否满足时空一致性;
判断单元,用于判断所述预设时间窗口中是否存在与所述目标轨迹点间的一致性权值大于预设一致性权值阈值、且未被聚类的轨迹点;
第二确定单元,用于在所述判断单元的判断结果为是时,确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点;
第三确定单元,用于在所述判断单元的判断结果为否时,确定所述预设时间窗口中不存在所述目标轨迹点的相关轨迹点;
若确定所述预设时间窗口中存在所述目标轨迹点的相关轨迹点,则所述装置还包括:
第二确定子模块,用于将与所述目标轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的轨迹点,确定为所述目标轨迹点的第一相关轨迹点;
第三确定子模块,用于将与所述第一相关轨迹点间的一致性权值大于所述预设一致性权值阈值、且未被聚类的其他轨迹点,确定为所述目标轨迹点的第二相关轨迹点。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二确定模块,用于针对每一停留点,根据该停留点对应的停留点聚类中轨迹点最早的采集时间和最晚的采集时间,确定所述目标用户在该停留点的停留时段;
第一判断模块,用于针对每相邻的两个停留点,判断该相邻的两个停留点间在停留时段上是否重叠;
第一合并模块,用于在所述第一判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
第二判断模块,用于在所述第一判断模块的判断结果为否时,判断该相邻的两个停留点间的距离是否小于预设距离阈值;
第二合并模块,用于在所述第二判断模块的判断结果为是时,对该相邻的两个停留点对应的停留点聚类进行合并处理;
更新模块,用于利用合并后的停留点聚类的中心位置对所述目标用户的停留点进行更新。
CN202110632294.XA 2021-06-07 2021-06-07 一种停留点确定方法及装置 Active CN113342905B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110632294.XA CN113342905B (zh) 2021-06-07 2021-06-07 一种停留点确定方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110632294.XA CN113342905B (zh) 2021-06-07 2021-06-07 一种停留点确定方法及装置

Publications (2)

Publication Number Publication Date
CN113342905A CN113342905A (zh) 2021-09-03
CN113342905B true CN113342905B (zh) 2022-10-25

Family

ID=77474821

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110632294.XA Active CN113342905B (zh) 2021-06-07 2021-06-07 一种停留点确定方法及装置

Country Status (1)

Country Link
CN (1) CN113342905B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114265912A (zh) * 2021-12-27 2022-04-01 智慧足迹数据科技有限公司 驻留点生成方法及相关装置
CN114509076B (zh) * 2022-02-16 2023-10-20 平安科技(深圳)有限公司 移动轨迹数据处理方法、装置、设备及存储介质
CN114911887B (zh) * 2022-04-22 2023-06-23 阿波罗智联(北京)科技有限公司 数据处理的方法、装置、设备以及存储介质
CN114663691B (zh) * 2022-05-24 2022-09-20 浙江大华技术股份有限公司 一种落脚点定位方法、装置及电子设备
CN116070035B (zh) * 2022-08-31 2023-10-20 荣耀终端有限公司 数据处理方法和电子设备
CN116738073B (zh) * 2022-09-21 2024-03-22 荣耀终端有限公司 常驻地的识别方法、设备及存储介质
CN117171605B (zh) * 2023-11-03 2024-02-20 中国林业科学研究院森林生态环境与自然保护研究所(国家林业和草原局世界自然遗产保护研究中心) 一种基于gps数据的迁徙鸟类轨迹分割方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180778B1 (en) * 2010-02-05 2012-05-15 Google Inc. Generating action trails from web history
CN110210604A (zh) * 2019-05-21 2019-09-06 北京邮电大学 一种终端设备移动轨迹预测方法及装置
CN111159582A (zh) * 2019-12-20 2020-05-15 北京邮电大学 一种移动对象轨迹数据的处理方法及装置
CN112543419A (zh) * 2019-09-20 2021-03-23 中国移动通信集团吉林有限公司 一种基于密度聚类的用户轨迹预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8180778B1 (en) * 2010-02-05 2012-05-15 Google Inc. Generating action trails from web history
CN110210604A (zh) * 2019-05-21 2019-09-06 北京邮电大学 一种终端设备移动轨迹预测方法及装置
CN112543419A (zh) * 2019-09-20 2021-03-23 中国移动通信集团吉林有限公司 一种基于密度聚类的用户轨迹预测方法及装置
CN111159582A (zh) * 2019-12-20 2020-05-15 北京邮电大学 一种移动对象轨迹数据的处理方法及装置

Also Published As

Publication number Publication date
CN113342905A (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN113342905B (zh) 一种停留点确定方法及装置
CN110210604B (zh) 一种终端设备移动轨迹预测方法及装置
US11640320B2 (en) Correlation of thread intensity and heap usage to identify heap-hoarding stack traces
CN109377329B (zh) 一种房源推荐方法、装置、存储介质及电子设备
CN106202394B (zh) 文本资讯的推荐方法及系统
CN110704751B (zh) 数据处理方法、装置、电子设备及存储介质
CN108834077B (zh) 基于用户移动特性的跟踪区划分方法、装置及电子设备
WO2020199662A1 (zh) 用于推送信息的方法和装置
US20210173827A1 (en) Optimizing Offline Map Data Updates
KR20140093772A (ko) 사용자의 선호도 및 이동 패턴을 이용한 관심지역 추천 방법
CN111046895B (zh) 一种确定目标区域的方法和装置
CN114422267A (zh) 流量检测方法、装置、设备及介质
CN112118304A (zh) 数据预缓存方法、装置、电子设备及存储介质
CN113704378A (zh) 一种伴随信息的确定方法、装置、设备及存储介质
CN108319628B (zh) 一种用户兴趣确定方法及装置
CN114385772A (zh) 位置信息生成方法、装置、设备和计算机可读介质
US7702699B2 (en) Dynamic data stream histograms for large ranges
CN113051400A (zh) 标注数据确定方法、装置、可读介质及电子设备
CN113918801A (zh) 信息推荐方法及设备
CN111835541B (zh) 一种流量识别模型老化检测方法、装置、设备及系统
CN108595513B (zh) 一种视频搜索作弊处理方法及装置
CN112926613A (zh) 一种时间序列训练开始节点的定位方法和装置
CN111582456A (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN111582482B (zh) 用于生成网络模型信息的方法、装置、设备和介质
CN113518132B (zh) 网络地址的类别识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant