CN116017401A - 一种驻留点确定方法、装置、电子设备及存储介质 - Google Patents

一种驻留点确定方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN116017401A
CN116017401A CN202211698443.3A CN202211698443A CN116017401A CN 116017401 A CN116017401 A CN 116017401A CN 202211698443 A CN202211698443 A CN 202211698443A CN 116017401 A CN116017401 A CN 116017401A
Authority
CN
China
Prior art keywords
signaling
point
core
track
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211698443.3A
Other languages
English (en)
Inventor
姜海航
夏井新
黄永明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Network Communication and Security Zijinshan Laboratory
Original Assignee
Network Communication and Security Zijinshan Laboratory
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Network Communication and Security Zijinshan Laboratory filed Critical Network Communication and Security Zijinshan Laboratory
Priority to CN202211698443.3A priority Critical patent/CN116017401A/zh
Publication of CN116017401A publication Critical patent/CN116017401A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Mobile Radio Communication Systems (AREA)

Abstract

本发明实施例公开一种驻留点确定方法、装置、电子设备及存储介质。该方法包括:根据目标用户的手机信令数据确定目标用户对应的信令轨迹点,根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序,按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,并将核心轨迹点组成目标用户的驻留点。本发明实施例,通过各信令轨迹点在至少一个基站内的数量确定相应的数据处理顺序,按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,并将核心轨迹点组成目标用户的驻留点,能够解决核心轨迹点提取时计算复杂度高的问题,在不降低提取核心轨迹点精度的情况下,降低计算复杂度的同时节约了时间成本。

Description

一种驻留点确定方法、装置、电子设备及存储介质
技术领域
本发明涉及通信技术领域,尤其涉及一种驻留点确定方法、装置、电子设备及存储介质。
背景技术
目前,居民出行活动在时间和空间上也日益复杂多样,对城市交通管理和规划决策提出了更高的要求。然而,传统居民出行调查方式长期存在的如调查组织繁琐、基于主观回忆的数据失真、数据更新周期过长等诸多缺陷,在数据源头上阻碍了对城市交通运行现状综合把握的需求。移动通信技术的发展带来了更加海量详实的手机信令数据,为居民出行特征分析提供了高效便捷的技术手段。相比于传统人工调查方法,手机信令数据具备样本覆盖面广、数据客观、更新时效快等诸多优势,受到了业内人士的广泛关注。驻留点是交通调查中非常重要的出行参数,现有技术中,经典的DBSCAN聚类在提取核心点时需要对每一个点周围的点密度进行计算,提取技术存在计算复杂度过高的缺陷,且对百万级人口城市交通状态持续监测时,在高时效性的要求下需要花费巨额的算力和时间成本。
发明内容
有鉴于此,本发明提供一种驻留点确定方法、装置、电子设备、存储介质及产品,能够解决核心轨迹点确定时计算复杂度高的问题,在不降低提取核心轨迹点精度的情况下,降低计算复杂度的同时节约了时间成本。
根据本发明的一方面,本发明实施例提供了一种驻留点确定方法,所述方法包括:
根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点;
根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序;
按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取核心轨迹点,并将所述核心轨迹点组成所述目标用户的驻留点。
根据本发明的另一方面,本发明实施例还提供了一种驻留点确定装置,所述装置包括:
轨迹点确定模块,用于根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点;
顺序确定模块,用于根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序;
驻留点确定模块,用于按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取核心轨迹点,并将所述核心轨迹点组成所述目标用户的驻留点。
根据本发明的另一方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的驻留点确定方法。
根据本发明的另一方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的驻留点确定方法。
本发明实施例的技术方案,在目标用户的手机信令数据内确定目标用户对应的信令轨迹点,根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序,按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,并将核心轨迹点组成目标用户的驻留点。本发明实施例,通过根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序,并按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,能够在不降低提取核心轨迹点精度的情况下,解决核心轨迹点确定时计算复杂度过高的问题,降低计算复杂度的同时节约了时间成本。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种驻留点确定方法的流程图;
图2为本发明一实施例提供的另一种驻留点确定方法的流程图;
图3为本发明一实施例提供的又一种驻留点确定方法的流程图;
图4为本发明一实施例提供的一种改进Rapid-DBSCAN聚类前实际驻留点与信令轨迹点示意图;
图5为本发明一实施例提供的一种改进Rapid-DBSCAN聚类后实际驻留点与核心轨迹点示意图;
图6为本发明一实施例提供的一种算法改进前后计算时间对比箱线图;
图7为本发明一实施例提供的一种驻留点确定装置的结构框图;
图8为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
在一实施例中,图1为本发明一实施例提供的一种驻留点确定方法的流程图,本实施例可适用于对用户的驻留点进行提取时的情况,该方法可以由驻留点确定装置来执行,该驻留点确定装置可以采用硬件和/或软件的形式实现,该驻留点确定装置可配置于电子设备中。
如图1所示,该方法的具体步骤包括:
S110、根据目标用户的手机信令数据确定目标用户对应的信令轨迹点。
其中,手机信令数据可以理解为手机用户与发射基站或者微站之间的通信数据,可以通过手机用户在基站之间的信息交换来确定用户的空间位置,能相对准确的记录人流的时空轨迹。信令轨迹点可以理解为手机信令数据中携带的用户手机发出一条信令信息时对应的经度和维度信息,即为坐标信息,用户到达某个地方发出信令数据,会有对应的信令数据记录时间和对应的信令轨迹点。
在本实施例中,手机信令数据至少包含下述之一:用户标识、位置区码、小区标识、信令记录时间、信令类型、小区位置、基站对应的经度和维度。其中,信令记录时间指的是手机信令数据的记录时间,可以反映出用户在某些基站附近产生信令轨迹点的记录时间。基站对应的经度和维度可以表征基站所在的位置坐标信息。需要说明的是,手机信令数据里面本身是不包含有基站对应的经度和维度,可以通过手机信令数据中对应基站的位置区码和小区标识,然后将其与运营商方中的基站信息表对应每个基站的经度和维度进行匹配得到用户对应基站的信令轨迹点,信令轨迹点可以表征信令数据所在位置信息,即为用户的所在位置信息。示例性的,手机信令数据的格式样式可以如表1所示,本实施例以1个目标用户的手机信令数据为例进行说明。
表1手机信令数据的格式样式
Figure BDA0004023102070000051
在本实施例中,每个用户均对应有相应的手机信令数据,当用户的手机产生一段时间内的手机信令数据的情况下,可以在基站附近产生多个手机信令数据对应的信令轨迹点。在一些实施例中,可以通过获取目标用户的手机信令数据,根据手机信令数据确定目标用户对应的信令轨迹点,获取预先设置的基站信息表,通过将手机信令数据中对应的位置区码和小区标识与基站信息表中对应的位置区码和小区标识进行匹配,以确定目标用户对应的信令轨迹点。
S120、根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序。
其中,数据处理顺序可以理解为目标用户对应的信令轨迹点的聚类顺序,可以为从信令轨迹点中提取核心轨迹点时的聚类顺序。
在本实施例中,可以通过手机信令数据中对应的位置区码和小区标识确定所属的基站,统计对应于同一基站的信令轨迹点的集合,根据信令轨迹点集合中对应的信令轨迹点的数量,以确定目标用户对应的信令轨迹点的处理顺序,需要说明的是,目标用户对应的信令轨迹点可以为对应一个基站,也可以对应多个基站的信令轨迹点,可以理解为,用户可以在一段时间内一直在同一个基站附近产生对应的信令轨迹点,也可以在一段时间内在多个基站附近产生对应于多个基站的信令轨迹点,也即用户对应基站的信令轨迹点有多个。
S130、按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,并将核心轨迹点组成所述目标用户的驻留点。
其中,预设聚类规则指的是对信令轨迹点进行快速聚类的规则,可以通过相应的聚类算法进行实现聚类,本实施例中采用改进后的基于密度的快速聚类算法(RapidDensity-Based Spatial Clustering of Applications with Noise,Rapid-DBSCAN)以实现对信令轨迹点进行快速聚类。
在本实施例中,可以按照相应的数据处理顺序,以按照数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点;若否,则继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
在本发明实施例中,通过按照数据处理顺序,以依次判断以按照数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点;若否,则继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。通过上述方式能够解决核心轨迹点提取时计算复杂度高的问题,能够在不降低提取核心轨迹点精度的情况下,降低计算复杂度的同时节约了时间成本;而传统的经典的DBSCAN聚类在提取核心轨迹点时需要一个一个进行判断是否为核心轨迹点,从而造成提取技术存在计算复杂度高,且对百万级人口城市交通状态持续监测时,在高时效性的要求下需要花费巨额的算力和时间成本。
本发明实施例的技术方案,通过各信令轨迹点在至少一个基站内的数量,以确定数据处理顺序,按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,并将核心轨迹点组成目标用户的驻留点,能够解决核心轨迹点确定时计算复杂度高的问题,在不降低提取核心轨迹点精度的情况下,降低计算复杂度的同时节约了时间成本。
在一实施例中,图2为本发明一实施例提供的另一种驻留点确定方法的流程图,本实施例在上述各实施例地基础上,进行了进一步的细化。
如图2所示,本实施例中的驻留点确定方法,具体可以包含如下步骤:
S210、对手机信令数据进行数据预处理。
数据预处理过程至少包含下述之一:对手机信令数据进行去重操作;
将手机信令数据中缺失的信令数据进行过滤;
将同一用户标识对应的手机信令数据划分为一组,并按照信令记录时间对每组手机信令数据进行排序。
在本实施例中,手机信令数据中的用户标识是唯一的,一个用户标识可以表征是同一个用户的手机信令数据,可以将不同用户对应的手机信令数据按照用户对应的用户标识进行划分,可以理解为,同一用户对应的手机信令数据划分到一组中,以便进行后续的数据操作。除此之外,还可以按照信令记录时间的时间序列进行排序,可以理解为,对于同一个用户对应的手机信令数据,可以按照手机信令数据的信令记录时间,按照一定的时间粒度顺序进行排序。本实施例中可以按照时间粒度的升序进行排序,也可以按照时间粒度的降序进行排序,本实施例在此不做限制。示例性的,用户一天中按照时间粒度的手机信令数据从10月21日0点00分至10月21日23点59分,单独查找出每个用户的所有手机信令数据以及每个手机信令数据对应的信令记录时间,才能更加方便对用户的驻留点进行分析。
在本实施例中,对于同一个用户来说,一天可能会产生很多条手机信令数据,在获取到该用户的所有手机信令数据之后,需要对用户的手机信令数据进行相应的数据预处理,数据预处理过程至少包含下述之一:对手机信令数据进行去重操作;将手机信令数据中缺失的信令数据进行过滤;将同一用户标识对应的手机信令数据划分为一组,并按照信令记录时间对每组手机信令数据进行排序。
S220、根据目标用户的手机信令数据确定目标用户对应的信令轨迹点。
S230、根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序。
S240、按照数据处理顺序以及预设聚类规则在各信令轨迹点内确定核心轨迹点,并将核心轨迹点组成目标用户的驻留点。
S250、提取核心轨迹点对应的信令记录时间。
其中,信令记录时间可以反映出用户在某些基站附近产生核心轨迹点的记录时间。
在本实施例中,核心轨迹点是从信令轨迹点中提取出来的,每个信令轨迹点均对应有相应的信令记录时间,每个核心轨迹点也均对应有相应的信令记录时间,可以提取出核心轨迹点对应的信令记录时间。
S260、确定信令记录时间相连续的至少一组核心轨迹点,其中,每组核心轨迹点中至少包含两个核心轨迹点。
在本实施例中,核心轨迹点对应的信令记录时间若是相连续的,则信令记录时间相连续的核心轨迹点可以组成一组核心轨迹点。本实施例中,判断核心轨迹点对应的信令记录时间是否相连续,在信令记录时间相连续的的情况下,确定信令记录时间相连续的至少一组核心轨迹点。本实施例中的一组核心轨迹点包含至少2个核心轨迹点,至少2个核心轨迹点在时间上是连续的。
S270、确定每组核心轨迹点对应的首末信令记录时间差。
其中,首末信令记录时间差指的是一个核心轨迹点集中对应的第一个核心轨迹点对应的信令记录时间和最后一个核心轨迹点对应的信令记录时间之间的信令记录时间差。
在本实施例中,计算出在每组核心轨迹点中分别对应的第一个核心轨迹点对应的信令记录时间和最后一个核心轨迹点对应的信令记录时间之间的信令记录时间差,以确定每组核心轨迹点对应的首末信令记录时间差。
S280、将首末信令记录时间差大于或等于第一预设时间阈值的至少一组核心轨迹点组成至少一组驻留点簇。
其中,第一预设时间阈值指的是预先设置的首末信令记录时间差时间阈值,该第一预设时间阈值可以依据经验进行设置,也可以通过人为进行自行设置,本实施例在此不做限制。
在本实施例中,确定出信令记录时间相连续的至少一组核心轨迹点所对应的首末信令记录时间差,将首末信令记录时间差大于或等于第一预设时间阈值的至少一组核心轨迹点组成至少一组驻留点簇。其中,驻留点簇可以理解为首末信令记录时间差在预设时间范围内的一组核心轨迹点所组成的驻留点簇,驻留点簇中包含至少两个核心轨迹点。示例性的,第一预设时间阈值为10min,用户从6点至8点在家附近的基站对应相应的一组核心轨迹点,从8点半至11点半在办公地点附近的基站对应相应的一组核心轨迹点,从13点至16点在商场附近的基站对应相应的一组核心轨迹点,会形成对应该用户的多组核心轨迹点,在从8点半至11点半在办公地点附近的基站对应相应的一组核心轨迹点的首末信令记录时间差大于或等于10min,则该组核心点定义为一个驻留点簇。
本发明上述技术方案,通过手机信令数据进行数据预处理,能够将同一用户对应的手机信令数据划分至一组,更加方便对用户的驻留点进行分析;通过在时间连续的一组核心轨迹点的首末信令时间差大于或等于第一预设时间阈值的情况下,将该组核心轨迹点定义为一个驻留点簇,能够更加准确确定出用户的驻留点。
在一实施例中,所述方法,还包括:
确定第一驻留点簇对应的第一核心轨迹点以及第一核心轨迹点对应的第一信令记录时间;
确定第二驻留点簇对应的第二核心轨迹点以及第二核心轨迹点对应的第二信令记录时间;
在第一核心轨迹点和第二核心轨迹点之间的距离小于或等于预设距离阈值,且第一信令记录时间与第二信令记录时间的信令记录时间差小于或等于第二预设时间阈值的情况下,将第一驻留点簇和第二驻留点簇之间产生的信令轨迹点作为待合并核心轨迹点,并将第一驻留点簇、第二驻留点簇以及待合并核心轨迹点合并为一个驻留点簇。
其中,第一驻留点簇指的是至少一组驻留点簇中任意一组驻留点簇,第二驻留点簇指的是与第一驻留点簇相邻的驻留点簇。第一核心轨迹点指的是第一驻留点簇中至少两个核心轨迹点的首个核心轨迹点,第一信令记录时间指的是第一核心轨迹点对应的信令记录时间,第二核心轨迹点指的是第二驻留点簇中至少两个核心轨迹点的末尾核心轨迹点,第二信令记录时间指的是第二核心轨迹点对应的信令记录时间。
在本实施例中,由于通信信号波动的影响,可能手机信令数据会突然到另一个比较远的基站上,然后突然又回到原有的基站上,这时候可能会把用户连续的核心轨迹点打乱造成出错,为防止通信信号的波动对用户核心轨迹点的影响,可以通过确定出第一驻留点簇对应的第一核心轨迹点以及第一核心轨迹点对应的第一信令记录时间,并确定出第二驻留点簇对应的第二核心轨迹点以及第二核心轨迹点对应的第二信令记录时间,在第一核心轨迹点和第二核心轨迹点之间的距离小于或等于预设距离阈值,且第一信令记录时间与第二信令记录时间的信令记录时间差小于或等于第二预设时间阈值的情况下,将第一驻留点簇和第二驻留点簇之间产生的信令轨迹点作为待合并核心轨迹点,并将第一驻留点簇、第二驻留点簇以及待合并核心轨迹点合并为一个驻留点簇。可以理解为,相邻驻留点簇对应的首末核心轨迹点之间距离小于或等于预设距离阈值,且相邻驻留点簇对应的首末信令记录时间差小于或等于第二预设时间阈值,则将相邻的驻留点簇中间的信令轨迹点均确定为核心轨迹点,并将这相邻驻留点簇和中间的信令轨迹点合并为一个驻留点簇。
需要说明的是,由于每个驻留点簇均会对应有相应的信令记录的开始时间和结束时间,可以将驻留点簇对应的信令记录开始时间和结束时间作为用户驻留点的到达时间和离开时刻,驻留点坐标为该驻留点簇中所有核心轨迹点坐标的形心,可以理解为是该驻留点簇中所有驻留点进行求和再取平均值。用公式可以表示为,
Figure BDA0004023102070000121
其中,ci为第i个驻留点的坐标,g为当前驻留点簇中驻留点的个数。
在一实施例中,图3为本发明一实施例提供的又一种驻留点确定方法的流程图,本实施例在上述各实施例地基础上,对根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序,以及按照数据处理顺序以及预设聚类规则在各信令轨迹点内确定核心轨迹点,并将核心轨迹点组成目标用户的驻留点进行了进一步的细化。
如图3所示,本实施例中的驻留点确定方法,具体可以包含如下步骤:
S310、获取目标用户的手机信令数据并提取手机信令数据中的位置区码和小区标识。
其中,位置区码为基站对应的位置区码,每个基站均对应有唯一的位置区码。由于小区众多,每个小区需要利用标识来区分,即为小区标识。
在本实施例中,通过获取目标用户的手机信令数据,可以从目标用户的手机信令数据中提取基站对应的位置区码和小区标识,该位置区码和小区标识可以表征用户的位置信息。
S320、获取预先设置的基站信息表,基站信息表中至少包括下述之一:基站对应的第一位置区码、第一小区标识。
其中,第一位置区码指的是基站信息表中基站对应的位置区码。第一小区标识指的是基站所覆盖小区对应的小区标识。
在本实施例中,可以从通信运营商处以获取各基站预先配置的基站信息表,该基站信息表包括基站的各种信息,至少包括下述之一:基站对应的第一位置区码、第一小区标识。
S330、将位置区码和第一位置区码进行匹配,并将小区标识与第一小区标识进行匹配,以得到分别对应的匹配结果。
在本实施例中,用户到达某个地方发出手机信令数据,获取用户手机信令数据并提取手机信令数中基站对应的位置区码和小区标识,获取预先设置的基站信息表,将手机信令数据中基站对应的位置区码与基站信息表中的第一位置区码进行比对,并将手机信令数据中基站对应的小区标识与基站信息表中的小区标识进行比对,以得到分别对应的匹配结果。
S340、依据匹配结果确定目标用户对应的信令轨迹点。
在本实施例中,在手机信令数据中基站对应的位置区码与基站信息表中的第一位置区码相匹配,且手机信令数据中基站对应的小区标识与基站信息表中的小区标识相匹配的情况下,得到基站的精度和维度,可以确定出目标用户对应的信令轨迹点,也即位置信息,该位置信息可以包含但不限制于用户对应的经度信息和维度信息,可以理解为,位置信息可以反映目标用户对应的信令轨迹点。
S350、确定各信令轨迹点所属的基站,并统计目标用户针对同基站中信令轨迹点的数量。
在本实施例中,可以依据手机信令数据中的位置区码和小区标识,以确定各信令轨迹点所属的基站,统计目标用户的信令轨迹点属于同一基站的信令轨迹点,并组成信令轨迹点集合,然后从信令轨迹点集合中确定出同一基站中信令轨迹点的总数量。
S360、依据信令轨迹点的数量确定信令轨迹点的数据处理顺序。
在本实施例中,可以依据所统计的信令轨迹点的数量,以确定信令轨迹点的数据处理顺序,具体的,同一基站中所包含信令轨迹点数量最多的进行优先处理,可以理解为,依次按照同一基站中所包含信令轨迹点数量由多至少依次进行处理。
S370、按照数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则执行S380,若否,则执行S390。
其中,第一信令轨迹点指的是目标基站中的信令轨迹点。预设数量阈值指的是预先设置的信令轨迹点的个数上限。
在本实施例中,可以按照同一基站中所包含信令轨迹点数量由多至少,依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点;若否,则继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
S380、直接将达到预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点。
其中,预设第一距离阈值指的是某信令轨迹点周围聚类距离阈值。示例性的,预设第一距离阈值可以设置为300m、500m等。
在本实施例中,在目标基站内第一信令轨迹点的数量大于或等于预设数量阈值的情况下,则直接将达到大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点。示例性的,预设数量阈值为10,预设第一距离阈值为300m,如果某一个基站内的信令轨迹点的数量为12,则直接将该基站内的12个信令轨迹点均作为核心轨迹点,并将12个信令轨迹点周围300m内的其他基站内的信令轨迹点也统一设置为核心轨迹点。
S390、继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则执行S3100,若否,则执行S3110。
S3100、则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
S3110、则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
在本实施例中,在目标基站内第一信令轨迹点的数量小于预设数量阈值的情况下,则需要继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。示例性的,预设数量阈值为10个,预设第二距离阈值为300m,如果某一个基站内的第一信令轨迹点的数量为8个,即为不满足预设数量阈值的情况下,若在第一信令轨迹点的300m内存在其他基站对应的第二信令轨迹点的个数为5个,则可知第一信令轨迹点加上第二信令轨迹点的个数之和为13个,超过预设数量阈值,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
本发明实施例中,通过确定各信令轨迹点所属的基站,并统计目标用户针对同基站中信令轨迹点的数量,依据信令轨迹点的数量确定信令轨迹点的数据处理顺序,并以按照数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点;若否,继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕,能够使得针对同基站中数量最多的信令轨迹点,以及周围的信令轨迹点可以优先判断,在不降低提取核心轨迹点精度的情况下,能够进一步降低计算复杂度同时节约了时间成本。
在一实施例中,为便于更好的理解驻留点确定方法,可将本实施例作为优选实施例对驻留点确定方法进行进一步的说明。本实施例中的聚类顺序即为上述实施例中的数据处理顺序。
本实施例中的驻留点确定方法,具体的步骤如下:
a1、获取通信运营商提供的手机信令数据,并对手机信令数据进行预处理。
a2、在目标用户的手机信令数据内确定目标用户对应的信令轨迹点。
a3、根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序。
a4、根据聚类顺序并利用改进后的Rapid-DBSCAN聚类算法从目标用户对应的信令轨迹点中提取出核心轨迹点,并将核心轨迹点组成目标用户的驻留点。
在本实施例中,利用改进后的Rapid-DBSCAN聚类算法从目标用户对应的信令轨迹点中提取出核心轨迹点时,统计出目标用户针对同基站中信令轨迹点的数量,按照信令轨迹点的数量由多到少依次进行判断,将同基站对应的信令轨迹点进行统一判断是否为核心轨迹点,并将同基站信令轨迹点的周围其他同基站信令轨迹点进行统一判断。
在本实施例中,根据聚类顺序并利用改进后的Rapid-DBSCAN聚类算法提取核心轨迹点的具体过程包括:
b1、统计目标用户针对同一基站中信令轨迹点的数量。
b2、依据同一基站中信令轨迹点的数量确定信令轨迹点的数据处理顺序。
b3、按照数据处理顺序依次统计并判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值;若不存在,则执行b4,若存在,则执行b5。
b4、统计并继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
b5、直接将达到大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为核心轨迹点。
本实施例中,为便于方便理解改进后的Rapid-DBSCAN聚类算法得到的聚类前后效果,也即从信令轨迹点中提取核心轨迹点的具体方法,图4为本发明一实施例提供的一种改进Rapid-DBSCAN聚类前实际驻留点与信令轨迹点示意图,图5为本发明一实施例提供的一种改进Rapid-DBSCAN聚类后实际驻留点与核心轨迹点示意图。如图5所示,图5中的t>Tstay表示时间连续的一组核心轨迹点对应的首、末信令时间差大于预设时间阈值Tstay,本发明实施例中的Tstay可以设为10min。
a5、提取核心轨迹点对应的信令记录时间,在时间连续的一组核心轨迹点对应的首、末信令时间差大于预设时间阈值的情况下,该组核心轨迹点定义为一个驻留点簇。
a6、确定相邻驻留点簇对应的首、末核心轨迹点之间距离是否小于或等于预设距离阈值且首、末信令时间差小于第二预设时间阈值,则将相邻的驻留点簇中间的信令轨迹点也确定为核心轨迹点,将相邻的驻留点簇和中间的信令轨迹点合并为一个驻留点簇。
a7、将每个驻留点簇对应的首、末信令时间作为该驻留点的到达和离开时刻,驻留点坐标为该驻留点簇中所有信令轨迹点坐标的形心。
在本实施例中,为便于更好的诠释本发明在不降低提取核心轨迹点精度的情况下,解决核心轨迹点确定时计算复杂度过高的问题,降低计算复杂度的同时节约了时间成本,图6为本发明一实施例提供的一种算法改进前后计算时间对比图。本发明实施例,利用超过10万用户一天的手机信令数据作为实验数据,在相同的计算条件下,对比改进前后两种方法对每人每天手机信令数据进行驻留点提取的计算时长。经典DBSCAN聚类算法平均计算时长为18.4ms,本发明实施例改进后的算法平均计算时长为4.4ms。两种方法的驻留点提取结果没有任何差异,本发明实施例可将计算时间缩短76.3%。
在一实施例中,图7为本发明一实施例提供的一种驻留点确定装置的结构框图,该装置适用于对驻留点进行提取时的情况,该装置可以由硬件/软件实现。可配置于电子设备中来实现本发明实施例中的一种驻留点确定方法。
如图7所示,该装置,该装置包括:轨迹点确定模块710、顺序确定模块720以及驻留点确定模块730。
其中,轨迹点确定模块710,用于根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点;
顺序确定模块720,用于根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序;
驻留点确定模块730,用于按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取核心轨迹点,并将所述核心轨迹点组成所述目标用户的驻留点。
本发明实施例,顺序确定模块,通过根据各信令轨迹点在至少一个基站内的数量确定数据处理顺序,驻留点确定模块,按照数据处理顺序以及预设聚类规则在各信令轨迹点内提取核心轨迹点,能够在不降低提取核心轨迹点精度的情况下,解决核心轨迹点确定时计算复杂度过高的问题,降低计算复杂度的同时节约了时间成本。
在一实施例中,所述装置,还包括:
处理模块,用于对所述手机信令数据进行数据预处理;
所述数据预处理过程至少包含下述之一:对所述手机信令数据进行去重操作;
将所述手机信令数据中缺失的信令数据进行过滤;
将同一用户标识对应的所述手机信令数据划分为一组,并按照所述信令记录时间对每组所述手机信令数据进行排序。
在一实施例中,所述装置,还包括:
时间提取模块,用于在所述按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内确定至少一个核心轨迹点,将所述核心轨迹点作为所述目标用户的驻留点之后,提取所述核心轨迹点对应的信令记录时间;
第一确定模块,用于确定所述信令记录时间相连续的至少一组核心轨迹点;
第二确定模块,用于确定所述至少一组核心轨迹点对应的首末信令记录时间差;其中,每组核心轨迹点中至少包含两个核心轨迹点;
驻留点簇组成模块,用于将所述首末信令记录时间差大于或等于第一预设时间阈值的所述至少一组核心轨迹点作为至少一组驻留点簇。
在一实施例中,所述装置,还包括:
第一时间确定模块,用于确定第一驻留点簇对应的第一核心轨迹点以及所述第一核心轨迹点对应的第一信令记录时间;
第二时间确定模块,用于确定第二驻留点簇对应的第二核心轨迹点以及所述第二核心轨迹点对应的第二信令记录时间;
合并模块,用于在所述第一核心轨迹点和所述第二核心轨迹点之间的距离小于或等于预设距离阈值,且所述第一信令记录时间与所述第二信令记录时间的信令记录时间差小于或等于第二预设时间阈值的情况下,将所述第一驻留点簇和所述第二驻留点簇之间产生的信令轨迹点作为待合并核心轨迹点,并将所述第一驻留点簇、所述第二驻留点簇以及所述待合并核心轨迹点合并为一个驻留点簇。
在一实施例中,轨迹点确定模块710,包括:
第一获取单元,用于获取目标用户的手机信令数据并提取所述手机信令数据中的位置区码和小区标识;
第二获取单元,用于获取预先设置的基站信息表,所述基站信息表中至少包括下述之一:基站对应的第一位置区码、第一小区标识;
匹配单元,用于将所述第一位置区码和所述第一位置区码进行匹配,并将所述小区标识与所述第一小区标识进行匹配,以得到分别对应的匹配结果;
轨迹点确定单元,用于依据所述匹配结果确定所述目标用户对应的信令轨迹点。
在一实施例中,顺序确定模块720,包括:
统计单元,用于确定各所述信令轨迹点所属的基站,并统计所述目标用户针对同基站中所述信令轨迹点的数量;
确定单元,用于依据所述信令轨迹点的数量确定所述信令轨迹点的数据处理顺序。
在一实施例中,驻留点确定模块730,还包括:
判断单元,用于按照所述数据处理顺序依次判断在预设聚类范围内是否满足所述信令轨迹点周围存在预设数量阈值的其他同基站信令轨迹点;
第一确定单元,用于按照所述数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将达到所述大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将所述核心轨迹点在预设第一距离阈值内的其他基站内的信令轨迹点统一设置为所述核心轨迹点;
第二确定单元,用于若否,则继续判断第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得第一信令轨迹点和第二信令轨迹点的数量之和大于或等于预设数量阈值,若存在,则将第一信令轨迹点确定为核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕;若不存在,则将第一信令轨迹点标记为非核心轨迹点,并将第二信令轨迹点作为第一信令轨迹点返回按照数据处理顺序的判断流程,直至第二信令轨迹点判断完毕。
本发明实施例所提供的驻留点确定装置可执行本发明任意实施例所提供的应用于金融系统的驻留点确定方法,具备执行方法相应的功能模块和有益效果。
在一实施例中,图8为本发明实施例提供的一种电子设备的结构示意图。电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如驻留点确定方法。
在一些实施例中,驻留点确定方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM13并由处理器11执行时,可以执行上文描述的驻留点确定方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行驻留点确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程驻留点确定装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
在一实施例中,本发明实施例还包括一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序在被处理器执行时实现本发明任一实施例所述的驻留点确定方法。
计算机程序产品在实现的过程中,可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种驻留点确定方法,其特征在于,包括:
根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点;
根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序;
按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取核心轨迹点,并将所述核心轨迹点组成所述目标用户的驻留点。
2.根据权利要求1所述的方法,其特征在于,所述方法,还包括:
对所述手机信令数据进行数据预处理;
所述数据预处理过程至少包含下述之一:对所述手机信令数据进行去重操作;
将所述手机信令数据中缺失的信令数据进行过滤;
将同一用户标识对应的所述手机信令数据划分为一组,并按照所述信令记录时间对每组所述手机信令数据进行排序。
3.根据权利要求1所述的方法,其特征在于,在所述按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内确定至少一个核心轨迹点,将所述核心轨迹点作为所述目标用户的驻留点之后,包括:
提取所述核心轨迹点对应的信令记录时间;
确定所述信令记录时间相连续的至少一组核心轨迹点;其中,每组核心轨迹点中至少包含两个核心轨迹点;
确定所述至少一组核心轨迹点对应的首末信令记录时间差;
将所述首末信令记录时间差大于或等于第一预设时间阈值的所述至少一组核心轨迹点作为至少一组驻留点簇。
4.根据权利要求3所述的方法,其特征在于,所述方法,还包括:
确定第一驻留点簇对应的第一核心轨迹点以及所述第一核心轨迹点对应的第一信令记录时间;
确定第二驻留点簇对应的第二核心轨迹点以及所述第二核心轨迹点对应的第二信令记录时间;
在所述第一核心轨迹点和所述第二核心轨迹点之间的距离小于或等于预设距离阈值,且所述第一信令记录时间与所述第二信令记录时间的信令记录时间差小于或等于第二预设时间阈值的情况下,将所述第一驻留点簇和所述第二驻留点簇之间产生的信令轨迹点作为待合并核心轨迹点,并将所述第一驻留点簇、所述第二驻留点簇以及所述待合并核心轨迹点合并为一个驻留点簇。
5.根据权利要求1所述的方法,其特征在于,所述根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点,包括:
获取目标用户的手机信令数据并提取所述手机信令数据中的位置区码和小区标识;
获取预先设置的基站信息表,所述基站信息表中至少包括下述之一:基站对应的第一位置区码、第一小区标识;
将所述位置区码和所述第一位置区码进行匹配,并将所述小区标识与所述第一小区标识进行匹配,以得到分别对应的匹配结果;
依据所述匹配结果确定所述目标用户对应的信令轨迹点。
6.根据权利要求1所述的方法,其特征在于,所述根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序,包括:
确定各所述信令轨迹点所属的基站,并统计所述目标用户针对同基站中所述信令轨迹点的数量;
依据所述信令轨迹点的数量确定所述信令轨迹点的数据处理顺序。
7.根据权利要求1所述的方法,其特征在于,所述按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取至少一个核心轨迹点,包括:
按照所述数据处理顺序依次判断目标基站内第一信令轨迹点的数量是否大于或等于预设数量阈值,若是,则直接将达到所述大于或等于预设数量阈值的第一信令轨迹点作为核心轨迹点,并将所述核心轨迹点在预设第一距离阈值内其他基站的信令轨迹点统一设置为所述核心轨迹点;
若否,则继续判断所述第一信令轨迹点在预设第二距离阈值内是否存在其他基站对应的第二信令轨迹点,以使得所述第一信令轨迹点和所述第二信令轨迹点的数量之和大于或等于所述预设数量阈值,若存在,则将所述第一信令轨迹点确定为所述核心轨迹点,并将所述第二信令轨迹点作为所述第一信令轨迹点返回按照所述数据处理顺序的判断流程,直至所述第二信令轨迹点判断完毕;若不存在,则将所述第一信令轨迹点标记为非核心轨迹点,并将所述第二信令轨迹点作为所述第一信令轨迹点返回按照所述数据处理顺序的判断流程,直至所述第二信令轨迹点判断完毕。
8.一种驻留点聚类装置,其特征在于,包括:
轨迹点确定模块,用于根据目标用户的手机信令数据确定所述目标用户对应的信令轨迹点;
顺序确定模块,用于根据各所述信令轨迹点在至少一个基站内的数量确定数据处理顺序;
驻留点确定模块,用于按照所述数据处理顺序以及预设聚类规则在各所述信令轨迹点内提取核心轨迹点,并将所述核心轨迹点组成所述目标用户的驻留点。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的驻留点确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的驻留点确定方法。
CN202211698443.3A 2022-12-28 2022-12-28 一种驻留点确定方法、装置、电子设备及存储介质 Pending CN116017401A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211698443.3A CN116017401A (zh) 2022-12-28 2022-12-28 一种驻留点确定方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211698443.3A CN116017401A (zh) 2022-12-28 2022-12-28 一种驻留点确定方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN116017401A true CN116017401A (zh) 2023-04-25

Family

ID=86031297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211698443.3A Pending CN116017401A (zh) 2022-12-28 2022-12-28 一种驻留点确定方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN116017401A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456281A (zh) * 2023-05-12 2023-07-18 中国电信股份有限公司广东研究院 基于种子用户轨迹确定共址用户的方法及相关设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116456281A (zh) * 2023-05-12 2023-07-18 中国电信股份有限公司广东研究院 基于种子用户轨迹确定共址用户的方法及相关设备

Similar Documents

Publication Publication Date Title
CN109587008B (zh) 检测异常流量数据的方法、装置及存储介质
CN116017401A (zh) 一种驻留点确定方法、装置、电子设备及存储介质
CN112926621A (zh) 数据标注方法、装置、电子设备及存储介质
CN115346171A (zh) 一种输电线路监控方法、装置、设备及存储介质
CN116798592B (zh) 设施布设位置的确定方法、装置、设备及存储介质
CN116309963B (zh) 一种图像的批量标注方法、装置、电子设备及存储介质
CN115599687A (zh) 一种软件测试场景的确定方法、装置、设备及介质
CN115329748A (zh) 一种日志解析方法、装置、设备及存储介质
CN115359322A (zh) 一种目标检测模型训练方法、装置、设备和存储介质
CN118154362B (zh) 电力用户分类方法、装置、电子设备和存储介质
CN116186549B (zh) 模型的训练方法、装置、设备和介质
CN117574146B (zh) 文本分类标注方法、装置、电子设备和存储介质
CN113360688B (zh) 信息库的构建方法、装置及系统
CN117746069B (zh) 以图搜图的模型训练方法、和以图搜图方法
CN117609311A (zh) 一种服务降级方法、装置、设备以及存储介质
CN116016651A (zh) 一种经纬度校正方法、装置、电子设备及存储介质
CN116524959A (zh) 一种语音情绪确定方法、装置、设备及介质
CN118445732A (zh) 异常群体识别方法、装置、设备、介质及程序产品
CN115361308A (zh) 一种工控网络数据风险确定方法、装置、设备及存储介质
CN115603947A (zh) 一种异常访问检测方法及装置
CN115017145A (zh) 数据扩展方法、装置及存储介质
CN115019032A (zh) 图像处理方法、装置、电子设备及存储介质
CN115643182A (zh) 流量检测方法、装置及电子设备
CN116431809A (zh) 基于银行客服场景下的文本标注方法、装置和存储介质
CN115757869A (zh) 视频处理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination