CN116033354B - 一种用户位置属性信息的分析方法及系统 - Google Patents

一种用户位置属性信息的分析方法及系统 Download PDF

Info

Publication number
CN116033354B
CN116033354B CN202211622378.6A CN202211622378A CN116033354B CN 116033354 B CN116033354 B CN 116033354B CN 202211622378 A CN202211622378 A CN 202211622378A CN 116033354 B CN116033354 B CN 116033354B
Authority
CN
China
Prior art keywords
track
point
weekend
cluster
points
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211622378.6A
Other languages
English (en)
Other versions
CN116033354A (zh
Inventor
张梦伟
孔祥博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Shitong Hengqi Beijing Technology Co ltd
Original Assignee
Zhongke Shitong Hengqi Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Shitong Hengqi Beijing Technology Co ltd filed Critical Zhongke Shitong Hengqi Beijing Technology Co ltd
Priority to CN202211622378.6A priority Critical patent/CN116033354B/zh
Publication of CN116033354A publication Critical patent/CN116033354A/zh
Application granted granted Critical
Publication of CN116033354B publication Critical patent/CN116033354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种用户位置属性信息的分析方法及系统,涉及轨迹分析技术领域,包括:获取用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;按照活动时间将各活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点,并根据关联的经纬度分别进行聚类得到周末轨迹簇、工作日轨迹簇和节假日轨迹簇;分别根据周末轨迹簇、工作日轨迹簇和节假日轨迹簇对应分析得到用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点并标记为周末常驻地、工作地、居住地和祖籍地并作为用户的位置属性信息。有益效果是结合时间属性和位置属性进行轨迹点分析得到用户在特定时间段停留的轨迹点,进而确定该停留的轨迹点的位置属性信息。

Description

一种用户位置属性信息的分析方法及系统
技术领域
本发明涉及轨迹分析技术领域,具体涉及一种用户位置属性信息的分析方法及系统。
背景技术
随着网络技术的成熟、GPS技术的快速发展以及移动设备的广泛使用,使得我们很容易获取到不同用户日常的轨迹数据。轨迹记录了用户在真实世界中的活动,这些活动在一定程度上体现了个人的意图,喜好和行为模式。但现有的位置服务,通常直接使用用户提供的位置数据,缺乏对这些数据的分析和挖掘,忽略了这些位置数据中蕴含的信息和知识,如何利用这些轨迹数据,发现用户的运动规律、工作地、家庭地等信息成为亟待解决的技术难题。
发明内容
针对现有技术中存在的问题,本发明提供一种用户位置属性信息的分析方法,包括:
步骤S1,获取用户活动轨迹数据,所述用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
步骤S2,按照所述活动时间将各所述活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
步骤S3,根据关联的所述经纬度对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
步骤S4,分别根据所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇对应分析得到所述用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
步骤S5,将所述周末常驻地轨迹点、所述工作地轨迹点、所述居住地轨迹点和所述祖籍地轨迹点关联的所述地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为所述用户的位置属性信息。
优选的,所述步骤S1中,获取所述用户活动轨迹数据后,还包括对所述用户活动轨迹数据进行数据清洗,以获取用户的多个所述活动轨迹点及其关联的所述经纬度、所述活动时间和所述地址。
优选的,所述步骤S3中,根据DBSCAN聚类算法对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点关联的所述经纬度分别进行聚类得到相应的所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇。
优选的,所述步骤S4包括:
步骤S41a,分别统计各所述周末轨迹簇中的轨迹核心点出现的周频次和月频次;
步骤S42a,判断所述周末轨迹点的轨迹点总量是否大于第一预设阈值:
若是,则在所述周频次和所述月频次满足第一预设频次标准时将对应的所述周末轨迹簇中的周末轨迹中心点标记为所述周末常驻地轨迹点;
若否,则将所述周末轨迹簇中的周末轨迹中心点标记为周末偶尔前往轨迹点。
优选的,所述步骤S4包括:
步骤S41b,用于根据预设的工作时间段和休息时间段分别将各所述工作日轨迹簇中的各所述工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
步骤S42b,分别统计各所述工作时间轨迹点和各所述休息时间轨迹点在所述工作日轨迹簇中的工作时间点个数和休息时间点个数;
步骤S43b,针对每个所述工作日轨迹簇,判断所述工作时间点个数是否大于所述休息时间点个数:
若是,则转向步骤S44b;
若否,则转向步骤S45b;
步骤S44b,判断所述工作日轨迹点的轨迹点总量是否大于第二预设阈值:
若是,则将所述工作日轨迹簇的轨迹中心点标记为所述工作地轨迹点,随后退出;
若否,则将所述工作日轨迹簇的轨迹中心点标记为所述工作时间偶尔出现轨迹点,随后退出;
步骤S45b,判断所述工作日轨迹点的轨迹点总量是否大于第三预设阈值:
若是,则将所述工作日轨迹簇的轨迹中心点标记为所述居住地轨迹点,随后退出;
若否,则将所述工作日轨迹簇的轨迹中心点标记为所述休息时间偶尔出现轨迹点,随后退出。
优选的,所述步骤S4包括:
步骤S41c,分别统计各所述节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
步骤S42c,判断所述节假日轨迹点的轨迹点总量是否大于第四预设阈值:
若是,则在所述月频次和所述年频次满足第二预设频次标准时将对应的所述节假日轨迹簇中的节假日轨迹中心点标记为所述祖籍地轨迹点;
若否,则将所述节假日轨迹簇中的节假日轨迹中心点标记为出行游玩轨迹点。
本发明还提供一种用户位置属性信息的分析系统,应用上述的分析方法,所述分析系统包括:
轨迹数据获取模块,用于获取用户活动轨迹数据,所述用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
轨迹点划分模块,连接所述轨迹数据获取模块,用于按照所述活动时间将各所述活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
轨迹点聚类模块,分别连接所述轨迹数据获取模块和所述轨迹点划分模块,用于根据关联的所述经纬度对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
轨迹点分析模块,连接所述轨迹点聚类模块,用于分别根据所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇对应分析得到所述用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
位置属性标记模块,分别连接所述轨迹数据获取模块和所述轨迹点分析模块,用于将所述周末常驻地轨迹点、所述工作地轨迹点、所述居住地轨迹点和所述祖籍地轨迹点关联的所述地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为所述用户的位置属性信息。
优选的,所述轨迹点分析模块包括周末常驻地分析单元,所述周末常驻地分析单元包括:
第一统计子单元,用于分别统计各所述周末轨迹簇中的轨迹核心点出现的周频次和月频次;
第一判断子单元,连接所述第一统计子单元,用于在判断所述周末轨迹点的轨迹点总量是大于第一预设阈值且所述周频次和所述月频次满足第一预设频次标准时将对应的所述周末轨迹簇中的周末轨迹中心点标记为所述周末常驻地轨迹点。
优选的,所述轨迹点分析模块包括工作及居住地分析单元,所述工作及居住地分析单元包括:
划分子单元,用于根据预设的工作时间段和休息时间段分别将各所述工作日轨迹簇中的各所述工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
第二统计子单元,连接所述划分子单元,用于分别统计各所述工作时间轨迹点和各所述休息时间轨迹点在所述工作日轨迹簇中的工作时间点个数和休息时间点个数;
第二判断子单元,连接所述第二统计子单元,用于针对每个所述工作日轨迹簇,在判断所述工作时间点个数大于所述休息时间点个数且所述工作日轨迹点的轨迹点总量大于第二预设阈值时,将所述工作日轨迹簇的轨迹中心点标记为所述工作地轨迹点;
第三判断子单元,连接所述第二统计子单元,用于针对每个所述工作日轨迹簇,在判断所述工作时间点个数不大于所述休息时间点个数且所述工作日轨迹点的轨迹点总量大于第三预设阈值时,将所述工作日轨迹簇的轨迹中心点标记为所述居住地轨迹点。
优选的,所述轨迹点分析模块包括祖籍地分析单元,所述祖籍地分析单元包括:
第三统计子单元,用于分别统计各所述节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
第四判断子单元,连接所述第三统计子单元,用于在判断所述节假日轨迹点的轨迹点总量大于第四预设阈值且所述月频次和所述年频次满足第二预设频次标准时将对应的所述节假日轨迹簇中的节假日轨迹中心点标记为所述祖籍地轨迹点。
上述技术方案具有如下优点或有益效果:结合活动轨迹数据的时间属性(活动时间)和位置属性(经纬度)进行轨迹点分析,通过聚类将轨迹点分成不同的类别,实现对用户特定时间段的轨迹点分类分析,从而可以得到该用户在特定时间段内停留的轨迹点,进而能够基于时间属性确定该停留的轨迹点的位置属性信息。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的较佳的实施例中,一种用户位置属性信息的分析方法的流程示意图;
图2为本发明的较佳的实施例中,分析得到周末常驻地轨迹点的过程的流程示意图;
图3为本发明的较佳的实施例中,分析得到工作地轨迹点、居住地轨迹点的过程的流程示意图;
图4为本发明的较佳的实施例中,分析得到祖籍地轨迹点的过程的流程示意图;
图5为本发明的较佳的实施例中,一种用户位置属性信息的分析系统的结构示意图;
图6为本发明的较佳的实施例中,清洗用户活动轨迹数据的流程示意图;
图7为DBSCAN聚类示例图;
图8为对各类型轨迹点按照时间段进行细分的示意图;
图9为对周末轨迹簇、工作日轨迹簇和节假日轨迹簇进行数据分析的流程图;
图10为基于周末轨迹簇进行周末常驻地分析的流程图;
图11为基于工作日轨迹簇进行工作地和居住地分析的流程图;
图12为基于节假日轨迹簇进行祖籍地分析的流程图。
具体实施方式
下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。
其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利的限制;为了更好地说明本发明的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
在本发明的描述中,除非另有明确的规定和限定,若出现术语“连接”等指示部件之间的连接关系,该术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明的较佳的实施例中,基于现有技术中存在的上述问题,现提供一种用户位置属性信息的分析方法,如图1所示,包括:
步骤S1,获取用户活动轨迹数据,用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
步骤S2,按照活动时间将各活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
步骤S3,根据关联的经纬度对各周末轨迹点、各工作日轨迹点和各节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
步骤S4,分别根据周末轨迹簇、工作日轨迹簇和节假日轨迹簇对应分析得到用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
步骤S5,将周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点关联的地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为用户的位置属性信息。
具体地,本实施例中,考虑到分析所用的数据量越大,对应的分析结果越准确,上述用户活动轨迹数据优选由不同的数据源获取,如借助于基站、GPS、IP、WIFI等资源获取用户活动轨迹数据,以采集得到该用户尽可能多的活动轨迹点。但基于用户活动轨迹数据获取的数据源的多样性,采集来的用户活动轨迹数据的数据格式以及数据字段形式也存在着很大的差异,为保证数据的准确性,因此,本发明的较佳的实施例中,步骤S1中,获取用户活动轨迹数据后,还包括对用户活动轨迹数据进行数据清洗,以获取用户的多个活动轨迹点及其关联的经纬度、活动时间和地址。轨迹数据的数据格式主要包含如下表a所示的几个字段:
表a
进一步具体地,本实施例进行用户的位置属性信息分析时,用到的需求字段包括用户的活动轨迹点的经纬度、活动时间和地址即可,若采集的用户活动轨迹数据还包括其他字段的信息,则这些信息是不必要的,需要进行清洗过滤掉,以减少不必要的数据量,提升处理效率。上述数据清洗还包括但不限于对于残缺数据,即对采集时未全部包含上述需求字段的轨迹数据进行清洗,对于错误数据,即由于数据来源导致的采集格式不同的轨迹数据进行清洗,对于重复数据,即在相同数据源或不同数据源采集的重复的轨迹数据进行清洗等。本实施例提供的数据清洗流程具体请参照图6。
更进一步地,在进行数据清洗获取到需求的用户活动轨迹数据后,考虑到需要分析用户的位置属性信息,因此需要将获取的各活动轨迹点按照活动时间进行初步分类为周末轨迹点、工作日轨迹点和节假日轨迹点,从而针对各类别的轨迹点进行聚类,进而针对聚类结果分析得到用户的位置属性信息。
本实施例中,根据DBSCAN聚类算法对各周末轨迹点、各工作日轨迹点和各节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法是基于密度的聚类算法,将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类。在采用DBSCAN聚类算法进行聚类时,可以将各轨迹点划分为核心点、边界点和噪声点,其中,核心点是在半径Eps(Eps指ε-邻域的距离阈值,和样本距离超过ε的样本点不在ε-邻域内。默认值为0.5,一般需要通过在多组值里面选择一个合适的阈值。eps过大,则更多的点会落在核心对象的ε-邻域,此时我们的类别数可能会减少,本来不应该是一类的样本也会被划为一类。反之则类别数可能会增大,本来是一类的样本却被划分开)内含有不少于MinPts(MinPts指样本点要成为核心对象所需要的ε-邻域的样本数阈值。默认值是5。一般需要通过在多组值里面选择一个合适的阈值。通常和eps一起调参。在eps一定的情况下,MinPts过大,则核心对象会过少,此时簇内部分本来是一类的样本可能会被标为噪音点,类别数也会变多。反之MinPts过小的话,则会产生大量的核心对象,可能会导致类别数过少)数目的点,边界点是在半径Eps内点的数目少于MinPts,但是落在核心点的邻域内,噪声点是既不是核心点也不是边界点的点。上述Eps和MinPts的值可按需配置。
DBSCAN算法进行聚类的原理简要解释如下:
如图7所示,MinPts=4,点A和附图标记为100的点是核心点,因为它们的ε-邻域(图中包括A和附图标记为100的圆圈)里包含最少4个点(包括点A),由于它们之间相互可达,相互间形成了一个聚类。点B和点C不是核心点,但是它们可由A经其他核心点可达,因此它们和A属于同一个聚类。点N是离散点,它既不是核心点也不能由其他点可达。
基于DBSCAN聚类算法对各周末轨迹点、各工作日轨迹点和各节假日轨迹点进行聚类的方法简述如下:
分别将各周末轨迹点、各工作日轨迹点和各节假日轨迹点的经纬度坐标提取出来,然后设置半径Eps为50米,MinPts为10个,通过DBSCAN聚类后即可分别得到周末轨迹点、各工作日轨迹点和各节假日轨迹点的若干个簇,然后对每个簇单独进行分析,最终将每个分析结果汇总到一起即可。
基于上述DBSCAN聚类算法聚类得到周末轨迹簇、工作日轨迹簇和节假日轨迹簇后,优选剔除周末轨迹簇、工作日轨迹簇和节假日轨迹簇中的噪声点(通过聚类之后,该点不能与其他点构成一簇,它既不是核心点也不能由其他点可达,类似图7中的N点),仅保留核心点和边界点(过聚类之后,该点可以与其他点构成一簇,当该点正好处于核心位置时,则该点为核心点类似图7中的A点,当该点可以由核心点可达时,该点可作为边界点类似图7中的B点和C点)进行位置属性信息的分析。
更为细致地,可以将工作日轨迹簇进一步细分为白天工作时间轨迹簇、晚上休息时间轨迹簇和自由活动时间轨迹簇,比如将如图8中细分的上午9点到下午17点产生的工作日轨迹点加入到白天工作时间轨迹簇,将晚上22点到次日6点产生的工作日轨迹点加入到晚上休息时间轨迹簇,将工作的其他时间产生的轨迹点加入到自由活动时间轨迹簇。
数据分簇后,本实施例按照活动时间和轨迹坐标分类分别进行数据分析。比如,周末的时间和轨迹(周末轨迹簇)用来进行周末常驻地分析,工作日的时间和轨迹(工作日轨迹簇)用来进行工作地和居住地的分析,节假日的时间和轨迹(节假日轨迹簇)用来进行祖籍地的分析,对各类型轨迹簇的数据分析流程如图9所示。
针对周末轨迹簇,本发明的较佳的实施例中,如图2和图10所示,步骤S4包括:
步骤S41a,分别统计各周末轨迹簇中的轨迹核心点出现的周频次和月频次;
步骤S42a,判断周末轨迹点的轨迹点总量是否大于第一预设阈值:
若是,则在周频次和月频次满足第一预设频次标准时将对应的周末轨迹簇中的周末轨迹中心点标记为周末常驻地轨迹点;
若否,则将周末轨迹簇中的周末轨迹中心点标记为周末偶尔前往轨迹点。
具体地,正常通勤情况下,若用户周末时间去往某个位置的周频次和月频次均较高,则认为该位置为用户的周末常驻地,否则认为该位置为用户的周末偶尔前往地,上述周频次和月频次是否较高通过配置的第一预设频次标准进行判定,该第一预设频次标准可以包括相应的周频次阈值和月频次阈值。
针对工作日轨迹簇,本发明的较佳的实施例中,如图3和图11所示,步骤S4包括:
步骤S41b,用于根据预设的工作时间段和休息时间段分别将各工作日轨迹簇中的各工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
步骤S42b,分别统计各工作时间轨迹点和各休息时间轨迹点在工作日轨迹簇中的工作时间点个数和休息时间点个数;
步骤S43b,针对每个工作日轨迹簇,判断工作时间点个数是否大于休息时间点个数:
若是,则转向步骤S44b;
若否,则转向步骤S45b;
步骤S44b,判断工作日轨迹点的轨迹点总量是否大于第二预设阈值:
若是,则将工作日轨迹簇的轨迹中心点标记为工作地轨迹点,随后退出;
若否,则将工作日轨迹簇的轨迹中心点标记为工作时间偶尔出现轨迹点,随后退出;
步骤S45b,判断工作日轨迹点的轨迹点总量是否大于第三预设阈值:
若是,则将工作日轨迹簇的轨迹中心点标记为居住地轨迹点,随后退出;
若否,则将工作日轨迹簇的轨迹中心点标记为休息时间偶尔出现轨迹点,随后退出。
具体地,本实施例中,在正常通勤情况下,用户在白天会在工作地,晚上下班后会返回居住地,基于此,优选配置工作时间段为早9点到晚5点,以及配置休息时间段为晚10点至次日6点,其他时间段为自由活动时间,实现将工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点。考虑到不同用户的工作时间段和休息时间段可以会出现偏差,为提升准确性,在基于工作时间段和休息时间段进行轨迹点划分时,可以将相邻时间段的点一同进行标记。进而分别针对工作时间轨迹点进行聚类后分析获取工作地轨迹点,以及针对休息时间轨迹点进行聚类后分析获取居住地轨迹点。
由于工作时间轨迹点和休息时间轨迹点的划分是依据预设的工作时间段和休息时间段,而用户实际生活中,不可能严格按遵守上述各时间段进行工作和休息,在工作时间段也可能由于各种因素如请假、休假、调休等特殊因素出现在居住地,同样地在休息时间段也可能由于加班出现在工作地,但上述特殊因素毕竟相对占较小的比重。基于此,在工作时间点个数大于休息时间点个数时进行工作地轨迹点的判定,在工作时间点个数不大于休息时间点个数时进行居住地轨迹点的判定。但考虑到数据量较小的情况下,即使工作时间点个数大于休息时间点个数,也并不能准确判定工作地轨迹点,此时将工作日轨迹簇的轨迹中心点标记为工作时间偶尔出现轨迹点,同样地,即使工作时间点个数不大于休息时间点个数,也不能准确判定居住地轨迹点,此时将工作日轨迹簇的轨迹中心点标记为休息时间偶尔出现轨迹点。
针对节假日轨迹簇,本发明的较佳的实施例中,如图4和图12所示,步骤S4包括:
步骤S41c,分别统计各节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
步骤S42c,判断节假日轨迹点的轨迹点总量是否大于第四预设阈值:
若是,则在月频次和年频次满足第二预设频次标准时将对应的节假日轨迹簇中的节假日轨迹中心点标记为祖籍地轨迹点;
若否,则将节假日轨迹簇中的节假日轨迹中心点标记为出行游玩轨迹点。
具体地,本实施例中,考虑到通常情况下,用户会在节假日回到祖籍地,若用户节假日去往某个位置的月频次和年频次均较高,则认为该位置为用户的祖籍地,否则认为该位置为用户的节假日出行游玩前往地,上述月频次和年频次是否较高通过配置的第二预设频次标准进行判定,该第二预设频次标准可以包括相应的月频次阈值和年频次阈值。
本发明还提供一种用户位置属性信息的分析系统,应用上述的分析方法,如图5所示,分析系统包括:
轨迹数据获取模块1,用于获取用户活动轨迹数据,用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
轨迹点划分模块2,连接轨迹数据获取模块1,用于按照活动时间将各活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
轨迹点聚类模块3,分别连接轨迹数据获取模块1和轨迹点划分模块2,用于根据关联的经纬度对各周末轨迹点、各工作日轨迹点和各节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
轨迹点分析模块4,连接轨迹点聚类模块3,用于分别根据周末轨迹簇、工作日轨迹簇和节假日轨迹簇对应分析得到用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
位置属性标记模块5,分别连接轨迹数据获取模块1和轨迹点分析模块4,用于将周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点关联的地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为用户的位置属性信息。
本发明的较佳的实施例中,轨迹点分析模块4包括周末常驻地分析单元41,周末常驻地分析单元41包括:
第一统计子单元411,用于分别统计各周末轨迹簇中的轨迹核心点出现的周频次和月频次;
第一判断子单元412,连接第一统计子单元411,用于在判断周末轨迹点的轨迹点总量是大于第一预设阈值且周频次和月频次满足第一预设频次标准时将对应的周末轨迹簇中的周末轨迹中心点标记为周末常驻地轨迹点。
本发明的较佳的实施例中,轨迹点分析模块4包括工作及居住地分析单元42,工作及居住地分析单元42包括:
划分子单元421,用于根据预设的工作时间段和休息时间段分别将各工作日轨迹簇中的各工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
第二统计子单元422,连接划分子单元421,用于分别统计各工作时间轨迹点和各休息时间轨迹点在工作日轨迹簇中的工作时间点个数和休息时间点个数;
第二判断子单元423,连接第二统计子单元422,用于针对每个工作日轨迹簇,在判断工作时间点个数大于休息时间点个数且工作日轨迹点的轨迹点总量大于第二预设阈值时,将工作日轨迹簇的轨迹中心点标记为工作地轨迹点;
第三判断子单元424,连接第二统计子单元422,用于针对每个工作日轨迹簇,在判断工作时间点个数不大于休息时间点个数且工作日轨迹点的轨迹点总量大于第三预设阈值时,将工作日轨迹簇的轨迹中心点标记为居住地轨迹点。
本发明的较佳的实施例中,轨迹点分析模块4包括祖籍地分析单元43,祖籍地分析单元43包括:
第三统计子单元431,用于分别统计各节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
第四判断子单元432,连接第三统计子单元431,用于在判断节假日轨迹点的轨迹点总量大于第四预设阈值且月频次和年频次满足第二预设频次标准时将对应的节假日轨迹簇中的节假日轨迹中心点标记为祖籍地轨迹点。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。另外,本申请说明书和权利要求书所使用的一些术语并不是限制,仅仅是为了便于描述。

Claims (8)

1.一种用户位置属性信息的分析方法,其特征在于,包括:
步骤S1,获取用户活动轨迹数据,所述用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
步骤S2,按照所述活动时间将各所述活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
步骤S3,对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
步骤S4,分别根据所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇对应分析得到所述用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
步骤S5,将所述周末常驻地轨迹点、所述工作地轨迹点、所述居住地轨迹点和所述祖籍地轨迹点关联的所述地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为所述用户的位置属性信息;
所述步骤S4包括:
步骤S41b,用于根据预设的工作时间段和休息时间段分别将各所述工作日轨迹簇中的各所述工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
步骤S42b,分别统计各所述工作时间轨迹点和各所述休息时间轨迹点在所述工作日轨迹簇中的工作时间点个数和休息时间点个数;
步骤S43b,针对每个所述工作日轨迹簇,判断所述工作时间点个数是否大于所述休息时间点个数:
若是,则转向步骤S44b;
若否,则转向步骤S45b;
步骤S44b,判断所述工作日轨迹点的轨迹点总量是否大于第二预设阈值:
若是,则将所述工作日轨迹簇的轨迹中心点标记为所述工作地轨迹点,随后退出;
若否,则将所述工作日轨迹簇的轨迹中心点标记为所述工作时间偶尔出现轨迹点,随后退出;
步骤S45b,判断所述工作日轨迹点的轨迹点总量是否大于第三预设阈值:
若是,则将所述工作日轨迹簇的轨迹中心点标记为所述居住地轨迹点,随后退出;
若否,则将所述工作日轨迹簇的轨迹中心点标记为所述休息时间偶尔出现轨迹点,随后退出。
2.根据权利要求1所述的分析方法,其特征在于,所述步骤S1中,获取所述用户活动轨迹数据后,还包括对所述用户活动轨迹数据进行数据清洗,以获取用户的多个所述活动轨迹点及其关联的所述经纬度、所述活动时间和所述地址。
3.根据权利要求1所述的分析方法,其特征在于,所述步骤S3中,根据DBSCAN聚类算法对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点关联的所述经纬度分别进行聚类得到相应的所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇。
4.根据权利要求1所述的分析方法,其特征在于,所述步骤S4包括:
步骤S41a,分别统计各所述周末轨迹簇中的轨迹核心点出现的周频次和月频次;
步骤S42a,判断所述周末轨迹点的轨迹点总量是否大于第一预设阈值:
若是,则在所述周频次和所述月频次满足第一预设频次标准时将对应的所述周末轨迹簇中的周末轨迹中心点标记为所述周末常驻地轨迹点;
若否,则将所述周末轨迹簇中的周末轨迹中心点标记为周末偶尔前往轨迹点。
5.根据权利要求1所述的分析方法,其特征在于,所述步骤S4包括:
步骤S41c,分别统计各所述节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
步骤S42c,判断所述节假日轨迹点的轨迹点总量是否大于第四预设阈值:
若是,则在所述月频次和所述年频次满足第二预设频次标准时将对应的所述节假日轨迹簇中的节假日轨迹中心点标记为所述祖籍地轨迹点;
若否,则将所述节假日轨迹簇中的节假日轨迹中心点标记为出行游玩轨迹点。
6.一种用户位置属性信息的分析系统,其特征在于,应用如权利要求1-5中任意一项所述的分析方法,所述分析系统包括:
轨迹数据获取模块,用于获取用户活动轨迹数据,所述用户活动轨迹数据包括用户的多个活动轨迹点及其关联的经纬度、活动时间和地址;
轨迹点划分模块,连接所述轨迹数据获取模块,用于按照所述活动时间将各所述活动轨迹点分别对应标记为周末轨迹点、工作日轨迹点和节假日轨迹点;
轨迹点聚类模块,分别连接所述轨迹数据获取模块和所述轨迹点划分模块,用于根据关联的所述经纬度对各所述周末轨迹点、各所述工作日轨迹点和各所述节假日轨迹点分别进行聚类得到相应的周末轨迹簇、工作日轨迹簇和节假日轨迹簇;
轨迹点分析模块,连接所述轨迹点聚类模块,用于分别根据所述周末轨迹簇、所述工作日轨迹簇和所述节假日轨迹簇对应分析得到所述用户的周末常驻地轨迹点、工作地轨迹点、居住地轨迹点和祖籍地轨迹点;
位置属性标记模块,分别连接所述轨迹数据获取模块和所述轨迹点分析模块,用于将所述周末常驻地轨迹点、所述工作地轨迹点、所述居住地轨迹点和所述祖籍地轨迹点关联的所述地址分别对应标记为周末常驻地、工作地、居住地和祖籍地并作为所述用户的位置属性信息;
所述轨迹点分析模块包括工作及居住地分析单元,所述工作及居住地分析单元包括:
划分子单元,用于根据预设的工作时间段和休息时间段分别将各所述工作日轨迹簇中的各所述工作日轨迹点划分为工作时间轨迹点和休息时间轨迹点;
第二统计子单元,连接所述划分子单元,用于分别统计各所述工作时间轨迹点和各所述休息时间轨迹点在所述工作日轨迹簇中的工作时间点个数和休息时间点个数;
第二判断子单元,连接所述第二统计子单元,用于针对每个所述工作日轨迹簇,在判断所述工作时间点个数大于所述休息时间点个数且所述工作日轨迹点的轨迹点总量大于第二预设阈值时,将所述工作日轨迹簇的轨迹中心点标记为所述工作地轨迹点;
第三判断子单元,连接所述第二统计子单元,用于针对每个所述工作日轨迹簇,在判断所述工作时间点个数不大于所述休息时间点个数且所述工作日轨迹点的轨迹点总量大于第三预设阈值时,将所述工作日轨迹簇的轨迹中心点标记为所述居住地轨迹点。
7.根据权利要求6所述的分析系统,其特征在于,所述轨迹点分析模块包括周末常驻地分析单元,所述周末常驻地分析单元包括:
第一统计子单元,用于分别统计各所述周末轨迹簇中的轨迹核心点出现的周频次和月频次;
第一判断子单元,连接所述第一统计子单元,用于在判断所述周末轨迹点的轨迹点总量是大于第一预设阈值且所述周频次和所述月频次满足第一预设频次标准时将对应的所述周末轨迹簇中的周末轨迹中心点标记为所述周末常驻地轨迹点。
8.根据权利要求6所述的分析系统,其特征在于,所述轨迹点分析模块包括祖籍地分析单元,所述祖籍地分析单元包括:
第三统计子单元,用于分别统计各所述节假日轨迹簇中的轨迹核心点出现的月频次和年频次;
第四判断子单元,连接所述第三统计子单元,用于在判断所述节假日轨迹点的轨迹点总量大于第四预设阈值且所述月频次和所述年频次满足第二预设频次标准时将对应的所述节假日轨迹簇中的节假日轨迹中心点标记为所述祖籍地轨迹点。
CN202211622378.6A 2022-12-16 2022-12-16 一种用户位置属性信息的分析方法及系统 Active CN116033354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211622378.6A CN116033354B (zh) 2022-12-16 2022-12-16 一种用户位置属性信息的分析方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211622378.6A CN116033354B (zh) 2022-12-16 2022-12-16 一种用户位置属性信息的分析方法及系统

Publications (2)

Publication Number Publication Date
CN116033354A CN116033354A (zh) 2023-04-28
CN116033354B true CN116033354B (zh) 2023-07-21

Family

ID=86072137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211622378.6A Active CN116033354B (zh) 2022-12-16 2022-12-16 一种用户位置属性信息的分析方法及系统

Country Status (1)

Country Link
CN (1) CN116033354B (zh)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8606294B2 (en) * 2010-10-05 2013-12-10 Skyhook Wireless, Inc. Method of and system for estimating temporal demographics of mobile users
US8855361B2 (en) * 2010-12-30 2014-10-07 Pelco, Inc. Scene activity analysis using statistical and semantic features learnt from object trajectory data
US9079090B2 (en) * 2012-10-25 2015-07-14 Sstatzz Oy Sports apparatus and method
CN104348635A (zh) * 2013-07-24 2015-02-11 中国移动通信集团福建有限公司 一种移动用户行为分析方法和装置
CN105989226A (zh) * 2015-02-12 2016-10-05 中兴通讯股份有限公司 一种分析用户轨迹的方法及装置
CN106792514B (zh) * 2016-11-30 2020-10-30 南京华苏科技有限公司 基于信令数据的用户职住地分析方法
CN107563648A (zh) * 2017-09-05 2018-01-09 上海博泰悦臻网络技术服务有限公司 车主生活轨迹的管理方法、服务平台及信息盒
CN112364907A (zh) * 2020-11-03 2021-02-12 北京红山信息科技研究院有限公司 待测用户常驻地普查方法、系统、服务器和存储介质
CN113055439B (zh) * 2021-02-08 2023-03-24 北京淇瑀信息科技有限公司 一种基于工作稳定性的信息推送方法、装置及电子设备
CN112685659B (zh) * 2021-03-19 2021-06-18 上海钐昆网络科技有限公司 目标地点确定方法、装置、电子设备及计算机存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
空间位置的关联分析及其向量化表示方法;张舒;郭旦怀;周纯葆;李薰春;靳薇;;计算机系统应用(第09期);全文 *

Also Published As

Publication number Publication date
CN116033354A (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
CN105701123B (zh) 人车关系的识别方法及装置
CN110020221B (zh) 职住分布确认方法、装置、服务器及计算机可读存储介质
Nurmi et al. Identifying meaningful places: The non-parametric way
KR20190139130A (ko) 피셀 알고리즘을 이용하여 실시간 유동 인구 데이터의 제공이 가능한 유동인구 정보 분석 방법
CN107798557A (zh) 电子装置、基于lbs数据的服务场所推荐方法及存储介质
CN107977673A (zh) 一种基于大数据的经济活动人口识别方法
CN105307121B (zh) 一种信息处理方法及装置
CN104380293A (zh) 基于位置从地图历史提供关于相关元素的信息
CN105824840B (zh) 一种用于区域标签管理的方法及装置
WO2013107669A1 (en) A method for the automatic detection and labelling of user point of interest
CN112738729B (zh) 一种用手机信令数据判别探亲返乡游客的方法及系统
CN111475746B (zh) 兴趣点位置挖掘方法、装置、计算机设备和存储介质
CN108427679A (zh) 一种人流分布处理方法及其设备
Sun et al. Identifying tourists and locals by K-means clustering method from mobile phone signaling data
CN111209487B (zh) 用户数据分析方法、服务器及计算机可读存储介质
CN111400376A (zh) 基于电信数据建设人口分析平台的方法和装置
de Regt et al. Investigating potential transit ridership by fusing smartcard and global system for mobile communications data
Alhazzani et al. Urban Attractors: Discovering patterns in regions of attraction in cities
CN116033354B (zh) 一种用户位置属性信息的分析方法及系统
CN111242723B (zh) 用户子女情况判断方法、服务器及计算机可读存储介质
Pierdicca et al. Identifying the use of a park based on clusters of visitors' movements from mobile phone data
Koh et al. Clustering and analysis of gps trajectory data using distance-based features
CN111352964B (zh) 获取兴趣点信息的方法、装置、设备及存储介质
Pu et al. MViewer: Mobile phone spatiotemporal data viewer
Shad et al. Precise location acquisition of mobility data using cell-id

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant