CN108509434A - 一种群体用户的挖掘方法及装置 - Google Patents

一种群体用户的挖掘方法及装置 Download PDF

Info

Publication number
CN108509434A
CN108509434A CN201710099962.0A CN201710099962A CN108509434A CN 108509434 A CN108509434 A CN 108509434A CN 201710099962 A CN201710099962 A CN 201710099962A CN 108509434 A CN108509434 A CN 108509434A
Authority
CN
China
Prior art keywords
user
characteristic attribute
dwell
track characteristic
frequent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710099962.0A
Other languages
English (en)
Other versions
CN108509434B (zh
Inventor
吕广娜
鲍媛媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201710099962.0A priority Critical patent/CN108509434B/zh
Publication of CN108509434A publication Critical patent/CN108509434A/zh
Application granted granted Critical
Publication of CN108509434B publication Critical patent/CN108509434B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions

Abstract

本发明公开了一种群体用户的挖掘方法及装置,根据由轨迹点组成的多个用户的历史轨迹数据,将各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点归类为多个具有语义信息的公共停留区域;再基于满足预设时间阈值、距离阈值和方向变化阈值条件的停留点,以及具有语义信息的公共停留区域,统计各用户最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性;采用预设聚类方法将各用户的上述四个轨迹特征属性聚类为多个群体用户,从而实现了基于历史轨迹数据,更全面地对群体用户的挖掘。

Description

一种群体用户的挖掘方法及装置
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种群体用户的挖掘方法及装置。
背景技术
移动智能设备和移动互联网的飞速发展,使得获取用户位置信息越来越方便。与此同时智能汽车的发展,使得汽车不仅仅是一个代步工具,更是互联网的一个节点,是产生历史轨迹数据的重要来源。
由于对历史轨迹数据的深度挖掘将会产生很多有价值的知识,从而催生新的商业应用和商业价值,例如:交通流量管理,基于日程提醒的路径规划,好友发现,个性化广告推动服务等,因此,对历史轨迹数据的挖掘受到越来越多的关注。现有技术中,已开展的基于历史轨迹数据的挖掘工作,主要是对轨迹数据进行分类、聚类或频繁模式挖掘。但现有技术中仅从单一方面对历史轨迹数据进行挖掘,并未对历史轨迹数据的挖掘进行整体考虑,而且并未根据历史轨迹数据深度挖掘群体用户。
因此,如何基于历史轨迹数据,更全面地实现对群体用户的挖掘,是目前亟需解决的技术问题。
发明内容
本发明实施例提供一种群体用户的挖掘方法及装置,用以解决现有技术中存在的如何基于历史轨迹数据,更全面地实现对群体用户的挖掘的问题。
本发明实施例提供一种群体用户的挖掘方法,包括:
根据由轨迹点组成的多个用户的历史轨迹数据,将各所述用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各所述用户每天的停留点,并将各所述用户每天的停留点按时间顺序排列构成各所述用户每天的停留点序列;
根据各所述用户每天的停留点序列,统计各所述用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;
将各所述用户每天的停留点归类为多个公共停留区域;为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表;将各所述用户符合所述公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表轨迹特征属性;
根据各所述用户每天的停留点序列和各所述用户的停留区域列表,确定各所述用户每天的停留区域轨迹;根据确定出的各所述用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各所述用户的最频繁的重复轨迹模式轨迹特征属性;
采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘方法中,所述将各所述用户每天的停留点归类为多个公共停留区域,具体包括:
采用基于密度的聚类算法P-DBSCAN将各所述用户每天的停留点归类为多个公共停留区域。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘方法中,所述为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表,具体包括:
通过信息点POI数据库,为确定出的各所述公共停留区域赋予语义信息,并将赋予语义信息的各所述公共停留区域构成各所述用户的公共停留区域列表。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘方法中,所述根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表,具体包括:
确定各所述用户的停留区域列表中的各停留区域的停留时间;
将停留时间满足预设时长的各所述停留区域统计为各所述用户的最经常停留的区域列表。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘方法中,所述采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户,具体包括:
采用快速聚类的方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘方法中,在所述采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户之后,还包括:
结合词云获取各所述群体用户的特征;其中,所述词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;所述群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
本发明实施例提供一种群体用户的挖掘装置,包括:
统计单元,用于根据由轨迹点组成的多个用户的历史轨迹数据,将各所述用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各所述用户每天的停留点,并将各所述用户每天的停留点按时间顺序排列构成各所述用户每天的停留点序列;根据各所述用户每天的停留点序列,统计各所述用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;将各所述用户每天的停留点归类为多个公共停留区域;为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表;将各所述用户符合所述公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表轨迹特征属性;根据各所述用户每天的停留点序列和各所述用户的停留区域列表,确定各所述用户每天的停留区域轨迹;根据确定出的各所述用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各所述用户的最频繁的重复轨迹模式轨迹特征属性;
聚类单元,用于采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘装置中,所述统计单元,具体用于采用基于密度的聚类算法P-DBSCAN将各所述用户每天的停留点归类为多个公共停留区域。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘装置中,所述统计单元,具体用于通过信息点POI数据库,为确定出的各所述公共停留区域赋予语义信息,并将赋予语义信息的各所述公共停留区域构成各所述用户的公共停留区域列表。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘装置中,所述统计单元,具体用于确定各所述用户的停留区域列表中的各停留区域的停留时间;将停留时间满足预设时长的各所述停留区域统计为各所述用户的最经常停留的区域列表。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘装置中,所述聚类单元,具体用于采用快速聚类的方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在一种可能的实现方式中,在本发明实施例提供的上述挖掘装置中,还包括:获取单元,用于结合词云获取各所述群体用户的特征;其中,所述词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;所述群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
本发明有益效果如下:
本发明实施例提供的群体用户的挖掘方法及装置,包括:根据由轨迹点组成的多个用户的历史轨迹数据,将各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点按时间顺序排列构成各用户每天的停留点序列;根据各用户每天的停留点序列,统计各用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;将各用户每天的停留点归类为多个公共停留区域;为各公共停留区域赋予语义信息,并根据各公共停留区域和语义信息,统计各用户的公共停留区域列表;将各用户符合公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各用户的停留区域列表,统计各用户的最经常停留的区域列表轨迹特征属性;根据各用户每天的停留点序列和各用户的停留区域列表,确定各用户每天的停留区域轨迹;根据确定出的各用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各用户的最频繁的重复轨迹模式轨迹特征属性;采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。由于根据由轨迹点组成的多个用户的历史轨迹数据,提取了各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点的归类为多个公共停留区域,且为各公共停留区域赋予语义信息;再基于满足预设的时间阈值、距离阈值和方向变化阈值条件的停留点,以及赋予语义信息的公共停留区域,统计出了各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性;并采用预设的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,从而得到了多个群体用户,因此,实现了基于历史轨迹数据,更全面地对群体用户的挖掘。
附图说明
图1为本发明实施例提供的群体用户的挖掘方法的流程图;
图2为本发明实施例提供的停留点的示意图;
图3为本发明实施例提供的具有语义信息的停留区域的示意图;
图4为本发明实施例提供的群体用户特征的挖掘方法的流程图;
图5为本发明实施例提供的群体用户的挖掘装置的结构示意图。
具体实施方式
下面结合附图,对本发明实施例提供的群体用户的挖掘方法及装置的具体实施方式进行详细地说明。
本发明实施例提供的一种群体用户的挖掘方法,如图1所示,具体可以包括以下步骤:
S101、根据由轨迹点组成的多个用户的历史轨迹数据,将各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点按时间顺序排列构成各用户每天的停留点序列;
S102、根据各用户每天的停留点序列,统计各用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;
S103、将各用户每天的停留点归类为多个公共停留区域;为各公共停留区域赋予语义信息,并根据各公共停留区域和语义信息,统计各用户的公共停留区域列表;将各用户符合公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各用户的停留区域列表,统计各用户的最经常停留的区域列表轨迹特征属性;
S104、根据各用户每天的停留点序列和各用户的停留区域列表,确定各用户每天的停留区域轨迹;根据确定出的各用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各用户的最频繁的重复轨迹模式轨迹特征属性;
S105、采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
具体地,在本发明实施例提供的上述挖掘方法中,由于根据由轨迹点组成的多个用户的历史轨迹数据,提取了各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点的归类为多个公共停留区域,且为各公共停留区域赋予语义信息;再基于满足预设的时间阈值、距离阈值和方向变化阈值条件的停留点,以及赋予语义信息的公共停留区域,统计出了各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性;并采用预设的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,从而得到了多个群体用户,因此,实现了基于历史轨迹数据,更全面地对群体用户的挖掘。
需要说明的是,在本发明实施例提供的上述挖掘方法中的步骤S102和S103的顺序可以互换,并不限于上述描述的先后顺序。
进一步地,在本发明实施例提供的上述挖掘方法中,不仅可以提取同时满足预设时间、空间和语义条件的各用户的多个轨迹特征属性,还可以根据实际需要,在此基础上适当增加或减少预设条件和轨迹特征属性,或重新设置预设条件和轨迹特征属性的含义和数量,在此不做限定。
一般地,每个用户在每天、每月等持续运动中都会产生大量的历史轨迹数据。例如,用户Uk某天的历史轨迹数据可以表示为Ti=Pm→Pm+1→…→Pn,轨迹点Pk通常是一个带有时间戳的全球定位系统(Global Positioning System,GPS)坐标点,定义为Pk=(latk,lngtk,tk),其中,latk为纬度,lngtk为经度,tk为时间戳。于是,可根据由轨迹点Pk组成的用户Uk的大量历史轨迹数据(Ti,Ti+1,…,Tj)来提取用户Uk的轨迹特征属性。
具体地,为了有效地将用户Uk与其他用户区别开来,可以根据特征提取遵守的最有效性原则,即同类样本的不变性、不同样本的鉴别性、对噪声的鲁棒性,从历史轨迹数据(Ti,Ti+1,…,Tj)中提取用户Uk的最频繁的出行起始时间段,最频繁的结束行程时间段,最经常停留的区域列表,以及最频繁的重复轨迹模式等四个轨迹特征属性来表征用户Uk。当然,在具体实施时,也可以根据实际情况选择其他轨迹特征属性来表征用户Uk,在此不做限定。
较佳地,为了更好地理解本发明实施例提供的上述挖掘方法的步骤S101至S104中获取各用户的最频繁的出行起始时间段,最频繁的结束行程时间段,最经常停留的区域列表,以及最频繁的重复轨迹模式等四个轨迹特征属性的详细过程,以下以获取用户Uk的上述四个轨迹特征属性的过程为例进行说明。
首先,提取用户Uk每天的停留点。例如,以针对用户Uk某天的历史轨迹数据Ti=Pm→Pm+1→…→Pn为例,使用预设的时间阈值τ,距离阈值ε和方向变化阈值δ这三个参数,提取满足以下三个条件的轨迹点构成停留点,其中,m<i≤n。
1)轨迹点Pi与轨迹点Pm之间的距离(Pm,Pi)≤ε,
2)轨迹点Pn与轨迹点Pm之间的时间差(Pm,Pn)≥τ,
3)轨迹点Pi与轨迹点Pi+1之间的方向差(Pi,Pi+1)≥δ,
具体地,若根据预设的上述条件提取到的用户Uk某天的停留点包含一个轨迹点Pk,则以Pk=(latk,lngtk,tk)表示停留点;若根据预设的上述条件提取到的用户Uk某天的停留点包含多个轨迹点,如图2中的S1包含四个轨迹点,S2包含三个轨迹点,则将停留点S1和S2分别表示为S1=(lat1,lngt1,t1start,t1stop),S2=(lat2,lngt2,t2start,t2stop),其中,latx,lngtx分别是停留点包含的各轨迹点的平均经度和平均纬度,txstart是停留开始的时间,txstop是停留结束时间。即对于图2中的S1=(lat1,lngt1,t1start,t2stop),lat1即为轨迹点P4、P5、P6和P7的经度的平均值,lngt1为轨迹点P4、P5、P6和P7的纬度的平均值,t1start为轨迹点P4的时间戳,t1stop为轨迹点P7的时间戳。
然后,提取用户Uk每天的停留点序列,并根据用户Uk每天的停留点序列,统计用户Uk的最频繁的出行起始时间段和最频繁的结束行程时间段。例如用户Uk某天的历史轨迹数据Ti=Pm→Pm+1→…→Pn可以表示为Ti=Sm→Sm+1→…→Sn。由此,通过将时间划分为数量与停留点数量相同的多个时隙,进而可以获得用户Uk某天出行起始的时间段Sm.tstart和结束行程的时间段Sn.tstop。基于相似的过程,可以获得用户Uk每天的停留点序列,进而获得用户Uk每天的出行起始的时间段和结束行程的时间段。进一步地,通过统计用户Uk每天出行起始的时间段和每天结束行程的时间段,即可取得用户Uk的发生率最高的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性。
之后,在提取出的用户Uk的停留点和停留序列的基础上,可以获得用户Uk最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性。
由于在本发明实施例提供的挖掘方法中的停留区域表示很多用户有兴趣愿意停留的区域,而单个用户的停留点只是该用户有兴趣停留的地方,其他用户不一定有兴趣在该用户的停留点停留,因此,为了有利于后续获取各用户的停留区域列表,在本发明实施例提供的挖掘方法中还对所有用户的停留点进行了聚类,从而获取了带有语义的公共停留区域,进而可以将各用户符合公共停留区域列表的停留点对应的公共停留区域构成该用户的停留区域列表。
具体地,在本发明实施例提供的上述挖掘方法中,可以采用基于密度的聚类算法P-DBSCAN将各用户每天的停留点归类为多个公共停留区域;
再通过信息点POI数据库,为确定出的各公共停留区域赋予语义信息,并将赋予语义信息的各公共停留区域构成各用户的公共停留区域列表。
在得到公共停留区域列表后,就可以将各用户符合公共停留区域列表的停留点对应的公共停留区域构成该用户的停留区域列表。例如如图3所示,用户Uk的某天的停留点S1和S2分别与公共停留区域银行B和餐馆R对应,即用户Uk某天的停留区域为银行B和餐馆R。如此,可得到用户Uk每天的停留区域。统计用户Uk每天的停留区域,从而可以得到用户Uk的停留区域列表。
进一步地,在得到用户Uk的停留区域列表后,在本发明实施例提供的上述挖掘方法中,还可以确定用户Uk的停留区域列表中的各停留区域的停留时间。例如如图3所示,用户Uk在银行B和餐馆R的停留时间分别为轨迹点P5的时间戳与轨迹点P4的时间戳的差值和轨迹点P10的时间戳与轨迹点P8的时间戳的差值。如此确定停留时间后,再将停留时间满足预设时长的各停留区域统计为用户Uk的最经常停留的区域列表。即在停留时间满足预设时长的各停留区域中统计用户Uk的最经常停留的区域,其中,预设时长可以根据实际需要进行设定,在此不做限定。例如,可以在每次停留时间大于0.5h的各停留区域中,统计用户Uk到达各停留区域的频率,以得到用户Uk的最经常停留的区域。如表1所示,可以为用户Uk的最经常停留的区域列表。
表1
停留区域 位置 语义 停留时间
Location1:餐馆A 地理范围1 餐馆 2h
Location2:银行A 地理范围2 银行 1h
Location3:公园A 地理范围3 公园 1.5h
Location4:学校A 地理范围4 学校 0.5h
Location5:餐馆B 地理范围4 餐馆 1h
此外,根据如图2所示的用户Uk某天的停留点得到的停留点序列Ti=S1→S2和如图3所示的用户Uk某天的停留区域列表银行B和餐馆R,可以确定用户Uk某天的停留区域轨迹L2→L5;如此,可以确定出用户Uk每天的停留区域轨迹。采用预先设定的针对序列模式的挖掘算法,例如PrefixSpan或者CloseSpan算法,对确定出的用户Uk每天的停留区域轨迹进行挖掘,最终统计出用户Uk的最频繁的重复轨迹模式。例如,用户Uk的最频繁的重复轨迹模式可以为家-学校-公园,或公园-电影院-餐馆等。
在具体实施时,由于快速(K-means)聚类算法是硬聚类算法,以欧式距离作为相似度测度,求对应某一初始聚类中心向量V的最优分类,使得评价指标最小,是典型的基于原型的目标函数聚类方法的代表,因此,在本发明实施例提供的上述挖掘方法中,步骤S105采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户,具体可以通过以下方式实现:
采用快速(K-means)聚类的方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
当然,也可以采用其他聚类方法对各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,例如谱系(hierarchical clustering)聚类方法、两阶段(Two-Step)聚类方法,在此不做限定。
具体地,采用K-means聚类算法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,即首先从n个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象中任意选择k个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象作为初始聚类中心;而对于所剩下的其它用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象,则根据它们与这些聚类中心的相似度即距离,分别将它们分配给与其距离最短的聚类中心所代表的聚类;然后再计算每个所获新聚类的聚类中心,即该聚类中所有对象的均值;不断重复这一过程直到标准测度函数开始收敛为止,并且,一般地,采用均方差作为标准测度函数。
具体K-means聚类算法描述如下:
1.随机选取k个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象作为聚类质心点(cluster centroids),并记为μ11,…,μk∈R;
2.重复下面的过程直到收敛。
{
对于每一个样例i即作为聚类质心点的k个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象之外的其它用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象i,计算其应该属于的类
c(i):=argmin||x(i)j||2
对于每一个类j,重新计算该类的质心
}
其中,k是预设的聚类数;c(i)代表作为聚类质心点的k个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象之外的其它用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象i与k个类中距离最近的那个类,c(i)的值是1到k中的一个;质心μj代表对属于同一个类的样本中心点的猜测。
为判断K-means聚类算法收敛,在这里设定结束条件/评价指标,定义畸变函数(distortion function)如下:
J函数表示每个样本点到其质心的距离平方和。K-means聚类算法是要将J调整到最小。假设当前J没有达到最小值,那么首先可以固定每个类的质心μj,调整每个样例的所属的类别c(i)来让J函数减小;同样,固定c(i),调整每个类的质心μj也可以使J减小。这两个过程就是内循环中使J单调递减的过程。当J递减到最小时,μ和c也同时收敛。在理论上,可以有多组不同的μ和c值能够使得J取得最小值,但这种现象实际上很少见。
值得注意的是,由于畸变函数J是非凸函数,意味着我们不能保证取得的最小值是全局最小值,也就是说k-means聚类算法对质心初始位置的选取比较敏感,但一般情况下k-means聚类算法达到的局部最优已经满足需求。但为防止陷入局部最优,较佳地,可以选取不同的初始值即不同的k个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性数据对象试验k-means聚类算法,然后取其中最小的J对应的μ和c输出,从而将n个用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性划分为了k个不同的类。
一般地,不同群体用户受自身行为习惯和兴趣爱好的影响,会逐渐形成有差异化的出行模式。通过挖掘群体的普遍特征,可以刻画出不同用户群体的画像和行为偏好,进而实现同一应用针对不同的用户群体提供不同的服务,或指定更有针对性、更有效的方案,全方位提升服务体验,以达到在增加用户粘性的同时实现高效的拓展用户群的效果。此外,根据挖掘出的不同群体用户的特征,亦可能开发新的商业应用和商业价值,例如线下营销推广、选地选址、城市人口研究等。
鉴于上述用户群体特征的商业应用和商业价值,具体地,在本发明实施例提供的上述挖掘方法中的步骤S105采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户之后,如图4所示,还可以包括以下步骤:
S106、结合词云获取各群体用户的特征;其中,词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
具体地,以根据用户注册信息获取词云信息,进而结合词云信息获取各群体用户的特征为例:应用在向用户提供服务前,一般会要求用户注册,并勾选性别,年龄,偏好或兴趣等信息,这样就可以生成一个用户的词云列表。将同一群体用户中的全部用户的词云列表进行统计,即可以辅助标定一个群体用户的特征。其中,群体用户的特征可以包括但不限于性别、年龄段、职业、长期偏好、短期需求、消费习惯、主要活动的地理区域等。
较佳地,为了更全面丰富地体现群体用户的特征,可以同时根据用户签到信息,用户调查问卷,以及用户注册信息等获取词云信息。当然,还可以通过其他方式获取词云信息,在此不做限定。
基于同一发明构思,本发明实施例提供了一种群体用户的挖掘装置,由于本发明实施例提供的挖掘装置与上述挖掘方法解决问题的原理相似,因此,该挖掘装置的实施可以参见上述挖掘方法的实施,重复之处不再赘述。
本发明实施例提供的一种群体用户的挖掘装置,如图5所示,包括:
统计单元501,用于根据由轨迹点组成的多个用户的历史轨迹数据,将各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点按时间顺序排列构成各用户每天的停留点序列;根据各用户每天的停留点序列,统计各用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;将各用户每天的停留点归类为多个公共停留区域;为各公共停留区域赋予语义信息,并根据各公共停留区域和语义信息,统计各用户的公共停留区域列表;将各用户符合公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各用户的停留区域列表,统计各用户的最经常停留的区域列表轨迹特征属性;根据各用户每天的停留点序列和各用户的停留区域列表,确定各用户每天的停留区域轨迹;根据确定出的各用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各用户的最频繁的重复轨迹模式轨迹特征属性;
聚类单元502,用于采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在具体实施时,在本发明实施例提供的上述挖掘装置中,统计单元501,具体用于采用基于密度的聚类算法P-DBSCAN将各用户每天的停留点归类为多个公共停留区域。
在具体实施时,在本发明实施例提供的上述挖掘装置中,统计单元501,具体用于通过信息点POI数据库,为确定出的各公共停留区域赋予语义信息,并将赋予语义信息的各公共停留区域构成各用户的公共停留区域列表。
在具体实施时,在本发明实施例提供的上述挖掘装置中,统计单元501,具体用于确定各用户的停留区域列表中的各停留区域的停留时间;将停留时间满足预设时长的各停留区域统计为各用户的最经常停留的区域列表。
在具体实施时,在本发明实施例提供的上述挖掘装置中,聚类单元502,具体用于采用快速聚类的方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
在具体实施时,在本发明实施例提供的上述挖掘装置中,如图5所示,还可以包括:获取单元503,用于结合词云获取各群体用户的特征;其中,词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
本发明实施例提供的上述群体用户的挖掘方法及装置,包括:根据由轨迹点组成的多个用户的历史轨迹数据,将各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点按时间顺序排列构成各用户每天的停留点序列;根据各用户每天的停留点序列,统计各用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;将各用户每天的停留点归类为多个公共停留区域;为各公共停留区域赋予语义信息,并根据各公共停留区域和语义信息,统计各用户的公共停留区域列表;将各用户符合公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各用户的停留区域列表,统计各用户的最经常停留的区域列表轨迹特征属性;根据各用户每天的停留点序列和各用户的停留区域列表,确定各用户每天的停留区域轨迹;根据确定出的各用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各用户的最频繁的重复轨迹模式轨迹特征属性;采用预先设定的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。由于根据由轨迹点组成的多个用户的历史轨迹数据,提取了各用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各用户每天的停留点,并将各用户每天的停留点的归类为多个公共停留区域,且为各公共停留区域赋予语义信息;再基于满足预设的时间阈值、距离阈值和方向变化阈值条件的停留点,以及赋予语义信息的公共停留区域,统计出了各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性;并采用预设的聚类方法,对统计出的各用户的最频繁的出行起始时间段轨迹特征属性、最频繁的结束行程时间段轨迹特征属性、最经常停留的区域列表轨迹特征属性和最频繁的重复轨迹模式轨迹特征属性进行聚类,从而得到了多个群体用户,因此,实现了基于历史轨迹数据,更全面地对群体用户的挖掘。
此外,在本发明实施例提供的上述群体用户的挖掘方法和装置中,在挖掘出多个群体用户后,还结合词云获取了各群体用户的特征。不仅实现了对群体用户的深度挖掘,而且根据各群体用户的特征可以刻画出不同用户群体的画像和行为偏好,进而实现同一应用针对不同的用户群体提供不同的服务,或指定更有针对性、更有效的方案,全方位提升服务体验,以达到在增加用户粘性的同时实现高效的拓展用户群的效果。并且,根据挖掘出的不同群体用户的特征,亦可能开发新的商业应用和商业价值,例如线下营销推广、选地选址、城市人口研究等。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (12)

1.一种群体用户的挖掘方法,其特征在于,包括:
根据由轨迹点组成的多个用户的历史轨迹数据,将各所述用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各所述用户每天的停留点,并将各所述用户每天的停留点按时间顺序排列构成各所述用户每天的停留点序列;
根据各所述用户每天的停留点序列,统计各所述用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;
将各所述用户每天的停留点归类为多个公共停留区域;为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表;将各所述用户符合所述公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表轨迹特征属性;
根据各所述用户每天的停留点序列和各所述用户的停留区域列表,确定各所述用户每天的停留区域轨迹;根据确定出的各所述用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各所述用户的最频繁的重复轨迹模式轨迹特征属性;
采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
2.如权利要求1所述的挖掘方法,其特征在于,所述将各所述用户每天的停留点归类为多个公共停留区域,具体包括:
采用基于密度的聚类算法P-DBSCAN将各所述用户每天的停留点归类为多个公共停留区域。
3.如权利要求1所述的挖掘方法,其特征在于,所述为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表,具体包括:
通过信息点POI数据库,为各所述公共停留区域赋予语义信息,并将赋予语义信息的各所述公共停留区域构成各所述用户的公共停留区域列表。
4.如权利要求1所述的挖掘方法,其特征在于,所述根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表,具体包括:
确定各所述用户的停留区域列表中的各停留区域的停留时间;
将停留时间满足预设时长的各所述停留区域统计为各所述用户的最经常停留的区域列表。
5.如权利要求1-4任一项所述的挖掘方法,其特征在于,所述采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户,具体包括:
采用快速聚类的方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
6.如权利要求1-4任一项所述的挖掘方法,其特征在于,在所述采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户之后,还包括:
结合词云获取各所述群体用户的特征;其中,所述词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;所述群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
7.一种群体用户的挖掘装置,其特征在于,包括:
统计单元,用于根据由轨迹点组成的多个用户的历史轨迹数据,将各所述用户的每天满足预设的时间阈值、距离阈值和方向变化阈值条件的轨迹点构成各所述用户每天的停留点,并将各所述用户每天的停留点按时间顺序排列构成各所述用户每天的停留点序列;根据各所述用户每天的停留点序列,统计各所述用户的最频繁的出行起始时间段轨迹特征属性和最频繁的结束行程时间段轨迹特征属性;将各所述用户每天的停留点归类为多个公共停留区域;为各所述公共停留区域赋予语义信息,并根据各所述公共停留区域和所述语义信息,统计各所述用户的公共停留区域列表;将各所述用户符合所述公共停留区域列表的停留点对应的公共停留区域作为该用户的停留区域列表;根据确定出的各所述用户的停留区域列表,统计各所述用户的最经常停留的区域列表轨迹特征属性;根据各所述用户每天的停留点序列和各所述用户的停留区域列表,确定各所述用户每天的停留区域轨迹;根据确定出的各所述用户每天的停留区域轨迹,采用预先设定的针对序列模式的挖掘算法,统计各所述用户的最频繁的重复轨迹模式轨迹特征属性;
聚类单元,用于采用预先设定的聚类方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
8.如权利要求7所述的挖掘装置,其特征在于,所述统计单元,具体用于采用基于密度的聚类算法P-DBSCAN将各所述用户每天的停留点归类为多个公共停留区域。
9.如权利要求7所述的挖掘装置,其特征在于,所述统计单元,具体用于通过信息点POI数据库,为各所述公共停留区域赋予语义信息,并将赋予语义信息的各所述公共停留区域构成各所述用户的公共停留区域列表。
10.如权利要求7所述的挖掘装置,其特征在于,所述统计单元,具体用于确定各所述用户的停留区域列表中的各停留区域的停留时间;将停留时间满足预设时长的各所述停留区域统计为各所述用户的最经常停留的区域列表。
11.如权利要求7-10任一项所述的挖掘装置,其特征在于,所述聚类单元,具体用于采用快速聚类的方法,对统计出的各所述用户的所述最频繁的出行起始时间段轨迹特征属性、所述最频繁的结束行程时间段轨迹特征属性、所述最经常停留的区域列表轨迹特征属性和所述最频繁的重复轨迹模式轨迹特征属性进行聚类,得到多个群体用户。
12.如权利要求7-10任一项所述的挖掘装置,其特征在于,还包括:获取单元,用于结合词云获取各所述群体用户的特征;其中,所述词云为以下之一或组合:用户签到信息,用户调查问卷,用户注册信息;所述群体用户的特征为以下之一或组合:性别,年龄段,职业,长期偏好,短期需求,消费习惯,主要活动的地理区域。
CN201710099962.0A 2017-02-23 2017-02-23 一种群体用户的挖掘方法及装置 Active CN108509434B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710099962.0A CN108509434B (zh) 2017-02-23 2017-02-23 一种群体用户的挖掘方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710099962.0A CN108509434B (zh) 2017-02-23 2017-02-23 一种群体用户的挖掘方法及装置

Publications (2)

Publication Number Publication Date
CN108509434A true CN108509434A (zh) 2018-09-07
CN108509434B CN108509434B (zh) 2020-12-25

Family

ID=63373482

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710099962.0A Active CN108509434B (zh) 2017-02-23 2017-02-23 一种群体用户的挖掘方法及装置

Country Status (1)

Country Link
CN (1) CN108509434B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389178A (zh) * 2018-10-26 2019-02-26 深圳市元征科技股份有限公司 一种维修厂评级方法、系统及电子设备和存储介质
CN109635208A (zh) * 2018-10-25 2019-04-16 百度在线网络技术(北京)有限公司 用户到访推断模型建立方法、装置及存储介质
CN109743689A (zh) * 2019-01-09 2019-05-10 南京航空航天大学 一种基于稳定性值的室内轨迹停留区域发现方法
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置
CN110046218A (zh) * 2019-05-13 2019-07-23 东软集团股份有限公司 一种用户出行模式的挖掘方法、装置、系统和处理器
CN110222278A (zh) * 2019-06-18 2019-09-10 东北大学 综合因素下用户位置的获取方法
CN110309434A (zh) * 2018-10-10 2019-10-08 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN110503032A (zh) * 2019-08-21 2019-11-26 中南大学 基于监控摄像头轨迹数据的个体重要场所探测方法
CN110910054A (zh) * 2018-09-17 2020-03-24 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法和装置
CN110909037A (zh) * 2019-10-09 2020-03-24 中国人民解放军战略支援部队信息工程大学 一种频繁轨迹模式的挖掘方法及装置
CN111046895A (zh) * 2018-10-15 2020-04-21 北京京东尚科信息技术有限公司 一种确定目标区域的方法和装置
CN111209318A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 基于地理位置数据分析方法、装置、电子设备及存储介质
CN111324677A (zh) * 2018-12-13 2020-06-23 中国移动通信集团山西有限公司 用户位置数据的获取方法、装置、设备及介质
CN111367896A (zh) * 2018-12-25 2020-07-03 北京融信数联科技有限公司 基于大数据的用户个性化活动图谱构建方法
CN111380541A (zh) * 2018-12-29 2020-07-07 沈阳美行科技有限公司 兴趣点确定方法、装置、计算机设备和存储介质
CN111523058A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 服务区域分析处理方法、装置、设备及存储介质
CN111797291A (zh) * 2020-06-02 2020-10-20 成都方未科技有限公司 一种轨迹数据进行社会功能挖掘的方法、系统及存储介质
CN111831763A (zh) * 2019-09-11 2020-10-27 北京嘀嘀无限科技发展有限公司 地图处理方法、装置、设备及计算机可读存储介质
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN112351004A (zh) * 2020-10-23 2021-02-09 烟台南山学院 一种基于计算机网络信息安全事件处理系统及方法
CN112380285A (zh) * 2020-10-30 2021-02-19 北京百度网讯科技有限公司 信息处理方法和装置
CN113268679A (zh) * 2021-04-19 2021-08-17 宁波市测绘和遥感技术研究院 基于互联网大数据的可视化处理方法
CN114997739A (zh) * 2022-07-18 2022-09-02 深圳市奇果物联科技有限公司 一种基于物联网的电子学生证信息管理系统及方法
TWI819319B (zh) * 2021-06-22 2023-10-21 台灣大哥大股份有限公司 用於建立在地理區域中的用戶活動模型之系統及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731795A (zh) * 2013-12-19 2015-06-24 日本电气株式会社 用于挖掘个体活动模式的设备和方法
CN104750751A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 轨迹数据标注方法及装置
CN104965913A (zh) * 2015-07-03 2015-10-07 重庆邮电大学 一种基于gps地理位置数据挖掘的用户分类方法
CN105117424A (zh) * 2015-07-31 2015-12-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法
US9477745B2 (en) * 2014-07-07 2016-10-25 Sap Se Predictive cluster analytics optimization
CN106339417A (zh) * 2016-08-15 2017-01-18 浙江大学 基于移动轨迹中停留点的用户群体行为规律检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104731795A (zh) * 2013-12-19 2015-06-24 日本电气株式会社 用于挖掘个体活动模式的设备和方法
CN104750751A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 轨迹数据标注方法及装置
US9477745B2 (en) * 2014-07-07 2016-10-25 Sap Se Predictive cluster analytics optimization
CN104965913A (zh) * 2015-07-03 2015-10-07 重庆邮电大学 一种基于gps地理位置数据挖掘的用户分类方法
CN105117424A (zh) * 2015-07-31 2015-12-02 中国科学院软件研究所 一种基于停留时间的移动对象语义行为模式挖掘方法
CN106339417A (zh) * 2016-08-15 2017-01-18 浙江大学 基于移动轨迹中停留点的用户群体行为规律检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴云: "轨迹挖掘场景化精准广告投放研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *
安建瑞: "基于MapReduce的用户移动轨迹序列模式挖掘算法研究", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *
陈鹏: "基于用户移动数据的可视化用户行为分析", 《中国优秀硕士学位论文全文数据库 (信息科技辑)》 *
黄文彬等: "移动用户画像构建研究", 《现代情报》 *

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110910054A (zh) * 2018-09-17 2020-03-24 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法和装置
CN110910054B (zh) * 2018-09-17 2024-04-05 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法和装置
WO2020057275A1 (zh) * 2018-09-17 2020-03-26 北京京东尚科信息技术有限公司 轨迹的确定方法和装置、时间的推荐方法、装置和系统
CN110309434B (zh) * 2018-10-10 2023-10-13 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN110309434A (zh) * 2018-10-10 2019-10-08 腾讯大地通途(北京)科技有限公司 一种轨迹数据处理方法、装置以及相关设备
CN111046895B (zh) * 2018-10-15 2023-11-07 北京京东振世信息技术有限公司 一种确定目标区域的方法和装置
CN111046895A (zh) * 2018-10-15 2020-04-21 北京京东尚科信息技术有限公司 一种确定目标区域的方法和装置
CN109635208A (zh) * 2018-10-25 2019-04-16 百度在线网络技术(北京)有限公司 用户到访推断模型建立方法、装置及存储介质
CN109389178A (zh) * 2018-10-26 2019-02-26 深圳市元征科技股份有限公司 一种维修厂评级方法、系统及电子设备和存储介质
CN111324677A (zh) * 2018-12-13 2020-06-23 中国移动通信集团山西有限公司 用户位置数据的获取方法、装置、设备及介质
CN111367896A (zh) * 2018-12-25 2020-07-03 北京融信数联科技有限公司 基于大数据的用户个性化活动图谱构建方法
CN111380541A (zh) * 2018-12-29 2020-07-07 沈阳美行科技有限公司 兴趣点确定方法、装置、计算机设备和存储介质
CN109743689A (zh) * 2019-01-09 2019-05-10 南京航空航天大学 一种基于稳定性值的室内轨迹停留区域发现方法
CN109918395A (zh) * 2019-02-19 2019-06-21 北京明略软件系统有限公司 一种群体挖掘方法及装置
CN110046218B (zh) * 2019-05-13 2021-05-07 东软集团股份有限公司 一种用户出行模式的挖掘方法、装置、系统和处理器
CN110046218A (zh) * 2019-05-13 2019-07-23 东软集团股份有限公司 一种用户出行模式的挖掘方法、装置、系统和处理器
CN110222278A (zh) * 2019-06-18 2019-09-10 东北大学 综合因素下用户位置的获取方法
CN110222278B (zh) * 2019-06-18 2022-05-17 东北大学 综合因素下用户位置的获取方法
CN110503032A (zh) * 2019-08-21 2019-11-26 中南大学 基于监控摄像头轨迹数据的个体重要场所探测方法
CN110503032B (zh) * 2019-08-21 2021-08-31 中南大学 基于监控摄像头轨迹数据的个体重要场所探测方法
CN111831763A (zh) * 2019-09-11 2020-10-27 北京嘀嘀无限科技发展有限公司 地图处理方法、装置、设备及计算机可读存储介质
CN110909037B (zh) * 2019-10-09 2024-02-13 中国人民解放军战略支援部队信息工程大学 一种频繁轨迹模式的挖掘方法及装置
CN110909037A (zh) * 2019-10-09 2020-03-24 中国人民解放军战略支援部队信息工程大学 一种频繁轨迹模式的挖掘方法及装置
CN111209318B (zh) * 2020-01-02 2020-09-08 平安科技(深圳)有限公司 基于地理位置数据分析方法、装置、电子设备及存储介质
CN111209318A (zh) * 2020-01-02 2020-05-29 平安科技(深圳)有限公司 基于地理位置数据分析方法、装置、电子设备及存储介质
CN111523058B (zh) * 2020-04-21 2023-11-03 北京嘀嘀无限科技发展有限公司 服务区域分析处理方法、装置、设备及存储介质
CN111523058A (zh) * 2020-04-21 2020-08-11 北京嘀嘀无限科技发展有限公司 服务区域分析处理方法、装置、设备及存储介质
CN111797291A (zh) * 2020-06-02 2020-10-20 成都方未科技有限公司 一种轨迹数据进行社会功能挖掘的方法、系统及存储介质
CN112351004A (zh) * 2020-10-23 2021-02-09 烟台南山学院 一种基于计算机网络信息安全事件处理系统及方法
CN112380285A (zh) * 2020-10-30 2021-02-19 北京百度网讯科技有限公司 信息处理方法和装置
CN112380285B (zh) * 2020-10-30 2024-02-06 北京百度网讯科技有限公司 信息处理方法和装置
CN112182410B (zh) * 2020-11-05 2023-04-21 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN112182410A (zh) * 2020-11-05 2021-01-05 西南交通大学 基于时空轨迹知识图谱的用户出行模式挖掘方法
CN113268679A (zh) * 2021-04-19 2021-08-17 宁波市测绘和遥感技术研究院 基于互联网大数据的可视化处理方法
TWI819319B (zh) * 2021-06-22 2023-10-21 台灣大哥大股份有限公司 用於建立在地理區域中的用戶活動模型之系統及方法
CN114997739A (zh) * 2022-07-18 2022-09-02 深圳市奇果物联科技有限公司 一种基于物联网的电子学生证信息管理系统及方法

Also Published As

Publication number Publication date
CN108509434B (zh) 2020-12-25

Similar Documents

Publication Publication Date Title
CN108509434A (zh) 一种群体用户的挖掘方法及装置
García-Palomares et al. City dynamics through Twitter: Relationships between land use and spatiotemporal demographics
Gao et al. Discovering spatial interaction communities from mobile phone d ata
Widhalm et al. Discovering urban activity patterns in cell phone data
Yuan et al. Correlating mobile phone usage and travel behavior–A case study of Harbin, China
CN103220376B (zh) 利用移动终端的位置数据来定位ip位置的方法
Soto et al. Robust land use characterization of urban landscapes using cell phone data
Ríos et al. Land Use detection with cell phone data using topic models: Case Santiago, Chile
Swerts et al. The future of India's urbanization
Bao et al. Spatial analysis of bikeshare ridership with smart card and POI data using geographically weighted regression method
Khoo et al. User requirements and route choice response to smart phone traffic applications (apps)
CN106156528B (zh) 一种轨迹数据停留识别方法及系统
CN105243128A (zh) 一种基于签到数据的用户行为轨迹聚类方法
Silva et al. Visualizing the invisible image of cities
CN107622325A (zh) 基于建成环境和微博数据的交通事故时空分布量化方法
Chen Parking occupancy prediction and pattern analysis
CN106339483A (zh) 一种移动社交网络中的社交活动推荐算法
Doyle et al. Population mobility dynamics estimated from mobile telephony data
Wismans et al. Improving a priori demand estimates transport models using mobile phone data: a Rotterdam-region case
CN107977673A (zh) 一种基于大数据的经济活动人口识别方法
Jia et al. Measuring the vibrancy of urban neighborhoods using mobile phone data with an improved PageRank algorithm
Cui et al. Social media and mobility landscape: Uncovering spatial patterns of urban human mobility with multi source data
Alhazzani et al. Urban Attractors: Discovering patterns in regions of attraction in cities
Zhu et al. Urban population migration pattern mining based on taxi trajectories
Shoman et al. Spatio-temporal evaluation of transport accessibility of the Istanbul metrobus line

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant