CN104750829A - 一种基于签到特征的用户位置分类方法及系统 - Google Patents
一种基于签到特征的用户位置分类方法及系统 Download PDFInfo
- Publication number
- CN104750829A CN104750829A CN201510151827.7A CN201510151827A CN104750829A CN 104750829 A CN104750829 A CN 104750829A CN 201510151827 A CN201510151827 A CN 201510151827A CN 104750829 A CN104750829 A CN 104750829A
- Authority
- CN
- China
- Prior art keywords
- user
- register
- history
- registering
- place
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Mobile Radio Communication Systems (AREA)
Abstract
本发明公开了一种基于签到特征的用户位置分类模型,其应用在针对性的广告推荐、智能导航、智慧交通等基于位置的服务中,该模型包括:针对用户当前的“签到”场所,查询其是否已在用户的历史“签到”位置集里面;如果不在,则分别基于社交网络全局用户知识域、用户好友知识域、用户个人知识域提取用户的“签到”特征;应用已训练的SVM分类模型对用户当前的“签到”场所进行分类,预测该位置是否为用户将来频繁“签到”的场所。本发明不仅能够挖掘社交网络用户的移动行为规律,还能捕捉到用户个人的位置偏好,从而可以用于改进一系列基于位置的服务或应用。
Description
技术领域
本发明属于社交网络数据挖掘技术领域,更具体地,涉及一种基于签到特征的用户位置分类方法及系统。
背景技术
基于位置的社交网络是随着智能手机的流行而出现的一种新应用。在基于位置的社交网络里面,用户可以通过“签到”这一操作来让他的好友知道他具体什么时候在哪儿。因此,从用户的“签到”轨迹中,不仅可以洞察到用户的移动行为,还能了解到用户个人的偏好。目前,基于用户“签到”轨迹的工作可以分为两种,即位置预测与位置推荐。位置预测的任务是在给定用户历史“签到”轨迹以及当前“签到”场所的情况下,对用户下一个可能的“签到”场所进行预测。这项工作代表了对用户移动行为规律的捕获,可以服务于城市规划,传染病的预防以及移动通信网络里面的资源管理等。与位置预测不同,位置推荐主要致力于捕获用户个人的位置偏好,然后基于用户的偏好,推荐用户去一些流行场所进行“签到”。位置推荐可以服务于移动市场,针对性的广告推荐等领域。与现有的位置预测和位置推荐工作不同,本发明致力于为用户的“签到”场所进行分类。基于对用户“签到”数据的观察与分析,结果证明了用户频繁“签到”场所的个数一般限定在两到三个。这些被用户频繁“签到”的场所在很大程度上不仅主导了用户自身的移动行为,而且还反映了用户个人的偏好。比如,某一用户每周五下班之后都会去体育馆。从这一现象就可以推断出该用户喜欢运动,并且每周五下班之后不是从公司径直回家,而是先去体育馆健身。因此,通过对用户的“签到”场所分类,及时地识别这些频繁“签到”的场所,可以帮助改善一系列基于用户位置的服务和应用。然而,在目前的研究中,还未出现对用户的“签到”场所进行分类的工作。
发明内容
针对现有技术的缺陷以及基于位置的服务的改进需求,本发明提供了一种基于用户“签到”特征的位置分类方法,其目的在于及时地对用户的“新签到”场所进行分类,以识别出用户在将来是否会频繁在该场所进行“签到”,从而用来进一步改进基于位置的服务或应用。
为了实现上述目的,按照本发明的一个方面,提供了一种基于用户“签到”特征的位置分类方法,该方法包括以下步骤:
(1)针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
(2)针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取。
(3)针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取。
(4)针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取。
(5)应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类,其中一类分类结果表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
进一步地,所述步骤(2)包括以下子步骤:
(2-1)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
(2-2)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(2-3)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
(2-4)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,所述步骤(3)包括以下子步骤:
(3-1)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
(3-2)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(3-3)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
(3-4)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,所述步骤(4)包括以下子步骤:
(4-1)根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
(4-2)根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
(4-3)根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
(4-4)根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
(4-5)根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
(4-6)根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-7)根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-8)根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
按照本发明的另一方面,还提供了一种基于用户“签到”的用户位置分类系统,包括:
查询模块,用于针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,则不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
基于全局用户知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取;
基于用户好友知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取;
基于用户个人知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取;
分类模块,用于应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类;其中一类表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
进一步地,基于全局用户知识域的特征提取模块又包括四个子模块,即:
HCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
HCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
RCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
RCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,基于用户好友知识域的特征提取模块包括四个子模块,即:
HCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
HCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
RCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
RCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,基于用户个人知识域的特征提取模块包括八个子模块,即:
HCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
HCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
RCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
RCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
HCFH″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
HCFW″子模块,用于根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
HCFM″子模块,用于根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
CF″子模块,用于根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
总体而言,通过本发明所构思的以上技术方案与现有工作相比,能够取得下列有益效果:
1、通过对用户的“签到”场所进行分类来挖掘社交网络用户的移动行为规律及其个人的偏好,可以帮助改进基于用户位置的服务或应用,比如针对性的广告推送,智能导航等。
2、在“签到”轨迹比较稀疏时,仍能够对用户的“签到”场所进行分类,预测其是否会在此位置频繁地重复“签到”。这有助于解决位置预测以及位置推荐工作在用户历史轨迹稀疏时所遭遇的“冷启动”问题。
3、能够对影响用户“签到”行为的因素进行分析。通过对所提取的特征进行特征选择以及特征排序操作,可以得到最能影响用户“签到”行为的top-k影响因素,从而可以帮助我们主动引导用户在某些位置场所进行“签到”。
附图说明
图1是本发明中所述的“签到”位置分类模型训练框架图;
图2是本发明中所述的基于“签到”位置分类方法的流程图;
图3是本发明中所述的用户“签到”行为分析系统模块框架图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
图1显示了“签到”位置分类模型训练的框架。对于某用户在一个“新”的位置场所进行签到,为了能够预测其将来是否会频繁地在此处进行重复“签到”,必须要根据已观测到“签到”数据集来训练出一个“签到”位置分类模型。首先,在收集完毕用户的“签到”数据集后,对于用户已签过到的每一个场所,进行“签到”特征的提取,并对该场所进行类别标注。例如,如果某用户在场所A签到次数大于设定的阈值,那么就为该用户将场所A标记为频繁“签到”场所,否则为非频繁“签到”场所。然后,将得到的带有类标签的样本数据集分成两部分,80%的数据集用来进行分类模型的训练,20%的数据集用来进行模型分类精度的评估。最后,将精度评估通过的分类模型投入使用,用于在线对用户的“签到”场所进行分类。
为了便于后续技术方案的叙述,在此首先给出本发明中所引用的符号说明。
表1:在特征提取中频繁使用的符号
表2:在特征提取中使用的约束条件
如图2所示,本发明提供了一种基于用户“签到”特征的位置分类方法,具体包括如下步骤:
(1)针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
(2)针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取。
(3)针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取。
(4)针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取。
(5)应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类,其中一类分类结果表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
进一步地,所述步骤(2)包括以下子步骤:
(2-1)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
(2-2)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(2-3)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
(2-4)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,所述步骤(3)包括以下子步骤:
(3-1)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
(3-2)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(3-3)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
(3-4)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,所述步骤(4)包括以下子步骤:
(4-1)根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
(4-2)根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
(4-3)根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
(4-4)根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
(4-5)根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
(4-6)根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-7)根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-8)根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
如图3所示,提供了一种基于用户“签到”特征的位置分类系统,其所述系统包括如下模块:
(1)查询模块,用于针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,则不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
(2)基于全局用户知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取;
(3)基于用户好友知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取;
(4)基于用户个人知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取;
(5)分类模块,用于应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类;其中一类表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
进一步地,基于全局用户知识域的特征提取模块包括四个子模块:
(2-1)HCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
(2-2)HCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(2-3)RCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
(2-4)RCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,基于用户好友知识域的特征提取模块包括四个子模块:
(3-1)HCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
(3-2)HCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(3-3)RCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
(3-4)RCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
进一步地,基于用户个人知识域的特征提取模块包括八个子模块:
(4-1)HCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
(4-2)HCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
(4-3)RCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
(4-4)RCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
(4-5)HCFH″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
(4-6)HCFW″子模块,用于根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-7)HCFM″子模块,用于根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-8)CF″子模块,用于根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
本发明的优势在于通过对社交网络用户的“签到”位置进行分类来挖掘用户移动行为的规律性以及用户个人的偏好,从而可以改进一系列基于位置的服务或应用。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于“签到”特征的用户位置分类方法,其特征在于,所述方法包括以下步骤:
(1)针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,则不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
(2)针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取;
(3)针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取;
(4)针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取;
(5)应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类;其中一类表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
2.根据权利要求1所述的用户位置分类方法,其特征在于,步骤(2)包括以下子步骤:
(2-1)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
(2-2)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(2-3)根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
(2-4)根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
3.根据权利要求1或2所述的用户位置分类方法,其特征在于,步骤(3)包括以下子步骤:
(3-1)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
(3-2)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
(3-3)根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
(3-4)根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
4.根据权利要求1或2所述的用户位置分类方法,其特征在于,步骤4包括以下子步骤:
(4-1)根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
(4-2)根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
(4-3)根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
(4-4)根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
(4-5)根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
(4-6)根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-7)根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
(4-8)根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
5.一种基于“签到”特征的用户位置分类系统,其特征在于,所述系统包括查询模块、基于全局用户知识域的特征提取模块、基于用户好友知识域的特征提取模块、基于用户个人知识域的特征提取模块以及分类模块,其中:
所述查询模块,用于针对用户u′当前的“签到”场所c′,查询其是否已出现在u′的历史“签到”位置集里面,如果该场所已在历史“签到”位置集里面,则不需要再进行分类处理;如果不在,则需要对该场所做进一步位置分类处理;
所述基于全局用户知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于社交网络全局用户知识域,进行用户“签到”特征的提取;
所述基于用户好友知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户好友知识域,进行用户“签到”特征的提取;
所述基于用户个人知识域的特征提取模块,用于针对用户u′当前的“签到”结果,基于用户个人的知识域,进行用户“签到”特征的提取;
所述分类模块,用于应用SVM分类模型到所提取的“签到”特征集,实现对用户“签到”场所c′的分类;其中一类表示该用户u′将来不会在该位置频繁地签到,另一类表示相反的情况。
6.根据权利要求5所述的用户位置分类系统,其特征在于,所述基于全局用户知识域的特征提取模块包括HCF子模块、HCFN子模块、RCF子模块以及RCFN子模块,其中:
所述HCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′的历史“签到”频率HCF,HCF为所有用户过去在场所c′平均每天的签到次数;
所述HCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN,HCFN为所有用户过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
所述RCF子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在场所c′最近一个月的历史“签到”频率RCF,RCF为所有用户在过去一个月内平均每天在场所c′的签到次数;
所述RCFN子模块,用于根据所有用户的历史“签到”轨迹,计算所有用户在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN,RCFN为所有用户过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
7.根据权利要求5或6所述的用户位置分类系统,其特征在于,所述基于用户好友知识域的特征提取模块,包括HCF′子模块、HCFN′子模块、RCF′子模块以及RCFN′子模块,其中:
所述HCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处的历史“签到”频率HCF′,HCF′为该用户的所有好友过去在场所c′平均每天的签到次数;
所述HCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的历史“签到”频率HCFN′,HCFN′为该用户的所有好友过去在c′附近设定地域范围以内所有场所平均每天的签到次数;
所述RCF′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在场所c′处最近一个月的历史“签到”频率RCF′,RCF′为该用户的所有好友在过去一个月内平均每天在场所c′的签到次数;
所述RCFN′子模块,用于根据好友的历史“签到”轨迹,计算用户u′的所有好友在c′附近设定地域范围以内所有场所的最近一个月的历史“签到”频率RCFN′,RCFN′为该用户的所有好友过去一个月内平均每天在c′附近设定地域范围以内所有场所的签到次数。
8.根据权利要求5或6所述的用户位置分类系统,其特征在于,所述基于用户个人知识域的特征提取模块包括HCF″子模块、HCFN″子模块、RCF″子模块RCFN″子模块、HCFH″子模块、HCFW″子模块、HCFM″子模块以及CF″子模块,其中:
所述HCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′的总体历史“签到”频率HCF″,HCF″为该用户在过去平均每天的签到次数;
所述HCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在场所c′附近的历史“签到”频率HCFN″,HCFN″为该用户过去在场所c′附近设定地域范围以内平均每天的签到次数;
所述RCF″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′在最近一个月内的历史“签到”频率RCF″,RCF″为该用户在过去一个月内平均每天的签到次数;
所述RCFN″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′场所c′附近最近一个月内的历史“签到”频率RCFN″,RCFN″为该用户在过去一个月平均每天在场所c′附近设定地域范围以内的签到次数;
所述HCFH″子模块,用于根据用户个人的历史“签到”轨迹,计算用户u′过去在同一时间的历史“签到”频率HCFH″,HCFH″为该用户过去在同一时刻的签到次数除以历史总签到数;
所述HCFW″子模块,用于根据用户个人的历史“签到”轨迹,以一周为循环周期,计算用户u′在每周的同一天的历史“签到”频率HCFW″,HCFW″为该用户过去在同一天的签到次数除以其历史总签到数;
所述HCFM″子模块,用于根据用户个人的历史“签到”轨迹,以月为循环周期,计算用户u′在每月的同一天的历史“签到”频率HCFM″,HCFM″为该用户过去在同一天的签到次数除以其历史总签到数;
所述CF″子模块,用于根据用户个人的“签到”结果,计算用户u′在将来半个小时内“签到”频率CF″,CF″为该用户在当前签到发生以后的半个小时以内进行签到的次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510151827.7A CN104750829B (zh) | 2015-04-01 | 2015-04-01 | 一种基于签到特征的用户位置分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510151827.7A CN104750829B (zh) | 2015-04-01 | 2015-04-01 | 一种基于签到特征的用户位置分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104750829A true CN104750829A (zh) | 2015-07-01 |
CN104750829B CN104750829B (zh) | 2017-10-31 |
Family
ID=53590513
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510151827.7A Active CN104750829B (zh) | 2015-04-01 | 2015-04-01 | 一种基于签到特征的用户位置分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104750829B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106211071A (zh) * | 2016-07-04 | 2016-12-07 | 深圳大学 | 基于多源时空轨迹数据的群体活动数据收集方法及系统 |
CN107194011A (zh) * | 2017-06-23 | 2017-09-22 | 重庆邮电大学 | 一种基于社交网络的位置预测系统及方法 |
CN107633067A (zh) * | 2017-09-21 | 2018-01-26 | 北京工业大学 | 一种基于人员行为规律和数据挖掘方法的群体识别方法 |
CN109035050A (zh) * | 2018-07-25 | 2018-12-18 | 安徽新华学院 | 一种基于位置的社交推荐系统 |
CN112232444A (zh) * | 2020-11-23 | 2021-01-15 | 中国移动通信集团江苏有限公司 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
CN112488384A (zh) * | 2020-11-27 | 2021-03-12 | 香港理工大学深圳研究院 | 基于社交媒体签到预测目标区域的方法、终端及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102594905A (zh) * | 2012-03-07 | 2012-07-18 | 南京邮电大学 | 一种基于场景的社交网络位置兴趣点推荐方法 |
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
US20140258211A1 (en) * | 2010-03-07 | 2014-09-11 | Dr. Hamid Hatami-Hanza | Interactive and Social Knowledge Discovery Sessions |
-
2015
- 2015-04-01 CN CN201510151827.7A patent/CN104750829B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140258211A1 (en) * | 2010-03-07 | 2014-09-11 | Dr. Hamid Hatami-Hanza | Interactive and Social Knowledge Discovery Sessions |
CN102594905A (zh) * | 2012-03-07 | 2012-07-18 | 南京邮电大学 | 一种基于场景的社交网络位置兴趣点推荐方法 |
CN103745105A (zh) * | 2014-01-06 | 2014-04-23 | 中国科学院计算技术研究所 | 一种社交网络中用户属性的预测方法及系统 |
Non-Patent Citations (4)
Title |
---|
DAN JIANG 等: "Locations recommendation based on check-in data from location-based social network", 《GEOINFORMATICS,2014 22ND INTERNATIONAL CONFERENCE ON》 * |
YU CHEN 等: "Mining user check-in features for location classification in location-based social networks", 《2015 IEEE SYMPOSIUM ON COMPUTERS AND COMMUNICATION(ISCC)》 * |
李敏 等: "基于位置的社交网络用户签到及相关行为研究", 《计算机科学》 * |
潘果 等: "LBSN中位置信息与网络拓扑相融合的好友预测", 《计算机科学》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106211071A (zh) * | 2016-07-04 | 2016-12-07 | 深圳大学 | 基于多源时空轨迹数据的群体活动数据收集方法及系统 |
CN106211071B (zh) * | 2016-07-04 | 2019-05-21 | 深圳大学 | 基于多源时空轨迹数据的群体活动数据收集方法及系统 |
CN107194011A (zh) * | 2017-06-23 | 2017-09-22 | 重庆邮电大学 | 一种基于社交网络的位置预测系统及方法 |
CN107633067A (zh) * | 2017-09-21 | 2018-01-26 | 北京工业大学 | 一种基于人员行为规律和数据挖掘方法的群体识别方法 |
CN107633067B (zh) * | 2017-09-21 | 2020-03-27 | 北京工业大学 | 一种基于人员行为规律和数据挖掘方法的群体识别方法 |
CN109035050A (zh) * | 2018-07-25 | 2018-12-18 | 安徽新华学院 | 一种基于位置的社交推荐系统 |
CN112232444A (zh) * | 2020-11-23 | 2021-01-15 | 中国移动通信集团江苏有限公司 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
CN112232444B (zh) * | 2020-11-23 | 2024-02-27 | 中国移动通信集团江苏有限公司 | 对象的地理位置数据确定方法、装置、设备及存储介质 |
CN112488384A (zh) * | 2020-11-27 | 2021-03-12 | 香港理工大学深圳研究院 | 基于社交媒体签到预测目标区域的方法、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN104750829B (zh) | 2017-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104750829A (zh) | 一种基于签到特征的用户位置分类方法及系统 | |
Bachir et al. | Inferring dynamic origin-destination flows by transport mode using mobile phone data | |
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
Qiao et al. | A hybrid Markov-based model for human mobility prediction | |
CN103905978B (zh) | 基于位置的信息推送方法、推送装置和网络 | |
CN106778876B (zh) | 基于移动用户轨迹相似性的用户分类方法和系统 | |
CN106912015B (zh) | 一种基于移动网络数据的人员出行链识别方法 | |
Smith-Clarke et al. | Poverty on the cheap: Estimating poverty maps using aggregated mobile communication networks | |
US10244060B2 (en) | Determining seeds for targeted notifications through online social networks in conjunction with user mobility data | |
CN108205766A (zh) | 信息推送方法、装置及系统 | |
CN107908606A (zh) | 基于不同信息源自动生成报表的方法和系统 | |
CN108509434A (zh) | 一种群体用户的挖掘方法及装置 | |
CN104834967A (zh) | 泛在网络下基于用户相似度的业务行为预测方法 | |
CN102118711B (zh) | 信息推送方法和信息推送装置 | |
CN107341693A (zh) | 旅游用户筛选的方法和旅游用户筛选的系统 | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 | |
Horn et al. | QZTool—automatically generated origin-destination matrices from cell phone trajectories | |
CN111598333A (zh) | 客流数据的预测方法及装置 | |
CN107133689B (zh) | 一种位置标记方法 | |
Ectors et al. | Developing an optimised activity type annotation method based on classification accuracy and entropy indices | |
CN106295868A (zh) | 交通出行数据处理方法及装置 | |
CN105761093A (zh) | 一种基于知识空间的行为结果评估方法以及装置 | |
CN110459050B (zh) | 一种基于混合决策树的短期公交客流预测方法 | |
Katranji et al. | Mobility data disaggregation: A transfer learning approach | |
Feng et al. | Scaling of spatio-temporal variations of taxi travel routes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |