CN105554140A - 一种用户群体定位方法及服务器 - Google Patents
一种用户群体定位方法及服务器 Download PDFInfo
- Publication number
- CN105554140A CN105554140A CN201510989673.9A CN201510989673A CN105554140A CN 105554140 A CN105554140 A CN 105554140A CN 201510989673 A CN201510989673 A CN 201510989673A CN 105554140 A CN105554140 A CN 105554140A
- Authority
- CN
- China
- Prior art keywords
- user
- attribute
- group
- member users
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户群体定位方法及服务器,其中方法包括:基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性设置到所述用户群体的每一个成员用户;基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
Description
技术领域
本发明涉及通信领域中的用户信息处理技术,尤其涉及一种用户群体定位方法及服务器。
背景技术
伴随互联网的发展,互联网中的媒体信息呈现爆炸式增长的态势;用户往往需要在尽量短的时间内对媒体信息进行了解,目前,媒体信息呈现于用户之前,往往只能固定的根据用户属性选取一些用户进行媒体信息的发送。但是,现有技术中这种仅基于用户的属性选取的目标用户群体的操作方式,无法保证选取目标用户群体的准确性,进而无法保证针对目标用户群体执行进一步操作的效果。
发明内容
有鉴于此,本发明的目的在于提供一种用户群体定位方法及服务器,能至少解决现有技术中存在的上述问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明实施例提供了一种用户群体定位方法,所述方法包括:
基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
本发明实施例提供了一种服务器,包括:
第一选取单元,用于基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
群信息处理单元,用于确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
第二选取单元,用于比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
筛选单元,用于基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
本发明实施例提供了用户群体定位方法及服务器,基于候选用户所使用的服务的数据,选取种子用户,确定获取所述种子用户所归属的至少一个用户群体的成员用户;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;再对所述用户群体的成员用户进行筛选,得到所述目标用户群体。如此,就能够准确的通过分析用户的服务数据获取到对应的种子用户,进而通过种子用户所在的用户群体进一步扩展得到更多的用户作为目标用户,从而提升了选取目标用户群体的精准性,保证了针对目标用户群体执行进一步操作的效果。
附图说明
图1为本发明实施例用户群体定位方法流程示意图一;
图2为本发明实施例选取种子用户场景示意图;
图3为本发明实施例基于种子用户选取用户群体示意图;
图4为本发明实施例基于用户群体进行共有属性的选取示意图;
图5为本发明实施例对群中成员用户扩展共有属性示意图;
图6为本发明实施例选取到目标成员群体示意图;
图7为本发明实施例根据目标群体类型的操作示意图;
图8为本发明实施例服务器组成结构示意图;
图9为本发明实施例服务器硬件组成结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明再作进一步详细的说明。
实施例一、
本发明实施例提供了一种用户群体定位方法,如图1所示,所述方法包括:
步骤101:基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
步骤102:确定获取所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
步骤103:比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
步骤104:基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
本实施例提供的方案可以应用于服务器侧。
上述基于候选用户所使用的的服务的数据,选取符合预设目标特征的至少一个所述候选用户,可以包括:
从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;将预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。比如,图2所示,候选用户可以包含用户A、B、C,经过筛选,得到两个种子用户,用户A、和用户B。
其中,所述至少一个维度包括有以下至少之一:位置信息,指定的一种或多种网络服务;
相应的,所述确定所述候选用户在所述至少一个维度使用所述服务的特征,可以为:通过基于位置的服务(LBS)获取到候选用户的位置信息,还可以再附加特征为年龄特征;或者,可以为候选用户所采用的线上服务,比如,下载音乐、在线收听音乐、网上订餐等服务。
所述预设目标特征可以为以下至少之一:包括关注信息点(POI,PointofInterest)的位置;年龄段在指定范围内。
确定获取所述种子用户所归属的至少一个用户群体可以为用户加入的群组,比如QQ群,微信群等。比如,基于图2中选取到的种子用户为用户A和用户B,如3中,得到用户A加入了群一、群二、群三,用户B加入了群一、群三、群四和群五。
确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性,可以包括:获取到所述用户群体中的全部成员用户,并且获取到所述全部成员用户的全部属性。其中,所述用户成员具备的属性可以为用户的标签,一个用户可以具备有多个标签,比如,大学、爱好、星座等。如图4所示,以种子用户用户A为例进行描述,用户A加入了群一和群二,分别获得群一和群二中的全部成员用户,群一包括用户1、用户2和用户A,分别获得这三个用户的标签;群二包括用户1、用户A和用户3,分别获得三个用户的标签。
进一步地,所述比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,可以包括:
确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;
从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
其中,所述得分可以为逐个统计每一个标签有多少个成员用户在使用。另外,所述选取得分最高的属性作为共有属性,可以为:若当前得分最高的属性有两个或两个以上,那么共有属性可以为两个或两个以上的属性,也可以为从两个或两个以上的属性中随机选取一个作为共有属性。
另外,在从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性之前,还可以包括:基于每一个属性的得分与成员用户的个数,判断是否保留对应的属性。判断的方法可以有以下几种:
一、判断属性的得分是否高于预设第二门限值,若高于则保留所述属性,否则,删除所述属性;
二、判断属性与成员用户的个数的比值是否高于预设的第三门限值,若高于则保留所述属性,否则删除所述属性。
如图4所示,采用第二种判断方法为例,过滤掉“分值/群人数”低于一定阈值的(群,标签),比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
将所述用户群体的共有属性对应到所述用户群体的每一个成员用户,可以为:将共有属性对应给用户群体中全部成员用户作为其属性,基于图4所示的场景,当确定标签1为共有属性时,只有群二中的用户3没有该标签,则将标签1对应的作为用户3的属性,结果可以如图5所示。
本实施例中所述对所述用户群体的成员用户进行筛选,得到所述目标用户群体采用的方法,可以为按照预设条件从所述成员用户中进行筛选,得到最终的目标用户群体。比如,参见图6,假设预设条件可以为按照年龄段,或者按照专业进行选取。获取到成员用户的年龄段以及专业的方式可以基于成员用户的服务数据。
本实施例采用的方案,利用LBS数据找出在每个大学校园区域内近期活跃的用户作为种子用户;利用QQ用户-群的二部图进行标签传播与过滤,找出概率较高的大学生群,并且将大学标签传播给群成员;利用用户年龄和圈子数据,过滤掉明显不属于大学生群体的用户,如超龄或者有工作同事圈子的人;得到最终的目标用户群体。
进一步地,基于上述方案,可以对所述目标用户群体进行进一步的处理,比如,可以将在校大学生作为目标用户群体,针对在校大学生进行教育、招聘、电商以及游戏的媒体信息的发送,以提升媒体信息的点击率、下载率等等参数。
另外,本实施例中选取目标用户群体的方式,比如,想要选取具备“在校大学生”这个标签即属性的用户作为目标用户群体,可以在如图7所示的操作界面上进行选择。那么服务器侧会在收到该选择之后,根据该标签即属性确定对应的预设目标特征对种子用户进行筛选,进而得到符合要求的目标用户群体。
可见,通过采用上述方案,基于候选用户所使用的服务的数据,选取种子用户,确定获取所述种子用户所归属的至少一个用户群体的成员用户;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;再对所述用户群体的成员用户进行筛选,得到所述目标用户群体。如此,就能够准确的通过分析用户的服务数据获取到对应的种子用户,进而通过种子用户所在的用户群体进一步扩展得到更多的用户作为目标用户,从而提升了选取目标用户群体的精准性,保证了针对目标用户群体执行进一步操作的效果。
实施例二、
本发明实施例提供了一种用户群体定位方法,如图1所示,所述方法包括:
步骤101:基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
步骤102:确定获取所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
步骤103:比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
步骤104:基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
本实施例提供的方案可以应用于服务器侧。
上述基于候选用户所使用的的服务的数据,选取符合预设目标特征的至少一个所述候选用户,可以包括:从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;将预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。比如,图2所示,候选用户可以包含用户A、B、C,经过筛选,得到两个种子用户,用户A、和用户B。
其中,所述至少一个维度包括有以下至少之一:位置信息,指定的一种或多种网络服务;相应的,所述确定所述候选用户在所述至少一个维度使用所述服务的特征,可以为:通过基于位置的服务(LBS)获取到候选用户的位置信息,还可以再附加特征为年龄特征;或者,可以为候选用户所采用的线上服务,比如,下载音乐、在线收听音乐、网上订餐等服务。
优选地,针对不同的目标用户群体可以预设有多种不同的目标特征,当目标用户群体为大学生时,可以对应的目标特征包括有:关注信息点(POI,PointofInterest)的位置;年龄段在指定范围内。比如,POI的位置可以为预设的大学周边的标志性建筑,类似书店、饭店等,年龄段可以为17-24岁之间。另外,如果目标用户群体为音乐爱好者,对应的目标特征可以包括有:获取音乐的线上服务的频率、获取到音乐的类型等。本实施例进一步针对如何更加准确的选取种子用户进行说明:
所述将所述预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户,包括:
所述候选用户使用所述服务的特征包括所述用户使用所述服务的地理位置、以及用户在每个所述地理位置使用所述服务的频率;分析所述候选用户使用所述服务的数据,确定所述候选用户在不同地理位置使用所述服务的频率;确定使用所述服务的频率高于频率阈值时所处的地理位置,将所述第理位置与所述目标用户群体的预设地理位置范围进行匹配,匹配成功则将所述候选用户识别为所述种子用户。
也就是说,获取到预设时长内,比如一年之内,用户使用过的服务对应的地理位置,并且分别计算每一个地理位置在其出现过的全部地理位置中的出现频率;选取频率高于频率阈值对应的地理位置作为预设地理位置,那么就将其作为种子用户。进一步地进行解释,可以理解为,用户分别出现在大学、体育馆、商场这些地方,用户总的登录次数为10次,其中,5次登录后确定其登录位置在大学,三次在体育馆,2次在商场,那么可以看出大学为其出现频率最高的地点,将这个用户作为种子用户。
如此,能够通过用户登录的位置信息对得到的种子用户进行进一步的筛选,得到更加准确的种子用户。
进一步地,所述匹配成功则将所述候选用户确定为所述种子用户,还包括:获取所述候选用户的个人数据,得到所述候选用户基于客户端登录以使用所述服务的默认地理位置;将所述候选用户使用所述服务的频率高于频率阈值时所处的地理位置与所述默认地理位置进行匹配;匹配到属于同一地理区域则将所述候选用户识别为所述种子用户。也就是,通过关联用户的基础信息,得到学校所在地和常用登录地一致的用户作为最终的种子用户;如此,不仅能够确定用户为大学生,还能够进一步的认为用户为所要选取的几个大学中的一个大学的学生。
确定获取所述种子用户所归属的至少一个用户群体可以为用户加入的群组,比如QQ群,微信群等。比如,基于图2中选取到的种子用户为用户A和用户B,如3中,得到用户A加入了群一、群二、群三,用户B加入了群一、群三、群四和群五。
确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性,可以包括:获取到所述用户群体中的全部成员用户,并且获取到所述全部成员用户的全部属性。其中,所述用户成员具备的属性可以为用户的标签,一个用户可以具备有多个标签,比如,大学、爱好、星座等。如图4所示,以种子用户用户A为例进行描述,用户A加入了群一和群二,分别获得群一和群二中的全部成员用户,群一包括用户1、用户2和用户A,分别获得这三个用户的标签;群二包括用户1、用户A和用户3,分别获得三个用户的标签。
进一步地,所述比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,可以包括:
确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;
从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
其中,所述得分可以为逐个统计每一个标签有多少个成员用户在使用。另外,所述选取得分最高的属性作为共有属性,可以为:若当前得分最高的属性有两个或两个以上,那么共有属性可以为两个或两个以上的属性,也可以为从两个或两个以上的属性中随机选取一个作为共有属性。
另外,在从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性之前,还可以包括:基于每一个属性的得分与成员用户的个数,判断是否保留对应的属性。判断的方法可以有以下几种:
一、判断属性的得分是否高于预设第二门限值,若高于则保留所述属性,否则,删除所述属性;
二、判断属性与成员用户的个数的比值是否高于预设的第三门限值,若高于则保留所述属性,否则删除所述属性。
如图4所示,采用第二种判断方法为例,过滤掉“分值/群人数”低于一定阈值的(群,标签),比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
将所述用户群体的共有属性对应到所述用户群体的每一个成员用户,可以为将共有属性设置给用户群体中全部成员用户作为其属性,基于图4所示的场景,当确定标签1为共有属性时,只有群二中的用户3没有该标签,则将标签1设置为用户3的属性,结果可以如图5所示。
本实施例中所述对所述用户群体的成员用户进行筛选,得到所述目标用户群体采用的方法,可以为按照预设条件从所述成员用户中进行筛选,得到最终的目标用户群体。比如,参见图6,假设预设条件可以为按照年龄段,或者按照专业进行选取。获取到成员用户的年龄段以及专业的方式可以基于成员用户的服务数据。
本实施例采用的方案,利用LBS数据找出在每个大学校园区域内近期活跃的用户作为种子用户;利用QQ用户-群的二部图进行标签传播与过滤,找出概率较高的大学生群,并且将大学标签传播给群成员;利用用户年龄和圈子数据,过滤掉明显不属于大学生群体的用户,如超龄或者有工作同事圈子的人;得到最终的目标用户群体。
进一步地,基于上述方案,可以对所述目标用户群体进行进一步的处理,比如,可以将在校大学生作为目标用户群体,针对在校大学生进行教育、招聘、电商以及游戏的媒体信息的发送,以提升媒体信息的点击率、下载率等等参数。
另外,本实施例中选取目标用户群体的方式,比如,想要选取具备“在校大学生”这个标签即属性的用户作为目标用户群体,可以在如图7所示的操作界面上进行选择。那么服务器侧会在收到该选择之后,根据该标签确定对应的预设目标特征对种子用户进行筛选,进而得到符合要求的目标用户群体。
可见,通过采用上述方案,基于候选用户所使用的服务的数据,选取种子用户,确定获取所述种子用户所归属的至少一个用户群体的成员用户;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;再对所述用户群体的成员用户进行筛选,得到所述目标用户群体。如此,就能够准确的通过分析用户的服务数据获取到对应的种子用户,进而通过种子用户所在的用户群体进一步扩展得到更多的用户作为目标用户,从而提升了选取目标用户群体的精准性,保证了针对目标用户群体执行进一步操作的效果。
实施例三、
本发明实施例提供了一种用户群体定位方法,如图1所示,所述方法包括:
步骤101:基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
步骤102:确定获取所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
步骤103:比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
步骤104:基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
本实施例提供的方案可以应用于服务器侧。
上述基于候选用户所使用的的服务的数据,选取符合预设目标特征的至少一个所述候选用户,可以包括:从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;将预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。比如,图2所示,候选用户可以包含用户A、B、C,经过筛选,得到两个种子用户,用户A、和用户B。
其中,所述至少一个维度包括有以下至少之一:位置信息,指定的一种或多种网络服务;相应的,所述确定所述候选用户在所述至少一个维度使用所述服务的特征,可以为:通过基于位置的服务(LBS)获取到候选用户的位置信息,还可以再附加特征为年龄特征;或者,可以为候选用户所采用的线上服务,比如,下载音乐、在线收听音乐、网上订餐等服务。
优选地,针对不同的目标用户群体可以预设有多种不同的目标特征,当目标用户群体为大学生时,可以对应的目标特征包括有:关注信息点(POI,PointofInterest)的位置;年龄段在指定范围内。比如,POI的位置可以为预设的大学周边的标志性建筑,类似书店、饭店等,年龄段可以为17-24岁之间。另外,如果目标用户群体为音乐爱好者,对应的目标特征可以包括有:获取音乐的线上服务的频率、获取到音乐的类型等。本实施例进一步针对如何更加准确的选取种子用户进行说明:
所述将所述预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户,包括:
所述候选用户使用所述服务的特征包括所述用户使用所述服务的地理位置、以及用户在每个所述地理位置使用所述服务的频率;分析所述候选用户使用所述服务的数据,确定所述候选用户在不同地理位置使用所述服务的频率;确定使用所述服务的频率高于频率阈值时所处的地理位置,将所述第理位置与所述目标用户群体的预设地理位置范围进行匹配,匹配成功则将所述候选用户识别为所述种子用户。
也就是说,获取到预设时长内,比如一年之内,用户使用过的服务对应的地理位置,并且分别计算每一个地理位置在其出现过的全部地理位置中的出现频率;选取频率高于频率阈值对应的地理位置作为预设地理位置,那么就将其作为种子用户。进一步地进行解释,可以理解为,用户分别出现在大学、体育馆、商场这些地方,用户总的登录次数为10次,其中,5次登录后确定其登录位置在大学,三次在体育馆,2次在商场,那么可以看出大学为其出现频率最高的地点,将这个用户作为种子用户。
如此,能够通过用户登录的位置信息对得到的种子用户进行进一步的筛选,得到更加准确的种子用户。
进一步举例针对种子用户筛选,以大学生为种子用户进行说明:
用户在包含“大学”的POI周围出现过,并且出现的累计天数不少于阀值天数;
用户到访POI的名称中包含有大学名称并且POI所在城市和大学基础信息中的城市一致;
设用户在某个学校出现的天数是在该校POI出现的总天数之和,针对每个用户找到出现天数最多的高校,如果出现天数大于阈值,认为该用户是相应学校的在校学生;
通过关联用户的基础信息,得到学校所在地和常用登录地一致的用户作为最终的种子用户。
进一步地,所述匹配成功则将所述候选用户确定为所述种子用户,还包括:获取所述候选用户的个人数据,得到所述候选用户基于客户端登录以使用所述服务的默认地理位置;将所述候选用户使用所述服务的频率高于频率阈值时所处的地理位置与所述默认地理位置进行匹配;匹配到属于同一地理区域则将所述候选用户识别为所述种子用户。也就是,通过关联用户的基础信息,得到学校所在地和常用登录地一致的用户作为最终的种子用户;如此,不仅能够确定用户为大学生,还能够进一步的认为用户为所要选取的几个大学中的一个大学的学生。
确定获取所述种子用户所归属的至少一个用户群体可以为用户加入的群组,比如QQ群,微信群等。比如,基于图2中选取到的种子用户为用户A和用户B,如3中,得到用户A加入了群一、群二、群三,用户B加入了群一、群三、群四和群五。
确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性,可以包括:获取到所述用户群体中的全部成员用户,并且获取到所述全部成员用户的全部属性。其中,所述用户成员具备的属性可以为用户的标签,一个用户可以具备有多个标签,比如,大学、爱好、星座等。如图4所示,以种子用户用户A为例进行描述,用户A加入了群一和群二,分别获得群一和群二中的全部成员用户,群一包括用户1、用户2和用户A,分别获得这三个用户的标签;群二包括用户1、用户A和用户3,分别获得三个用户的标签。
进一步地,所述比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,可以包括:
确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;
从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
其中,所述得分可以为逐个统计每一个标签有多少个成员用户在使用。另外,所述选取得分最高的属性作为共有属性,可以为:若当前得分最高的属性有两个或两个以上,那么共有属性可以为两个或两个以上的属性,也可以为从两个或两个以上的属性中随机选取一个作为共有属性。
另外,在从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性之前,还可以包括:基于每一个属性的得分与成员用户的个数,判断是否保留对应的属性。判断的方法可以有以下几种:
一、判断属性的得分是否高于预设第二门限值,若高于则保留所述属性,否则,删除所述属性;
二、判断属性与成员用户的个数的比值是否高于预设的第三门限值,若高于则保留所述属性,否则删除所述属性。
如图4所示,采用第二种判断方法为例,过滤掉“分值/群人数”低于一定阈值的(群,标签),比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
将所述用户群体的共有属性对应到所述用户群体的每一个成员用户,可以为将共有属性设置给用户群体中全部成员用户作为其属性,基于图4所示的场景,当确定标签1为共有属性时,只有群二中的用户3没有该标签,则将标签1设置为用户3的属性,结果可以如图5所示。
本实施例与实施例一以及实施例二不同之处在于,本实施例会基于选取出来的成员用户进一步进行处理,具体如下所示:
所述基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体,包括:
根据预设的目标共有属性,选取用户群体的共有属性与所述目标共有属性相同的用户群体;分析选取得到的所述用户群体中所述成员用户的服务数据,选取符合预设条件的成员用户;判断所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值,若所述差值小于预设门限值,则将所述符合预设条件的成员用户识别作为所述目标用户群体;否则,将所述符合预设条件的成员用户替换所述选取的种子用户作为新的所述种子用户,直至所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值小于所述预设门限值。
其中,所述目标共有属性可以为根据实际情况设置的一种或多种共有属性,比如,当选取的目标用户群体为大学生,那么可以设置目标拥有属性为“大学生”;如果选取的目标用户群体为音乐爱好者,那么目标共有属性可以为“音乐”等。
其中,预设门限值可以为根据实际情况进行设置,比如,可以设置小于二或者小于十。
也就是说,本实施例中提供的方法并不是只执行一次扩散就完成处理,而是等到成员的组成相对稳定的时候才会结束执行。
还是以大学生为目标用户群体为例,基于QQ群的属性即标签进行传播与扩散进行说明:
通过年龄限制对候选用户进行筛选与过滤,要求候选用户的年龄在17到26岁之间,并通过用户基础信息获取用户的最近常用的登录地;
通过群信息筛选出最近四年之内建立的群;
关联群信息,用户基础信息,群成员信息得到年龄在17到26岁之间,加过最近4年之内建立群的(群,用户)对;如图3所示。
关联(用户,群)和(用户,标签)信息得到(群,标签,标签得分),其中标签的得分是群中拥有该标签的用户数,由于一个群可能有多个标签,如图4所示。故可能有多个得分值,这里只保留得分最大的标签和分值,过滤掉“分值/群人数”低于一定阈值的(群,标签);比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
关联(群,标签,标签得分)和(群,成员)得到(用户,标签,标签得分),其中用户的标签得分是用户添加的具有某个标签的群的个数,虽然一个用户可能有多个标签,这里只保留得分值最大的标签,把这个标签赋给群成员,比如,图5中,假设选取标签1作为群二的标签,那么就将标签1作为群用户的标签,即用户3的标签包括有(标签1、标签2和标签3)。保留年龄在17~26岁之间并且标签所在地和常用登录地一致的(用户,标签)作为下一轮迭代的种子用户;比如,图6所示,基于图5的场景,由于用户2的年龄不符合要求,所以可以将用户2去除,保留用户A、用户1和用户3作为下一轮进行迭代的种子用户。
反复执行选取种子用户的操作若干次直到人数基本不再变化为止,保留(用户,标签)数据就得到了用户所在的学校。
另外,上面算法中基于LBS数据和基础信息寻找种子用户,再利用群数据进行标签的扩散和传播,还可以执行以下至少一种处理:
处理一、通过引入建群时的位置信息扩大种子用户的量,从而避免一些学校不存在种子用户,导致最后找不到该校的学生;
处理二、通过LBS数据筛选的种子用户关联QQ圈子中具有大学及以上学历的人进行扩充,避免一些学校的种子用户较少,并且添加的群也少,在群中的占比偏低,导致扩散后的总人数很少;
处理三、通过群标签传播后的结果关联QQ圈子中具有大学及以上学历的人进行压缩删减;避免一些学校的种子用户偏多(存在并非是该校学生的用户),加的群也比较多,在群中的占比偏高,导致扩散后的人数很多。
上述处理二以及处理三可以根据选取的成员用户的数量进行选取处理方式,比如,当成员用户的数量小于数量阈值时,选处理二进行处理,当成员用户的数量不小于数量阈值时,需要对成员用户进行删减,就采用处理三进行处理。
本实施例采用的方案,利用基于位置的服务LBS数据找出在每个大学校园区域内近期活跃的用户作为种子用户;利用QQ用户-群的二部图进行标签传播与过滤,找出概率较高的大学生群,并且将大学标签传播给群成员;在每一轮迭代中,利用用户年龄和圈子数据,过滤掉明显不属于大学生群体的用户,如超龄或者有工作同事圈子的人;一般迭代4~5次就可以完成,然后进行一次修正。
进一步地,基于上述方案,可以对所述目标用户群体进行进一步的处理,比如,可以将在校大学生作为目标用户群体,针对在校大学生进行教育、招聘、电商以及游戏的媒体信息的发送,以提升媒体信息的点击率、下载率等等参数。
另外,本实施例中选取目标用户群体的方式,比如,想要选取具备“在校大学生”这个标签即属性的用户作为目标用户群体,可以在如图7所示的操作界面上进行选择。那么服务器侧会在收到该选择之后,根据标签确定对应的预设目标特征对种子用户进行筛选,进而得到符合要求的目标用户群体。
可见,通过采用上述方案,基于候选用户所使用的服务的数据,选取种子用户,确定获取所述种子用户所归属的至少一个用户群体的成员用户;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;再对所述用户群体的成员用户进行筛选,得到所述目标用户群体。如此,就能够准确的通过分析用户的服务数据获取到对应的种子用户,进而通过种子用户所在的用户群体进一步扩展得到更多的用户作为目标用户,从而提升了选取目标用户群体的精准性,保证了针对目标用户群体执行进一步操作的效果。
实施例四、
本发明实施例提供了一种服务器,如图8所示,包括:
第一选取单元81,用于基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
群信息处理单元82,用于确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
第二选取单元83,用于比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
筛选单元84,用于基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
上述第一选取单元81,用于从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;将预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。比如,图2所示,候选用户可以包含用户A、B、C,经过筛选,得到两个种子用户,用户A、和用户B。
其中,所述至少一个维度包括有以下至少之一:位置信息,指定的一种或多种网络服务;相应的,所述确定所述候选用户在所述至少一个维度使用所述服务的特征,可以为:通过基于位置的服务(LBS)获取到候选用户的位置信息,还可以再附加特征为年龄特征;或者,可以为候选用户所采用的线上服务,比如,下载音乐、在线收听音乐、网上订餐等服务。
优选地,针对不同的目标用户群体可以预设有多种不同的目标特征,当目标用户群体为大学生时,可以对应的目标特征包括有:关注信息点(POI,PointofInterest)的位置;年龄段在指定范围内。比如,POI的位置可以为预设的大学周边的标志性建筑,类似书店、饭店等,年龄段可以为17-24岁之间。另外,如果目标用户群体为音乐爱好者,对应的目标特征可以包括有:获取音乐的线上服务的频率、获取到音乐的类型等。本实施例进一步针对如何更加准确的选取种子用户进行说明:
所述第一选取单元81,用于所述候选用户使用所述服务的特征包括所述用户使用所述服务的地理位置、以及用户在每个所述地理位置使用所述服务的频率;分析所述候选用户使用所述服务的数据,确定所述候选用户在不同地理位置使用所述服务的频率;确定使用所述服务的频率高于频率阈值时所处的地理位置,将所述第理位置与所述目标用户群体的预设地理位置范围进行匹配,匹配成功则将所述候选用户识别为所述种子用户。
也就是说,获取到预设时长内,比如一年之内,用户使用过的服务对应的地理位置,并且分别计算每一个地理位置在其出现过的全部地理位置中的出现频率;选取频率高于频率阈值对应的地理位置作为预设地理位置,那么就将其作为种子用户。进一步地进行解释,可以理解为,用户分别出现在大学、体育馆、商场这些地方,用户总的登录次数为10次,其中,5次登录后确定其登录位置在大学,三次在体育馆,2次在商场,那么可以看出大学为其出现频率最高的地点,将这个用户作为种子用户。
如此,能够通过用户登录的位置信息对得到的种子用户进行进一步的筛选,得到更加准确的种子用户。
进一步举例针对种子用户筛选,以大学生为种子用户进行说明:
用户在包含“大学”的POI周围出现过,并且出现的累计天数不少于阀值天数;
用户到访POI的名称中包含有大学名称并且POI所在城市和大学基础信息中的城市一致;
设用户在某个学校出现的天数是在该校POI出现的总天数之和,针对每个用户找到出现天数最多的高校,如果出现天数大于阈值,认为该用户是相应学校的在校学生;
通过关联用户的基础信息,得到学校所在地和常用登录地一致的用户作为最终的种子用户。
进一步地,第一选取单元81,用于获取所述候选用户的个人数据,得到所述候选用户基于客户端登录以使用所述服务的默认地理位置;将所述候选用户使用所述服务的频率高于频率阈值时所处的地理位置与所述默认地理位置进行匹配;匹配到属于同一地理区域则将所述候选用户识别为所述种子用户。也就是,通过关联用户的基础信息,得到学校所在地和常用登录地一致的用户作为最终的种子用户;如此,不仅能够确定用户为大学生,还能够进一步的认为用户为所要选取的几个大学中的一个大学的学生。
确定获取所述种子用户所归属的至少一个用户群体可以为用户加入的群组,比如QQ群,微信群等。比如,基于图2中选取到的种子用户为用户A和用户B,如3中,得到用户A加入了群一、群二、群三,用户B加入了群一、群三、群四和群五。
群信息处理单元82,用于获取到所述用户群体中的全部成员用户,并且获取到所述全部成员用户的全部属性。其中,所述用户成员具备的属性可以为用户的标签,一个用户可以具备有多个标签,比如,大学、爱好、星座等。如图4所示,以种子用户用户A为例进行描述,用户A加入了群一和群二,分别获得群一和群二中的全部成员用户,群一包括用户1、用户2和用户A,分别获得这三个用户的标签;群二包括用户1、用户A和用户3,分别获得三个用户的标签。
进一步地,所述群信息处理单元82,用于确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;
从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
其中,所述得分可以为逐个统计每一个标签有多少个成员用户在使用。另外,所述选取得分最高的属性作为共有属性,可以为:若当前得分最高的属性有两个或两个以上,那么共有属性可以为两个或两个以上的属性,也可以为从两个或两个以上的属性中随机选取一个作为共有属性。
另外,群信息处理单元82,用于基于每一个属性的得分与成员用户的个数,判断是否保留对应的属性。判断的方法可以有以下几种:
一、判断属性的得分是否高于预设第二门限值,若高于则保留所述属性,否则,删除所述属性;
二、判断属性与成员用户的个数的比值是否高于预设的第三门限值,若高于则保留所述属性,否则删除所述属性。
如图4所示,采用第二种判断方法为例,过滤掉“分值/群人数”低于一定阈值的(群,标签),比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
将所述用户群体的共有属性对应到所述用户群体的每一个成员用户,可以为将共有属性设置给用户群体中全部成员用户作为其属性,基于图4所示的场景,当确定标签1为共有属性时,只有群二中的用户3没有该标签,则将标签1设置为用户3的属性,结果可以如图5所示。
本实施例与实施例一以及实施例二不同之处在于,本实施例会基于选取出来的成员用户进一步进行处理,具体如下所示:
所述筛选单元,用于根据预设的目标共有属性,选取用户群体的共有属性与所述目标共有属性相同的用户群体;分析选取得到的用户群体中所述成员用户的服务数据,选取符合预设条件的成员用户;判断所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值,若所述差值小于预设门限值,则将所述符合预设条件的成员用户识别作为所述目标用户群体;否则,将所述符合预设条件的成员用户替换所述选取的种子用户作为新的所述种子用户,直至所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值小于所述预设门限值。
其中,预设门限值可以为根据实际情况进行设置,比如,可以设置小于二或者小于十。
也就是说,本实施例中提供的方法并不是只执行一次扩散就完成处理,而是等到成员的组成相对稳定的时候才会结束执行。
还是以大学生为目标用户群体为例,基于QQ群的属性即标签进行传播与扩散进行说明:
通过年龄限制对候选用户进行筛选与过滤,要求候选用户的年龄在17到26岁之间,并通过用户基础信息获取用户的最近常用的登录地;
通过群信息筛选出最近四年之内建立的群;
关联群信息,用户基础信息,群成员信息得到年龄在17到26岁之间,加过最近4年之内建立群的(群,用户)对;如图3所示。
关联(用户,群)和(用户,标签)信息得到(群,标签,标签得分),其中标签的得分是群中拥有该标签的用户数,由于一个群可能有多个标签,如图4所示。故可能有多个得分值,这里只保留得分最大的标签和分值,过滤掉“分值/群人数”低于一定阈值的(群,标签);比如,阈值可以设置为2/3,那么图4中的群一的标签1作为群的标签,标签2和标签3则过滤掉;群二可以将标签1以及标签2同时作为标签,过滤掉标签3。
关联(群,标签,标签得分)和(群,成员)得到(用户,标签,标签得分),其中用户的标签得分是用户添加的具有某个标签的群的个数,虽然一个用户可能有多个标签,这里只保留得分值最大的标签,把这个标签赋给群成员,比如,图5中,假设选取标签1作为群二的标签,那么就将标签1作为群用户的标签,即用户3的标签包括有(标签1、标签2和标签3)。保留年龄在17~26岁之间并且标签所在地和常用登录地一致的(用户,标签)作为下一轮迭代的种子用户;比如,图6所示,基于图5的场景,由于用户2的年龄不符合要求,所以可以将用户2去除,保留用户A、用户1和用户3作为下一轮进行迭代的种子用户。
另外,上面算法中基于LBS数据和基础信息寻找种子用户,再利用群数据进行标签的扩散和传播,还可以执行以下至少一种处理:
处理一、通过引入建群时的位置信息扩大种子用户的量,从而避免一些学校不存在种子用户,导致最后找不到该校的学生;
处理二、通过LBS数据筛选的种子用户关联QQ圈子中具有大学及以上学历的人进行扩充,避免一些学校的种子用户较少,并且添加的群也少,在群中的占比偏低,导致扩散后的总人数很少;
处理三、通过群标签传播后的结果关联QQ圈子中具有大学及以上学历的人进行压缩删减;避免一些学校的种子用户偏多(存在并非是该校学生的用户),加的群也比较多,在群中的占比偏高,导致扩散后的人数很多。
上述处理二以及处理三可以根据选取的成员用户的数量进行选取处理方式,比如,当成员用户的数量小于数量阈值时,选处理二进行处理,当成员用户的数量不小于数量阈值时,需要对成员用户进行删减,就采用处理三进行处理。
本实施例采用的方案,利用基于位置的服务LBS数据找出在每个大学校园区域内近期活跃的用户作为种子用户;利用QQ用户-群的二部图进行标签传播与过滤,找出概率较高的大学生群,并且将大学标签传播给群成员;在每一轮迭代中,利用用户年龄和圈子数据,过滤掉明显不属于大学生群体的用户,如超龄或者有工作同事圈子的人;一般迭代4~5次就可以完成,然后进行一次修正。
进一步地,基于上述方案,可以对所述目标用户群体进行进一步的处理,比如,可以将在校大学生作为目标用户群体,针对在校大学生进行教育、招聘、电商以及游戏的媒体信息的发送,以提升媒体信息的点击率、下载率等等参数。
另外,本实施例中选取目标用户群体的方式,比如,想要选取具备“在校大学生”这个标签即属性的用户作为目标用户群体,可以在如图7所示的操作界面上进行选择。那么服务器侧会在收到该选择之后,根据标签确定对应的预设目标特征对种子用户进行筛选,进而得到符合要求的目标用户群体。
可见,通过采用上述方案,基于候选用户所使用的服务的数据,选取种子用户,确定获取所述种子用户所归属的至少一个用户群体的成员用户;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;再对所述用户群体的成员用户进行筛选,得到所述目标用户群体。如此,就能够准确的通过分析用户的服务数据获取到对应的种子用户,进而通过种子用户所在的用户群体进一步扩展得到更多的用户作为目标用户,从而提升了选取目标用户群体的精准性,保证了针对目标用户群体执行进一步操作的效果。
本发明实施例所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、基站、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
本实施例基于上述设备实施例提供一个具体的硬件,如图9所示,所述装置包括处理器92、存储介质94以及至少一个外部通信接口91;所述处理器92、存储介质94以及外部通信接口91均通过总线93连接。所述处理器92可为微处理器、中央处理器、数字信号处理器或可编程逻辑阵列等具有处理功能的电子元器件。所述存储介质中存储有计算机可执行代码。
所述硬件可以为所述服务器。所述处理器执行所述计算机可执行代码时,至少能实现以下功能:基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;对所述用户群体的成员用户进行筛选,得到所述目标用户群体。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (12)
1.一种用户群体定位方法,其特征在于,所述方法包括:
基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
2.根据权利要求1所述的方法,其特征在于,所述基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户,包括:
从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;
将所述预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。
3.根据权利要求2所述的方法,其特征在于,所述将所述预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户,包括:
所述候选用户使用所述服务的特征包括所述用户使用所述服务的地理位置、以及用户在每个所述地理位置使用所述服务的频率;
分析所述候选用户使用所述服务的数据,确定所述候选用户在不同地理位置使用所述服务的频率;
确定使用所述服务的频率高于频率阈值时所处的地理位置,将所述地理位置与所述目标用户群体的预设地理位置范围进行匹配,匹配成功则将所述候选用户确定为所述种子用户。
4.根据权利要求3所述的方法,其特征在于,所述匹配成功则将所述候选用户确定为所述种子用户,还包括:
获取所述候选用户的个人数据,得到所述候选用户基于客户端登录以使用所述服务的默认地理位置;
将所述候选用户使用所述服务的频率高于频率阈值时所处的地理位置与所述默认地理位置进行匹配;
匹配到属于同一地理区域则将所述候选用户识别为所述种子用户。
5.根据权利要求1所述的方法,其特征在于,所述比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,包括:
确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;
从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
6.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体,包括:
根据预设的目标共有属性,选取用户群体的共有属性与所述目标共有属性相同的用户群体;
分析选取得到的所述用户群体中所述成员用户的服务数据,选取符合预设条件的成员用户;
判断所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值,若所述差值小于预设门限值,则将所述符合预设条件的成员用户识别作为所述目标用户群体;否则,
将所述符合预设条件的成员用户替换所述选取的种子用户作为新的所述种子用户,直至所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值小于所述预设门限值。
7.一种服务器,其特征在于,包括:
第一选取单元,用于基于候选用户所使用的服务的数据,选取符合预设目标特征的至少一个所述候选用户为种子用户;
群信息处理单元,用于确定所述种子用户所归属的至少一个用户群体的成员用户、以及所述成员用户所具有的至少一个属性;
第二选取单元,用于比较基于所述用户群体中每个所述成员用户具有的至少一个属性,确定所述用户群体的共有属性,将所述用户群体的共有属性对应到所述用户群体的每一个成员用户;
筛选单元,用于基于所述至少一个用户群体对应的共有属性,选取具备目标共有属性的用户群体,对具备目标共有属性的所述用户群体的成员用户进行筛选,得到所述目标用户群体。
8.根据权利要求7所述的服务器,其特征在于,
所述第一选取单元,用于从至少一个维度分析所述候选用户所使用的服务的数据,确定所述候选用户在所述至少一个维度使用所述服务的特征;将所述预设目标特征与所述候选用户的至少一个维度的特征进行匹配,筛选出至少一个所述候选用户为所述种子用户。
9.根据权利要求8所述的服务器,其特征在于,
所述第一选取单元,用于所述候选用户使用所述服务的特征包括所述用户使用所述服务的地理位置、以及用户在每个所述地理位置使用所述服务的频率;分析所述候选用户使用所述服务的数据,确定所述候选用户在不同地理位置使用所述服务的频率;确定使用所述服务的频率高于频率阈值时所处的地理位置,将所述地理位置与所述目标用户群体的预设地理位置范围进行匹配,匹配成功则将所述候选用户确定为所述种子用户。
10.根据权利要求9所述的服务器,其特征在于,
所述第一选取单元,用于获取所述候选用户的个人数据,得到所述候选用户基于客户端登录以使用所述服务的默认地理位置;将所述候选用户使用所述服务的频率高于频率阈值时所处的地理位置与所述默认地理位置进行匹配;匹配到属于同一地理区域则将所述候选用户识别为所述种子用户。
11.根据权利要求7所述的服务器,其特征在于,
所述群信息处理单元,用于确定所述用户群体中用户成员具备的至少一个属性在用户群体中的得分;其中,所述属性在用户群体中的得分用于表征所述用户群体中具备所述属性的成员用户的数量;从至少一个属性中选取得分最高的属性作为所述用户群体的共有属性。
12.根据权利要求7所述的服务器,其特征在于,
所述筛选单元,用于根据预设的目标共有属性,选取用户群体的共有属性与所述目标共有属性相同的用户群体;分析选取得到的所述用户群体中所述成员用户的服务数据,选取符合预设条件的成员用户;判断所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值,若所述差值小于预设门限值,则将所述符合预设条件的成员用户识别作为所述目标用户群体;否则,将所述符合预设条件的成员用户替换所述选取的种子用户作为新的所述种子用户,直至所述符合预设条件的成员用户的数量与所述选取的种子用户的数量之间的差值小于所述预设门限值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510989673.9A CN105554140B (zh) | 2015-12-24 | 2015-12-24 | 一种用户群体定位方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510989673.9A CN105554140B (zh) | 2015-12-24 | 2015-12-24 | 一种用户群体定位方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105554140A true CN105554140A (zh) | 2016-05-04 |
CN105554140B CN105554140B (zh) | 2020-01-10 |
Family
ID=55833072
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510989673.9A Active CN105554140B (zh) | 2015-12-24 | 2015-12-24 | 一种用户群体定位方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105554140B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204163A (zh) * | 2016-07-29 | 2016-12-07 | 北京京东尚科信息技术有限公司 | 一种用户属性特征的确定方法和装置 |
CN108024203A (zh) * | 2016-10-31 | 2018-05-11 | 腾讯科技(北京)有限公司 | 一种目标对象选取方法及服务器 |
CN111292107A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 用户数据处理方法、装置、电子设备及存储介质 |
CN113536848A (zh) * | 2020-04-17 | 2021-10-22 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065481A1 (en) * | 2006-09-13 | 2008-03-13 | Microsoft Corporation | User-associated, interactive advertising monetization |
CN101510856A (zh) * | 2009-03-12 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 一种sns网络中成员关系圈的提取方法和装置 |
CN101685458A (zh) * | 2008-09-27 | 2010-03-31 | 华为技术有限公司 | 一种基于协同过滤的推荐方法和系统 |
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN103632294A (zh) * | 2013-12-20 | 2014-03-12 | 互动通天图信息技术有限公司 | 基于媒体和第三方数据平台的用户数据整合方法 |
CN103778151A (zh) * | 2012-10-23 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 一种识别特征群体的方法及装置和搜索方法及装置 |
CN104573096A (zh) * | 2015-01-30 | 2015-04-29 | 湖南识微科技有限公司 | 一种挖掘目标微博用户的方法 |
CN105095264A (zh) * | 2014-05-08 | 2015-11-25 | 中国移动通信集团甘肃有限公司 | 一种关系圈的确定方法及装置 |
-
2015
- 2015-12-24 CN CN201510989673.9A patent/CN105554140B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080065481A1 (en) * | 2006-09-13 | 2008-03-13 | Microsoft Corporation | User-associated, interactive advertising monetization |
CN101685458A (zh) * | 2008-09-27 | 2010-03-31 | 华为技术有限公司 | 一种基于协同过滤的推荐方法和系统 |
CN101510856A (zh) * | 2009-03-12 | 2009-08-19 | 腾讯科技(深圳)有限公司 | 一种sns网络中成员关系圈的提取方法和装置 |
CN103778151A (zh) * | 2012-10-23 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 一种识别特征群体的方法及装置和搜索方法及装置 |
CN103024017A (zh) * | 2012-12-04 | 2013-04-03 | 武汉大学 | 一种社交网络重要目标及社区群体识别方法 |
CN103632294A (zh) * | 2013-12-20 | 2014-03-12 | 互动通天图信息技术有限公司 | 基于媒体和第三方数据平台的用户数据整合方法 |
CN105095264A (zh) * | 2014-05-08 | 2015-11-25 | 中国移动通信集团甘肃有限公司 | 一种关系圈的确定方法及装置 |
CN104573096A (zh) * | 2015-01-30 | 2015-04-29 | 湖南识微科技有限公司 | 一种挖掘目标微博用户的方法 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204163A (zh) * | 2016-07-29 | 2016-12-07 | 北京京东尚科信息技术有限公司 | 一种用户属性特征的确定方法和装置 |
CN108024203A (zh) * | 2016-10-31 | 2018-05-11 | 腾讯科技(北京)有限公司 | 一种目标对象选取方法及服务器 |
US10951574B2 (en) | 2016-10-31 | 2021-03-16 | Tencent Technology (Shenzhen) Company Limited | Target object selection method, server, and computer storage medium |
CN111292107A (zh) * | 2018-12-06 | 2020-06-16 | 北京嘀嘀无限科技发展有限公司 | 用户数据处理方法、装置、电子设备及存储介质 |
CN113536848A (zh) * | 2020-04-17 | 2021-10-22 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
CN113536848B (zh) * | 2020-04-17 | 2024-03-19 | 中国移动通信集团广东有限公司 | 一种数据处理方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN105554140B (zh) | 2020-01-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104186016B (zh) | 定位移动设备 | |
CN109918894B (zh) | 边缘计算网络视频处理中基于声誉的信任评估方法 | |
CN102104635B (zh) | 一种更新互联网协议ip地址库的方法和装置 | |
CN105554140A (zh) | 一种用户群体定位方法及服务器 | |
CN106792992B (zh) | 一种用于提供无线接入点信息的方法与设备 | |
CN107894952A (zh) | 接口测试用例的生成方法、装置、设备及可读存储介质 | |
CN110071915B (zh) | 一种身份核实产品推送方法、装置、设备及系统架构 | |
WO2014186074A1 (en) | Generating a playlist based on content meta data and user parameters | |
CN105630977A (zh) | 应用程序推荐方法、装置及系统 | |
CN102270199B (zh) | 一种信息的筛选方法和设备 | |
CN106777382A (zh) | 社交朋友推荐方法、装置和服务器 | |
CN110300127A (zh) | 一种基于深度学习的网络入侵检测方法、装置以及设备 | |
CN107978189A (zh) | 一种习题的智能推送方法、系统及终端设备 | |
CN105468653A (zh) | 基于社交应用软件的数据推荐方法和装置 | |
CN103701774A (zh) | 一种登录方法及装置 | |
CN108959469A (zh) | 阅读管理方法、装置、计算机设备及存储介质 | |
CN109522895A (zh) | 兴趣点位置校验方法、装置、服务器和计算机可读介质 | |
CN105991583A (zh) | 一种游戏应用推荐方法、应用服务器、终端及系统 | |
CN104731937B (zh) | 用户行为数据的处理方法及装置 | |
CN103617221B (zh) | 软件推荐方法及系统 | |
CN109918048B (zh) | 目标对象提取方法、装置、系统及计算机可读存储介质 | |
CN104166659B (zh) | 一种地图数据判重的方法及系统 | |
CN108093303A (zh) | 一种视频推送方法及装置 | |
CN104796440A (zh) | 用于发送定位数据的方法和装置 | |
US20140164270A1 (en) | Method, system and computer readable medium for recommending medium users |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |