CN106611350A - 挖掘潜在用户源的方法和装置 - Google Patents

挖掘潜在用户源的方法和装置 Download PDF

Info

Publication number
CN106611350A
CN106611350A CN201510703241.7A CN201510703241A CN106611350A CN 106611350 A CN106611350 A CN 106611350A CN 201510703241 A CN201510703241 A CN 201510703241A CN 106611350 A CN106611350 A CN 106611350A
Authority
CN
China
Prior art keywords
account
social networks
account set
user
social
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510703241.7A
Other languages
English (en)
Other versions
CN106611350B (zh
Inventor
戢洋
杨志军
庞琳
甘云锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510703241.7A priority Critical patent/CN106611350B/zh
Publication of CN106611350A publication Critical patent/CN106611350A/zh
Application granted granted Critical
Publication of CN106611350B publication Critical patent/CN106611350B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/04Real-time or near real-time messaging, e.g. instant messaging [IM]
    • H04L51/046Interoperability with other network applications or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种挖掘潜在用户源的方法和装置,所述方法包括:根据预设特征从第一用户账号集合筛选出第二用户账号集合;根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合;从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。由筛选出的社交网络账号发布一些相关产品的信息,能够被更多相关领域内的社交网络用户看到,从而增加了线上广告投放的有效目标人群。

Description

挖掘潜在用户源的方法和装置
技术领域
本申请属于互联网领域,具体地说,涉及一种挖掘潜在用户源的方法和装置。
背景技术
目前,游戏行业通常是通过线上或者线下广告投放形式来拉拢新用户,促进业务成长的。但是由于技术和数据能力的问题,目前主要还是渠道直接投放的方式,这个方法最大的问题就是不精准。例如,某个渠道有100万活跃用户,那么游戏广告就是直接投放这100万人,但是其中有多少人会对这个游戏感兴趣,会注册并玩这个游戏,没有人会知道。
目前,基于人口学基本属性来做人群挖掘和规模放大时,通用特征比较泛泛,共同重合度很高。很难有明显的特征挖掘结果,从而不能够形成有效种子人群,没有有效种子人群,那么就更难作出放大人群了。
发明内容
有鉴于此,本申请提供了一种挖掘潜在用户源的方法和装置,以解决现有技术中线上广告投放缺乏有效的目标人群的技术问题。
为了解决上述技术问题,本申请公开了一种挖掘潜在用户源的方法,所述方法包括:根据预设特征从第一用户账号集合筛选出第二用户账号集合;根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合;从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
在一个实施例中,所述根据预设特征从第一用户账号集合筛选出第二用户账号集合包括:根据输入的用户信息确定对应的所述第一用户账号集合;根据预设特征从第一用户账号集合筛选出第二用户账号集合。
在一个实施例中,所述方法还包括:判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;当所述第三社交网络账号集合内的账号数量大于预设阈值时,调整所述账号活跃度的预设条件以减少所述第三社交网络账号集合内的账号数量。
在一个实施例中,所述方法还包括:判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;当所述第三社交网络账号集合内的账号数量大于预设阈值时,根据所述社交网络的关系数据,获取所述第三社交网络账号集合所关注的第四社交网络账号集合;从所述第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
在一个实施例中,所述预设特征包括:性别,地域,年龄,消费层级等特征信息中一个或多个。
为了解决上述技术问题,本申请还公开了一种挖掘潜在用户源的装置,所述装置包括:第一筛选模块,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合;第一获取模块,用于根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;第二获取模块,用于根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合,第二筛选模块,用于从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
在一个实施例中,所述第一筛选模块包括:确定子模块,用于根据输入的用户信息确定对应的所述第一用户账号集合;筛选子模块,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合。
在一个实施例中,所述装置还包括:第一判断模块,用于判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;调整模块,用于当所述第三社交网络账号集合内的账号数量大于预设阈值时,调整所述账号活跃度的预设条件以减少所述第三社交网络账号集合内的账号数量。
在一个实施例中,所述装置还包括:第二判断模块,用于判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;第三获取模块,用于当所述第三社交网络账号集合内的账号数量大于预设阈值时,根据所述社交网络的关系数据,获取所述第三社交网络账号集合所关注的第四社交网络账号集合;第三筛选模块,用于从所述第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
为了解决上述技术问题,本申请还公开了一种挖掘潜在用户源的装置,所述装置包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:根据预设特征从第一用户账号集合筛选出第二用户账号集合;根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合,从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
与现有技术相比,本申请可以获得包括以下技术效果:筛选出的第三社交网络账号集合内的社交网络账号,通常是相关领域内较为知名的社交网络账号,需要投放线上广告的商家可以考虑与筛选出的社交网络账号开展合作,由这些社交网络账号发布一些相关产品的信息,能够被更多相关领域内的社交网络用户看到,从而增加了线上广告投放的有效目标人群。
当然,实施本申请的任一产品必不一定需要同时达到以上所述的所有技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例提供的一种挖掘潜在用户源的方法的流程图;
图2是本申请实施例提供的一种挖掘潜在用户源的方法的流程图;
图3是本申请实施例提供的一种挖掘潜在用户源的方法的流程图;
图4是本申请实施例提供的一种挖掘潜在用户源的方法的流程图;
图5是本申请实施例提供的一种挖掘潜在用户源的装置的框图。
具体实施方式
以下将配合附图及实施例来详细说明本申请的实施方式,藉此对本申请如何应用技术手段来解决技术问题并达成技术功效的实现过程能充分理解并据以实施。
本申请实施例依据后台的用户数据建立用户帐号与社交网络账号的对应关系,根据预设特征筛选出种子人群并获取种子人群所对应社交网络账号;从这些社交网络账号所关注的其他社交网络账号中筛选出活跃度达到预设条件的社交网络账号,筛选出的社交网络账号在其所专注的领域内通常具有较高的知名度,可以将这些筛选出的社交网络账号做为发现潜在用户的源头,通常这些筛选出的社交网络账号投放相应的信息能够更准确的被该领域内用户所看到,从而增加线上广告投放的有效目标人群。
图1是本申请实施例通过的一种挖掘潜在用户源的方法的流程图,适用于服务器设备,如图1所示,该方法包括以下步骤。
在步骤S101中,根据预设特征从第一用户账号集合筛选出第二用户账号集合。
用户账号集合包括一个或多个用户账号,每个用户账号对应的用户账号信息包括但不限于以下信息:用户ID、电子邮箱、手机号码、IP地址、收获地址、姓名、性别、年龄、消费记录等。
预设特征用于与用户账号信息匹配以筛选用户账号,包括性别、年龄、地域、消费层级等特征信息。
第一用户账号集合是已注册的所有用户账号所组成的集合。在一个实施例中,第一用户账号集合还可以是根据输入的用户信息确定的用户账号的集合,例如,输入某个网络游戏当前已注册的用户信息,与用户账号信息匹配,由匹配出的所有用户账号组成第一用户账号集合。
在步骤S102中,根据用户账号与社交网络账号的对应关系,获取第二用户账号集合所对应的第一社交网络账号集合。
服务器设备利用用户账号信息与社交网络账号信息将用户账号与社交网络账号打通。利用社交网络账号的注册邮箱、手机号码、IP地址、设备标识等信息匹配用户账号信息,从而建立用户账号与社交网络账号的对应关系。根据这一对应关系获取第二用户账号集合内的每个用户账号所对应的社交网络账号并组成第一社交网络账号集合。
在步骤S103中,根据社交网络的关系数据,获取第一社交网络账号集合所关注的第二社交网络账号集合。
在社交网络的关系数据中,每个社交网络账号通常都关注或者跟随(Follow)其他社交网络账号。那么,根据社交网络的关系数据获取第一社交网络账号集合内的每个社交网络账号所关注或跟随的其他社交网络账号,将这些关注或跟随社交网络账号组合成为第二社交网络账号集合。
在步骤S104中,从第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
社交网络账号活跃度的预设条件包括但不限于:粉丝或者跟随者(Follower)总数,发布动态信息的总数,动态信息发布频率等。
根据以上预设条件从第二社交网络账号集合筛选出符合的社交网络网络账号并组成第三社交网络账号集合。例如,在筛选时账号活跃度的预设条件粉丝或者跟随者总数N≥100000,发布动态信息的总数M≥5000,动态信息发布频率P≥5次/天。
筛选出的第三社交网络账号集合内的社交网络账号,通常是相关领域内较为知名的社交网络账号,需要投放线上广告的商家可以考虑与筛选出的社交网络账号开展合作,由这些社交网络账号发布一些相关产品的信息,能够被更多相关领域内的社交网络用户看到,从而增加了线上广告投放的有效目标人群。
有时,筛选出的第三社交网络账号集合内的社交网络账号数量会比较多,与商家的实际需求或者投入成本不相符,因此需要进一步缩小范围,减少筛选到的社交网络账号数量。此时,如图2所示,可进一步实施以下步骤来实现。
在步骤S105中,判断第三社交网络账号集合内的账号数量是否大于预设阈值。当第三社交网络账号集合内的账号数量大于预设阈值时,执行步骤S106;当第三社交网络账号集合内的账号数量小于或等于预设阈值时,则结束。
在步骤S106中,调整账号活跃度的预设条件以减少第三社交网络账号集合内的账号数量。
将账号活跃度的预设条件调整得更加苛刻,以减少第三社交网络账号的数量。例如,账号活跃度的预设条件为:粉丝或者跟随者总数N≥100000,发布动态信息的总数M≥5000,动态信息发布频率P≥5次/天,筛选出100个社交网络账号,而商家需要筛选出社交网络账号数量在10个以内。那么,将账号活跃度的预设条件调整为粉丝或者跟随者总数N≥1000000,发布动态信息的总数M≥10000,动态信息发布频率P≥8次/天,通过设置更加苛刻的条件以减少筛选出的社交网咯账号数量。
在一个实施例中,如图3所示,还可以进一步实施以下步骤来达到减少筛选出的社交网络账号数量的目的。
在步骤S107中,判断第三社交网络账号集合内的账号数量是否大于预设阈值。当第三社交网络账号集合内的账号数量大于预设阈值时,执行步骤S108;当第三社交网络账号集合内的账号数量小于或等于预设阈值时,则结束。
在步骤S108中,根据社交网络的关系数据,获取第三社交网络账号集合所关注的第四社交网络账号集合。
在步骤S109中,从第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
步骤S104筛选出的第三社交网络账号集合可以被称为1度社交关系人群,而当这一人群的数量较多并不满足商家的实际需求时,由第三社交网络账号集合内的社交网络账号所关注的社交网络账号组成第四社交网络账号集合。从第四社交网络账号集合中进一步筛选出符合账号活跃度的预设条件的第五社交网络账号集合。筛选出的第五社交网络账号集合可以被称为2度社交关系人群,如果仍然不满足商家的实际需求,可以进一步获取N度社交关系人群,直到得到满足实际需求的社交网络账号个数。
而随着获取N度社交关系人群的迭代次数的增加,获得的社交网络账号集合与需要合作发布的内容或者投放的线上广告之间的相关性也会逐渐降低,因此一味的增加获取N度社交关系人群的迭代次数,得到的社交网络账号集合也许不适合合作发布信息或者投放线上广告。本申请的发明人发现,通过两次迭代获得的2度社交关系人群中,筛选出的社交网络账号较为理想,人群数量也已经比较接近商家的实际需求,如果人群数量仍然较多,可以通过调整账号活跃度预设条件的方法来缩小人群数量,比再进行一次迭代而获得3度社交关系人群的效果更好。
下面通过实际应用场景对本申请实施例做进一步说明。
通过电子商务(以下简称“电商”)网站B的用户账号的购物行为记录来找到喜欢网络游戏A的用户账号,从而进一步通过对应的微博账号筛选出账号活跃度较高的可以考虑与之合作投放相关游戏广告的微博账号。该挖掘潜在用户源的方法的流程图如图4所示,该方法适用于服务器设备,包括以下步骤。
在步骤S201中,从电商网站用户账号集合中筛选出购物行为记录符合预设特征的电商网站用户账号。
与网络游戏A相关的购物行为记录包括充值游戏时间、购买游戏道具以及购买该游戏的周边产品等。根据上述购物行为记录即可将网络游戏A做为该用户帐号的特征,以网络游戏A做为预设特征对电商网站用户账号进行筛选,例如,where shopping=网络游戏A。从而筛选出属于网络游戏A的“玩家”以及喜欢网络游戏A的用户在电商网站B的用户账号。
在步骤S202中,根据电商网站用户账号与微博账号的对应关系,获取筛选出的用户账号所对应的第一微博账号集合。
服务器设备将电商网站B的用户账号与微博的用户账号打通,建立两者之间的对应关系。例如,电商网站B的用户账号“abcd123”的用户信息中的注册邮箱与微博账号“张三”的注册邮箱相同,则可以认为这两账号由同一个网络用户在使用,建立用户账号“abcd123”与微博账号“123”之间的对应关系。此外,还可以通过手机号码、IP地址、设备标识等信息建立上述对应关系。当然也会存在部分用户账号没有对应的微博账号的情况,这时,对这一部分的用户帐号不予考虑,只保留能够获取到的微博帐号并组成第一微博帐号集合。
在步骤S203中,根据微博关系数据,获取第一微博账号集合所关注的第二微博账号集合。
例如,获取的第一微博帐号集合包括“张三”、“李四”、“王五”等微博帐号。每个微博帐号可能关注了一个或多个其他微博帐号,例如:
“张三”关注了“李四”、“BCD”、“杨AB”等;
“李四”关注了“王NM”、“张QD”、“老王”等;
“王五”关注了“张三”、“李AD”、“王NM”等。
那么,这些被第一微博帐号集合所关注的微博帐号就构成了第二微博帐号集合,包括:“李四”、“BCD”、“杨AB”、“王NM”、“张QD”、“老王”、张三”、“李AD”等。
“张三”、“李四”、“王五”做为筛选出的网络游戏A的玩家或者喜欢网络游戏A的用户,其关注的微博帐号也很有可能与网络游戏A相关,例如网络游戏A的知名玩家、职业选手以及活动组织方的微博帐号。此时,进一步从他们所关注的微博帐号中筛选出活跃度较高的微博帐号。
在步骤S204中,从第二微博账号集合筛选出账号活跃度达到预设条件的第三微博账号集合。
从上述第二微博帐号集合中筛选出粉丝数N≥50000,微博发布数M≥3000,微博发布频率P≥5次/天的微博帐号。例如:
WHERE followers_count≥50000,
AND statuses_count≥3000,
AND statuses_freq≥5。
此外,还可以通过微博的评论次数、被点赞(喜欢)次数等数据对微博帐号进行筛选。
例如,经过筛选后满足上述帐号活跃度预设条件的微博帐号包括:李四”、“BCD”、“杨AB”、“王NM”、“张QD”、“老王”。那么这些微博帐号即组成第三微博帐号集合,极有可能与网络游戏A相关。此时商家可以考虑与第三微博帐号集合内的微博帐号所有者开展合作,来发布消息或者投放广告,那么发布的消息或投放的广告就极有可能被网络游戏A的玩家“张三”、“李四”、“王五”所看到,从而增强了线上广告投放的目的性,增加了有效了目标人群。
而如果商家认为筛选出的微博帐号数量过多,则可以对第三微博帐号集合内的微博帐号数量进行设置,当筛选出微博帐号数量超过设置的阈值时,则调整帐号活跃度预设条件。例如,商家希望筛选出三个微博帐号并开展合作,上例筛选出的第三微博帐号集合包括六个微博帐号,已超过了预设数量。此时,对帐号活跃度预设条件进行修改,修改为更加苛刻的预设条件,例如粉丝数N≥100000,微博发布数M≥5000,微博发布频率P≥8次/天,以减少筛选出微博帐号数量,直到筛选出的微博帐号数量在三个或三个以内。
本实施例中获得的第三微博帐号集合可以被称为1度社交关注人群,如果1度社交关系人群的数量不满足商家的实际需求,则在另一个实施例中,还可以基于第三微博帐号集合来获取2度社交关系人群,其方法与获取1度社交关系人群类似。
首先获取“李四”、“BCD”、“杨AB”、“王NM”、“张QD”、“老王”等微博帐号所关注的微博帐号,组成第四微博帐号集合。例如,第四微博帐号集合包括“李四”、“BCD”、“杨AB”、“老王”、“DTM”、“小WW”、“张DE”、“刘JH”、“郭DD”,“PPQ”等微博帐号。再根据帐号活跃度预设条件对第四微博帐号集合内的微博帐号进行筛选,得到第五微博帐号集合,第五微博帐号集合即为2度社交关系人群。例如,筛选出的第五微博帐号包括“BCD”、“杨AB”、“老王”、“DTM”。
如果2度社交关系人群的数量仍不符合商家的需求,此时可以继续筛选出3度、4度……N度社交关系人群,直至人群的数量符合需求。但每增加一度社交关系而获得的人群,与网络游戏A的关联性会随之降低,因此经过多次筛选获得的N度社交关系人群的效果不一定好,在获得2度社交关系人群后,如果人群规模仍不符合需求,优选采用调整帐号活跃度预设条件的方法减少筛选到的微博帐号的数量,要比继续获取3度社交关系人群的效果更好。
本实施例中,从电商网站B的用户帐号集合中根据购物行为记录筛选出与网络游戏A相关的用户帐号。在另一个实施例中,还可以获取网路游戏A上线后已注册的游戏帐号。根据游戏帐号的注册信息将游戏帐号与电商网站B的用户帐号以及微博帐号全部打通,获得已注册的游戏帐号所对应的微博帐号。或者先根据游戏帐号对应的电商网站用户帐号,再将对应的电商网站用户帐号根据预设特征进行一次筛选,例如,针对玩家性别、地域等特征进行一次筛选,获得筛选后的用户帐号所对应的微博帐号。然后,利用微博关系数据筛选出社交关系人群,从社交关系人群中筛选出帐号活跃度较高的微博帐号,从而寻找到网咯游戏A的玩家通常比较关注知名微博帐号,与这些微博帐号的所有者合作发布游戏信息或者投放游戏广告就能够被较多的游戏玩家看到,增加广告投放的有效目标人群。
在本申请的上述实施例中,由于需要对电商网站、社交网络甚至网络游戏的用户数据进行分析处理,因此本申请实施例所采用的服务器设备需具备TB/PB级别的海量数据处理能力。本申请实施例优选采用开放数据处理服务(Open Data Processing Service,ODPS)平台,提供针对TB/PB级数据、实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。电商网站、社交网络以及网络游戏相关的用户数据可以SQL数据库的方式保存在ODPS平台,本申请实施例提供的挖掘潜在用户源的方法可通过Java或者Python编程语言做为可执行程序由有相关数据挖掘需求的用户进行调用。
以下为本申请的装置实施例,用以执行本申请实施例的上述方法。
如图5所示,本申请实施例提供了一种挖掘潜在用户源的装置,该装置包括:
第一筛选模块30,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合;
第一获取模块31,用于根据用户账号与社交网络账号的对应关系,获取第二用户账号集合所对应的第一社交网络账号集合;
第二获取模块32,用于根据社交网络的关系数据,获取第一社交网络账号集合所关注的第二社交网络账号集合,
第二筛选模块33,用于从第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
在一个实施例中,该第一筛选模块30进一步包括:
确定子模块,用于根据输入的用户信息确定对应的第一用户账号集合;
筛选子模块,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合。
在一个实施例中,该装置进一步包括:
第一判断模块,用于判断第三社交网络账号集合内的账号数量是否大于预设阈值;
调整模块,用于当第三社交网络账号集合内的账号数量大于预设阈值时,调整账号活跃度的预设条件以减少第三社交网络账号集合内的账号数量。
在一个实施例中,该装置进一步包括:
第二判断模块,用于判断第三社交网络账号集合内的账号数量是否大于预设阈值;
第三获取模块,用于当第三社交网络账号集合内的账号数量大于预设阈值时,根据社交网络的关系数据,获取第三社交网络账号集合所关注的第四社交网络账号集合;
第三筛选模块,用于从第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
本实施例中,选出的第三社交网络账号集合内的社交网络账号,通常是相关领域内较为知名的社交网络账号,需要投放线上广告的商家可以考虑与筛选出的社交网络账号开展合作,由这些社交网络账号发布一些相关产品的信息,能够被更多相关领域内的社交网络用户看到,从而增加了线上广告投放的有效目标人群。
本申请实施例还可以通过硬件处理器(hardware processor)来实现上述各个功能模块。本申请实施例还提供了一种挖掘潜在用户源的装置,该装置包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据预设特征从第一用户账号集合筛选出第二用户账号集合;根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合,从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
在一个实施例中,所述根据预设特征从第一用户账号集合筛选出第二用户账号集合包括:
根据输入的用户信息确定对应的所述第一用户账号集合;根据预设特征从第一用户账号集合筛选出第二用户账号集合。
在一个实施例中,所述处理器进一步被配置为:
判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;当所述第三社交网络账号集合内的账号数量大于预设阈值时,调整所述账号活跃度的预设条件以减少所述第三社交网络账号集合内的账号数量。
在一个实施例中,所述处理器进一步被配置为:
判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;当所述第三社交网络账号集合内的账号数量大于预设阈值时,根据所述社交网络的关系数据,获取所述第三社交网络账号集合所关注的第四社交网络账号集合;从所述第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
如在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可理解,硬件制造商可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名称的差异来作为区分组件的方式,而是以组件在功能上的差异来作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”为一开放式用语,故应解释成“包含但不限定于”。“大致”是指在可接收的误差范围内,本领域技术人员能够在一定误差范围内解决所述技术问题,基本达到所述技术效果。此外,“耦接”一词在此包含任何直接及间接的电性耦接手段。因此,若文中描述一第一装置耦接于一第二装置,则代表所述第一装置可直接电性耦接于所述第二装置,或通过其他装置或耦接手段间接地电性耦接至所述第二装置。说明书后续描述为实施本申请的较佳实施方式,然所述描述乃以说明本申请的一般原则为目的,并非用以限定本申请的范围。本申请的保护范围当视所附权利要求所界定者为准。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。
上述说明示出并描述了本申请的若干优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (10)

1.一种挖掘潜在用户源的方法,其特征在于,所述方法包括:
根据预设特征从第一用户账号集合筛选出第二用户账号集合;
根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;
根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合;
从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
2.如权利要求1所述的方法,其特征在于,所述根据预设特征从第一用户账号集合筛选出第二用户账号集合包括:
根据输入的用户信息确定对应的所述第一用户账号集合;
根据预设特征从第一用户账号集合筛选出第二用户账号集合。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;
当所述第三社交网络账号集合内的账号数量大于预设阈值时,调整所述账号活跃度的预设条件以减少所述第三社交网络账号集合内的账号数量。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;
当所述第三社交网络账号集合内的账号数量大于预设阈值时,根据所述社交网络的关系数据,获取所述第三社交网络账号集合所关注的第四社交网络账号集合;
从所述第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
5.如权利要求1所述的方法,其特征在于,所述预设特征包括:性别,地域,年龄,消费层级等特征信息中一个或多个。
6.一种挖掘潜在用户源的装置,其特征在于,所述装置包括:
第一筛选模块,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合;
第一获取模块,用于根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;
第二获取模块,用于根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合;
第二筛选模块,用于从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
7.如权利要求6所述的装置,其特征在于,所述第一筛选模块包括:
确定子模块,用于根据输入的用户信息确定对应的所述第一用户账号集合;
筛选子模块,用于根据预设特征从第一用户账号集合筛选出第二用户账号集合。
8.如权利要求6所述的装置,其特征在于,所述装置还包括:
第一判断模块,用于判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;
调整模块,用于当所述第三社交网络账号集合内的账号数量大于预设阈值时,调整所述账号活跃度的预设条件以减少所述第三社交网络账号集合内的账号数量。
9.如权利要求6所述的装置,其特征在于,所述装置还包括:
第二判断模块,用于判断所述第三社交网络账号集合内的账号数量是否大于预设阈值;
第三获取模块,用于当所述第三社交网络账号集合内的账号数量大于预设阈值时,根据所述社交网络的关系数据,获取所述第三社交网络账号集合所关注的第四社交网络账号集合;
第三筛选模块,用于从所述第四社交网络账号集合筛选出账号活跃度达到预设条件的第五社交网络账号集合。
10.一种挖掘潜在用户源的装置,其特征在于,所述装置包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据预设特征从第一用户账号集合筛选出第二用户账号集合;
根据所述用户账号与社交网络账号的对应关系,获取所述第二用户账号集合所对应的第一社交网络账号集合;
根据所述社交网络的关系数据,获取所述第一社交网络账号集合所关注的第二社交网络账号集合,
从所述第二社交网络账号集合筛选出账号活跃度达到预设条件的第三社交网络账号集合。
CN201510703241.7A 2015-10-26 2015-10-26 挖掘潜在用户源的方法和装置 Active CN106611350B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510703241.7A CN106611350B (zh) 2015-10-26 2015-10-26 挖掘潜在用户源的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510703241.7A CN106611350B (zh) 2015-10-26 2015-10-26 挖掘潜在用户源的方法和装置

Publications (2)

Publication Number Publication Date
CN106611350A true CN106611350A (zh) 2017-05-03
CN106611350B CN106611350B (zh) 2020-06-05

Family

ID=58613911

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510703241.7A Active CN106611350B (zh) 2015-10-26 2015-10-26 挖掘潜在用户源的方法和装置

Country Status (1)

Country Link
CN (1) CN106611350B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109731341A (zh) * 2018-12-28 2019-05-10 广州华多网络科技有限公司 一种关联账户的拆分方法、装置及设备
CN110213216A (zh) * 2018-08-22 2019-09-06 腾讯科技(北京)有限公司 确定不同账号集合中相同账号的方法、装置及存储介质
CN110503467A (zh) * 2019-08-15 2019-11-26 深圳市云积分科技有限公司 一种跨平台的消费者人群获取方法及装置
CN110851485A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 社交关系的挖掘方法及装置、计算机设备与可读介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140506A1 (en) * 2006-12-08 2008-06-12 The Procter & Gamble Corporation Systems and methods for the identification, recruitment, and enrollment of influential members of social groups
CN101505311A (zh) * 2009-03-18 2009-08-12 腾讯科技(深圳)有限公司 一种基于社会化网络的信息传播方法及系统
CN103514204A (zh) * 2012-06-27 2014-01-15 华为技术有限公司 信息推荐方法和装置
CN103593342A (zh) * 2012-08-13 2014-02-19 腾讯科技(深圳)有限公司 基于单向用户关系的专家挖掘方法及挖掘系统
CN103761246A (zh) * 2013-12-19 2014-04-30 国家计算机网络与信息安全管理中心 一种基于链接网络的用户领域识别方法及其装置
CN104428805A (zh) * 2012-07-13 2015-03-18 脸谱公司 强化搜索的连接目标锁定

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080140506A1 (en) * 2006-12-08 2008-06-12 The Procter & Gamble Corporation Systems and methods for the identification, recruitment, and enrollment of influential members of social groups
CN101505311A (zh) * 2009-03-18 2009-08-12 腾讯科技(深圳)有限公司 一种基于社会化网络的信息传播方法及系统
CN103514204A (zh) * 2012-06-27 2014-01-15 华为技术有限公司 信息推荐方法和装置
CN104428805A (zh) * 2012-07-13 2015-03-18 脸谱公司 强化搜索的连接目标锁定
CN103593342A (zh) * 2012-08-13 2014-02-19 腾讯科技(深圳)有限公司 基于单向用户关系的专家挖掘方法及挖掘系统
CN103761246A (zh) * 2013-12-19 2014-04-30 国家计算机网络与信息安全管理中心 一种基于链接网络的用户领域识别方法及其装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851485A (zh) * 2018-07-25 2020-02-28 百度在线网络技术(北京)有限公司 社交关系的挖掘方法及装置、计算机设备与可读介质
CN110851485B (zh) * 2018-07-25 2022-07-22 百度在线网络技术(北京)有限公司 社交关系的挖掘方法及装置、计算机设备与可读介质
CN110213216A (zh) * 2018-08-22 2019-09-06 腾讯科技(北京)有限公司 确定不同账号集合中相同账号的方法、装置及存储介质
CN110213216B (zh) * 2018-08-22 2024-02-09 腾讯科技(北京)有限公司 确定不同账号集合中相同账号的方法、装置及存储介质
CN109731341A (zh) * 2018-12-28 2019-05-10 广州华多网络科技有限公司 一种关联账户的拆分方法、装置及设备
CN109731341B (zh) * 2018-12-28 2022-07-22 广州方硅信息技术有限公司 一种关联账户的拆分方法、装置及设备
CN110503467A (zh) * 2019-08-15 2019-11-26 深圳市云积分科技有限公司 一种跨平台的消费者人群获取方法及装置
CN110503467B (zh) * 2019-08-15 2022-11-22 深圳市云积分科技有限公司 一种跨平台的消费者人群获取方法及装置

Also Published As

Publication number Publication date
CN106611350B (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
US10909552B2 (en) Mobile application analytics framework
US9626158B1 (en) Dynamic availability-based integration of external functionality
CN109118296A (zh) 活动推送方法、装置及电子设备
US9703534B2 (en) Dynamic entity inference for developer integration of entity-based external functionality
CN105975472A (zh) 一种推荐方法和装置
Hunt et al. Algorithmic regulation in media and cultural policy: A framework to evaluate barriers to accountability
CN109155136A (zh) 从视频自动检测和渲染精彩场面的计算机化系统和方法
CN107292463A (zh) 一种对应用程序进行项目评估的方法及系统
US20120303552A1 (en) Techniques to track users and user metrics for a website
Winseck Vampire squids,‘the broken internet’and platform regulation
CN104899302A (zh) 向用户推荐音乐的方法和装置
CN106611350A (zh) 挖掘潜在用户源的方法和装置
CN107783993A (zh) 数据的存储方法和装置
Rosenberg et al. Use of corporate sponsorship as a tobacco marketing tool: a review of tobacco industry sponsorship in the USA, 1995-99
CN106570031A (zh) 一种业务对象的推荐方法和装置
CN107592296A (zh) 垃圾账户的识别方法和装置
Bhargava et al. Unsupervised modeling of users' interests from their Facebook profiles and activities
CN105005576B (zh) 一种视频网站相似用户搜索系统和方法
Cagliero et al. Discovering high-utility itemsets at multiple abstraction levels
US20150242961A1 (en) Enriched financial transaction records
Assunta et al. The tobacco industry’s accounts of refining indirect tobacco advertising in Malaysia
Mukerjee Net neutrality, Facebook, and India’s battle to# SaveTheInternet
Durham et al. A model architecture for Big Data applications using relational databases
Öztoprak Profiling subscribers according to their internet usage characteristics and behaviors
US20180246968A1 (en) Event processing system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1237098

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant