CN106708888A - 推荐方法及装置 - Google Patents

推荐方法及装置 Download PDF

Info

Publication number
CN106708888A
CN106708888A CN201510790152.0A CN201510790152A CN106708888A CN 106708888 A CN106708888 A CN 106708888A CN 201510790152 A CN201510790152 A CN 201510790152A CN 106708888 A CN106708888 A CN 106708888A
Authority
CN
China
Prior art keywords
user
similar users
sampling
similar
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510790152.0A
Other languages
English (en)
Other versions
CN106708888B (zh
Inventor
杨超
倪娜
刘忠义
魏虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510790152.0A priority Critical patent/CN106708888B/zh
Priority to TW105118404A priority patent/TWI720989B/zh
Priority to US15/352,219 priority patent/US10460373B2/en
Priority to PCT/US2016/062149 priority patent/WO2017087443A1/en
Publication of CN106708888A publication Critical patent/CN106708888A/zh
Application granted granted Critical
Publication of CN106708888B publication Critical patent/CN106708888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种推荐方法及装置。推荐方法包括:从网络系统中获取对预设第一关联项发生过网络行为的用户集合;对用户集合进行抽样,以获得抽样用户;对抽样用户进行相似处理,以获得相似用户列表;根据相似用户列表和待推荐网络服务提供商的至少一个核心用户,向待推荐网络服务提供商进行潜在用户的推荐。本申请可以高效的向网络服务提供商进行潜在用户的推荐。

Description

推荐方法及装置
【技术领域】
本申请涉及互联网技术领域,尤其涉及一种推荐方法及装置。
【背景技术】
随着互联网技术的发展,用户可以从网站上获取的网络服务越来越多。在用户浏览网站选择网络服务的过程中,网站推荐系统起着十分重要的作用,特别是对于不具有明确需求的用户,很可能会直接选择网站推荐系统所推荐的网络服务。基于此,目前各大网站都有自己的推荐系统,以向用户推荐网络服务,减少用户漫无目的的浏览、点击等行为,进而减轻网站服务器的负担,节约网络带宽资源,提升网站自身价值。
目前,各大网站最为常用的是基于协同过滤(Collaborative Filtering,CF)算法的向用户推荐网络服务,这样可以减少用户漫无目的的浏览、点击等行为,进而减轻网站服务器的负担,节约网络带宽资源,提升网站自身价值。实际上,网站除了可以向用户推荐网络服务之外,也可以从网络服务提供商的角度考虑,向网络服务提供商推荐潜在用户。但是,考虑到网站上用户数量较多,若直接基于协同过滤的算法进行潜在用户的推荐,其运算量较大,这会影响推荐效率。
【发明内容】
本申请的多个方面提供一种推荐方法及装置,用以高效的向网络服务提供商进行潜在用户的推荐。
本申请的一方面,提供一种推荐方法,包括:
从网络系统中获取对预设第一关联项发生过网络行为的用户集合;
对所述用户集合进行抽样,以获得抽样用户;
对所述抽样用户进行相似处理,以获得相似用户列表;
根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
本申请的另一方面,提供一种推荐装置,包括:
获取模块,用于从网络系统中获取对预设第一关联项发生过网络行为的用户集合;
抽样模块,用于对所述用户集合进行抽样,以获得抽样用户;
相似处理模块,用于对所述抽样用户进行相似处理,以获得相似用户列表;
推荐模块,用于根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
在本申请中,预先设定第一关联项,通过该第一关联项获得关联用户,即从网络系统中获取对该第一关联项发生过网络行为的用户集合;考虑到该用户集合的数量较多,其运算量会很大,为了降低运算量,对用户集合进行抽样,获得抽样用户,然后对抽样用户进行相似处理,获得相似用户列表,之后根据网络服务提供商的至少一个核心用户和所获得的相似用户列表,向网络服务提供商进行潜在用户的推荐。其中,由于抽样后得到抽样用户的数量相对较少,运算量减少了,运算速度相对提高,因此可以高效的向网络服务提供商进行潜在用户的推荐。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的推荐方法的流程示意图;
图2为本申请一实施例提供的基于热门商品关联的用户集合的示意图;
图3为本申请一实施例提供的基于图2所示用户集合抽样得到的两个抽样集合的示意图;
图4为本申请另一实施例提供的基于图2所示用户集合复制得到的复制用户集合的示意图;
图5为本申请又一实施例提供的基于图3所示抽样集合进行分块得到的抽样子集及抽样子集之间关联的示意图;
图6为本申请又一实施例提供的推荐装置的结构示意图;
图7为本申请又一实施例提供的推荐装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的推荐方法的流程示意图。如图1所示,该方法包括:
101、从网络系统中获取对预设第一关联项发生过网络行为的用户集合。
102、对上述用户集合进行抽样,以获得抽样用户。
103、对上述抽样用户进行相似处理,以获得相似用户列表。
104、根据上述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向待推荐网络服务提供商进行潜在用户的推荐。
本实施例提供一种推荐方法,可由推荐装置来执行,用以向网络服务提供商推荐潜在用户,从而利于网络服务的推广和应用。本实施例提供的方法 可用于任何基于互联网进行用户推荐的应用场景。举例说明,当网络店铺在电商网站上发布所提供商品对象时,电商网站采用本实施例提供的方法可以向该网络店铺推荐潜在购买用户。又例如,视频资源提供者在资源下载网站上传视频资源时,资源下载网站可以向视频资源提供者推荐潜在下载用户。又例如,外卖提供商通过外卖客户端提供外卖服务时,外卖客户端可以向外卖提供商推荐潜在下单用户等。
根据应用场景的不同,本实施例的网络系统、网络系统中的用户、用户行为及网络服务等均会有所不同。本实施例不对网络系统、网络系统中的用户、用户行为及网络服务等的实现形式进行限定。例如,网络系统可以是以各电商网站为核心的网络系统,相应的,网络系统中的网络服务可以为网购服务,网络系统中的用户行为可以包括浏览、收藏、加购物车、购买、支付以及评论中的一种或多种。又例如,网络系统可以是以资源下载网站为核心的网络系统,相应的,网络系统中的网络服务可以为资源下载服务,例如音视频资源、文本资源等下载服务,网络系统中的用户行为可以包括预览、下载、播放等中的一种或多种。另外,本实施例的网络服务还可以是洗车服务、网上订票服务、养护服务、按摩服务、清洁服务、厨师上门服务、家政服务、家教服务、娱乐服务、吃喝服务、旅行服务、酒店服务、或租车服务等等。
由上述举例可见,本实施例中的网络服务主要是指一些通过网络面向用户提供的服务,可以是电子商务、电子政务、公司业务流程电子化等各应用领域中的服务。
值得说明的是,用于执行本实施例方法流程的推荐装置,可以作为各网站或客户端中的功能模块实现,或者也可以独立于各网站或客户端但能够与各网站或客户端进行通信,以配合各网站或客户端完成推荐。
对网络服务提供商来说,为了更好的推广或营销所提供的网络服务,一般会针对自己的用户群体进行服务推广或营销策略。网络服务提供商的用户群组不仅包括已有用户,还包括一些潜在用户。对网络服务提供商来说,面临着如何圈定自己的潜在用户的问题。本实施例提供的推荐方法可以很好的 向网络服务提供商推荐潜在用户。
本实施例推荐方法的主要原理是:基于待推荐网络服务提供商的至少一个核心用户,从网络系统中获取与至少一个核心用户相似的用户作为待推荐网络服务提供商的潜在用户,并向网络服务提供商进行推荐。在具体实现上,本实施例先获得相似用户列表或称为U2U矩阵,然后再从该相似用户列表中发现与待推荐网络服务提供商的核心用户相似的用户并进行推荐。
具体的,预先设定用户之间的关联项,基于该关联项获得存在一定关联的用户,进而基于这些存在关联的用户获得相似用户列表,再基于所获得的相似用户列表向待推荐网络服务提供商进行推荐。为便于与后续扩展相似用户列表中出现的关联项进行区分,将此处出现的关联项称为第一关联项。
其中,根据应用场景的不同,第一关联项也会有所不同,但应用场景一旦确定,该第一关联项也相应确定。举例说明,第一关联项可以是访问热度大于预设热度门限的商品对象(简称为热门商品),或者可以是一级类目,例如家用电器、户外运动、母婴用户等,或者也可以是叶子类目,例如冰箱、洗衣机、跑步鞋、婴儿推车等,或者也可以是一些商品对象的属性,例如品牌、价格区间等。
以第一关联项为访问热度大于预设热度门限的商品对象为例,则从网络系统中获取对第一关联项发生过网络行为的用户集合具体为:从网络系统中获取对访问热度大于预设热度门限的商品对象发生过网络行为的用户集合。即从网络系统中获取浏览、点击、查看、询价、收藏、加购物车或购买过该访问热度大于预设热度门限的商品对象的用户,以形成用户集合。
考虑到网络系统中的用户的数量很多很多,例如单在淘宝系统上的活跃用户就过亿,因此上述获取到的用户集合会非常庞大,基于如此庞大的用户集合进行潜在用户推荐时的运算量会非常大,推荐效率会非常低,实用性较差。基于此,本实施例在获得用户集合之后,先对用户集合进行抽样,以获得抽样用户。这里的抽样用户是指被抽样到的用户。其中,抽样用户是用户集合中的部分用户,抽样用户的数量要小于用户集合中用户的数量,而且该 抽样用户的数量可以根据应用场景或业务需求等灵活控制。若应用场景或业务需求对用户覆盖度要求较高,则在满足时间要求的情况下,抽样用户的数量可以尽量多一些,以保证用户覆盖度;反之,若应用场景或业务需求对推荐时效要求较高,则在满足用户覆盖度的情况下,抽样用户的数量可以尽量少一些,以降低运算量,提高推荐效率。
在实际应用中,例如,可以预先设定抽样比例,通过抽样比例来控制抽样用户的数量,这里的抽样比例是指抽样用户与用户集合中用户总数的比值,例如可以是70%、60%或45%等。又例如,也可以预先设定抽样数量范围,要求抽样用户的数量在该抽样数量范围内,通过抽样数量范围来控制抽样用户的数量。又例如,也可以预先设定上限值或下限值,从而要求抽样用户的数量不能大于上限值,或者不能少于下限值,通过上限值或下限值来控制抽样用户的数量。
另外,从不同第一关联项来看,例如不同热门商品关联的用户集合的数量可能并不相同,甚至差别很大,这种现象叫做数据倾斜。如果数据倾斜程度较大,则会严重影响本实施例提供的方法的执行效率。而在本实施例中,通过对用户集合进行抽样可以使不同第一关联项关联的抽样用户的数量相同或基本相同,有利于减少数据倾斜程度,进而有利于在整体上提高本实例方法的执行效率。
在一可选实施方式中,可以根据用户的权重,对用户集合进行抽样,并保证权重较高的用户被抽样到的概率较高,反之,权重较低的用户被抽样到的概率较低。则对用户集合进行抽样,以获得抽样用户的具体实施过程包括:
根据用户集合中每个用户的网络行为活跃度和/或网络行为类型,为每个用户配置权重;然后,根据每个用户的权重,对用户集合进行随机抽样,以获得抽样用户。
其中,用户的网络行为活跃度越高,该用户的权重越高;反之,用户的网络行为活跃度越低,该用户的权重越低。例如,用户的网络行为活跃度可以通过一段时间(例如近两天、一周、一月等)内用户在网络系统中出现的 次数来衡量,但不限于此。另外,用户的网络行为类型也会影响用户的权重,例如购买行为对应的权重较高,点击行为对应的权重相对较小,浏览行为对应的权重更小等。
在实际应用中,可以预先设定权重配置策略,例如该权重配置策略中可以定义每个网络行为活跃度对应的权重值以及每个网络行为类型对应的权重值,并定义计算方式,例如可以是加权平均或指数运算等。基于此,具体可以按照该权重配置策略,确定用户的网络行为活跃度对应的权重值和网络行为类型对应的权重值,进而根据该权重配置策略定义的计算方式,对获取的权重值进行计算,例如可以是对两类权重值进行加权平均,以获得用户的权重。
在根据每个用户的权重,对用户集合进行随机抽样,以获得抽样用户的过程中,可以按照如下公式(1)计算出每个用户的抽样概率,即该用户被抽样到的概率。
在上述公式(1)中,p(wi)表示用户i的抽样概率;wi表示用户i的权重;n表示用户集合中用户的总数。
进一步,为了便于对抽样用户进行相似处理,可以将抽样用户放到两个抽样集合中,将两个抽样集合中的用户进行相似处理,以获得相似用户列表。
在一种具体实现中,可以根据用户集合中每个用户的权重,对用户集合进行两次随机抽样,以获得第一抽样集合和第二抽样集合。以图2所示,假设对热门商品发生过网络行为的用户集合共包括10个用户,分别为用户_1,用户_2,…,用户_10。如果设定抽样用户的数量为6,则经过抽样后得到如图3所示的两个抽样集合,一个抽样集合包括用户_1,用户_2,用户_3,用户_4,用户_9和用户_10,另一个抽样集合包括用户_1,用户_2,用户_3,用户_4,用户_8和用户_10。
在一种具体实现中,可以对用户集合进行复制,以获得复制用户集合;然后,按照用户集合中每个用户的权重,分别对用户集合和复制用户集合进行随机抽样,以获得第一抽样集合和第二抽样集合。以图2所示用户集合为例,则复制后可以获得图4所示的两个用户集合;如果设定抽样用户的数量为6,则对图4所示两个用户集合进行抽样后得到如图3所示两个抽样集合。
在获得第一抽样集合和第二抽样集合之后,可以对第一抽样集合和第二抽样集合中的用户进行相似处理,以达到对抽样用户进行相似处理的目的,并获得相似用户列表。
进一步,为了降低运算量,提高运算速度,可以对第一抽样集合和第二抽样集合进行多级分块计算。则一种对抽样用户进行相似处理,以获得相似用户列表的实施方式包括:
对第一抽样集合进行分块,以获得至少两个第一抽样子集;
对第二抽样集合进行分块,以获得至少两个第二抽样子集;
将至少两个第一抽样子集中的每个第一抽样子集分别与至少两个第二抽样子集中的每个抽样子集进行相似计算,以获得抽样用户之间的相似度;
获取相似度满足预设条件的抽样用户作为相似用户添加到相似用户列表中。
以上述图3所示第一抽样集合和第二抽样集合为例,则可以将第一抽样集合分为两个第一抽样子集,一个抽样子集包括:用户_1,用户_2,用户_3,另一抽样子集包括:用户_4,用户_9和用户_10;将第二抽样集合分为两个第二抽样子集,一个抽样子集包括:用户_1,用户_2,用户_3,另一抽样子集包括:用户_4,用户_8和用户_10。然后,将每个第一抽样子集分别与每个第二抽样子集进行相似计算,从而获得图5所示关联示意图。
例如,可以根据如下公式(2)计算第一抽样子集和第二抽样子集中用户之间的相似度。
在上述公式(2)中,sim(x,y,δ)表示x与之间的相似度,x表示第一抽样子集中的一个用户,y表示第二抽样子集中的一个用户,δ表示方差。
值得说明的,本实施例并不限定分块的次数,也不限定分块的方式,另外,对于每个抽样子集包括的用户数量也不做限定。
进一步,还可以将第一抽样子集或第二抽样子集进行进一步分块。
其中,通过对抽样集合进行分块,可以实现分块存储,并且实现分块处理,有利于进一步降低计算量,提高推荐效率。
在获得相似用户列表之后,可以根据待推荐网络服务提供商的核心用户,在该相似用户列表中进行匹配,找到与核心用户相似的用户作为待推荐网络服务提供商的潜在用户并推荐给该待推荐网络服务提供商。
在一可选实施方式中,随着网络系统中用户群体的增大以及关联项本身的不断变化等,相似用户列表中覆盖的相似用户可能会出现不足或覆盖不到的情况,为了进一步提高相似用户的覆盖率,在获得相似用户列表之后,使用相似用户列表进行潜在用户推荐之前,可以对相似用户列表进行扩展,以获得扩展相似用户列表。相应的,可以根据待推荐网络服务提供商的至少一个核心用户和扩展相似用户列表,向待推荐网络服务提供商进行潜在用户的推荐。
其中,一种对相似用户列表进行扩展的方式包括:根据相似用户列表中相似用户之间的相似关系,获得相似用户列表中与同一用户相似但不属于相似用户列表中的相似用户的两个用户作为新的相似用户,将所获取的新的相似用户添加到相似用户列表中从而获得扩展相似用户列表。举例说明,假设相似用户列表中包括:用户_1与用户_2相似,用户_2与用户_3相似,则可以获得用户_1和用户_3分别与用户_2相似但两者又不属于相似用户列表中的相似用户,于是可以将用户_1和用户_3作为新的相似用户添加到相似用户列表中,从而获得扩展相似用户列表,即此时扩展相似用户列表中包括:用户_1与用户_2相似,用户_2与用户_3相似,用户_1与用户_3相似。
其中,一种对相似用户列表进行扩展的方式包括:根据由对预设第二关 联项发生过网络行为的用户集合获得相似用户,对上述由预设第一关联项获得的相似用户列表进行扩展,以获得扩展相似用户列表。例如,可以将第一关联项修改或重置为第二关联项后,重新运行一次本实施例提供的方法流程,获得新的相似用户列表,再用新的相似用户列表去更新或扩展之前获得的相似用户列表。其中,第二关联项优选是不同于第一关联项的关联项。
值得说明的是,本实施例对相似用户列表进行扩展的操作可能导致计算量呈几何级数的增长,但是由于本申请在计算相似用户列表的过程中采取了随机抽样、分块等优化处理,使得运算量极大降低,为对相似用户列表的扩展打下了基础,使得对相似用户列表的扩展具有可行性,同时兼顾对相似用户的覆盖率和运算速度,在保证推荐效率的同时,可以向网络服务提供商推荐更多的潜在用户。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图6为本申请又一实施例提供的推荐装置的结构示意图。如图6所示,该装置包括:获取模块61、抽样模块62、相似处理模块63和推荐模块64。
获取模块61,用于从网络系统中获取对预设第一关联项发生过网络行为的用户集合。
抽样模块62,用于对获取模块61获取的用户集合进行抽样,以获得抽样用户。
相似处理模块63,用于对抽样模块62抽样到的抽样用户进行相似处理,以获得相似用户列表。
推荐模块64,用于根据相似处理模块63获得的相似用户列表和待推荐网 络服务提供商的至少一个核心用户,向待推荐网络服务提供商进行潜在用户的推荐。
在一可选实施方式中,第一关联项为访问热度大于预设热度门限的商品对象,简称为热门商品。
基于上述,获取模块61具体可用于:从网络系统中获取对访问热度大于预设热度门限的商品对象发生过网络行为的用户集合。
在一可选实施方式中,抽样模块62具体可用于:
根据用户集合中每个用户的网络行为活跃度和/或网络行为类型,为每个用户配置权重;根据每个用户的权重,对用户集合进行随机抽样,以获得抽样用户。
进一步,抽样模块62在根据每个用户的权重,对用户集合进行随机抽样,以获得抽样用户时,具体用于:
根据每个用户的权重,对用户集合进行两次随机抽样,以获得第一抽样集合和第二抽样集合;或者
对用户集合进行复制,以获得复制用户集合;按照每个用户的权重,分别对用户集合和复制用户集合进行随机抽样,以获得第一抽样集合和第二抽样集合。
基于上述,相似处理模块63具体可用于:
对第一抽样集合进行分块,以获得至少两个第一抽样子集;
对第二抽样集合进行分块,以获得至少两个第二抽样子集;
将至少两个第一抽样子集中的每个第一抽样子集分别与至少两个第二抽样子集中的每个抽样子集进行相似计算,以获得抽样用户之间的相似度;
获取相似度满足预设条件的抽样用户作为相似用户添加到相似用户列表中。
进一步,如图7所示,该推荐装置还包括:扩展模块65。
扩展模块65,用于对相似处理模块63获得的相似用户列表进行扩展,以获得扩展相似用户列表。
基于上述,推荐模块64具体可用于:根据扩展相似用户列表和待推荐网络服务提供商的至少一个核心用户,向待推荐网络服务提供商进行潜在用户的推荐。
进一步,扩展模块65具体可用于:
根据相似用户列表中相似用户之间的相似关系,获得相似用户列表中与同一用户相似但不属于相似用户列表中的相似用户的两个用户作为新的相似用户;
将新的相似用户添加到相似用户列表中,以获得扩展相似用户列表。或者
扩展模块65具体可用于:根据由对预设第二关联项发生过网络行为的用户集合获取的相似用户,对相似用户列表进行扩展,以获得扩展相似用户列表。
本实施例提供的推荐装置,基于预先设定第一关联项获得关联用户,即从网络系统中获取对该第一关联项发生过网络行为的用户集合;考虑到该用户集合的数量较多,其运算量会很大,为了降低运算量,对用户集合进行抽样,获得抽样用户,然后对抽样用户进行相似处理,获得相似用户列表,之后根据网络服务提供商的核心用户和获得的相似用户列表,向网络服务提供商进行潜在用户的推荐。其中,由于抽样后得到抽样用户的数量相对较少,运算量减少了,运算速度相对提高,因此可以高效的向网络服务提供商进行潜在用户的推荐。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (16)

1.一种推荐方法,其特征在于,包括:
从网络系统中获取对预设第一关联项发生过网络行为的用户集合;
对所述用户集合进行抽样,以获得抽样用户;
对所述抽样用户进行相似处理,以获得相似用户列表;
根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
2.根据权利要求1所述的方法,其特征在于,所述第一关联项为访问热度大于预设热度门限的商品对象;
所述从网络系统中获取对预设第一关联项发生过网络行为的用户集合,包括:
从所述网络系统中获取对所述访问热度大于预设热度门限的商品对象发生过网络行为的用户集合。
3.根据权利要求1所述的方法,其特征在于,所述对所述用户集合进行抽样,以获得抽样用户,包括:
根据所述用户集合中每个用户的网络行为活跃度和/或网络行为类型,为所述每个用户配置权重;
根据所述每个用户的权重,对所述用户集合进行随机抽样,以获得所述抽样用户。
4.根据权利要求3所述的方法,其特征在于,所述根据所述每个用户的权重,对所述用户集合进行随机抽样,以获得所述抽样用户,包括:
根据所述每个用户的权重,对所述用户集合进行两次随机抽样,以获得第一抽样集合和第二抽样集合;或者
对所述用户集合进行复制,以获得复制用户集合;
按照所述每个用户的权重,分别对所述用户集合和所述复制用户集合进行随机抽样,以获得第一抽样集合和第二抽样集合。
5.根据权利要求4所述的方法,其特征在于,所述对所述抽样用户进行相似处理,以获得相似用户列表,包括:
对所述第一抽样集合进行分块,以获得至少两个第一抽样子集;
对所述第二抽样集合进行分块,以获得至少两个第二抽样子集;
将所述至少两个第一抽样子集中的每个第一抽样子集分别与所述至少两个第二抽样子集中的每个抽样子集进行相似计算,以获得所述抽样用户之间的相似度;
获取相似度满足预设条件的抽样用户作为相似用户添加到所述相似用户列表中。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐之前,还包括:
对所述相似用户列表进行扩展,以获得扩展相似用户列表;
所述根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐,包括:
根据所述扩展相似用户列表和所述待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
7.根据权利要求6所述的方法,其特征在于,所述对所述相似用户列表进行扩展,以获得扩展相似用户列表,包括:
根据所述相似用户列表中相似用户之间的相似关系,获得所述相似用户列表中与同一用户相似但不属于所述相似用户列表中的相似用户的两个用户作为新的相似用户;
将所述新的相似用户添加到所述相似用户列表中,以获得所述扩展相似用户列表。
8.根据权利要求6所述的方法,其特征在于,所述对所述相似用户列表进行扩展,以获得相似用户列表,包括:
根据由对预设第二关联项发生过网络行为的用户集合获取的相似用户,对所述相似用户列表进行扩展,以获得所述扩展相似用户列表。
9.一种推荐装置,其特征在于,包括:
获取模块,用于从网络系统中获取对预设第一关联项发生过网络行为的用户集合;
抽样模块,用于对所述用户集合进行抽样,以获得抽样用户;
相似处理模块,用于对所述抽样用户进行相似处理,以获得相似用户列表;
推荐模块,用于根据所述相似用户列表和待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
10.根据权利要求9所述的装置,其特征在于,所述第一关联项为访问热度大于预设热度门限的商品对象;
所述获取模块具体用于:从所述网络系统中获取对所述访问热度大于预设热度门限的商品对象发生过网络行为的用户集合。
11.根据权利要求9所述的装置,其特征在于,所述抽样模块具体用于:
根据所述用户集合中每个用户的网络行为活跃度和/或网络行为类型,为所述每个用户配置权重;
根据所述每个用户的权重,对所述用户集合进行随机抽样,以获得所述抽样用户。
12.根据权利要求11所述的装置,其特征在于,所述抽样模块具体用于:
根据所述每个用户的权重,对所述用户集合进行两次随机抽样,以获得第一抽样集合和第二抽样集合;或者
对所述用户集合进行复制,以获得复制用户集合;
按照所述每个用户的权重,分别对所述用户集合和所述复制用户集合进行随机抽样,以获得第一抽样集合和第二抽样集合。
13.根据权利要求12所述的装置,其特征在于,所述相似处理模块具体用于:
对所述第一抽样集合进行分块,以获得至少两个第一抽样子集;
对所述第二抽样集合进行分块,以获得至少两个第二抽样子集;
将所述至少两个第一抽样子集中的每个第一抽样子集分别与所述至少两个第二抽样子集中的每个抽样子集进行相似计算,以获得所述抽样用户之间的相似度;
获取相似度满足预设条件的抽样用户作为相似用户添加到所述相似用户列表中。
14.根据权利要求9-13任一项所述的装置,其特征在于,还包括:
扩展模块,用于对所述相似用户列表进行扩展,以获得扩展相似用户列表;
所述推荐模块具体用于:根据所述扩展相似用户列表和所述待推荐网络服务提供商的至少一个核心用户,向所述待推荐网络服务提供商进行潜在用户的推荐。
15.根据权利要求14所述的装置,其特征在于,所述扩展模块具体用于:
根据所述相似用户列表中相似用户之间的相似关系,获得所述相似用户列表中与同一用户相似但不属于所述相似用户列表中的相似用户的两个用户作为新的相似用户;
将所述新的相似用户添加到所述相似用户列表中,以获得所述扩展相似用户列表。
16.根据权利要求14所述的装置,其特征在于,所述扩展模块具体用于:
根据由对预设第二关联项发生过网络行为的用户集合获取的相似用户,对所述相似用户列表进行扩展,以获得所述扩展相似用户列表。
CN201510790152.0A 2015-11-17 2015-11-17 推荐方法及装置 Active CN106708888B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510790152.0A CN106708888B (zh) 2015-11-17 2015-11-17 推荐方法及装置
TW105118404A TWI720989B (zh) 2015-11-17 2016-06-13 推薦方法及裝置
US15/352,219 US10460373B2 (en) 2015-11-17 2016-11-15 Recommendation method and apparatus
PCT/US2016/062149 WO2017087443A1 (en) 2015-11-17 2016-11-16 Recommendation method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510790152.0A CN106708888B (zh) 2015-11-17 2015-11-17 推荐方法及装置

Publications (2)

Publication Number Publication Date
CN106708888A true CN106708888A (zh) 2017-05-24
CN106708888B CN106708888B (zh) 2020-06-26

Family

ID=58691284

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510790152.0A Active CN106708888B (zh) 2015-11-17 2015-11-17 推荐方法及装置

Country Status (4)

Country Link
US (1) US10460373B2 (zh)
CN (1) CN106708888B (zh)
TW (1) TWI720989B (zh)
WO (1) WO2017087443A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118428992A (zh) * 2024-07-03 2024-08-02 全拓科技(杭州)股份有限公司 一种基于大数据分析的营销推荐系统及方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169801A (zh) * 2017-05-22 2017-09-15 上海汇纳信息科技股份有限公司 店铺关联关系获取方法、系统、存储介质以及移动终端
KR102170865B1 (ko) * 2017-07-19 2020-10-28 미쓰비시덴키 가부시키가이샤 레커맨드 장치
CN109740047A (zh) * 2018-12-11 2019-05-10 东软集团股份有限公司 样本推荐方法、装置、计算机可读存储介质和电子设备
CN109508405B (zh) * 2018-12-24 2020-07-31 北京爱奇艺科技有限公司 一种推荐视频的确定方法、装置、电子设备及存储介质
CN109753585B (zh) * 2018-12-24 2020-12-18 北京爱奇艺科技有限公司 一种推荐视频的确定方法、装置、电子设备及存储介质
CN113554460B (zh) * 2021-07-19 2024-10-22 北京沃东天骏信息技术有限公司 一种潜在用户的识别方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088603A1 (en) * 2005-10-13 2007-04-19 Jouppi Norman P Method and system for targeted data delivery using weight-based scoring
US20080228406A1 (en) * 2007-03-12 2008-09-18 Myconostica Ltd. System and method for fungal identification
CN102147906A (zh) * 2010-02-04 2011-08-10 微软公司 使用网络站点交互来生成潜在消费者的目标列表
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及系统
CN102819607A (zh) * 2012-08-21 2012-12-12 北京小米科技有限责任公司 一种推荐用户的方法和装置
US20150088649A1 (en) * 2013-09-22 2015-03-26 Acxiom Corporation Quick Audience Search and Recommendation Apparatus and Method

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6868389B1 (en) 1999-01-19 2005-03-15 Jeffrey K. Wilkins Internet-enabled lead generation
US20040243459A1 (en) 2003-01-24 2004-12-02 Geritz William F. System and method for automating business development
US20050154648A1 (en) 2003-11-04 2005-07-14 Strause Todd M. Interactive lead generation system having a web-based application for reporting and following up with leads and methods of use thereof
US20050246221A1 (en) 2004-02-13 2005-11-03 Geritz William F Iii Automated system and method for determination and reporting of business development opportunities
WO2008086444A1 (en) 2007-01-09 2008-07-17 Autobytel Inc. Systems and methods relating to a lead distribution engine that accommodates internal and imported destination relationships
US20080288361A1 (en) 2007-05-17 2008-11-20 Geoffrey Rego System and method for lead generation and lead demand fulfillment
US8229780B2 (en) 2007-07-30 2012-07-24 Silvercarrot, Inc. System and method for online lead generation
EP2176730A4 (en) 2007-08-08 2011-04-20 Baynote Inc METHOD AND APPARATUS FOR CONTENT RECOMMENDATION BASED ON CONTEXT
US7991841B2 (en) 2007-10-24 2011-08-02 Microsoft Corporation Trust-based recommendation systems
US20090183179A1 (en) 2008-01-14 2009-07-16 Brilig Llc User and business communication and discovery platform
US10380634B2 (en) 2008-11-22 2019-08-13 Callidus Software, Inc. Intent inference of website visitors and sales leads package generation
US8661050B2 (en) 2009-07-10 2014-02-25 Microsoft Corporation Hybrid recommendation system
US8326663B2 (en) 2010-03-17 2012-12-04 Leapfrog Online Customer Acquisition, LLC System for optimizing lead close rates
US20110258016A1 (en) 2010-04-14 2011-10-20 Optify, Inc. Systems and methods for generating lead intelligence
US9367847B2 (en) 2010-05-28 2016-06-14 Apple Inc. Presenting content packages based on audience retargeting
WO2012051586A1 (en) 2010-10-15 2012-04-19 Ness Computing, Inc. A computer system and method for analyzing data sets and generating personalized recommendations
US20120198056A1 (en) 2011-01-31 2012-08-02 Yaacov Shama Techniques for Analyzing Website Content
US9026521B1 (en) 2011-08-19 2015-05-05 Isaac S. Daniel System and method for conducting company searches and lead generation using company code index
US20130097017A1 (en) 2011-10-14 2013-04-18 Subrao Venugopal Shenoy Methods and systems for creating an intelligent online lead generation system connecting retail vendors with home buyers, sellers and renters in real estate transaction and move cycle
US20130166379A1 (en) 2011-12-21 2013-06-27 Akintunde Ehindero Social Targeting
CN103327045B (zh) 2012-03-21 2017-03-22 腾讯科技(深圳)有限公司 社交网络中的用户推荐方法和系统
US20130346182A1 (en) * 2012-06-20 2013-12-26 Yahoo! Inc. Multimedia features for click prediction of new advertisements
US8886575B1 (en) * 2012-06-27 2014-11-11 Google Inc. Selecting an algorithm for identifying similar user identifiers based on predicted click-through-rate
CN103729383B (zh) * 2012-10-16 2017-04-12 阿里巴巴集团控股有限公司 商品信息的推送方法和装置
US10628503B2 (en) 2012-11-27 2020-04-21 Gubagoo, Inc. Systems and methods for online web site lead generation service
US9189798B2 (en) 2012-11-27 2015-11-17 Gubagoo, Inc. Systems and methods for online website lead generation service
US20140358638A1 (en) 2013-06-04 2014-12-04 Sap Ag Dynamic intelligent lead identifier
US20160189203A1 (en) 2014-12-27 2016-06-30 Teradata Us, Inc. Automatic and dynamic predictive analytics

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070088603A1 (en) * 2005-10-13 2007-04-19 Jouppi Norman P Method and system for targeted data delivery using weight-based scoring
US20080228406A1 (en) * 2007-03-12 2008-09-18 Myconostica Ltd. System and method for fungal identification
CN102147906A (zh) * 2010-02-04 2011-08-10 微软公司 使用网络站点交互来生成潜在消费者的目标列表
CN102411596A (zh) * 2010-09-21 2012-04-11 阿里巴巴集团控股有限公司 一种信息推荐方法及系统
CN102819607A (zh) * 2012-08-21 2012-12-12 北京小米科技有限责任公司 一种推荐用户的方法和装置
US20150088649A1 (en) * 2013-09-22 2015-03-26 Acxiom Corporation Quick Audience Search and Recommendation Apparatus and Method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118428992A (zh) * 2024-07-03 2024-08-02 全拓科技(杭州)股份有限公司 一种基于大数据分析的营销推荐系统及方法
CN118428992B (zh) * 2024-07-03 2024-10-25 全拓科技(杭州)股份有限公司 一种基于大数据分析的营销推荐系统及方法

Also Published As

Publication number Publication date
US10460373B2 (en) 2019-10-29
WO2017087443A1 (en) 2017-05-26
TW201719531A (zh) 2017-06-01
US20170140454A1 (en) 2017-05-18
CN106708888B (zh) 2020-06-26
TWI720989B (zh) 2021-03-11

Similar Documents

Publication Publication Date Title
CN106708888A (zh) 推荐方法及装置
CN106570008B (zh) 推荐方法及装置
CN102316130B (zh) 一种基于用户的行为判断其与好友的亲疏度的方法与设备
CN103208077B (zh) 一种协同订购方法及设备、系统
CN107485859A (zh) 游戏邀请方法、装置及电子设备
US20100094856A1 (en) System and method for using a list capable search box to batch process search terms and results from websites providing single line search boxes
CN106251168A (zh) 信息推送方法及系统
EP2684106A1 (en) Determining preferred categories based on user access attribute values
CN110335123B (zh) 基于社交电商平台的商品推荐方法、系统、计算机可读介质以及装置
CN103186834A (zh) 业务流程配置方法和装置
EP2635960A1 (en) Determination of category information using multiple stages
CN104835057A (zh) 一种获取网络用户的消费特征信息的方法及装置
CN110210899A (zh) 基于广告相似性的广告推送方法、装置和设备
CN106910136A (zh) 为家庭画像的方法及装置、系统
CN103744904B (zh) 一种提供信息的方法及装置
CN111428143A (zh) 一种商品推荐方法及系统、服务器及存储介质
CN102982112A (zh) 排行榜生成方法、日志生成方法和服务器
CN107273521A (zh) Feed内容质量评价方法及装置
CN113689259A (zh) 基于用户行为的商品个性化推荐方法及系统
CN104992352A (zh) 一种个性化资源检索方法
CN108932640A (zh) 用于处理订单的方法和装置
CN114065038A (zh) 基于大数据的头条资讯推荐方法及装置
CN113378033B (zh) 一种推荐模型的训练方法和装置
CN106919693A (zh) 一种提高热词曝光覆盖率的方法和装置
CN110827044A (zh) 提取用户兴趣模式的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant