CN107644036B - 一种数据对象推送的方法、装置及系统 - Google Patents

一种数据对象推送的方法、装置及系统 Download PDF

Info

Publication number
CN107644036B
CN107644036B CN201610581054.0A CN201610581054A CN107644036B CN 107644036 B CN107644036 B CN 107644036B CN 201610581054 A CN201610581054 A CN 201610581054A CN 107644036 B CN107644036 B CN 107644036B
Authority
CN
China
Prior art keywords
user
data object
data objects
data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610581054.0A
Other languages
English (en)
Other versions
CN107644036A (zh
Inventor
倪娜
王晓伟
廖闯
樊志国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201610581054.0A priority Critical patent/CN107644036B/zh
Priority to TW106118715A priority patent/TW201804400A/zh
Priority to PCT/CN2017/092743 priority patent/WO2018014771A1/zh
Publication of CN107644036A publication Critical patent/CN107644036A/zh
Application granted granted Critical
Publication of CN107644036B publication Critical patent/CN107644036B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供了一种数据对象推送的方法、装置及系统,其中所述方法包括:接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。本申请可以结合用户的实际意图向用户推送最相关的数据对象。

Description

一种数据对象推送的方法、装置及系统
技术领域
本申请涉及数据处理技术领域,特别是涉及一种数据对象推送的方法,一种数据对象推送的装置,以及,一种数据对象推送的系统。
背景技术
内容推送即为将特定的广告内容、新闻内容、通知内容、音视频等多媒体资源内容推广给特定人群的一种方式。
在现有技术中,通常采用以下方式进行内容推送:
采用用户标签对人群进行定向的技术是广告及其他内容投放领域的常用技术,该技术是通过用户的历史行为或用户本身的属性等数据为用户打上的标签。
基于用户历史行为的标签技术主要针对用户在各个网页的浏览、搜索、点击,对广告或内容的点击、转化等历史行为,将用户映射到某个标签上。例如,对于电商网站来说,可以根据用户的搜索、对商品的点击、收藏、加购物车、成交等历史行为,相应的生成店铺老客、新客、n天收藏过店铺/加购过店铺商品的用户等标签。
用户属性标签一般为用户本身的属性,例如用户的性别、年龄、地域、职业等。跟具体的店铺无关。
上述人口属性和用户行为等标签,虽然可以在部分场景中满足人群划分和投放需求,但却无法准确预知用户的实际意图,是一种离转化目标不直接相关的标签。同时由于该技术是一种基于历史数据的计算技术,在无法预知未来用户的情况下,这种基于用户标签的用户内容匹配策略也是相对盲目的。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种数据对象推送的机制,用以结合用户的实际意图向用户推送最相关的数据对象。
发明内容
本申请实施例所要解决的技术问题是提供一种数据对象推送的方法,结合用户的实际意图向用户推送最相关的数据对象。
相应的,本申请实施例还提供了一种数据对象推送的装置以及一种数据对象推送的系统,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种数据对象推送的系统,所述系统包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块具有如下功能:
接收第一用户对应的客户端发送的第二用户关联的数据对象的访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
本申请实施例还公开了一种数据对象推送的方法,所述方法包括:
接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
优选地,所述从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合的步骤包括:
分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
优选地,所述分别确定所述第一用户与所述多个数据对象集合的实际偏好值的步骤包括:
分别获取所述多个数据对象集合的预测偏好值;
分别确定所述第一用户与所述数据对象集合的相关度;
针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
优选地,所述分别获取所述多个数据对象集合的预测偏好值的步骤包括:
分别获取所述数据对象集合的集合特征向量;
获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
优选地,所述预测模型采用如下方式建立:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
优选地,所述分别获取所述数据对象集合的集合特征向量的步骤包括:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
优选地,所述数据对象包括标题信息,所述分别确定所述第一用户与所述数据对象集合的相关度的步骤包括:
根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
优选地,所述从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象的步骤包括:
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
依据所述选择的数据对象生成目标页面;
将所述目标页面返回客户端。
优选地,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
本申请实施例还公开了一种数据对象推送的装置,所述装置包括:
访问请求接收模块,用于接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
数据对象确定模块,用于针对所述访问请求确定一个或多个数据对象;
目标数据对象集合确定模块,用于从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
数据对象发送模块,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
优选地,所述目标数据对象集合确定模块包括:
实际偏好确定子模块,用于分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
目标数据对象集合选取子模块,用于选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
优选地,所述实际偏好确定子模块包括:
预测偏好获取单元,用于分别获取所述多个数据对象集合的预测偏好值;
相关度计算单元,用于分别确定所述第一用户与所述数据对象集合的相关度;
纠正单元,用于针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
优选地,所述预测偏好获取单元包括:
集合特征向量获取子单元,用于分别获取所述数据对象集合的集合特征向量;
用户特征向量获取子单元,用于获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
预测偏好计算子单元,用于分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
优选地,所述预测模型采用如下方式建立:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
优选地,所述集合特征向量获取子单元还用于:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
优选地,所述数据对象包括标题信息,所述相关度计算单元包括:
集合词向量计算子单元,用于根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
意图词向量计算子单元,用于获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
相似度计算子单元,用于分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
优选地,所述数据对象发送模块包括:
数据对象选择子模块,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
目标页面生成子模块,用于依据所述选择的数据对象生成目标页面;
目标页面返回子模块,用于将所述目标页面返回客户端。
优选地,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
与背景技术相比,本申请实施例包括以下优点:
在本申请实施例中,第二用户可以预设一个或多个数据对象集合,当接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求时,针对该请求确定一个或多个数据对象,以及,从所述多个数据对象集合中确定与第一用户相关的目标数据对象集合,并从目标数据对象集合和针对所述请求确定的一个或多个数据对象中,选择向客户端发送至少一个数据对象,使得第一用户对应的客户端所获得的数据对象更加符合第一用户偏好,实现精准的数据对象推送。
附图说明
图1是本申请的一种数据对象推送的方法实施例的步骤流程图;
图1a是本申请的一种数据对象推送的方法实施例中的目标页面示意图;
图2是本申请的一种数据对象推送的装置实施例的结构框图;
图3是本申请实施例的一种服务器结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
参照图1,示出了本申请的一种数据对象推送的方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求;
其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合。
具体而言,本申请实施例的用户至少可以包括第一用户以及第二用户,其中,第二用户为数据对象的提供方,第一用户为被推送方。
第二用户可以具有关联的多个数据对象,该数据对象可以在指定网站的展现页面中展现和/或在指定网站中第二用户关联的页面中展现。
在实际中,展现页面中还可以展现该第二用户关联的页面的相关信息,例如,该第二用户关联的页面的页面标识信息和/或页面链接信息等,当点击该第二用户关联的页面的相关信息以后,可以跳转至该第二用户关联的页面,其中,第二用户关联的页面中可以包括多个第二用户关联的数据对象。
在具体实现中,展现页面中展现的数据对象中可以包括链接信息,当该数据对象被选中时,可以跳转至链接信息对应的页面,作为一种示例,该链接信息对应的页面可以为该数据对象的详情页面或者为该第二用户关联的页面。
进一步地,本申请实施例中第二用户还可以将关联的多个数据对象组合成多个数据对象集合,该数据对象集合可以为具有关联关系的多个数据对象所组合成的集合。例如,第二用户可以将数据对象I1、I2、I3关联在一个数据对象集合G1中,将数据对象I4、I5关联在数据对象集合G2中,将数据对象I6、I7、I8、I9关联在数据对象集合G3中。
在本申请实施例中,第一用户可以通过第一用户对应的客户端发送对第二用户关联的数据对象访问请求。其中,作为一种示例,第一用户对应的客户端可以包括指定网站的客户端或浏览器客户端。
在具体实现中,第一用户可以采用如下方式的至少一种发出访问请求:
(1)第一用户可以在第一用户对应的客户端中加载展现页面,该展现页面中包括第二用户关联的数据对象在内的多个数据对象,当第一用户在展现页面中选中第二用户关联的数据对象时,则判定为第一用户发出了针对该第二用户关联的数据对象的访问请求。
(2)若展现页面中展现的数据对象较多,第一用户还可以通过搜索的方式在展现页面中查找所需的第二用户关联的数据对象,在查找成功时,点击该第二用户关联的数据对象,此时可以判定为第一用户发出了针对该第二用户关联的数据对象的访问请求。
(3)第一用户还可以调用第一用户对应的客户端所提供的接口来传入第二用户关联的数据对象的链接地址,以发出针对该数据对象的访问请求。
(4)若展现页面中展现第二用户关联的页面的相关信息,若第一用户点击该第二用户关联的页面的相关信息,则可以判定为第一用户发出了针对该第二用户关联的数据对象的访问请求。
(5)第一用户还可以调用第一用户对应的客户端所提供的接口来传入第二用户关联的页面的链接地址,以发出针对该数据对象的访问请求。
需要说明的是,上述第一用户对应的客户端发出对第二用户关联的数据对象访问请求的方式仅仅是本申请实施例的示例,本领域技术人员采用其他方式通过第一用户对应的客户端发出对第二用户关联的数据对象访问请求均是可以的,本申请实施例对此不作限定。
本申请实施例可以应用于电子商务的场景中,则该第一用户可以为买家用户,该第二用户可以为卖家用户,该第二用户关联的页面可以为卖家用户的店铺所在的页面;该第二用户关联的数据对象可以为卖家用户所售卖的商品,该数据对象集合可以为同一店铺中具有关联关系的商品的组合。例如,在电商网站中,卖家可以预先将其销售的具有相关性的多个商品组合起来,得到商品组合,如,可以将牙刷、牙膏、杯子组合起来,或者,将手机、手机壳、手机贴膜、耳机线、充电器等与手机相关的商品组合起来。
步骤102,针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
在本申请实施例中,当接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求以后,可以针对该访问请求确定与第一用户的实时访问意图对应的一个或多个第二用户关联的数据对象。
在具体实现中,若第一用户通过在展现页面中选中第二用户关联的数据对象和/或传入第二用户关联的数据对象的链接地址来发出访问请求,则依据该访问请求可以直接确定对应的数据对象。
若第一用户通过在展现页面中选中第二用户关联的页面的相关信息和/或传入第二用户关联的页面的链接地址来发出访问请求,则可以根据访问请求确定第二用户关联的页面,从而获得第二用户关联的页面所包含的数据对象作为与访问请求对应的数据对象。
应用于本申请实施例,当接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求以后,还可以依据该访问请求确定第二用户关联的多个数据对象集合,并从该多个数据对象集合中提取目标数据对象集合,其中,该目标数据对象集合为该多个数据对象集合中与第一用户的最相关的数据对象集合。
在本申请实施例的一种优选实施例中,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合的步骤可以包括如下子步骤:
子步骤S11,分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
本申请实施例中实际偏好值的计算需要考虑第一用户实时的访问行为。
在本申请实施例的一种优选实施例中,子步骤S11进一步可以包括如下子步骤:
子步骤S111,分别获取所述多个数据对象集合的预测偏好值;
在本申请实施例中,预测偏好值可以为离线计算的数值,该值的计算可以不考虑用户实时的访问行为,而是根据数据对象集合的特征以及指定网站中的多维特征进行综合分析后计算得到的数值。
在本申请实施例的一种优选实施例中,子步骤S111进一步可以包括如下子步骤:
子步骤S1111,分别获取所述数据对象集合的集合特征向量;
在本申请实施例的一种优选实施例中,子步骤S1111进一步可以包括:获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
具体而言,每个数据对象均有反映该数据对象的属性的属性特征,例如,若数据对象为商品,则对应的属性特征可以包括但不限于:商品的品类、价格、销量、商品的定位、功效、购买该商品的用户的性别分布、年龄分布等。
确定数据对象的属性特征以后,可以首先获取数据对象的属性特征的特征值vj(第j个数据对象的属性特征的特征值),并根据该特征值vj计算该数据对象的属性特征向量
Figure BDA0001056129050000111
属性特征的特征值可以根据调用指定的接口获取。
数学上,线性变换的特征向量(本征向量)是一个非退化的向量,其方向在该变换下不变。该向量在此变换下缩放的比例称为其特征值(本征值)。如果向量v与变换满足Av=λv,则称向量v是变换A的一个特征向量,λ是相应的特征值。
本申请实施例可以采用通用的根据特征值计算特征向量的方式计算属性特征向量,例如,一旦确定特征值λ,相应的特征向量可以通过求解方程(A-λ1)v=0得到,本申请实施例对特征向量的计算方式不作限定。
在本申请实施例中,根据数据对象集合中所包含的所有数据对象的属性特征值和属性特征向量,可以获取该数据对象集合的一个或多个集合特征向量
Figure BDA0001056129050000112
以实时将数据对象集合特征化到数据对象相同的向量空间中。
在一种实施方式中,可以采用如下公式(1)计算数据对象集合的集合特征向量
Figure BDA0001056129050000113
Figure BDA0001056129050000114
在公式(1)中,采用了对数函数对数据对象的属性特征的特征值做了平滑,可以看出,数据对象的属性特征的特征值越大,该数据对象在数据对象集合中所占的比例越大。例如,商品的销量越大,该商品在商品组合中所占的比例越大。
当然,上述公式(1)仅仅是本申请实施例的一种示例,本领域技术人员还可以采用其他方式计算数据对象集合的集合特征向量,本申请实施例对此不作限定。
子步骤S1112,获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
具体的,全网用户是指指定网站中每个访客用户。
作为本申请实施例的一种优选示例,用户特征可以包括行为特征和/或人口属性特征,其中,行为特征可以包括但不限于:用户对数据对象的浏览、收藏等行为;人口属性特征可以包括但不限于:用户的性别、年龄、职业等。
在具体实现中,可以从指定网站的日志记录中获取用户的行为特征,以及,从指定网站的用户数据库中获取用户的人口属性特征,该用户数据库记录了每个注册用户的人口属性特征等信息。
确定行为特征和/或人口属性特征以后,可以首先获取所有用户的某一人口属性特征和/或行为特征的特征值,对该所有用户的特征值进行汇总后求平均特征值,然后根据该平均特征值计算用户特征向量
Figure BDA0001056129050000121
根据特征值计算特征向量的方式如上述子步骤S1111所述,本申请实施例对此不再赘述。
子步骤S1113,分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
预置的预测模型可以为离线训练得到的模型,在本申请实施例的一种优选实施例中,预测模型可以采用如下方式建立,但应当理解的是,本申请实施例并不限于此,本领域技术人员采用其他方式建立作用相同的预测模型均是可以的:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;获取所述第二用户关联的数据对象的属性特征向量;获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;对所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
具体的,访客特征向量的计算方式与上述用户特征向量的计算方式类似,只是用户特征向量的数据来源于全网的所有访客的访问行为,而访客特征向量的数据来源于所有访问所述第二用户的关联页面的访客的访问行为。
也即,访客特征向量根据访客特征值获取,而访客特征值为访客特征的特征值,访客特征可以包括包括行为特征和/或人口属性特征,其中,行为特征可以包括但不限于:访客对第二用户相关联的数据对象的浏览、收藏等行为;人口属性特征可以包括但不限于:访客的性别、年龄、职业等。
数据对象的属性特征向量如上述子步骤S1111的描述,此处不再赘述了。
所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据可以为访问第二用户的关联页面的访客对关联页面中的数据对象的访问行为,该访问行为可以表示为(u,i),其中,u为访问关联页面的访客标识,i为该访客在关联页面中访问的数据对象标识。
在具体实现中,一条(u,i)可以作为一个样本信息。在该(u,i)中,若u对i执行了指定操作,则该样本信息为正样本,否则,若u对i没有执行指定操作,则该样本信息为负样本。例如,在电子商务应用场景中,如果用户浏览了某个商品并且购买了该商品,则这条样本为一条正样本,否则,如果用户浏览了某个商品但是没有购买该商品,则这条样本为一条负样本。
当确定样本信息、属性特征向量以及访客特征向量以后,可以将其作为建模入参,采用预设的建模算法进行建模,以获得预测模型。作为一种示例,该建模算法可以为MPI(Message Passing Interface,标准消息传递界面,可以用于并行计算)-GBDT(GradientBoosting Decision Tree,一种广泛用于分类或回归问题的机器学习算法,一种迭代的决策树算法,该算法由多颗决策树组成,所有树的结论累加起来作最终答案)算法,建模后得到的是非线性的预测模型。
该预测模型的作用是根据第二用户的关联页面的访客的历史访问数据以及关联页面中的数据对象的属性特征,预估未来第一用户对某一个数据对象发生指定操作的概率。例如,根据店内访客、商品等历史行为数据,预估未来用户对某一个商品产生购买关系的概率。
在本申请实施例的一种优选实施例中,分别将每个集合特征向量以及用户特征向量输入预置的预测模型后,输出的用户对各数据对象集合的预测偏好值可以表示如下:
Figure BDA0001056129050000141
子步骤S112,分别确定所述第一用户与所述数据对象集合的相关度;
应用于本申请实施例,还可以计算第一用户与每个数据对象集合的相关度。
在本申请实施例的一种优选实施例中,子步骤S112进一步可以包括如下子步骤:
子步骤S1121,根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,词向量(Word Embedding,或称为Word Representation)就是用来将语言中的词进行数学化的一种方式,在本申请实施例中,词向量用于表示每个数据对象的词向量。
在一种实施方式中,预置的词向量模型可以采用如下方式生成:
每个数据对象在指定网站中具有标题信息,将指定网站中每个数据对象的标题信息作为语料,采用基于神经网络的词向量算法对语料进行训练,得到一个多维的词向量模型,该词向量模型包括多个数据对象的词向量。
在具体实现中,基于神经网络的词向量算法可以包括循环神经网络算法、递归神经网络算法等,以下对其中一种神经网络算法的原理进行示例性说明:
假设语料中前n-1个数据对象分别为wt-n+1,…,wt-2,wt-1,现在需要根据这已知的n-1个数据对象预测下一个数据对象wt。C(w)表示数据对象w所对应的词向量,整个模型中使用的是一套唯一的词向量,存在矩阵C(|V|×m的矩阵)中,其中|V|表示词表的大小(语料中的总词数),m表示词向量的维度。w到C(w)的转化就是从矩阵中取出一行,网络的第一层(输入层)是将C(wt-n+1),…,C(wt-2),C(wt-1)这n-1个向量首尾相接拼起来,形成一个(n-1)m维的向量,下面记为x。网络的第二层(隐藏层)直接使用d+Hx计算得到,d是一个偏置项。在此之后,使用tanh作为激活函数。网络的第三层(输出层)一共有|V|个节点,每个节点yi表示下一个词为i的未归一化log概率。最后使用softmax激活函数将输出值y归一化成概率。最终,y的计算公式为:
y=b+Wx+Utanh(d+Hx)
其中,U(|V|×h的矩阵)是隐藏层到输出层的参数,整个模型的多数计算集中在U和隐藏层的矩阵乘法中;W(|V|×(n-1)m)矩阵包含了从输入层到输出层的直连边(直连边就是从输入层直接到输出层的一个线性变换),如果不需要直连边的话,将W置为0就可以了。最后,用随机梯度下降法则可以得到词向量模型。
得到词向量模型以后,还可以将词向量模型同步到存储中,供实时计算使用。
在本申请实施例中,可以根据词向量模型以及数据对象的属性特征计算每个数据对象集合的集合词向量
Figure BDA0001056129050000151
在一种实施方式中,可以采用下述公式(2)计算集合词向量
Figure BDA0001056129050000152
Figure BDA0001056129050000153
其中,vj为第j个数据对象的属性特征的特征值,同时采用对数函数做了平滑,
Figure BDA0001056129050000161
为第j个数据对象的词向量。
子步骤S1122,获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
在本申请实施例中,可以结合第一用户的历史浏览行为来预测用户的实时意图。具体的,可以获取第一用户最近浏览的指定数量的数据对象(例如,当天最近浏览的10个商品),并获取该指定数量的数据对象的词向量,根据该指定数量的数据对象的词向量来获取第一用户的意图词向量。
在一种实施方式中,可以采用如下公式(3)计算第一用户的意图词向量:
Figure BDA0001056129050000162
其中,Tj为用户u浏览的数据对象距离当前时间的秒数,α为衰减系数。
从上述公式(3)可知,越是最近浏览的数据对象,对用户当前的意图的预测贡献度越大。
子步骤S1123,分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
当获得第一用户的意图词向量以及每个数据对象集合的集合词向量以后,可以分别计算两者的相似度,该相似度反映的是第一用户与对应的数据对象集合的相关程度。
在一种实施方式中,可以采用如下公式(4)计算意图词向量以及每个集合词向量的相似度:
Figure BDA0001056129050000163
子步骤S113,针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
在本申请实施例中,得到第一用户的意图词向量以及每个集合词向量的相关程度以后,可以根据相关程度对预测偏好值进行纠正,得到第一用户与每个数据对象集合的实际偏好值。
在一种实施方式中,可以采用下述公式(5)计算实际偏好值:
Figure BDA0001056129050000171
其中,λ为融合参数。
子步骤S12,选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
在本申请实施例中,得到第一用户与每个数据对象集合的实际偏好值以后,可以将实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
步骤103,从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
在本申请实施例中,根据访问请求确定对应的一个或多个数据对象以及目标数据对象集合以后,可以从中选择至少一个数据对象发送至客户端,以在客户端中展现该选择的数据对象。
在本申请实施例的一种优选实施例中,步骤103进一步可以包括如下子步骤:
子步骤S21,从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
子步骤S22,依据所述选择的数据对象生成目标页面;
子步骤S23,将所述目标页面返回客户端。
具体而言,当根据访问请求确定对应的一个或多个数据对象以及确定目标数据对象集合以后,可以从目标数据对象集合所包含的多个数据对象以及访问请求对应的一个或多个数据对象中,选择一个或多个数据对象,作为向第一用户展现的数据对象。在具体实现中,该选择的方式可以为随机选择或者按照预设的优先级策略进行选择,例如,优先选择对应的数据对象,然后选择目标数据集合中的数据对象。
随后,可以依据该选择的数据对象生成目标页面,并将该目标页面返回客户端,以在客户端中展现该目标页面。
例如,参考图1a所示的目标页面示意图,其中,该目标页面可以展现在移动终端的应用程序app客户端中,或者,该目标页面还可以展现在PC端或移动终端的浏览器客户端中。在客户端展现的目标页面10中,可以包括多个与访问请求对应的数据对象20以及多个与第一用户相关的数据对象集合30,每个数据对象集合30中可以包括多个数据对象20,使得目标页面展现的内容跟符合用户偏好。
在本申请实施例中,第二用户可以预设一个或多个数据对象集合,当接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求时,针对该请求确定一个或多个数据对象,以及,从所述多个数据对象集合中确定与第一用户相关的目标数据对象集合,并从目标数据对象集合和针对所述请求确定的一个或多个数据对象中,选择向客户端发送至少一个数据对象,使得第一用户对应的客户端所获得的数据对象更加符合第一用户偏好,实现精准的数据对象推送。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图2,示出了本申请的一种数据对象推送的装置实施例的结构框图,可以包括如下模块:
访问请求接收模块201,用于接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
数据对象确定模块202,用于针对所述访问请求确定一个或多个数据对象;
目标数据对象集合确定模块203,用于从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
数据对象发送模块204,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
在本申请实施例的一种优选实施例中,所述目标数据对象集合确定模块203可以包括如下子模块:
实际偏好确定子模块,用于分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
目标数据对象集合选取子模块,用于选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
在本申请实施例的一种优选实施例中,所述实际偏好确定子模块进一步可以包括如下单元:
预测偏好获取单元,用于分别获取所述多个数据对象集合的预测偏好值;
相关度计算单元,用于分别确定所述第一用户与所述数据对象集合的相关度;
纠正单元,用于针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
在本申请实施例的一种优选实施例中,所述预测偏好获取单元进一步可以包括如下子单元:
集合特征向量获取子单元,用于分别获取所述数据对象集合的集合特征向量;
用户特征向量获取子单元,用于获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
预测偏好计算子单元,用于分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
在本申请实施例的一种优选实施例中,所述预测模型采用如下方式建立:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
在本申请实施例的一种优选实施例中,所述集合特征向量获取子单元还用于:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
在本申请实施例的一种优选实施例中,所述数据对象包括标题信息,所述相关度计算单元进一步可以包括如下子单元:
集合词向量计算子单元,用于根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
意图词向量计算子单元,用于获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
相似度计算子单元,用于分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
在本申请实施例的一种优选实施例中,所述数据对象发送模块204可以包括如下子模块:
数据对象选择子模块,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
目标页面生成子模块,用于依据所述选择的数据对象生成目标页面;
目标页面返回子模块,用于将所述目标页面返回客户端。
在本申请实施例的一种优选实施例中,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
对于装置实施例而言,由于其与上述方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例还提供了一种数据对象推送的系统,该数据对象推送的系统可以包括:
一个或多个处理器;
存储器;和
一个或多个模块,该一个或多个模块存储于存储器中并被配置成由一个或多个处理器执行,其中,该一个或多个模块具有如下功能:
接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
可选地,该一个或多个模块可以具有如下功能:
分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
可选地,该一个或多个模块可以具有如下功能:
分别获取所述多个数据对象集合的预测偏好值;
分别确定所述第一用户与所述数据对象集合的相关度;
针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
可选地,该一个或多个模块可以具有如下功能:
分别获取所述数据对象集合的集合特征向量;
获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
可选地,该一个或多个模块可以具有如下功能:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
可选地,该一个或多个模块可以具有如下功能:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
可选地,该一个或多个模块可以具有如下功能:
根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
可选地,该一个或多个模块可以具有如下功能:
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
依据所述选择的数据对象生成目标页面;
将所述目标页面返回客户端。
可选地,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
图3是本申请实施例提供的一种服务器结构示意图。该服务器300可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processingunits,CPU)322(例如,一个或一个以上处理器)和存储器332,一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中,存储器332和存储介质330可以是短暂存储的或持久存储的。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器322可以设置为与存储介质330通信,在服务器300上执行存储介质330中的一系列指令操作。
服务器300还可以包括一个或一个以上电源326,一个或一个以上有线或无线网络接口350,一个或一个以上输入输出接口358,一个或一个以上键盘356,和/或,一个或一个以上操作系统341,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
一方面,中央处理器322可以在服务器300上执行以下操作的指令:
接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
分别获取所述多个数据对象集合的预测偏好值;
分别确定所述第一用户与所述数据对象集合的相关度;
针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
分别获取所述数据对象集合的集合特征向量;
获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
可选地,中央处理器322还可以在服务器300上执行以下操作的指令:
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
依据所述选择的数据对象生成目标页面;
将所述目标页面返回客户端。
可选地,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序操作指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序操作指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的操作指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序操作指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的操作指令产生包括操作指令装置的制造品,该操作指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序操作指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的操作指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种数据对象推送的方法、装置及系统进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (19)

1.一种数据对象推送的系统,其特征在于,所述系统包括:
一个或多个处理器;
存储器;和
一个或多个模块,所述一个或多个模块存储于所述存储器中并被配置成由所述一个或多个处理器执行,所述一个或多个模块具有如下功能:
接收第一用户对应的客户端发送的第二用户关联的数据对象的访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象;
其中,所述目标数据对象集合依据所述第一用户实时的访问行为所确定。
2.一种数据对象推送的方法,其特征在于,所述方法包括:
接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
针对所述访问请求确定一个或多个数据对象,以及,从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象;
其中,所述目标数据对象集合依据所述第一用户实时的访问行为所确定。
3.根据权利要求2所述的方法,其特征在于,所述从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合的步骤包括:
分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
4.根据权利要求3所述的方法,其特征在于,所述分别确定所述第一用户与所述多个数据对象集合的实际偏好值的步骤包括:
分别获取所述多个数据对象集合的预测偏好值;
分别确定所述第一用户与所述数据对象集合的相关度;
针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
5.根据权利要求4所述的方法,其特征在于,所述分别获取所述多个数据对象集合的预测偏好值的步骤包括:
分别获取所述数据对象集合的集合特征向量;
获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
6.根据权利要求5所述的方法,其特征在于,所述预测模型采用如下方式建立:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
7.根据权利要求5或6所述的方法,其特征在于,所述分别获取所述数据对象集合的集合特征向量的步骤包括:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
8.根据权利要求4所述的方法,其特征在于,所述数据对象包括标题信息,所述分别确定所述第一用户与所述数据对象集合的相关度的步骤包括:
根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
9.根据权利要求2所述的方法,其特征在于,所述从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象的步骤包括:
从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
依据所述选择的数据对象生成目标页面;
将所述目标页面返回客户端。
10.根据权利要求2-6任一项所述的方法,其特征在于,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
11.一种数据对象推送的装置,其特征在于,所述装置包括:
访问请求接收模块,用于接收第一用户对应的客户端发送的第二用户关联的数据对象访问请求,其中,所述第二用户具有关联的多个数据对象,以及,依据所述多个数据对象确定的多个数据对象集合;
数据对象确定模块,用于针对所述访问请求确定一个或多个数据对象;
目标数据对象集合确定模块,用于从所述多个数据对象集合中,确定与所述第一用户相关的目标数据对象集合;
数据对象发送模块,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择向所述客户端发送至少一个数据对象;
其中,所述目标数据对象集合依据所述第一用户实时的访问行为所确定。
12.根据权利要求11所述的装置,其特征在于,所述目标数据对象集合确定模块包括:
实际偏好确定子模块,用于分别确定所述第一用户与所述多个数据对象集合的实际偏好值;
目标数据对象集合选取子模块,用于选取所述实际偏好值最大的前N个数据对象集合,作为与所述第一用户相关的目标数据对象集合,其中,N为正整数且N小于数据对象集合的数量。
13.根据权利要求12所述的装置,其特征在于,所述实际偏好确定子模块包括:
预测偏好获取单元,用于分别获取所述多个数据对象集合的预测偏好值;
相关度计算单元,用于分别确定所述第一用户与所述数据对象集合的相关度;
纠正单元,用于针对每个数据对象集合,分别采用所述相关度对所述预测偏好值进行纠正,得到所述第一用户与所述数据对象集合的实际偏好值。
14.根据权利要求13所述的装置,其特征在于,所述预测偏好获取单元包括:
集合特征向量获取子单元,用于分别获取所述数据对象集合的集合特征向量;
用户特征向量获取子单元,用于获取全网用户的用户特征的特征值,并依据所述用户特征的特征值确定对应的用户特征向量;
预测偏好计算子单元,用于分别将所述集合特征向量以及所述用户特征向量输入预置的预测模型,以获得所述数据对象集合的预测偏好值。
15.根据权利要求14所述的装置,其特征在于,所述预测模型采用如下方式建立:
获取所有访问所述第二用户的关联页面的访客在全网的访客特征向量;
获取所述第二用户关联的数据对象的属性特征向量;
获取所有访问所述第二用户的关联页面的访客在所述关联页面中的访问行为数据,作为样本信息;
依据所述样本信息、所述属性特征向量以及所述访客特征向量进行建模,生成预测模型。
16.根据权利要求14或15所述的装置,其特征在于,所述集合特征向量获取子单元还用于:
获取所述数据对象集合中每个数据对象的属性特征的特征值和特征向量;
对所述数据对象集合中所有数据对象的属性特征的特征值和特征向量进行汇总,获得所述数据对象集合的集合特征向量。
17.根据权利要求13所述的装置,其特征在于,所述数据对象包括标题信息,所述相关度计算单元包括:
集合词向量计算子单元,用于根据预置的词向量模型,分别计算所述数据对象集合的集合词向量;
意图词向量计算子单元,用于获取第一用户最近浏览的指定数量的数据对象,并基于所述指定数量的数据对象获取所述第一用户的意图词向量;
相似度计算子单元,用于分别计算所述意图词向量以及每个集合词向量的相似度,作为所述第一用户与对应的数据对象集合的相关度。
18.根据权利要求11所述的装置,其特征在于,所述数据对象发送模块包括:
数据对象选择子模块,用于从所述目标数据对象集合和所述针对所述访问请求确定的一个或多个数据对象中,选择至少一个数据对象;
目标页面生成子模块,用于依据所述选择的数据对象生成目标页面;
目标页面返回子模块,用于将所述目标页面返回客户端。
19.根据权利要求11-15任一项所述的装置,其特征在于,所述第一用户为买家用户,所述第二用户为卖家用户,所述第二用户关联的数据对象为卖家用户所售卖的商品,所述数据对象集合为同一店铺中具有关联关系的商品的组合。
CN201610581054.0A 2016-07-21 2016-07-21 一种数据对象推送的方法、装置及系统 Active CN107644036B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201610581054.0A CN107644036B (zh) 2016-07-21 2016-07-21 一种数据对象推送的方法、装置及系统
TW106118715A TW201804400A (zh) 2016-07-21 2017-06-06 資料物件推送的方法、裝置及系統
PCT/CN2017/092743 WO2018014771A1 (zh) 2016-07-21 2017-07-13 一种数据对象推送的方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610581054.0A CN107644036B (zh) 2016-07-21 2016-07-21 一种数据对象推送的方法、装置及系统

Publications (2)

Publication Number Publication Date
CN107644036A CN107644036A (zh) 2018-01-30
CN107644036B true CN107644036B (zh) 2021-06-29

Family

ID=60991981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610581054.0A Active CN107644036B (zh) 2016-07-21 2016-07-21 一种数据对象推送的方法、装置及系统

Country Status (3)

Country Link
CN (1) CN107644036B (zh)
TW (1) TW201804400A (zh)
WO (1) WO2018014771A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109901B (zh) * 2018-02-02 2024-05-24 北京京东尚科信息技术有限公司 筛选目标对象的方法和装置
CN110324370B (zh) * 2018-03-29 2023-05-30 北京京东尚科信息技术有限公司 服务端向客户端推送数据的方法和装置
CN110517099A (zh) * 2018-05-22 2019-11-29 北京京东尚科信息技术有限公司 用于确定关联供应方的方法和装置
CN108898067B (zh) * 2018-06-06 2021-04-30 北京京东尚科信息技术有限公司 确定人和物关联度的方法、装置及计算机可读存储介质
CN110147882B (zh) * 2018-09-03 2023-02-10 腾讯科技(深圳)有限公司 神经网络模型的训练方法、人群扩散方法、装置及设备
CN110032860B (zh) * 2018-12-27 2020-07-28 阿里巴巴集团控股有限公司 登录方式的推送、展示方法、装置及设备
CN111724221A (zh) * 2019-03-19 2020-09-29 北京京东尚科信息技术有限公司 确定商品匹配信息的方法、系统、电子设备及存储介质
CN110378749B (zh) * 2019-07-25 2023-09-26 深圳前海微众银行股份有限公司 客户端相似性的评估方法、装置、终端设备及存储介质
CN113379436A (zh) * 2020-03-09 2021-09-10 阿里巴巴集团控股有限公司 信息处理方法、装置、计算设备及介质
CN112000884A (zh) * 2020-08-13 2020-11-27 腾讯音乐娱乐科技(深圳)有限公司 一种用户内容推荐方法及装置、服务器、存储介质
US11977728B1 (en) * 2022-12-22 2024-05-07 Lifetrack Medical Systems Private Ltd. Interface-integrated permissions configuration

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853463A (zh) * 2009-03-30 2010-10-06 北京邮电大学 基于客户特征的协同过滤推荐方法和系统
US8762388B2 (en) * 2010-09-09 2014-06-24 Ebay Inc. Sizing content recommendation system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101408960A (zh) * 2007-10-12 2009-04-15 阿里巴巴集团控股有限公司 一种个性化信息推荐方法和装置
CN102340514B (zh) * 2010-07-15 2015-07-29 腾讯科技(北京)有限公司 网络信息推送方法及系统
KR20120114444A (ko) * 2011-03-28 2012-10-17 삼성전자주식회사 사용자 구매 정보 관리 및 제공 방법과 그 장치
CN102663627A (zh) * 2012-04-26 2012-09-12 焦点科技股份有限公司 个性化推荐方法
CN103425677B (zh) * 2012-05-18 2016-08-24 阿里巴巴集团控股有限公司 关键词分类模型确定方法、关键词分类方法及装置
CN104866474B (zh) * 2014-02-20 2018-10-09 阿里巴巴集团控股有限公司 个性化数据搜索方法及装置
CN105450586A (zh) * 2014-07-24 2016-03-30 阿里巴巴集团控股有限公司 信息推送方法、系统、服务器及客户端
CN105590220A (zh) * 2014-10-24 2016-05-18 无锡蓝阳谐波科技有限公司 一种互联网商品的推送展示方法及装置
US9817903B2 (en) * 2014-11-25 2017-11-14 Ebay Inc. Methods and systems for social network based content recommendations

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853463A (zh) * 2009-03-30 2010-10-06 北京邮电大学 基于客户特征的协同过滤推荐方法和系统
US8762388B2 (en) * 2010-09-09 2014-06-24 Ebay Inc. Sizing content recommendation system

Also Published As

Publication number Publication date
TW201804400A (zh) 2018-02-01
WO2018014771A1 (zh) 2018-01-25
CN107644036A (zh) 2018-01-30

Similar Documents

Publication Publication Date Title
CN107644036B (zh) 一种数据对象推送的方法、装置及系统
JP6967612B2 (ja) 情報検索方法、装置及びシステム
WO2020034849A1 (zh) 音乐推荐的方法、装置、计算设备和介质
US9569499B2 (en) Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies
US9836765B2 (en) System and method for context-aware recommendation through user activity change detection
CN110162701B (zh) 内容推送方法、装置、计算机设备和存储介质
US9563705B2 (en) Re-ranking results in a search
WO2018196424A1 (zh) 推荐方法及装置
CN106557480B (zh) 查询改写的实现方法及装置
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
US11704376B2 (en) Retrieval of content using link-based search
CN110851699A (zh) 基于深度强化学习的信息流推荐方法、装置、设备及介质
CN111008335B (zh) 一种信息处理方法、装置、设备及存储介质
CN111695960A (zh) 一种对象推荐系统、方法、电子设备及存储介质
CN110084658B (zh) 物品匹配的方法和装置
CN110264277B (zh) 由计算设备执行的数据处理方法及装置、介质和计算设备
CN111914188A (zh) 推荐目标用户的选择方法、系统、设备及存储介质
CN111967924A (zh) 商品推荐方法、商品推荐装置、计算机设备和介质
CN114168843A (zh) 搜索词推荐方法、设备及存储介质
CN111429161A (zh) 特征提取方法、特征提取装置、存储介质及电子设备
CN111310025B (zh) 模型训练方法、数据处理方法、装置以及相关设备
CN114862480A (zh) 广告投放定向方法及其装置、设备、介质、产品
CN112036987B (zh) 确定推荐商品的方法和装置
CN111680213A (zh) 信息推荐方法、数据处理方法及装置
CN113469786A (zh) 物品推荐的方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant