CN113495985A - 物品推荐方法及装置、短视频推荐方法及装置和服务器 - Google Patents
物品推荐方法及装置、短视频推荐方法及装置和服务器 Download PDFInfo
- Publication number
- CN113495985A CN113495985A CN202010192059.0A CN202010192059A CN113495985A CN 113495985 A CN113495985 A CN 113495985A CN 202010192059 A CN202010192059 A CN 202010192059A CN 113495985 A CN113495985 A CN 113495985A
- Authority
- CN
- China
- Prior art keywords
- item
- information
- account
- article
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 230000004044 response Effects 0.000 claims abstract description 15
- 239000013598 vector Substances 0.000 claims description 100
- 238000003860 storage Methods 0.000 claims description 10
- 230000009466 transformation Effects 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 7
- 230000006399 behavior Effects 0.000 description 25
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 230000002452 interceptive effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000009471 action Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本公开关于一种物品推荐方法及装置、短视频推荐方法及装置和服务器。其中,该物品推荐方法包括:响应于第一账户对于第一物品的正向标记,生成正向标记信息,正向标记信息包括第一账户信息和第一物品信息;对正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本;在缓存的物品数据库中读取第二物品信息,物品数据库包括账户标记的物品信息;获取第二物品信息对应的第二账户信息,对第二账户信息和第二物品信息进行组合,得到负样本;根据正样本和负样本,对账户和物品进行匹配,得到用于向第一账户推荐的物品。本公开可有效解决数据偏差问题,能够较好地帮助用户发现潜在的兴趣点,通过提高推荐结果的发现性,提升了物品推荐效果。
Description
技术领域
本公开涉及物品数据推算技术领域,尤其涉及物品推荐方法及装置、短视频推荐方法及装置、服务器和存储介质。
背景技术
随着互联网技术的快速发展,如今每天产生的信息数以亿计,为了方便用户从大规模的数据中发现自身所需的信息,推荐系统应运而生。推荐系统是通过用户账户产生的历史数据,发现用户的信息需求、兴趣等,然后将用户感兴趣的信息、物品等推荐给用户账户。推荐系统一直致力于在推荐结果的发现性和相关性上寻求平衡,其中,相关性的推荐结果满足用户偏好,提高用户体验,发现性的推荐结果帮助用户发现潜在的兴趣点。
相关技术中,物品推荐方法多采用协同过滤方法,例如itemcf(Item basedcollaborative filtering)方法,该方法是通过挖掘物品之间的相关性,再基于用户账户的历史行为推荐相关物品,由此实现了为用户账户推荐与历史行为相似的物品。
然而,采用上述相关技术,很难挖掘用户的潜在兴趣点,导致推荐结果的发现性不足,推荐效果不佳。
发明内容
本公开提供一种物品推荐方法及装置、短视频推荐方法及装置、服务器和存储介质,以至少解决相关技术中推荐效果不佳的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种物品推荐方法,包括:
响应于第一账户对于第一物品的正向标记,生成正向标记信息,所述正向标记信息包括第一账户信息和第一物品信息;
对所述正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本;
在缓存的物品数据库中读取第二物品信息,所述物品数据库包括账户标记的物品信息;
获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本;
根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品。
在其中一个实施例中,所述响应于第一账户对于第一物品的正向标记,生成正向标记信息,包括:
响应于第一账户对于第一物品的正向标记,通过分布式日志系统收集第一账户信息和第一物品信息;
将所述第一账户信息和所述第一物品信息进行聚合,生成正向标记信息。
在其中一个实施例中,在获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本之后,还包括:
获取所述第一物品对应的曝光次数;
将所述曝光次数输入预设的缓存概率公式,计算得到所述第一物品对应的缓存概率;
若所述缓存概率小于预设阈值,则将所述第一物品信息缓存至所述物品数据库中。
在其中一个实施例中,所述根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品,包括:
将所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量;
根据所述账户偏好向量与所述物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向所述第一账户推荐的物品。
在其中一个实施例中,所述将所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量,包括:
将所述正样本和所述负样本输入至预设的物品推荐模型中,通过所述物品推荐模型对所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量,其中,
所述物品推荐模型的损失函数为:
其中,EUi表示账户偏好向量,EIi表示物品向量,batch表示正样本集,i表示正样本集中的任一正样本,negative表示负样本集,j表示负样本集中的任一负样本,n表示负样本集中负样本的数量。
在其中一个实施例中,所述根据所述账户偏好向量与所述物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向所述第一账户推荐的物品,包括:
根据所述物品向量,构建包含有所述物品向量的检索引擎;
将所述账户偏好向量输入所述检索引擎进行向量检索,并将排序位于前列的且满足预设数量的物品向量对应的物品,确定为用于向所述第一账户推荐的物品。
根据本公开实施例的第二方面,提供一种短视频推荐方法,包括:
应用第一方面的任一项实施例中所述的物品推荐方法,得到用于向所述第一账户推荐的短视频,并将包含所述短视频信息的推荐指令发送至所述第一账户并展示所述推荐的短视频。
根据本公开实施例的第三方面,提供一种物品推荐装置,包括:
标记信息生成模块,被配置为执行响应于第一账户对于第一物品的正向标记,生成正向标记信息,所述正向标记信息包括第一账户信息和第一物品信息;
正样本获取模块,被配置为执行对所述正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本;
物品信息读取模块,被配置为执行在缓存的物品数据库中读取第二物品信息,所述物品数据库包括账户标记的物品信息;
负样本获取模块,被配置为执行获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本;
推荐物品确定模块,被配置为执行根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品。
在其中一个实施例中,所述标记信息生成模块具体被配置为执行响应于第一账户对于第一物品的正向标记,通过分布式日志系统收集第一账户信息和第一物品信息;将所述第一账户信息和所述第一物品信息进行聚合,生成正向标记信息。
在其中一个实施例中,还包括:
曝光次数获取模块,被配置为执行获取所述第一物品对应的曝光次数;
缓存概率计算模块,被配置为执行将所述曝光次数输入预设的缓存概率公式,计算得到所述第一物品对应的缓存概率;
物品信息缓存模块,被配置为执行若所述缓存概率小于预设阈值,则将所述第一物品信息缓存至所述物品数据库中。
在其中一个实施例中,所述推荐物品确定模块具体被配置为执行将所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量;根据所述账户偏好向量与所述物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向所述第一账户推荐的物品。
在其中一个实施例中,所述推荐物品确定模块具体被配置为执行将所述正样本和所述负样本输入至预设的物品推荐模型中,通过所述物品推荐模型对所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量,其中,
所述物品推荐模型的损失函数为:
其中,EUi表示账户偏好向量,EIi表示物品向量,batch表示正样本集,i表示正样本集中的任一正样本,negative表示负样本集,j表示负样本集中的任一负样本,n表示负样本集中负样本的数量。
在其中一个实施例中,所述推荐物品确定模块具体被配置为执行根据所述物品向量,构建包含有所述物品向量的检索引擎;将所述账户偏好向量输入所述检索引擎进行向量检索,并将排序位于前列的且满足预设数量的物品向量对应的物品,确定为用于向所述第一账户推荐的物品。
根据本公开实施例的第四方面,提供一种短视频推荐装置,包括:
第三方面的任一项实施例中所述的物品推荐装置,通过所述装置得到用于向所述第一账户推荐的短视频;
推荐指令发送模块,被配置为执行将包含所述短视频信息的推荐指令发送至所述第一账户;
短视频展示模块,被配置为执行展示所述推荐的短视频。
根据本公开实施例的第五方面,提供一种服务器,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现第一方面的任一项实施例中所述的物品推荐方法或第二方面的任一项实施例中所述的短视频推荐方法。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行第一方面的任一项实施例中所述的物品推荐方法或第二方面的任一项实施例中所述的短视频推荐方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序,使得设备执行第一方面的任一项实施例中所述的物品推荐方法或第二方面的任一项实施例中所述的短视频推荐方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
上述物品推荐方法及装置、短视频推荐方法及装置、服务器和存储介质,在发生正向标记(如点赞、关注、转发等)过程中,将直接相关的第一账户信息和第一物品信息组合得到正样本,同时,将缓存的且存在标记行为的第二账户信息和第二物品信息组合得到负样本,进而通过对该正样本和负样本的处理,完成账户与物品的匹配,得到用于向第一账户推荐的物品。由于正样本是由发生正向标记行为的直接相关的信息构建而成,负样本是由发生标记行为的直接相关的信息构成,正负样本的选取都与账户的标记行为相关,可有效解决数据偏差问题,能够较好地帮助用户发现潜在的兴趣点,协助用户找到所需的物品,通过提高推荐结果的发现性,提升了物品推荐效果,并且中长尾物品也容易被推荐,提升中长尾物品的推荐次数,对中长尾物品更为友好。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种物品推荐方法的应用环境图。
图2是根据一示例性实施例示出的一种物品推荐方法的流程图。
图3是根据一示例性实施例示出的生成正向标记信息的补充方案的流程图。
图4是根据一示例性实施例示出的第一物品信息缓存至物品数据库的实现方案的流程图。
图5是根据一示例性实施例示出的根据正样本和负样本得到用于向第一账户推荐的物品的补充方案的流程图。
图6是根据一示例性实施例示出的根据账户偏好向量与物品向量之间的相似度得到用于向第一账户推荐的物品的补充方案的流程图。
图7是根据一示例性实施例示出的一种物品推荐装置的框图。
图8是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开提供的物品推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。具体地,第一账户可在终端102中对第一物品进行正向标记,如点赞标记、关注标记等。服务器104获取终端102上传的第一账户信息和第一物品信息,并根据这些信息构建正样本,并且,服务器104在物品缓存队列中读取第二物品信息,并根据该第二物品信息构建负样本,之后将该正样本和负样本输入至预设的物品推荐模型,得到账户偏好向量和物品向量,并根据账户偏好向量和物品向量进行最近邻检索,得到用于向第一账户推荐的第一物品。终端102可向第一账户对应的用户显示该推荐物品。
其中,客户端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
图2是根据一示例性实施例示出的一种物品推荐方法的流程图。该物品推荐方法用于服务器中,如图2所示,包括以下步骤:
在步骤S202中,响应于第一账户对于第一物品的正向标记,生成正向标记信息,正向标记信息包括第一账户信息和第一物品信息。
其中,正向标记用于表征用户因感兴趣而做出的交互行为所对应的标记。用户因感兴趣而做出的交互行为包括点赞、关注、转发等交互行为,对应地,正向标记可以是点赞标记、关注标记及转发标记等等。
其中,第一账户可包含多个用户对应的账户。
具体地,在第一用户通过终端对第一物品做出正向交互行为时,例如用户A点赞了短视频a,或者用户B关注了文章b,此时终端检测到第一用户对应的第一账户对第一物品进行了正向标记,并将包含第一账户信息和第一物品信息的正向标记请求发送给服务器。服务器通过解析该正向标记请求得到第一账户信息和第一物品信息,并将第一账户信息和第一物品信息聚合生成正向标记信息。
在步骤S204中,对正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本。
可选地,第一账户信息包括第一账户标识,第一账户标识用于唯一的识别第一账户。第一物品信息包括第一物品标识,第一物品标识用于唯一的识别第一物品。假设第一账户标识用User_i表示,第一物品标识用Item_i表示,服务器将User_i和Item_i组合成正样本<User_i,Item_i>。
在步骤S206中,在缓存的物品数据库中读取第二物品信息。
其中,物品数据库包括账户标记的物品信息。标记用于表征用户做出的交互行为所对应的标记。标记包括正向标记和负向标记,正向标记与负向标记含义相对。例如,负向标记包括投诉标记、举报标记等等。例如物品数据库包含账户点赞的短视频,或者账户关注的文章,亦或者账户举报的短视频等等。
具体地,服务器在缓存的物品数据库中读取第二物品信息。可选地,在分布式日志系统中设置的物品缓存队列中,服务器随机读取第二物品信息。其中,物品缓存队列可缓存在当前时间之前的预设时间段内账户所标记的物品信息。例如,假设当前时间为7月1日,预设时间段为10天,那么物品缓存队列中缓存了6月21日-6月30日期间账户标记的物品信息。可选地,物品缓存队列可采用循环数组队列或者链表队列。
在步骤S208中,获取第二物品信息对应的第二账户信息,对第二账户信息和第二物品信息进行组合,得到负样本。
可选地,第二账户信息包括第二账户标识,第二账户标识用于唯一的识别第二账户。第二物品信息包括第二物品标识,第二物品标识用于唯一的识别第二物品。假设第二账户标识用User_x表示,第二物品标识用Item_x表示,服务器将User_x和Item_x组合成负样本<User_x,Item_x>。
在步骤S210中,根据正样本和负样本,对账户和物品进行匹配,得到用于向第一账户推荐的物品。
具体地,服务器通过对该正样本和负样本的处理,完成账户与物品的匹配,得到用于向第一账户推荐的物品。更具体地,服务器将正样本和负样本进行向量转化,得到账户偏好向量和物品向量,根据账户偏好向量与物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向第一账户推荐的物品。
上述物品推荐方法及装置、短视频推荐方法及装置、服务器和存储介质,在发生正向标记(如点赞、关注、转发等)过程中,将直接相关的第一账户信息和第一物品信息组合得到正样本,同时,将缓存的且存在标记行为的第二账户信息和第二物品信息组合得到负样本,进而通过对该正样本和负样本的处理,完成账户与物品的匹配,得到用于向第一账户推荐的物品。由于正样本是由发生正向标记行为的直接相关的信息构建而成,负样本是由发生标记行为的直接相关的信息构成,正负样本的选取都与账户的标记行为相关,可有效解决数据偏差问题,能够较好地帮助用户发现潜在的兴趣点,协助用户找到所需的物品,通过提高推荐结果的发现性,提升了物品推荐效果,并且中长尾物品也容易被推荐,提升中长尾物品的推荐次数,对中长尾物品更为友好。
服务器将构建的正样本和负样本输入至预设的召回模型中进行词向量表达,得到账户偏好向量和物品向量,进而根据该账户偏好向量和物品向量进行最近邻检索,得到向目标账户推荐的物品。可选地,可采用Faiss或者HNSW(Hierarchcal Navigable SmallWorld graphs)进行最近邻检索。
图3是根据一示例性实施例示出的生成正向标记信息的补充方案的流程图。为了实现对大规模实时的数据进行物品推荐,在一示例性实施例中,步骤S202具体可以通过以下步骤实现:
在步骤S2022中,响应于第一账户对于第一物品的正向标记,通过分布式日志系统收集第一账户信息和第一物品信息。
在步骤S2024中,将第一账户信息和第一物品信息进行聚合,生成正向标记信息。
具体地,服务器采用分布式日志系统收集大规模的由第一用户实时的正向交互行为例如点击、点赞、关注、转发、收藏等行为而产生正向标记对应的第一账户信息和第一物品信息,并将这些第一账户信息和第一物品信息进行聚合,生成正向标记信息。其中,在聚合过程中,同一正向标记行为对应的第一账户信息和第一物品信息建立关联关系。
可选地,服务器采用Kafka分布式日志系统可实现大规模地收集不同用户终端上传的基于正向标记动作的第一账户信息和第一物品信息。具体地,Kafka分布式日志系统中包含分布式的多个生产(producer)模块,用来收集大规模的第一账户实时的正向标记动作,并将其发送给下游的消费(consumer)模块进行数据处理以得到该正向标记动作对应的第一账户信息和第一物品信息,在每个生产模块中,将第一账户信息和第一物品信息进行聚合,生成正向标记信息。通过对大量的信息进行归类、聚合,有利于数据的快速处理。
为了解决数据偏差问题,在一示例性实施例中,步骤S206具体可以通过以下步骤实现:
在步骤S2062中,在分布式日志系统中设置的物品缓存队列中,随机读取预设数量的第二物品。
具体地,通过在分布式日志系统中设置物品缓存队列,使得服务器可从物品缓存队列中随机读取预设数量的第二物品信息,从而根据该第二物品信息及其对应的第二账户信息构建负样本。可选地,服务器采用Kafka分布式日志系统构建负样本。具体而言,通过在Kafka分布式日志系统中的各个消费模块中部署循环数组队列,用以采集负样本。其中,循环数组队列采用先进先出的方式,缓存当前消费模块中最近的账户标记过的物品信息。服务器从当前的消费模块中的循环数组队列中随机读取N个第二物品信息,并获取该N个第二物品信息对应的第二账户信息,由它们共同构成样本对<User_i,Item_inegative_1>…<User_i,Item_inegative_n>作为负样本。
在本实施例中,采用分布式方式实时采样得到负样本,能很好地解决数据偏差问题,提高推荐结果的相关性。
进一步地,在一示例性实施例中,在步骤S208之后,该方法还包括以下步骤:
在步骤S2092中,获取第一物品对应的曝光次数。
在步骤S2094中,将所述曝光次数输入预设的缓存概率公式,计算得到所述第一物品对应的缓存概率。
在步骤S2096中,若所述缓存概率小于预设阈值,则将所述第一物品信息缓存至所述物品数据库中。
具体地,服务器根据第一物品的曝光次数和预设的概率公式f(freq(Item_ipositive)),计算第一物品对应的缓存概率,若该缓存概率小于预设阈值,则将第一物品信息缓存至物品缓存队列中,若该缓存概率大于或等于预设阈值,则舍弃第一物品信息,不将第一物品信息缓存至物品缓存队列中。
在本实施例中,将第一物品信息按照一定概率加入物品缓存队列,实现对物品缓存队列的实时更新,使得负样本的随机采样考虑了实时的热度信息,从而推荐的物品更加符合用户的需求。
在一示例性实施例中,召回模型的优化目标为:其中,Loss表示损失值,EUi表示账户偏好向量,EIi表示物品向量,batch表示正样本集,i表示正样本集中的任一正样本,negative表示负样本集,j表示负样本集中的任一负样本,n表示负样本集中负样本的数量。
具体地,召回模型的构建可参考Factorization Machine模型构建二分类问题,将账户的信息和物品信息分别表达为多维向量EU和EI,账户偏好向量EU和物品向量EI间通过内积方式得到logit,即logit=EU*EI。为了配合物品推荐场景的大规模实时数据的需求,本实施例在召回模型的训练上使用现有的在线学习方法,在此不在赘述。
在一示例性实施例中,步骤S210可以包括以下步骤:
在步骤S2102中,根据物品向量,构建包含有物品向量的检索引擎。
在步骤S2104中,将账户偏好向量输入检索引擎进行向量检索,并将排序位于前列的且满足预设数量的物品向量对应的物品,确定为用于向第一账户推荐的物品。
具体地,服务器在得到账户偏好向量EU和物品向量EI之后,先根据物品向量EI,构建检索引擎,进而在账户推荐请求到来时,通过查询当前的账户偏好向量,并基于构建好的检索引擎进行最近邻的检索,得到TopN的物品作为用于向第一账户推荐的物品以推荐给第一账户。
上述实施例涉及的物品推荐方法可应用于多种应用场景,例如但不限于短视频推荐、长视频推荐、文章推荐以及音乐推荐等实际应用场景。基于同一发明构思,在一示例性实施例中,提供了一种短视频推荐方法,包括以下步骤:
在步骤S232中,响应于第一账户对于第一短视频的正向标记,生成正向标记信息,其中,正向标记信息包括第一账户信息和第一短视频信息;
在步骤S234中,对正向标记信息中的第一账户信息和第一短视频信息进行组合,得到正样本;
在步骤S236中,在缓存的短视频数据库中读取第二短视频信息,其中,短视频数据库包括账户标记的短视频信息;
在步骤S238中,获取第二短视频信息对应的第二账户信息,对第二账户信息和第二短视频信息进行组合,得到负样本;
在步骤S240中,根据正样本和负样本,对账户和短视频进行匹配,得到用于向第一账户推荐的短视频。
具体地,本实施例涉及的步骤与上述实施例的实现过程基本一致,在此不再赘述。
上述短视频推荐方法,在发生正向标记(如点赞、关注、转发等)过程中,将直接相关的第一账户信息和第一短视频信息组合得到正样本,同时,将缓存的且存在标记行为的第二账户信息和第二短视频信息组合得到负样本,进而通过对该正样本和负样本的处理,完成账户与短视频的匹配,得到用于向第一账户推荐的短视频。由于正样本是由发生正向标记行为的直接相关的信息构建而成,负样本是由发生标记行为的直接相关的信息构成,正负样本的选取都与账户的标记行为相关,可有效解决数据偏差问题,能够较好地帮助用户发现潜在的兴趣点,协助用户找到所需的短视频,通过提高推荐结果的发现性,提升了短视频推荐效果,并且中长尾短视频也容易被推荐,提升中长尾短视频的推荐次数,对中长尾短视频更为友好。
需进一步补充说明,关于短视频推荐方法的其他实施例可参考上述涉及物品推荐方法的实施例,两者的发明构思是共通的,在此不再赘述。同理,关于文章推荐方法、音乐推荐方法等实施例也可以参考上述涉及物品推荐方法的实施例。
本申请通过将召回数据源应用在各种推荐场景中,如短视频、文章,经过AB测试证明,本公开所涉及的方法,能够提高账户在相应推荐场景的停留时长,提高推荐结果的相关性,降低账户负反馈的比例。
图4是根据一示例性实施例示出的一种物品推荐装置框图。请参照图4,该装置30包括标记信息生成模块302、正样本获取模块304、物品信息读取模块306、负样本获取模块308和推荐物品确定模块310。
该标记信息生成模块302被配置为执行响应于第一账户对于第一物品的正向标记,生成正向标记信息,正向标记信息包括第一账户信息和第一物品信息。
该正样本获取模块304被配置为执行对正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本。
该物品信息读取模块306被配置为执行在缓存的物品数据库中读取第二物品信息,物品数据库包括账户标记的物品信息。
该负样本获取模块308被配置为执行获取第二物品信息对应的第二账户信息,对第二账户信息和第二物品信息进行组合,得到负样本。
该推荐物品确定模块310被配置为执行根据正样本和负样本,对账户和物品进行匹配,得到用于向第一账户推荐的物品。
上述物品推荐装置中,在发生正向标记(如点赞、关注、转发等)过程中,将直接相关的第一账户信息和第一物品信息组合得到正样本,同时,将缓存的且存在标记行为的第二账户信息和第二物品信息组合得到负样本,进而通过对该正样本和负样本的处理,完成账户与物品的匹配,得到用于向第一账户推荐的物品。由于正样本是由发生正向标记行为的直接相关的信息构建而成,负样本是由发生标记行为的直接相关的信息构成,正负样本的选取都与账户的标记行为相关,可有效解决数据偏差问题,能够较好地帮助用户发现潜在的兴趣点,协助用户找到所需的物品,通过提高推荐结果的发现性,提升了物品推荐效果,并且中长尾物品也容易被推荐,提升中长尾物品的推荐次数,对中长尾物品更为友好。
在一示例性实施例中,该标记信息生成模块302具体被配置为执行响应于第一账户对于第一物品的正向标记,通过分布式日志系统收集第一账户信息和第一物品信息;将第一账户信息和第一物品信息进行聚合,生成正向标记信息。
在一示例性实施例中,该装置30还包括曝光次数获取模块、缓存概率计算模块和物品信息缓存模块。
该曝光次数获取模块被配置为执行获取第一物品对应的曝光次数。
该缓存概率计算模块被配置为执行将曝光次数输入预设的缓存概率公式,计算得到第一物品对应的缓存概率。
该物品信息缓存模块被配置为执行若缓存概率小于预设阈值,则将第一物品信息缓存至物品数据库中。
在一示例性实施例中,该推荐物品确定模块310具体被配置为执行将正样本和负样本进行向量转化,得到账户偏好向量和物品向量;根据账户偏好向量与物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向第一账户推荐的物品。
在一示例性实施例中,该推荐物品确定模块310具体被配置为执行将正样本和负样本输入至预设的物品推荐模型中,通过物品推荐模型对正样本和负样本进行向量转化,得到账户偏好向量和物品向量,其中,
物品推荐模型的损失函数为:
其中,EUi表示账户偏好向量,EIi表示物品向量,batch表示正样本集,i表示正样本集中的任一正样本,negative表示负样本集,j表示负样本集中的任一负样本,n表示负样本集中负样本的数量。
在一示例性实施例中,该推荐物品确定模块310具体被配置为执行根据物品向量,构建包含有物品向量的检索引擎;将账户偏好向量输入检索引擎进行向量检索,并将排序位于前列的且满足预设数量的物品向量对应的物品,确定为用于向第一账户推荐的物品。
在一示例性实施例中,提供一种短视频推荐装置,包括物品推荐装置、推荐指令发送模块和短视频展示模块。
通过该物品推荐装置得到用于向第一账户推荐的短视频。
该推荐指令发送模块被配置为执行将包含短视频信息的推荐指令发送至第一账户。
该短视频展示模块被配置为执行展示推荐的短视频。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图5是根据一示例性实施例示出的一种用于执行物品推荐方法的设备S00的框图。例如,设备S00可以为一服务器。参照图5,设备S00包括处理组件S20,其进一步包括一个或多个处理器,以及由存储器S22所代表的存储器资源,用于存储可由处理组件S20的执行的指令,例如应用程序。存储器S22中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件S20被配置为执行指令,以执行上述物品推荐方法。
设备S00还可以包括一个电源组件S24被配置为执行设备S00的电源管理,一个有线或无线网络接口S26被配置为将设备S00连接到网络,和一个输入输出(I/O)接口S28。设备S00可以操作基于存储在存储器S22的操作系统,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器S22,上述指令可由设备S00的处理器执行以完成上述方法。存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种物品推荐方法,其特征在于,包括:
响应于第一账户对于第一物品的正向标记,生成正向标记信息,所述正向标记信息包括第一账户信息和第一物品信息;
对所述正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本;
在缓存的物品数据库中读取第二物品信息,所述物品数据库包括账户标记的物品信息;
获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本;
根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品。
2.根据权利要求1所述的物品推荐方法,其特征在于,所述响应于第一账户对于第一物品的正向标记,生成正向标记信息,包括:
响应于第一账户对于第一物品的正向标记,通过分布式日志系统收集第一账户信息和第一物品信息;
将所述第一账户信息和所述第一物品信息进行聚合,生成正向标记信息。
3.根据权利要求1或2所述的物品推荐方法,其特征在于,在获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本之后,还包括:
获取所述第一物品对应的曝光次数;
将所述曝光次数输入预设的缓存概率公式,计算得到所述第一物品对应的缓存概率;
若所述缓存概率小于预设阈值,则将所述第一物品信息缓存至所述物品数据库中。
4.根据权利要求1所述的物品推荐方法,其特征在于,所述根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品,包括:
将所述正样本和所述负样本进行向量转化,得到账户偏好向量和物品向量;
根据所述账户偏好向量与所述物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向所述第一账户推荐的物品。
6.根据权利要求4或5所述的物品推荐方法,其特征在于,所述根据所述账户偏好向量与所述物品向量之间的相似度,对账户与和物品的进行匹配,得到用于向所述第一账户推荐的物品,包括:
根据所述物品向量,构建包含有所述物品向量的检索引擎;
将所述账户偏好向量输入所述检索引擎进行向量检索,并将排序位于前列的且满足预设数量的物品向量对应的物品,确定为用于向所述第一账户推荐的物品。
7.一种短视频推荐方法,其特征在于,包括:
应用如权利要求1至6中任一项所述的物品推荐方法,得到用于向所述第一账户推荐的短视频,并将包含所述短视频信息的推荐指令发送至所述第一账户并展示所述推荐的短视频。
8.一种物品推荐装置,其特征在于,包括:
标记信息生成模块,被配置为执行响应于第一账户对于第一物品的正向标记,生成正向标记信息,所述正向标记信息包括第一账户信息和第一物品信息;
正样本获取模块,被配置为执行对所述正向标记信息中的第一账户信息和第一物品信息进行组合,得到正样本;
物品信息读取模块,被配置为执行在缓存的物品数据库中读取第二物品信息,所述物品数据库包括账户标记的物品信息;
负样本获取模块,被配置为执行获取所述第二物品信息对应的第二账户信息,对所述第二账户信息和所述第二物品信息进行组合,得到负样本;
推荐物品确定模块,被配置为执行根据所述正样本和所述负样本,对账户和物品进行匹配,得到用于向所述第一账户推荐的物品。
9.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的物品推荐方法或如权利要求7所述的短视频推荐方法。
10.一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如权利要求1至6中任一项所述的物品推荐方法或如权利要求7所述的短视频推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192059.0A CN113495985B (zh) | 2020-03-18 | 2020-03-18 | 物品推荐方法及装置、短视频推荐方法及装置和服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192059.0A CN113495985B (zh) | 2020-03-18 | 2020-03-18 | 物品推荐方法及装置、短视频推荐方法及装置和服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113495985A true CN113495985A (zh) | 2021-10-12 |
CN113495985B CN113495985B (zh) | 2024-03-19 |
Family
ID=77994469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010192059.0A Active CN113495985B (zh) | 2020-03-18 | 2020-03-18 | 物品推荐方法及装置、短视频推荐方法及装置和服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113495985B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417156A (zh) * | 2022-01-19 | 2022-04-29 | 北京达佳互联信息技术有限公司 | 内容推荐模型的训练方法、装置、服务器及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110153598A1 (en) * | 2009-12-22 | 2011-06-23 | Kamimaeda Naoki | Information Processing Apparatus and Method |
CN108304441A (zh) * | 2017-11-14 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 网络资源推荐方法、装置、电子设备、服务器及存储介质 |
CN109492687A (zh) * | 2018-10-31 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 用于处理信息的方法和装置 |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110097412A (zh) * | 2018-01-31 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 物品推荐方法、装置、设备以及存储介质 |
CN110428295A (zh) * | 2018-08-01 | 2019-11-08 | 北京京东尚科信息技术有限公司 | 商品推荐方法和系统 |
CN110557659A (zh) * | 2019-08-08 | 2019-12-10 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
-
2020
- 2020-03-18 CN CN202010192059.0A patent/CN113495985B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110153598A1 (en) * | 2009-12-22 | 2011-06-23 | Kamimaeda Naoki | Information Processing Apparatus and Method |
CN108304441A (zh) * | 2017-11-14 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 网络资源推荐方法、装置、电子设备、服务器及存储介质 |
CN110097412A (zh) * | 2018-01-31 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 物品推荐方法、装置、设备以及存储介质 |
CN110428295A (zh) * | 2018-08-01 | 2019-11-08 | 北京京东尚科信息技术有限公司 | 商品推荐方法和系统 |
CN109492687A (zh) * | 2018-10-31 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 用于处理信息的方法和装置 |
CN110008399A (zh) * | 2019-01-30 | 2019-07-12 | 阿里巴巴集团控股有限公司 | 一种推荐模型的训练方法及装置、一种推荐方法及装置 |
CN110557659A (zh) * | 2019-08-08 | 2019-12-10 | 北京达佳互联信息技术有限公司 | 视频推荐方法、装置、服务器及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114417156A (zh) * | 2022-01-19 | 2022-04-29 | 北京达佳互联信息技术有限公司 | 内容推荐模型的训练方法、装置、服务器及存储介质 |
CN114417156B (zh) * | 2022-01-19 | 2022-09-30 | 北京达佳互联信息技术有限公司 | 内容推荐模型的训练方法、装置、服务器及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113495985B (zh) | 2024-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11711447B2 (en) | Method and apparatus for real-time personalization | |
CN110321422B (zh) | 在线训练模型的方法、推送方法、装置以及设备 | |
CN107609152B (zh) | 用于扩展查询式的方法和装置 | |
Agarwal et al. | Statistical methods for recommender systems | |
Liu | A collaborative filtering recommendation algorithm based on the influence sets of e-learning group’s behavior | |
CN112883265A (zh) | 信息推荐方法、装置、服务器及计算机可读存储介质 | |
CN101957825A (zh) | 基于网页中图像、视频内容的图像搜索方法 | |
CN115659008B (zh) | 大数据信息反馈的信息推送系统、方法、电子设备及介质 | |
CN112989169A (zh) | 目标对象识别方法、信息推荐方法、装置、设备及介质 | |
CN115222433A (zh) | 一种信息推荐方法、装置及存储介质 | |
CN113469752A (zh) | 内容推荐方法、装置、存储介质及电子设备 | |
CN112115354B (zh) | 信息处理方法、装置、服务器及存储介质 | |
US8903817B1 (en) | Determining search relevance from user feedback | |
CN113495985B (zh) | 物品推荐方法及装置、短视频推荐方法及装置和服务器 | |
CN116578774A (zh) | 一种预估排序方法、装置、计算机设备及存储介质 | |
CN113254513B (zh) | 排序模型生成方法、排序方法、装置、电子设备 | |
CN114298118B (zh) | 一种基于深度学习的数据处理方法、相关设备及存储介质 | |
CN112200602B (zh) | 用于广告推荐的神经网络模型训练方法及装置 | |
CN114329055A (zh) | 搜索推荐方法及推荐装置、电子设备、存储介质 | |
CN112035740B (zh) | 项目使用时长预测方法、装置、设备及存储介质 | |
CN111460300B (zh) | 网络内容推送方法、装置及存储介质 | |
CN113327145B (zh) | 一种物品推荐方法和装置 | |
Chen et al. | SR-HetGNN: Session-based Recommendation with Heterogeneous Graph Neural Network | |
Hussan et al. | An optimized user behavior prediction model using genetic algorithm on mobile web structure | |
CN112118486A (zh) | 内容项投放方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |