CN110598118A - 资源对象的推荐方法、装置及计算机可读介质 - Google Patents

资源对象的推荐方法、装置及计算机可读介质 Download PDF

Info

Publication number
CN110598118A
CN110598118A CN201910900920.1A CN201910900920A CN110598118A CN 110598118 A CN110598118 A CN 110598118A CN 201910900920 A CN201910900920 A CN 201910900920A CN 110598118 A CN110598118 A CN 110598118A
Authority
CN
China
Prior art keywords
resource
resource object
vector
objects
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910900920.1A
Other languages
English (en)
Inventor
郁振庭
邹远航
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Yayue Technology Co ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910900920.1A priority Critical patent/CN110598118A/zh
Publication of CN110598118A publication Critical patent/CN110598118A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提出了一种资源对象的推荐方法、装置及计算机可读介质,通过用户的行为信息,构建用户的图关系网络;构建图关系网络中的每一个资源对象的嵌入向量;计算资源对象的隐藏向量;资源对象的隐藏向量包括的资源对象的每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性;计算每一个资源对象的最终特征向量,用于说明每一个资源对象与其邻居资源对象之间的关联性。由于本申请可从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象,实现自动向用户推荐感兴趣的对象的功能。

Description

资源对象的推荐方法、装置及计算机可读介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种资源对象的推荐方法、装置及计算机可读介质。
背景技术
随着互联网技术的发展,越来越多的用户利用互联网平台浏览自身感兴趣的视频、商品、文章等资源对象。现有的提供资源的平台中,通常需要用户主动搜索关键字,来获取自身感兴趣的资源对象。
这种方式依赖于用户主动搜索的行为,不利于持续激发用户使用该平台的兴趣,容易造成平台用户流失。因此,现有的资源平台中,急需一种自动向用户推荐用户感兴趣的资源对象的方法,以提高用户的留存率,降低用户的流失。
发明内容
基于上述现有技术的不足,本申请提出了一种资源对象的推荐方法、装置及计算机可读介质,以实现自动向用户推荐感兴趣的资源对象。
本发明第一方面公开了一种资源对象的推荐方法,包括:
根据用户的行为信息,构建所述用户的图关系网络;其中,所述用户的图关系网络中包括多个具有连接关系的资源对象,所述资源对象的连接关系用于说明所述资源对象间的关联性;
构建得到所述图关系网络中的每一个资源对象的嵌入向量;其中,所述每一个资源对象的嵌入向量包括:所述资源对象的每一个特征的潜在语义向量;
根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量;其中,所述资源对象的隐藏向量包括所述资源对象的每一个特征的高阶特征向量;所述每一个特征的高阶特征向量用于说明所述每一个特征与所述资源对象的其他特征间的关联性;
根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量;其中,所述每一个资源对象的最终特征向量用于说明所述每一个资源对象与其邻居资源对象之间的关联性;所述资源对象的邻居资源对象为所述图关系网络中与所述资源对象有连接关系的资源对象;
从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象;其中,n为正整数。
可选地,在上述资源对象的推荐方法中,所述根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量,包括:
将所述每一个资源对象的嵌入向量输入至K层多头自注意力网络,由所述K层多头自注意力网络计算所述资源对象的嵌入向量,得到所述每一个资源对象的隐藏向量;其中,K为正整数;所述K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,所述K层多头自注意力网络中末尾层输出的向量为所述资源对象的隐藏向量。
可选地,在上述资源对象的推荐方法中,所述根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量,包括:
将所述每一个资源对象的隐藏向量输入至前馈神经网络,得到所述每一个资源对象的中间隐藏向量;
将所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量进行多次处理操作,得到所述每一个资源对象的最终特征向量;
其中,首次所述处理操作的输入信息为:所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量;从第二次所述处理操作开始,每一次所述处理操作的输出结果作为下一次处理操作的输入信息;
所述处理操作包括:利用多头自注意力网络计算每一次的输入信息,得到所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量;将所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量进行拼接,得到所述每一个资源对象的拼接聚合向量;将所述每一个资源对象的拼接聚合向量代入至激活函数后进行归一化处理。
可选地,在上述资源对象的推荐方法中,所述根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量之后,还包括:
基于所述图关系网络,生成随机游走的序列;
针对所述序列中的其中一个资源对象,使用窗口构造方法得到所述资源对象的正例对;
根据所述资源对象的正例对,计算所述资源对象的推荐方法中的损失值;
根据所述损失值,采用误差反向传导算法调节所述资源对象的推荐方法中使用到的参数值。
可选地,在上述资源对象的推荐方法中,所述根据用户的行为信息,构建所述用户的图关系网络,包括:
在所述用户在预设的周期时间内所点击的对象之间构建连接关系,且在与所述点击的对象相似度高于阈值的对象和所述点击的对象之间构建连接关系,形成所述用户的图关系网络。
可选地,在上述资源对象的推荐方法中,所述从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象,包括:
从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量;其中,所述q为大于所述n的正整数;
将所述q个资源对象的最终特征向量输入至所述粗排模型中,使所述q个资源对象按照第一类特征进行排序;其中,所述第一类特征包括:用户特征,和/或,资源对象特征;
依据排序后的q个资源对象选出n个资源对象,将所述n个资源对象作为推荐资源对象。
可选地,在上述资源对象的推荐方法中,所述依据排序后的q个资源对象选出n个资源对象,将所述n个资源对象作为推荐资源对象,包括:
依据排序后的q个资源对象选出m个资源对象,将所述m个资源对象的最终特征向量作为精排模型的输入向量;其中,所述m为小于所述q、且大于所述n的正整数;
将所述m个资源对象的最终特征向量输入至所述精排模型中,使所述m个资源对象的最终特征向量按照第二类特征进行排序;所述第二类特征包括:用户特征,和/或,资源对象特征;
依据排序后的m个资源对象选出n个资源对象,作为所述推荐资源对象。
本发明第二方面公开了一种资源对象的推荐装置,包括:
第一构建单元,用于根据用户的行为信息,构建所述用户的图关系网络;其中,所述用户的图关系网络中包括多个具有连接关系的资源对象,所述资源对象的连接关系用于说明所述资源对象间的关联性;
第二构建单元,用于构建得到所述图关系网络中的每一个资源对象的嵌入向量;其中,所述每一个资源对象的嵌入向量包括:所述资源对象的每一个特征的潜在语义向量;
第一计算单元,用于根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量;其中,所述资源对象的隐藏向量包括所述资源对象的每一个特征的高阶特征向量;所述每一个特征的高阶特征向量用于说明所述每一个特征与所述资源对象的其他特征间的关联性;
第二计算单元,用于根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量;其中,所述每一个资源对象的最终特征向量用于说明所述每一个资源对象与其邻居资源对象之间的关联性;所述资源对象的邻居资源对象为所述图关系网络中与所述资源对象有连接关系的资源对象;
选择单元,用于从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象;其中,n为正整数。
可选地,在上述资源对象的推荐装置中,所述第一计算单元,包括:
第一计算子单元,用于将所述每一个资源对象的嵌入向量输入至K层多头自注意力网络,由所述K层多头自注意力网络计算所述资源对象的嵌入向量,得到所述每一个资源对象的隐藏向量;其中,K为正整数;所述K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,所述K层多头自注意力网络中末尾层输出的向量为所述资源对象的隐藏向量。
可选地,在上述资源对象的推荐装置中,所述第二计算单元,包括:
第二计算子单元,用于将所述每一个资源对象的隐藏向量输入至前馈神经网络,得到所述每一个资源对象的中间隐藏向量;
第三计算子单元,用于将所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量进行多次处理操作,得到所述每一个资源对象的最终特征向量;
其中,首次所述处理操作的输入信息为:所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量;从第二次所述处理操作开始,每一次所述处理操作的输出结果作为下一次处理操作的输入信息;
所述处理操作包括:利用多头自注意力网络计算每一次的输入信息,得到所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量;将所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量进行拼接,得到所述每一个资源对象的拼接聚合向量;将所述每一个资源对象的拼接聚合向量代入至激活函数后进行归一化处理。
可选地,在上述资源对象的推荐装置中,还包括:
生成单元,用于基于所述图关系网络,生成随机游走的序列;
构造单元,用于针对所述序列中的其中一个资源对象,使用窗口构造方法得到所述资源对象的正例对;
第四计算子单元,用于根据所述资源对象的正例对,计算所述资源对象的推荐方法中的损失值;
调节单元,用于根据所述损失值,采用误差反向传导算法调节所述资源对象的推荐方法中使用到的参数值。
可选地,在上述资源对象的推荐装置中,所述第一构建单元,包括:
第一构建子单元,用于在所述用户在预设的周期时间内所点击的对象之间构建连接关系,且在与所述点击的对象相似度高于阈值的对象和所述点击的对象之间构建连接关系,形成所述用户的图关系网络。
可选地,在上述资源对象的推荐装置中,所述资源对象的推荐装置为区块链系统中的任意一个节点。
可选地,在上述资源对象的推荐装置中,所述选择单元,包括:
第一选择子单元,用于从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量;其中,所述q为大于所述n的正整数;
第一排序单元,用于将所述q个资源对象的最终特征向量输入至所述粗排模型中,使所述q个资源对象按照第一类特征进行排序;其中,所述第一类特征包括:用户特征,和/或,资源对象特征;
第二选择子单元,用于依据排序后的q个资源对象选出n个资源对象,将所述n个资源对象作为推荐资源对象。
可选地,在上述资源对象的推荐装置中,所述第二选择子单元,包括:
第三选择子单元,用于依据排序后的q个资源对象选出m个资源对象,将所述m个资源对象的最终特征向量作为精排模型的输入向量;其中,所述m为小于所述q、且大于所述n的正整数;
第二排序单元,用于将所述m个资源对象的最终特征向量输入至所述精排模型中,使所述m个资源对象的最终特征向量按照第二类特征进行排序;所述第二类特征包括:用户特征,和/或,资源对象特征;
第四选择子单元,用于依据排序后的m个资源对象选出n个资源对象,作为所述推荐资源对象。
本发明第三方面公开了一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如上述第一方面中任一所述的方法。
从上述的技术方案可以看出,本申请提供的资源对象的推荐方法,根据用户的行为信息,构建用户的图关系网络。又构建得到图关系网络中的每一个资源对象的嵌入向量;其中,每一个资源对象的嵌入向量包括:资源对象的每一个特征的潜在语义向量。根据每一个资源对象的嵌入向量,计算得到资源对象的隐藏向量。其中,资源对象的隐藏向量包括资源对象的每一个特征的高阶特征向量;每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性。根据每一个资源对象和资源对象的邻居资源对象的隐藏向量,计算得到每一个资源对象的最终特征向量;其中,每一个资源对象的最终特征向量用于说明每一个资源对象与其邻居资源对象之间的关联性。从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象。由于本申请可从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象作为推荐资源对象,实现自动向用户推荐感兴趣的对象的功能。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种资源对象的推荐方法的流程示意图;
图2为本发明实施例公开的一种图关系网络的结构示意图;
图3为本发明实施例公开的一种计算资源对象的最终特征向量的方法的流程示意图;
图4为本发明实施例公开的一种优化资源对象的推荐方法中的参数的方法的流程示意图;
图5为本发明实施例公开的一种选择出推荐资源对象的方法的流程示意图;
图6为本发明实施例公开的另一种选择出推荐资源对象的方法的流程示意图;
图7为本发明实施例公开的一种资源对象的推荐装置的结构示意图;
图8为本发明实施例公开的一种分布式系统的结构示意图;
图9为本发明实施例公开的一种区块的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,本申请实施例公开了一种资源对象的推荐方法,该方法可应用于服务器中,具体包括以下步骤:
S101、根据用户的行为信息,构建用户的图关系网络。
其中,用户的图关系网络中包括多个具有连接关系的资源对象,资源对象的连接关系用于说明资源对象间的关联性。
用户的行为信息可从用户过往的点击日志中查询得到。用户的行为信息可以是用户在预设的时间内点击资源对象的行为信息。资源对象可以是视频、文章、商品等。执行步骤S101时,通过收集用户在某个应用平台上的行为信息,构建与该用户相对应的图关系网络。由于每一名用户的行为信息互不相同,因此基于行为信息构建的每一名用户的图关系网络也互不相同。且由于用户的图关系网络是依据用户的行为信息建立的,因此用户的图关系网络中涵盖了用户可能感兴趣的资源对象,可从图关系网络中选出部分对象推荐给用户。其中,从图关系网络中选取出推荐对象的具体方式可参见步骤S102至步骤S105的内容。
需要说明的是,收集用户在某个平台上的行为信息时,除了获取用户在预设的时间内点击资源对象的行为信息,还可以获取用户在预设的时间内点击资源对象的频率、浏览资源对象的时间等用户信息。构建用户的图关系网络时依据的用户行为信息越详细,得到的图关系网络更能反映出用户感兴趣的内容。还需要说明的是,除了可根据用户的行为信息构建资源对象的连接关系,还可以根据资源对象的内容画像等信息,构建资源对象间的连接关系,使内容相似度较高的资源对象间形成连接。
可选地,在本申请一具体实施例中,执行步骤S101的一种方式,包括:
在用户在预设的周期时间内所点击的对象之间构建连接关系,且在与点击的对象相似度高于阈值的对象和点击的对象之间构建连接关系,形成用户的图关系网络。
具体地,根据用户的过往点击日志以及资源对象的内容画像,建立图关系网络中的对象的连接关系。通过用户的过往点击日志,获知用户在预设的周期时间内点击过的资源对象,将用户在预设的周期时间内点击过的资源对象两两互连。并且,通过内容画像,获知与每一个点击过的资源对象的相似度高于阈值的对象,将与该资源对象相似度高于阈值的对象与该点击过的资源对象相连。其中,资源对象的相似度可通过预设的规则得到。例如,可通过一些计算相似度的公式得到,也可以对用户所使用的应用平台中的所有资源对象都提取内容上的特征,根据资源对象内容上的特征来计算相似度。相似度的阈值也可人为进行设定。
例如,参阅图2,将预设的周期时间设置为昨天的16点至18点,在该时间段内,其中一个用户在一个视频平台上点击了A视频、B视频以及C视频。而与A视频相似度高于阈值的视频有D视频、E视频以及F视频;与B视频相似度高于阈值的有D视频、G视频;与C视频相似度高于阈值的有F视频、H视频。因此,如图2所示,基于用户的行为信息,建立A视频、B视频以及C视频的连接关系,使得A视频、B视频以及C视频两两互连。又基于对象的内容相似度信息,将D视频、E视频以及F视频分别与A视频相连,将D视频、G视频分别与B视频相连,将F视频、H视频分别与C视频相连,由此构成了该用户的图关系网络。图2示出的视频对象间的连接关系说明了对象间的关联性。
需要说明的是,多个资源对象间除了根据用户点击视频的行为信息、以及资源对象内容的信息来建立连接关系外,还可以根据用户点击资源对象的历史记录信息等其他的信息来建立连接关系,包括但不限于本申请实施例提出的方案。
S102、构建得到图关系网络中的每一个资源对象的嵌入向量。
其中,每一个资源对象的嵌入向量包括:资源对象的每一个特征的潜在语义向量。具体地,根据图关系网络中所有资源对象的特征建立哈希表,使所有特征与潜在语义向量一一对应。可选地,潜在语义向量可以为独热码向量。通过不同的独热码向量来代表不同的特征。执行步骤S102的具体过程为,先对图关系网络中每一个资源对象进行特征提取,并使用特征对应的标签进行标记。例如,对于A视频,特征对应的标签为体育、比赛以及篮球,对于B视频特征对应的标签为娱乐八卦、电视剧以及古装。需要说明的是,依据资源对象的特征实现分类标记的方法有很多,例如可通过分类器、支持向量机等方法实现,依据资源对象的特征实现分类标记的方式上的不同,并不影响本申请实施例的实现。
对每一个资源对象的特征标记了对应的标签后,可根据每一个资源对象的标签,从预先构建好的哈希表中,找到对应的潜在语义向量,即找到资源对象中的每一个特征所对应的潜在语义向量来表示该特征,构建得到每一个资源对象的嵌入向量E=[e1,e2,e3…em]。其中,e1向量对应于该资源对象的第一个特征,em向量对应于该资源对象的第m个特征。每一个资源对象的嵌入向量用于说明资源对象的特征信息。
S103、根据每一个资源对象的嵌入向量,计算得到资源对象的隐藏向量。
其中,资源对象的隐藏向量包括资源对象的每一个特征的高阶特征向量。每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性。步骤S102中得到的资源对象的嵌入向量中,仅能说明资源对象的每一个特征之间的信息,但不能说明特征与特征之间的关联性。而步骤S103得到的资源对象的隐藏向量中还说明了特征与特征之间的关联性。
例如,对于一个资源对象,它的嵌入向量中包括了特征A对应的潜在语义向量e1、特征B对应的潜在语义向量e2、以及特征C对应的潜在语义向量e3。但向量e1中并没有体现出特征A与特征B、特征C之间的关联性。而步骤S103得到的该资源对象的隐藏向量H=[h1,h2,h3]。其中,h1为特征A的高阶特征向量,用于说明特征A与特征B、特征C之间的关联性。h2为特征B的高阶特征向量,用于说明特征B与特征A、特征C的关系。h3为特征C的高阶特征向量,用于说明特征C与特征A特征B之前的关系。每一个特征的高阶特征向量表示出了特征与特征之间复杂的交叉信息,对每一个资源对象的特征描述更加的准确、充分。
需要说明的是,对于其中一个特征的高阶特征向量,它可以是说明两个特征之间的关联性,也可以是说明两个以上的多个特征之间的关联性。
可选地,在本申请一具体实施例中,执行步骤S103的一种实施方式,包括:
将所述每一个资源对象的嵌入向量输入至K层多头自注意力网络,由K层多头自注意力网络计算资源对象的嵌入向量,得到每一个资源对象的隐藏向量。
其中,K为正整数。K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,K层多头自注意力网络中末尾层输出的向量为资源对象的隐藏向量。但第一层多头自注意力网络输入的是嵌入向量,第二层至第K层中,则是将上一层的输出作为下一层的输入,第K层多头自注意力网络则输出的是资源对象的隐藏向量。
多头自注意力网络共有h个头,每一个自注意力头关注输入的向量中的不同部分的信息,因此,采用多头自注意力网络可以针对向量中不同部分的信息提取出更为重要的深层次信息。多头自注意力网络可采用经典的Query-Key-Value型注意力机制。每一层多头自注意力网络中都会使用到WQuery、WKey以及WValue这三个二维转换矩阵,每一层的WQuery、WKey以及WValue的参数值可以不同。这三个矩阵中的参数可依据多次训练得到的结果进行调整。将嵌入向量E=[e1,e2,e3…em]输入到第一层多头自注意力网络中时,对于嵌入向量中第m个特征的潜在语义向量em,使用每一个自注意力头对向量em进行计算,都可以得到一个隐藏子向量。而将h个头分别得到的隐藏子向量进行拼接起来,即可得到第一层自注意力网络的输出向量其中,表示使用第h个自注意力头对向量em计算所得到的向量。表示向量拼接计算。
可选地,使用第h个头对向量em进行计算的过程为:
先使用公式(1)计算嵌入向量E中的em向量与ed向量间的关联性,得到可用于说明em向量以及ed向量之间的交叉信息的值其中公式(1)为:
其中,表示对做向量内积计算。WQuery、WKey是多头自注意力网络中的其中两个二维转换矩阵,这两个矩阵中的参数可依据多次训练得到的结果进行调整。ed表示的是嵌入向量E中除了em以外的一个特征的潜在语义向量。则是一个可用于说明em向量以及ed向量之间的交叉信息的值。
再使用公式(2)得到第h个自注意力头对向量em计算所得到的向量公式(2)为:
WValue是多头自注意力网络中的二维转换矩阵,这个矩阵中的参数可依据多次训练得到的结果进行调整。公式(2)得到的隐藏子向量中说明了em向量与嵌入向量中的其他向量之间的特征。然后再使用公式(3),将h个头分别得到的隐藏子向量进行拼接,得到第一层自注意力网络的输出向量其中公式(3)为:
嵌入向量中的每一个特征都可以得到一个对应的输出向量,组成第一层的输出向量然后将第一层的输出向量作为第二层多头自注意力网络的输入,重复使用公式(1)、公式(2)以及公式(3)的计算,在第K层输出资源对象的隐藏向量。
通过上述公式(1)、公式(2)以及公式(3)的计算过程可看出,执行步骤S103时既使用了多注意力从不同方面关注输入的信息,提取了不同方面的深层次特征信息,且计算出特征间的交叉信息。其中,特征间的交叉信息可以是两个特征间的交叉信息,还可以是两个以上的特征间的交叉信息。经过的多头自注意力网络的层数越多,得到的资源对象的隐藏向量中的每一个特征的高阶特征向量中,包含的交叉信息越为复杂。具体的,仅输入第一层多头自注意力网络时得到的每一个特征的高阶特征向量说明的是两个特征间的交叉信息,而经过多层多头自注意力网络时,得到的每一个特征的高阶特征向量则能够说明两个以上的特征间的交叉信息。
S104、根据每一个资源对象和资源对象的邻居资源对象的隐藏向量,计算得到每一个资源对象的最终特征向量。
其中,每一个资源对象的最终特征向量用于说明每一个资源对象与其邻居资源对象之间的关联性。资源对象的邻居资源对象为图关系网络中与资源对象有连接关系的资源对象。资源对象的邻居资源对象可以是与该资源对象直接相连的资源对象,也可以是与该资源对象间接相连的资源对象,即多阶邻居对象。可选地,可通过一个基于图关系网络的函数N(v)来取出与资源对象v所对应的邻居资源对象。
由于步骤S104中计算得到的每一个资源对象的最终特征向量中,说明了每一个资源对象与其邻居资源对象之间的关联性,聚合了该资源对象的邻居资源对象的信息,因此能更充分、准确的表示出资源对象的内容信息,利于后续执行步骤S105时选取出的推荐资源对象更为准确,更满足用户当前的访问需求。
可选地,参阅图3,在本申请一具体实施例中,执行步骤S104的一种实施方式,包括:
S301、将每一个资源对象的隐藏向量输入至前馈神经网络,得到每一个资源对象的中间隐藏向量。
由于步骤S103得到的每一个资源对象的隐藏向量的维数较多,通过步骤S301将每一个资源对象的隐藏向量输入至前馈神经网络中,可达到降低维数的目的,因此步骤S301得到的每一个资源对象的中间隐藏向量是一个一行多列或者多行一列的向量。
可选地,将每一个资源对象的隐藏向量代入至公式(4)中,得到的每一个资源对象的中间隐藏向量其中公式(4)为:
其中,W为二维转换矩阵,W中的参数可通过多次训练的结果进行调整。hK表示步骤S103中第K层多头自注意力网络输出的向量,即步骤S103得到的每一个资源对象的隐藏向量。表示每一个资源对象的中间隐藏向量。
S302、将每一个资源对象的中间隐藏向量以及资源对象的邻居资源对象的中间隐藏向量进行多次处理操作,得到每一个资源对象的最终特征向量。
其中,首次处理操作的输入信息为:每一个资源对象的中间隐藏向量以及资源对象的邻居资源对象的中间隐藏向量。从第二次处理操作开始,每一次处理操作的输出结果作为下一次处理操作的输入信息。
例如,对资源对象v1的中间隐藏向量资源对象v1的邻居资源对象v2的中间隐藏向量以及资源对象v1的邻居资源对象v3的中间隐藏向量进行第一次处理操作,得到资源对象v1对应的第一次输出结果为向量。而对于资源对象v1的邻居资源对象v2进行了第一次处理操作后,得到的资源对象v2对应的第一次输出结果则为向量,资源对象v1的邻居资源对象v3进行第一次处理操作后,也得到资源对象v3对应的第一次输出结果向量。进行第二次处理操作的时候,则是将第一次处理操作的结果:资源对象v1对应的第一次输出结果为资源对象v2对应的第一次输出结果则为向量以及资源对象v3对应的第一次输出结果向量进行第二次处理操作,然后输出第二次输出结果:资源对象v1对应的第二次输出结果为资源对象v2对应的第二次输出结果则为向量以及资源对象v3对应的第二次输出结果向量。以此类推,自第二次操作开始每一次处理操作的输出结果作为下一次处理操作的输入信息。
需要说明的是,处理操作的次数可人为进行设定,操作的次数越多,每一个资源对象所聚合的对应的邻居资源对象的信息也会越多,最终得到的每一个资源对象的最终特征向量就更能精准地描述出资源对象的内容信息。
其中,处理操作包括:利用多头自注意力网络计算每一次的输入信息,得到每一个资源对象的聚合向量以及资源对象的邻居资源对象的聚合向量。将每一个资源对象的聚合向量以及资源对象的邻居资源对象的聚合向量进行拼接,得到每一个资源对象的拼接聚合向量;将每一个资源对象的拼接聚合向量代入至激活函数后进行归一化处理。
具体地,利用计算邻居资源对象的函数N(v)取出资源对象v0对应的邻居资源对象v1、v2、…、vT。将资源对象v0、v1、v2、…、vT分别代入公式(5)中,分别计算得到资源对象v0对应的向量资源对象v1对应的向量…、以及资源对象vT对应的向量其中,公式(5)为:
聚合函数AGGREGATEk(x)是一个与上述实施例中公式(1)、公式(2)以及公式(3)计算过程相同的Query-Key-Value型多头自注意力网络,其中的资源对象v0的向量表示作为Query,v0的邻居资源对象的向量表示作为Key和Value。聚合函数AGGREGATEk(x)的计算过程可参见上述实施例中多头自注意力网络中公式(1)、公式(2)以及公式(3)的计算过程,此处不再赘述。K表示为第K次处理操作,公式(5)执行了K次,说明经过了K层多头自注意力网络。但公式(5)输出的结果,即第K层多头自注意力网络输出的结果并不用来当做第K+1层多头自注意力网络的输入,而是要经过公式(6)和公式(7)计算后,才作为第K+1层的输入。
将计算得到的资源对象v0对应的向量资源对象v1对应的向量
、以及资源对象vT对应的向量代入至公式(6)中,得到资源对象v0对应的向量其中,公式(6)为:
其中,表示为将资源对象v0对应的向量与资源对象v1对应的向量…、以及资源对象vT对应的向量进行拼接。σ(x)是一种激活函数,使用激活函数运算可从输入输出之间生成非线性映射。Wk是一个二维转换矩阵,Wk中的参数可以根据多次训练的结果进行调整。
将资源对象v0对应的向量代入至公式(7)中,进行归一化处理,得到资源对象v0的向量若第K次操作为最后一次操作,那么得到的向量即为资源对象v0的最终特征向量Zv。其中,公式(7)为:
其中,表示向量的L2范数。通过归一化处理后的结果可简化后续计算,缩小量值。
每一次处理操作的过程为公式(5)、公式(6)以及公式(7)的计算过程,通过公式(5)、公式(6)以及公式(7)的计算过程可知,对于资源对象v0,最终得到的对应的最终特征向量表示中,除了汇聚了v0的邻居资源对象v1、v2、…、vT的特征信息,还汇聚了v1的邻居资源对象信息、v2的邻居资源对象信息、…、vT的邻居资源对象信息,因此达到了进一步更好地描述每一个资源对象的内容信息的目的。
可选地,参阅图4,在本申请一具体实施例中,执行完步骤S104之后,还包括:
S401、基于图关系网络,生成随机游走的序列。
其中,生成随机游走的序列的具体过程为:将图关系网络中的任意一个资源对象L1作为起始资源对象,再游走至与资源对象L1相连的任意一个资源对象L2,然后再从资源对象L2游走至与资源接地那L2相连的任意一个资源对象L3……以此类推,构成随机游走的序列:L1、L2、…、Ln。其中,序列的长度可自由设定。
S402、针对序列中的其中一个资源对象,使用窗口构造方法得到资源对象的正例对。
其中,窗口的大小W通过从[1,2,…,w]中随机采样得到。若随机采样到的窗口的大小为w,则对于步骤S401得到的序列中的一个资源对象Li来说,与Li构成正例对的资源对象为L(i-w)、…、L(i-1),以及L(i+1)、…、L(i+w)。例如,随机采样到窗口的大小为2,则对于资源对象L3而言,它分别与L1、L2、L4以及L5构成正例对。构成正例对的资源对象即认为是相似度高的资源对象。而对于L3而言,虽然L1、L2、L4以及L5都可以与它构成正例对,但与L3直接相连的L2、L4的相似度显然高于没有直接相连的L1、L5。因此构成的正例对中,会赋予距离更近的资源对象更大的权重值。窗口大小选取的不同,会导致按照距离赋予的权重值也会发生改变。其中,两对象的距离主要是指的是两对象在图关系网络中的距离。例如,在图关系网络中的序列L1、L2、…、Ln中,离L1最近的就是L2,离L1距离最远的则是Ln。这种按照距离赋予权重的方式可减少计算量,使得离资源对象L1越近的对象被赋予的权重值越高,进而让距离资源对象L1越近的资源对象计算出的相似度越大。
S403、根据资源对象的正例对,计算资源对象的推荐方法中的损失值。
在计算资源对象的最终特征向量的过程中,使用到了许多模型的参数值,例如多头自注意力网络中使用到的参数值、前馈神经网络中使用到的参数值等,这些参数值可根据计算得到的资源对象的推荐方法中的损失值进行调整,以提高推荐资源对象的准确率。
可选地,将一个资源对象的正例对(u,v)代入公式(8)中,计算得到对于正例对(u,v)的损失值Loss。其中,公式(8)为:
其中,zu表示资源对象u的最终向量表示,k为负例的个数,Pn(z)为用来采样负例的分布函数。负例指的是与资源对象相似度不高的对象。
S404、根据损失值,采用误差反向传导算法调节资源对象的推荐方法中使用到的参数值。
根据步骤S403计算得到的损失值,使用误差反向传导算法调节推荐方法中使用到的模型中的参数值,例如多头自注意力网络、前馈神经网络等。通过调整参数值,达到减少损失值、优化方法中使用的模型的目的。可选地,可以在训练过程中,在资源对象的推荐方法计算得到的结果满足预设的要求后,结束对参数值的调整,即认为该资源对象的推荐方法中使用到的模型已可以满足实际需求,实现资源对象的推荐。
S105、从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象。
需要说明的是,用户的图关系网络是基于用户之前的行为数据构建的网络。用户当前访问资源对象时,可从用户的图关系网络中查询是否存在有用户当前访问的资源对象,如果存在的话,就能找到当前访问资源对象的最终特征向量。并使用余弦相似度计算公式,计算图关系网络中的其他对象与当前访问的资源对象的相似度,将相似度最高的n个资源对象认定为用户当前可能感兴趣的对象,即作为推荐资源对象。可选地,可以按照相似度从高到低的排列方式为用户展示推荐资源对象,也可以不对用户展示推荐资源对象,而是将这些推荐资源对象仅作为候选的推荐资源对象,按照预设的规则算法做进一步的筛选处理,从中选择出真正的推荐资源对象。
可选地,还可以根据当前用户访问的k个资源对象,选择出与当前访问的n个资源对象的最终特征向量相似度最高的n×k个候选的推荐资源对象,又依据相似度、以及用户点击这n个资源对象的频次,对n×k个候选的推荐资源对象进行从高到底排列,再从中选出m个排名最高的资源对象作为推荐资源对象。
还需要说明的是,步骤S101至步骤S104的过程中,即计算每一个资源对象的最终特征向量的过程,在得到每一个资源对象的最终特征向量后即可将每一个资源对象的最终特征向量进行对应存储,当用户在当前访问资源对象时,即可不再进行最终特征向量的计算,而是直接执行步骤S105即可。可选地,也可以是在每一次接收到用户访问资源对象的信息时,均执行步骤S101至步骤S105的步骤。还可以是,提前计算得到图关系网络中的每一个资源对象的最终特征向量,以及提前计算得到每一个资源对象的最终特征向量与其他对象的相似度,并将计算得到的信息存储在数据库中,当用户访问资源对象时,直接调用数据库的数据,从中选取出推荐资源对象即可,即不需要每一次用户访问资源对象时都进行最终特征向量以及相似度的计算。
参阅图5,可选地,在本申请一具体实施例中,执行步骤S105的一种实施方式,包括:
S501、从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量。
其中,q为大于n的正整数。具体的,可根据用户当前访问的资源对象的最终特征向量,依据相似度公式来计算图关系网络中其他资源向量的最终特征向量与用户当前访问的资源对象的最终特征向量的相似度,例如采用余弦相似度计算公式进行计算,并依据计算出的相似度进行排序,选取出相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量。其中,粗排模型是一种用于排序的模型。通过粗排模型排序后的q个资源对象,可进一步筛选出最终作为推荐的资源对象。
S502、将q个资源对象的最终特征向量输入至粗排模型中,使q个资源对象按照第一类特征进行排序。
其中,第一类特征包括:用户特征,和/或,资源对象特征。用户特征可以是根据用户以往浏览记录得到的用户的兴趣特征,或者用户点击各个对象的频次的特征等。资源对象特征可以是资源对象的阅读量或播放量特征、资源对象的标签特征等。粗排模型可通过多次训练得到。具体用于排序的第一类特征的信息可预先进行设置。例如,根据资源对象的阅读量或播放量由高至低排列,再根据用户的兴趣特征调整排列顺序,将符合用户兴趣特征的资源对象排在高位。
S503、依据排序后的q个资源对象选出n个资源对象,将n个资源对象作为推荐资源对象。
q个资源对象根据用户特征,和/或,资源对象特征进行排列以后,从排序后的q个资源对象中选出n个用户最可能感兴趣的资源对象作为推荐资源对象。例如,如果依据资源对象的阅读量或播放量特征进行排序,那么阅读量或播放量越高的资源对象,用户感兴趣的可能性就越大,因此可选出阅读量或播放量最高的n个资源对象作为推荐资源对象。
参阅图6,可选地,在本申请一具体实施例中,执行步骤S503的一种实施方式,包括:
S601、依据排序后的q个资源对象选出m个资源对象,将m个资源对象的最终特征向量作为精排模型的输入向量。
其中,m为小于q、且大于n的正整数。根据用户特征,和/或,资源对象特征进行排列以后,从q个资源对象中选出m个用户最可能感兴趣的资源对象。然后将这些资源对象的最终特征向量作为精排模型的输入向量。可选地,选取出的m个资源对象也可直接作为最终推荐的资源对象,但是使用精排模型对m个资源对象再进行一次排序,再从排序后的m个资源对象中再次筛选出部分资源对象,作为最终的推荐资源对象,那么推荐的准确率会更高。
S602、将m个资源对象的最终特征向量输入至精排模型中,使m个资源对象的最终特征向量按照第二类特征进行排序。
其中,精排模型是用于进行排序的模型。第二类特征包括:用户特征,和/或,资源对象特征。精排模型相较于粗排模型更为复杂,且精排模型排序依据的第二类特征所涵盖的信息多于粗排模型依据的第一类特征。因此通过精排模型排序后的m个资源对象,更易于筛选出用户感兴趣的推荐资源对象。
S603、依据排序后的m个资源对象选出n个资源对象,作为推荐资源对象。
从排序后的m个资源对象中选出用户最可能感兴趣的n个资源对象,并将这n个资源对象作为推荐资源节点。由于精排模型排序所依据的第二类特征中包含的信息比第一类特征的更多,因此,通过粗排模型筛选后,再使用精排模型进行排序,从排序后的m个资源对象中筛选得到的推荐资源对象的准确率更高。
本申请提供的资源对象的推荐方法,根据用户的行为信息,构建用户的图关系网络。又构建得到图关系网络中的每一个资源对象的嵌入向量;其中,每一个资源对象的嵌入向量包括:资源对象的每一个特征的潜在语义向量。根据每一个资源对象的嵌入向量,计算得到资源对象的隐藏向量。其中,资源对象的隐藏向量包括资源对象的每一个特征的高阶特征向量;每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性。根据每一个资源对象和资源对象的邻居资源对象的隐藏向量,计算得到每一个资源对象的最终特征向量;其中,每一个资源对象的最终特征向量用于说明每一个资源对象与其邻居资源对象之间的关联性。从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象。由于本申请可从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象作为推荐资源对象,实现自动向用户推荐感兴趣的对象的功能。
参阅图7,基于上述本申请实施例提出的资源对象的推荐方法,本申请实施例还对应公开了一种资源对象的推荐装置700,包括:第一构建单元701、第二构建单元702、第一计算单元703、第二计算单元704以及选择单元705。
第一构建单元701,用于根据用户的行为信息,构建用户的图关系网络。其中,用户的图关系网络中包括多个具有连接关系的资源对象,资源对象的连接关系用于说明资源对象间的关联性。
可选地,在本申请一具体实施例中,第一构建单元701,包括:
第一构建子单元,用于在用户在预设的周期时间内所点击的对象之间构建连接关系,且在与点击的对象相似度高于阈值的对象和点击的对象之间构建连接关系,形成用户的图关系网络。
第二构建单元702,用于构建得到图关系网络中的每一个资源对象的嵌入向量。其中,每一个资源对象的嵌入向量包括:资源对象的每一个特征的潜在语义向量。
第一计算单元703,用于根据每一个资源对象的嵌入向量,计算得到资源对象的隐藏向量。其中,资源对象的隐藏向量包括资源对象的每一个特征的高阶特征向量。每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性。
可选地,在本申请一具体实施例中,第一计算单元703,包括:
第一计算子单元,用于将每一个资源对象的嵌入向量输入至K层多头自注意力网络,由K层多头自注意力网络计算资源对象的嵌入向量,得到每一个资源对象的隐藏向量。其中,K为正整数。K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,K层多头自注意力网络中末尾层输出的向量为所述资源对象的隐藏向量。
第二计算单元704,用于根据每一个资源对象和资源对象的邻居资源对象的隐藏向量,计算得到每一个资源对象的最终特征向量。其中,每一个资源对象的最终特征向量用于说明每一个资源对象与其邻居资源对象之间的关联性。资源对象的邻居资源对象为图关系网络中与资源对象有连接关系的资源对象。
可选地,在本申请一具体实施例中,第二计算单元704,包括:第二计算子单元和第三计算子单元。
第二计算子单元,用于将每一个资源对象的隐藏向量输入至前馈神经网络,得到每一个资源对象的中间隐藏向量。
第三计算子单元,用于将每一个资源对象的中间隐藏向量以及资源对象的邻居资源对象的中间隐藏向量进行多次处理操作,得到每一个资源对象的最终特征向量。
其中,首次处理操作的输入信息为:每一个资源对象的中间隐藏向量以及资源对象的邻居资源对象的中间隐藏向量;从第二次处理操作开始,每一次处理操作的输出结果作为下一次处理操作的输入信息。
处理操作包括:利用多头自注意力网络计算每一次的输入信息,得到每一个资源对象的聚合向量以及资源对象的邻居资源对象的聚合向量。将每一个资源对象的聚合向量以及资源对象的邻居资源对象的聚合向量进行拼接,得到每一个资源对象的拼接聚合向量。将每一个资源对象的拼接聚合向量代入至激活函数后进行归一化处理。
选择单元705,用于从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象。其中,n为正整数。
可选地,在本申请一具体实施例中,选择单元705包括:第一选择子单元、第一排序单元以及第二选择子单元。
第一选择子单元,用于从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量。其中,q为大于n的正整数。
第一排序单元,用于将q个资源对象的最终特征向量输入至粗排模型中,使q个资源对象按照第一类特征进行排序。其中,第一类特征包括:用户特征,和/或,资源对象特征。
第二选择子单元,用于依据排序后的q个资源对象选出n个资源对象,将n个资源对象作为推荐资源对象。
可选地,在本申请一具体实施例中,第二选择子单元,包括:
第三选择子单元,用于依据排序后的q个资源对象选出m个资源对象,将m个资源对象的最终特征向量作为精排模型的输入向量。其中,m为小于q、且大于n的正整数。
第二排序单元,用于将m个资源对象的最终特征向量输入至精排模型中,使m个资源对象的最终特征向量按照第二类特征进行排序。第二类特征包括:用户特征,和/或,资源对象特征。
第四选择子单元,用于依据排序后的m个资源对象选出n个资源对象,作为推荐资源对象。
可选地,在本申请一具体实施例中,资源对象的推荐装置700还包括:生成单元、构造单元、第四计算子单元以及调节单元。
生成单元,用于基于图关系网络,生成随机游走的序列。
构造单元,用于针对序列中的其中一个资源对象,使用窗口构造方法得到资源对象的正例对。
第四计算子单元,用于根据资源对象的正例对,计算资源对象的推荐方法中的损失值。
调节单元,用于根据损失值,采用误差反向传导算法调节资源对象的推荐方法中使用到的参数值。
上述本申请实施例公开的资源对象的推荐装置700中的具体的原理和执行过程,与上述本申请实施例公开的资源对象的推荐方法相同,可参见上述本申请实施例公开的资源对象的推荐方法中相应的部分,这里不再进行赘述。
本申请提供的资源对象的推荐装置中,第一构建单元701根据用户的行为信息,构建用户的图关系网络。第二构建单元702又构建得到图关系网络中的每一个资源对象的嵌入向量。其中,每一个资源对象的嵌入向量包括:资源对象的每一个特征的潜在语义向量。第一计算单元703根据每一个资源对象的嵌入向量,计算得到资源对象的隐藏向量。其中,资源对象的隐藏向量包括资源对象的每一个特征的高阶特征向量;每一个特征的高阶特征向量用于说明每一个特征与资源对象的其他特征间的关联性。第二计算单元704根据每一个资源对象和资源对象的邻居资源对象的隐藏向量,计算得到每一个资源对象的最终特征向量;其中,每一个资源对象的最终特征向量用于说明每一个资源对象与其邻居资源对象之间的关联性。选择单元705从用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象。由于本申请选择单元705可从第二计算单元704得到的用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象作为推荐资源对象,实现自动向用户推荐感兴趣的对象的功能。
本申请另一实施例还提供了一种计算机可读介质,其上存储有计算机程序,其中,该程序被处理器执行时实现以上各方法实施例提供的资源对象的推荐方法。
本发明实施例涉及的系统可以是由客户端、多个节点(接入网络中的任意形式的计算设备,如服务器、用户终端)通过网络通信的形式连接形成的分布式系统。其中,分布式系统中的任意一个节点用于执行以上各方法实施例提供的资源对象的推荐方法。
以分布式系统为区块链系统为例,参见图8,图8是本发明实施例提供的分布式系统800应用于区块链系统的一个可选的结构示意图,由多个节点(接入网络中的任意形式的计算设备,如服务器、用户终端)和客户端形成,节点之间形成组成的点对点(P2P,Peer ToPeer)网络,P2P协议是一个运行在传输控制协议(TCP,Transmission Control Protocol)协议之上的应用层协议。在分布式系统中,任何机器如服务器、终端都可以加入而成为节点,节点包括硬件层、中间层、操作系统层和应用层。
区块链系统中的任意一个节点用于执行以上各方法实施例提供的资源对象的推荐方法,并将计算得到的推荐资源对象的信息以区块链的形式共享给区块链系统中的所有的设备。
参见图8示出的区块链系统中各节点的功能,涉及的功能包括:
1)路由,节点具有的基本功能,用于支持节点之间的通信。
节点除具有路由功能外,还可以具有以下功能:
2)应用,用于部署在区块链中,根据实际业务需求而实现特定业务,记录实现功能相关的数据形成记录数据,在记录数据中携带数字签名以表示任务数据的来源,将记录数据发送到区块链系统中的其他节点,供其他节点在验证记录数据来源以及完整性成功时,将记录数据添加到临时区块中。
例如,应用实现的业务包括:
2.1)钱包,用于提供进行电子货币的交易的功能,包括发起交易(即,将当前交易的交易记录发送给区块链系统中的其他节点,其他节点验证成功后,作为承认交易有效的响应,将交易的记录数据存入区块链的临时区块中;当然,钱包还支持查询电子货币地址中剩余的电子货币;
2.2)共享账本,用于提供账目数据的存储、查询和修改等操作的功能,将对账目数据的操作的记录数据发送到区块链系统中的其他节点,其他节点验证有效后,作为承认账目数据有效的响应,将记录数据存入临时区块中,还可以向发起操作的节点发送确认。
2.3)智能合约,计算机化的协议,可以执行某个合约的条款,通过部署在共享账本上的用于在满足一定条件时而执行的代码实现,根据实际的业务需求代码用于完成自动化的交易,例如查询买家所购买商品的物流状态,在买家签收货物后将买家的电子货币转移到商户的地址;当然,智能合约不仅限于执行用于交易的合约,还可以执行对接收的信息进行处理的合约。
3)区块链,包括一系列按照产生的先后时间顺序相互接续的区块(Block),新区块一旦加入到区块链中就不会再被移除,区块中记录了区块链系统中节点提交的记录数据。
参见图9,图9是本发明实施例提供的区块结构(Block Structure)一个可选的示意图,每个区块中包括本区块存储交易记录的哈希值(本区块的哈希值)、以及前一区块的哈希值,各区块通过哈希值连接形成区块链。另外,区块中还可以包括有区块生成时的时间戳等信息。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了相关的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (10)

1.一种资源对象的推荐方法,其特征在于,包括:
根据用户的行为信息,构建所述用户的图关系网络;其中,所述用户的图关系网络中包括多个具有连接关系的资源对象,所述资源对象的连接关系用于说明所述资源对象间的关联性;
构建得到所述图关系网络中的每一个资源对象的嵌入向量;其中,所述每一个资源对象的嵌入向量包括:所述资源对象的每一个特征的潜在语义向量;
根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量;其中,所述资源对象的隐藏向量包括所述资源对象的每一个特征的高阶特征向量;所述每一个特征的高阶特征向量用于说明所述每一个特征与所述资源对象的其他特征间的关联性;
根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量;其中,所述每一个资源对象的最终特征向量用于说明所述每一个资源对象与其邻居资源对象之间的关联性;所述资源对象的邻居资源对象为所述图关系网络中与所述资源对象有连接关系的资源对象;
从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象;其中,n为正整数。
2.根据权利要求1所述的方法,其特征在于,所述根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量,包括:
将所述每一个资源对象的嵌入向量输入至K层多头自注意力网络,由所述K层多头自注意力网络计算所述资源对象的嵌入向量,得到所述每一个资源对象的隐藏向量;其中,K为正整数;所述K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,所述K层多头自注意力网络中末尾层输出的向量为所述资源对象的隐藏向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量,包括:
将所述每一个资源对象的隐藏向量输入至前馈神经网络,得到所述每一个资源对象的中间隐藏向量;
将所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量进行多次处理操作,得到所述每一个资源对象的最终特征向量;
其中,首次所述处理操作的输入信息为:所述每一个资源对象的中间隐藏向量以及所述资源对象的邻居资源对象的中间隐藏向量;从第二次所述处理操作开始,每一次所述处理操作的输出结果作为下一次处理操作的输入信息;
所述处理操作包括:利用多头自注意力网络计算每一次的输入信息,得到所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量;将所述每一个资源对象的聚合向量以及所述资源对象的邻居资源对象的聚合向量进行拼接,得到所述每一个资源对象的拼接聚合向量;将所述每一个资源对象的拼接聚合向量代入至激活函数后进行归一化处理。
4.根据权利要求1所述的方法,其特征在于,所述根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量之后,还包括:
基于所述图关系网络,生成随机游走的序列;
针对所述序列中的其中一个资源对象,使用窗口构造方法得到所述资源对象的正例对;
根据所述资源对象的正例对,计算所述资源对象的推荐方法中的损失值;
根据所述损失值,采用误差反向传导算法调节所述资源对象的推荐方法中使用到的参数值。
5.根据权利要求1所述的方法,其特征在于,所述根据用户的行为信息,构建所述用户的图关系网络,包括:
在所述用户在预设的周期时间内所点击的对象之间构建连接关系,且在与所述点击的对象相似度高于阈值的对象和所述点击的对象之间构建连接关系,形成所述用户的图关系网络。
6.根据权利要求1所述的方法,其特征在于,所述从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象,包括:
从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的q个资源对象的最终特征向量,作为粗排模型的输入向量;其中,所述q为大于所述n的正整数;
将所述q个资源对象的最终特征向量输入至所述粗排模型中,使所述q个资源对象按照第一类特征进行排序;其中,所述第一类特征包括:用户特征,和/或,资源对象特征;
依据排序后的q个资源对象选出n个资源对象,将所述n个资源对象作为推荐资源对象。
7.根据权利要求6所述的方法,其特征在于,所述依据排序后的q个资源对象选出n个资源对象,将所述n个资源对象作为推荐资源对象,包括:
依据排序后的q个资源对象选出m个资源对象,将所述m个资源对象的最终特征向量作为精排模型的输入向量;其中,所述m为小于所述q、且大于所述n的正整数;
将所述m个资源对象的最终特征向量输入至所述精排模型中,使所述m个资源对象的最终特征向量按照第二类特征进行排序;所述第二类特征包括:用户特征,和/或,资源对象特征;
依据排序后的m个资源对象选出n个资源对象,作为所述推荐资源对象。
8.一种资源对象的推荐装置,其特征在于,包括:
第一构建单元,用于根据用户的行为信息,构建所述用户的图关系网络;其中,所述用户的图关系网络中包括多个具有连接关系的资源对象,所述资源对象的连接关系用于说明所述资源对象间的关联性;
第二构建单元,用于构建得到所述图关系网络中的每一个资源对象的嵌入向量;其中,所述每一个资源对象的嵌入向量包括:所述资源对象的每一个特征的潜在语义向量;
第一计算单元,用于根据所述每一个资源对象的嵌入向量,计算得到所述资源对象的隐藏向量;其中,所述资源对象的隐藏向量包括所述资源对象的每一个特征的高阶特征向量;所述每一个特征的高阶特征向量用于说明所述每一个特征与所述资源对象的其他特征间的关联性;
第二计算单元,用于根据所述每一个资源对象和所述资源对象的邻居资源对象的隐藏向量,计算得到所述每一个资源对象的最终特征向量;其中,所述每一个资源对象的最终特征向量用于说明所述每一个资源对象与其邻居资源对象之间的关联性;所述资源对象的邻居资源对象为所述图关系网络中与所述资源对象有连接关系的资源对象;
选择单元,用于从所述用户的图关系网络中的资源对象的最终特征向量中,选择出与用户当前访问的资源对象的最终特征向量相似度最高的n个资源对象,作为推荐资源对象;其中,n为正整数。
9.根据权利要求8所述的装置,其特征在于,所述第一计算单元,包括:
第一计算子单元,用于将所述每一个资源对象的嵌入向量输入至K层多头自注意力网络,由所述K层多头自注意力网络计算所述资源对象的嵌入向量,得到所述每一个资源对象的隐藏向量;其中,K为正整数;所述K层多头自注意力网络中的上一层输出的向量作为下一层多头自注意力网络输入的向量,所述K层多头自注意力网络中末尾层输出的向量为所述资源对象的隐藏向量。
10.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1至7中任一所述的方法。
CN201910900920.1A 2019-09-23 2019-09-23 资源对象的推荐方法、装置及计算机可读介质 Pending CN110598118A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910900920.1A CN110598118A (zh) 2019-09-23 2019-09-23 资源对象的推荐方法、装置及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910900920.1A CN110598118A (zh) 2019-09-23 2019-09-23 资源对象的推荐方法、装置及计算机可读介质

Publications (1)

Publication Number Publication Date
CN110598118A true CN110598118A (zh) 2019-12-20

Family

ID=68862395

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910900920.1A Pending CN110598118A (zh) 2019-09-23 2019-09-23 资源对象的推荐方法、装置及计算机可读介质

Country Status (1)

Country Link
CN (1) CN110598118A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111382190A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 一种基于智能的对象推荐方法、装置和存储介质
CN112182413A (zh) * 2020-12-01 2021-01-05 三盟科技股份有限公司 一种基于教学大数据的智能推荐方法及服务器
WO2021139325A1 (zh) * 2020-01-09 2021-07-15 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、电子设备及存储介质
CN113206855A (zh) * 2021-05-10 2021-08-03 中国工商银行股份有限公司 数据访问异常的检测方法、装置、电子设备及存储介质
CN113256190A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 资源召回方法及装置
CN113360745A (zh) * 2020-03-04 2021-09-07 阿里巴巴集团控股有限公司 一种数据对象推荐方法、装置及电子设备
CN115174997A (zh) * 2022-06-29 2022-10-11 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法
WO2022239975A1 (en) * 2020-05-20 2022-11-17 Samsung Electronics Co., Ltd. System and method for explainable embedding-based recommendation system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104903885A (zh) * 2012-12-21 2015-09-09 微软技术许可有限责任公司 矩阵因式分解中的特征嵌入
CN105653535A (zh) * 2014-11-13 2016-06-08 中国科学院沈阳计算技术研究所有限公司 一种媒体资源推荐方法
US20190163982A1 (en) * 2017-11-28 2019-05-30 Visual Semantics, Inc. Method and apparatus for integration of detected object identifiers and semantic scene graph networks for captured visual scene behavior estimation
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104903885A (zh) * 2012-12-21 2015-09-09 微软技术许可有限责任公司 矩阵因式分解中的特征嵌入
CN105653535A (zh) * 2014-11-13 2016-06-08 中国科学院沈阳计算技术研究所有限公司 一种媒体资源推荐方法
US20190163982A1 (en) * 2017-11-28 2019-05-30 Visual Semantics, Inc. Method and apparatus for integration of detected object identifiers and semantic scene graph networks for captured visual scene behavior estimation
CN110119467A (zh) * 2019-05-14 2019-08-13 苏州大学 一种基于会话的项目推荐方法、装置、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴增源,钮亮,虎陈霞: "《电子商务创业管理》", 30 September 2015 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139325A1 (zh) * 2020-01-09 2021-07-15 腾讯科技(深圳)有限公司 媒体信息推荐方法、装置、电子设备及存储介质
US12056176B2 (en) 2020-01-09 2024-08-06 Tencent Technology (Shenzhen) Company Limited Media information recommendation method and apparatus, electronic device, and storage medium
CN113360745A (zh) * 2020-03-04 2021-09-07 阿里巴巴集团控股有限公司 一种数据对象推荐方法、装置及电子设备
CN111382190A (zh) * 2020-03-04 2020-07-07 腾讯科技(深圳)有限公司 一种基于智能的对象推荐方法、装置和存储介质
WO2022239975A1 (en) * 2020-05-20 2022-11-17 Samsung Electronics Co., Ltd. System and method for explainable embedding-based recommendation system
CN112182413B (zh) * 2020-12-01 2021-02-19 三盟科技股份有限公司 一种基于教学大数据的智能推荐方法及服务器
CN112182413A (zh) * 2020-12-01 2021-01-05 三盟科技股份有限公司 一种基于教学大数据的智能推荐方法及服务器
CN113206855A (zh) * 2021-05-10 2021-08-03 中国工商银行股份有限公司 数据访问异常的检测方法、装置、电子设备及存储介质
CN113206855B (zh) * 2021-05-10 2022-10-28 中国工商银行股份有限公司 数据访问异常的检测方法、装置、电子设备及存储介质
CN113256190A (zh) * 2021-07-15 2021-08-13 腾讯科技(深圳)有限公司 资源召回方法及装置
CN113256190B (zh) * 2021-07-15 2021-10-29 腾讯科技(深圳)有限公司 资源召回方法及装置
CN115174997A (zh) * 2022-06-29 2022-10-11 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法
CN115174997B (zh) * 2022-06-29 2023-11-28 Vidaa国际控股(荷兰)公司 显示设备和媒资推荐方法

Similar Documents

Publication Publication Date Title
CN110598118A (zh) 资源对象的推荐方法、装置及计算机可读介质
CN112000819B (zh) 多媒体资源推荐方法、装置、电子设备及存储介质
CA3007853C (en) End-to-end deep collaborative filtering
CN110837598B (zh) 信息推荐方法、装置、设备及存储介质
JP5897019B2 (ja) 候補製品のリンクリストを判定する方法および装置
CN111506820B (zh) 推荐模型、方法、装置、设备及存储介质
Okon et al. An improved online book recommender system using collaborative filtering algorithm
CN111461841A (zh) 物品推荐方法、装置、服务器及存储介质
CN111008336A (zh) 一种内容推荐方法、装置、设备及可读存储介质
CN110008397A (zh) 一种推荐模型训练方法及装置
JP7257172B2 (ja) 通信プログラム、通信装置、および、通信方法
CN113191838A (zh) 一种基于异质图神经网络的购物推荐方法及系统
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN113761359B (zh) 数据包推荐方法、装置、电子设备和存储介质
CN110866489A (zh) 图像识别方法、装置、设备及存储介质
CN113868466B (zh) 视频推荐的方法、装置、设备和存储介质
CN108268519A (zh) 一种推荐网络对象的方法和装置
CN114154080A (zh) 一种基于图神经网络的动态社会化推荐方法
WO2020135420A1 (zh) 对用户进行分类的方法和装置
CN115564532A (zh) 序列推荐模型的训练方法及装置
CN108830680A (zh) 基于离散分解机的个性化推荐方法、系统及存储介质
CN111460300B (zh) 网络内容推送方法、装置及存储介质
CN110727705B (zh) 信息推荐方法、装置、电子设备及计算机可读存储介质
CN116777529B (zh) 一种对象推荐的方法、装置、设备、存储介质及程序产品
Rasolroveicy et al. IntelliChain: An Intelligent and Scalable Framework for Decentralized Applications on Public Blockchain Technologies: An NFT Marketplace Case Study

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221124

Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518133

Applicant after: Shenzhen Yayue Technology Co.,Ltd.

Address before: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors

Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd.

TA01 Transfer of patent application right