CN114692007A - 表示信息的确定方法、装置、设备及存储介质 - Google Patents

表示信息的确定方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114692007A
CN114692007A CN202210613440.9A CN202210613440A CN114692007A CN 114692007 A CN114692007 A CN 114692007A CN 202210613440 A CN202210613440 A CN 202210613440A CN 114692007 A CN114692007 A CN 114692007A
Authority
CN
China
Prior art keywords
node
class object
nodes
representation information
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210613440.9A
Other languages
English (en)
Other versions
CN114692007B (zh
Inventor
林苏颖
张立冬
石思源
林宇澄
迟铭宇
魏春水
周燕红
阮超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210613440.9A priority Critical patent/CN114692007B/zh
Publication of CN114692007A publication Critical patent/CN114692007A/zh
Application granted granted Critical
Publication of CN114692007B publication Critical patent/CN114692007B/zh
Priority to PCT/CN2023/084684 priority patent/WO2023231542A1/zh
Priority to US18/583,686 priority patent/US20240193402A1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/45Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/483Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种表示信息的确定方法、装置、设备及存储介质,可应用于计算机技术中的媒体资源推荐、人工智能以及车载等场景。在本申请实施例提供的技术方案中,获取了异质图,该异质图包括目标资源业务中多类实体对应的节点。通过图神经网络采用多类元路径对该异质图进行处理,得到第一类对象节点和第二类对象节点的初始表示信息,由于元路径连接了不同类型的节点,那么对象节点的初始表示信息中也就携带了媒体资源的相关信息。基于连线将第一类对象节点和第二类对象节点的初始表示信息进行了融合,得到的目标表示信息能够更加充分地表示该第一类对象。基于目标表示信息向该第一类对象进行媒体资源的推荐时,推荐的媒体资源的准确性较高。

Description

表示信息的确定方法、装置、设备及存储介质
技术领域
本申请涉及计算机技术领域,特别涉及一种表示信息的确定方法、装置、设备及存储介质。
背景技术
随着网络技术的发展,网络上所呈现的媒体资源的数量越来越多,而如何从海量媒体资源中为用户推荐符合需求的媒体资源,逐渐成为了目前研究的主流方向。
目前,通常会采用图神经网络来对媒体资源的业务数据进行分析,从而确定向用户推荐哪些媒体资源,图神经网络的本质是一种图数据处理方法,通过对用于表示业务数据的图数据进行处理,得到图数据中节点的表示信息,也即是,得到用户与用户或者用户与媒体资源之间的关系,以便进行推荐。在进行媒体资源推荐的过程中,不可避免地会遇到向一些交互数据较少的用户推荐媒体资源的情况,目前的图神经网络无法满足相应需求。
发明内容
本申请实施例提供了一种表示信息的确定方法、装置、设备及存储介质,该方法能够提高确定出的表示信息的准确性,从而提高媒体资源推荐的准确性,该技术方案如下。
一方面,提供了一种表示信息的确定方法,该方法包括:
获取目标资源业务的异质图,所述异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示所述目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,所述目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,所述第一类对象为与所述媒体资源之间发生目标交互行为的次数小于目标次数的对象,所述第二类对象为与所述媒体资源之间发生所述目标交互行为的次数大于或等于所述目标次数的对象;
通过图神经网络,按照所述异质图中多个节点的多类元路径,对所述异质图进行图卷积,得到所述多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,所述第一类对象节点对应于所述第一类对象,所述第二类对象节点对应于所述第二类对象,所述多类元路径中的任一类元路径用于表示所述异质图中不同类型节点之间的一种连接方式;
基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息,所述目标表示信息用于向所述第一类对象进行媒体资源的推荐。
一方面,提供了一种表示信息的确定装置,该装置包括:
异质图获取模块,用于获取目标资源业务的异质图,所述异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示所述目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,所述目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,所述第一类对象为与所述媒体资源之间发生目标交互行为的次数小于目标次数的对象,所述第二类对象为与所述媒体资源之间发生所述目标交互行为的次数大于或等于所述目标次数的对象;
图卷积模块,用于通过图神经网络,按照所述异质图中多个节点的多类元路径,对所述异质图进行图卷积,得到所述多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,所述第一类对象节点对应于所述第一类对象,所述第二类对象节点对应于所述第二类对象,所述多类元路径中的任一类元路径用于表示所述异质图中不同类型节点之间的一种连接方式;
融合模块,用于基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息,所述目标表示信息用于向所述第一类对象进行媒体资源的推荐。
在一种可能的实施方式中,所述异质图获取模块,用于获取所述目标资源业务中的多个实体的实体特征以及所述多个实体之间的关联数据,所述关联数据用于表示所述多个实体中不同类型实体之间的关联关系;基于所述多个实体的实体特征以及所述多个实体中不同类型实体之间的关联数据,生成所述异质图。
在一种可能的实施方式中,所述异质图获取模块,用于生成所述多个实体分别对应的节点,所述节点的节点特征为对应实体的实体特征,不同类型的实体对应于不同类型的节点;基于所述多个实体中不同类型实体之间的关联数据,在生成的多个节点之间增加连线,得到所述异质图。
在一种可能的实施方式中,所述异质图获取模块,用于执行下述至少一项:
在所述关联数据表示所述多个实体中任一第一类对象在目标时间段内对任一媒体资源发生过所述目标交互行为的情况下,在所述第一类对象对应的第一类对象节点和所述媒体资源对应的资源节点之间增加第一类连线,所述第一类连线的权重与所述目标交互行为的数量正相关;
在所述关联数据表示所述多个实体中任一第二类对象在所述目标时间段内对任一媒体资源发生过所述目标交互行为的情况下,在所述第二类对象对应的第二类对象节点和所述媒体资源对应的资源节点之间增加所述第一类连线;
在所述关联数据表示所述多个实体中任一媒体资源的生产者为所述多个实体中的任一第一类对象的情况下,在所述第一类对象对应的第一类对象节点和所述媒体资源对应的资源节点之间增加第二类连线;
在所述关联数据表示所述多个实体中任一媒体资源的生产者为所述多个实体中的任一第二类对象的情况下,在所述第二类对象对应的第二类对象节点和所述媒体资源对应的资源节点之间增加所述第二类连线。
在一种可能的实施方式中,所述图卷积模块,用于对于所述多个节点中的任一第一类对象节点,基于所述图神经网络,按照所述第一类对象节点的多条元路径对所述第一类对象节点进行图卷积,得到所述节点的初始表示信息,所述第一类对象节点的多条元路径的终点均为所述第一类对象节点;对于所述多个节点中的任一第二类对象节点,基于所述图神经网络,按照所述第二类对象节点的多条元路径对所述第二类对象节点进行图卷积,得到所述节点的初始表示信息,所述第二类对象节点的多条元路径的终点均为所述第二类对象节点。
在一种可能的实施方式中,所述图卷积模块,用于基于所述图神经网络,将所述第一类对象节点的多条元路径所经过节点的节点特征与所述第一类对象节点的节点特征进行融合,得到所述第一类对象节点的初始表示信息。
在一种可能的实施方式中,所述融合模块,用于对于所述多个节点中的任一第一类对象节点,基于所述第一类对象节点与资源节点之间的连线,确定所述第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,所述相关第二类对象节点对应的第二类对象与所述第一类对象对同一个媒体资源发生过所述目标交互行为,所述不相关第二类对象节点对应的第二类对象发生过所述目标交互行为的媒体资源与所述第一类对象发生过所述目标交互行为的媒体资源均不相同;将所述第一类对象节点的初始表示信息、所述至少一个相关第二类对象节点的初始表示信息以及所述至少一个不相关第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的融合表示信息;基于所述至少一个相关第二类对象节点的初始表示信息,对所述第一类对象节点的融合表示信息进行调整,得到所述第一类对象节点的目标表示信息。
在一种可能的实施方式中,所述融合模块,用于在所述第一类对象节点的初始表示信息中增加掩码,得到所述第一类对象节点的参考表示信息;将所述第一类对象节点的参考表示信息、所述至少一个相关第二类对象节点的初始表示信息以及所述至少一个不相关第二类对象节点的初始表示信息进行加权求和,得到所述第一类对象节点的融合表示信息。
在一种可能的实施方式中,所述融合模块,用于将所述至少一个相关第二类对象节点的初始表示信息输入目标分类器,由所述目标分类器输出所述相关第二类对象节点对应的第二类对象的对象类型;将所述第一类对象节点的融合表示信息输入所述输入目标分类器,由所述目标分类器输出所述第一类对象节点对应的第一类对象的对象类型;基于所述第二类对象的对象类型与所述第一类对象的对象类型之间的差异信息,对所述第一类对象节点的融合表示信息进行调整,得到所述第一类对象节点的目标表示信息。
在一种可能的实施方式中,所述装置还包括:
训练模块,用于基于所述多个节点之间的连线,获取多个正样本节点对和多个负样本节点对,所述正样本节点对为所述异质图中间接相连的两个相同类型的节点,所述负样本节点对为所述异质图中不相连的两个相同类型的节点;基于每个所述正样本节点对的初始表示信息之间的第一差异信息,以及每个所述负样本节点对的初始表示信息之间的第二差异信息,对所述图神经网络进行训练。
在一种可能的实施方式中,所述装置还包括:
训练模块,用于对于所述多个节点中的任一节点,基于所述节点的多个候选表示信息中任两个候选表示信息之间的第三差异信息,对所述图神经网络进行训练,所述节点的候选表示信息是按照所述节点的一组元路径进行图卷积得到的表示信息。
在一种可能的实施方式中,所述装置还包括:
推荐模块,用于基于所述第一类对象节点的目标表示信息,确定与所述第一类对象之间相似度符合第一相似度条件的至少一个候选对象;向所述第一类对象推荐所述至少一个候选对象发生过所述目标交互行为的媒体资源。
一方面,提供了一种计算机设备,该计算机设备包括一个或多个处理器和一个或多个存储器,该一个或多个存储器中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器加载并执行以实现该表示信息的确定方法。
一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现该表示信息的确定方法。
一方面,提供了一种计算机程序产品,该计算机程序被处理器执行时实现该表示信息的确定方法。
通过本申请实施例提供的技术方案,获取了目标资源业务的异质图,该异质图包括目标资源业务中多类实体对应的节点。通过图神经网络采用多类元路径对该异质图进行处理,得到第一类对象节点的初始表示信息和第二类对象节点的初始表示信息,由于元路径连接了不同类型的节点,那么对象节点的初始表示信息中也就携带了媒体资源的相关信息。基于连线将第一类对象节点和第二类对象节点的初始表示信息进行了融合,得到的目标表示信息能够更加充分地表示该第一类对象。基于目标表示信息向该第一类对象进行媒体资源的推荐时,推荐的媒体资源的准确性较高。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种表示信息的确定方法的实施环境示意图;
图2是本申请实施例提供的一种表示信息的确定方法的流程图;
图3是本申请实施例提供的另一种表示信息的确定方法的流程图;
图4是本申请实施例提供的一种节点间连线的示意图;
图5是本申请实施例提供的另一种节点间连线的示意图;
图6是本申请实施例提供的一种构建异质图的流程图;
图7是本申请实施例提供的一种第一类对象节点的多条元路径的示意图;
图8是本申请实施例提供的两类元路径的示意图;
图9是本申请实施例提供的又一种表示信息的确定方法的流程图;
图10是本申请实施例提供的一种正负样本对的示意图;
图11是本申请实施例提供的一种表示信息的确定装置的结构示意图;
图12是本申请实施例提供的一种终端的结构示意图;
图13是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步的详细描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分,应理解,“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系,也不对数量和执行顺序进行限定。
为了便于理解本申请实施例的技术过程,下面对本申请实施例所涉及的一些名词进行解释:
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
图神经网络(Graph Neural Networks,GNN),是一种基于图结构的深度学习算法,在计算机科学中,图是由节点和边两部分组成的数据结构,图神经网络是一种直接作用于图结构上的神经网络,其本质是一种图数据处理方法,用来获得图数据特征表示。
异质图(Heterogeneous Graph),又称异质图,是一种包含多种节点或边类型的图。
元路径(Meta-path),图结构中用于连接两类实体的一条特定的路径模式。比如“视频→用户→视频”这条元路径可以连接两个视频,因此可以视为一种挖掘视频之间的潜在关系的方式。
嵌入(Embedding),又称表征或表示,是一个实体在低维空间中的一个向量表示。是一种隐式的表征,表现成一个多维的向量,例如一个单词、一件商品、一部电影等都可以用embedding表示。
注意力机制(Attention),本质就是定位到感兴趣的信息,抑制无用信息,结果通常都是以概率图或者概率特征向量的形式展示,是深度学习中经常用到的一种机制。
ICF(Item-based Collaborative Filtering,基于物品的协同过滤)召回:即根据用户历史选择物品的行为,通过物品间的相似度,给用户推荐其他物品。
UCF(User-based Collaborative Filtering,基于用户的协同过滤)召回:即找到兴趣相同的用户,把其中某个用户选择过的东西,推荐给其他的用户。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
以下对本申请的实施环境进行介绍,图1是本申请实施例提供的一种表示信息的确定方法的实施环境示意图,参见图1,该实施环境包括:终端101和服务器102,终端101和服务器102之间通过有线或者无线网络相互连接。
终端101安装和运行有支持媒体资源播放的应用程序。可选地,该应用程序是社交应用、媒体资源应用等等。
终端101可以是车载终端、智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、智能电视等,本申请实施例对此不作限定。
服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。可选地,上述终端或服务器的数量可以更多或更少,本申请实施例对此不加以限定。
在一些实施例中,上述终端101和服务器102能够作为区块链系统中的节点。
在介绍完本申请实施例的实施环境之后,下面将结合上述实施环境,对本申请实施例的应用场景进行说明,在下述说明过程中,终端也即是上述实施环境中的终端101,服务器也即是上述实施环境中的服务器102。
本申请实施例提供的技术方案能够应用在推荐各类媒体资源的场景下,比如,应用在推荐短视频的场景下,或者应用在推荐影视作品的场景下,或者应用在推荐音乐的场景下,或者应用在推荐文章的场景下。
在推荐短视频的场景下,终端启动观看短视频的应用程序,该应用程序登录有第一类对象,该第一类对象为推荐业务的新用户,推荐业务的新用户包括新注册的用户以及观看短视频的数量较少的用户。终端向服务器发送短视频推荐请求,该短视频推荐请求携带该第一类对象。服务器获取该短视频推荐请求,从该推荐请求中获取该第一类对象。服务器基于该第一类对象在对象数据库中进行查询,得到该第一类对象对应的目标表示信息,该目标表示信息能够从一定程度上反映该第一类对象对短视频的喜好。服务器基于该目标表示信息在短视频数据库中进行匹配,确定至少一个候选类对象,该候选对象也即是与该第一类对象具有相同短视频喜好的对象。服务器向该第一类对象推荐该至少一个候选对象进行过目标交互行为的短视频,从而实现对推荐业务的新用户进行短视频推荐的目的。在上述过程中,第一类对象对应的目标表示信息的准确性会影响短视频推荐的准确性,采用本申请实施例提供的技术方案,能够通过异质图来确定第一类对象节点的初始表示信息和第二类对象节点的初始表示信息,第一类对象节点对应于第一类对象,也即是推荐业务的新用户;第二类对象节点对应于第二类对象,也即是推荐业务的老用户。根据异质图中的连线,将第二类对象节点的初始表示信息与第一类对象节点的初始表示信息进行融合,也就是利用推荐业务的老用户的初始表示信息来丰富推荐业务的新用户的表示信息,从而得到第一类对象节点的目标表示信息,第一类对象节点的目标表示信息能够在提高准确性的前提下,携带更多的信息,从而基于目标表示信息进行短视频的推荐时的准确性较高。
需要说明的是,在上述说明过程中,是以服务器推荐短视频为例进行说明的,在服务器推荐影视作品、推荐音乐以及推荐文章等场景中,与上述说明过程属于同一发明构思,内容不再赘述。当然,本申请实施例提供的技术方案除了能够应用在上述几个场景之外,还能够应用在推荐其他类型的媒体资源的场景中,本申请实施例对此不做限定。
在介绍完本申请实施例的实施环境和应用场景之后,下面对本申请实施例提供的技术方案进行介绍。参见图2,本申请实施例提供的技术方案可以由终端或服务器执行,也可以由终端和服务器共同执行,在本申请实施例中,以执行主体为服务器为例进行说明,方法包括下述步骤。
201、服务器获取目标资源业务的异质图,该异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示该目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,该目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,该第一类对象为与该媒体资源之间发生目标交互行为的次数小于目标次数的对象,该第二类对象为与该媒体资源之间发生目标交互行为的次数大于或等于该目标次数的对象。
其中,目标资源业务为推荐媒体资源的业务,根据推荐的媒体资源的不同,目标资源业务具有相应的含义。异质图是指包括两类或两类以上节点的图,在异质图中,在两个节点之间存在连线的情况下,表示这两个节点之间具有关联关系。在两个节点之间不存在连线的情况下,表示这两个节点之间不具有关联关系。实体是指在进行目标资源业务时具有意义的概念,实体的确定与目标资源业务相关联。该目标资源业务的媒体资源为可供进行媒体资源推荐的媒体资源,比如可供推荐的短视频、影视作品、音乐或者文章等。该目标资源业务的第一类对象和第二类对象均为可供进行媒体资源推荐的对象,该第一类对象为与媒体资源发生目标交互行为的次数较少的对象,也即是推荐业务的新用户,该目标交互行为包括观看、点赞、分享、收藏以及评论等。该第二类对象为与媒体资源发生目标交互行为的次数较多的对象,也即是推荐业务的老用户。
202、服务器通过图神经网络,按照该异质图中多个节点的多类元路径,对该异质图进行图卷积,得到该多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,该第一类对象节点对应于该第一类对象,该第二类对象节点对应于该第二类对象,该多类元路径中的任一类元路径用于表示该异质图中不同类型节点之间的一种连接方式。
其中,图神经网络用于异质图进行图卷积,得到第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息。在一些实施例中,该图神经网络为训练完成的图神经网络。多类元路径表示异质图中不同类型节点之间的不同连接方式,那么对于异质图中的一个节点来说,该第一类对象节点可以属于不同的元路径。
203、服务器基于该多个节点之间的连线,将该第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的目标表示信息,该目标表示信息用于向该第一类对象进行媒体资源的推荐。
其中,多个节点之间的连线用于表示多个节点之间的关联关系,比如,在一个第一类对象节点与一个资源节点相连的情况下,表示该第一类对象节点对应的第一类对象与该资源节点对应的媒体资源之间发生过目标交互行为,该资源节点为该异质图中对应于媒体资源的节点。
通过本申请实施例提供的技术方案,获取了目标资源业务的异质图,该异质图包括目标资源业务中多类实体对应的节点。通过图神经网络采用多类元路径对该异质图进行处理,得到第一类对象节点的初始表示信息和第二类对象节点的初始表示信息,由于元路径连接了不同类型的节点,那么对象节点的初始表示信息中也就携带了媒体资源的相关信息。基于连线将第一类对象节点和第二类对象节点的初始表示信息进行了融合,得到的目标表示信息能够更加充分地表示该第一类对象。基于目标表示信息向该第一类对象进行媒体资源的推荐时,推荐的媒体资源的准确性较高。
需要说明的是,上述步骤201-203是对本申请实施例提供的技术方案的简单介绍,下面将结合一些例子,对本申请实施例提供的技术方案进行更加清楚的说明,参见图3,本申请实施例提供的技术方案可以由终端或服务器执行,也可以由终端和服务器共同执行,在本申请实施例中,以执行主体为服务器为例进行说明,方法包括下述步骤。
301、服务器获取目标资源业务中多个实体的实体特征以及该多个实体之间的关联数据,该目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,该第一类对象为与该媒体资源之间发生目标交互行为的次数小于目标次数的对象,该第二类对象为与该媒体资源之间发生目标交互行为的次数大于或等于该目标次数的对象,该关联数据用于表示该多个实体中不同类型实体之间的关联关系。
其中,媒体资源、第一类对象和第二类对象的数量均为多个。该多个实体之间的关联数据包括第一类对象与媒体资源之间的交互数据以及第二类对象与媒体资源之间的交互数据,第一类对象为与该媒体资源之间发生目标交互行为的次数小于目标次数的对象,也即是与媒体资源发生目标交互行为的次数较少的对象,该目标次数由技术人员根据实际情况进行设置,比如设置为10、15或者20等,本申请实施例对此不做限定。该目标交互行为包括观看、点赞、分享、收藏以及评论等。在该第一类对象为第一类用户账号的情况下,该第一类对象也被称为推荐业务的新用户账号,推荐业务的新用户账号包括新注册的用户账号以及活跃度较低的用户账号,活跃度较低也即是发生上述目标交互行为的次数较少。第二类对象为与该媒体资源之间发生目标交互行为的次数大于或等于该目标次数的对象,也即是与媒体资源发生目标交互行为的次数较多的对象。在该第二类对象为第二类用户账号的情况下,该第二类对象也被称为推荐业务的老用户账号,或者叫活跃度较高的用户账号,活跃度较高也即是发生上述目标交互行为的次数较多。在一些实施例中,第一类对象也被称为推荐业务的新用户,第二类对象也被称为推荐业务的老用户。目标互动行为也被称为正向行为。
该多个实体之间的关联数据包括第一类对象与媒体资源之间的关联数据以及第二类对象与媒体资源之间的关联数据。对于第一类对象来说,该第一类对象与媒体资源之间的交互数据包括该第一类对象对媒体资源执行的目标交互行为的相关数据,比如该第一类对象对媒体资源的观看、点赞、分享、收藏以及评论等交互行为的相关数据。在一些实施例中,相关数据包括执行上述目标交互行为的时间。该第一类对象与媒体资源之间的交互数据还包括第一类对象与媒体资源之间的从属数据,比如,第一类对象为某个媒体资源的生产者。对于第二类对象来说,该第二类对象与媒体资源之间的交互数据包括该第二类对象对媒体资源执行的目标交互行为的相关数据,比如该第二类对象对媒体资源的观看、点赞、分享、收藏以及评论等交互行为的相关数据,在一些实施例中,相关数据包括执行上述目标交互行为的时间。该第二类对象与媒体资源之间的交互数据还包括第二类对象与媒体资源之间的从属数据,比如,第二类对象为某个媒体资源的生产者。
在一些实施例中,该多个实体之间的关联数据还包括第一类对象与第二类对象之间的关联数据、多个第二类对象之间的关联数据以及多个媒体资源之间的关联数据中的至少一项,本申请实施例对此不做限定。其中,第一类对象与第二类对象之间的关联数据用于表示第一类对象和第二类对象之间的关联关系,比如,第一类对象是由第二类对象邀请的。多个第二类对象之间的关联数据把包括多个第二类对象之间的关注以及邀请等数据。多个媒体资源之间的关联数据包括多个媒体资源之间的来源数据,比如,来源数据记录了两个媒体资源来源于同一个生产者,或者,两个媒体资源来源于同一个媒体资源集合等。
多个实体的实体特征也被称为多个实体的实体信息,比如,媒体资源的实体特征包括媒体资源的标识、标签、生产者、类型以及背景音乐等。对象的实体特征包括对象的标识、年龄、性别以及所处地域等基础信息,对象包括第一类对象和第二类对象。需要说明的是,对象的实体特征的获取必须经过对象同意,只有在对象同意的情况下,服务器才能够获取和使用对象的实体特征。比如,对象在使用媒体资源类应用程序时,该应用程序显示权限获取弹窗,该权限获取弹窗中显示想要获取和使用的实体特征的内容,只有当对象点击同意时,服务器才能够获取和使用对象的实体特征。
在一些实施例中,目标资源业务中多个实体的实体特征以及多个实体之间的关联数据被统称为目标资源业务的业务数据。
在一种可能的实施方式中,服务器获取该目标资源业务的初始业务数据,该初始业务数据包括多个候选媒体资源的资源特征、多个候选第一类对象、多个候选第二类对象以及候选媒体资源、候选第一类对象以及候选第二类对象之间的关联数据。服务器基于目标规则对该初始业务数据进行预处理,得到该目标资源业务的目标资源业务数据,该目标资源业务数据包括媒体资源的资源特征、该第一类对象的对象特征、该第二类对象的对象特征以及媒体资源、第一类对象以及第二类对象之间的关联数据。
其中,多个候选媒体资源为服务器对应维护的资源数据库中记录的媒体资源,多个候选第一类对象和多个候选第二类对象为服务器对应维护的对象数据库中存储的对象,目标规则为一种数据预处理的规则,由技术人员根据实际情况进行设置,本申请实施例对此不做限定。在一些实施例中,对初始业务数据进行预处理的过程也被称为对初始业务数据进行数据清洗或者数据过滤的过程。
在这种实施方式下,服务器能够基于目标规则对初始业务数据进行预处理,预处理过程能够将一些错误或者异常的数据剔除,既能够减少数据量也能够提高后续处理的准确性。
下面对上述实施方式中服务器基于目标规则对该初始业务数据进行预处理,得到该目标资源业务的目标资源业务数据的方法进行说明。
在一些实施例中,目标规则包括候选媒体资源是否符合第一目标条件、候选第一类对象和候选第二类对象是否符合第二目标条件以及该多个候选对象与该多个候选媒体资源之间的候选关联数据是否符合第三目标条件。服务器将该多个候选媒体资源中符合该第一目标条件的候选媒体资源以及对应的资源特征删除,得到该媒体资源以及该媒体资源的资源特征。服务器将该多个候选第一类对象以及多个候选第二类对象中符合第二目标条件的候选第一类对象、候选第二类对象以及对应的对象特征删除,得到该第一类对象、第二类对象以及对应的对象特征。服务器将该候选关联数据中符合第三目标条件的候选关联数据删除,得到该关联数据。
在一些实施例中,候选媒体资源符合第一目标条件是指下述至少一项:
被删除的候选媒体资源,被删除的媒体资源不再具有参考价值,因此需要过滤。审核不通过的媒体资源,审核不通过的媒体资源也不具有参考价值,因此需要过滤。候选媒体资源的播放次数小于或等于播放次数阈值,由于播放次数较少的候选媒体资源的参考价值不大,服务器能够将播放次数较少的候选媒体资源剔除,在一些实施例中,该播放次数较少的候选媒体资源也被称为低频播放媒体资源。候选媒体资源与对象之间的交互次数小于或等于交互次数阈值,由于交互次数较少的候选媒体资源的参考价值不大,服务器能够将交互次数较少的候选媒体资源剔除,在一些实施例中,该交互次数较少的候选媒体资源也被称为低频互动媒体资源。候选媒体资源的时长小于或等于资源时长阈值,由于时长较短的候选媒体资源的参考价值不大,服务器能够将时长较短的候选媒体资源剔除,在一些实施例中,该时长较短的候选媒体资源也被称为异常媒体资源。候选媒体资源的资源特征的数量小于或等于资源特征数量阈值,由于资源特征数量较少的候选媒体资源的参考价值不大,服务器能够将资源特征数量较少的候选媒体资源剔除。其中,播放次数阈值、交互次数阈值、资源时长阈值以及资源特征数据阈值由技术人员根据实际情况进行设置,本申请实施例对此不做限定。
在一些实施例中,候选第一类对象符合第二目标条件是指候选第一类对象处于被封禁状态。
在一些实施例中,候选第二类对象符合第二目标条件是指下述至少一项:
候选第二类对象处于被封禁状态。候选第二类对象的单日观看时长大于或等于观看时长阈值,由于单日观看时长过长的候选第二类对象可能为异常对象,参考价值不大,服务器能够将单日观看时长较长的候选第二类对象剔除。候选第二类对象的对象特征的数量小于或等于对象特征数量阈值,由于对象特征数量较少候选第二类对象的参考价值不大,服务器能够将对象特征数量较少的候选第二类对象剔除。其中,观看时长阈值以及对象特征数量阈值由技术人员根据实际情况进行设置,本申请实施例对此不做限定。
在一些实施例中,第三目标条件是指,候选关联数据对应的观看比例小于或等于观看比例阈值,其中,观看比例是指在执行候选关联数据对应的交互操作时,媒体资源的观看比例。在一些实施例中,该观看比例阈值与媒体资源的时长负相关。比如,对于时长较短的媒体资源,需要完整看完、甚至看一遍以上才认为是有效观看;对于时长较长的媒体资源,仅需要观看一定的比例即可保留;时长越长的媒体资源,观看比例的阈值设定越低。
在一些实施例中,服务器基于目标规则对该初始业务数据进行预处理,得到该目标资源业务的目标资源业务数据之后,还能够对目标资源业务数据中的特征进行预处理,该目标资源业务数据中的特征包括媒体资源的资源特征、第一类对象的对象特征以及第二类对象的对象特征。对特征进行预处理也即是对特征进行编码或者归一化,以使得特征更便于服务器进行处理。
在一种可能的实施方式中,该目标资源业务中的实体除了包括媒体资源、第一类对象和第二类对象之外,还包括媒体资源的生产者和资源标签。其中,媒体资源的生产者为媒体资源的作者或者发布者。资源标签用于指示媒体资源的类型、场景或者内容等信息,该资源标签可以用于指示媒体资源和类型之间的归类关系,也即是,该媒体资源属于该资源标签所指示的某一类型的媒体资源。该资源标签可以用于指示媒体资源和内容之间是从属关系,也即是,该媒体资源属于该资源标签所指示内容的从属内容,例如,该资源标签指示某一部电视剧,而该媒体资源为该电视剧的一集。
302、服务器基于该多个实体的实体特征以及该多个实体中不同类型实体之间的关联数据,生成该异质图,该异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示该目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系。
其中,在该多个实体包括媒体资源、第一类对象和第二类对象的情况下,该多个实体的实体特征包括媒体资源的资源特征、第一类对象的对象特征以及第二类对象的对象特征。该异质图包括三类节点,第一类节点为与媒体资源对应的资源节点,第二类节点为与第一类对象对应的第一类对象节点,第三类节点为与第二类对象对应的第二类对象节点,资源节点的数量与媒体资源的数量相同,第一类对象节点的数量与第一类对象的数量相同,第二类对象节点的数量与第二类对象的数量相同。相应地,资源节点的节点特征为对应媒体资源的资源特征,第一类对象节点的节点特征为对应第一类对象的对象特征,第二类对象节点的节点特征为对应第二类对象的对象特征。在一些实施例中,实体的实体特征也被称为实体的属性,节点的节点特征也被称为节点的属性。在一些实施例中,第一类对象节点也被称为第一类用户节点,第二类对象节点也被称为第二类用户节点。
在该异质图中,在一个资源节点与一个对象节点之间存在连线的情况下,表示该资源节点对应的媒体资源与该对象节点对应的对象之间存在交互关系或者从属关系,对象节点包括第一类对象节点和第二类对象节点。在一个资源节点与一个对象节点之间不存在连线的情况下,表示该资源节点对应的媒体资源与该对象节点对应的对象之间不存在交互关系或者从属关系。在一些实施例中,该异质图中资源节点之间也可能存在连线,在一个资源节点与另一个资源节点之间存在连线的情况下,表示这两个资源节点对应的两个媒体资源为同一类型的媒体资源,或者,表示这两个资源节点被同一个对象执行过目标交互行为。
在一种可能的实施方式中,服务器生成该多个实体分别对应的节点,该节点的节点特征为对应实体的实体特征,不同类型的实体对应于不同类型的节点。服务器基于该多个实体中不同类型实体之间的关联数据,在生成的多个节点之间增加连线,得到该异质图。
其中,实体的实体特征也被称为实体地表示,在一些实施例中,实体的实体特征以特征矩阵的形式进行存储。在该异质图中,实体与节点一一对应,也即是一个实体对应于一个节点。
举例来说,在该多个实体包括媒体资源、第一类对象和第二类对象的情况下,服务器生成该多个媒体资源分别对应的多个资源节点,各个资源节点的节点特征为对应媒体资源的资源特征矩阵,各个资源节点的节点标识为对应媒体资源的资源标识,比如为媒体资源的名称或者编号等,通过资源节点的节点标识能够确定资源节点与媒体资源之间的对应关系。服务器生成该多个第一类对象分别对应的多个第一类对象节点,各个第一类对象节点的节点特征为对应第一类对象的第一类对象特征矩阵,各个第一类对象节点的节点标识为对应第一类对象的第一类对象标识,比如为第一类对象的账号等,通过第一类对象节点的节点标识能够确定第一类对象节点与第一类对象之间的对应关系。服务器生成该多个第二类对象分别对应的多个第二类对象节点,各个第二类对象节点的节点特征为对应第二类对象的第二类对象特征矩阵,各个第二类对象节点的节点标识为对应第二类对象的第二类对象标识,比如为第二类对象的账号等,通过第二类对象节点的节点标识能够确定第二类对象节点与第二类对象之间的对应关系。服务器基于该多个实体中不同类型实体之间的关联数据,在资源节点与第一类对象节点之间以及资源节点与第二类对象节点之间增加连线,得到该异质图。
在一些实施例中,服务器还能够基于该关联数据,在不同资源节点之间增加连线,比如,在两个资源节点对应的媒体资源被同一个对象执行目标交互行为的情况下,服务器在这两个资源节点之间增加连线,通过连线来表示这两个资源节点的关系,比如,参见图4,资源节点401和资源节点402-405之间均存在连线,资源节点406和资源节点407-408之间均存在连线。当然,为了通过连线来增加清楚的体现节点之间的关系,资源节点与资源节点之间的连线和资源节点与对象节点之间的连线的类型可以是不同的,比如,资源节点与对象节点之间的连线的类型为第一类型,资源节点与资源节点之间的连线为第二类型,服务器通过特定标识来区分第一类型的连线和第二类型的连线,比如,采用类型标识1来表示第一类型的连线,采用类型标识2来表示第二类型的连线。在通过这种方式确定出的异质图中,相同类型的节点之间可能存在连线,不同类型的节点之间也可能存在连线。
下面对服务器基于该关联数据,在该多个节点之间增加连线的方法进行说明。
在一种可能的实施方式中,在该关联数据表示该多个实体中任一第一类对象在目标时间段内对任一媒体资源发生过目标交互行为的情况下,服务器在该第一类对象对应的第一类对象节点和该媒体资源对应的资源节点之间增加第一类连线,该第一类连线的权重与该目标交互行为的数量正相关。
其中,目标交互行为包括观看、点赞、分享、收藏以及评论等,目标交互行为的数量是指对媒体资源完成上述行为的数量,比如,在该第一类对象在目标时间段内仅观看过该媒体资源的情况下,那么可以将该第一类连线的权重设置为0.5。在该第一类对象在目标时间段内观看和点赞过该媒体资源的情况下,那么可以将该第一类连线的权重设置为0.6。第一类连线用于连接对象节点和资源节点,表示对象节点对应的对象与资源节点对应的媒体资源在目标时间段内发生过目标交互行为,该对象节点包括第一类对象节点和第二类对象节点。该目标时间段由技术人员根据实际情况进行设置,本申请实施例对此不做限定。
在这种实施方式下,服务器能够通过在第一类对象节点和资源节点之间增加第一类连线的方式来体现第一类对象节点和资源节点之间的关系,通过第一类连线的权重来体现目标交互行为的数量,基于第一类连线和第一类连线的权重能够在后续图卷积时得到较为精准的结果。
在一种可能的实施方式中,在该关联数据表示该多个实体中任一第二类对象在该目标时间段内对任一媒体资源发生过目标交互行为的情况下,服务器在该第二类对象对应的第二类对象节点和该媒体资源对应的资源节点之间增加该第一类连线。
在这种实施方式下,服务器能够通过在第二类对象节点和资源节点之间增加第一类连线的方式来体现第二类对象节点和资源节点之间的关系,通过第一类连线的权重来体现目标交互行为的数量,基于第一类连线和第一类连线的权重能够在后续图卷积时得到较为精准的结果。
在一种可能的实施方式中,在该关联数据表示该多个实体中任一媒体资源的生产者为该多个实体中的任一第一类对象的情况下,服务器在该第一类对象对应的第一类对象节点和该媒体资源对应的资源节点之间增加第二类连线。
其中,第二类连线用于对象节点和资源节点,表示对象节点对应的对象与资源节点对应的媒体资源存在生产与被生产的关系,能够增强对象节点与资源节点之间的联系,提高后续图卷积的准确性。
在一种可能的实施方式中,在该关联数据表示该多个实体中任一媒体资源的生产者为该多个实体中的任一第二类对象的情况下,服务器在该第二类对象对应的第二类对象节点和该媒体资源对应的资源节点之间增加该第二类连线。
其中,第二类连线用于对象节点和资源节点,表示对象节点对应的对象与资源节点对应的媒体资源存在生产与被生产的关系,能够增强对象节点与资源节点之间的联系,提高后续图卷积的准确性。
服务器通过重复执行上述基于该关联数据在节点之间添加连线的步骤,能够得到该异质图。
上述是以该目标资源业务中的实体包括媒体资源、第一类对象和第二类对象为例进行说明的,在下述说明过程中,该目标资源业务中的实体还包括其他类型的实体为例进行说明。
在一些实施例中,该目标资源业务中的实体除了包括媒体资源、第一类对象和第二类对象之外,还包括该媒体资源的生产者和资源标签中的至少一项,这里所说的生产者不属于上述第一类对象和第二类对象,是一个只生产内容,不消费内容的对象。在该目标资源业务中的实体还包括该媒体资源的生产者和资源标签情况下,该异质图包括五类节点,第一类节点为与媒体资源对应的资源节点,第二类节点为与第一类对象对应的第一类对象节点,第三类节点为与第二类对象对应的第二类对象节点,第四类节点为媒体资源的生产者对应的生产者节点,第五类节点为媒体资源的资源标签对应的标签节点,其中,资源节点的数量与媒体资源的数量相同,第一类对象节点的数量与第一类对象的数量相同,第二类对象节点的数量与第二类对象的数量相同,生产者节点的数量与媒体资源的生产者的数量相同,标签节点的数量与媒体资源的资源标签的数量相同。相应地,资源节点的节点特征为对应媒体资源的资源特征,第一类对象节点的节点特征为对应第一类对象的对象特征,第二类对象节点的节点特征为对应第二类对象的对象特征,生产者节点的节点特征为对应生产者的生产者特征,标签节点的节点特征为对应资源标签的内容。在一些实施例中,生产者特征与对象特征类似,包括对应生产者的性别、所在地区、在线时间以及关注列表等特征中的至少一项,当然,服务器获取和使用生产者特征时,也必须经过生产者的同意。
在该异质图中,在一个资源节点与一个对象节点之间存在连线的情况下,表示该资源节点对应的媒体资源与该对象节点对应的对象之间存在交互关系,也即是对象节点对应的对象对资源节点对应的媒体资源发生过目标交互行为或者该媒体资源的生产者是该对象,该对象节点包括第一类对象节点和第二类对象节点。在一个资源节点与一个对象节点之间不存在连线的情况下,表示该资源节点对应的媒体资源与该对象节点对应的对象之间不存在交互关系,也即是对象节点对应的对象对资源节点对应的媒体资源未发生过目标交互行为以及该媒体资源的生产者不是该对象。在一个资源节点与一个生产者节点之间存在连线的情况下,表示该资源节点对应的媒体资源与该生产者节点对应的生产者之间存在生产关系,也即是该媒体资源是该生产者创作或者发布的。在一个资源节点与一个生产者节点之间不存在连线的情况下,表示该资源节点对应的媒体资源与该生产者节点对应的生产者之间不存在生产关系。在一个资源节点与一个标签节点之间存在连线的情况下,表示该资源节点对应的媒体资源与该标签节点对应的资源标签之间存在从属关系,也即是该资源标签是该媒体资源的一个资源标签。在一个资源节点与一个标签节点之间不存在连线的情况下,表示该资源节点对应的媒体资源与该标签节点对应的资源标签之间不存在从属关系。在一个对象节点与一个生产者节点之间存在连线的情况下,表示该对象节点对应的对象与该生产者节点对应的生产者之间存在关注关系,也即是该对象关注了该生产者。在一个对象节点与一个生产者节点之间不存在连线的情况下,表示该对象节点对应的对象与该生产者节点对应的生产者之间不存在关注关系。比如,图5提供了一个异质图的示意图,在图5中,包括第一类对象节点501、第二类对象节点502、资源节点503、生产者节点505以及标签节点506。
在一种可能的实施方式中,服务器生成该多个媒体资源对应的多个资源节点,各个资源节点的节点特征为对应媒体资源的资源特征矩阵,各个资源节点的节点标识为对应媒体资源的资源标识。服务器生成该多个第一类对象分别对应的多个第一类对象节点,各个第一类对象节点的节点特征为对应第一类对象的第一类对象特征矩阵,各个第一类对象节点的节点标识为对应第一类对象的第一类对象标识。服务器生成多个媒体资源的生产者对应的多个生产者节点,各个生产者节点的节点特征为对应生产者的生产者特征,各个生产者节点的节点标识为对应生产者的生产者标识,比如为生产者的账号等,通过生产者节点的节点标识能够确定生产者节点与生产者之间的对应关系。服务器生成该多个媒体资源的资源标签对应的多个标签节点,各个标签节点的节点特征为对应媒体标签的内容,各个标签节点的节点标识也可以为对应媒体标签的内容。服务器基于该多个实体之间的关联数据,在资源节点与第一类对象节点之间、资源节点与生产者节点之间、资源节点与标签节点之间以及第一类对象节点与生产者节点之间增加连线,得到该异质图。在通过这种方式确定出的异质图中,不同类型的节点之间存在连线,相同类型的节点之间不存在连线。
比如,在该关联数据指示任一生产者与任一媒体资源之间存在从属关系的情况下,在该生产者对应的生产者节点与该媒体资源对应的资源节点之间增加第三类连线;在该多个实体之间的关联数据指示任一资源标签与任一媒体资源之间存在从属关系的情况下,在该资源标签对应的标签节点与该媒体资源对应的资源节点之间增加第四类连线。通过重复执行上述基于该多个实体之间的关联数据在节点之间添加连线的步骤,能够得到该异质图。
其中,第三类连线用于连接生产者节点和资源节点,表示生产者节点对应的生产者为该资源节点对应的媒体资源的生产者。第四类连线用于连接标签节点和资源节点,表示标签节点的标签为该资源节点对应的媒体资源的标签。结合之前描述的第一类连线和第二类连线,该异质图中通过多种类型的连线能够更加准确地反映节点之间的关系。
需要说明的是,上述是以该目标资源业务中的实体包括媒体资源、第一类对象、第二类对象、媒体资源的生产者和资源标签五类实体为例进行说明的。在该目标资源业务中的实体包括媒体资源、第一类对象、第二类对象以及媒体资源的生产者四类实体,或者该目标资源业务中的实体包括媒体资源、第一类对象、第二类对象以及媒体资源的资源标签四类实体的情况下,服务器生成该异质图的方式与上述描述的方式属于同一发明构思,对应减少创建节点的类型以及连线即可,在此不再赘述。
另外,在该目标资源业务中的实体除了包括媒体资源、第一类对象、第二类对象、媒体资源的生产者和资源标签五类实体之外还包括其他类型的实体的情况下,服务器对应生成节点和增加连线即可,在此不再赘述。
下面将结合图6对上述步骤301和302进行说明。
参见图6,服务器对初始业务数据进行数据清理,得到目标业务数据。服务器对目标业务数据中的特征进行预处理。服务器基于特征预处理后的目标业务数据,构建该异质图。
需要说明的是,上述步骤301和302是可选地步骤,服务器也能直接获取已经生成的异质图,并基于该异质图执行下述步骤303,本申请实施例对此不做限定。
303、服务器通过图神经网络,按照该异质图中多个节点的多类元路径,对该异质图进行图卷积,得到该多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,该第一类对象节点对应于该第一类对象,该第二类对象节点对应于该第二类对象,该多类元路径中的任一类元路径用于表示该异质图中不同类型节点之间的一种连接方式。
其中,该图神经网络为Graph Sage(Graph Sample and Aggregate,图样本聚合)或者GAT(Graph Attention Network,图注意力网络),当然随着科学技术的发展也可以为其他类型的图神经网络,本申请实施例对此不做限定。元路径连接多个节点,元路径连接的节点之间存在连线,也即是元路径连接的节点之间存在关联关系。按照该异质图中多个节点的多类元路径,对该异质图进行图卷积是指,基于该异质图中每个节点对应的元路径进行图卷积,以得到每个节点的初始表示信息,当然,一个节点可能对应于多条元路径。节点的初始表示信息与节点的节点特征是不同的,节点特征是在生成异质图时赋予给节点的,而初始表示信息是通过图神经网络进行处理之后得到的表示信息,该初始表示信息融合了该第一类对象节点的节点特征以及该第一类对象节点的邻居节点的节点特征。由于节点的初始表示信息是按照节点的元路径进行图卷积得到的,那么该初始表示信息实际上是一个聚合的表示信息,包括元路径所经过节点的节点特征。
在一种可能的实施方式中,对于该多个节点中的任一第一类对象节点,服务器基于图神经网络,按照该第一类对象节点的多条元路径对该第一类对象节点进行图卷积,得到该第一类对象节点的初始表示信息,该第一类对象节点的多条元路径的终点均为该第一类对象节点。
其中,该第一类对象节点的多条元路径表示的不是第一类对象节点的全部元路径,而是第一类对象节点的一组元路径,一组元路径包括多条元路径,多组元路径组成该第一类对象节点的全部元路径。该第一类对象节点的元路径的分组由技术人员根据实际情况进行设置,或者由服务器随机分组,本申请实施例对此不做限定。
元路径的类型由元路径的终点决定,也即是元路径的终点节点能够将元路径分为不同的类型,比如,一条元路径的终点节点为第一类对象节点,那么该条元路径的类型为第一类对象节点的元路径。另一条元路径的终点节点为第二类对象节点,那么该条元路径的类型为第二类对象节点的元路径。或者说,元路径的类型由元路径经过节点的顺序决定,节点的顺序是指节点类型的顺序,比如,一条元路径依次经过第一类对象节点A、资源节点B以及第一类对象节点C,另一条元路径依次经过第一类对象节点D、资源节点E以及第一类对象节点C,那么这两条元路径属于同一类型的元路径,也即是依次经过第二类对象节点、资源节点以及第二类对象节点的元路径,这两条元路径均是第一类对象节点C的元路径。若将资源节点简写为V,第一类对象节点简写为U1,那么第一类对象的元路径也即是U1→V→U1。该第一类对象节点的多条元路径的终点均为该第一类对象节点,除了该第一类对象节点之外,多条元路径上经过的节点各不相同。
当然,上述是该第一类对象节点的元路径经过三个节点为例进行说明的,在其他可能的实施方式中,该第一类对象节点的元路径还可以经过更多节点,比如经过5个节点U1→V→U1→V→U1或者经过7个节点U1→V→U1→V→U1→V→U1等,本申请实施例对此不做限定。
举例来说,服务器基于该图神经网络,将该第一类对象节点的多条元路径所经过节点的节点特征与该第一类对象节点的节点特征进行融合,得到该第一类对象节点的初始表示信息。
比如,对于该第一类对象节点的一条元路径,该条元路径经过三个节点,分别是另一第一类对象节点、资源节点以及该第一类对象节点。在基于图神经网络,通过该条元路径进行图卷积时,将该另一第一类对象节点的节点特征与该资源节点的节点特征进行融合,得到该资源节点的第一融合特征。将该资源节点的第一融合特征与该第一类对象节点的节点特征进行融合,得到该第一类对象节点在该条元路径下的表示信息。在一些实施例中,在基于图神经网络,通过该条元路径进行图卷积时,还能够参考该条元路径上节点之间连线的类型和权重,也即是基于元路径上两个节点之间连线的类型和权重来对两个节点的节点特征进行融合,其中,连线的类型对应于基准权重,连线上的权重为在该基准权重的基础上额外施加的权重。在进行加权求和时,是从该元路径的起点向终点方向加权求和。比如,一个第一类对象节点与一个资源节点之间存在第一类连线,该第一类连线的权重为0.5,该第一类对象节点靠近该元路径的起点,该资源节点靠近该元路径的终点。服务器确定该第一类连线对应的基准权重为0.9,在融合该第一类对象节点的节点特征和该资源节点的节点特征时,将该第一类对象节点的节点特征与基准权重0.9相乘后再于该第一类连线的权重为0.5相乘,将两次相乘的结果与该资源节点的节点特征相加即可。服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息,其中,服务器确定该第一类对象节点在该多条元路径下的表示信息的方法,与上述描述属于同一发明构思,在此不再赘述。
在一些实施例中,该第一类对象节点的一条元路径经过的节点,也被称为该第一类对象节点的参考节点,参考节点为该第一类对象节点的邻居节点,邻居节点包括一阶邻居节点、二阶邻居节点……N阶邻居节点,其中,N为正整数。在参考节点为该第一类对象节点的一阶邻居节点的情况下,那么也就表示该参考节点与该第一类对象节点之间是直接相连的,也即是该参考节点与该第一类对象节点之间存在连线。在参考节点为该第一类对象节点的二阶邻居节点的情况下,那么也就表示该参考节点与该第一类对象节点之间是通过另一个节点间接相连的,也即是该参考节点与该第一类对象节点之间存在另一个节点,该参考节点和该第一类对象节点与该另一个节点之间均存在连线。在元路径连接三个节点的情况下,也就是连接了元路径起点节点的一阶邻居节点和二阶邻居节点。
在一些实施例中,服务器通过图神经网络,按照该异质图中节点的多条元路径进行图卷积时,每条元路径对应的图卷积层的参数不共享。图卷积算子包括如Graphsage(Graph Sample and Aggregate,图样本和聚合)、GAT(Graph Attention Networks,图注意力网络)以及GCN(Graph Convolutional Network,图卷积网络)等。在实验过程中,对上述网络中的图卷积层进行了改进,将原来的mean aggregator(平均聚合),改为mean poolingaggregator(平均池化聚合),提高网络对邻居节点的特征抽取能力。
为了对上述实施方式进行更加清楚的说明,下面将基于上述参考节点的表述,从另一个角度对上述实施方式进行说明。
在一种可能的实施方式中,该第一类对象节点的一条元路径依次经过第二参考节点、第一参考节点以及该一类对象节点,其中,该第一类对象节点为该条元路径的终端,该第一参考节点为该条元路径的中点,该第二参考节点为该条元路径的起点,该第一参考节点为该第一类对象节点的一阶邻居节点,该第二类参考节点为该第一类对象节点的二阶邻居节点。服务器基于该图神经网络,将该第二参考节点的节点特征与该第一参考节点的节点特征进行融合,得到第一融合特征。服务器基于该图神经网络,将第一融合特征与该第一类对象节点的节点特征进行融合,得到该第一类对象节点在该元路径下的表示信息。服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息。
下面对服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息的方法进行说明。
其中,该第一类对象节点的初始表示信息为该第一类对象节点的初始嵌入(Embedding)向量。
在一种可能的实施方式中,服务器将该第一类对象节点在多条元路径下的表示信息进行加权求和,得到该第一类对象节点的初始表示信息。
其中,加权求和的权重由技术人员根据实际情况进行设置,本申请实施例对此不做限定。
在一种可能的实施方式中,服务器基于注意力机制对该第一类对象节点在多条元路径下的表示信息进行编码,得到该第一类对象节点的初始表示信息。
举例来说,服务器获取该多个表示信息之间的多个注意力权重。服务器基于该多个注意力权重将多个表示信息进行融合,得到该第一类对象节点的初始表示信息。
比如,以该表示信息为两个表示信息为例,服务器采用三个线性变换矩阵,对第一个表示信息进行线性变换,得到该第一个表示信息的第一查询矩阵、第一键矩阵以及第一值矩阵,其中,该三个线性变换矩阵为模型训练过程中得到的矩阵。服务器采用该三个线性变换矩阵,对第二个表示信息进行线性变换,得到该第二个表示信息的第二查询矩阵、第二键矩阵以及第二值矩阵。服务器基于该第一个表示信息的查询矩阵以及该第二个表示信息的键矩阵,获取该第一个表示信息对该第二个表示信息的第一注意力权重。服务器基于该第二个表示信息的查询矩阵以及该第一个表示信息的键矩阵,获取该第二个表示信息对该第一个表示信息的第二注意力权重。服务器采用第一注意力权重和该第二注意力权重,将该第一值矩阵和第二值矩阵进行加权求和,得到该第一类对象节点的初始表示信息。其中,服务器基于查询矩阵以及键矩阵获取注意力权重时,能够采用将查询矩阵与键矩阵相乘的方式来实现。
需要说明的是,上述是以表示信息为两个表示信息为例进行说明的,在该表示信息数量更多的情况下,实现过程与上述说明属于同一发明构思,在此不再赘述。
在一些实施例中,在服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息的过程中,服务器能够将该多个表示信息分别与掩码矩阵相乘,得到多个第一候选表示信息。服务器将该多个第一候选表示信息进行融合,得到该第一类对象节点的初始表示信息。
其中,掩码矩阵为包含0和1的矩阵,该掩码矩阵中0和1的位置由服务器随机生成,表示信息与掩码矩阵相乘之后,能够随机隐去表示信息中的部分信息,这样能够提高模型的鲁棒性。
在一些实施例中,由于表示信息的形式可能有所差别,因此,可以通过归一化处理,来使得各个节点的表示信息具有一致性,相应地,服务器对多个表示信息进行归一化,得到多个第二候选表示信息。服务器将该多个第二候选表示信息进行融合,得到该第一类对象节点的初始表示信息。
其中,归一化方法可以采用SoftMax(软最大化)、Relu(线性整流)或者Sigmoid(S型生长曲线)中的任一项,本申请实施例对此不做限定。
下面将结合图7对服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息的过程进行说明。
图7包括该第一类对象节点701、三个资源节点702-704以及另外三个第一类对象节点705-707。在图7中,第一类对象节点705-资源节点702以及第一类对象节点701构成了一条元路径,基于该条元路径进行图卷积时,沿着第一类对象节点705-资源节点702以及第一类对象节点701的方向进行聚合,得到该第一类对象节点在该条元路径下的表示信息。第一类对象节点706-资源节点703以及第一类对象节点701构成了另一条元路径,基于该条元路径进行图卷积时,沿着第一类对象节点706-资源节点703以及第一类对象节点701的方向进行聚合,得到该第一类对象节点在该条元路径下的表示信息。第一类对象节点707-资源节点704以及第一类对象节点701构成了另一条元路径,基于该条元路径进行图卷积时,沿着第一类对象节点707-资源节点704以及第一类对象节点701的方向进行聚合,得到该第一类对象节点在该条元路径下的表示信息。
在介绍完服务器获取第一类对象节点的初始表示信息之后,下面对服务器获取第二类对象节点的初始表示信息的方法进行说明。
在一种可能的实施方式中,对于该多个节点中的任一第二类对象节点,服务器图基于神经网络,按照该第二类对象节点的多条元路径对该第二类对象节点进行图卷积,得到该第二类对象节点的初始表示信息,该第二类对象节点的多条元路径的终点均为该第二类对象节点。
其中,该第二类对象节点的多条元路径表示的不是第二类对象节点的全部元路径,而是第二类对象节点的一组元路径,一组元路径包括多条元路径,多组元路径组成该第二类对象节点的全部元路径。该第二类对象节点的元路径的分组由技术人员根据实际情况进行设置,或者由服务器随机分组,本申请实施例对此不做限定。
元路径的类型由元路径的终点决定,也即是元路径的终点节点能够将元路径分为不同的类型,比如,一条元路径的终点节点为第二类对象节点,那么该条元路径的类型为第二类对象节点的元路径。另一条元路径的终点节点为第二类对象节点,那么该条元路径的类型为第二类对象节点的元路径。或者说,元路径的类型由元路径经过节点的顺序决定,节点的顺序是指节点类型的顺序。若将资源节点简写为V,第二类对象节点简写为U2,那么第一类对象的元路径也即是U2→V→U2。该第二类对象节点的多条元路径的终点均为该第二类对象节点,除了该第二类对象节点之外,多条元路径上经过的节点各不相同。
当然,上述是该第二类对象节点的元路径经过三个节点为例进行说明的,在其他可能的实施方式中,该第二类对象节点的元路径还可以经过更多节点,比如经过5个节点U2→V→U2→V→U2或者经过7个节点U2→V→U2→V→U2→V→U2等,本申请实施例对此不做限定。
举例来说,服务器基于该图神经网络,将该第二类对象节点的多条元路径所经过节点的节点特征与该第二类对象节点的节点特征进行融合,得到该第二类对象节点的初始表示信息。
比如,对于该第二类对象节点的一条元路径,该条元路径经过三个节点,分别是另一第二类对象节点、资源节点以及该第二类对象节点。在基于图神经网络,通过该条元路径进行图卷积时,将该另一第二类对象节点的节点特征与该资源节点的节点特征进行融合,得到该资源节点的第一融合特征。将该资源节点的第一融合特征与该第二类对象节点的节点特征进行融合,得到该第二类对象节点在该条元路径下的表示信息。在一些实施例中,在基于图神经网络,通过该条元路径进行图卷积时,还能够参考该条元路径上节点之间连线的类型和权重,也即是基于元路径上两个节点之间连线的类型和权重来对两个节点的节点特征进行融合,其中,连线的类型对应于基准权重,连线上的权重为在该基准权重的基础上额外施加的权重。在进行加权求和时,是从该元路径的起点向终点方向加权求和。比如,一个第二类对象节点与一个资源节点之间存在第一类连线,该第一类连线的权重为0.5,该第二类对象节点靠近该元路径的起点,该资源节点靠近该元路径的终点。服务器确定该第一类连线对应的基准权重为0.9,在融合该第二类对象节点的节点特征和该资源节点的节点特征时,将该第二类对象节点的节点特征与基准权重0.9相乘后再于该第一类连线的权重为0.5相乘,将两次相乘的结果与该资源节点的节点特征相加即可。服务器将该第二类对象节点在多条元路径下的表示信息进行融合,得到该第二类对象节点的初始表示信息,其中,服务器确定该第二类对象节点在该多条元路径下的表示信息的方法,与上述描述属于同一发明构思,在此不再赘述。
在一些实施例中,该第二类对象节点的一条元路径经过的节点,也被称为该第二类对象节点的参考节点,参考节点为该第二类对象节点的邻居节点,邻居节点包括一阶邻居节点、二阶邻居节点……N阶邻居节点,其中,N为正整数。在参考节点为该第二类对象节点的一阶邻居节点的情况下,那么也就表示该参考节点与该第二类对象节点之间是直接相连的,也即是该参考节点与该第二类对象节点之间存在连线。在参考节点为该第二类对象节点的二阶邻居节点的情况下,那么也就表示该参考节点与该第二类对象节点之间是通过另一个节点间接相连的,也即是该参考节点与该第二类对象节点之间存在另一个节点,该参考节点和该第二类对象节点与该另一个节点之间均存在连线。在元路径连接三个节点的情况下,也就是连接了元路径起点节点的一阶邻居节点和二阶邻居节点。
为了对上述实施方式进行更加清楚的说明,下面将基于上述参考节点的表述,从另一个角度对上述实施方式进行说明。
在一种可能的实施方式中,该第二类对象节点的一条元路径依次经过第二参考节点、第一参考节点以及该一类对象节点,其中,该第二类对象节点为该条元路径的终端,该第一参考节点为该条元路径的中点,该第二参考节点为该条元路径的起点,该第一参考节点为该第二类对象节点的一阶邻居节点,该第二类参考节点为该第二类对象节点的二阶邻居节点。服务器基于该图神经网络,将该第二参考节点的节点特征与该第一参考节点的节点特征进行融合,得到第一融合特征。服务器基于该图神经网络,将第一融合特征与该第二类对象节点的节点特征进行融合,得到该第二类对象节点在该元路径下的表示信息。服务器将该第二类对象节点在多条元路径下的表示信息进行融合,得到该第二类对象节点的初始表示信息。
其中,服务器将该第二类对象节点在多条元路径下的表示信息进行融合,得到该第二类对象节点的初始表示信息的方法,与服务器将该第一类对象节点在多条元路径下的表示信息进行融合,得到该第一类对象节点的初始表示信息的方法属于同一发明构思,实现过程不再赘述。
在一些实施例中,对于该异质图中的资源节点,服务器也能够通过上述实施方式来获取资源节点的初始表示信息,实现过程与上述获取对象节点的初始表示信息方法属于同一发明构思,实现过程不再赘述。
比如,参见图8,提供了在ICF和UCF场景下元路径的示意图,图8上方是ICF场景下的元路径,在ICF场景下元路径的形式为V-U-V(媒体资源-对象-媒体资源)。图8下方是UCF场景下的元路径,在UCF场景下元路径的形式为U-V-U(对象-媒体资源-对象)。
304、服务器基于该多个节点之间的连线,将该第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的目标表示信息,该目标表示信息用于向该第一类对象进行媒体资源的推荐。
在一种可能的实施方式中,对于该多个节点中的任一第一类对象节点,服务器基于该第一类对象节点与资源节点之间的连线,确定该第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,该相关第二类对象节点对应的第二类对象与该第一类对象对同一个媒体资源发生过目标交互行为,该不相关第二类对象节点对应的第二类对象发生过目标交互行为的媒体资源与该第一类对象发生过目标交互行为的媒体资源均不相同。服务器将该第一类对象节点的初始表示信息、该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的融合表示信息。服务器基于该至少一个相关第二类对象节点的初始表示信息,对该第一类对象节点的融合表示信息进行调整,得到该第一类对象节点的目标表示信息。
在这种实施方式下,能够确定第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,将该第一类对象节点的初始表示信息、至少一个相关第二类对象节点的初始表示信息、和至少一个不相关第二类对象节点的初始表示信息进行融合,得到第一类对象节点的融合表示信息。随后通过至少一个相关第二类对象节点的初始表示信息,对该第一类对象节点的融合表示信息进行调整,得到第一类对象节点的目标表示信息,该目标表示信息融合了相关第二类对象节点和不相关第二类节点的信息,且经过相关第二类对象节点进行了调整,目标表示信息更加丰富和准确。
为了对上述实施方式进行更加清楚的说明,下面将分为三个部分对上述实施方式进行说明。
第一部分、服务器基于该第一类对象节点与资源节点之间的连线,确定该第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点。
其中,该第一类对象节点的相关第二类对象节点和不相关第二类对象节点均为该异质图中的第二类对象节点。
在一种可能的实施方式中,服务器基于该第一类对象节点与资源节点之间的连线,确定该第一类对象节点的至少一个相关资源节点,该相关资源节点也即是与该第一类对象节点之间存在连线的资源节点。服务器基于该第一类对象节点的至少一个相关资源节点,确定该第一类对象节点的至少一个相关第二类对象节点,该相关第二类对象节点与该相关资源节点之间存在连线。服务器基于该第一类对象节点与资源节点之间的连线,确定该第一类对象节点的至少一个不相关资源节点,该不相关资源节点也即是与该第一类对象节点之间不存在连线的资源节点。服务器基于该第一类对象节点的至少一个不相关资源节点,确定该第一类对象节点的至少一个相关第二类对象节点,该不相关第二类对象节点与该不相关资源节点之间存在连线。
在这种实施方式下,服务器能够通过第一类对象节点与资源节点之间的连线来获取该第一类对象节点的相关第二类对象节点以及不相关第二类资源节点,效率较高。
在一种可能的实施方式中,服务器基于该第一类对象节点与资源节点之间的连线,以及多个第二类对象节点与资源节点之间的连线,从该多个第二类对象节点中确定出该第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,该至少一个相关第二类对象节点连接的资源节点与该第一类对象节点相连,该至少一个不相关第二类对象节点连接的资源节点与该第一类对象节点不相连。
在这种实施方式下,服务器能够根据第一类对象节点与资源节点之间的连线,以及第二类对象节点与资源节点之间的连线,来从多个第二类对象节点中筛选出该第一类对象节点的相关第二类节点和不相关第二类节点,效率较高。
举例来说,服务器基于该第一类对象节点与资源节点之间的连线,确定多个参考节点对,每个参考节点对包括该第一类对象节点与一个相连的资源节点。服务器基于多个第二类对象节点与资源节点之间的连线,确定多个候选节点对,每个候选节点对包括一个第二类对象节点与一个相连的资源节点。服务器从该多个候选节点对中,确定出参考节点对具有相同资源节点的目标候选节点对。服务器将目标候选节点对中的第二类对象节点确定为该第一类对象节点的相关第二类对象节点,将其他候选节点对中的第二类对象节点确定为该第一类对象节点的不相关第二类对象节点。
在一些实施例中,参考节点对中的节点为该第一类对象节点的元路径经过的节点。
第二部分、服务器将该第一类对象节点的初始表示信息、该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的融合表示信息。
在一些实施例中,该相关第二类对象节点对应的第二类对象,也被称为该第一类对象节点的对应的第一类对象的相同行为对象,也即是与该第二类对象是与该第一类对象对同一个媒体资源进行过目标交互行为。该不相关第二类对象节点对应的第二类对象,也被称为该第一类对象节点的对应的第一类对象的不同行为对象,也即是与该第二类对象是与该第一类对象没有对同一个媒体资源进行过目标交互行为。
在一种可能的实施方式中,服务器在该第一类对象节点的初始表示信息中增加掩码,得到该第一类对象节点的参考表示信息。服务器将该第一类对象节点的参考表示信息、该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行加权求和,得到该第一类对象节点的融合表示信息。
在这种实施方式下,将该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行融合时,能够得到一个可以含有第二类对象节点的信息,且更偏向于第一类对象节点的表示信息。该第一类对象节点的表示信息包括第一类对象的信息,相关第二类对象节点包括第一类对象和第二类对象之间交集的信息,不相关第二类对象节点包括第一类对象和第二类对象之间差集的信息。在这种情况下,在该第一类对象节点的参考表示信息中增加掩码,能够弱化得到的融合表示信息中该第一类对象节点的参考表示信息,使得至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息能够在融合表示信息中的重要程度更高,这样提高后续视频推荐的准确性。
第三部分、服务器基于该至少一个相关第二类对象节点的初始表示信息,对该第一类对象节点的融合表示信息进行调整,得到该第一类对象节点的目标表示信息。
在一种可能的实施方式中,服务器将该至少一个相关第二类对象节点的初始表示信息输入目标分类器,由该目标分类器输出该相关第二类对象节点对应的第二类对象的对象类型。服务器将该第一类对象节点的融合表示信息输入该输入目标分类器,由该目标分类器输出该第一类对象节点对应的第一类对象的对象类型。服务器基于该第二类对象的对象类型与该第一类对象的对象类型之间的差异信息,对该第一类对象节点的融合表示信息进行调整,得到该第一类对象节点的目标表示信息。
其中,该目标分类器包括全连接层和归一化层,服务器将表示信息处于该目标分类器之后,通过该目标分类器的全连接层对表示信息进行全连接,通过归一化层进行归一化,最终输出对象类型,表示信息包括上述相关第二类对象节点的初始表示信息以及该第一类对象节点的融合表示信息。
在这种实施方式下,由于第一类对象节点的融合表示信息往往较为稀疏,通过使用目标分类器来使得第一类对象节点的融合表示信息学习到相关第二类对象节点的初始表示信息中的映射,得到的第一类对象节点的目标表示信息能够更加完整地反映第一类对象的特性,这种方式也即是一种迁移学习的方法,将第二类对象的信息迁移到第一类对象上。
305、服务器存储该异质图中多个节点各自的表示信息。
其中,多个节点包括资源节点、第一类对象节点以及第二类对象节点。多个节点各自的表示信息包括资源节点的初始表示信息、第一类对象节点的目标表示信息以及第二类对象节点的初始表示信息,其中,资源节点的初始表示信息以及第二类对象节点的初始表示信息的获取方式参见上述步骤303的相关描述,第一类对象节点的目标表示信息的获取方式参见上述步骤304的相关描述。
在一种可能的实施方式中,服务器将该多个节点中资源节点的初始表示信息存储在资源数据库中,将该多个节点中第一类对象节点的目标表示信息以及第二类对象节点的初始表示信息存储在对象数据库中,在该对象为用户的情况下,该对象数据库也被称为用户数据库。其中。服务器在资源数据库中存储资源节点的初始表示信息时,会将该资源节点的初始表示信息与该资源节点对应的媒体资源绑定存储,比如,将该资源节点的初始表示信息与该资源节点对应的媒体资源的名称或者链接绑定存储。服务器在对象数据库中存储第一类对象节点的目标表示信息时,会将该第一类对象节点的目标表示信息与该第一类对象节点对应的第一类对象绑定存储,比如,将该对象节点的目标表示信息与该对象节点对应对象的对象标识绑定存储,该对象标识可以为对象账号。服务器在对象数据库中存储第二类对象节点的目标表示信息时,会将该第二类对象节点的目标表示信息与该第二类对象节点对应的第二类对象绑定存储,比如,将该对象节点的目标表示信息与该对象节点对应对象的对象标识绑定存储,该对象标识可以为对象账号。
在一些实施例中,该资源数据库和该对象数据库的类型均为远程字典服务(Remote Dictionary Server,Redis)。
306、服务器基于该第一类对象节点的目标表示信息向第一类对象进行媒体资源的推荐。
在一种可能的实施方式中,服务器基于该第一类对象节点的目标表示信息,确定与该第一类对象之间相似度符合第一相似度条件的至少一个候选对象。服务器向该第一类对象推荐该至少一个候选对象发生过目标交互行为的媒体资源。
其中,候选对象与第一类对象之间的相似度符合第一相似度条件是指,候选对象地表示信息与该第一类对象对应的目标表示信息之间的相似度大于或等于第一相似度阈值,该第一相似度阈值由技术人员根据实际情况进行设置,本申请实施例对此不做限定。这种方式也即是UCF的召回方式。
在这种实施方式下,服务器能够基于该第一类对象节点的目标表示信息来确定候选对象,并将候选对象发生过目标交互行为的媒体资源推荐给第一类对象,由于候选对象为与第一类对象相似度较高的对象,候选对象发生过目标交互行为的媒体资源也可能是第一类对象喜欢的媒体资源,采用这样的方式来进行媒体资源推荐的准确性较高。
举例来说,响应于资源推荐请求,服务器基于该资源推荐请求携带的第一类对象的标识在该对象数据库中进行查询,得到该第一类对象的目标表示信息。服务器基于该第一类对象的目标表示信息在该对象数据库中进行匹配,得到表示信息与该目标表示信息之间的相似度大于或等于第一相似度阈值的至少一个候选对象。服务器向该第一类对象推荐该至少一个候选对象发生过目标交互行为的媒体资源,也即是将该至少一个候选对象观看、点赞、分享、评论以及收藏的媒体资源推荐给该第一类对象。
在一些实施例中,该相似度为余弦相似度,或者为内积,或者为汉明距离等,本申请实施例对此不做限定。服务器在确定该相似度的时,可以采用最近邻居(ApproximateNearest Neighbors Oh Yeah,Annoy)和脸书相近搜索(Facebook AI Similarity Search,Faiss)两个向量搜索引擎来进行。
在一些实施例中,还提供了另一种向第一类对象进行媒体资源推荐的方法。服务器获取资源推荐请求,该媒体资源推荐请求携带该第一类对象正在观看的媒体资源的标识。服务器基于该媒体资源的标识,在资源数据库中进行查询,得到该媒体资源的初始表示信息。服务器在该资源数据库中,基于该媒体资源的初始表示信息进行匹配,得到至少一个候选媒体资源,该至少一个候选媒体资源为与该媒体资源相似度符合第二相似度条件的媒体资源。服务器向该第一类对象推荐该至少一个候选媒体资源。
其中,候选媒体资源与该媒体资源之间的相似度符合第二相似度条件是指,候选媒体资源的初始表示信息与该媒体资源对应的初始表示信息之间的相似度大于或等于第二相似度阈值,该第二相似度阈值由技术人员根据实际情况进行设置,本申请实施例对此不做限定。这种方式也即是ICF的召回方式。
下面将结合图9以及上述步骤301-305对本申请实施例提供的技术方案进行说明。
参见图9,方法包括信息获取,也即是上述步骤301。数据处理,也即是上述步骤302。图表示学习,也即是上述步骤303和304。在线召回,也即是上述步骤305和306。
在介绍完上述步骤301-306之后,下面对本申请实施例中训练该图神经网络的方法进行说明。
在一种可能的实施方式中,服务器基于该多个节点之间的连线,获取多个正样本节点对和多个负样本节点对,该正样本节点对为该异质图中间接相连的两个相同类型的节点,该负样本节点对为该异质图中不相连的两个相同类型的节点。服务器基于每个该正样本节点对的初始表示信息之间的第一差异信息,以及每个该负样本节点对的初始表示信息之间的第二差异信息,对该图神经网络进行训练。
其中,间接相连是指,两个相同类型的节点均直接相连与一个不同类型的节点,直接相连是指节点之间存在连线。比如,两个第一类对象节点均与一个资源节点直接相连,那么这两个第一类对象节点也就是间接相连的,这两个第一类对象节点可以构成一个正样本对。基于第一差异信息和第二差异信息对该图神经网络进行训练的目的是使得第一差异信息尽可能小,使得第二差异信息尽可能大,这种训练方式也被称为表征学习。
在一些实施例中,服务器能够直接基于获取到的正样本对生成负样本对,也即是,服务器将获取到的正样本对中的资源节点替换为该异质图中的任一资源节点,或者将获取到的正样本对中的对象节点替换为该异质图中的任一对象节点。参见图10,存在三个资源节点,资源节点O和资源节点P构成一个正样本对,资源节点O和资源节点P与资源节点Q均不构成正样本对,那么直接将正样本对资源节点O和资源节点P中的资源节点O或者资源节点P变为资源节点Q,即可得到一个负样本对。
除了通过上述表征学习的方式来对图神经网络进行训练之外,本申请实施例还提供了另一种对图神经网络进行训练方式:
在一种可能的实施方式中,对于该多个节点中的任一节点,服务器基于该节点的多个候选表示信息中任两个候选表示信息之间的第三差异信息,对该图神经网络进行训练,该节点的候选表示信息是按照该节点的一组元路径进行图卷积得到的表示信息。
其中,该节点为资源节点、第一类对象节点或者第二类对象节点,下面以该节点为第一类对象节点为例进行说明。由于该节点的多个候选表示信息是图神经网络基于该节点的多组元路径进行图卷积得到的,那么该节点的多个候选表示信息也就均是用于表示该节点对应的实体的,一组元路径包括该节点的多条元路径。那么基于第三差异信息对该图神经网络进行训练的目的是使得第三差异信息尽可能小,也即是通过多组元路径进行图卷积得到的多个候选表示信息尽可能相似。在一些实施例中,这种训练方式也被称为对比学习。
在这种实施方式系,通过对比学习和迁移学习的思想,能够提高目标表示信息的准确性,从而提高基于目标表示信息进行媒体资源推荐的准确性。
需要说明的是,服务器能够通过上述任一种方式对该图神经网络进行训练,或者同时采用上述两种方式对该图神经网络进行训练,本申请实施例对此不做限定。在同时采用上述两种方式对该图神经网络进行训练时,会将上述两种方式的损失函数进行组合,得到一个组合损失函数,基于该组合损失函数,采用梯度下降法对该图神经网络进行训练。
在一些实施例中,对该图神经网络进行训练之后,还能够通过离线评估的方式来检查该图神经网络的性能。对于媒体资源的初始表示信息,服务器随机获取两个初始表示信息之间相似度大于或等于第二相似度阈值的媒体资源,由技术人员判断两个媒体资源之间的相关性。对于第一类对象或者第二类对象,以第一类对象为例,服务器随机获取两个目标表示信息之间相似度大于或等于第一相似度阈值的第一类对象,由技术人员判断两个的第一类对象之间的相关性。
通过本申请实施例提供的技术方案,获取了目标资源业务的异质图,该异质图包括目标资源业务中多类实体对应的节点。通过图神经网络采用多类元路径对该异质图进行处理,得到第一类对象节点的初始表示信息和第二类对象节点的初始表示信息,由于元路径连接了不同类型的节点,那么对象节点的初始表示信息中也就携带了媒体资源的相关信息。基于连线将第一类对象节点和第二类对象节点的初始表示信息进行了融合,得到的目标表示信息能够更加充分地表示该第一类对象。基于目标表示信息向该第一类对象进行媒体资源的推荐时,推荐的媒体资源的准确性较高。
图11是本申请实施例提供的一种表示信息的确定装置的结构示意图,参见图11,该装置包括:异质图获取模块1101、图卷积模块1102以及融合模块1103。
异质图获取模块1101,用于获取目标资源业务的异质图,该异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示该目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,该目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,该第一类对象为与该媒体资源之间发生目标交互行为的次数小于目标次数的对象,该第二类对象为与该媒体资源之间发生目标交互行为的次数大于或等于该目标次数的对象。
图卷积模块1102,用于通过图神经网络,按照该异质图中多个节点的多类元路径,对该异质图进行图卷积,得到该多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,该第一类对象节点对应于该第一类对象,该第二类对象节点对应于该第二类对象,该多类元路径中的任一类元路径用于表示该异质图中不同类型节点之间的一种连接方式。
融合模块1103,用于基于该多个节点之间的连线,将该第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的目标表示信息,该目标表示信息用于向该第一类对象进行媒体资源的推荐。
在一种可能的实施方式中,该异质图获取模块1101,用于获取该目标资源业务中的多个实体的实体特征以及该多个实体之间的关联数据,该关联数据用于表示该多个实体中不同类型实体之间的关联关系。基于该多个实体的实体特征以及该多个实体中不同类型实体之间的关联数据,生成该异质图。
在一种可能的实施方式中,该异质图获取模块1101,用于生成该多个实体分别对应的节点,该节点的节点特征为对应实体的实体特征,不同类型的实体对应于不同类型的节点。基于该多个实体中不同类型实体之间的关联数据,在生成的多个节点之间增加连线,得到该异质图。
在一种可能的实施方式中,该异质图获取模块1101,用于执行下述至少一项:
在该关联数据表示该多个实体中任一第一类对象在目标时间段内对任一媒体资源发生过目标交互行为的情况下,在该第一类对象对应的第一类对象节点和该媒体资源对应的资源节点之间增加第一类连线,该第一类连线的权重与该目标交互行为的数量正相关。
在该关联数据表示该多个实体中任一第二类对象在该目标时间段内对任一媒体资源发生过目标交互行为的情况下,在该第二类对象对应的第二类对象节点和该媒体资源对应的资源节点之间增加该第一类连线。
在该关联数据表示该多个实体中任一媒体资源的生产者为该多个实体中的任一第一类对象的情况下,在该第一类对象对应的第一类对象节点和该媒体资源对应的资源节点之间增加第二类连线。
在该关联数据表示该多个实体中任一媒体资源的生产者为该多个实体中的任一第二类对象的情况下,在该第二类对象对应的第二类对象节点和该媒体资源对应的资源节点之间增加该第二类连线。
在一种可能的实施方式中,该图卷积模块1102,用于对于该多个节点中的任一第一类对象节点,基于该图神经网络,按照该第一类对象节点的多条元路径对该第一类对象节点进行图卷积,得到该节点的初始表示信息,该第一类对象节点的多条元路径的终点均为该第一类对象节点。对于该多个节点中的任一第二类对象节点,基于该图神经网络,按照该第二类对象节点的多条元路径对该第二类对象节点进行图卷积,得到该节点的初始表示信息,该第二类对象节点的多条元路径的终点均为该第二类对象节点。
在一种可能的实施方式中,该图卷积模块1102,用于基于该图神经网络,将该第一类对象节点的多条元路径所经过节点的节点特征与该第一类对象节点的节点特征进行融合,得到该第一类对象节点的初始表示信息。
在一种可能的实施方式中,该融合模块1103,用于对于该多个节点中的任一第一类对象节点,基于该第一类对象节点与资源节点之间的连线,确定该第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,该相关第二类对象节点对应的第二类对象与该第一类对象对同一个媒体资源发生过目标交互行为,该不相关第二类对象节点对应的第二类对象发生过目标交互行为的媒体资源与该第一类对象发生过目标交互行为的媒体资源均不相同。将该第一类对象节点的初始表示信息、该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行融合,得到该第一类对象节点的融合表示信息。基于该至少一个相关第二类对象节点的初始表示信息,对该第一类对象节点的融合表示信息进行调整,得到该第一类对象节点的目标表示信息。
在一种可能的实施方式中,该融合模块1103,用于在该第一类对象节点的初始表示信息中增加掩码,得到该第一类对象节点的参考表示信息。将该第一类对象节点的参考表示信息、该至少一个相关第二类对象节点的初始表示信息以及该至少一个不相关第二类对象节点的初始表示信息进行加权求和,得到该第一类对象节点的融合表示信息。
在一种可能的实施方式中,该融合模块1103,用于将该至少一个相关第二类对象节点的初始表示信息输入目标分类器,由该目标分类器输出该相关第二类对象节点对应的第二类对象的对象类型。将该第一类对象节点的融合表示信息输入该输入目标分类器,由该目标分类器输出该第一类对象节点对应的第一类对象的对象类型。基于该第二类对象的对象类型与该第一类对象的对象类型之间的差异信息,对该第一类对象节点的融合表示信息进行调整,得到该第一类对象节点的目标表示信息。
在一种可能的实施方式中,该装置还包括:
训练模块,用于基于该多个节点之间的连线,获取多个正样本节点对和多个负样本节点对,该正样本节点对为该异质图中间接相连的两个相同类型的节点,该负样本节点对为该异质图中不相连的两个相同类型的节点。基于每个该正样本节点对的初始表示信息之间的第一差异信息,以及每个该负样本节点对的初始表示信息之间的第二差异信息,对该图神经网络进行训练。
在一种可能的实施方式中,该装置还包括:
训练模块,用于对于该多个节点中的任一节点,基于该节点的多个候选表示信息中任两个候选表示信息之间的第三差异信息,对该图神经网络进行训练,该节点的候选表示信息是按照该节点的一组元路径进行图卷积得到的表示信息。
在一种可能的实施方式中,该装置还包括:
推荐模块,用于基于该第一类对象节点的目标表示信息,确定与该第一类对象之间相似度符合第一相似度条件的至少一个候选对象。向该第一类对象推荐该至少一个候选对象发生过目标交互行为的媒体资源。
需要说明的是:上述实施例提供的表示信息的确定装置在确定表示信息时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将计算机设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的表示信息的确定装置与表示信息的确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
通过本申请实施例提供的技术方案,获取了目标资源业务的异质图,该异质图包括目标资源业务中多类实体对应的节点。通过图神经网络采用多类元路径对该异质图进行处理,得到第一类对象节点的初始表示信息和第二类对象节点的初始表示信息,由于元路径连接了不同类型的节点,那么对象节点的初始表示信息中也就携带了媒体资源的相关信息。基于连线将第一类对象节点和第二类对象节点的初始表示信息进行了融合,得到的目标表示信息能够更加充分地表示该第一类对象。基于目标表示信息向该第一类对象进行媒体资源的推荐时,推荐的媒体资源的准确性较高。
本申请实施例提供了一种计算机设备,用于执行上述方法,该计算机设备可以实现为终端或者服务器,下面先对终端的结构进行介绍。
图12是本申请实施例提供的一种终端的结构示意图。该终端1200包括有:一个或多个处理器1201和一个或多个存储器1202。
处理器1201可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器1201可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器1201也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器1201可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器1201还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器1202可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器1202还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器1202中的非暂态的计算机可读存储介质用于存储至少一个计算机程序,该至少一个计算机程序用于被处理器1201所执行以实现本申请中方法实施例提供的表示信息的确定方法。
在一些实施例中,该计算机设备被提供为服务器,图13是本申请实施例提供的一种服务器的结构示意图,该服务器1300可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)1301和一个或多个的存储器1302,其中,该一个或多个存储器1302中存储有至少一条计算机程序,该至少一条计算机程序由该一个或多个处理器1301加载并执行以实现上述各个方法实施例提供的方法。
在示例性实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现该表示信息的确定方法。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,该计算机程序被处理器执行时实现该表示信息的确定方法。
在一些实施例中,本申请实施例所涉及的计算机程序可被部署在一个计算机设备上执行,或者在位于一个地点的多个计算机设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算机设备上执行,分布在多个地点且通过通信网络互连的多个计算机设备可以组成区块链系统。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
上述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种表示信息的确定方法,其特征在于,所述方法包括:
获取目标资源业务的异质图,所述异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示所述目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,所述目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,所述第一类对象为与所述媒体资源之间发生目标交互行为的次数小于目标次数的对象,所述第二类对象为与所述媒体资源之间发生所述目标交互行为的次数大于或等于所述目标次数的对象;
通过图神经网络,按照所述异质图中多个节点的多类元路径,对所述异质图进行图卷积,得到所述多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,所述第一类对象节点对应于所述第一类对象,所述第二类对象节点对应于所述第二类对象,所述多类元路径中的任一类元路径用于表示所述异质图中不同类型节点之间的一种连接方式;
基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息,所述目标表示信息用于向所述第一类对象进行媒体资源的推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取目标资源业务的异质图包括:
获取所述目标资源业务中的多个实体的实体特征以及所述多个实体之间的关联数据,所述关联数据用于表示所述多个实体中不同类型实体之间的关联关系;
基于所述多个实体的实体特征以及所述多个实体中不同类型实体之间的关联数据,生成所述异质图。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个实体的实体特征以及所述多个实体中不同类型实体之间的关联数据,生成所述异质图包括:
生成所述多个实体分别对应的节点,所述节点的节点特征为对应实体的实体特征,不同类型的实体对应于不同类型的节点;
基于所述多个实体中不同类型实体之间的关联数据,在生成的多个节点之间增加连线,得到所述异质图。
4.根据权利要求3所述的方法,其特征在于,所述基于所述多个实体中不同类型实体之间的关联数据,在生成的多个节点之间增加连线包括下述至少一项:
在所述关联数据表示所述多个实体中任一第一类对象在目标时间段内对任一媒体资源发生过所述目标交互行为的情况下,在所述第一类对象对应的第一类对象节点和所述媒体资源对应的资源节点之间增加第一类连线,所述第一类连线的权重与所述目标交互行为的数量正相关;
在所述关联数据表示所述多个实体中任一第二类对象在所述目标时间段内对任一媒体资源发生过所述目标交互行为的情况下,在所述第二类对象对应的第二类对象节点和所述媒体资源对应的资源节点之间增加所述第一类连线;
在所述关联数据表示所述多个实体中任一媒体资源的生产者为所述多个实体中的任一第一类对象的情况下,在所述第一类对象对应的第一类对象节点和所述媒体资源对应的资源节点之间增加第二类连线;
在所述关联数据表示所述多个实体中任一媒体资源的生产者为所述多个实体中的任一第二类对象的情况下,在所述第二类对象对应的第二类对象节点和所述媒体资源对应的资源节点之间增加所述第二类连线。
5.根据权利要求1所述的方法,其特征在于,所述通过图神经网络,按照所述异质图中多个节点的多类元路径,对所述异质图进行图卷积,得到所述多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息包括:
对于所述多个节点中的任一第一类对象节点,基于所述图神经网络,按照所述第一类对象节点的多条元路径对所述第一类对象节点进行图卷积,得到所述节点的初始表示信息,所述第一类对象节点的多条元路径的终点均为所述第一类对象节点;
对于所述多个节点中的任一第二类对象节点,基于所述图神经网络,按照所述第二类对象节点的多条元路径对所述第二类对象节点进行图卷积,得到所述节点的初始表示信息,所述第二类对象节点的多条元路径的终点均为所述第二类对象节点。
6.根据权利要求5所述的方法,其特征在于,所述基于所述图神经网络,按照所述第一类对象节点的多条元路径对所述第一类对象节点进行图卷积,得到所述节点的初始表示信息包括:
基于所述图神经网络,将所述第一类对象节点的多条元路径所经过节点的节点特征与所述第一类对象节点的节点特征进行融合,得到所述第一类对象节点的初始表示信息。
7.根据权利要求1所述的方法,其特征在于,所述基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息包括:
对于所述多个节点中的任一第一类对象节点,基于所述第一类对象节点与资源节点之间的连线,确定所述第一类对象节点的至少一个相关第二类对象节点和至少一个不相关第二类对象节点,所述相关第二类对象节点对应的第二类对象与所述第一类对象对同一个媒体资源发生过所述目标交互行为,所述不相关第二类对象节点对应的第二类对象发生过所述目标交互行为的媒体资源与所述第一类对象发生过所述目标交互行为的媒体资源均不相同;
将所述第一类对象节点的初始表示信息、所述至少一个相关第二类对象节点的初始表示信息以及所述至少一个不相关第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的融合表示信息;
基于所述至少一个相关第二类对象节点的初始表示信息,对所述第一类对象节点的融合表示信息进行调整,得到所述第一类对象节点的目标表示信息。
8.根据权利要求7所述的方法,其特征在于,所述将所述第一类对象节点的初始表示信息、所述至少一个相关第二类对象节点的初始表示信息以及所述至少一个不相关第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的融合表示信息包括:
在所述第一类对象节点的初始表示信息中增加掩码,得到所述第一类对象节点的参考表示信息;
将所述第一类对象节点的参考表示信息、所述至少一个相关第二类对象节点的初始表示信息以及所述至少一个不相关第二类对象节点的初始表示信息进行加权求和,得到所述第一类对象节点的融合表示信息。
9.根据权利要求7所述的方法,其特征在于,所述基于所述至少一个相关第二类对象节点的初始表示信息,对所述第一类对象节点的融合表示信息进行调整,得到所述第一类对象节点的目标表示信息包括:
将所述至少一个相关第二类对象节点的初始表示信息输入目标分类器,由所述目标分类器输出所述相关第二类对象节点对应的第二类对象的对象类型;
将所述第一类对象节点的融合表示信息输入所述输入目标分类器,由所述目标分类器输出所述第一类对象节点对应的第一类对象的对象类型;
基于所述第二类对象的对象类型与所述第一类对象的对象类型之间的差异信息,对所述第一类对象节点的融合表示信息进行调整,得到所述第一类对象节点的目标表示信息。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于所述多个节点之间的连线,获取多个正样本节点对和多个负样本节点对,所述正样本节点对为所述异质图中间接相连的两个相同类型的节点,所述负样本节点对为所述异质图中不相连的两个相同类型的节点;
基于每个所述正样本节点对的初始表示信息之间的第一差异信息,以及每个所述负样本节点对的初始表示信息之间的第二差异信息,对所述图神经网络进行训练。
11.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对于所述多个节点中的任一节点,基于所述节点的多个候选表示信息中任两个候选表示信息之间的第三差异信息,对所述图神经网络进行训练,所述节点的候选表示信息是按照所述节点的一组元路径进行图卷积得到的表示信息。
12.根据权利要求1所述的方法,其特征在于,所述基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息之后,所述方法还包括:
基于所述第一类对象节点的目标表示信息,确定与所述第一类对象之间相似度符合第一相似度条件的至少一个候选对象;向所述第一类对象推荐所述至少一个候选对象发生过所述目标交互行为的媒体资源。
13.一种表示信息的确定装置,其特征在于,所述装置包括:
异质图获取模块,用于获取目标资源业务的异质图,所述异质图包括多类节点,每类节点包括至少一个节点,每类节点用于表示所述目标资源业务中的一类实体,不同节点之间的连线用于表示实体之间的关联关系,所述目标资源业务中的实体包括媒体资源、第一类对象和第二类对象,所述第一类对象为与所述媒体资源之间发生目标交互行为的次数小于目标次数的对象,所述第二类对象为与所述媒体资源之间发生所述目标交互行为的次数大于或等于所述目标次数的对象;
图卷积模块,用于通过图神经网络,按照所述异质图中多个节点的多类元路径,对所述异质图进行图卷积,得到所述多个节点中第一类对象节点的初始表示信息以及第二类对象节点的初始表示信息,所述第一类对象节点对应于所述第一类对象,所述第二类对象节点对应于所述第二类对象,所述多类元路径中的任一类元路径用于表示所述异质图中不同类型节点之间的一种连接方式;
融合模块,用于基于所述多个节点之间的连线,将所述第一类对象节点的初始表示信息和第二类对象节点的初始表示信息进行融合,得到所述第一类对象节点的目标表示信息,所述目标表示信息用于向所述第一类对象进行媒体资源的推荐。
14.一种计算机设备,其特征在于,所述计算机设备包括一个或多个处理器和一个或多个存储器,所述一个或多个存储器中存储有至少一条计算机程序,所述至少一条计算机程序由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求12任一项所述的表示信息的确定方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条计算机程序,所述至少一条计算机程序由处理器加载并执行以实现如权利要求1至权利要求12任一项所述的表示信息的确定方法。
CN202210613440.9A 2022-06-01 2022-06-01 表示信息的确定方法、装置、设备及存储介质 Active CN114692007B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202210613440.9A CN114692007B (zh) 2022-06-01 2022-06-01 表示信息的确定方法、装置、设备及存储介质
PCT/CN2023/084684 WO2023231542A1 (zh) 2022-06-01 2023-03-29 表示信息的确定方法、装置、设备及存储介质
US18/583,686 US20240193402A1 (en) 2022-06-01 2024-02-21 Method and apparatus for determining representation information, device, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210613440.9A CN114692007B (zh) 2022-06-01 2022-06-01 表示信息的确定方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114692007A true CN114692007A (zh) 2022-07-01
CN114692007B CN114692007B (zh) 2022-08-23

Family

ID=82131026

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210613440.9A Active CN114692007B (zh) 2022-06-01 2022-06-01 表示信息的确定方法、装置、设备及存储介质

Country Status (3)

Country Link
US (1) US20240193402A1 (zh)
CN (1) CN114692007B (zh)
WO (1) WO2023231542A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116628345A (zh) * 2023-07-13 2023-08-22 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质
WO2023231542A1 (zh) * 2022-06-01 2023-12-07 腾讯科技(深圳)有限公司 表示信息的确定方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781379A (zh) * 2019-09-09 2020-02-11 深圳壹账通智能科技有限公司 信息推荐方法、装置、计算机设备和存储介质
CN111382309A (zh) * 2020-03-10 2020-07-07 深圳大学 一种基于图模型的短视频推荐方法、和智能终端和存储介质
WO2021114590A1 (zh) * 2019-12-09 2021-06-17 北京百度网讯科技有限公司 会话推荐方法、装置以及电子设备
CN113392334A (zh) * 2021-06-29 2021-09-14 长沙理工大学 冷启动环境下的虚假评论检测方法
CN113641920A (zh) * 2021-10-13 2021-11-12 中南大学 基于社区发现和图神经网络的商品个性化推荐方法及系统
US20210374174A1 (en) * 2020-05-27 2021-12-02 Beijing Baidu Netcom Science and Technology Co., Ltd Method and apparatus for recommending multimedia resource, electronic device and storage medium
CN113742561A (zh) * 2020-05-27 2021-12-03 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN114238752A (zh) * 2021-11-30 2022-03-25 湖南大学 物品推荐方法、装置及存储介质
CN114399028A (zh) * 2022-01-14 2022-04-26 马上消费金融股份有限公司 信息处理方法、图卷积神经网络训练方法及电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800342B (zh) * 2021-04-15 2021-07-02 中国人民解放军国防科技大学 基于异质信息的推荐方法、系统、计算机设备和存储介质
CN114692007B (zh) * 2022-06-01 2022-08-23 腾讯科技(深圳)有限公司 表示信息的确定方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110781379A (zh) * 2019-09-09 2020-02-11 深圳壹账通智能科技有限公司 信息推荐方法、装置、计算机设备和存储介质
WO2021114590A1 (zh) * 2019-12-09 2021-06-17 北京百度网讯科技有限公司 会话推荐方法、装置以及电子设备
CN111382309A (zh) * 2020-03-10 2020-07-07 深圳大学 一种基于图模型的短视频推荐方法、和智能终端和存储介质
US20210374174A1 (en) * 2020-05-27 2021-12-02 Beijing Baidu Netcom Science and Technology Co., Ltd Method and apparatus for recommending multimedia resource, electronic device and storage medium
CN113742561A (zh) * 2020-05-27 2021-12-03 北京达佳互联信息技术有限公司 视频推荐方法、装置、电子设备及存储介质
CN113392334A (zh) * 2021-06-29 2021-09-14 长沙理工大学 冷启动环境下的虚假评论检测方法
CN113641920A (zh) * 2021-10-13 2021-11-12 中南大学 基于社区发现和图神经网络的商品个性化推荐方法及系统
CN114238752A (zh) * 2021-11-30 2022-03-25 湖南大学 物品推荐方法、装置及存储介质
CN114399028A (zh) * 2022-01-14 2022-04-26 马上消费金融股份有限公司 信息处理方法、图卷积神经网络训练方法及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023231542A1 (zh) * 2022-06-01 2023-12-07 腾讯科技(深圳)有限公司 表示信息的确定方法、装置、设备及存储介质
CN116628345A (zh) * 2023-07-13 2023-08-22 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质
CN116628345B (zh) * 2023-07-13 2024-02-06 腾讯科技(深圳)有限公司 一种内容推荐方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US20240193402A1 (en) 2024-06-13
CN114692007B (zh) 2022-08-23
WO2023231542A1 (zh) 2023-12-07

Similar Documents

Publication Publication Date Title
US11106995B2 (en) Automatic segmentation of a collection of user profiles
Xu et al. Personalized course recommendation system fusing with knowledge graph and collaborative filtering
CN114692007B (zh) 表示信息的确定方法、装置、设备及存储介质
Feng et al. Computational social indicators: a case study of chinese university ranking
Kong et al. Describing and predicting online items with reshare cascades via dual mixture self-exciting processes
Huang et al. Information fusion oriented heterogeneous social network for friend recommendation via community detection
Zhan et al. Identification of top-K influential communities in big networks
CN115358809A (zh) 一种基于图对比学习的多意图推荐方法及装置
CN116127190A (zh) 一种数字地球资源推荐系统及方法
CN117216362A (zh) 内容推荐方法、装置、设备、介质和程序产品
Cao et al. Web API recommendation via combining graph attention representation and deep factorization machines quality prediction
CN112861009A (zh) 基于人工智能的媒体账号推荐方法、装置及电子设备
CN111860870A (zh) 交互行为确定模型的训练方法、装置、设备及介质
CN117132323A (zh) 推荐内容的分析方法、装置、设备、介质及程序产品
CN116452225A (zh) 对象分级方法、装置、计算机设备及存储介质
Song et al. Algorithm for generating negative cases for collaborative filtering recommender
CN115809339A (zh) 跨领域推荐方法、系统、设备及存储介质
Jin et al. Predicting potential real-time donations in YouTube live streaming services via continuous-time dynamic graphs
Jyoti et al. A review on recommendation system and web usage data mining using k-nearest neighbor (knn) method
Zhao et al. Detecting fake reviews via dynamic multimode network
Motohashi et al. Technological competitiveness of China's internet platformers: comparison of Google and Baidu by using patent text information
CN114612246A (zh) 对象集合识别方法、装置、计算机设备及存储介质
KR101458693B1 (ko) 예측 모형에 기초한 예측결과의 판단 방법
CN114996435A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
Chen et al. KGCF: Social relationship-aware graph collaborative filtering for recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40070804

Country of ref document: HK