CN115270005A

CN115270005A - 一种信息推荐方法、装置、设备以及存储介质

Info

Publication number: CN115270005A
Application number: CN202211210833.1A
Authority: CN
Inventors: 沈春旭; 成昊; 薛天竹
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-09-30
Filing date: 2022-09-30
Publication date: 2022-11-01
Anticipated expiration: 2042-09-30
Also published as: CN115270005B

Abstract

本申请实施例提供了一种信息推荐方法、装置、设备以及存储介质，用于提高信息推荐的精确度。包括：根据对象对资源信息产生的历史交互行为构建二部图，其中，二部图包括图节点和关联关系；根据二部图的关联关系确定对象节点与资源节点之间传播消息；利用传播消息和关联关系训练初始图神经网络得到第一图神经网络；利用传播消息和第一图神经网络得到对象节点的第一嵌入表示以及资源节点的第二嵌入表示；根据第一嵌入表示和第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数；根据第一预测分数向目标对象推荐第二资源信息。本申请提供的技术方案可应用于人工智能领域。

Description

一种信息推荐方法、装置、设备以及存储介质

技术领域

本申请涉及计算机领域，尤其涉及一种信息推荐方法、装置、设备以及存储介质。

背景技术

推荐系统在近年来被广泛应用于各个领域，比如在电子商务、广告和社交媒体网站等领域向客户提供合适的内容。推荐系统中最重要和最流行的技术之一是协同过滤（collaborative filtering, CF），它从历史交互（如点击和购买）中计算出用户和物品之间的相似性，通过假设彼此行为相似的用户表现出对物品的相似偏好来向用户推荐相关物品。近年来出现的许多使用神经网络的推荐系统，如图神经网络（Graph Neural Networks，GNN），在提高推荐精度的意义上得到了广泛的研究。基于图神经网络的推荐系统试图从用户与物品的交互中建立高阶连通性信息模型，并将其视为一个二部图。图神经网络拥有学习图结构及其顶点的向量表示的强大性能，在许多机器学习的下游任务中表现出了强大的实力。

然而，在推荐系统领域，这些基于图神经网络的方法要么只利用具有正面反馈的用户-物品交互的信息，要么不做任何区别得同等对待正面反馈和负面反馈。然而在实际应用中，用户对物品的评价有明显的两极性：用户可能对物品给予正面的评价，也有可能给予物品负面的评价；同时在曝光给用户的商品/广告等物品后，用户有可能产生点击行为（正面反馈），也有可能不点击（负面反馈）。已有的方法并没有合理地利用好用户的正面反馈和负面反馈。

发明内容

本申请实施例提供了一种信息推荐方法、装置、设备以及存储介质，用于提高信息推荐的精确度。

有鉴于此，本申请一方面提供一种信息推荐方法，包括：根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，该传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络；利用该传播消息和该第一图神经网络得到该对象节点的第一嵌入表示以及该资源节点的第二嵌入表示；根据该第一嵌入表示和该第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；根据该第一预测分数向该目标对象推荐该第二资源信息。

本申请另一方面提供一种信息推荐装置，包括：

生成模块，用于根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；

确定模块，用于根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，该传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；

训练模块，用于利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络；

处理模块，用于利用该传播消息和该第一图神经网络得到该对象节点的第一嵌入表示以及该资源节点的第二嵌入表示；根据该第一嵌入表示和该第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；

输出模块，用于根据该第一预测分数向该目标对象推荐该第二资源信息。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该初始图神经网络包括N层消息传播层，该N为大于1的正整数，该训练模块，具体用于随机生成该对象节点的第一初始嵌入表示和该资源节点的第二初始嵌入表示；

将该第一初始嵌入表示、该第二初始嵌入表示和该传播消息输入该N层消息传播层得到该对象节点的第三嵌入表示和该资源节点的第四嵌入表示；

根据该第三嵌入表示和该第四嵌入表示计算该对象节点对该资源节点的第二预测分数；

根据该第二预测分数和该关联关系计算第一损失值；

根据该第一损失值训练该初始图神经网络得到该第一图神经网络。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该N层消息传播层均包括消息函数、消息聚合函数和消息更新函数，该训练模块，具体用于将该第一初始嵌入表示和该第一初始嵌入表示输入第一层消息传播层，根据该第一初始嵌入表示、该第一初始嵌入表示以及该传播消息得到该对象节点和该资源节点对应的第一消息函数表示；

根据该第一层消息传播层的消息聚合函数和该第一消息函数表示得到该对象节点和该资源节点对应的第一聚合表示；

根据该第一层消息传播层的消息更新函数和该第一聚合表示得到该对象节点的第一中间嵌入表示和该资源节点的第二中间嵌入表示；

将该第一中间嵌入表示和该第二中间嵌入表示输入第二层消息传播层，根据该第一中间嵌入表示、该第一中间嵌入表示以及该传播消息得到该对象节点和该资源节点对应的第二消息函数表示；

根据该第二层消息传播层的消息聚合函数和该第二消息函数表示得到该对象节点和该资源节点对应的第二聚合表示；

根据该第二层消息传播层的消息更新函数和该第二聚合表示得到该对象节点的第三中间嵌入表示和该资源节点的第四中间嵌入表示；

依此类推，执行完该N层消息传播层得到该二部图中各个对象节点的第三嵌入表示和该二部图中各个资源节点的第四嵌入表示。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该处理模块，具体用于根据该关联关系从该第二预测分数中获取第三预测分数，该第三预测分数为该二部图中存在关联关系的对象节点与资源节点对应的预测分数；

根据该关联关系和该第三预测分数利用有符号对比损失函数计算该第一损失值。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该训练模块，具体用于根据该第一损失值和梯度下降法训练该初始图神经网络得到该第一图神经网络。

基于该第四嵌入表示随机采样生成M个假反例资源节点的第五嵌入表示；

根据该第三嵌入表示和该第四嵌入表示计算该对象节点对该资源节点的第二预测分数，并根据该第三嵌入表示和该第五嵌入表示计算该对象节点对该假反例资源节点的第四预测分数；

根据该第二预测分数、该第四预测分数和该关联关系计算第二损失值；

根据该第二损失值训练该初始图神经网络得到该第一图神经网络。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该训练模块，具体用于根据该关联关系从该第二预测分数中获取第三预测分数，该第三预测分数为该二部图中存在关联关系的对象节点与资源节点对应的预测分数；

根据该第三预测分数、该第四预测分数和该关联关系利用有符号对比损失函数计算该第二损失值。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该处理模块，具体用于根据该第一嵌入表示和该第二嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；

将该余弦距离输入激活函数得到该第一预测分数。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该生成模块，具体用于获取该对象对该资源信息的评分信息，该评分信息作为该历史交互行为；

根据该评分信息构建该对象与该资源信息之间的关系矩阵；

根据该关系矩阵构建该二部图。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点时，确定该第一对象节点至该第一资源节点的传播消息为正面反馈传播消息以及该第一资源节点至该第一对象节点的传播消息为正面反馈传播消息；

在该二部图中的关联关系指示该第一对象节点的消息通过负面反馈传递至该第一资源节点时，确定该第一对象节点至该第一资源节点的传播消息为负面反馈传播消息以及该第一资源节点至该第一对象节点的传播消息为负面反馈传播消息；

在该二部图中的关联关系指示该第一对象节点的消息传递至该第一资源节点的方式与该第一资源节点的消息传递至第二对象节点的方式相同时，确定该第一对象节点与该第二对象节点之间的传播消息为正面反馈消息；

在该二部图中的关联关系指示该第一对象节点的消息传递至该第一资源节点的方式与该第一资源节点的消息传递至该第二对象节点的方式不相同时，确定该第一对象节点与该第二对象节点之间的传播消息为负面反馈消息；

在该二部图中的关联关系指示该第一资源节点的消息传递至该第一对象节点的方式与该第一对象节点的消息传递至第二资源节点的方式不相同时，确定该第一资源节点与该第二资源节点之间的传播消息为负面反馈消息；

在该二部图中的关联关系指示该第一资源节点的消息传递至该第一对象节点的方式与该第一对象节点的消息传递至第二资源节点的方式相同时，确定该第一资源节点与该第二资源节点之间的传播消息为正面反馈消息。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过正面反馈传递至该第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为正面反馈传播消息；

或者，

在该二部图中的关联关系指示第一对象节点的消息通过负面反馈传递至第一资源节点，且该第一资源节点的消息再通过负面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为正面反馈传播消息。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过负面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为负面反馈传播消息；

或者，

在该二部图中的关联关系指示第一对象节点的消息通过负面反馈传递至第一资源节点，且该第一资源节点的消息再通过正面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为负面反馈传播消息。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块，具体用于在该二部图中的关联关系指示第一资源节点的消息通过正面反馈传递至第一对象节点，且该第一对象节点的消息再通过负面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为负面反馈消息；

或者，

在该二部图中的关联关系指示第一资源节点的消息通过负面反馈传递至第一对象节点，且该第一对象节点的消息再通过正面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为负面反馈消息。

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块，具体用于在该二部图中的关联关系指示第一资源节点的消息通过正面反馈传递至第一对象节点，且该第一对象节点的消息再通过正面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为正面反馈消息；

或者，

在该二部图中的关联关系指示第一资源节点的消息通过负面反馈传递至第一对象节点，且该第一对象节点的消息再通过负面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为正面反馈消息。

本申请一方面提供一种信息推荐方法，包括：根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈；利用该第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络；利用该第一图神经网络得到该第一二部图中全部对象的第一嵌入表示以及该第一二部图中全部资源信息的第二嵌入表示，并利用该第二图神经网络得到该第二二部图中全部对象的第三嵌入表示以及该第二二部图中全部资源信息的第四嵌入表示；将该第一嵌入表示与该第三嵌入表示进行融合得到该对象节点的对象嵌入表示，并将该第二嵌入表示与该第四嵌入表示进行融合得到该资源节点的资源嵌入表示；根据该对象嵌入表示和该资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；根据该第一预测分数向该目标对象从该第二资源信息中推荐第三资源信息。

本申请另一方面提供一种信息推荐装置，包括：生成模块，用于根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈；

训练模块，用于利用该第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络；

处理模块，用于利用该第一图神经网络得到该第一二部图中全部对象的第一嵌入表示以及该第一二部图中全部资源信息的第二嵌入表示，并利用该第二图神经网络得到该第二二部图中全部对象的第三嵌入表示以及该第二二部图中全部资源信息的第四嵌入表示；将该第一嵌入表示与该第三嵌入表示进行融合得到该对象节点的对象嵌入表示，并将该第二嵌入表示与该第四嵌入表示进行融合得到该资源节点的资源嵌入表示；根据该对象嵌入表示和该资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该处理模块，具体用于将该对象嵌入表示和该资源嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；

将该余弦距离输入激活函数得到该第一预测分数。

本申请另一方面提供一种计算机设备，包括：存储器、处理器以及总线系统；

其中，存储器用于存储程序；

处理器用于执行存储器中的程序，处理器用于根据程序代码中的指令执行上述各方面的方法；

总线系统用于连接存储器以及处理器，以使存储器以及处理器进行通信。

本申请的另一方面提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面的方法。

本申请的另一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方面所提供的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：构建有符号的二部图，并基于有符号图的平衡理论获取到该二部图多种传播消息，即从单一的对象至资源信息的传播消息增加到对象至资源信息的传播消息、对象至对象的传播消息、资源信息至资源信息的传播消息，从而增加了该图神经网络在进行训练以及预测时的数据输入，并充分考虑了对象与资源信息之间的正面反馈和负面反馈，使得该图神经网络在进行信息推荐时可以参考更多的信息，从而提高信息推荐的精确度。

附图说明

图1为本申请实施例中有符号二部图的一个示意图；

图2为本申请实施例中应用场景的一个架构示意图；

图3为本申请实施例中信息推荐方法的一个方法流程示意图；

图4为本申请实施例中有符号二部图的邻接矩阵的一个示意图；

图5为本申请实施例中有符号二部图的一个示意图；

图6为本申请实施例中信息推荐方法的一个整体框架示意图；

图7为本申请实施例中信息推荐方法的一个实施例示意图；

图7a为本申请实施例中视频推荐的推荐界面的一个展示示意图；

图7b为本申请实施例中游戏信息推荐应用场景下有符号二部图的一个示意图；

图7c为本申请实施例中游戏信息推荐的推荐界面的一个展示示意图；

图8为本申请实施例中信息推荐方法的另一个方法流程示意图；

图9为本申请实施例中有符号二部图的另一个示意图；

图10为本申请实施例中有符号二部图的另一个示意图；

图11为本申请实施例中信息推荐方法的另一个整体框架示意图；

图12为本申请实施例中信息推荐方法的一个实施例示意图；

图13为本申请实施例中信息推荐装置的一个实施例示意图；

图14为本申请实施例中信息推荐装置的另一个实施例示意图；

图15为本申请实施例中信息推荐装置的另一个实施例示意图；

图16为本申请实施例中信息推荐装置的另一个实施例示意图。

具体实施方式

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

推荐系统在近年来被广泛应用于各个领域，比如在电子商务、广告和社交媒体网站等领域向客户提供合适的内容。推荐系统中最重要和最流行的技术之一是CF，它从历史交互（如点击和购买）中计算出用户和物品之间的相似性，通过假设彼此行为相似的用户表现出对物品的相似偏好来向用户推荐相关物品。近年来出现的许多使用神经网络的推荐系统，如GNN，在提高推荐精度的意义上得到了广泛的研究。基于图神经网络的推荐系统试图从用户与物品的交互中建立高阶连通性信息模型，并将其视为一个二部图。图神经网络拥有学习图结构及其顶点的向量表示的强大性能，在许多机器学习的下游任务中表现出了强大的实力。然而，在推荐系统领域，这些基于图神经网络的方法要么只利用具有正面反馈的用户-物品交互的信息，要么不做任何区别得同等对待正面反馈和负面反馈。然而在实际应用中，用户对物品的评价有明显的两极性：用户可能对物品给予正面的评价，也有可能给予物品负面的评价；同时在曝光给用户的商品/广告等物品后，用户有可能产生点击行为（正面反馈），也有可能不点击（负面反馈）。已有的方法并没有合理地利用好用户的正面反馈和负面反馈。为了解决上述问题，本申请提供如下技术方案：根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，该传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络；利用该传播消息和该第一图神经网络得到该对象节点的第一嵌入表示以及该资源节点的第二嵌入表示；根据该第一嵌入表示和该第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；根据该第一预测分数向该目标对象推荐该第二资源信息。

为了方便理解，下面对本申请中涉及到的部分专业名词进行说明：

正面反馈（Positive Feedback）：用户对物品产生的正面的反馈，例如用户在看到系统曝光给他的物品后，点击了该物品，或者给予了好评，高评分，喜欢，点赞等行为。

负面反馈（Negative Feedback）：用户对物品产生的负面的反馈，例如物品被曝光给用户后，用户并没有点该物品（代表用户对该物品不感兴趣），或者给予了差评，低评分，不喜欢等行为。

潜在空间（Latent Space）：潜在空间，也称为潜在特征空间或嵌入空间，是一组项目在流形中的嵌入，其中彼此更相似的项目在潜在空间中彼此靠近。潜在空间中的位置可以被视为由从对象的相似性中出现的一组潜在变量定义。

有符号图（Signed Graph）：每个边都具有正号或负号的图结构。

二部图（Bipartite Graph）：一种特殊的图结构，二部图的顶点集V可以分割成两个互不相交的子集，图中每条边两端的顶点都属于不同的两个子集，并且同一个子集中的顶点不相邻。本申请中，该有符号的二部图可以如图1所示，二部图的顶点集包括用户与物品。如图1所示，该节点u1至u5为用户，节点v1至v8为物品，此时该用户与物品之间存在正面反馈和负面反馈。若该用户与物品的节点之间的边为正号（图1中的实线指示正号）则指示该用户对该物品之间为正面反馈，若该用户与物品的节点之间的边为负号（图1中的虚线指示负号）则指示该用户对该物品之间为负面反馈。

嵌入表示：邻接矩阵描述二部图中节点之间的连接。它是一个|V| x |V|矩阵，其中|V|是二部图中节点的个数。矩阵中的每一列和每一行表示一个节点。矩阵中的非零值表示两个节点相连。使用邻接矩阵作为大型图的特征空间几乎是不可能的，因此需要将节点属性打包到一个维度更小的向量中，也称为图嵌入（Graph Embedding，也叫NetworkEmbedding）表示。即将属性图转换为向量或向量集，通过捕获图的拓扑结构、顶点到顶点的关系以及关于图、子图和顶点的其他相关信息转换为向量或者向量集，也称为嵌入表示。本实施例中，该对象节点的初始嵌入表示可以为

，资源节点的初始嵌入表示可以为

，其中

表示嵌入维度，且上述初始嵌入表示为随机初始化生成。而在训练过程中通过消息传播函数时，该对象节点与该资源节点的嵌入表示可以根据函数聚合以及函数更新从而进行更新得到中间嵌入表示。在该图神经网络训练完成后，该二部图再次输入该图神经网络将得到该对象节点和该资源节点的最终嵌入表示，即该最终嵌入表示将用于预测对象节点对资源节点的偏好。

机器学习(Machine Learning ,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习等技术。

反向传播：前向传播是指模型的前馈处理过程，反向传播与前向传播相反，指根据模型输出的结果对模型各个层的权重参数进行更新。例如，模型包括输入层、隐藏层和输出层，则前向传播是指按照输入层-隐藏层-输出层的顺序进行处理，反向传播是指按照输出层-隐藏层-输入层的顺序，依次更新各个层的权重参数。

多层感知器（Multiple Layer Perceptron，MLP）：通常也称为深度神经网络（DeepNeural Network，DNN）是多层全连接神经网络。

全连接层(Fully Connected layer，FC)是指该层状结构中的每一个结点均与上一层的所有结点相连，可用于将上一层的神经网络层提取的特征进行综合处理，在神经网络模型中起到“分类器”的作用。

本申请实施例提供的一种信息推荐方法、装置、设备及存储介质，能够提高信息推荐的精确度。下面说明本申请实施例提供的电子设备的示例性应用，本申请实施例提供的电子设备可以实施为各种类型的用户终端，也可以实施为服务器。

电子设备通过运行本申请实施例提供的信息推荐的方案，可以能够保证提高信息推荐的精确度，即提高电子设备自身对信息推荐的精确度，适用于信息推荐的多个应用场景。例如，该推荐系统能够向用户推荐媒体资源，如推荐新闻、推荐广告、推荐视频等，还能够用于向用户推荐商品、服务等。例如，终端设备为车载终端，服务器基于该多目标推荐模型向多个车载终端推送附近的加油站、停车场等内容。再例如，终端设备为智能手机，服务器向多个智能手机推荐附近的美食、景点等内容。

参见图2，图2是本申请实施例提供的信息推荐方案的一个应用场景下的一个可选的架构示意图，为实现支撑一个信息推荐应用，终端设备100通过网络200连接服务器300，服务器300连接数据库400，网络200可以是广域网或者局域网，又或者是二者的组合。其中用于实现信息推荐方案的客户端部署于终端设备100上，其中，客户端可以通过浏览器的形式运行于终端设备100上，也可以通过独立的应用程序（application，APP）的形式运行于终端设备100上等，对于客户端的具体展现形式，此处不做限定。本申请涉及的服务器300可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络（Content Delivery Network，CDN）、以及大数据和人工智能平台等基础云计算服务的云服务器。终端设备100可以是智能手机、平板电脑、笔记本电脑、掌上电脑、个人电脑、智能电视、智能手表、车载设备、可穿戴设备等，但并不局限于此。终端设备100以及服务器300可以通过有线或无线通信方式通过网络200进行直接或间接地连接，本申请在此不做限制。服务器300和终端设备100的数量也不做限制。本申请提供的方案可以由终端设备100独立完成，也可以由服务器300独立完成，还可以由终端设备100与服务器300配合完成，对此，本申请并不做具体限定。其中，数据库400，简而言之可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作。所谓“数据库”是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。数据库管理系统（Database Management System，DBMS）是为管理数据库而设计的电脑软件系统，一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类，例如关系式、可扩展标记语言（Extensible Markup Language,XML）；或依据所支持的计算机类型来作分类，例如服务器群集、移动电话；或依据所用查询语言来作分类，例如结构化查询语言(StructuredQuery Language，SQL)、XQuery；或依据性能冲量重点来作分类，例如最大规模、最高运行速度；亦或其他的分类方式。不论使用哪种分类方式，一些DBMS能够跨类别，例如，同时支持多种查询语言。在本申请中，数据库400可以用于存储对象与资源信息的历史交互行为，当然，对象与资源信息的历史交互行为的存储位置并不限于数据库，例如还可以存储于终端设备100、区块链或者服务器300的分布式文件系统中等。

在一些实施例中，服务器300可以与该终端设备100联合执行本申请实施例提供的信息推荐方法，本实施例中，该其具体流程可以如下：从终端设备100和/或数据库400中获取对象对资源信息产生的历史交互行为，并建立初始图神经网络模型；该服务器300根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系（本申请中也称为边），该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；并根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，即基于有符号图的平衡理论获取到该对象与资源信息之间的传播消息、对象与对象之间的传播消息以及资源信息与资源信息之间的传播消息，其中该传播消息具体包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络，本申请中该服务器300在训练该第一图神经网络时可以利用该二部图中的产生了历史交互行为的对象和资源信息的真实偏好与该服务器300预测得到的预测偏好计算损失值，然后基于该损失值训练该初始图神经网络得到该第一图神经网络中；然后该服务器300再基于该第一图神经网络计算二部图中各个对象和资源信息的嵌入表示，最后根据各个对象和资源信息的嵌入表示计算该二部图中未产生历史交互行为的对象与资源信息之间的预测分数；最后该服务器300根据该预测分数向该终端设备100进行资源信息推荐，以使终端设备100在图形界面110中显示推荐出来的资源信息。

在另一个实施例中，该终端设备100独立执行本申请实施例提供的信息推荐方法，本实施例中，该其具体流程可以如下：从终端设备100和/或数据库400中获取对象对资源信息产生的历史交互行为，并建立初始图神经网络模型；该终端设备100根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系（本申请中也称为边），该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；并根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，即基于有符号图的平衡理论获取到该对象与资源信息之间的传播消息、对象与对象之间的传播消息以及资源信息与资源信息之间的传播消息，其中该传播消息具体包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络，本申请中该终端设备100在训练该第一图神经网络时可以利用该二部图中的产生了历史交互行为的对象和资源信息的真实偏好与该终端设备100预测得到的预测偏好计算损失值，然后基于该损失值训练该初始图神经网络得到该第一图神经网络中；然后该终端设备100再基于该第一图神经网络计算二部图中各个对象和资源信息的嵌入表示，最后根据各个对象和资源信息的嵌入表示计算该二部图中未产生历史交互行为的对象与资源信息之间的预测分数；最后该终端设备100根据该预测分数进行资源信息推荐，并在终端设备100在图形界面110中显示推荐出来的资源信息。

基于上述系统，具体请参阅图3所示，本申请中信息推荐方法的一个执行流程可以如下：

步骤1、获取对象对资源信息的评分信息，构造评分矩阵（或者说是有符号图的邻接矩阵）。本申请中，该评分信息可用于指示该对象对资源信息的历史交互信息。比如对于视频推荐来说，包括用户1至用户5，视频1至视频4；其中，用户1未点击视频1和视频2，点击视频3，并给视频评分为5分，点击视频4，并给视频评分1分；用户2未点击视频1和视频4，点击视频2，并给视频评分为1分，点击视频3，并给视频评分4分；用户3未点击视频2和视频3，点击视频1，并给视频评分为2分，点击视频4，并给视频评分5分；用户4未点击视频1和视频4，点击视频2，并给视频评分为5分，点击视频3，并给视频评分1分；用户5未点击视频3和视频4，点击视频1，并给视频评分为5分，点击视频2，并给视频评分4分。此时该用户与视频之间的评分矩阵可以如图4所示。其中，该+1用于指示用户对该视频进行点击，且评分超过3分；该-1用于指示用户点击视频，但评分低于3分；0用于指示用户未点击视频。

步骤2、根据该有符号图的邻接矩阵构建二部图。一个示例性方案中，基于图4所示的邻接矩阵，构建如图5所示的二部图。其中+1表示为正边，-1表示为负边；0表示无历史交互行为。

步骤3、将对象初始嵌入表示和资源初始嵌入表示输入有符号图神经网络，同时基于有符号图的平衡理论计算得到对象最终嵌入表示和资源最终嵌入表示。本申请中，该有符号图的平衡理论可以理解如下：

基于有符号图，图中有正边，也有负边，在图中通过边进行信息传播的时候，有一个基本原则，用谚语来说就是：“朋友的朋友我的朋友，朋友的敌人是我的敌人，敌人的敌人是我的朋友”。所以基于这一基本原则，在信息经过正边和负边进行传播的时候，以用户侧为例，两个用户顶点之间有以下几种情况：

用户

的消息通过一条负边传递到物品

，物品

的消息再经过一条负边传递到另外一个用户

，这种情况用户

和用户

是正面的关系，也可以称为正面传播消息。

用户

的消息通过一条负边传递到物品

，物品

的消息再经过一条正边传递到另外一个用户

，这种情况用户

和用户

是负面的关系，也可以称为负面传播消息。

用户

的消息通过一条正边传递到物品

，物品

的消息再经过一条负边传递到另外一个用户

，这种情况用户

和用户

是负面的关系，也可以称为负面传播消息。

用户

的消息通过一条正边传递到物品

，物品

的消息再经过一条正边传递到另外一个用户

，这种情况用户

和用户

是正面的关系，也可以称为正面传播消息。

同理，两个物品顶点之间，也存在四种情况。

步骤4、根据对象最终嵌入表示和资源最终嵌入表示计算对象与资源信息之间余弦距离，然后将该余弦距离输入至激活函数得到对象对资源信息的预测分数。

步骤5、根据预测分数向对象推荐资源信息。本申请中，根据该预测分数向对象推荐资源信息可以理解为对象推荐与其未发生历史交互行为的资源信息，如图6所示。

可以理解的是，在本申请的具体实施方式中，涉及到历史交互行为等相关的数据，当本申请以上实施例运用到具体产品或技术中时，需要获得用户许可或者同意，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

结合上述介绍，下面以终端设备为执行主体为例，对本申请中信息推荐方法进行介绍，请参阅图7，本申请实施例中信息推荐方法的一个实施例包括：

701、根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈。

终端设备获取对象对资源信息的评分信息，构造评分矩阵（或者说是有符号图的邻接矩阵），然后再根据该评分矩阵构建该二部图，其中，该二部图中图节点分别为该对象对应的对象节点和该资源信息对应的资源节点，而该二部图中的边用于指示该对象节点与该资源节点之间的关联关系，本实施例中，该二部图中的边即包括正面反馈也包括负面反馈。一个示例性方案中，该终端设备构建该二部图过程可以如上述图4和图5所示，具体此处不再赘述。

本实施例中，该对象与该资源信息之间的历史交互行为可以包括用户在一个或多个应用平台上的历史行为数据。例如，用户在支付平台上的历史交互行为可以包括但不限于用户点击过的用户权益、用户使用的用户权益、用户通过用户权益购买过的商品及商品的成交金额等，用户在购物平台上的历史交互行为可以包括但不限于用户产生过指定行为（如点击、浏览、收藏、购买、点击后购买等一种或多种）的商品、用户购买商品的花费等。用户在视频平台上的历史交互行为可以包括但不限于用户点击视频进行观看，用户为观看的视频发送弹幕或者进行评论或者收藏视频等等。

该对象可以是终端设备的使用用户，而该资源信息可以是与该用户有关联关系的推荐对象，例如包括但不限于向用户推荐过的推荐对象、用户点击过的推荐对象、用户通过点击并产生购买行为的推荐对象等。比如，可以是商品、文章、视频、音频等等信息。

702、根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，该传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息。

本实施例中，该终端设备基于有符号图的平衡理论从该二部图的关联关系中可以获取到多种传播消息。具体可以如下：

在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点时，确定该第一对象节点至该第一资源节点的传播消息为正面反馈传播消息以及该第一资源节点至该第一对象节点的传播消息为正面反馈传播消息；

在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过正面反馈传递至该第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为正面反馈传播消息；

在该二部图中的关联关系指示第一对象节点的消息通过负面反馈传递至第一资源节点，且该第一资源节点的消息再通过负面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为正面反馈传播消息；

在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过负面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为负面反馈传播消息；

在该二部图中的关联关系指示第一对象节点的消息通过负面反馈传递至第一资源节点，且该第一资源节点的消息再通过正面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为负面反馈传播消息；

在该二部图中的关联关系指示第一资源节点的消息通过正面反馈传递至第一对象节点，且该第一对象节点的消息再通过负面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为负面反馈消息；

以图5所示二部图进行说明，即用户1至视频3为正面反馈消息，用户1至视频4为负面反馈消息；用户1至用户2为正面反馈消息；用户1至用户4为负面反馈消息；视频1至视频4为负面反馈消息；视频1至视频2为正面反馈消息。

703、利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络。

该终端设备随机生成该对象节点的第一初始嵌入表示和该资源节点的第二初始嵌入表示；将该第一初始嵌入表示和该第一初始嵌入表示输入第一层消息传播层，根据该第一初始嵌入表示、该第一初始嵌入表示以及该传播消息得到该对象节点和该资源节点对应的第一消息函数表示；根据该第一层消息传播层的消息聚合函数和该第一消息函数表示得到该对象节点和该资源节点对应的第一聚合表示；根据该第一层消息传播层的消息更新函数和该第一聚合表示得到该对象节点的第一中间嵌入表示和该资源节点的第二中间嵌入表示；将该第一中间嵌入表示和该第二中间嵌入表示输入第二层消息传播层，根据该第一中间嵌入表示、该第一中间嵌入表示以及该传播消息得到该对象节点和该资源节点对应的第二消息函数表示；根据该第二层消息传播层的消息聚合函数和该第二消息函数表示得到该对象节点和该资源节点对应的第二聚合表示；根据该第二层消息传播层的消息更新函数和该第二聚合表示得到该对象节点的第三中间嵌入表示和该资源节点的第四中间嵌入表示；依此类推，执行完该N层消息传播层得到该二部图中各个对象节点的第三嵌入表示和该二部图中各个资源节点的第四嵌入表示；根据该第三嵌入表示和该第四嵌入表示计算该对象节点对该资源节点的第二预测分数；根据该第二预测分数和该关联关系计算第一损失值；根据该第一损失值训练该初始图神经网络得到该第一图神经网络。

本实施例中，该初始图神经网络由

层相同的消息传播层组成，每一层消息传播层依次由三个组件组成：消息函数、消息聚合函数、消息更新函数。每一层的输入来自于上一层的输出，但是第一层的输入为第一初始嵌入表示

和第二初始嵌入表示

，其中

表示嵌入维度，第一初始嵌入表示和第二初始嵌入表示为随机初始化生成，可以理解的是，其需要服从正态分布

,并且在训练过程中会通过反向传播不断被优化更新。

下面对本实施例中该消息传播层中的三个组件进行说明：

1、消息函数

在该有符号二部图中，每一种边都会生成一种消息，基于有符号二部图的平衡理论，每一个有符号二部图总共有8种边：用户（即对象）顶点到物品（即资源信息）顶点的正边（即正向反馈消息），用户顶点到物品顶点的负边（即负向反馈消息），物品顶点到用户顶点的正边，物品顶点到用户顶点的负边，用户顶点到用户顶点的正边，用户顶点到用户顶点的负边，物品顶点到物品顶点的正边，物品顶点到物品顶点的负边。因此，对于第

层，这 8种消息函数分别为：

用户顶点到物品顶点的正边

用户顶点到物品顶点的负边

物品顶点到用户顶点的正边

物品顶点到用户顶点的负边

用户顶点到用户顶点的正边

用户顶点到用户顶点的负边

物品顶点到物品顶点的正边

物品顶点到物品顶点的负边

其中

为参数矩阵，其中

用于指示消息传播层的层数，该

用于指示上一层消息传播层输出的物品的嵌入表示；

用于指示上一层消息传播层输出的用户的嵌入表示。

2、消息聚合函数

消息聚合函数与消息函数类似，在该有符号二部图中，每一种边都会生成一种消息，基于有符号二部图的平衡理论，每一个有符号二部图总共有8种边，采用注意力机制来进行消息聚合，以用户顶点到物品顶点的正边为例，其他七种类似。

其中

为参数矩阵，

表示拼接函数，其中

用于指示注意力权重。

3、消息更新函数

其中

表示多层感知网络。

第一图神经网络的最后一层输出就是用户顶点和物品顶点的最终嵌入表示，即

。

在本实施例中，在计算出该各个对象的最终嵌入表示和该资源信息的最终嵌入表示之后，该终端设备可以计算该用户

对物品

的预测偏好为：

其中

表示 sigmoid 函数。

而此时该终端设备可以根据有符号对比损失函数来计算该第一损失值，其中有符号对比损失函数可以如下：

本实施例中为了拉远真实正面反馈与假反例在潜在空间中的距离，拉远真实负面反馈与假反例在潜在空间中的距离，最后使得真实正面反馈和真实负面反馈在潜在空间的距离足够远，使得模型能够很好的区分出正面反馈和负面反馈，可以随机采样M个假反例，具体过程可以如下：随机生成该对象节点的第一初始嵌入表示和该资源节点的第二初始嵌入表示；将该第一初始嵌入表示、该第二初始嵌入表示和该传播消息输入该N层消息传播层得到该对象节点的第三嵌入表示和该资源节点的第四嵌入表示；基于该第四嵌入表示随机采样生成M个假反例资源节点的第五嵌入表示；根据该第三嵌入表示和该第四嵌入表示计算该对象节点对该资源节点的第二预测分数，并根据该第三嵌入表示和该第五嵌入表示计算该对象节点对该假反例资源节点的第四预测分数；根据该第二预测分数、该第四预测分数和该关联关系计算第二损失值；根据该第二损失值训练该初始图神经网络得到该第一图神经网络。

在本实施例，该假反例为随机采样的M个物品与当前二部图中的用户之间构建生成的负面反馈样本，其中，该M个物品为未与当前二部图中的用户发生历史交互行为且未出现在该二部图中的物品。假设，在某一视频软件中，待推荐给用户的视频数量为1000个，历史推荐给用户的数量为100，用户对其中60个视频产生了正面反馈，对其中40个视频产生了负面反馈。而在模型训练中，可以从1000-100=900个视频中再次随机采样20个视频，并设置用户对该20个视频产生了负面反馈。此时，用户与该20个视频构建了至少20个负面反馈样本。

在上述方法中，该终端设备将该第一初始嵌入表示、该第二初始嵌入表示和该传播消息输入该N层消息传播层得到该对象节点的第三嵌入表示和该资源节点的第四嵌入表示的具体做法可以参阅上述过程，此处不再赘述。在此方案中，该终端设备在计算该损失值时，可以采用如下公式计算：

其中，

用于指示真实偏好，该

为用户

对物品

的预测偏好，

用于指示用户

对假反例

的预测偏好。

同时，该终端设备在训练时可以采用梯度下降法进行训练，也可以采用其他方法进行训练，比如最小化损失函数进行训练，具体此处不做限定。

704、利用该传播消息和该第一图神经网络得到该对象节点的第一嵌入表示以及该资源节点的第二嵌入表示。

在该终端设备在训练好该第一图神经网络之后，将该二部图输入该第一图神经网络得到该二部图中各个对象节点的第一嵌入表示和该资源节点的第二嵌入表示。

705、根据该第一嵌入表示和该第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点。

本实施例中，该终端设备将根据该第一嵌入表示和该第二嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；将该余弦距离输入激活函数得到该第一预测分数。

而为了进行资源信息推荐，则该第二资源信息应该是与该目标对象未产生过历史交互行为的资源信息。一种示例性方案中，如图5所示的二部图中，若该终端设备为该用户1进行推荐，则该终端设备应该计算用户1与视频1和视频2的预测分数。

706、根据该第一预测分数向该目标对象推荐该第二资源信息。

本实施例中，该终端设备在获取到目标对象与该第二资源信息中的各个资源信息的预测分数之后，根据该第二资源信息中的各个资源信息的预测分数对该第二资源信息中的各个资源信息进行排序，然后将该第二资源信息中的各个资源信息推荐给用户的终端设备，并展示。可以理解的是，本实施例中终端设备可以按照用户在训练第一图神经网络时的设置规则根据预测分数对该待推荐对象进行排序。比如，在训练第一图神经网络时设置评分越低的为喜欢，则该终端设备按照预测分数由低到高对该第二资源信息中的各个资源信息进行排序。若在训练第一图神经网络时设置评分越高的为喜欢，则该终端设备按照预测分数由高到低对该第二资源信息中的各个资源信息进行排序。

在图5所示的应用场景下，若该用户1与视频1和视频2的预测分数分别为：85和90。且该图5所示的应用场景下，预测分数越高，表示用户对其产生正面反馈的概率越高，此时该推荐界面中视频的推荐排序可以如图7a所示，其中，视频2排序在推荐界面的最前面，然后再推荐该视频1。

可以理解的是，本申请提供的技术方案也可以应用于游戏信息推荐。一种示例性方案中，该二部图如图7b所示，用于指示用户与游戏信息的关联关系。若该终端设备为该用户2进行推荐，则该终端设备应该计算用户2与游戏信息1以及游戏信息4的预测分数。若该用户2与游戏信息1和游戏信息4的预测分数分别为：80和70。且该图7b所示的应用场景下，预测分数越高，表示用户对其产生正面反馈的概率越高，此时该推荐界面中游戏信息的推荐排序可以如图7c所示，其中，游戏信息1排序在推荐界面的最前面，然后再推荐该游戏信息4。

本申请以一个具体的离线实验对本申请提供的技术方案的有益效果进行说明。本申请中离线实验采用的是信息推荐领域最主流的数据集 MovieLens-1M，该数据集包含6040个用户以及3952个电影（资源信息），然后共有1000209 条用户对电影的评分，评分为0到5的整数，我们将高于3分的视为正面反馈，低于3分的评分视为负面反馈，同时去掉所有评分为3分的打分。最后我们随机抽取 80% 的打分用于构造有符号二部图作为训练，剩余的 20% 用作预测任务来计算测试结果。对于性能指标，我们采用AUC，同时AUC增益绝对量是本发明的测试AUC减去对比方法的测试AUC的值。实验结果可以如表1所示：

表1

方法名称	测试 AUC	AUC 增益绝对量
			LR	0.7716	+0.1151
FM	0.8252	+0.0615
			AFM	0.8227	+0.0640
NFM	0.8357	+0.0510
			HOFM	0.8304	+0.0563
DeepCrossing	0.8448	+0.0419
			CrossNet	0.7968	+0.0899
xDeepFM	0.8286	+0.0581
			AutoInt	0.8456	+0.0411
Fi-GNN	0.8462	+0.0405
			InterHAt	0.8421	+0.0446
GraphFM	0.8535	+0.0332
			本申请提供的方案	0.8867	+0.0000

从结果可以看出，本申请提供的技术方案相比对比方法，在公开数据集上的性能提升明显。

本申请中还可以提供另一个信息推荐方法，其同样可以应用于如图1所示的系统架构中，在一些实施例中，服务器300可以与该终端设备100联合执行本申请实施例提供的信息推荐方法，本实施例中，该其具体流程可以如下：从终端设备100和/或数据库400中获取对象对资源信息产生的历史交互行为，并建立初始图神经网络模型；该服务器300根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系（本申请中也称为边），该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈；利用该第一二部图中的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图中的关联关系训练第二初始图神经网络得到第二图神经网络。本申请中该服务器300在训练该第一图神经网络时可以利用该二部图中的产生了历史交互行为的对象和资源信息的真实偏好与该服务器300预测得到的预测偏好计算损失值，然后基于该损失值训练该第一初始图神经网络得到该第一图神经网络；基于该损失值训练该第二初始图神经网络得到该第二图神经网络；然后该服务器300再基于该第一图神经网络计算第一二部图中各个对象和资源信息的嵌入表示，并利用该第二图神经网络计算第二二部图中各个对象和资源信息的嵌入表示；然后将第一二部图中各个对象和资源信息的嵌入表示和该第二二部图中各个对象和资源信息的嵌入表示进行融合得到各个对象和资源信息的最终嵌入表示；最后根据各个对象和资源信息的最终嵌入表示计算该二部图中未产生历史交互行为的对象与资源信息之间的预测分数；最后该服务器300根据该预测分数向该终端设备100进行资源信息推荐，以使终端设备100在图形界面110（示例性示出了图形界面1101和图形界面1102）中显示推荐出来的资源信息。

在另一个实施例中，终端设备100可以与该终端设备100联合执行本申请实施例提供的信息推荐方法，本实施例中，该其具体流程可以如下：从终端设备100和/或数据库400中获取对象对资源信息产生的历史交互行为，并建立初始图神经网络模型；该终端设备100根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系（本申请中也称为边），该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈；利用该第一二部图中的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图中的关联关系训练第二初始图神经网络得到第二图神经网络。本申请中该终端设备100在训练该第一图神经网络时可以利用该二部图中的产生了历史交互行为的对象和资源信息的真实偏好与该终端设备100预测得到的预测偏好计算损失值，然后基于该损失值训练该第一初始图神经网络得到该第一图神经网络；基于该损失值训练该第二初始图神经网络得到该第二图神经网络；然后该终端设备100再基于该第一图神经网络计算第一二部图中各个对象和资源信息的嵌入表示，并利用该第二图神经网络计算第二二部图中各个对象和资源信息的嵌入表示；然后将第一二部图中各个对象和资源信息的嵌入表示和该第二二部图中各个对象和资源信息的嵌入表示进行融合得到各个对象和资源信息的最终嵌入表示；最后根据各个对象和资源信息的最终嵌入表示计算该二部图中未产生历史交互行为的对象与资源信息之间的预测分数；最后该终端设备100根据该预测分数向该终端设备100进行资源信息推荐，以使终端设备100在图形界面110（示例性示出了图形界面1101和图形界面1102）中显示推荐出来的资源信息。

基于上述方案，具体请参阅图8所示，本申请中信息推荐方法的一个执行流程可以如下：

步骤1、获取对象对资源信息的评分信息，构造评分矩阵（或者说是有符号图的邻接矩阵）。本申请中，该评分信息可用于指示该对象对资源信息的历史交互信息。比如对于视频推荐来说，包括用户1至用户5，视频1至视频4；其中，用户1未点击视频1和视频2，点击视频3，并给视频评分为5分，点击视频4，并给视频评分1分；用户2未点击视频1和视频4，点击视频2，并给视频评分为1分，点击视频3，并给视频评分4分；用户3未点击视频2和视频3，点击视频1，并给视频评分为2分，点击视频4，并给视频评分5分；用户4未点击视频1和视频4，点击视频2，并给视频评分为5分，点击视频3，并给视频评分1分；用户5未点击视频3和视频4，点击视频1，并给视频评分为5分，点击视频2，并给视频评分4分。此时该用户与视频之间的评分矩阵可以如图4所示。其中，该+1用于指示用户对该视频进行点击，且评分超过3分；该-1用于指示用户点击视频，但评分低于3分；0用于指示用户用户未点击视频。

步骤2、根据该有符号图的邻接矩阵构建第一二部图和第二二部图。一个示例性方案中，基于图4所示的邻接矩阵，构建如图9和图10所示的二部图。其中+1表示为正边，-1表示为负边；0表示无历史交互行为。

步骤3、将对象初始嵌入表示和资源初始嵌入表示输入第一有符号图神经网络得到对象正面嵌入表示和资源正面嵌入表示，将对象初始嵌入表示和资源初始嵌入表示输入第二有符号图神经网络得到对象负面嵌入表示和资源负面嵌入表示。

步骤4、根据对象正面嵌入表示和对象负面嵌入表示得到对象最终嵌入表示，并根据资源正面嵌入表示和资源负面嵌入表示得到资源最终嵌入表示。

步骤5、根据对象最终嵌入表示和资源最终嵌入表示计算对象与资源信息之间余弦距离，然后将该余弦距离输入至激活函数得到对象对资源信息的预测分数。

步骤6、根据预测分数向对象推荐资源信息。

基于图8所示的流程图，该信息推荐方法的框架图可以如图11所示。

基于上述描述，下面以终端设备为执行主体对本申请信息推荐方法进行说明，如图12所示，本申请实施例中信息推荐方法的一个实施例包括：

1201、根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈。

终端设备获取对象对资源信息的评分信息，构造评分矩阵（或者说是有符号图的邻接矩阵），然后再根据该评分矩阵构建该二部图，其中，该二部图中图节点分别为该对象对应的对象节点和该资源信息对应的资源节点，而该二部图中的边用于指示该对象节点与该资源节点之间的关联关系，本实施例中，该二部图中的边即包括正面反馈也包括负面反馈。一个示例性方案中，该终端设备构建该第一二部图和第二二部图的过程可以如上述图4、图9以及图10所示，具体此处不再赘述。

1202、利用该第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络。

本实施例中，该第一二部图中仅有该对象至该资源信息的正向传播消息，该第二二部图中仅有该对象至该资源信息的负向传播消息，除此之外，该第一二部图与该第二二部图的训练方式可以与该步骤703类似，具体此处不再赘述。

1203、利用该第一图神经网络得到该第一二部图中全部对象的第一嵌入表示以及该第一二部图中全部资源信息的第二嵌入表示，并利用该第二图神经网络得到该第二二部图中全部对象的第三嵌入表示以及该第二二部图中全部资源信息的第四嵌入表示。

本实施例中，在训练好该第一图神经网络和第二图神经网络之后，将该第一二部图输入该第一图神经网络得到该第一二部图中各个对象节点的第一嵌入表示和该资源节点的第二嵌入表示，并该第二二部图输入该第二图神经网络得到该第二二部图中全部对象的第三嵌入表示以及该第二二部图中全部资源信息的第四嵌入表示。

1204、将该第一嵌入表示与该第三嵌入表示进行融合得到该对象节点的对象嵌入表示，并将该第二嵌入表示与该第四嵌入表示进行融合得到该资源节点的资源嵌入表示。

本实施例中，第一二部图在通过该第一图神经网络之后可以得到每个对象的第一嵌入表示

，每个资源信息的第二嵌入表示

；同时第二二部图在通过该第二图神经网络之后可以得到每个对象的第三嵌入表示

，以及每个资源信息的第四嵌入表示

。最后终端设备将每个对象的第一二部图通过第一图神经网络得到的嵌入表示和第二二部图通过第二图神经网络得到的嵌入表示进行融合，得到对象的对象嵌入表示

；将每个资源信息的第一二部图通过第一图神经网络得到的嵌入表示和第二二部图通过第二图神经网络得到的嵌入表示进行融合，得到资源信息的资源嵌入表示

。其具体表示可以如下：

其中

是可学习参数矩阵，

可学习参数向量。

1205、根据该对象嵌入表示和该资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点。

本实施例中，该终端设备将根据该对象嵌入表示和该资源嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；将该余弦距离输入激活函数得到该第一预测分数。

而为了进行资源信息推荐，则该第二资源信息应该是与该目标对象未产生过历史交互行为的资源信息。一种示例性方案中，如图5所示的二部图中，若该终端设备为该用户1进行推荐，则该终端设备应该计算用户1与视频1以及视频2的预测分数。

1206、根据该第一预测分数向该目标对象推荐该第二资源信息。

可以理解的是，本申请提供的技术方案也可以应用于游戏信息推荐。一种示例性方案中，该二部图如图7b所示，用于指示用户与游戏信息的关联关系。若该终端设备为该用户2进行推荐，则该终端设备应该计算用户2与游戏信息1以及游戏信息4的预测分数。若该用户2与视频1和视频2的预测分数分别为：80和70。且该图7b所示的应用场景下，预测分数越高，表示用户对其产生正面反馈的概率越高，此时该推荐界面中游戏信息的推荐排序可以如图7c所示，其中，游戏信息1排序在推荐界面的最前面，然后再推荐该游戏信息4。

下面对本申请中的信息推荐装置进行详细描述，请参阅图13，图13为本申请实施例中信息推荐装置的一个实施例示意图，信息推荐装置20包括：

生成模块201，用于根据对象对资源信息产生的历史交互行为构建二部图，其中，该二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该关联关系用于指示该对象节点与该资源信息节点之间的正面反馈和负面反馈；

确定模块202，用于根据该二部图的关联关系确定该对象节点与该资源节点之间传播消息，该传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；

训练模块203，用于利用该传播消息和该关联关系训练初始图神经网络得到第一图神经网络；

处理模块204，用于利用该传播消息和该第一图神经网络得到该对象节点的第一嵌入表示以及该资源节点的第二嵌入表示；根据该第一嵌入表示和该第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；

输出模块205，用于根据该第一预测分数向该目标对象推荐该第二资源信息。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，构建有符号的二部图，并基于有符号图的平衡理论获取到该二部图多种传播消息，即从单一的对象至资源信息的传播消息增加到对象至资源信息的传播消息、对象至对象的传播消息、资源信息至资源信息的传播消息，从而增加了该图神经网络在进行训练以及预测时的数据输入，并充分考虑了对象与资源信息之间的正面反馈和负面反馈，使得该图神经网络在进行信息推荐时可以参考更多的信息，从而提高信息推荐的精确度。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该初始图神经网络包括N层消息传播层，该N为大于1的正整数，该训练模块203，具体用于随机生成该对象节点的第一初始嵌入表示和该资源节点的第二初始嵌入表示；

根据该第二预测分数和该关联关系计算第一损失值；

本申请实施例中，提供了一种信息推荐装置。采用上述装置，在通过初始图神经网络的多个消息传播层对该对象和资源信息的传播消息进行聚合和更新，从而增加了该图神经网络在进行训练以及预测时的数据输入，使得该图神经网络在进行信息推荐时可以参考更多的信息，从而提高信息推荐的精确度。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该N层消息传播层均包括消息函数、消息聚合函数和消息更新函数，该训练模块203，具体用于将该第一初始嵌入表示和该第一初始嵌入表示输入第一层消息传播层，根据该第一初始嵌入表示、该第一初始嵌入表示以及该传播消息得到该对象节点和该资源节点对应的第一消息函数表示；

本申请实施例中，提供了一种信息推荐装置。采用上述装置，基于有符号图的平衡理论获取到该二部图多种传播消息，即从单一的对象至资源信息的传播消息增加到对象至资源信息的传播消息、对象至对象的传播消息、资源信息至资源信息的传播消息，从而增加了该图神经网络在进行训练以及预测时的数据输入，使得该图神经网络在进行信息推荐时可以参考更多的信息，从而提高信息推荐的精确度。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该处理模块204，具体用于根据该关联关系从该第二预测分数中获取第三预测分数，该第三预测分数为该二部图中存在关联关系的对象节点与资源节点对应的预测分数；

本申请实施例中，提供了一种信息推荐装置。采用上述装置，提供了新的有符号对比损失函数，使得该图神经网络的训练可以更加快速的实现收敛，提高数据处理效率。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该训练模块203，具体用于根据该第一损失值和梯度下降法训练该初始图神经网络得到该第一图神经网络。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，这样可以增加了方案的可实行性。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，在通过初始图神经网络的多个消息传播层对该对象和资源信息的传播消息进行聚合和更新，从而增加了该图神经网络在进行训练以及预测时的数据输入，使得该图神经网络在进行信息推荐时可以参考更多的信息，从而提高信息推荐的精确度。同时在训练过程中增加假反例资源节点的嵌入表示，这样增加了训练过程中的噪声，使得该图神经网络可以更精确的区分该正面反馈和负面反馈，从而提高图神经网络的推荐精确度。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该训练模块203，具体用于根据该关联关系从该第二预测分数中获取第三预测分数，该第三预测分数为该二部图中存在关联关系的对象节点与资源节点对应的预测分数；

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该处理模块204，具体用于根据该第一嵌入表示和该第二嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；

将该余弦距离输入激活函数得到该第一预测分数。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，利用余弦距离和激活函数计算该预测分数，提高该方案的可实行性。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该生成模块201，具体用于获取该对象对该资源信息的评分信息，该评分信息作为该历史交互行为；

根据该评分信息构建该对象与该资源信息之间的关系矩阵；

根据该关系矩阵构建该二部图。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，细化了构建二部图的应用场景，即可以由评分场景转化为二部图，从而扩展方案的应用场景。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该确定模块202，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点时，确定该第一对象节点至该第一资源节点的传播消息为正面反馈传播消息以及该第一资源节点至该第一对象节点的传播消息为正面反馈传播消息；

本申请实施例中，提供了一种信息推荐装置。采用上述装置，细化有符号图的平衡理论的具体情况，从而提升方案的可行性和可操作性。

可选地，在上述图13所对应的实施例的基础上，本申请实施例提供的信息推荐装置20的另一实施例中，该确定模块202，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过正面反馈传递至该第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为正面反馈传播消息；

或者，

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块202，具体用于在该二部图中的关联关系指示第一对象节点的消息通过正面反馈传递至第一资源节点，且该第一资源节点的消息再通过负面反馈传递至该二部图中的第二对象节点时，确定该第一对象节点至第二对象节点的传播消息为负面反馈传播消息；

或者，

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块202，具体用于在该二部图中的关联关系指示第一资源节点的消息通过正面反馈传递至第一对象节点，且该第一对象节点的消息再通过负面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为负面反馈消息；

或者，

在一种可能的设计中，在本申请实施例的另一方面的另一种实现方式中，该确定模块202，具体用于在该二部图中的关联关系指示第一资源节点的消息通过正面反馈传递至第一对象节点，且该第一对象节点的消息再通过正面反馈传递至该二部图中的第二资源节点时，确定该第一资源节点与该第二资源节点之间的传播消息为正面反馈消息；

或者，

请参阅图14，图14为本申请实施例中信息推荐装置的一个实施例示意图，信息推荐装置30包括：

生成模块301，用于根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，该第一二部图和该第二二部图包括图节点和关联关系，该图节点的节点类型包括标识该对象的对象节点和标识该资源信息的资源节点，该第一二部图中的关联关系用于指示该对象节点与该资源信息节点之间的正面反馈，该第二二部图中的关联关系用于指示该对象节点与该资源信息节点之间的负面反馈；

训练模块302，用于利用该第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用该第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络；

处理模块303，用于利用该第一图神经网络得到该第一二部图中全部对象的第一嵌入表示以及该第一二部图中全部资源信息的第二嵌入表示，并利用该第二图神经网络得到该第二二部图中全部对象的第三嵌入表示以及该第二二部图中全部资源信息的第四嵌入表示；将该第一嵌入表示与该第三嵌入表示进行融合得到该对象节点的对象嵌入表示，并将该第二嵌入表示与该第四嵌入表示进行融合得到该资源节点的资源嵌入表示；根据该对象嵌入表示和该资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，该第二资源信息为该二部图中未与该目标对象产生历史交互行为的资源信息，该目标对象包含于该二部图的对象节点；

输出模块304，用于根据该第一预测分数向该目标对象从该第二资源信息中推荐第三资源信息。

本申请实施例中，提供了一种信息推荐装置。采用上述装置，根据历史交互行为构建正二部图和负号二部图，并分别训练正二部图对应的图神经网络以及负二部图对应图神经网络，然后再对其嵌入表示进行融合，这样可以使得对象与资源信息之间的嵌入表示更丰富，从而提高信息推荐的精确度。

可选地，在上述图14所对应的实施例的基础上，本申请实施例提供的信息推荐装置30的另一实施例中，该处理模块303，具体用于将该对象嵌入表示和该资源嵌入表示计算得到该目标对象和该第二资源信息之间的余弦距离；

将该余弦距离输入激活函数得到该第一预测分数。

本申请提供的信息推荐装置可用于服务器，请参阅图15，图15是本申请实施例提供的一种服务器结构示意图，该服务器300可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器（central processing units，CPU）322（例如，一个或一个以上处理器）和存储器332，一个或一个以上存储应用程序342或数据344的存储介质330（例如一个或一个以上海量存储设备）。其中，存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器322可以设置为与存储介质330通信，在服务器300上执行存储介质330中的一系列指令操作。

服务器300还可以包括一个或一个以上电源326，一个或一个以上有线或无线网络接口350，一个或一个以上输入输出接口358，和/或，一个或一个以上操作系统341，例如Windows Server^TM，Mac OS X^TM，Unix^TM, Linux^TM，FreeBSD^TM等等。

上述实施例中由服务器所执行的步骤可以基于该图15所示的服务器结构。

本申请提供的信息推荐装置可用于终端设备，请参阅图16，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。在本申请实施例中，以终端设备为智能手机为例进行说明：

图16示出的是与本申请实施例提供的终端设备相关的智能手机的部分结构的框图。参考图16，智能手机包括：射频（radio frequency，RF）电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、无线保真（wireless fidelity，WiFi）模块470、处理器480、以及电源490等部件。本领域技术人员可以理解，图16中示出的智能手机结构并不构成对智能手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图16对智能手机的各个构成部件进行具体的介绍：

RF电路410可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器480处理；另外，将设计上行的数据发送给基站。RF电路410还可以通过无线通信与网络和其他设备通信。

存储器420可用于存储软件程序以及模块，处理器480通过运行存储在存储器420的软件程序以及模块，从而执行智能手机的各种功能应用以及数据处理。

输入单元430可用于接收输入的数字或字符信息，以及产生与智能手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元430可包括触控面板431以及其他输入设备432。触控面板431，也称为触摸屏，可收集用户在其上或附近的触摸操作（比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作），并根据预先设定的程式驱动相应的连接装置。除了触控面板431，输入单元430还可以包括其他输入设备432。具体地，其他输入设备432可以包括但不限于物理键盘、功能键（比如音量控制按键、开关按键等）、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元440可用于显示由用户输入的信息或提供给用户的信息以及智能手机的各种菜单。显示单元440可包括显示面板441。进一步的，触控面板431可覆盖显示面板441，当触控面板431检测到在其上或附近的触摸操作后，传送给处理器480以确定触摸事件的类型，随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图16中，触控面板431与显示面板441是作为两个独立的部件来实现智能手机的输入和输入功能，但是在某些实施例中，可以将触控面板431与显示面板441集成而实现智能手机的输入和输出功能。

智能手机还可包括至少一种传感器450，比如光传感器、运动传感器以及其他传感器。

音频电路460、扬声器461，传声器462可提供用户与智能手机之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号，传输到扬声器461，由扬声器461转换为声音信号输出；另一方面，传声器462将收集的声音信号转换为电信号，由音频电路460接收后转换为音频数据，再将音频数据输出处理器480处理后，经RF电路410以发送给比如另一智能手机，或者将音频数据输出至存储器420以便进一步处理。

WiFi属于短距离无线传输技术，智能手机通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图16示出了WiFi模块470，但是可以理解的是，其并不属于智能手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器480是智能手机的控制中心，利用各种接口和线路连接整个智能手机的各个部分，通过运行或执行存储在存储器420内的软件程序和/或模块，以及调用存储在存储器420内的数据，执行智能手机的各种功能和处理数据，从而对智能手机进行整体监测。

智能手机还包括给各个部件供电的电源490（比如电池），可选的，电源可以通过电源管理系统与处理器480逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出，智能手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

上述实施例中由终端设备所执行的步骤可以基于该图16所示的终端设备结构。

本申请实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如前述各个实施例描述的方法。

本申请实施例中还提供一种包括程序的计算机程序产品，当其在计算机上运行时，使得计算机执行前述各个实施例描述的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（read-only memory，ROM）、随机存取存储器（random access memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种信息推荐方法，其特征在于，包括：

根据对象对资源信息产生的历史交互行为构建二部图，其中，所述二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述资源信息的资源节点，所述关联关系用于指示所述对象节点与所述资源信息节点之间的正面反馈和负面反馈；

根据所述二部图的关联关系确定所述对象节点与所述资源节点之间传播消息，所述传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；

利用所述传播消息和所述关联关系训练初始图神经网络得到第一图神经网络；

利用所述传播消息和所述第一图神经网络得到所述对象节点的第一嵌入表示以及所述资源节点的第二嵌入表示；

根据所述第一嵌入表示和所述第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，所述第二资源信息为所述二部图中未与所述目标对象产生历史交互行为的资源信息，所述目标对象包含于所述二部图的对象节点；

根据所述第一预测分数向所述目标对象推荐所述第二资源信息。

2.根据权利要求1所述的方法，其特征在于，所述初始图神经网络包括N层消息传播层，所述N为大于1的正整数，所述利用所述传播消息和所述关联关系训练初始图神经网络得到第一图神经网络包括：

随机生成所述对象节点的第一初始嵌入表示和所述资源节点的第二初始嵌入表示；

将所述第一初始嵌入表示、所述第二初始嵌入表示和所述传播消息输入所述N层消息传播层得到所述对象节点的第三嵌入表示和所述资源节点的第四嵌入表示；

根据所述第三嵌入表示和所述第四嵌入表示计算所述对象节点对所述资源节点的第二预测分数；

根据所述第二预测分数和所述关联关系计算第一损失值；

根据所述第一损失值训练所述初始图神经网络得到所述第一图神经网络。

3.根据权利要求2所述的方法，其特征在于，所述N层消息传播层均包括消息函数、消息聚合函数和消息更新函数，所述将所述第一初始嵌入表示、所述第二初始嵌入表示和所述传播消息输入所述N层消息传播层得到所述对象节点的第三嵌入表示和所述资源节点的第四嵌入表示包括：

将所述第一初始嵌入表示和所述第一初始嵌入表示输入第一层消息传播层，根据所述第一初始嵌入表示、所述第一初始嵌入表示以及所述传播消息得到所述对象节点和所述资源节点对应的第一消息函数表示；

根据所述第一层消息传播层的消息聚合函数和所述第一消息函数表示得到所述对象节点和所述资源节点对应的第一聚合表示；

根据所述第一层消息传播层的消息更新函数和所述第一聚合表示得到所述对象节点的第一中间嵌入表示和所述资源节点的第二中间嵌入表示；

将所述第一中间嵌入表示和所述第二中间嵌入表示输入第二层消息传播层，根据所述第一中间嵌入表示、所述第一中间嵌入表示以及所述传播消息得到所述对象节点和所述资源节点对应的第二消息函数表示；

根据所述第二层消息传播层的消息聚合函数和所述第二消息函数表示得到所述对象节点和所述资源节点对应的第二聚合表示；

根据所述第二层消息传播层的消息更新函数和所述第二聚合表示得到所述对象节点的第三中间嵌入表示和所述资源节点的第四中间嵌入表示；

依此类推，执行完所述N层消息传播层得到所述二部图中各个对象节点的第三嵌入表示和所述二部图中各个资源节点的第四嵌入表示。

4.根据权利要求2所述的方法，其特征在于，所述根据所述第二预测分数和所述关联关系计算第一损失值包括：

根据所述关联关系从所述第二预测分数中获取第三预测分数，所述第三预测分数为所述二部图中存在关联关系的对象节点与资源节点对应的预测分数；

根据所述关联关系和所述第三预测分数利用有符号对比损失函数计算所述第一损失值。

5.根据权利要求2所述的方法，其特征在于，所述根据所述第一损失值训练所述初始图神经网络得到所述第一图神经网络包括：

根据所述第一损失值和梯度下降法训练所述初始图神经网络得到所述第一图神经网络。

6.根据权利要求1所述的方法，其特征在于，所述初始图神经网络包括N层消息传播层，所述N为大于1的正整数，所述利用所述传播消息和所述关联关系训练初始图神经网络得到第一图神经网络包括：

基于所述第四嵌入表示随机采样生成M个假反例资源节点的第五嵌入表示；

根据所述第三嵌入表示和所述第四嵌入表示计算所述对象节点对所述资源节点的第二预测分数，并根据所述第三嵌入表示和所述第五嵌入表示计算所述对象节点对所述假反例资源节点的第四预测分数；

根据所述第二预测分数、所述第四预测分数和所述关联关系计算第二损失值；

根据所述第二损失值训练所述初始图神经网络得到所述第一图神经网络。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第二预测分数、所述第三预测分数和所述关联关系计算第二损失值包括：

根据所述第三预测分数、所述第四预测分数和所述关联关系利用有符号对比损失函数计算所述第二损失值。

8.根据权利要求1至7中任一项所述的方法，其特征在于，所述根据所述第一嵌入表示和所述第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数包括：

根据所述第一嵌入表示和所述第二嵌入表示计算得到所述目标对象和所述第二资源信息之间的余弦距离；

将所述余弦距离输入激活函数得到所述第一预测分数。

9.根据权利要求1至7中任一项所述的方法，其特征在于，根据对象对资源信息产生的历史交互行为构建二部图包括：

获取所述对象对所述资源信息的评分信息，所述评分信息作为所述历史交互行为；

根据所述评分信息构建所述对象与所述资源信息之间的关系矩阵；

根据所述关系矩阵构建所述二部图。

10.一种信息推荐方法，其特征在于，包括：

根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，所述第一二部图和所述第二二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述资源信息的资源节点，所述第一二部图中的关联关系用于指示所述对象节点与所述资源信息节点之间的正面反馈，所述第二二部图中的关联关系用于指示所述对象节点与所述资源信息节点之间的负面反馈；

利用所述第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用所述第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络；

利用所述第一图神经网络得到所述第一二部图中全部对象的第一嵌入表示以及所述第一二部图中全部资源信息的第二嵌入表示，并利用所述第二图神经网络得到所述第二二部图中全部对象的第三嵌入表示以及所述第二二部图中全部资源信息的第四嵌入表示；

将所述第一嵌入表示与所述第三嵌入表示进行融合得到所述对象节点的对象嵌入表示，并将所述第二嵌入表示与所述第四嵌入表示进行融合得到所述资源节点的资源嵌入表示；

根据所述对象嵌入表示和所述资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，所述第二资源信息为所述二部图中未与所述目标对象产生历史交互行为的资源信息，所述目标对象包含于所述二部图的对象节点；

11.根据权利要求10所述的方法，其特征在于，所述根据所述对象嵌入表示和所述资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数包括：

将所述对象嵌入表示和所述资源嵌入表示计算得到所述目标对象和所述第二资源信息之间的余弦距离；

将所述余弦距离输入激活函数得到所述第一预测分数。

12.一种信息推荐装置，其特征在于，包括：

生成模块，用于根据对象对资源信息产生的历史交互行为构建二部图，其中，所述二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述资源信息的资源节点，所述关联关系用于指示所述对象节点与所述资源信息节点之间的正面反馈和负面反馈；

确定模块，用于根据所述二部图的关联关系确定所述对象节点与所述资源节点之间传播消息，所述传播消息包括对象节点与对象节点的正面传播消息和负面传播消息、对象节点与资源节点的正面传播消息和负面传播消息、资源节点对资源节点的正面传播消息和负面传播消息以及资源节点与对象节点的正面传播消息和负面传播消息；

训练模块，用于利用所述传播消息和所述关联关系训练初始图神经网络得到第一图神经网络；

处理模块，用于利用所述传播消息和所述第一图神经网络得到所述对象节点的第一嵌入表示以及所述资源节点的第二嵌入表示；根据所述第一嵌入表示和所述第二嵌入表示计算得到目标对象对第二资源信息的第一预测分数，所述第二资源信息为所述二部图中未与所述目标对象产生历史交互行为的资源信息，所述目标对象包含于所述二部图的对象节点；

输出模块，用于根据所述第一预测分数向所述目标对象推荐所述第二资源信息。

13.一种信息推荐装置，其特征在于，包括：

生成模块，用于根据对象对资源信息产生的历史交互行为构建第一二部图和第二二部图，其中，所述第一二部图和所述第二二部图包括图节点和关联关系，所述图节点的节点类型包括标识所述对象的对象节点和标识所述资源信息的资源节点，所述第一二部图中的关联关系用于指示所述对象节点与所述资源信息节点之间的正面反馈，所述第二二部图中的关联关系用于指示所述对象节点与所述资源信息节点之间的负面反馈；

训练模块，用于利用所述第一二部图的关联关系训练第一初始图神经网络得到第一图神经网络，并利用所述第二二部图的关联关系训练第二初始图神经网络得到第二图神经网络；

处理模块，用于利用所述第一图神经网络得到所述第一二部图中全部对象的第一嵌入表示以及所述第一二部图中全部资源信息的第二嵌入表示，并利用所述第二图神经网络得到所述第二二部图中全部对象的第三嵌入表示以及所述第二二部图中全部资源信息的第四嵌入表示；将所述第一嵌入表示与所述第三嵌入表示进行融合得到所述对象节点的对象嵌入表示，并将所述第二嵌入表示与所述第四嵌入表示进行融合得到所述资源节点的资源嵌入表示；根据所述对象嵌入表示和所述资源嵌入表示计算得到目标对象对第二资源信息的第一预测分数，所述第二资源信息为所述二部图中未与所述目标对象产生历史交互行为的资源信息，所述目标对象包含于所述二部图的对象节点；

14.一种计算机设备，其特征在于，包括：存储器、处理器以及总线系统；

其中，所述存储器用于存储程序；

所述处理器用于执行所述存储器中的程序，所述处理器用于根据程序代码中的指令执行权利要求1至9或者10至11中任一项所述的方法；

所述总线系统用于连接所述存储器以及所述处理器，以使所述存储器以及所述处理器进行通信。

15.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至9或者10至11中任一项所述的方法。