CN113742561B

CN113742561B - 视频推荐方法、装置、电子设备及存储介质

Info

Publication number: CN113742561B
Application number: CN202010460801.1A
Authority: CN
Inventors: 白明
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2020-05-27
Filing date: 2020-05-27
Publication date: 2024-01-02
Anticipated expiration: 2040-05-27
Also published as: CN113742561A

Abstract

本公开关于一种视频推荐方法、装置、电子设备及存储介质，其中该方法包括：获取目标账户的账户属性信息；对账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息；确定候选视频集合中各候选视频的视频属性信息、与候选视频存在交互行为的交互账户以及交互账户属性信息；根据候选视频、视频属性信息、交互账户以及交互账户属性信息，确定用于表示候选视频的视频特征信息；根据各候选视频的视频特征信息以及目标账户的账户特征信息，从候选视频集合中确定用于向目标账户推荐的目标视频。从而实现根据已有交互账户的视频交互数据，为新用户进行视频推荐，提高对新账户的冷启动推荐的准确率。

Description

视频推荐方法、装置、电子设备及存储介质

技术领域

本公开涉及数据处理技术，尤其涉及一种视频推荐方法、装置、电子设备及存储介质。

背景技术

互联网的出现和普及给用户带来了大量的信息，满足了用户在信息时代对信息的需求，但随着网络的迅速发展而带来的网上信息量的大幅增长，使得用户在面对大量信息时无法从中获得对自己真正有用的部分，对信息的使用效率反而降低了，这就是信息超载(information overload)问题。推荐系统能够比较好地解决信息超载问题，推荐系统的目标是根据已有的信息向用户推荐用户喜欢的物品，从而促进用户与物品之间发生交互行为，如点击和收藏等等。

相关技术中，推荐系统的推荐思路是根据用户的当前背景和过去的行为向用户推荐可能会喜欢的物品。但是，如果用户过去的行为和当前的背景信息不可用，例如对于新注册的用户来说，新用户的大部分信息是无法获取的，而且无平台上的交互行为信息，所以，在这种情况下，推荐系统对于新用户的信息推荐精确率较低。

发明内容

本公开提供一种视频推荐方法及装置，以至少解决相关技术中为新用户进行视频推荐时导致的推荐困难，推荐准确率较低的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种视频推荐方法，包括：

获取目标账户的账户属性信息，其中，所述目标账户为在当前平台未发生视频交互行为的账户或者发生的视频交互行为不满足预设条件的账户；

对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息；

确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息；

根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息；

根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频。

可选地，所述对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息的步骤包括：根据所述目标账户以及所述目标账户的账户属性信息，构建账户属性异构图，所述账户属性异构图中包括目标账户节点以及账户属性信息节点；

将所述账户属性异构图输入至已训练的第一图卷积神经网络模型，在所述第一图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第一特征向量，对不同类型的节点的值进行联合卷积操作，获得第二特征向量，并对所述第一特征向量及所述第二特征向量进行降维处理，输出账户特征信息。

可选地，所述目标账户节点采用由所述目标账户经由已有模型训练后的向量来表示；

所述账户属性信息节点由所述账户属性信息表示，或者，由所述账户属性信息经由已有模型训练后的向量来表示，或者由所述账户属性信息以及所述账户属性信息经由已有模型训练后的向量进行联合表示。

可选地，所述第一图卷积神经网络模型采用如下方式训练得到：

确定多个样本账户，所述样本账户为在当前平台存在视频交互行为的注册账户；

获取各样本账户对应的样本账户属性信息；

根据所述样本账户以及对应的样本账户属性信息构建样本账户属性异构图；

采用预设的图卷积神经网络学习器对所述样本账户属性异构图进行学习，生成第一图卷积神经网络模型。

可选地，所述根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息的步骤包括：

根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，构建视频账户属性异构图，所述视频账户属性异构图中包括视频标识节点、视频属性信息节点、交互账户节点以及交互账户属性信息节点；

将所述视频账户属性异构图输入至已训练的第二图卷积神经网络模型，在所述第二图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第三特征向量，对不同类型的节点的值进行联合卷积操作，获得第四特征向量，并对所述第三特征向量及所述第四特征向量进行降维处理，输出视频特征信息。

可选地，所述交互账户节点采用由所述交互账户经由已有模型训练后的向量来表示；

所述视频标识节点采用由所述视频标识经由已有模型训练后的向量来表示；

所述交互账户属性信息节点由所述交互账户属性信息表示，或者，由所述交互账户属性信息经由已有模型训练后的向量来表示，或者，由所述交互账户属性信息以及所述交互账户属性信息经由已有模型训练后的向量进行联合表示；

所述视频属性信息节点由所述视频属性信息表示，或者，由所述视频属性信息经由已有模型训练后的向量来表示，或者由所述视频属性信息以及所述视频属性信息经由已有模型训练后的向量进行联合表示。

可选地，所述第二图卷积神经网络模型采用如下方式训练得到：

获取各样本账户对应的样本账户属性信息；

确定各样本账户的第一视频集合以及第二视频集合，其中，所述第一视频集合包括符合该样本账户的指定特征的视频，所述第二视频集合包括除所述符合该样本账户的指定特征的视频以外的其他视频；

获取所述第一视频集合及所述第二视频集合中各视频的属性信息，作为样本视频属性信息；

根据所述样本账户、所述第一视频集合及所述第二视频集合中各视频标识、所述样本账户属性信息以及所述样本视频属性信息构建样本账户视频属性异构图；

采用预设的图卷积神经网络学习器对所述样本账户视频属性异构图进行学习，生成第二图卷积神经网络模型。

可选地，所述确定各样本账户的第一视频集合的步骤包括：

确定所述样本账户发生交互的视频信息，所述样本账户发生交互的视频信息包括所述样本账户点击、收藏的视频信息；

根据所述样本账户以及所述视频信息构建账户视频交互异构图，所述账户视频交互异构图包括账户节点和视频标识节点；

在所述账户视频交互异构图中对所述账户节点的直接相邻节点进行采样，或者，对所述账户节点的直接相邻节点及间接相邻节点进行采样；

将获得的采样结果对应的视频组织成第一视频集合。

可选地，所述根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频的步骤包括：

将所述账户特征信息与各候选视频的视频特征信息输入至已训练的匹配模型，并获取所述匹配模型输出的所述账户特征信息与各候选视频的视频特征信息的匹配分数；

在所述候选视频集合中选取匹配分数排序在前的一个或多个候选视频作为目标视频。

根据本公开实施例的第二方面，提供一种视频推荐装置，包括：

账户属性信息获取单元，被配置为获取目标账户的账户属性信息，其中，所述目标账户为在当前平台未发生视频交互行为的账户或者发生的视频交互行为不满足预设条件的账户；

账户特征信息确定单元，被配置为对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息；

视频特征信息确定单元，被配置为确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息；并根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息；

目标视频确定单元，被配置为根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频。

可选地，所述账户特征信息确定单元包括：

账户属性异构图构建子单元，被配置为根据所述目标账户以及所述目标账户的账户属性信息，构建账户属性异构图，所述账户属性异构图中包括目标账户节点以及账户属性信息节点；

账户特征信息获取子单元，被配置为将所述账户属性异构图输入至已训练的第一图卷积神经网络模型，在所述第一图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第一特征向量，对不同类型的节点的值进行联合卷积操作，获得第二特征向量，并对所述第一特征向量及所述第二特征向量进行降维处理，输出账户特征信息。

可选地，所述装置还包括被配置为训练所述第一图卷积神经网络模型的第一模型训练单元，包括：

样本账户确定子单元，被配置为确定多个样本账户，所述样本账户为在当前平台存在视频交互行为的注册账户；

样本账户属性信息获取子单元，被配置为获取各样本账户对应的样本账户属性信息；

样本账户属性异构图构建子单元，被配置为根据所述样本账户以及对应的样本账户属性信息构建样本账户属性异构图；

第一学习子单元，被配置为采用预设的图卷积神经网络学习器对所述样本账户属性异构图进行学习，生成第一图卷积神经网络模型。

可选地，所述视频特征信息确定单元包括：

视频账户属性异构图构建子单元，被配置为根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，构建视频账户属性异构图，所述视频账户属性异构图中包括视频标识节点、视频属性信息节点、交互账户节点以及交互账户属性信息节点；

视频特征信息获取子单元，被配置为将所述视频账户属性异构图输入至已训练的第二图卷积神经网络模型，在所述第二图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第三特征向量，对不同类型的节点的值进行联合卷积操作，获得第四特征向量，并对所述第三特征向量及所述第四特征向量进行降维处理，输出视频特征信息。

可选地，所述装置还包括被配置为训练所述第二图卷积神经网络模型的第二模型训练单元，包括：

视频集合确定子单元，被配置为确定各样本账户的第一视频集合以及第二视频集合，其中，所述第一视频集合包括符合该样本账户的指定特征的视频，所述第二视频集合包括除所述符合该样本账户的指定特征的视频以外的其他视频；

样本视频属性信息获取子单元，被配置为获取所述第一视频集合及所述第二视频集合中各视频的属性信息，作为样本视频属性信息；

样本账户视频属性异构图构建子单元，被配置为根据所述样本账户、所述第一视频集合及所述第二视频集合中各视频标识、所述样本账户属性信息以及所述样本视频属性信息构建样本账户视频属性异构图；

第二学习子单元，被配置为采用预设的图卷积神经网络学习器对所述样本账户视频属性异构图进行学习，生成第二图卷积神经网络模型。

可选地，所述视频集合确定子单元还被配置为：

将获得的采样结果对应的视频组织成第一视频集合。

可选地，所述目标视频确定单元包括：

匹配分数获取子单元，被配置为将所述账户特征信息与各候选视频的视频特征信息输入至已训练的匹配模型，并获取所述匹配模型输出的所述账户特征信息与各候选视频的视频特征信息的匹配分数；

目标视频选取子单元，被配置为在所述候选视频集合中选取匹配分数排序在前的一个或多个候选视频作为目标视频。

根据本公开实施例的第三方面，提供一种存储介质，当所述存储介质中的指令由所述设备的处理器执行时，使得所述电子设备能够执行上述的方法。

根据本公开实施例的第四方面，提供一种计算机程序产品，包括可执行程序代码，其中，所述程序代码在通过上述装置执行时实施上述的方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

在本实施例中，针对当前平台无视频交互行为的目标账户或者视频交互行为不满足预设条件的目标账户，可以获取该目标账户的账户属性信息，并将账户属性信息转换成用于表示目标账户的账户特征信息。同时，确定候选视频集合中各候选视频的视频属性信息、与该候选视频存在交互行为的交互账户以及交互账户属性信息，并根据上述视频属性信息、交互账户以及交互账户属性信息确定该候选视频的视频特征信息。然后，根据各候选视频的视频特征信息以及目标账户的账户特征信息，从候选视频集合中确定用于向目标账户推荐的目标视频，从而实现根据已有交互账户的视频交互数据，为不存在视频交互行为或者发生的视频交互行为不满足预设条件的目标账户进行视频推荐，提高对目标账户的冷启动推荐的准确率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种视频推荐方法的流程图。

图2是根据一示例性实施例示出的另一种视频推荐方法的流程图。

图3是根据一示例性实施例示出的账户属性异构图示意图。

图4是根据一示例性实施例示出的降维处理示意图。

图5是根据一示例性实施例示出的第一图卷积神经网络模型生成的方法实施例流程图。

图6是根据一示例性实施例示出的视频账户属性异构图示意图。

图7是根据一示例性实施例示出的第二图卷积神经网络模型生成的方法实施例流程图。

图8是根据一示例性实施例示出的账户视频交互异构图生成示意图。

图9是根据一示例性实施例示出的一种视频推荐装置框图。

图10是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种视频推荐方法的流程图，该视频推荐方法可以应用于在视频推荐平台或视频播放平台中(下文可以称为平台)中为新用户冷启动推荐(Cold Start Recommendation，简称CSR)视频的场景，以此提高新用户在平台上的参与度和活跃度。其中，该平台可以与客户端通过网络连接。平台可以用独立的服务器或者是多个服务器组成的服务器集群来实现。该客户端所在的终端具体可以是台式终端或移动终端，移动终端具体可以包括手机、平板电脑、笔记本电脑等中的至少一种。终端可以用于播放视频、音频等的多媒体内容。

如图1所示，本实施例包括以下步骤。

在步骤S11中，获取目标账户的账户属性信息。

作为一种示例，目标账户可以为在当前平台未发生视频交互行为的账户，包括：在当前平台中新注册的账户(new user)、在当前平台未登录的注册账户、通过新的终端设备登录当前平台的账户(在当前平台没有登记新的终端设备的设备id)，等等。

在其他示例中，目标账户还可以为发生的视频交互行为不满足预设条件的账户，例如，在当前平台只有少量视频交互行为的账户(如视频交互记录低于50条)。

在实际中，对于平台而言，假如用户注册账户时提供的信息比较少，例如，只提供电话号码或邮箱地址等少量信息，而且新用户在平台上无视频交互行为信息或者只有少量的视频交互行为，在这种情况下，本实施例可以通过其他方式获取目标账户的账户属性信息来实现对新用户的冷启动推荐。

示例性地，账户属性信息至少可以包括如下的一种或结合：目标账户所在的信息点POI(Point Of Information)信息、目标账户所使用的设备的设备信息(如设备型号、设备品牌、设备子品牌等)、该设备安装的应用程序列表等。

在一种例子中，POI信息可以包括但不限于：用户所在的城市City、该城市的城市等级City_level、该城市所在的省份Province_name、用户所处的社区类型Community_type等等。在一种实现中，可以通过目标账户所在的客户端调用所处设备的定位功能来获取POI信息。

而对于目标账户所使用的设备的设备信息及该设备安装的应用程序列表app_list等信息，也可以通过目标账户所在的客户端调用设备的相关接口来获取，例如，通过调用GetAPPList()函数来获取app_list。

在步骤S12中，对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息。

在该步骤中，由于目标账户在当前平台没有视频交互行为或者已有的视频交互行为不满足预设条件，则可以通过获取账户属性信息，并对账户属性信息进行转换，以获得账户特征信息，该账户特征信息可以用来表征目标账户。

在一种实施方式中，可以将账户属性信息转换成账户属性向量，并将所有的账户属性向量作为账户特征信息。

在步骤S13中，确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息。

在一种实施方式中，候选视频集合(photo set)可以为平台在全局范围内进行搜索获取的最热门的多个视频组成的集合，其中，候选视频集合中的候选视频的数量可以根据实际需求确定，本实施例对此不作限制。本实施例从全局范围内选出候选视频集合进行推荐，可以避免全量视频推荐导致的视频数据量过大、计算资源消耗大等问题，提高视频推荐效率。

在该步骤中，针对候选视频集合中的各候选视频，可以获取各候选视频的视频属性信息、与该候选视频存在交互行为的交互账户、以及该交互账户的交互账户属性信息。

示例性地，视频属性信息可以包括但不限于：视频标签tag及视频的多模态信息等。在一种例子中，该多模态信息可以包括文本信息(如视频的评论文本数据、视频的语音文本数据等等)、视频信息(如视频封面表示、视频的所有帧表示等等)及音频信息等。

在一种实现中，可以从日志记录中查找与候选视频存在交互行为的交互账户，该交互账户的交互账户属性信息可以包括但不限于：POI信息、该交互账户所使用的设备的设备信息、该设备安装的应用程序列表等。

在步骤S14中，根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息。

在该步骤中，该视频特征信息可以用来表征候选视频。在一种实施方式中，可以将候选视频、视频属性信息、交互账户以及交互账户属性信息转换成向量，并将所有转换得到的向量作为视频特征信息。

在步骤S15中，根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频。

在一种实施方式中，可以采用相似度算法来计算各候选视频的视频特征信息以及目标账户的账户特征信息的匹配程度，本实施例对具体的相似度算法不作限定，例如可以是余弦相似度算法、欧式距离相似度算法等。

在一种例子中，匹配程度可以表示为匹配分数(matching score)，匹配分数越大，代表账户特征信息与视频特征信息的距离越近，两者越匹配。反之，匹配分数越小，代表账户特征信息与视频特征信息之间的距离越远，两者越不匹配。例如，假设匹配分数在[0,1]区间内，当账户特征信息与视频特征信息的匹配分数越接近1时，表示两者越匹配；当账户特征信息与视频特征信息的匹配分数越接近0时，表示两者越不匹配。

然后，可以将匹配分数进行排序操作(Ranking)，将匹配分数最高的前N个候选视频作为目标视频推荐给目标用户，其中，N可以根据实际需求确定，本实施例对此不作限定。

在本实施例中，针对当前平台无视频交互行为的目标账户或者视频交互行为不满足预设条件的目标账户，可以获取该目标账户的账户属性信息，并将账户属性信息转换成用于表示目标账户的账户特征信息。同时，确定候选视频集合中各候选视频的视频属性信息、与该候选视频存在交互行为的交互账户以及交互账户属性信息，并根据上述视频属性信息、交互账户以及交互账户属性信息确定该候选视频的视频特征信息。然后，根据各候选视频的视频特征信息以及目标账户的账户特征信息，从候选视频集合中确定用于向目标账户推荐的目标视频，从而实现根据已有交互账户的视频交互数据，为不存在视频交互行为或者发生的视频交互行为不满足预设条件的目标账户进行视频推荐，提高对目标账户的冷启动推荐的准确率，保证视频推荐效果，增加新用户留存。

图2是根据一示例性实施例示出的另一种视频推荐方法的流程图，如图2所示，包括以下步骤。

在步骤S21中，获取目标账户的账户属性信息。

其中，目标账户为在当前平台未发生视频交互行为的账户或者发生的视频交互行为不满足预设条件的账户。

示例性地，账户属性信息可以包括目标账户所处的POI信息、目标账户所使用的设备的设备信息、该设备安装的应用程序列表等的一种或结合。

在步骤S22中，根据所述目标账户以及所述目标账户的账户属性信息，构建账户属性异构图。

账户属性异构图(user/user-attribute graph)是用于表示目标账户和账户属性信息之间关系的图表示方法，在账户属性异构图中可以包括目标账户节点以及账户属性信息节点，其中，目标账户节点与账户属性信息节点是异构的。如图3的账户属性异构图所示，可以包括目标账户节点U以及账户属性信息节点UA。在图3中，标记相同的圆圈表示的是同一个语义(例如同标记为“U”)，标记不同的圆圈表示的是不用的语义(例如标记为“U”的圆圈和标记为“UA”的圆圈)。在一个graph(图)中有多个不同语义的node(节点)参与构建，即定义为异构图。

在账户属性异构图中可以表示不同节点之间的一阶关系(即直接关系，如图3中的圆圈通过一条边连通)或者高阶关系(即间接关系，如图3中的圆圈通过两条以上的边连通)，其中，间接关系是指在一个graph中，只要2个node(即图3中的圆圈)没有直接相连，而是需要多条边才能连通的。另外，不符合间接关系的是指在graph中，无论通过多少条边都连通不到一起的，表示没有间接关系的。在实际中，一般需要一阶关系、二阶关系(通过2条边能连接在一起的两个node，称这两个node符合二阶关系，依此类推)，三阶关系(通过3条边能连接在一起的)。

在本实施例中，账户属性异构图中的目标账户节点以及账户属性信息节点可以按需采用不同的表示方式。在一种例子中，目标账户节点可以采用由目标账户经由已有模型训练后的向量来表示，即目标账户节点可以是通过其他模型学习到的可训练的向量表示(learnable embedding)。而账户属性信息节点由账户属性信息表示(即预训练的属性表示，pre-trained feature)，或者，由账户属性信息经由已有模型训练后的向量来表示(即learnable embedding)，或者由账户属性信息以及该账户属性信息经由已有模型训练后的向量进行联合表示(即pre-trained feature+learnable embedding)。

在步骤S23中，将所述账户属性异构图输入至已训练的第一图卷积神经网络模型，在所述第一图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第一特征向量，对不同类型的节点的值进行联合卷积操作，获得第二特征向量，并对所述第一特征向量及所述第二特征向量进行降维处理，输出账户特征信息。

在该步骤中，在构建出账户属性异构图(user/user-attribute graph)以后，可以将该账户属性异构图输入至已训练的第一图卷积神经网络(Graph ConvolutionalNetwork，简称GCN)模型，由该第一图卷积神经网络模型对账户属性异构图进行多层的卷积操作(即GCN on users)，最终输出账户特征信息，以此学习目标账户的特征表示。

在本实施例中，将GCN模型应用在异构图中，相比于应用在同构图中，本实施例可以对GCN模型中的卷积操作进行如下改进：

对相同类型的节点的值进行聚合卷积操作，获得第一特征向量。例如，对账户属性异构图中同为city_name的节点或者是同为app的节点，做卷积操作时可以使用聚合函数(aggregator functions)进行卷积，得到第一特征向量。

示例性地，聚合函数可以包括但不限于如下函数：

GCN aggregator：节点表示进行相加操作。

MEAN aggregator：节点表示进行取平均操作。

LSTM aggregator：将需要进行卷积操作的节点作为序列，通过LSTM进行表示学习，其中，LSTM可以是单向的也可以是双向的。

MAX POOLING aggregator：对节点表示的每一维度做最大池化(max pooling)操作。

另外，对账户属性异构图中不同类型的节点的值进行联合卷积操作，获得第二特征向量。例如，可以按照预设的联合规则进行联合(concatenation)，以构建新的向量，作为第二特征向量。

在实际中，由于user/user-attribute graph中不同类型的节点较多，卷积操作中对于不同类的节点进行concatenation操作后得到的第二特征向量的维度会过大，如上万维的向量，则在本实施例中可以对卷积后得到的特征向量进行降维操作，最终得到低维的向量。

在一种实施方式中，上述的降维处理可以包括DAE(Denoising Auto Encoder，降噪自动编码机)降维，即采用DAE模型对第一特征向量以及第二特征向量降噪。

在一个例子中，如图4的降维处理示意图所示，DAE模型的输入是GCN的卷积操作中，同类节点aggregator操作后输出的第一特征向量，以及，不同类节点concatenation操作后的第二特征向量。corrupting表示对输入进行加噪音数据处理；最后经过encoders和decoders进行输入数据的维度压缩，DAE模型的输出是隐层的输出，即压缩的账户特征信息(encoded feature)。

图5是根据一示例性实施例示出的第一图卷积神经网络模型生成的方法实施例流程图，如图5所示，包括以下步骤。

在步骤S51中，确定多个样本账户，所述样本账户为在当前平台存在视频交互行为的注册账户。

在该步骤中，样本账户相对于目标账户而言，是指在当前平台发生视频交互行为的注册账户(existing user)。

在步骤S52中，获取各样本账户对应的样本账户属性信息。

示例性地，与目标账户的账户属性信息类似，样本账户属性信息可以包括但不限于如下的一种或结合：样本账户所在的POI信息、样本账户所使用的设备的设备信息(如设备型号、设备品牌、设备子品牌等)、该设备安装的应用程序列表等。

在步骤S53中，根据所述样本账户以及对应的样本账户属性信息构建样本账户属性异构图。

该样本账户属性异构图与上述的账户属性异构图类似，此处不再赘述了。

在步骤S54中，采用预设的图卷积神经网络学习器对所述样本账户属性异构图进行学习，生成第一图卷积神经网络模型。

在该步骤中，在训练第一图卷积神经网络模型的过程中，可以在样本账户属性异构图中使用GCN模型学习器来学习低维的账户特征信息。

在步骤S24中，确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息。

在步骤S25中，根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，构建视频账户属性异构图。

视频账户属性异构图从整体上对账户、视频和交互矩阵之间关系的图表示方法。例如，如图6所示，视频账户属性异构图(UAPA graph)中可以包括视频标识节点P’、视频属性信息节点PA’、交互账户节点U’以及交互账户属性信息节点UA’。在视频账户属性异构图中，不同节点可以具有一阶关系或者高阶关系(如二阶关系、三阶关系等)。

在本实施例中，视频账户属性异构图中的各节点可以按需采用不同的表示方式。在一种例子中，交互账户节点可以采用由交互账户经由已有模型训练后的向量来表示，即learnable embedding。

视频标识节点可以采用由视频标识经由已有模型训练后的向量来表示，即learnable embedding。

交互账户属性信息节点可以由交互账户属性信息表示(pre-trained feature)，或者，由交互账户属性信息经由已有模型训练后的向量来表示(learnable embedding)，或者，由交互账户属性信息以及该交互账户属性信息经由已有模型训练后的向量进行联合表示(pre-trained feature+learnable embedding)。

视频属性信息节点可以由视频属性信息表示(pre-trained feature)，或者，由视频属性信息经由已有模型训练后的向量来表示(learnable embedding)，或者由视频属性信息以及该视频属性信息经由已有模型训练后的向量进行联合表示(pre-trainedfeature+learnable embedding)。

在步骤S26中，将所述视频账户属性异构图输入至已训练的第二图卷积神经网络模型，在所述第二图卷积神经网络模型中，对相同类型的节点的值进行聚合卷积操作，获得第三特征向量，对不同类型的节点的值进行联合卷积操作，获得第四特征向量，并对所述第三特征向量及所述第四特征向量进行降维处理，输出视频特征信息。

在该步骤中，在构建出视频账户属性异构图(UAPA graph)以后，可以将该视频账户属性异构图输入至已训练的第二图卷积神经网络模型，由该第二图卷积神经网络模型对账户属性异构图进行多层的卷积操作(即GCN on UAPA)，最终输出视频特征信息，以此学习候选视频的特征表示。

需要说明的是，第一图卷积神经网络模型与第二图卷积神经网络模型可以是分开的两个GCN模型，也可以整合在一个GCN模型中，本实施例对此不作限制。

图7是根据一示例性实施例示出的第二图卷积神经网络模型生成的方法实施例流程图，如图7所示，包括以下步骤。

在步骤S71中，确定多个样本账户，所述样本账户为在当前平台存在视频交互行为的注册账户。

在步骤S72中，获取各样本账户对应的样本账户属性信息。

在步骤S73中，确定各样本账户的第一视频集合以及第二视频集合。

其中，第一视频集合包括符合该样本账户的指定特征的视频，例如，指定特征可以为该样本账户点击、收藏等能体现用户喜好该视频的特征，因此第一视频集合也可以称为用户偏爱的视频集合；第二视频集合包括除所述符合该样本账户的指定特征的视频以外的其他视频，因此第二视频集合也可以称为用户不偏爱的视频集合。

在该步骤中，通过对样本账户的交互行为分析，分析出样本账户与视频之间的关联，得到样本账户偏爱的第一视频集合以及不偏爱的第二视频集合。其中，样本账户偏爱的第一视频集合可以为正样本，样本账户不偏爱的第二视频集合可以作为负样本。

在一种实施方式中，步骤S73中确定各样本账户的第一视频集合的步骤可以包括如下步骤。

在步骤S73-1中，确定所述样本账户发生交互的视频信息。

示例性地，样本账户发生交互的视频信息可以包括但不限于：样本账户点击、收藏的视频的视频信息。其中，该视频信息可以包括视频标识以及视频标签等。

在一种实施方式中，可以从平台的日志记录中提取各样本账户点击、收藏或喜欢的各视频的视频信息。

在步骤S73-2中，根据所述样本账户以及所述视频信息构建账户视频交互异构图。

在该步骤中，账户视频交互异构图(User-photo graph)是用于表示账户和视频之间交互行为关系的图表示方法，可以包括账户节点和视频标识节点，其中，账户节点和视频标识节点是异构的。账户视频交互异构图中可以表示账户节点和视频标识节点之间的一阶关系或者高阶关系。在其他实施例中，该账户视频交互异构图也可以是一种二分图Bipartite graph，即账户节点与账户节点之间没有关联，视频标识节点与视频标识节点之间也没有关联。

在一种例子中，如图8的账户视频交互异构图生成示意图所示，可以预先构建交互矩阵，并从交互矩阵中提取出样本账户和对应的存在交互行为的视频标识，然后根据样本账户以及交互的视频标识构建账户视频交互异构图，本实施例对构建graph的方式不作限定，本领域技术人员可以采用常用的图创建方法构建graph。

在一种实施方式中，可以根据用户点击视频的点击行为构建交互矩阵。但为了使得后续采样时能够更好地采样到用户喜欢或者偏爱的视频，可以在交互矩阵中添加更多的属性信息来反映用户对视频的喜欢或者偏爱程度。作为一种示例，上述添加的属性信息可以包括但不限于：用户点互信息(Pointwise Mutual Information，简称PMI)、用户喜欢Like、用户收藏follow、用户标签tags和视频标签tags等。

在步骤S73-3中，在所述账户视频交互异构图中对所述账户节点的直接相邻节点进行采样，或者，对所述账户节点的直接相邻节点及间接相邻节点进行采样。

在步骤S73-4中，将获得的采样结果对应的视频组织成第一视频集合。

在实际中，由于平台中账户和视频的数量都很大，使得交互矩阵很大，从而导致账户视频交互异构图很大，为了提高后续的模型训练效率，本实施例可以在账户视频交互异构图中对账户节点进行采样(sampling)，获得样本账户偏爱的第一视频集合，可以表示为(ui,pj)，代表账户ui偏爱的视频或视频集合pj。

在一种实施方式中，可以采用Deep walk算法或Random walk算法对账户视频交互异构图中的账户节点的直接相邻节点，或者账户节点的直接相邻节点及间接相邻节点进行随机采样操作，并将采样结果对应的视频组成该账户节点对应的样本账户偏爱的第一视频集合。

需要说明的是，在账户交互异构图中账户节点与视频标识节点之间的权重可以由交互矩阵中用户的交互行为的偏爱程度确定的，权重越大，更有可能被采样。

另外，在负采样过程中，针对各样本账户，可以在全局视频集合中进行随机选择该账户不偏爱的视频集合。

在步骤S74中，获取所述第一视频集合及所述第二视频集合中各视频的属性信息，作为样本视频属性信息。

示例性地，样本视频属性信息可以包括但不限于视频标签tag及视频的多模态信息等。在一种例子中，该多模态信息可以包括文本信息(如视频的评论文本数据、视频的语音文本数据等等)、视频信息(如视频封面表示、视频的所有帧表示等等)及音频信息等。

在步骤S75中，根据所述样本账户、所述第一视频集合及所述第二视频集合中各视频标识、所述样本账户属性信息以及所述样本视频属性信息构建样本账户视频属性异构图。

样本账户视频属性异构图的表示以及构建方法与上述的账户视频属性异构图类似，具体可以参考账户视频属性异构图的描述，此处不再赘述了。

在步骤S76中，采用预设的图卷积神经网络学习器对所述样本账户视频属性异构图进行学习，生成第二图卷积神经网络模型。

在该步骤中，在训练第二图卷积神经网络模型的过程中，可以在样本账户视频属性异构图中使用GCN模型学习器来学习低维的视频特征信息。

在本实施例中，通过构建账户视频属性异构图，并在账户视频属性异构图中使用GCN算法进行模型训练，从而可以得到第二图卷积神经网络。

在步骤S27中，将所述账户特征信息与各候选视频的视频特征信息输入至已训练的匹配模型，并获取所述匹配模型输出的所述账户特征信息与各候选视频的视频特征信息的匹配分数。

在该步骤中，本实施例还可以包括匹配模型(Matching Model)，示例性地，该匹配模型可以是一个深度神经网络模型。

第一图卷积神经网络模型及第二图卷积神经网络模型的输出可以作为匹配模型的输入。具体的，第一图卷积神经网络模型可以将账户特征信息输入至匹配模型中，第二图卷积神经网络模型可以将各视频特征信息输入至匹配模型中。匹配模型在获得账户特征信息以及各视频特征信息以后，通过多层卷积操作，实现对账户特征信息与各视频特征信息的匹配，输出匹配分数列表，该匹配分数列表可以包括账户特征信息与各视频特征信息的匹配分数。

在步骤S28中，在所述候选视频集合中选取匹配分数排序在前的一个或多个候选视频作为目标视频。

在一种实施方式中，可以将匹配分数列表中各匹配分数进行排序操作(Ranking)，然后将匹配分数最高的前N个候选视频作为目标视频推荐给目标账户，其中，N可以根据实际需求确定，本实施例对此不作限定。

在本实施例中，对于目标账户而言，由于其没有视频交互行为或者只有少量的视频交互行为，则与账户相关的信息只有账户和账户属性信息，此处结合了ZSL(zero-shotlearning，零样本学习)的思想，利用在平台上存在视频交互行为的账户的属性信息以及交互行为数据，训练第一图卷积神经网络模型以及第二图卷积神经网络模型。然后通过将第一图卷积神经网络模型作用在目标账户的账户属性异构图上，获得目标账户的账户特征信息，通过将第二图卷积神经网络模型作用在候选视频的视频账户属性异构图上，获得各候选视频的视频特征信息(即视频表示空间)，然后通过匹配模型将账户特征信息与各视频特征信息进行匹配，并根据获得的匹配分数确定用于向目标账户推荐的目标视频，整个过程通过GCN模型以及异构图实现，能够获得更精确的账户特征信息以及视频特征信息，从而根据该账户特征信息以及视频特征信息决策出的目标视频能与目标账户更匹配，更好地提高视频推荐的准确率。

图9是根据一示例性实施例示出的一种视频推荐装置框图。参照图9，该装置包括账户属性信息获取单元901，账户特征信息确定单元902，视频特征信息确定单元903和目标视频确定单元904。

账户属性信息获取单元901，被配置为获取目标账户的账户属性信息，其中，所述目标账户为在当前平台未发生视频交互行为的账户或者发生的视频交互行为不满足预设条件的账户；

账户特征信息确定单元902，被配置为对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息；

视频特征信息确定单元903，被配置为确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息；并根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息；

目标视频确定单元904，被配置为根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频。

在一种可选的实施方式中，所述账户特征信息确定单元902可以包括如下子单元：

在一种可选的实施方式中，所述目标账户节点采用由所述目标账户经由已有模型训练后的向量来表示；

在一种可选的实施方式中，所述装置还包括被配置为训练所述第一图卷积神经网络模型的第一模型训练单元，包括：

在一种可选的实施方式中，所述视频特征信息确定单元903可以包括如下子单元：

在一种可选的实施方式中，所述交互账户节点采用由所述交互账户经由已有模型训练后的向量来表示；

在一种可选的实施方式中，所述装置还包括被配置为训练所述第二图卷积神经网络模型的第二模型训练单元，包括：

在一种可选的实施方式中，所述视频集合确定子单元还被配置为：

将获得的采样结果对应的视频组织成第一视频集合。

在一种可选的实施方式中，所述目标视频确定单元904可以包括如下子单元：

目标视频选取子单元，被配置为在所述候选视频集合中选取匹配分数排序在前的若干候选视频作为目标视频。

关于上述的视频推荐装置的具体限定可以参见上文中对于视频推荐方法的限定，在此不再赘述。上述装置中的各个单元可全部或部分通过软件、硬件及其组合来实现。上述各单元可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

图10是根据一示例性实施例示出的一种电子设备，该电子设备可以是终端或者服务器，其内部结构图可以如图10所示。该电子设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该电子设备的处理器用于提供计算和控制能力。该电子设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该电子设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述的一种视频推荐方法。该电子设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该电子设备的输入装置可以是显示屏上覆盖的触摸层，也可以是电子设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本公开还提供一种计算机程序产品，包括：计算机程序代码，当所述计算机程序代码被计算机运行时，使得所述计算机执行上述的模型训练方法和多媒体内容推荐方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，本公开涉及的账户/用户信息均为经用户/账户授权之后采集并进行后续处理分析的。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种视频推荐方法，其特征在于，包括：

对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息；所述账户特征信息为已训练的第一图卷积神经网络模型作用在所述目标账户的账户属性异构图上得到的；所述账户属性异构图包括目标账户节点以及账户属性信息节点；

根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息；所述视频特征信息为已训练的第二图卷积神经网络模型作用在所述候选视频的视频账户属性异构图上得到的；所述视频账户属性异构图包括视频标识节点、视频属性信息节点、交互账户节点以及交互账户属性信息节点；

根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频；

其中，所述第一图卷积神经网络模型以及第二图卷积神经网络模型利用所述当前平台存在视频交互行为的账户的属性信息以及交互行为数据进行训练得到的。

2.根据权利要求1所述的视频推荐方法，其特征在于，所述对所述账户属性信息进行转换处理，获得用于表示所述目标账户的账户特征信息的步骤包括：

根据所述目标账户以及所述目标账户的账户属性信息，构建账户属性异构图，所述账户属性异构图中包括目标账户节点以及账户属性信息节点；

3.根据权利要求2所述的方法，其特征在于，所述目标账户节点采用由所述目标账户经由已有模型训练后的向量来表示；

4.根据权利要求2或3所述的视频推荐方法，其特征在于，所述第一图卷积神经网络模型采用如下方式训练得到：

获取各样本账户对应的样本账户属性信息；

5.根据权利要求1所述的视频推荐方法，其特征在于，所述根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息的步骤包括：

6.根据权利要求5所述的方法，其特征在于，所述交互账户节点采用由所述交互账户经由已有模型训练后的向量来表示；

所述视频标识节点采用由视频标识经由已有模型训练后的向量来表示；

7.根据权利要求5或6所述的视频推荐方法，其特征在于，所述第二图卷积神经网络模型采用如下方式训练得到：

获取各样本账户对应的样本账户属性信息；

8.根据权利要求7所述的视频推荐方法，其特征在于，所述确定各样本账户的第一视频集合的步骤包括：

将获得的采样结果对应的视频组织成第一视频集合。

9.根据权利要求1所述的视频推荐方法，其特征在于，所述根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频的步骤包括：

10.一种视频推荐装置，其特征在于，包括：

账户属性信息获取单元，被配置为获取目标账户的账户属性信息，其中，所述目标账户为在当前平台未发生视频交互行为的账户或者发生的视频交互行为不满足预设条件的账户；所述账户特征信息为已训练的第一图卷积神经网络模型作用在所述目标账户的账户属性异构图上得到的；所述账户属性异构图包括目标账户节点以及账户属性信息节点；

视频特征信息确定单元，被配置为确定候选视频集合中各候选视频的视频属性信息、与所述候选视频存在交互行为的交互账户以及交互账户属性信息；并根据所述候选视频、所述视频属性信息、所述交互账户以及所述交互账户属性信息，确定用于表示所述候选视频的视频特征信息；所述视频特征信息为已训练的第二图卷积神经网络模型作用在所述候选视频的视频账户属性异构图上得到的；所述视频账户属性异构图包括视频标识节点、视频属性信息节点、交互账户节点以及交互账户属性信息节点；

目标视频确定单元，被配置为根据各候选视频的视频特征信息以及所述目标账户的账户特征信息，从所述候选视频集合中确定用于向所述目标账户推荐的目标视频；

11.根据权利要求10所述的视频推荐装置，其特征在于，所述账户特征信息确定单元包括：

12.根据权利要求11所述的装置，其特征在于，所述目标账户节点采用由所述目标账户经由已有模型训练后的向量来表示；

13.根据权利要求11或12所述的视频推荐装置，其特征在于，所述装置还包括被配置为训练所述第一图卷积神经网络模型的第一模型训练单元，包括：

14.根据权利要求10所述的视频推荐装置，其特征在于，所述视频特征信息确定单元包括：

15.根据权利要求14所述的装置，其特征在于，所述交互账户节点采用由所述交互账户经由已有模型训练后的向量来表示；

16.根据权利要求14或15所述的视频推荐装置，其特征在于，所述装置还包括被配置为训练所述第二图卷积神经网络模型的第二模型训练单元，包括：

17.根据权利要求16所述的视频推荐装置，其特征在于，所述视频集合确定子单元还被配置为：

将获得的采样结果对应的视频组织成第一视频集合。

18.根据权利要求10所述的视频推荐装置，其特征在于，所述目标视频确定单元包括：

19.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器;

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至9中任一项所述的视频推荐方法。

20.一种存储介质，当所述存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行如权利要求1至9中任一项所述的视频推荐方法。