CN117390221A

CN117390221A - 手机银行中视频推荐方法、装置、计算机设备和存储介质

Info

Publication number: CN117390221A
Application number: CN202311133516.9A
Authority: CN
Inventors: 南晓停
Original assignee: Bank of China Ltd
Current assignee: Bank of China Ltd
Priority date: 2023-09-04
Filing date: 2023-09-04
Publication date: 2024-01-12

Abstract

本申请涉及一种大数据技术领域的手机银行中视频推荐方法、装置、计算机设备、存储介质和计算机程序产品。方法包括：获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量；获取候选视频集合的属性与环境特征向量；得到候选视频集合多模态内容特征向量、历史视频集合多模态内容特征向量；得到候选视频集合与历史视频集合的相关性系数，并对历史视频集合的内容多模态特征向量进行加权处理；基于预设视频推荐网络，得到候选视频集合中视频被观看概率；对候选视频集合中的视频进行排序后推荐。采用本方法能够准确实现手机银行中视频推荐。

Description

手机银行中视频推荐方法、装置、计算机设备和存储介质

技术领域

本申请涉及大数据技术领域，特别是涉及一种手机银行中视频推荐方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术

观看视频作为一种常见的娱乐手段，能够丰富人们的生活、及精神世界。目前的金融类app，如手机银行等，也大多会根据用户的偏好，采用推荐算法来进行视频的推荐。其中，手机银行中推荐的视频可以是与手机银行业务操作有关的视频，也可以是与手机银行业务相关的宣传视频。在海量的视频中，推荐算法可以帮助用户高效获得感兴趣的内容，以增强用户的体验性和粘性。

目前，采用推荐算法来进行视频推荐的方法可以是：通过将观看记录的特征直接求和再求均值来表示用户的历史行为特征，根据用户的历史行为特征来预测现有的用户想观看的视频，从而进行视频选择并推荐；然而，目前的视频推荐方法并不能够准确推荐手机银行中视频。

发明内容

基于此，有必要针对上述技术问题，提供一种准确的手机银行中视频推荐方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种手机银行中视频推荐方法。所述方法包括：

获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量；

获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量；

根据所述候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量，并根据所述历史视频集合的内容特征向量，得到历史视频集合多模态内容特征向量；

根据所述历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数，并根据所述相关性系数，对所述历史视频集合的内容多模态特征向量进行加权处理；

将加权处理后的历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量、所述视频观看对象特征向量、所述候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率；

根据所述候选视频集合中视频被观看概率，对候选视频集合中的视频进行排序后推荐。

在其中一个实施例中，所述获取手机银行中历史视频集合包括：

获取手机银行中历史已观看视频集合，并查询手机银行中历史已观看视频集合中各历史视频的观看时长记录；

对比所述观看时长记录与预设观看时长阈值，得到对比结果；

基于所述对比结果筛选所述历史已观看视频集合中的历史视频，得到手机银行中历史视频集合。

在其中一个实施例中，所述获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、与历史视频集合的内容特征向量包括：

获取候选视频集合的属性与环境特征、候选视频集合的内容特征、与历史视频集合的内容特征；

对所述候选视频集合的属性与环境特征进行one-hot向量编码，得到候选视频集合的属性与环境特征向量；

根据所述候选视频集合的内容特征、及历史视频集合的内容特征，得到所述候选视频集合的第一封面图像信息与第一文字描述信息、及历史视频集合的第二封面图像信息与第二文字描述信息；

对所述第一封面图像信息与所述第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量，并对所述第二封面图像信息与所述第二文字描述信息进行向量化处理，得到第二封面图像信息向量与第二文字描述信息向量；

根据所述第一封面图像信息向量与所述第一文字描述信息向量，得到候选视频集合的内容特征向量，并根据所述第二封面图像信息向量与所述第二文字描述信息向量，得到历史视频集合的内容特征向量。

在其中一个实施例中，所述对所述第一封面图像信息与所述第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量包括：

对所述第一封面图像信息进行映射编码和向量化处理，得到第一封面图像编码信息向量；

对所述第一文字描述信息进行one-hot编码，并将编码后的第一文字描述信息输入至Word2Vec模型，得到降维后的第一文字描述编码信息向量；

根据所述降维后的第一文字描述编码信息向量，得到第一文字描述信息向量。

在其中一个实施例中，所述根据所述候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量包括：

将所述候选视频集合的内容特征向量输入至预设多模态Transformer模型，得到候选视频集合多模态内容特征向量。

在其中一个实施例中，所述根据所述历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数包括：

对所述历史视频集合多模态内容特征向量、及所述候选视频集合多模态内容特征向量进行向量的元素减操作，得到元素减操作后的特征向量；

将所述元素减操作后的特征向量、所述历史视频集合多模态内容特征向量、及所述候选视频集合多模态内容特征向量进行维度拼接，得到拼接后的特征向量；

基于所述拼接后的特征向量，采用Relu非线性激活函数得到候选视频集合与历史视频集合的相关性系数。

在其中一个实施例中，所述将加权处理后的历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量、所述视频观看对象特征向量、所述候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率包括：

将加权处理后的历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量、所述视频观看对象特征向量、所述候选视频集合的属性与环境特征向量进行维度拼接，得到维度拼接后的特征向量；

将所述维度拼接后的特征向量输入至所述预设视频推荐网络，得到候选视频集合中视频被观看概率。

第二方面，本申请还提供了一种手机银行中视频推荐装置。所述装置包括：

数据获取模块，用于获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量；

特征获取模块，用于获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量；

多模态特征分析模块，用于根据所述候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量，并根据所述历史视频集合的内容特征向量，得到历史视频集合多模态内容特征向量；

历史加权模块，用于根据所述历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数，并根据所述相关性系数，对所述历史视频集合的内容多模态特征向量进行加权处理；

特征分析模块，用于将加权处理后的历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量、所述视频观看对象特征向量、所述候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率；

视频推荐模块，用于根据所述候选视频集合中视频被观看概率，对候选视频集合中的视频进行排序后推荐。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

上述手机银行中视频推荐方法、装置、计算机设备、存储介质和计算机程序产品，从手机银行中的候选视频集合与历史视频集合出发，通过获取与候选短视频、历史视频集合相关的多维特征向量，如获取视频观看对象特征向量、候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、与历史视频集合的内容特征向量；且会对候选视频集合的内容特征向量、与历史视频集合的内容特征向量进行处理，生成候选视频集多模态内容特征向量、与历史视频集合多模态内容特征向量，从而使得内容特征更具有语义信息，进而准确对候选视频集合进行推荐；并通过得到候选视频集合与历史视频集合的相关性系数，进一步对历史视频集合的内容多模态特征向量进行加权处理，从而基于相关性系数加大历史视频集合对候选视频进行推荐的权重，最后将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，准确输出候选视频集合中视频观看概率；并根据候选视频集合中视频观看概率的大小，准确进行候选视频集合中候选视频的推荐。即本申请基于候选视频集与历史视频集合的相关性、及候选视频本身多模态特征，采用预设视频推荐网络来对手机银行中候选视频集合进行准确推荐。

附图说明

图1为一个实施例中手机银行中视频推荐方法的应用环境图；

图2为一个实施例中手机银行中视频推荐方法的流程示意图；

图3为另一个实施例中手机银行中视频推荐方法的流程示意图；

图4为又一个实施例中手机银行中视频推荐方法的流程示意图；

图5为一个具体应用实例中采用多兴趣注意网络得到候选视频集合与历史视频集合的相关性系数的流程示意图；

图6为一个具体应用实例中多兴趣注意网络的全连接层的结构示意图；

图7为一个具体应用实例中采用预设视频推荐网络来得到候选视频集合中视频被观看概率的流程示意图；

图8为一个具体应用实例中以短视频为例的手机银行中视频推荐方法的流程示意图；

图9为一个实施例中手机银行中视频推荐装置的结构框图；

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的手机银行中视频推荐方法，可以应用于如图1所示的应用环境中。其中，手机银行终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上，也可以放在云上或其他网络服务器上。

用户登录手机银行终端102，向手机银行终端102发出观看视频请求，以在手机银行终端102中观看视频，手机银行终端102根据观看视频请求，生成视频推荐请求至服务器104，服务器104接收视频推荐请求，视频推荐请求用于控制服务器104获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量；获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量；根据候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量，并根据历史视频集合的内容特征向量，得到历史视频集合多模态内容特征向量；根据历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数，并根据相关性系数，对历史视频集合的内容多模态特征向量进行加权处理；将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率；根据候选视频集合中视频被观看概率，对候选视频集合中的视频进行排序后推荐至手机银行终端102。

其中，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，推荐系统主要包括召回、视频推荐(重排序)、规则和展示阶段。召回阶段主要是从海量的产品中召回用户可能感兴趣的产品，规模为从百万产品召回几千或者几百的量级，采用少量的特征和简单的模型或规则对候选集进行快速筛选，减少后续排序阶段的时间开销。在召回阶段，一般采用协同过滤算法、矩阵分解算法、基于内容语义的召回算法。在重排序阶段，会使用较为复杂的特征和模型，保证排序的精准，即推荐给用户最可能观看的Top-N短视频。

在一个实施例中，如图2所示，提供了一种手机银行中视频推荐方法，以该方法应用于图1中的服务器104为例进行说明，包括以下步骤：

S100，获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量。

其中，候选视频集合是指服务器预先准备好的给视频观看对象观看的一系列候选视频，视频观看对象是指观看视频的用户；历史视频集合是指在过去的时间段已观看的视频集合。且本申请中的视频可以为与手机银行有关的视频，包括但不限于手机银行中业务宣传视频、及手机银行中业务操作视频。业务宣传视频如反欺诈宣传视频等，业务操作视频如手机银行交易操作视频等。特征向量是一个非简并的向量，其方向在该变换下不变，向量在此变换下缩放的比例称为其特征值(本征值)，在本申请中，视频观看对象是指观看手机银行中视频的对象；视频观看对象特征向量是以向量形式表征的视频观看对象特征。视频观看对象特征包括手机银行中视频观看对象的属性特征及行为特征，属性特征包括手机银行中视频观看对象年龄、性别、地区、与职业等；行为特征包括视频观看对象登录次数、视频播放时长、播放次数、完播率、快速划过率、互动次数、与活跃度等。

具体地，用户在手机银行终端中观看视频，并向手机银行终端发出观看视频请求，手机银行终端根据观看视频请求，生成视频推荐请求至服务器，服务器接收视频推荐请求，视频推荐请求用于控制服务器获取手机银行中的候选视频集合、手机银行中的历史视频集合、以及视频观看对象特征向量，即服务器获取候选推荐的视频集合、及视频观看对象在之前时刻观看过的视频集合、及视频观看对象本身的特征向量，且视频观看对象的特征向量包括属性特征与行为特征，从多个特征角度来实现对视频观看对象的特征准确挖掘。

进一步地，视频可以是长视频，也可以是短视频。

S200，获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量。

其中，候选视频集合的属性与环境特征向量包括以向量形式表示的候选视频集合的属性特征、与环境特征；候选视频集合的属性特征是候选视频自带的特征，而候选视频的环境特征是候选视频的上下文特征，是候选视频与视频观看对象观看时相关的环境特征。候选视频集合的内容特征向量、以及历史视频集合的内容特征向量均为非结构化的特征。

具体地，本申请只考虑历史视频集合的内容特征向量，对候选视频集合进行特征分析，获取候选视频集合的属性与环境特征向量、及候选视频集合的内容特征向量；对历史视频集合进行特征分析，获取历史视频集合的内容特征向量。

S300，根据候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量，并根据历史视频集合的内容特征向量，得到历史视频集合多模态内容特征向量。

其中，多模态指的是多种模态的信息，包括：文本、图像、视频、音频等。多模态特征向量是指将不同模态的信息进行融合得到的特征向量信息。

具体地，内容特征向量中包括许多与内容相关的特征信息，如文本、图像等，对候选视频集合的内容特征向量进行处理，将不同类型的内容特征信息进行融合，得到候选视频集合多模态内容特征向量；并对历史视频集合的内容特征向量进行处理，将不同类型的内容特征信息进行融合，得到历史视频集合多模态内容特征向量。

S400，根据历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数，并根据相关性系数，对历史视频集合的内容多模态特征向量进行加权处理。

具体地，由于手机银行中视频用户的兴趣是多样的，对于候选视频来说，不同历史视频对于建模用户偏好重要性不同，若将历史视频的特征直接求和再求均值来表示用户的历史行为特征，再进行候选视频的排序推荐，则容易造成用户兴趣单一性和用户兴趣疲劳。比如，手机银行中某用户曾经观看过“业务操作攻略”视频，但大多数看“业务宣传视频”视频，历史行为特征直接求和再均值则造成用户“业务操作攻略”兴趣被淹没。因此，对于用户多种兴趣的推荐，会通过根据历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量，得到历史视频与候选视频的相关性系数，而不是对历史视频进行简单的平均计算，从而对历史视频集合的内容多模态特征向量进行加权处理，得到加权处理后的历史视频集合多模态内容特征向量，使得根据加权处理后的历史视频集合多模态内容特征向量是对历史视频中内容特征向量进行准确挖掘的特征向量，能够准确对候选视频进行排序推荐。

S500，将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率。

具体地，本申请从多个特征角度出发，将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，实现从结构化特征、非结构化特征、候选视频特征、历史视频特征、视频观看对象特征等多个特征角度方面来准确获取候选视频集合中视频被观看概率。

S600，根据候选视频集合中视频被观看概率，对候选视频集合中的视频进行排序后推荐。

具体地，候选视频集合中视频被观看概率有高有低，根据候选视频集合中视频被观看概率的高低，对候选视频集合中的视频进行排序，即将候选视频集合中视频被观看概率最高的作为候选视频集合中排序后的第一个，将候选视频集合中视频被观看概率第二高的作为候选视频集合中排序后的第二个…，依次排序，直至候选视频集合中所有视频均排序完成，得到排序完成的候选视频集合，并按照排序完成的候选视频集合中各视频的排序顺序，对手机银行中候选视频集合中的视频进行推荐。

上述手机银行中视频推荐方法中，从手机银行中候选视频集合与历史视频集合出发，通过获取与候选短视频、历史视频集合相关的多维特征向量，如获取视频观看对象特征向量、候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、与历史视频集合的内容特征向量；且会对候选视频集合的内容特征向量、与历史视频集合的内容特征向量进行处理，生成候选视频集多模态内容特征向量、与历史视频集合多模态内容特征向量，从而使得内容特征更具有语义信息，进而准确对候选视频集合进行推荐；并通过得到候选视频集合与历史视频集合的相关性系数，进一步对历史视频集合的内容多模态特征向量进行加权处理，从而基于相关性系数加大历史视频集合对候选视频进行推荐的权重，最后将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，准确输出候选视频集合中视频观看概率；并根据候选视频集合中视频观看概率的大小，准确进行候选视频集合中候选视频的推荐。即本申请基于候选视频集与历史视频集合的相关性、及候选视频本身多模态特征，采用预设视频推荐网络来对手机银行中候选视频集合进行准确推荐。

在一个实施例中，获取手机银行中历史视频集合包括：

获取手机银行中历史已观看视频集合，并查询手机银行中历史已观看视频集合中各历史视频的观看时长记录；对比观看时长记录与预设观看时长阈值，得到对比结果；基于对比结果筛选历史已观看视频集合中的历史视频，得到手机银行中历史视频集合。

具体地，手机银行中历史视频集合是指在过去的时间段手机银行中已观看的视频集合。但是，为了使得得到的历史视频集合中的视频是有效、值得去挖掘其中历史视频特征的，还需要对过去的时间段已观看的视频集合进行筛选处理。首先，设定过去的时间段，并获取过去的时间段内已观看视频集合，查询过去的时间段内手机银行中已观看视频集合中各历史视频的观看时长记录，并对比观看时长记录与预设观看时长阈值，得到对比结果，其中，对比结果包括观看时长记录长于预设观看时长阈值、及观看时长记录短于预设观看时长阈值；基于对比结果筛选历史已观看视频集合中的历史视频，得到历史视频集合，即筛选得到对比结果表征观看时长记录长于预设观看时长阈值的历史视频。举例来说，服务器获取手机银行中近一周的已观看视频集合中各视频的观看时长记录，令预设观看时长阈值为3s，将观看时长记录小于3s的视频过滤，将观看时长记录大于3s的作为所需要的历史视频集合，即将观看时长过短、快速划过的视频过滤。

本实施例中，通过对手机银行中历史已观看视频集合中观看时长记录小于预设观看时长阈值的视频进行过滤，能够使得获取的历史视频集合是有效的，是有获取价值的，从而能够基于有获取价值的历史视频集合中的特征来实现视频推荐。

在一个实施例中，如图3所示，S200包括：

S210，获取候选视频集合的属性与环境特征、候选视频集合的内容特征、与历史视频集合的内容特征。

具体地，候选视频集合的属性与环境特征包括候选视频集合的属性特征与候选视频集合的环境特征；候选视频集合的属性特征包括视频时长、曝光数、被完播率、作者id、热度、互动渗透率、与新鲜度；候选视频集合的环境特征是指候选视频集合的上下文特征向量，环境特征包括用户观看时间段、观看渠道等。内容特征包括文字描述信息与封面图像信息。服务器获取候选视频集合的属性与环境特征、候选视频集合的内容特征、与历史视频集合的内容特征。

S220，对候选视频集合的属性与环境特征进行one-hot向量编码，得到候选视频集合的属性与环境特征向量。

其中，分类变量作为二进制向量的表示。首先需要将分类变量映射到整数值。然后，每个整数值表示为二进制向量，除了整数的索引之外，其它都是零值，只有该索引位的值为1，如[0，0，0，0，1，0]向量。

具体地，候选视频集合的内容特征、与历史视频集合的内容特征是非结构化特征，候选视频集合的属性与环境特征是结构化特征。对结构化特征进行one-hot向量编码，可以得到候选视频集合的属性与环境特征向量。且结构化特征包括数值特征和类别特征两大类，对不同的特征采取不同的one-hot向量编码处理方式，如：

对于数值特征先进行分桶离散化处理，再进行one-hot向量编码。其中，分桶离散化处理是指采用等区间分桶或聚类的方式将数值特征划分为多个类别，得到离散化数据；基于分桶后的数据进行one-hot向量编码，如对曝光数进行分桶处理后，得到5种区间类型，此时，one-hot可编码为[1，0，0，0，0]，[0，1，0，0，0]…[0，0，0，0，1]。此外，在进行one-hot向量编码后，还会进行缺失值的处理，具体包括采用均值、众数来代替缺失值的方式。

对于类别特征，直接采用one-hot向量编码来表示，如性别特征，[0，1]表示男，[1，0]表示女。

进一步地，视频观看对象特征也是结构化特征，可以对视频观看对象中的数值特征、及类别特征采取上述方式进行特征数据的预处理。

S230，根据候选视频集合的内容特征、及历史视频集合的内容特征，得到候选视频集合的第一封面图像信息与第一文字描述信息、及历史视频集合的第二封面图像信息与第二文字描述信息。

具体地，由于内容特征包括文字描述信息与封面图像信息，因此，根据候选视频集合的内容特征，可以得到候选视频集合的第一封面图像信息与第一文字描述信息；根据历史视频集合的内容特征，可以得到历史视频集合的第二封面图像信息与第二文字描述信息。其中，文字描述信息是指对视频的内容进行文字的描述，如视频文字简介等。如对于手机银行中某金融服务宣传视频，文字描述信息可以是“金融服务宣传”、封面图像信息可以是宣传者的人物形象。

S240，对第一封面图像信息与第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量，并对第二封面图像信息与第二文字描述信息进行向量化处理，得到第二封面图像信息向量与第二文字描述信息向量。

具体地，对内容特征也需要进行向量化处理，由于内容特征是非结构化特征，因此，对内容特征进行处理的手段与结构化特征不同，即对第一封面图像信息与第一文字描述信息、第二封面图像信息与第二文字描述信息进行向量化处理的手段与对结构化特征进行向量化处理的手段不同。且对封面图像信息与文字描述信息的向量化处理手段也不同，经过向量化处理后，得到候选视频集合对应的第一封面图像信息向量与第一文字描述信息向量、及历史视频集合对应的第二封面图像信息向量与第二文字描述信息向量。

S250，根据第一封面图像信息向量与第一文字描述信息向量，得到候选视频集合的内容特征向量，并根据第二封面图像信息向量与第二文字描述信息向量，得到历史视频集合的内容特征向量。

具体地，综合第一封面图像信息向量与第一文字描述信息向量，得到候选视频集合的内容特征向量；综合第二封面图像信息向量与第二文字描述信息向量，得到历史视频集合的内容特征向量。

本实施例中，通过采取不同的手段将候选视频集合的属性与环境特征、候选视频集合的内容特征、与历史视频集合的内容特征均进行向量转换，避免单一手段造成的特征向量转换效果差，能够得到高效且准确的特征向量。

在一个实施例中，对第一封面图像信息与第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量包括：

对第一封面图像信息进行映射编码和向量化处理，得到第一封面图像编码信息向量；对第一文字描述信息进行one-hot编码，并将编码后的第一文字描述信息输入至Word2vec模型，得到降维后的第一文字描述编码信息向量；根据降维后的第一文字描述编码信息向量，得到第一文字描述信息向量。

其中，Word2vec是一种词向量嵌入技术，将词向量化，即假定句子中每个词与其相邻的词关系最密切，通过大量语料的训练来定量地度量词和词之间的关系。

具体地，第一封面图像信息、及第一文字描述信息是候选视频的内容特征，对候选视频的内容特征中包括的封面图像信息与文字描述信息进行向量化处理的手段包括：根据第一封面图像信息，将第一封面图像进行图像切块，将切块后的图像看作是图像块序列，对图像块进行映射编码和向量化处理，以得到第一封面图像编码信息向量，其中，在图像块的映射编码时，是从图像左上角开始，从左到右，从上到下顺序依次编码为0，1，2，3…，以进行编码；根据第一文字描述信息，将文字描述信息看作词序列，对词序列进行one-hot编码，得到编码后的第一文字描述信息，并将编码后的第一文字描述信息输入至词向量Word2Vec模型，对编码后的第一文字描述信息进行降维，以得到降维后的第一文字描述编码信息向量，并将降维后的第一文字描述编码信息向量作为最终的第一文字描述信息向量，即视频中的文字描述相关的特征向量。

同理，对历史视频的内容特征中包括的封面图像信息与文字描述信息进行向量化处理的手段包括：

对第二封面图像信息进行映射编码和向量化处理，得到第二封面图像编码信息向量；对第二文字描述信息进行one-hot编码，并将编码后的第二文字描述信息输入至Word2Vec模型，得到降维后的第二文字描述编码信息向量；根据降维后的第二文字描述编码信息向量，得到第二文字描述信息向量。

本实施例中，通过分别对视频集合内的非结构化特征，如封面图像信息与文字描述信息进行不同的向量化处理，能够实现准确的向量化，以高效得到准确的封面图像编码信息向量、及文字描述信息向量，从而得到视频集合的内容特征。

在一个实施例中，根据候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量包括：

将候选视频集合的内容特征向量输入至预设多模态Transformer模型，得到候选视频集合多模态内容特征向量。

其中，Transformer模型能够高效抽取文本信息并应用于各种自然语言处理任务，相比RNN(Recurrent Neural Networks，循环神经网络)，它摒弃了RNN逐字迭代的短板，可以实现序列中所有字的并行，采用多头注意力机制将序列中所有字的信息按权重融入当前字的隐向量中，该权重表示其他字对于推测当前字的贡献大小，并采用位置编码，利用正余弦函数来记录序列中每个字的位置信息。本申请采用ViLT的Transformer预训练模型作为预设多模态Transformer模型，来提取视频的内容多模态特征信息。相比于卷积神经网络，它将图像切块看成图像的一个块序列，因此可以看作序列信息并送入Transformer模型，该模型自注意力机制将序列中其他图像块信息都融入到当前图像块中，因此比卷积神经网络可以获得更大的感受野。

具体地，视频的内容特征包括视频封面信息、及文字描述信息，由于预设多模态Transformer模型的自注意力机制，以候选视频的内容特征为例，可将包括第一封面图像编码信息向量、第一文字描述信息向量的内容特征向量输入至预设多模态Transformer模型，进而将图像编码信息向量融入文字描述信息向量中，文字描述信息向量融入图像编码信息向量中，即将图像块信息融入文本信息中，文本信息可以融入图像块信息中，并经过模型的训练学习，第一封面图像编码信息向量、第一文字描述信息向量将处于共同的特征空间，最终得到短视频的多模态Embedding(嵌入)特征表示，即候选视频集合多模态内容特征向量。其中，特征空间是指相同特征值的特征向量的集合。同理，将历史视频集合的内容特征向量输入至预设多模态Transformer模型，得到历史视频集合多模态内容特征向量。

且本申请中采用多头注意力机制将序列中所有字的信息按权重融入当前字的隐向量中是指：序列有两个：文字序列与图像块序列。具体地，输入的向量通过权重矩阵WQ、WK、WV线性变换得到Q、K、V三个序列向量。Q对应Query查询向量、V对应Key键向量、V对应Value值向量。用每个字的query向量分别和序列中所有字的Key向量做乘积，得到字与字之间的相关度，然后这个相关度再通过Softmax进行归一化，归一化后的权重(注意力)再通过Value向量加权求和，得到每个字新的编码。

需要说明的是，将视频集合的内容特征向量输入至预设多模态Transformer模型时，是将文字描述信息向量、封面图像编码信息向量进行拼接，并输入至预设多模态Transformer模型。且相比于现有的Transformer模型，会对每个位置增加标志位，标志位为0表述文字序列元素，标志位为1表述图像块序列元素。

本实施例中，通过预设多模态Transformer模型对输入的非结构化特征向量进行处理，能够将非结构化特征向量互相融合，来增加模态间的交流，使得提取的多模态特征更具有语义信息，从而使得不同的非结构化特征向量能够在共同的特征空间，得到非结构化特征向量的多模态特征向量。

在一个实施例中，如图4所示，S400包括：

S410，对历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行向量的元素减操作，得到元素减操作后的特征向量。

S420，将元素减操作后的特征向量、历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行维度拼接，得到拼接后的特征向量。

S430，基于拼接后的特征向量，采用Relu非线性激活函数得到候选视频集合与历史视频集合的相关性系数。

S440，根据相关性系数，对历史视频集合的内容多模态特征向量进行加权处理。

具体地，手机银行中视频用户的兴趣是多样的，对于手机银行中候选集中的视频，不同历史观看记录对于建模用户偏好重要性不同，若将历史观看记录的特征直接求和再求均值来表示用户的历史行为特征，则容易造成用户兴趣单一性和用户兴趣疲劳。因此，对于用户多种兴趣的推荐，本申请采用注意力机制，当手机银行中候选集中视频与用户的某个历史视频相似时，则加大该历史视频的权重，即对相似度大的历史视频多模态内容特征投放更多的“注意力”。

在采用注意力机制时，如图5所示，可以采用多兴趣注意网络来对历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行处理。即将历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量输入至多兴趣注意网络，可以得到候选视频集合与历史视频集合的相关性系数(权重系数)。在多兴趣注意网络中，主要利用注意力激活单元来生成注意力得分，具体实现为：

1、对输入的手机银行中历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行向量的元素减操作，得到元素减操作后的特征向量；

2、将元素减操作后的特征向量、历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行维度拼接，得到拼接后的特征向量；

3、将拼接后的特征向量送入全连接层，该层的激活函数为ReLU非线性函数，从全连接层输出后，最终送入无激活函数的全连接层，该全连接层只有一个输出单元，便于输出权重系数。其中，全连接层结构如图6所示，由多个人工神经元组成深度全连接神经网络，神经元的输入经过其相应的权重加权，上一层网络输出值可作为下一层网络的输入值，不断向前传播，当网络结构足够深时，可模拟任何复杂的函数。全连接层对拼接后的特征向量，采用Relu非线性激活函数得到候选视频集合与历史视频集合的相关性系数。其中，相关性系数与候选视频集合与历史视频集合的相似度有关。即计算候选视频集合与历史视频集合直接的相似度，当相似度越大时，说明候选视频和用户历史视频相关性大，符合用户偏好，则加大与候选视频相似的历史视频的权重，即更新候选视频和用户历史视频的相关性系数。其中，激活函数是指在多层神经网络中，上层神经元的输出和下层神经元的输入存在的一个函数关系。

4、根据候选视频和用户历史视频的相关性系数，得到加权处理后的历史视频集合多模态内容特征向量。

本实施例中，通过得到候选集合中的视频与用户所有历史视频的相关性系数的大小，能够达到对与候选视频相关性系数大的历史视频增加权重，从而使得根据历史视频的特征来对候选视频进行排序的手段更加准确，而不是单纯的求取历史视频的平均特征。

在一个实施例中，将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率包括：

将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量进行维度拼接，得到维度拼接后的特征向量；将维度拼接后的特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率。

具体地，本申请还采用预设视频推荐网络来得到候选视频集合中视频被观看概率，在预设视频推荐网络中，网络输入层包括加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量，其中候选视频集合的属性与环境特征向量包括候选视频集合的属性特征向量、与环境特征向量。如图7所示，将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量进行维度拼接，得到维度拼接后的特征向量，使得特征向量的维度变大。再送入预设视频推荐网络的全连接残差网络单元ResNet18，且本申请的全连接残差网络单元不同于现有的ResNet残差单元，本申请采用全连接层替代卷积神经网络层。

且本申请的预设视频推荐网络在网络旁路加入了直连通道，允许保留前面网络层一定比例的输出。通过短路连接，将网络每个残差模块的输出与输入进行逐元素相加。该手段操作简单而有效，没有给网络带来过多的参数量和计算量，同时加快了网络收敛的速度以及有效解决了由于层数加深而造成的“退化”问题。

进一步地，预设视频推荐网络的输出层为Softmax函数，将上一层的输出向量映射为一个概率分布，概率越大，说明用户观看该短视频的概率越大。最终得到候选视频集合中视频被观看概率。

本实施例中，对手机银行中加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量进行特征拼接，并输入至预设视频推荐网络的手段，从多个特征角度出发，不仅对候选视频集合中视频的结构化特征，如候选视频集合的属性与环境特征向量都进行了处理，且考虑到视频观看对象的特征，还对候选视频集合的非结构化特征，如内容特征进行多模态的特征处理，并考虑历史视频对候选视频中视频被观看概率的影响，实现从多个特征角度方面来准确获取候选视频集合中视频被观看概率。

在一个实施例中，如图8所示，以手机银行向手机银行用户A推荐短视频为例，手机银行中视频推荐方法包括：

S1、挖掘短视频特征与视频观看对象特征。获取手机银行中候选短视频集合、用户A在手机银行中历史观看过的短视频集合，其中，用户A历史观看过的短视频集合是经过筛选，去除掉用户A快速划过的视频的。进一步地，挖掘候选手机银行中短视频集合的属性特征、环境特征、及内容特征，挖掘手机银行中用户A历史观看过的短视频集合的内容特征，挖掘用户A本身的属性特征与行为特征。并对挖掘到的特征进行向量化处理，得到候选视频集合的属性特征向量、候选视频集合的环境特征向量、候选视频集合的内容特征向量、历史视频集合的内容特征向量、用户A的属性特征向量与行为特征向量。

S2、短视频多模态特征提取。本申请中多模态特征提取是针对非结构化的内容特征来进行多模态特征提取，内容特征包括封面图像信息、及文字描述信息，将封面图像信息、及文字描述信息拼接，同时输入至预设多模态Transformer模型，得到多模态内容特征向量。且短视频多模态特征提取不仅针对候选视频集合，还针对历史短视频集合。

S3、多兴趣注意力推荐网络搭建。搭建的多兴趣注意力推荐网络中包括输入层、有激活函数的全连接层、无激活函数的全连接层(包含一个输出单元)，将历史短视频集合多模态内容特征向量、及候选短视频集合多模态内容特征向量输入至多兴趣注意力推荐网络，计算出候选短视频和历史观看集合中每一个短视频的相关性，得到相关性系数；按照相关性系数对历史短视频集合的内容多模态特征向量进行加权处理，得到加权处理后的历史短视频集合多模态内容特征向量。

进一步地，还需要设计手机银行中的短视频推荐网络，短视频推荐网络的网络输入层包括加权处理后的历史短视频集合多模态内容特征向量、候选短视频集合多模态内容特征向量、用户A特征向量、候选短视频集合的属性特征向量、与环境特征向量五部分，将这五部分进行拼接后送入短视频推荐网络，经过softmax函数映射输出候选视频集合中视频被观看概率。

S4、获取短视频重排序结果。按照候选短视频集合中短视频被观看概率的高低顺序，对候选短视频集合中的短视频进行对应排序，候选短视频集合中短视频被观看概率高的排序在前，候选短视频集合中短视频被观看概率高的排序在后，并将排序完成的短视频进行推荐。并同时收集手机银行用户的行为日志，送至服务端，以及时收集手机银行用户的兴趣变化，从而更新特征挖掘，保证推荐的准确性。

应该理解的是，虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的手机银行中视频推荐方法的手机银行中视频推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个手机银行中视频推荐装置实施例中的具体限定可以参见上文中对于手机银行中视频推荐方法的限定，在此不再赘述。

在一个实施例中，如图9所示，提供了一种手机银行中视频推荐装置，包括：数据获取模块100、特征获取模块200、多模态特征分析模块300、历史加权模块400、特征分析模块500和视频推荐模块600，其中：

数据获取模块100，用于获取手机银行中候选视频集合、手机银行中历史视频集合、以及视频观看对象特征向量；

特征获取模块200，用于获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量；

多模态特征分析模块300，用于根据候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量，并根据历史视频集合的内容特征向量，得到历史视频集合多模态内容特征向量；

历史加权模块400，用于根据历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数，并根据相关性系数，对历史视频集合的内容多模态特征向量进行加权处理；

特征分析模块500，用于将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率；

视频推荐模块600，用于根据候选视频集合中视频被观看概率，对候选视频集合中的视频进行排序后推荐。

在一个实施例中，数据获取模块100还用于获取手机银行中历史已观看视频集合，并查询手机银行中历史已观看视频集合中各历史视频的观看时长记录；对比观看时长记录与预设观看时长阈值，得到对比结果；基于对比结果筛选历史已观看视频集合中的历史视频，得到手机银行中历史视频集合。

在一个实施例中，特征获取模块200还用于获取候选视频集合的属性与环境特征、候选视频集合的内容特征、与历史视频集合的内容特征；对候选视频集合的属性与环境特征进行one-hot向量编码，得到候选视频集合的属性与环境特征向量；根据候选视频集合的内容特征、及历史视频集合的内容特征，得到候选视频集合的第一封面图像信息与第一文字描述信息、及历史视频集合的第二封面图像信息与第二文字描述信息；对第一封面图像信息与第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量，并对第二封面图像信息与第二文字描述信息进行向量化处理，得到第二封面图像信息向量与第二文字描述信息向量；根据第一封面图像信息向量与第一文字描述信息向量，得到候选视频集合的内容特征向量，并根据第二封面图像信息向量与第二文字描述信息向量，得到历史视频集合的内容特征向量。

在一个实施例中，特征获取模块200还用于对第一封面图像信息进行映射编码和向量化处理，得到第一封面图像编码信息向量；对第一文字描述信息进行one-hot编码，并将编码后的第一文字描述信息输入至Word2Vec模型，得到降维后的第一文字描述编码信息向量；根据降维后的第一文字描述编码信息向量，得到第一文字描述信息向量。

在一个实施例中，多模态特征分析模块300还用于将候选视频集合的内容特征向量输入至预设多模态Transformer模型，得到候选视频集合多模态内容特征向量。

在一个实施例中，历史加权模块400还用于对历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行向量的元素减操作，得到元素减操作后的特征向量；将元素减操作后的特征向量、历史视频集合多模态内容特征向量、及候选视频集合多模态内容特征向量进行维度拼接，得到拼接后的特征向量；基于拼接后的特征向量，采用Relu非线性激活函数得到候选视频集合与历史视频集合的相关性系数。

在一个实施例中，特征分析模块500还用于将加权处理后的历史视频集合多模态内容特征向量、候选视频集合多模态内容特征向量、视频观看对象特征向量、候选视频集合的属性与环境特征向量进行维度拼接，得到维度拼接后的特征向量；将维度拼接后的特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率。

上述视频推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O)和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储候选视频集合、历史视频集合、视频观看对象特征向量、候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、以及历史视频集合的内容特征向量等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种视频推荐方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据，且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种手机银行中视频推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取手机银行中历史视频集合包括：

3.根据权利要求1所述的方法，其特征在于，所述获取候选视频集合的属性与环境特征向量、候选视频集合的内容特征向量、与历史视频集合的内容特征向量包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述第一封面图像信息与所述第一文字描述信息进行向量化处理，得到第一封面图像信息向量与第一文字描述信息向量包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述候选视频集合的内容特征向量，得到候选视频集合多模态内容特征向量包括：

6.根据权利要求1所述的方法，其特征在于，所述根据所述历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量，得到候选视频集合与历史视频集合的相关性系数包括：

7.根据权利要求1所述的方法，其特征在于，所述将加权处理后的历史视频集合多模态内容特征向量、所述候选视频集合多模态内容特征向量、所述视频观看对象特征向量、所述候选视频集合的属性与环境特征向量输入至预设视频推荐网络，得到候选视频集合中视频被观看概率包括：

8.一种手机银行中视频推荐装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。