CN113590965A

CN113590965A - 一种融合知识图谱与情感分析的视频推荐方法

Info

Publication number: CN113590965A
Application number: CN202110896190.XA
Authority: CN
Inventors: 薛峰; 盛一城; 刘学亮; 郝世杰; 闵海; 罗月童; 汪萌
Original assignee: Hefei University of Technology; Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Current assignee: Hefei University of Technology; Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority date: 2021-08-05
Filing date: 2021-08-05
Publication date: 2021-11-02
Anticipated expiration: 2041-08-05
Also published as: CN113590965B

Abstract

本发明公开了一种融合知识图谱与情感分析的视频推荐方法，包括：1、使用知识图谱作为额外辅助信息，通过文本卷积神经网络提取视频特征生成视频向量；2、构建情感兴趣预测模型，眼动仪采集的眼动数据通过广义回归神经网络生成情感向量；3、将历史视频向量与对应的视频情感向量进行拼接经过神经网络DNN生成历史视频最终向量，计算所有历史视频最终向量的加和平均值动态的构建用户向量；4、候选视频向量和用户向量拼接后通过多层感知计算用户点击候选视频的概率，得到Top‑N推荐列表。本发明通过建立融合知识图谱与情感分析的视频推荐模型，用于用户的个性化推荐，并能提高推荐精度。

Description

一种融合知识图谱与情感分析的视频推荐方法

技术领域

本发明属于计算机机器学习与人工智能技术领域，主要是涉及一种融合知识图谱与情感分析的视频推荐方法。

背景技术

近些年来互联网技术的进步突飞猛进，互联网用户的数量也呈几何倍的速度爆炸增长，这其中就产生了海量的数据，传统的搜索引擎技术虽然可以帮助我们寻找到满意的信息，但当我们没有明显的需求情况下，面对海量的数据，很难找到自己感兴趣的信息。因此，为了解决这种“信息过载”的问题，推荐系统应运而生。简单来说，推荐系统会根据用户的使用习惯，如用户的历史记录等，去了解用户的兴趣，通过建模用户兴趣偏好，将用户可能感兴趣的信息推荐给用户，从而满足用户的个性化需求。推荐算法被广泛地应用于各种领域如电子商务、社交应用以及新闻媒体等，对有效减轻信息过载尤为重要。

传统的推荐系统只使用用户和物品的交互信息作为输入，通过描述用户或物品的现有特性(如ID属性)映射来获得用户或物品的Embedding表示。然而这样的方法应用到视频推荐中会存在以下的缺点，即无法发现视频之间潜在的知识级连接，也无法利用用户在观看视频时产生的情感，不能区分出用户对不同视频的兴趣偏好程度。这样一来，用户观看视频的模式就会被限制在一个有限的范围内，无法在现有的基础上合理扩展推荐的方法。

发明内容

本发明是为了解决上述现有技术存在的不足之处，提出一种融合知识图谱与情感分析的视频推荐方法，以期能发现视频之间潜在的知识级连接，并且充分利用用户在观看视频时产生的情感，以提高不同用户对不同视频的兴趣偏好程度的区分度，从而达到更好的推荐效果和较高的精度。

本发明为解决技术问题采用如下技术方案：

本发明一种融合知识图谱与情感分析的视频推荐方法的特点是按照如下步骤进行：

步骤1、融合通用知识图谱：

步骤1.1、获取用户u在一段时间内观看过的视频作为历史视频，并将历史视频的视频标题记为

表示用户u观看过的第i个历史视频的视频标题，i∈[1,N_u]，N_u为用户u观看过的视频总量；同时获取推荐给用户u的M个候选视频的视频标题

表示第j个候选视频的视频标题，j∈[1,M]，M为推荐给用户u的候选视频数目；

步骤1.2、分别提取所述第i个历史视频的视频标题

与第j个候选视频的视频标题

中的词向量，记为

和

其中，

表示第i个历史视频的视频标题

中第n个词向量，

表示第j个候选视频的视频标题

中第n个词向量，N为视频标题中词向量数量的最大值；

步骤1.3、标注视频标题{t_u,t_h}中的每个单词为实体词，并获取通用知识图谱中对应的实体，从而利用实体链接和消除歧义构建知识子图；

步骤1.4、利用知识图谱表示学习模型TransE分别提取所述知识子图中第i个历史视频的视频标题

中的实体词对应的实体向量

以及第j个候选视频的视频标题

中的实体词对应的实体向量

其中，

表示第i个历史视频的视频标题

中第n个单词对应的实体向量；

表示第j个候选视频的视频标题

中第n个单词对应的实体向量；

步骤1.5、根据所述实体向量

和

分别获取所述知识子图中与相应实体向量相互关联的其他实体向量，并将与相应实体向量相互关联的其他实体向量的平均值分别作为对应实体向量的实体上下文向量

和

步骤1.6、将第n个词向量

实体向量

和实体上下文向量

进行拼接，得到拼接后的第n个历史视频特征向量

从而得到N个历史视频特征向量；

将第n个词向量

实体向量

和实体上下文向量

进行拼接，得到拼接后的第n个候选视频特征向量

从而得到N个候选视频特征向量；

步骤1.7、将N个历史视频特征向量和N个候选视频特征向量分别送入文本卷积神经网络中，并经过卷积、池化操作后，得到视频向量e(t)，包括：历史视频向量

候选视频向量

步骤2、建立基于眼动数据的情感兴趣预测模型；

步骤2.1、利用眼动仪装置捕捉用户u观看第i个历史视频的眼动数据并进行归一化处理，得到第i个眼动向量

从而得到眼动向量集合

步骤2.2、将第i个眼动向量

输入广义回归神经网络的输入层中，并经过模式层的处理后，得到如式(1)所示的模式层中第k个神经元输出

式(2)中，

为广义回归神经网络的输入，

为眼动向量集合X_u中第k个眼动向量，σ为平滑参数，k∈[1,N_u]；

步骤2.3、利用式(2)和式(3)分别计算广义回归神经网络的求和层中S型神经元的第i个输出

以及第r个T型神经元的第i个输出

式(3)中，y_k,r为模式层中第k个神经元与求和层中第r个T型神经元之间的连接权值，r＝1,2,3；

步骤2.4、利用式(4)得到广义回归神经网络的输出层中第r个神经单元的第i个输出值

从而得到第i个眼动向量

对应的视频情感向量

进而得到

步骤2.5、使用r个神经单元的输出值分别对应中文简化版PAD情绪量表中P维情感值

A维情感值

和D维情感值

从而利用式(5)、式(6)和式(7)将三维情感值与广义回归神经网络的输出进行关联，得到关联后的视频情感向量

步骤3、在用户向量e(u)嵌入过程中引入视频情感向量Y_u；

步骤3.1、将第i个历史视频的视频标题

所对应的历史视频向量

与用户u观看完第i个历史视频得到的视频情感向量

进行拼接后，输入神经网络DNN进行情感融合，得到第i个历史视频的视频标题

对应的历史视频最终向量

从而得到历史视频最终向量集合

步骤3.2、利用式(8)构建用户向量e(u)；

步骤4、建立融合知识图谱与情感分析的视频推荐模型的损失函数；

步骤4.1、利用式(9)建立基于眼动数据的情感兴趣预测模型的损失函数L₁：

式(9)中，

为用户u观看完第i个历史视频后填写中文简化版PAD情绪量表所获取的真实值，且

为中文简化版PAD情绪量表中P维情感值的真实值，

为中文简化版PAD情绪量表中A维情感值的真实值，

为中文简化版PAD情绪量表中D维情感值的真实值；

步骤4.2、利用式(10)建立推荐模型的损失函数L₂：

式(10)中，

表示用户u、用户u观看过的视频以及未看过的候选视频组成的三元组，sigmoid表示激活函数，

和

分别表示用户u对观看过的历史视频和未观看过的候选视频的偏好得分，λ₂表示正则化系数，||·||₂表示二范数正则化，W表示多层感知机的权值系数矩阵；

步骤4.3、利用式(11)建立情感兴趣预测模型与推荐模型组成的融合视频推荐模型的损失函数L：

L＝λ₁L₁+L₂ (11)

式(11)中，λ₁表示另一正则化系数；

步骤5、将用户向量e(u)与候选视频向量e(t_h)进行拼接后，输入所述多层感知机中预测点击率，并利用Adam优化器对所述融合视频推荐模型进行训练，使得损失函数L达到最小，从而得到最优融合视频推荐模型，并用于用户的个性化视频推荐。

与现有技术相比，本发明的有益效果在于：

1.本发明通过使用知识图谱作为额外辅助内容去丰富视频的语义信息，融入了用户的情感向量的协同过滤框架，建立了融合知识图谱与情感分析的视频推荐模型的损失函数，不仅能发现视频之间潜在的知识级连接，还可以利用用户在观看视频时产生的情感，区分出用户对不同视频的兴趣偏好程度，从而可以更加准确的学习用户与视频的交互关系，实现了更好的推荐效果。

2.本发明通过融合通用知识图谱发现视频内容间的深层逻辑关系，使用文本卷积神经网络同时提取视频标题中的实体向量、词向量与实体上下文向量，得到视频向量，以丰富视频的语义信息，从而能有效发现视频之间潜在的知识级连接。

3.本发明构建了基于眼动数据的情感兴趣预测模型，通过眼动仪装置获取用户在观看视频后的眼动数据，使用广义回归神经网络提取眼动数据特征，输出该视频的视频情感向量，即将视频映射到了用户的情感空间之中，从而可以利用眼动数据预测用户的情感状态，并将情感量化以用于融合历史视频向量去构建用户向量。

4.本发明在用户向量嵌入过程中引入情感向量，将历史视频向量与其对应的视频情感向量进行拼接经过神经网络DNN生成历史视频最终向量，计算所有历史视频最终向量的加和平均值动态的构建用户向量，从而提高了不同用户对不同视频的兴趣偏好程度的区分。

5.本发明建立了融合知识图谱与情感分析的视频推荐模型的损失函数，利用Adam优化器对模型进行训练，可以更加准确的学习用户与视频的交互关系，实现了更好的推荐效果。

附图说明

图1为本发明的模型结构图；

图2为本发明的实施流程图。

具体实施方式

本实施例中，一种融合知识图谱与情感分析的视频推荐方法是通过使用知识图谱作为额外辅助内容去丰富视频的语义信息，发现视频之间潜在的知识级连接。构建情感兴趣预测模型将眼动仪装置采集到的眼动数据与用户的情感状态关联起来，并将情感量化，并且在用户向量嵌入过程中引入了情感向量，克服了不同用户对不同视频的兴趣偏好程度的区分不足的弱点。本方法的模型结构图如图1所示，模型的输入部分有三个方面，候选视频的视频标题构成的集合t_h、历史视频的视频标题构成的集合t_u以及用户在观看完视频后被眼动仪捕捉下来的眼动数据构成的集合X_u，从视频标题{t_u,t_h}中生成的词向量、实体向量和实体上下文向量拼接后分别通过文本卷积神经网络提取特征，形成相应的候选视频向量集合e(t_h)和历史视频向量集合e(t_u)，被记录下来的眼动数据集合X_u经过处理后送入情感兴趣预测模型之中，情感兴趣预测模型由广义回归神经网络构成，输出视频情感向量的集合

即将用户的眼动数据与观看视频时的情感状态关联起来，将该视频映射到了用户的情感空间之中。历史视频向量e(t_u)会与其对应的视频情感向量

进行拼接送入神经网络DNN中形成历史视频最终向量的集合s(t_u)，将这些历史视频最终向量s(t_u)做加和平均动态的构建用户向量e(u)，用户向量e(u)与候选视频向量e(t_u)经过拼接后通过多层感知得到用户的点击概率，从而完成视频的个性化推荐。具体的说，如图2所示，该方法是按照如下步骤进行：

步骤1、融合通用知识图谱，用来丰富视频的语义信息，发现视频之间潜在的知识级连接；

步骤1.2、分别提取第i个历史视频的视频标题

与第j个候选视频的视频标题

中的词向量，记为

和

其中，

表示第i个历史视频的视频标题

中第n个词向量，

表示第j个候选视频的视频标题

中第n个词向量，N为视频标题中词向量数量的最大值，在本实例中，w_u,i和w_h,j长度未达到N的部分，用零向量填充；

步骤1.4、利用知识图谱表示学习模型TransE分别提取知识子图中第i个历史视频的视频标题

中的实体词对应的实体向量

以及第j个候选视频的视频标题

中的实体词对应的实体向量

其中，

表示第i个历史视频的视频标题

中第n个单词对应的实体向量；

表示第j个候选视频的视频标题

中第n个单词对应的实体向量，在本实施例中，若第i个历史视频的视频标题

中第n个单词或第j个候选视频的视频标题

中第n个单词没有对应的实体向量，则用零向量填充；

步骤1.5、根据实体向量

和

分别获取知识子图中与相应实体向量相互关联的其他实体向量，并将与相应实体向量相互关联的其他实体向量的平均值分别作为对应实体向量的实体上下文向量

和

步骤1.6、将第n个词向量

实体向量

和实体上下文向量

进行拼接，得到拼接后的第n个历史视频特征向量

从而得到N个历史视频特征向量；

将第n个词向量

实体向量

和实体上下文向量

进行拼接，得到拼接后的第n个候选视频特征向量

从而得到N个候选视频特征向量；

候选视频向量

步骤2、建立基于眼动数据的情感兴趣预测模型，将眼动数据与用户观看视频后的情感状态关联起来，将视频映射到用户的情感空间之中，从而可以利用眼动数据预测用户的情感状态，并将情感量化以用于融合历史视频向量去构建用户向量；

从而得到眼动向量集合

步骤2.2、将第i个眼动向量

式(2)中，

为广义回归神经网络的输入，

为眼动向量集合X_u中第k个眼动向量，σ为平滑参数，在本实例中σ的初始化取值为1.0，k∈[1,N_u]；

以及第r个T型神经元的第i个输出

式(3)中，y_k,r为模式层中第k个神经元与求和层中第r个T型神经元之间的连接权值，r＝1,2,3，在本实例中，y_k，r的取值为第i个输出样本

中的第r个元素；

从而得到第i个眼动向量

对应的视频情感向量

进而得到

A维情感值

和D维情感值

步骤3、在用户向量e(u)嵌入过程中引入视频情感向量Y_u，提高了不同用户对不同视频的兴趣偏好程度的区分；

步骤3.1、将第i个历史视频的视频标题

所对应的历史视频向量

与用户u观看完第i个历史视频得到的视频情感向量

对应的历史视频最终向量

从而得到历史视频最终向量集合

步骤3.2、利用式(8)构建用户向量e(u)；

式(9)中，

为中文简化版PAD情绪量表中P维情感值的真实值，

为中文简化版PAD情绪量表中A维情感值的真实值，

为中文简化版PAD情绪量表中D维情感值的真实值；

步骤4.2、利用式(10)建立推荐模型的损失函数L₂：

式(10)中，

和

L＝λ₁L₁+L₂ (11)

式(11)中，λ₁表示另一正则化系数；

步骤5、模型的预测与优化：将用户向量e(u)与候选视频向量e(t_h)进行拼接后，输入上述多层感知机中预测点击率，并利用Adam优化器对融合视频推荐模型进行训练，使得损失函数L达到最小，从而得到最优融合视频推荐模型，并用于用户的个性化视频推荐。

综上所述，通过使用知识图谱作为额外辅助信息，通过文本卷积神经网络提取视频的知识表示和语义表示，可以发现视频之间潜在的知识级连接，构建基于眼动数据的情感兴趣预测模型可以很好的预测用户情感状态，在用户向量嵌入过程中引入情感向量，可以提高不同用户对不同视频的兴趣偏好程度的区分。此外，还考虑建立了融合知识图谱与情感分析的视频推荐模型的损失函数，利用Adam优化器进行训练，使得模型可以实现更好的推荐效果。