CN112699831B

CN112699831B - 基于弹幕情感的视频热点片段检测方法、装置及存储介质

Info

Publication number: CN112699831B
Application number: CN202110019644.5A
Authority: CN
Inventors: 吴渝; 张运凯; 杨杰; 李芊
Original assignee: Chongqing University of Post and Telecommunications
Current assignee: Chongqing University of Post and Telecommunications
Priority date: 2021-01-07
Filing date: 2021-01-07
Publication date: 2022-04-01
Anticipated expiration: 2041-01-07
Also published as: CN112699831A

Abstract

本发明公开了基于弹幕情感的视频热点片段检测方法、装置及存储介质，包括对获取到的弹幕视频进行清洗，并对清洗后的弹幕视频进行切分，构造弹幕情感词典，对视频片段中的弹幕进行情感强度计算和整体情感倾向进行判定；计算相邻视频片段的情感强度变化率；使用LDA主题模型进行主题提取，计算相邻视频片段的主题相似度；构造热点视频片段检测模型；将需要检测的弹幕视频输入到模型中，得到热点视频片段。本发明构建的弹幕情感词典提升了弹幕情感强度计算准确度，弹幕情感强度计算方法能够得到更为准确的情感强度计算结果，直接对应弹幕文本的分析满足用户利用情感倾向和关键词检索热点片段的需求，具有较高的检测准确度。

Description

基于弹幕情感的视频热点片段检测方法、装置及存储介质

技术领域

本发明涉及网络舆情领域，具体涉及基于弹幕情感的视频热点片段检测方法、装置及存储介质。

背景技术

近年来，随着网络视频的流行，视频数量爆炸式增长，高效为用户群体推送高质量的符合内容需求和情感倾向的热点视频片段具有重要现实意义。而现有的视频网站检测视频热点片段方法主要有人工筛选剪辑、机器自动识别。对于日益产生的视频数据，人工剪辑方式效果不佳、耗时久、成本高，机器自动识别检测准确度低。

机器自动识别热点视频片段检测主要有两种方法，是基于视频中的弹幕数量与阈值的大小检测，是基于视频片段的情感特征检测。基于视频弹幕数量与阈值大小的检测方法，无法满足用户根据内容和情感倾向选择热点片段。基于视频片段的情感特征检测方法主要分为两类：一类是基于情感词典的方法，一类是基于有监督的机器学习方法。基于情感词典方法主要利用情感词典计算情感强度，但是弹幕文本口语化明显、网络新词多，情感强度计算不准确。基于有监督的机器学习方法需要大量标记语料，且无法量化情感强度。因此需要新的视频热点片段检测方法，可以满足用户利用情感倾向和关键词检索热点片段的需求，提高检测准确度。

发明内容

本发明提供基于弹幕情感的视频热点片段检测方法、装置及存储介质，利用情感倾向和关键词检索热点视频片段，提高热点视频片段检测准确度，本发明中热点视频片段的定义为：观众情感波动大且情感强度高的视频片段，且对于视频片段中出现的内容，讨论的话题集中。

本发明通过下述技术方案实现：

基于弹幕情感的视频热点片段检测方法，具体步骤包括：

步骤S1、对获取到的弹幕视频进行清洗，并对清洗后的弹幕视频进行切分，得到视频片段；

步骤S2、构造弹幕情感词典，使用构造的弹幕情感词典对步骤S2中视频片段中的弹幕进行情感强度计算，得到视频片段的整体情感强度，并根据整体情感强度对视频片段的整体情感倾向进行判定；

步骤S3、根据步骤S2中得到的各视频片段的整体情感强度，计算相邻视频片段的情感强度变化率；

步骤S4、使用LDA主题模型对视频片段进行主题提取，生成视频片段对应的主题-关键词概率分布，计算相邻视频片段的主题相似度；

步骤S5、对步骤S2中的视频片段的整体情感强度、步骤S3的相邻视频片段的情感强度变化率及步骤S4中的相邻视频片段的主题相似度设置阈值，构造热点视频片段检测模型；

步骤S6、将获取到的弹幕视频输入到热点视频片段检测模型中，得到弹幕视频的热点视频片段。

进一步优选，步骤S1的具体步骤包括：

对清洗后的弹幕视频进行切分，得到含有k个视频片段的弹幕视频分段集合V，V＝{s₁，s₂，…s_k}，s_k代表弹幕视频分段集合V中第k个视频片段，s_k的时间长度为定值T_s，将弹幕c定义为三元组(w_c，t_c，t_d)，其中w_c代表弹幕c中的关键词集合，t_c代表弹幕c在弹幕视频中的时间戳，t_d代表弹幕发布的时间距离弹幕视频上线时间的天数。3、根据权利要求1所述的基于弹幕情感的视频热点片段检测方法，其特征在于，步骤S3中构造弹幕情感词典的步骤包括：

采用大连理工大学情感本体库词典为初始词典，共含有情感词27466个，将情感分为7种：好、乐、哀、怒、惧、恶、惊，其中，乐和好属于正向情感，哀、怒、惧、恶和惊属于负向情感，将每种正向情感的强度分为1、3、5、7、9五档，负向情感分为-1、-3、-5、-7、-9五档；在所述初始词典的基础上扩充弹幕颜表情词典，如“ψ(`')ψ”、“(

皿

#)”，并确定颜表情权重；扩充语气词典，如弹幕“哈哈”、“唉”等，防止这些语气词当作停用词给过滤掉；扩充否定词典，根据弹幕常用的71个否定副词，将否定副词的权重设为-1；扩充弹幕网络情感新词词典，部分网络词更加简短和口语化，从弹幕视频中和搜狗输入法的词库中整理筛选网络情感新词进行扩充，如“秀”、“打call”等，并定义所述网络情感新词的情感权重。

进一步优选，步骤S2中对视频片段的情感强度计算和情感倾向判定的具体过程为：

步骤S21、根据弹幕特有的时序性特征，计算视频片段中每条弹幕的情感强度，并根据计算的情感强度将弹幕定义为正向情感弹幕或负向情感弹幕，计算情感强度的公式如下：

其中，t_d为弹幕c发布的时间距离弹幕视频上线时间的天数，t_sum是弹幕视频发布的总天数；

表示弹幕中第j个情感词e_j前有neg_j个否定副词和q_j个程度副词修饰时的情感强度，E_m为弹幕c中颜表情的权重，n_m为弹幕c中颜表情的个数；当eⁱ>0时，定义弹幕c为正向情感弹幕，当eⁱ≤0时定义弹幕c为负面情感弹幕；

步骤S22、将步骤S21中计算的每条弹幕的情感强度累加求和得到视频片段s_k的整体情感强度

其中，S_c表示视频片段s_k中弹幕的条数；

步骤S23、根据步骤S22的计算结果，定义情感倾向

当

时，

定义视频片段s_k的整体情感倾向为正向；

当

时，

定义视频片段s_k的整体情感倾向为负向；

当

时，

定义视频片段s_k的整体情感倾向为中性。

进一步优选，计算相邻视频片段的情感强度变化率的具体过程包括：

对弹幕视频分段集合V中的每一个视频片段进行情感倾向的判定，所有视频片段的情感倾向向量表示为

计算弹幕视频分段集合V的片段平均情感强度Avg(E_v)，计算公式如下：

计算视频片段s_k的终止时间t_e时刻的情感变化率k_e，相邻视频片段的时间间隔为T_s，计算两个相邻视频片段的情感强度变化率

计算公式如下：

其中，

为视频片段s_k的整体情感强度，

为视频片段s_k-1的整体情感强度，k＝1时，

计算弹幕视频分段集合V的相邻片段平均情感强度变化率

计算公式如下：

进一步优选，步骤S4的具体过程包括：

步骤S41、采用LDA主题模型，对切分后的视频片段进行主题提取，生成视频片段对应的文档-主题、主题关键词概率分布；

步骤S42、根据步骤S41生成的视频片段对应的文档-主题、主题关键词概率分布，提取视频片段每个主题的前m个主题关键词及权重，生成视频片段的主题关键词集合和主题关键词权重集合，其中，主题关键词集合表示为：

表示主题t_K中第m个关键词；

主题关键词权重集合表示为：

其中，

表示主题t_K中第m个关键词的权重；

步骤S43、利用Jaccard相似度计算视频片段主题关键词相似度，利用余弦相似度计算视频片段主题关键词权重的相似度；

步骤S44、结合步骤S43中计算的视频片段主题关键词相似度和视频片段主题关键词权重的相似度计算相邻视频片段之间的主题相似度。

进一步优选，相邻视频片段主题相似度的计算公式如下：

其中，s_u和s_v为相邻视频片段，

分别表示视频片段s_u和s_v的主题关键词特征集合，

分别表示视频片段s_u和s_v主题关键词权重的集合，

表示视频片段s_u和s_v的主题关键词相似度，取值范围为(0，1]，

表示视频片段s_u和s_v的相同主题关键词权重向量的相似度。

进一步优选，构造热点片段检测模型的步骤包括：

步骤S51、按照弹幕视频分段集合V中各视频片段的时间，对各视频片段逐个进行热点片段特征计算，热点片段特征计算包括：计算各视频片段的整体情感强度

计算弹幕视频分段集合V的情感倾向向量V_f和片段平均情感强度Avg(E_v)，计算两个相邻视频片段的情感强度变化率

步骤S52、根据步骤S51的热点片段特征计算结果对弹幕视频分段集合V中的视频片段搜索热点视频片段的起始点，若其中一个视频片段s_k与其相邻的视频片段s_k-1的情感强度变化率

大于相邻片段平均情感强度变化率

且该视频片段的整体情感强度

大于片段平均情感强度Avg(E_v)，则认为该视频片段s_k为热点视频片段的起始片段，并更新起始热点视频片段集合D，并合并相邻的视频片段s_k和s_k-1；

步骤S53、根据视频片段主题关键词和主题关键词权重，计算相邻视频片段的主题相似度，判断视频片段的整体情感强度是否大于片段平均情感强度Avg(E_v)且相邻视频片段主题相似度是否大于δ，相邻视频片段主题相似度的取值范围为(0，1]，δ表示根据实际视频片段检测需求的取值，初始值取0.5；

步骤S54、若步骤S53中的判断结果为是，则认为该视频片段为热点视频片段，更新热点视频片段窗口W；

步骤S55、按照起始热点视频片段集合D中视频片段的时间顺序，重复步骤S53-S54，依次进行所有视频片段的热点片段检测，直至遍历完起始热点视频片段集合D中所有的起始热点视频片段。

另外，本发明提出基于弹幕情感的视频热点片段检测装置，包括预处理模块、情感计算模块、主题相似度计算模块、边界判定模块、检测模块，其中，

预处理模块用于对获取到的弹幕视频数据进行片段划分和数据清洗，得到视频片段，构造弹幕情感词典；

情感计算模块用于使用预处理模块构建的弹幕情感词典对视频片段进行整体情感强度计算并进行整体情感倾向的判定，对已经完成整体情感强度计算的视频片段进行相邻视频片段情感强度变化率的计算；

主题相似度计算模块用于对视频片段进行主题相似度计算，使用LDA主题模型对视频片段进行主题提取，并计算相邻视频片段的主题相似度；

边界判定模块用于对视频片段的整体情感强度、情感强度变化率及相邻视频片段的主题相似度设置阈值，对热点视频片段的起始时间进行标识，构造热点视频片段检测模型；

检测模块用于将获取的弹幕视频输入到构造的热点视频片段检测模型中，得到弹幕视频的热点视频片段。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在运行时实现上述的基于弹幕情感的视频热点片段检测方法。

本发明与现有技术相比，具有如下的优点和有益效果：

1、本发明基于弹幕情感的视频热点片段检测方法、装置及存储介质，构建一种弹幕情感词典，核心思想为采用大连理工大学情感本体库词典为初始词典，扩充弹幕颜表情词典、语气词典、否定词典及弹幕网络词典，并人工定义其情感权重。改进后的弹幕情感词典可适用于弹幕文本情景下的情感分析，提升弹幕情感强度计算准确度；

2、本发明基于弹幕情感的视频热点片段检测方法、装置及存储介质，综合考虑颜表情、语气词和网络用语，同时结合弹幕时序性特征，提出了一种新的弹幕情感强度计算方法，能够得到更为准确的情感强度计算结果；

3、本发明基于弹幕情感的视频热点片段检测方法、装置及存储介质，将热点片段检测问题从视频帧的分析转化为对视频片段对应弹幕文本的分析，满足用户利用情感倾向和关键词检索热点片段的需求，具有较高的检测准确度。

附图说明

此处所说明的附图用来提供对本发明实施例的进一步理解，构成本申请的一部分，并不构成对本发明实施例的限定。在附图中：

图1是本发明方法的总体流程图；

图2是本发明提供的情感计算流程图；

图3是本发明提供相邻视频片段主题相似度计算的流程图；

图4是本发明构造热点视频片段检测模型流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白，下面结合实施例和附图，对本发明作进一步的详细说明，本发明的示意性实施方式及其说明仅用于解释本发明，并不作为对本发明的限定。

在以下描述中，为了提供对本发明的透彻理解阐述了大量特定细节。然而，对于本领域普通技术人员显而易见的是：不必采用这些特定细节来实行本发明。在其他实例中，为了避免混淆本发明，未具体描述公知的结构、电路、材料或方法。

在整个说明书中，对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着：结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此，在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外，可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外，本领域普通技术人员应当理解，在此提供的示图都是为了说明的目的，并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。

在本发明的描述中，需要理解的是，术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低””内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明保护范围的限制。

实施例1

如图1所示，本发明基于弹幕情感的视频热点片段检测方法，总体整体流程图如图1所示，具体包括步骤S1-S7：

步骤S3、根据步骤S2中得到的各视频片段的整体情感强度，计算各视频片段的情感强度变化率；

步骤S4、根据视频片段对应的主题-关键词概率分布，使用LDA主题模型对视频片段进行主题提取，计算相邻视频片段的主题相似度；

步骤S5、对步骤S2中的视频片段的整体情感强度、步骤S3的情感强度变化率及步骤S4中的相邻视频片段的主题相似度设置阈值，构造热点视频片段检测模型；

在步骤S1中，对视频片段中的弹幕进行清洗即过滤筛选，作为示例，过滤筛选的规则为在相应时长的视频中没有达到相应弹幕数量的视频过滤，具体的对照标准如表1所示：

表1弹幕数量对照标准表

视频时长	弹幕池上限
		0–3min	500
3–10min	1000
		10–15min	1500
15–35min	3000
		35–60min	6000
60min以上	8000

对上述清洗后的弹幕视频进行切分，得到含有k个视频片段的弹幕视频分段集合V，V＝{s₁，s₂，…s_k}，s_k代表弹幕视频分段集合V中第k个视频片段，s_k的时间长度为定值T_s，将弹幕c定义为三元组(w_c，t_c，t_d)，其中w_c代表弹幕c中的关键词集合，t_c代表弹幕c在弹幕视频中的时间戳，t_d代表弹幕发布的时间距离弹幕视频上线时间的天数。

在步骤S2中，通过采用大连理工大学情感本体库词典为初始词典，通过弹幕对弹幕文本内容的分析，构造适用于弹幕视频的情感词典，初始词典中共含有情感词27466个，并将弹幕情感分为7种：好、乐、哀、怒、惧、恶、惊，其中，乐和好属于正向情感，哀、怒、惧、恶和惊属于负向情感，将每种正向情感的强度分为1、3、5、7、9五档，负向情感分为-1、-3、-5、-7、-9五档；

在上述初始词典的基础上扩充弹幕颜表情词典，颜表情是基于ASCII的符号组成的，如“ψ(`')ψ”、“(

皿

#)”，本示例中收集了328个常用的表情符号，并根据表情特征人工确定表情权重，部分颜表情词典格式如表2所示：

表2部分颜表情词典

扩充语气词典，弹幕中存在很多语气词组成的弹幕，如弹幕“哈哈”、“唉”等，防止这些语气词当作停用词给过滤掉，部分语气词典如表3所示：

表3语气词典

语气词	类别	权重
			笑死	乐	5
好气	怒	-1
			唉	哀	-5
我的天	惊	1

扩充否定词典，根据弹幕常用的71个否定副词，将否定副词的权重设为-1；扩充弹幕网络情感新词词典，部分网络词更加简短和口语化，从弹幕视频中和搜狗输入法的词库中整理筛选网络情感新词进行扩充，如“秀”、“打call”等，并定义所述网络情感新词的情感权重。

通过上述构造的弹幕情感词典，对弹幕文本进行分词，去除停用词后，根据情感词典的情感词、副词、否定词、颜表情和弹幕的发送时间等指标进行弹幕情感强度的计算、情感倾向的判断具体过程包括如图2所示，具体包括步骤S21-S23：

其中，S_c表示视频片段s_k中弹幕的条数；

步骤S23、根据步骤S22的计算结果，定义情感倾向T_sk，当

时，

定义视频片段s_k的整体情感倾向为正向；

当

时，

定义视频片段s_k的整体情感倾向为负向；

当

时，

定义视频片段s_k的整体情感倾向为中性。

步骤S3中计算相邻视频片段的情感强度变化率的过程包括：

计算公式如下：

其中，

为视频片段s_k的整体情感强度，E_sk-1为视频片段s_k-1的整体情感强度，k＝1时，

计算弹幕视频分段集合V的相邻片段平均情感强度变化率

计算公式如下：

如图3所示，步骤S4的具体过程包括步骤S41-S44：

步骤S41、采用LDA主题模型，对切分后的视频片段进行主题提取，生成视频片段对应的文档-主题、主题关键词概率分布；具体的，采用LDA主题模型利用视频中的弹幕文本内容，提取视频片段主题，初始设置K个隐含主题Topic_i(t₁，t₂，t₃，...t_K)，使得每个视频片段都能得到一个主题分布，每个关键词都能在视频片段中对应一个主题；

步骤S42、根据步骤S41生成的视频片段对应的文档-主题、主题关键词概率分布，提取视频片段每个主题的前m个主题关键词及主题关键词权重，生成视频片段的主题关键词集合和主题关键词权重集合，其中，主题关键词集合表示为：

表示主题t_K中第m个关键词；

主题关键词权重集合表示为：

其中，

表示主题t_K中第m个关键词的权重；

步骤S44、结合步骤S43中计算的视频片段主题关键词相似度和视频片段主题关键词权重的相似度计算相邻视频片段之间的主题相似度，相邻视频片段主题相似度的计算公式如下：

其中，s_u和s_v为相邻视频片段，

分别表示视频片段s_u和s_v的主题关键词特征集合，

分别表示视频片段s_u和s_v主题关键词权重的集合，

表示视频片段s_u和s_v的相同主题关键词权重向量的相似度。

如图4所示，步骤S5中构造热点片段检测模型的步骤包括S51-S55：

大于相邻片段平均情感强度变化率

且该视频片段的整体情感强度

步骤S53、根据视频片段主题关键词和主题关键词权重，计算相邻视频片段的主题相似度，判断视频片段的整体情感强度是否大于片段平均情感强度Avg(E_v)且相邻视频片段的主题相似度是否是否大于δ，相邻视频片段主题相似度的取值范围为(0，1]，δ表示根据实际视频片段检测需求的取值，初始值取0.5；

实施例2

本发明提供基于弹幕情感的视频热点片段检测装置，包括预处理模块、情感计算模块、主题相似度计算模块、边界判定模块、检测模块，其中，

使用基于弹幕情感的视频热点片段检测装置时采用实施例1中描述的基于弹幕情感的视频热点片段检测方法，在此就不一一赘述。

实施例3

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在运行时实现实施例1中所述的基于弹幕情感的视频热点片段检测方法。

可以理解的是，本发明综合考虑颜表情、语气词和网络用语，构建了新的弹幕情感词典，提升弹幕情感强度计算准确度；同时结合弹幕时序性特征，提出新的弹幕情感强度计算方法，能够得到更为准确的情感强度计算结果；将热点视频片段检测问题从视频帧的分析转化为对视频片段对应弹幕文本的分析，满足用户利用情感倾向和关键词检索热点片段的需求，具有较高的检测准确度。

以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.基于弹幕情感的视频热点片段检测方法，其特征在于，具体步骤包括：

2.根据权利要求1所述的基于弹幕情感的视频热点片段检测方法，其特征在于，步骤S1的具体步骤包括：

对清洗后的弹幕视频进行切分，得到含有k个视频片段的弹幕视频分段集合V，V＝{s₁，s₂，…s_k}，s_k代表弹幕视频分段集合V中第k个视频片段，s_k的时间长度为定值T_s，将弹幕c定义为三元组(w_c，t_c，t_d)，其中w_c代表弹幕c中的关键词集合，t_c代表弹幕c在弹幕视频中的时间戳，t_d代表弹幕发布的时间距离弹幕视频上线时间的天数。

3.根据权利要求1所述的基于弹幕情感的视频热点片段检测方法，其特征在于，步骤S2中构造弹幕情感词典的步骤包括：

采用大连理工大学情感本体库词典为初始词典，将情感分为7种：好、乐、哀、怒、惧、恶、惊，其中，乐和好属于正向情感，哀、怒、惧、恶和惊属于负向情感，将每种正向情感的强度分为1、3、5、7、9五档，负向情感分为-1、-3、-5、-7、-9五档；

在所述初始词典的基础上扩充弹幕颜表情词典，并确定颜表情权重；扩充语气词典；扩充否定词典，根据弹幕常用的否定副词，将否定副词的权重设为-1；扩充弹幕网络情感新词词典，从弹幕视频中和搜狗输入法的词库中整理筛选网络情感新词进行扩充，并定义所述网络情感新词的情感权重。

4.根据权利要求2所述的基于弹幕情感的视频热点片段检测方法，其特征在于，步骤S2中对视频片段的情感强度计算和情感倾向判定的具体过程为：