CN114095774B

CN114095774B - 一种视频弹幕展示方法、计算机设备及存储介质

Info

Publication number: CN114095774B
Application number: CN202210063071.0A
Authority: CN
Inventors: 贾鑫; 何烈州; 李培立; 于子凡; 蔡嘉琪
Original assignee: Zhejiang University of Science and Technology ZUST
Current assignee: Zhejiang University of Science and Technology ZUST
Priority date: 2022-01-20
Filing date: 2022-01-20
Publication date: 2022-06-03
Anticipated expiration: 2042-01-20
Also published as: CN114095774A

Abstract

本发明提供了一种视频弹幕展示方法、计算机设备及存储介质，包括获取视频，提取视频的视频类型，基于视频类型获取对应的词汇库，提取视频中的音频信息；提取音频信息的声音频率，获得音频频率，提取词汇库中词汇对应的标准声音频率，获得标准词汇频率；将标准词汇频率与音频频率进行比对，获得第一相似度；将弹幕的有效内容与词汇库中的词汇进行比对，获得第二相似度；判断第三相似度是否超过第一预设阈值；若是，则将弹幕作为第一弹幕；从第一弹幕中使用预设筛选策略获得主要展示弹幕；获取弹幕显示指令，当显示指令为第一模式时，在视频内显示主要展示弹幕，可以准确筛选与视频所属领域相关联的弹幕，提升用户的使用体验。

Description

一种视频弹幕展示方法、计算机设备及存储介质

技术领域

本发明涉及弹幕技术领域，具体而言，涉及一种视频弹幕展示方法、计算机设备及存储介质。

背景技术

弹幕指直接显现在视频上的评论，可以以滚动、停留甚至更多动作特效方式出现在视频上，是观看视频的人发送的简短评论，在一些热门或专业性强的视频中，由于弹幕的数量较多，很容易出现弹幕铺满整个屏幕的情况，在众多的弹幕之中，可能会出现用户不想看到的弹幕，使用户在观看视频时的体验下降，现有的许多弹幕显示方法中，仅基于弹幕的字数来相应控制弹幕的滚动速度，通过用户主动设置屏蔽词汇来达到过滤弹幕的目的，通过上述方法，不仅不能提升用户的使用体验，还会使字数较多的弹幕快速地移动直至消失。

发明内容

本发明解决的问题是如何准确地显示与视频内容关联性较强的弹幕。

为解决上述问题，本发明提供一种视频弹幕展示方法，包括：

获取视频，提取所述视频的视频类型，基于所述视频类型获取对应的词汇库，提取所述视频中的音频信息，其中，所述词汇库包括所述视频所属领域中的专业词汇；提取所述音频信息的声音频率，获得音频频率，提取所述词汇库中词汇对应的标准声音频率，获得标准词汇频率；将所述标准词汇频率与所述音频频率进行比对，获得第一相似度；将弹幕的有效内容与所述词汇库中的词汇进行比对，获得第二相似度；判断第三相似度是否超过第一预设阈值，其中，所述第三相似度包括所述第一相似度与所述第二相似度加权后之和；若是，则将所述弹幕作为第一弹幕；从所述第一弹幕中使用预设筛选策略获得主要展示弹幕，其中，所述预设筛选策略包括：从服务器中获得所述第一弹幕的互动信息，将所述互动信息最多的第一预设数量的所述第一弹幕作为主要展示弹幕；获取弹幕显示指令，当所述显示指令为第一模式时，在所述视频内显示所述主要展示弹幕。

相对于现有技术，本发明通过获取视频类型获得视频所属领域的词汇库，通过词汇库与视频中的音频信息判断视频的内容是否与获取到的视频类型相一致，可以避免视频类型与视频内容不相符的情况，保证筛选出的弹幕与视频的内容相一致；通过将弹幕中的有效内容与词汇库中的词汇进行比对，保证筛选出与视频所属领域相一致的弹幕内容；通过第三相似度判断所述弹幕是否可以作为主要显示弹幕的候选弹幕，因第三相似度将弹幕中的有效内容与视频中的音频内容、词汇库中的词汇相结合，从而使计算出的相似度既综合了视频内容，又综合了视频所属领域，保证得出的相似程度更加准确；通过预设筛选策略，将预设个数的第一弹幕显示在屏幕上，保证用户可以拥有良好地弹幕体验；通过显示指令，可以使用户自主选择自己想要的弹幕显示方式。

可选地，所述获取视频，获取所述视频所述领域的词汇库，提取所述视频中的音频信息包括：

将所述视频划分为至少一个预设时间间隔；获取所述视频中的观看率、快进起点率和快进终点率，其中，所述观看率包括所述预设时间间隔被完整观看的次数与所述视频的播放量的比值，所述快进起点率包括在所述预设时间间隔内，被快进的次数与所述视频的播放量的比值，所述快进终点率包括被快进至所述预设时间间隔内的次数与所述视频的播放量的比值；将满足第一预设条件且相邻的所述预设时间间隔合并为一个时间段，其中，所述第一预设条件包括：所述观看率大于或等于第一预设观看率且所述快进终点率与所述快进起点率之差大于或等于第二预设值；以所述时间段为单位，获取每个所述时间段所属细化领域的所述词汇库

由此，将视频以观看率、快进起点率和快进终点率为划分逻辑，划分多个时间段，并基于每个时间段选择其对应的词汇库，可以更准确地判断时间段内的弹幕是否与视频内容相关联，防止出现在某些视频有多个主题的情况下，无法判断视频中第二主题的弹幕与该主题的关联性的情况；另一方面，通过判断观看率是否大于第一预设观看率，同时判断快进终点率与快进起点率之差是否大于第二预设值，可以排除用户反复跳转及无意义跳转信息的干扰，从而更准确地将视频分段。

可选地，所述从所述第一弹幕中使用预设筛选策略获得主要展示弹幕还包括：

使用所述预设筛选策略筛选每个所述时间段内的所述第一弹幕，获得每个所述时间段的所述主要展示弹幕。

由此，筛选出每个时间段内的主要展示弹幕，可以更精确地对弹幕进行筛选，显示用户最感兴趣的弹幕。

可选地，在所述将所述标准词汇频率与所述声音频率进行比对，获得第一相似度之后，还包括：

当所述第一相似度低于第二预设阈值时，识别所述声音频率，判断所述声音频率是否为普通话；若是，则更换词汇库的领域。

由此，当词汇库中的词汇对应的普通话音频与视频中的音频内容的相似程度较低时，需要排除视频中的口音干扰，若视频中的口音较轻且未对识别产生干扰，则表示当前的词汇库并不准确，故需要更换词汇库的领域，保证与视频所述领域相一致。

可选地，所述将弹幕的有效内容与所述词汇库中的词汇进行比对，获得第二相似度包括：

判断所述弹幕的字数是否超过预设字数；若是，则对所述弹幕进行词汇划分，获得至少一个目标词汇；将所述目标词汇进行词性划分，保留所述弹幕的所述有效内容，所述有效内容包括名词和动词；将所述有效内容与所述词汇库中的词汇进行比对，获得所述第二相似度，其中，所述第二相似度包括所述词汇库中的词汇与所述有效内容的比值。

由此，排除未超过预设字数的弹幕，可以保证在减少计算量的同时不影响第一弹幕的筛选；对目标词汇进行词性划分，提取名词与动词，基于名词与动词与词汇库中的词汇进行对比，可以保证准确比对弹幕内容与词汇库的相似性。

可选地，在所述从所述第一弹幕中使用预设筛选策略获得主要展示弹幕之后，还包括：

对所述主要展示弹幕进行词汇划分，获得至少一个词汇；对所述词汇进行词性划分，保留名词和动词；判断词频超过预设词频阈值的所述名词和所述动词是否已存在于所述词汇库中；若否，则将词频超过所述预设词频阈值的所述名词和所述动词存入所述词汇库中。

由此，通过主要展示弹幕中词频较高的有效词汇扩充词汇库中的词汇量。

可选地，所述获取弹幕显示指令，当所述显示指令为第一模式时，在所述视频内显示所述主要展示弹幕包括：

当所述显示指令为第二模式时，在视频内显示所有弹幕，延长所述主要展示弹幕的显示时长、减小所述主要展示弹幕的位移速度、增大所述主要展示弹幕的大小。

由此，通过第二模式显示所有弹幕，并分别对不同的弹幕进行不同的显示策略，使用户获取完整的高质量弹幕信息。

可选地，所述互动信息包括所述弹幕被用户标记的次数。

由此，依据考虑用户的喜好筛选主要显示弹幕。

另一方面，本发明还提出一种计算机存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器读取并运行时实现如上所述的视频弹幕展示方法。

所述计算机存储介质相对于现有技术与所述视频弹幕展示方法所具有的优势相同，在此不再赘述。

本发明还提出一种计算机设备，包括存储有计算机程序的计算机可读存储介质和处理器，所述计算机程序被所述处理器读取并运行时，实现如上所述的视频弹幕展示方法。

所述计算机设备相对于现有技术与所述视频弹幕展示方法所具有的优势相同，在此不再赘述。

附图说明

图1为本发明实施例的视频弹幕展示方法的流程示意图；

图2为本发明实施例的视频弹幕展示方法步骤S100细化后的示意图；

图3为本发明实施例的视频弹幕展示方法在步骤S300之后细化步骤的示意图；

图4为本发明实施例的视频弹幕展示方法步骤S400细化后的示意图；

图5为本发明实施例的视频弹幕展示方法在步骤S700之后细化步骤的示意图；

图6为现有技术中弹幕的效果图。

具体实施方式

为使本发明的上述目的、特征和优点能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

为便于理解本发明，首先简要介绍现有技术中存在的问题。

如图6所示，在现有技术中，在弹幕视频播放量较多的情况下，视频中的弹幕也会随之增加，在某些视频中，可能会出现满屏弹幕遮挡视频的情况，使用户无法正常观看视频，让用户的体验下降；在另一些情况中，大量用户使用弹幕刷屏，使视频的某些时间段内的弹幕急速增加，而这些弹幕往往是大量用户通过复制发送的无意义弹幕，在这种情况下，想要获取高质量弹幕信息的用户无法获取到自己想要的内容，只能看到遮挡住屏幕的大量无意义弹幕。

在上述情况下，用户只能手动屏蔽关键词来达到过滤重复性弹幕的目的，然而某些视频中的无意义弹幕是不同用户发送的不同词汇，无法仅通过关键词进行有效地过滤；另一方面，若用户设置的关键词不合理，则可能会把用户想要看到的弹幕一并屏蔽，仍然会降低用户的观看体验。

还有些网站提供等级屏蔽的功能，让用户自主设置屏蔽等级，例如，屏蔽5级以下的用户弹幕，则会自动过滤该网站等级未达到5级的用户的弹幕发言。但是，通常意义上，网站的等级仅能作为该用户在该网站是否活跃的判断标准，而不能作为在当前视频中是否能发出高质量弹幕的标准，故，通过网站等级来过滤弹幕发言，也不是一种行之有效的弹幕过滤方法。

还有一些网站通过清除过期弹幕来精简弹幕数量，具体方法为，设置一个弹幕有效期限，当弹幕的发言时间与当前时间之差大于有效期限时，则清除该弹幕，通过此种方法，可能会将发言时间较早的高质量弹幕也一并清除，且无法清理发言时间较晚的无效弹幕。

基于上述问题，本发明提出一种基于视频内容筛选出与视频主题接近的弹幕的视频弹幕展示方法，如图1所示，包括：

步骤S100，获取视频，提取所述视频的视频类型，基于所述视频类型获取对应的词汇库，提取所述视频中的音频信息，其中，所述词汇库包括所述视频所属领域中的专业词汇。

视频类型包括视频所在的领域，在一实施例中，对视频进行三个层级的分类，将第三级分类后的结果作为视频所在的领域，确定领域后，获取该领域的词汇库，第一层级包括电影、电视剧、短视频等类别，用于将获取到的视频进行粗分类；第二层级包括粗分类之后，对于视频领域的细分类，以电视剧为例，电视剧的细分类包括古装、武侠、言情、家庭、偶像等分类；第三层级的分类则是对视频进行专业领域上的细分，例如，二级分类为古装电视剧的视频，其第三层级的分类包括：唐朝古装、宋朝古装等，最终依据第三层级的领域分类结果作为所述视频类型，获取对应的词汇库，保证词汇库中具有更加准确的词汇，根据词汇库里的词汇可以更加准确地判断弹幕与视频的关联程度。例如，第三层级的分类为唐朝古装，则词汇库中会出现唐朝的人名，在判断弹幕与视频的关联程度时，若出现了词汇库中的人名，则会作为此弹幕与该视频关联程度的判断依据之一，保证词汇库与视频所属的领域有较高的匹配性，增加弹幕显示的准确率。

在一实施例中，词汇库由其所属领域的专业词汇或出现词频较高的词汇组成，可以基于词汇库中的词汇判断弹幕内容是否与视频相关。例如，视频被分类为电子领域，则会将电子行业的专业词汇作为词汇库。

为准确判断弹幕与视频之间的关联程度，还提取视频中的音频信息，参考视频中的音频判断视频领域是否分类正确，同时，通过音频也可以进一步帮助判断弹幕与视频的关联程度。

步骤S200，提取所述音频信息的声音频率，获得音频频率，提取所述词汇库中词汇对应的标准声音频率，获得标准词汇频率。

提取音频信息中的声音频率，获得音频频率，在一实施例中，将音频进行预处理，获得音频频率，包括使用带通滤波器对音频信号进行滤波，抑制输入信号中频率超过二分之一采样频率的所有分量，防止混叠干扰，并防止电源工频干扰；对语音模拟信号转换为数字信号，即量化噪声、对A/D变换后的语音信号进行预加重，提升高频部分，使信号的频谱变得平坦，保持在低频到高频中能用同样的信噪比求频谱，便于频谱分析；最后通过端点检测确定语音的起点与终点，增加频率提取的准确度。

提取词汇库中词汇对应的标准声音频率，即为获取所述词汇的普通发音频率，在一实施例中，获取普通话发音音频，对所述普通话发音音频进行预处理，包括A/D变换、预加重等方法，获得标准词汇频率。

步骤S300，将所述标准词汇频率与所述音频频率进行比对，获得第一相似度。

将词汇库中的词汇对应的标准词汇频率与视频的音频对应的音频频率进行比对，可以准确获得视频讲述内容与词汇库中的词汇之间的相似程度，若音频频率与标准词汇频率的相似程度较低，则有可能是当前词汇库选择不准确，需要重新判断是否需要重新选择词汇库。

步骤S400，将弹幕的有效内容与所述词汇库中的词汇进行比对，获得第二相似度。

提取弹幕中有效的词汇或能表示该弹幕的含义的内容，并将此部分内容与词汇库中的词汇进行比对，可以直观地表示此弹幕与视频所属领域之间的相似程度，如果相似程度较高，则弹幕的有效内容与词汇库中的词汇的相似度也相应地较高，使得所述第二相似度也较高；若相似程度较低，则弹幕中的有效内容与词汇库中的词汇并没有重合，则所述第二相似度相应较低，表示该弹幕的内容与视频所属领域的关联性较低。

步骤S500，判断第三相似度是否超过第一预设阈值，其中，所述第三相似度包括所述第一相似度与所述第二相似度加权后之和。

因所述第一相似度是描述标准词汇频率与音频频率的相似程度，故第一相似度用来表示视频中的音频内容是否与视频所属领域相近；第二相似度是描述弹幕的内容与词汇库中的词汇之间的相似程度，故第二相似度用来表示弹幕内容是否为视频所属领域的内容。在某些情况中，视频中可能会出现发散性地举例说明或其他情况，导致视频中的音频信息与视频所属领域无关，此时若仅凭第一相似度或第二相似度判断当前弹幕是否为有价值的弹幕过于片面，故通过第一相似度与第二相似度综合考虑后，使用第三相似度直接对弹幕进行判断，若超过第一预设阈值，则表示该弹幕既与视频中讲述的内容相关，又与视频所属领域相关联，从而判断此弹幕为有价值的弹幕。

步骤S600，若是，则将所述弹幕作为第一弹幕。

当此弹幕的第三相似度超过第一预设阈值时，表示此弹幕为有价值的弹幕，将此弹幕作为第一弹幕。

步骤S700，从所述第一弹幕中使用预设筛选策略获得主要展示弹幕，其中，所述预设筛选策略包括：从服务器中获得所述第一弹幕的互动信息，将所述互动信息最多的第一预设数量的所述第一弹幕作为主要展示弹幕。

在一些实施例中，弹幕所属的视频播放量很高，其弹幕数量也很高，导致被筛选出的第一弹幕的数量仍会出现刷屏的情况，故使用预设筛选策略，将第一弹幕进行二次筛选，获得主要展示弹幕，对主要展示弹幕进行展示。其中，预设筛选策略包括从服务器中获得第一弹幕的互动信息，将与用户的互动信息最多的第一预设数量的第一弹幕作为主要展示弹幕。例如，在一视频中，第一弹幕的数量为100条，但是100条仍会占满整个屏幕，在此实施例中，第一预设数量为10条，则从服务器中获取每条第一弹幕所包含的互动信息，选出互动信息最多的10条弹幕作为主要展示弹幕。

可选地，所述互动信息包括所述弹幕被用户标记的次数。

将用户标记次数作为互动信息，可以实现用户的自主筛选，将用户认为最应该展示的第一预设数量个弹幕作为主要展示弹幕，使筛选策略更人性化，增加互动性。

步骤S800，获取弹幕显示指令，当所述显示指令为第一模式时，在所述视频内显示所述主要展示弹幕。

在一实施例中，所述第一模式即为精简模式，在用户设置显示指令为第一模式时，在视频中只显示主要展示弹幕，经过多次筛选，主要展示弹幕仅包括与该视频领域有关的第一预设数量个弹幕，使用户的屏幕中只存在关联性强、专业性强的弹幕内容，可以有效增加用户的弹幕体验。

可选地，如图2所示，步骤S100包括：

步骤S110，将所述视频划分为至少一个预设时间间隔。

可选地，根据视频的所属领域设置预设时间间隔。

在某些情况下，一个视频可能会有多个主题或多部分的内容，每个部分的内容涉及到的领域可能不尽相同，故，可以将视频分为多个时间段，以时间段为单位，获取与每个时间段的视频内容所属领域最相近的词汇库，可以更准确地对视频中的弹幕进行筛选。

在一实施例中，预设时间间隔为对弹幕处理的最小单位，例如，在一段时长为十分钟的视频中，预设时间间隔为1分钟，则以该视频的进度条为坐标系，单独处理每分钟内的弹幕信息。

在另一实施例中，基于视频类型设置预设时间间隔，因视频类型不同，可能会出现视频节奏不同的情况。例如，电影的时长可能为1.5-2小时，此时将视频分为3-4个时间段，每个时间段持续30分钟左右较为合理；若视频为关于两个领域的科普视频，此视频的时长为10分钟，则将视频分为2个时间段，每个时间段持续5分钟较为合理。

步骤S120，获取所述视频中的观看率、快进起点率和快进终点率，其中，所述观看率包括所述预设时间间隔被完整观看的次数与所述视频的播放量的比值，所述快进起点率包括在所述预设时间间隔内，被快进的次数与所述视频的播放量的比值，所述快进终点率包括被快进至所述预设时间间隔内的次数与所述视频的播放量的比值。

在一实施例中，利用用户的兴趣点划分时间间隔，所述用户的兴趣点具体包括在当前时间段是否会完整观看此部分的内容，通常来说，用户完整观看了一段内容表示该部分内容为用户想看的重点，即通过获取用户在每个预设时间间隔中完整观看的次数与播放量的比值，可以反映用户对该时间单位的兴趣度；在用户对当前内容不感兴趣时，才会做出拉动进度条的动作，基于此，还可以通过获得进度条被拉动时的起始时间点落入每个预设时间间隔的起始次数与总播放量的比值，来记录当前预设时间间隔被拉动进度条的频率从而进一步判断当前预设时间间隔内的内容是否吸引用户；当用户拉动进度条至某一时间段后，停止拉动进度条并进行观看，表示此内容较为吸引观众，通过记录此信息可以进一步帮助判断观众对当前时间段的内容是否感兴趣，即记录进度条被拉动时的终止时间点落入每个预设时间间隔的终止次数与总播放量的比值。

在一些情况中，用户拉动进度条时并不知道被跳过的内容是否为感兴趣的内容，在拉动进度条之后，用户可能会做出反复向前快退、向后快进的操作，此种操作会极大地影响对预设时间间隔的统计判断。故在步骤S120中，只获取进度条快进的频率，而不获取进度条快退（即进度条向前拉）的情况。

步骤S130，将满足第一预设条件且相邻的所述预设时间间隔合并为一个时间段，其中，所述第一预设条件包括：所述观看率大于或等于第一预设观看率且所述快进终点率与所述快进起点率之差大于或等于第二预设值。

用户在对视频进行快进后，存在三种情况，其一，用户快进后发现感兴趣的内容已经被跳过，则会进行快退操作，把进度条往时间点之前拉动；其二，用户快进后发现并未跳过当前不感兴趣的内容，则会继续进行快进操作，把进度条往时间点之后拉动；其三，用户发现正好跳过不感兴趣的时间段，则直接进行观看。

在上述的第一种情况中，不能判断用户是否对当前内容感兴趣，故不对第一种情况进行记录；在第二种情况中，表示用户当前的内容仍不感兴趣；在第三种情况中，表示用户对此预设时间间隔中的内容较为感兴趣。基于此，使用第一预设条件作为判断用户是否对当前预设时间间隔中的内容感兴趣的条件，将用户向前快退的操作忽略，记录并判断快进终点率与快进起点率之差是否大于或等于第二预设值，可以有效判断用户是否对当前内容感兴趣。

当用户普遍对连续多个预设时间间隔的内容感兴趣时，表示这段时间内的内容是连续且较为集中的，故，将满足第一预设条件且相邻的预设时间间隔合并为一个时间段，以时间段为单位，一并处理时间段内的弹幕，可以减少处理计算量，增加弹幕的处理效率。

步骤S140，以所述时间段为单位，获取每个所述时间段所属细化领域的所述词汇库。

将多个预设时间间隔合并为一个时间段，表示此时间段内的内容较为连贯，在一般情况下，此时间段内的内容处于一个细化的领域内，故可以以时间段为单位，获取每个时间段所述细化领域的词汇库，可以在有效增加词汇库与当前时间段内视频内容的匹配度的情况下，减少处理弹幕的计算量。

在一实施例中，步骤S140中的所述细化领域较步骤S100中的所述领域更加细化，以适应每一个时间段内的视频内容。

可选地，从所述第一弹幕中使用预设筛选策略获得主要展示弹幕还包括：

在对视频进行划分时间段后，针对于每个时间段内的弹幕进行独立筛选，获得每个时间段的主要展示弹幕。

在一实施例中，一视频包括三部分，其中，三个部分的内容互不相通，因三个部分的内容互不相通，则在此视频中，若不对视频进行分段、分批处理弹幕，则可能会出现一部分或两部分内容没有第一弹幕的情况，故分别使用三个词汇库，对三个部分的弹幕进行分别筛选。针对第一部分，使用第一词汇库，对该部分时间段内的弹幕进行识别与筛选，获得主要展示弹幕；针对第二和第三部分，使用相同的策略，对弹幕进行识别与筛选，获得主要展示弹幕。

可选地，划分时间段后，弹幕仅在其对应的时间段内显示。

在一实施例中，一视频具有两部分，则第一部分对应的主要展示弹幕仅在第一部分的时间段内显示，当视频播放到第二部分时，清除第一部分对应的主要展示弹幕内容，替换为第二部分对应的主要展示弹幕内容。

可选地，如图3所示，在步骤S300之后，还包括：

步骤S310，当所述第一相似度低于第二预设阈值时，识别所述声音频率，判断所述声音频率是否为普通话。

当词汇库中的词汇与视频播放的内容相似度较低时，表示此部分内容与选取的词汇库可能不在同一领域内，首先排除视频中的口音干扰，防止出现因口音而导致的相似度较差的问题。

步骤S320，若是，则更换词汇库的领域。

如果判断视频中的口音为普通话，或并不影响识别，则表示当前的词汇库与视频所属领域并不相同，则需要重新选择词汇库。

可选地，如图4所示，步骤S400包括：

步骤S410，判断所述弹幕的字数是否超过预设字数。

在一实施例中，预设字数设为3，表示首先剔除未超过3个字的弹幕，在通常情况下，3个字内的弹幕一般为语气词或刷屏的无意义弹幕，且过于零散的弹幕会降低用户的观看体验，故首先将预设字数内的弹幕剔除，可以有效减少计算量。

步骤S420，若是，则对所述弹幕进行词汇划分，获得至少一个目标词汇。

对弹幕的内容进行语素划分，将一句话划分为最小且有意义的多个单元，每个单元即为所述目标词汇，通过目标词汇，可以有效地分析弹幕句子成分，剖析弹幕包含的内容。

步骤S430，将所述目标词汇进行词性划分，保留所述弹幕的所述有效内容，所述有效内容包括名词和动词。

将目标词汇与词汇库中的词汇进行比对，结合其在弹幕句子中存在的位置，判断每个目标词汇的词性。

在一实施例中，视频所属领域的词汇库中的代词、形容词、数词、副词、介词等词汇不具有独特性，即上述词性的词汇不仅会出现在该领域，还会出现在其他领域，故无法使用上述词性的词汇判断弹幕是否与该领域相近；而动词与名词是在该领域所独有的，所以将名词与动词作为弹幕中的有效内容，通过句子中的动词与名词判断该弹幕是否与视频所属的领域相近。

在另一实施例中，视频所属领域的形容词较为有代表性，则通过句子中的形容词判断该弹幕是否满足条件。

步骤S440，将所述有效内容与所述词汇库中的词汇进行比对，获得所述第二相似度，其中，所述第二相似度包括所述词汇库中的词汇与所述有效内容的比值。

将有效内容与词汇库中的词汇进行比对，可以获得该弹幕中专业词汇的占比，即第二相似度，若第二相似度高，则表示该弹幕中具有较多的视频所属领域词汇；若第二相似度较低，则表示该弹幕的内容与视频所属领域关联程度较低。

可选地，如图5所示，在所述从所述第一弹幕中使用预设筛选策略获得主要展示弹幕之后，还包括：

步骤S710,对所述主要展示弹幕进行词汇划分，获得至少一个词汇。

在一实施例中，在筛选出主要展示弹幕后，还会对主要展示弹幕进行剖分，划分弹幕句子中的语素，将句子划分至最小且具有意义的多个单元，获得多个词汇。

步骤S720,对所述词汇进行词性划分，保留名词和动词。

在一实施例中，获得多个词汇后，对每个词汇进行词性的划分，由于视频所属领域中的名词与动词是较为特殊的，对名词与动词进行判断即可获得弹幕句子是否与视频所属领域相关。在筛选出主要展示弹幕后，可以对主要展示弹幕中的名词与动词的词频进行进一步分析。

步骤S730,判断词频超过预设词频阈值的所述名词和所述动词是否已存在于所述词汇库中。

判断主要展示弹幕中名词与动词出现的频率，若出现的频率足够高，则表示该词与视频所属领域的联系较为密切，故在划分词性，保留名词与动词后，判断名词与动词是否超过预设词频阈值，进一步判断超过预设词频阈值的名词和动词是否存在于词汇库中。

步骤S740,若否，则将词频超过所述预设词频阈值的所述名词和所述动词存入所述词汇库中。

如果词频超过了预设词频阈值且词汇库中未收录此词汇，则将此词汇存入词汇库中，扩充词汇库。

可选地，步骤S800包括：

在一实施例中，所述第二模式即为完整弹幕模式，在用户设置显示指令为第二模式时，在视频中显示所有弹幕，但是经过多次筛选之后的主要展示弹幕作为特殊的弹幕显示在屏幕上，包括增大主要展示弹幕的大小，使之明显地出现在屏幕中；延长主要展示弹幕的显示时长，在屏幕中的位移速度较普通弹幕更慢，且滚动到屏幕左端时会继续停留一段时间，使用户无需暂停即可获取到弹幕内容。在第二模式下，用户既可以完整又快速地浏览普通弹幕的内容，又可以完整地获取到主要展示弹幕的内容，有效地增加用户的弹幕体验。

虽然本公开披露如上，但本发明公开的保护范围并非仅限于此。本领域技术人员在不脱离本公开的精神和范围的前提下，可进行各种变更与修改，这些变更与修改均将落入本发明的保护范围。

Claims

1.一种视频弹幕展示方法，其特征在于，包括：

获取视频，提取所述视频的视频类型，基于所述视频类型获取对应的词汇库，提取所述视频中的音频信息，其中，所述词汇库包括所述视频所属领域中的专业词汇；

提取所述音频信息的声音频率，获得音频频率，提取所述词汇库中词汇对应的标准声音频率，获得标准词汇频率；

将所述标准词汇频率与所述音频频率进行比对，获得第一相似度；

将弹幕的有效内容与所述词汇库中的词汇进行比对，获得第二相似度，其中，所述有效内容包括所述弹幕中文字包含的名词和动词；

判断第三相似度是否超过第一预设阈值，其中，所述第三相似度包括所述第一相似度与所述第二相似度加权后之和；

若是，则将所述弹幕作为第一弹幕；

从所述第一弹幕中使用预设筛选策略获得主要展示弹幕，其中，所述预设筛选策略包括：从服务器中获得所述第一弹幕的互动信息，将所述互动信息最多的第一预设数量的所述第一弹幕作为主要展示弹幕；

获取弹幕显示指令，当所述显示指令为第一模式时，在所述视频内显示所述主要展示弹幕。

2.根据权利要求1所述的视频弹幕展示方法，其特征在于，所述获取视频，获取所述视频所述领域的词汇库，提取所述视频中的音频信息包括：

将所述视频划分为至少一个预设时间间隔；

获取所述视频中的观看率、快进起点率和快进终点率，其中，所述观看率包括所述预设时间间隔被完整观看的次数与所述视频的播放量的比值，所述快进起点率包括在所述预设时间间隔内被快进的次数与所述视频的播放量的比值，所述快进终点率包括被快进至所述预设时间间隔内的次数与所述视频的播放量的比值；

将满足第一预设条件且相邻的所述预设时间间隔合并为一个时间段，其中，所述第一预设条件包括：所述观看率大于或等于第一预设观看率且所述快进终点率与所述快进起点率之差大于或等于第二预设值；

以所述时间段为单位，获取每个所述时间段所属细化领域的所述词汇库。

3.根据权利要求2所述的视频弹幕展示方法，其特征在于，所述从所述第一弹幕中使用预设筛选策略获得主要展示弹幕还包括：

4.根据权利要求3所述的视频弹幕展示方法，其特征在于，在所述将所述标准词汇频率与所述声音频率进行比对，获得第一相似度之后，还包括：

当所述第一相似度低于第二预设阈值时，识别所述声音频率，判断所述声音频率是否为普通话；

若是，则更换词汇库的领域。

5.根据权利要求1-4任一所述的视频弹幕展示方法，其特征在于，所述将弹幕的有效内容与所述词汇库中的词汇进行比对，获得第二相似度包括：

判断所述弹幕的字数是否超过预设字数；

若是，则对所述弹幕进行词汇划分，获得至少一个目标词汇；

将所述目标词汇进行词性划分，保留所述弹幕的所述有效内容；

将所述有效内容与所述词汇库中的词汇进行比对，获得所述第二相似度，其中，所述第二相似度包括所述词汇库中的词汇与所述有效内容的比值。

6.根据权利要求5所述的视频弹幕展示方法，其特征在于，在所述从所述第一弹幕中使用预设筛选策略获得主要展示弹幕之后，还包括：

对所述主要展示弹幕进行词汇划分，获得至少一个词汇；

对所述词汇进行词性划分，保留名词和动词；

判断词频超过预设词频阈值的所述名词和所述动词是否已存在于所述词汇库中；

若否，则将词频超过所述预设词频阈值的所述名词和所述动词存入所述词汇库中。

7.根据权利要求5所述的视频弹幕展示方法，其特征在于，所述获取弹幕显示指令，当所述显示指令为第一模式时，在所述视频内显示所述主要展示弹幕包括：

8.根据权利要求5所述的视频弹幕展示方法，其特征在于，所述互动信息包括所述弹幕被用户标记的次数。

9.一种计算机设备，其特征在于，包括存储有计算机程序的计算机可读存储介质和处理器，所述计算机程序被所述处理器读取并运行时，实现如权利要求1-8任一项所述的视频弹幕展示方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器读取并运行时，实现如权利要求1-8任一项所述的视频弹幕展示方法。