CN112672202A

CN112672202A - 弹幕处理方法、设备和存储介质

Info

Publication number: CN112672202A
Application number: CN202011586426.1A
Authority: CN
Inventors: 蒋涛; 陈健生
Original assignee: Guangzhou Boguan Information Technology Co Ltd
Current assignee: Guangzhou Boguan Information Technology Co Ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-16
Anticipated expiration: 2040-12-28
Also published as: CN112672202B

Abstract

本申请实施例提供一种弹幕处理方法、设备和存储介质，获取目标时间段内多个子时间段产生的多条弹幕的句向量；将同一子时间段的多条弹幕聚类为至少一个弹幕类，获得弹幕类中的聚类中心弹幕；根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类，获得每个二级弹幕类的聚类中心弹幕；确定每个二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕。由于根据弹幕的句向量实现对弹幕的语义理解，再利用聚类算法对弹幕进行聚类，无需对弹幕进行分词，也无需统计分析弹幕中的特征信息，可以在提升热词弹幕准确性的同时，简化热词弹幕获取过程，提升热词弹幕的获得效率。

Description

弹幕处理方法、设备和存储介质

技术领域

本申请实施例涉及互联网技术领域，尤其涉及一种弹幕处理方法、设备和存储介质。

背景技术

随着互联网技术的发展，弹幕作为一种互动方法，其简洁有趣的信息交流方式而被广泛应用，例如视频播放、网络直播等均可以使用弹幕进行交互，以增加视频观看过程中的趣味性。在此过程中，服务器会提供一些热词供用户选取并发送，然后根据用户选取的热词以弹幕的形式在视频画面中对该文字信息进行显示。

现有技术中，主要通过对视频中的弹幕进行统计，根据出现次数、出现频率等信息对弹幕进行重要程度排序，再根据重要程度提供热词供用户选用，然而，上述提供热词弹幕的方法较为繁琐，且提供的热词弹幕不够准确。

发明内容

本申请实施例提供一种弹幕处理方法、设备和存储介质，用于解决现有技术中，提供热词弹幕的方法较为繁琐，且提供的热词弹幕不够准确的技术问题。

第一方面，本申请实施例提供一种弹幕处理方法，包括：

获取目标子时间段内多个不同子时间段产生的多条弹幕，并获取多条弹幕的句向量；

根据同一子时间段的弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，根据每个弹幕类中各条弹幕的句向量，获得每个弹幕类中的聚类中心弹幕；

根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据二级弹幕类中包含的弹幕的句向量，获得二级弹幕类的聚类中心弹幕；

确定二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕，热词弹幕用于供用户快捷输入弹幕。

可选的，获取多条弹幕的句向量，包括：

针对每条弹幕，获取弹幕中每个字的字向量；

根据弹幕中各字的字向量，获取弹幕的字向量均值；

根据字向量均值，获得弹幕的句向量。

可选的，获取目标时间段内多个不同子时间段产生的多条弹幕，并获取多条弹幕的句向量，包括：

针对每条弹幕，将弹幕输入至预先训练好的bert模型，获得bert模型输出的弹幕中每个字的字向量；

将弹幕中各字的字向量输入至预先训练好的双向LSTM网络，获取LSTM网络输出的弹幕的字向量均值。

可选的，根据同一子时间段的弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，包括：

针对同一子时间段，将子时间段的多条弹幕的句向量进行降维和归一化处理；

根据同一子时间段处理后的多条弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类。

可选的，根据同一子时间段的每条弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，包括：

针对同一子时间段，根据子时间段任意两条弹幕的句向量，获得任意两条弹幕的句向量间的余弦距离；

根据预设距离分别与子时间段中任意两条弹幕的句向量的余弦距离之差，采用DBSCAN聚类算法，将子时间段的多条弹幕聚类为至少一个弹幕类。

可选的，将同一子时间段的多条弹幕聚类为至少一个弹幕类所采用的聚类算法与将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类所采用的聚类算法相同；

其中，聚类为至少一个弹幕类所采用的聚类算法参考的聚类参数与聚类为N个二级弹幕类所采用的聚类算法参考的聚类参数不同。

可选的，根据弹幕类中包含的弹幕的句向量，获得弹幕类中的聚类中心弹幕，包括：

针对每个弹幕类，根据弹幕类中包含的多条弹幕的句向量，获取弹幕类的句向量均值为聚类中心向量；

根据弹幕类中多条弹幕的句向量和聚类中心向量，获得多条弹幕的句向量到聚类中心向量的欧式距离；

确定到聚类中心向量的欧式距离最小的句向量对应的弹幕，为弹幕类中的聚类中心弹幕。

可选的，确定每个二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕之后，还包括：

接收用户的终端设备发送的弹幕开始输入指令；

根据弹幕开始输入指令，向终端设备发送至少一个热词弹幕，以使终端设备在播放画面中显示至少一个热词弹幕，使得用户从至少一个热词弹幕中选择所需输入的弹幕。

第二方面，本申请实施例提供一种弹幕处理装置，包括：

获取模块，用于获取目标子时间段内多个不同子时间段产生的多条弹幕，并获取每条弹幕的句向量；

处理模块，用于根据同一子时间段的每条弹幕的句向量，将同一子时间段内的多条弹幕聚类为至少一个弹幕类，根据每个弹幕类中包含的弹幕的句向量，获得弹幕类中的聚类中心弹幕；以及根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据N个二级弹幕类中每个二级弹幕类中包含的弹幕的句向量，获得二级弹幕类的聚类中心弹幕；

确定模块，用于确定二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕，热词弹幕用于供用户快捷输入弹幕。

可选的，获取模块具体用于，针对每条弹幕，获取弹幕中每个字的字向量；

根据弹幕中各字的字向量，获取弹幕的字向量均值；

根据字向量均值，获得弹幕的句向量。

可选的，获取模块具体用于，针对每条弹幕，将弹幕输入至预先训练好的bert模型，获得bert模型输出的弹幕中每个字的字向量；

可选的，处理模块具体用于，针对同一子时间段，将子时间段的多条弹幕的句向量进行降维和归一化处理；

根据子时间段处理后的多条弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类。

可选的，处理模块具体用于，针对同一子时间段，根据子时间段任意两条弹幕的句向量，获得任意两条弹幕的句向量间的余弦距离；

可选的，处理模块具体用于，针对每个弹幕类，根据弹幕类中包含的弹幕的句向量，获取弹幕类的句向量均值为聚类中心向量；

可选的，处理模块还用于，接收用户的终端设备发送的弹幕开始输入指令；

第三方面，本申请实施例提供一种电子设备，包括：

存储器，用于存储程序指令；

处理器，用于调用并执行存储器中的程序指令，执行如第一方面中任一项所述的弹幕处理方法。

第四方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，包括：该程序被处理器执行时实现第一方面中任一项所述的弹幕处理方法。

第五方面，本申请实施例提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现第一方面所述的弹幕处理方法。

本申请实施例提供一种弹幕处理方法、设备和存储介质，通过获取目标时间段内多个不同子时间段产生的多条弹幕，并获取多条弹幕的句向量；根据同一子时间段的每条弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，根据同一弹幕类中弹幕的句向量，获得弹幕类中的聚类中心弹幕；根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据二级弹幕类中每个二级弹幕类的包含的弹幕的句向量，获得二级弹幕类的聚类中心弹幕；确定二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕，热词弹幕用于供用户快捷输入弹幕。本方案中，由于根据弹幕的句向量实现对弹幕的语义理解，再利用聚类算法对弹幕进行聚类，无需对弹幕进行分词，也无需统计分析弹幕中的特征信息，从而可以在提升热词弹幕的准确性的同时，简化热词弹幕获取过程，提升热词弹幕的获得效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的弹幕处理的场景示例图；

图2为本申请一实施例提供的弹幕处理方法的流程图；

图3为本申请一实施例提供的弹幕处理的原理示意图；

图4为本申请另一实施例提供的弹幕处理的原理示意图；

图5为本申请另一实施例提供的弹幕处理方法的流程图；

图6为本申请一实示例提供的热词弹幕发送过程的操作示意图；

图7为本申请一实施例提供的弹幕处理装置的结构示意图；

图8为本申请一实施例提供的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

需要说明的是，本申请实施例各部分及附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请下述实施例所涉及的方法流程图仅是示例性说明，不是必须包括所有的内容和步骤，也不是必须按照所描述的顺序执行。例如，有些步骤还可以分解，而有些步骤可以合并或部分合并，因此，实际执行的顺序可根据实际情况改变。

本申请下述实施例所涉及的方框图中的功能模块仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或者不同网络和/或处理器和/或微控制器中实现这些功能实体。

现有技术中，主要通过对视频中的弹幕进行统计，根据出现次数、出现频率等信息对弹幕进行重要程度排序，再根据重要程度提供热词供用户选用，具体的，首先需要利用分词工具，如jieba等，对句子进行分词，然后将分词后的词语，通过统计特征的方式，如基于词共现的Textrank算法和计算点互信息方法、基于词频的tf-idf算法，对词的重要性进行打分，再按重要程度从高到低排名，选取重要度最高词语作为热词。

然而，上述提供热词弹幕的方法中，必须对句子进行分词，十分依赖分词算法的准确度，而在视频观看或者直播当中会存在口语词或专用名词，上述分词算法难以完全准确的进行分词，使得最终提供的热词弹幕不够准确，另外，基于统计特征的方式，需要人为制定许多规则，对词语进行过滤，且不能从语义上对词语进行理解，还需要对特征进行统计，如共现次数、词语出现频率、文档频率等，过程较为繁琐。

基于上述问题，本申请实施例提供一种弹幕处理方法、设备和存储介质，通过获取每个弹幕的句向量，再利用聚类算法将句向量相似性较高的句子聚成一类，统计每个类别中出现的数量进行排名，作为热词弹幕的排名依据，上述过程无需对弹幕进行分词，即可以实现对弹幕的语义理解，从而提升热词弹幕的准确性，另外，由于无需统计分析弹幕中的特征信息，可以大大简化热词弹幕获取过程，提升运行速度。

为方便理解，首先结合图1对本申请实施例的场景进行说明。

图1为本申请一实施例提供的弹幕处理的场景示例图。如图1所示，该场景包括：终端设备101，服务器102以及用户。

在本申请实施例中，终端设备101可以为任意终端，比如，可以是机器类通信的用户设备。该终端设备101也可称之为用户设备(user equipment，UE)、移动台(mobilestation，MS)、移动终端(mobile terminal)、终端(terminal)等，例如，终端设备例如可以为台式电脑、笔记本、个人数字助理(Personal Digital Assistant，简称：PDA)、智能手机、平板电脑等设备。本场景以智能手机为例进行示出，需要说明的是，终端设备101的数量可以为多个，本申请实施例以一个为例进行说明。

需要说明的是，本方案的实施例可以应用于多种弹幕处理场景，例如：视频观看场景、直播互动场景等，本申请实施例不做具体限定。

在实际应用中，用户通过终端设备101观看视频或者直播，在此过程中，用户可以通过终端设备101的输入界面输入相关弹幕内容，从而通过发送弹幕实现与其他用户或者主播之间的互动。

在一种场景中，服务器102可以接收多个用户通过终端设备101发送的多条弹幕，通过获取每个弹幕的句向量，再利用聚类算法将句向量相似性较高的句子聚成一类，统计每个类别中出现的数量进行排名，作为热词弹幕的排名依据，从而获得热词弹幕。

进一步的，当服务器102接收用户的终端设备101发送的弹幕开始输入指令时，可以根据弹幕开始输入指令，向终端设备101发送至少一个热词弹幕，以使终端设备101在播放画面中显示至少一个热词弹幕，使得用户从至少一个热词弹幕中选择所需输入的弹幕。

更进一步的，服务器102接收用户输入的弹幕，将弹幕内容发送至终端设备101，使得终端设备101的显示界面上显示该弹幕。

下面以具体地实施例对本申请的实施例的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。

图2为本申请一实施例提供的弹幕处理方法的流程图。如图2所示，本申请实施例的执行主体可以为上述的服务器。如图2所示，本申请实施例的方法，包括如下步骤：

S201、获取目标时间段内多个不同子时间段产生的多条弹幕，并获取多条弹幕的句向量。

需要说明的是，对于弹幕来源，本申请实施例不做具体限定，一方面，针对视频观看场景，该弹幕可以是某一个视频中的弹幕，其也可以是某一视频播放端产生的弹幕。另一方面，针对直播观看场景，该弹幕可以是某一直播间中产生的弹幕，其也可以是某一直播平台中产生的弹幕。

本方案中，目标时间段的时长大于多个子时间段的时长，本申请实施例对于目标时间段的时长不做具体限定，其可以根据热词弹幕的获得需求设定为任意值，示例性的，目标时间段的时长可以为10天。

在实际应用中，多个子时间段中的每个子时间段的时长可以相同也可以不相同，一方面，可以将多个子时间段设置为任意相同的时长，例如多个子时间段的时长均为1天。此方案中，无需根据经验设置每个子时间段的时长，可以进一步简化弹幕处理操作，从而提升弹幕处理效率。

另一方面，可以将多个子时间段设置为任意不相同的时长，具体的，可以根据弹幕的数量来确定每个子时间段的长度，具体的，若当前时段的获取的弹幕的数量小于预设值，则可以增大当前时段的时长，直至当前时段获取的弹幕数量大于预设值，从而确定每一时段的时长。通过本方案，可以动态的调整多个子时间段的时长，从而降低每个子时间段中弹幕数量的差距，进一步提升热词弹幕的准确性。

进一步的，获取每个弹幕的句向量。为方便理解，请参考图3，图3为本申请一实施例提供的弹幕处理的原理示意图。如图3所示，弹幕1、弹幕2…弹幕N为一个子时间段内产生的弹幕，将每个弹幕映射为句向量，下面对于将弹幕映射为句向量的过程进行详细说明。

在一种实施方式中，针对每条弹幕，获取弹幕中每个字的字向量，对于子向量的获取方式，本申请实施例不做具体限定。示例性的，可以使用bert模型来获取弹幕的字向量。

具体的，将弹幕输入至预先训练好的bert模型，获得bert模型输出的弹幕中每个字的字向量。

进一步的，根据弹幕中各字的字向量，获取弹幕的字向量均值，需要说明的是，对于弹幕的字向量均值的获取方式，本申请实施例也不做具体限定，示例性的，可以采用双向LSTM网络，获取弹幕的字向量均值。具体的，将弹幕中各字的字向量输入至预先训练好的双向LSTM网络，获取LSTM网络输出的弹幕的字向量均值。

需要说明的是，输出的弹幕的字向量均值即为该弹幕的句向量。

本申请实施例中，bert模型和双向LSTM网络的训练方法，可以参考现有技术，本申请实施例不做具体限定。

本步骤中，通过bert模型获取弹幕中字的字向量，再利用双向LSTM网络获取弹幕的字向量均值，从而获得弹幕的句向量，由于bert模型和双向LSTM网络是提前训练好的，可以快速的将弹幕的内容映射为高维语义空间中的向量，从而提升弹幕处理效率，另外，由于无需对弹幕进行分词，而是根据词向量求均值获取句向量，可以从深层语义上进行理解，从而提升最终获得的热词弹幕的准确性。

S202、根据同一子时间段的每条弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，根据弹幕类中弹幕的句向量，获得弹幕类中的聚类中心弹幕。

本步骤中，对于每个子时间段的每条弹幕的句向量，确定每条弹幕之间的相似度，将相似度较高的弹幕聚类为一个弹幕类。

请继续参考图3，如图3所示，在获取到一个子时间段的句向量之后，根据句向量的相似度进行聚类，以获得弹幕类1、弹幕类2…弹幕类S，需要说明的是，对于弹幕类的个数S本申请实施例不做具体限定。一方面，弹幕类S可以为预先设定的一固定值，例如：5，即本步骤中，将每个子时间段的弹幕聚类为5个弹幕类，其中弹幕类的数量S小于等于弹幕数量M。本方案中，通过设置弹幕类为固定值，可以进一步提升弹幕聚类效率。

另一方面，可以根据弹幕的数量M确定弹幕类的数量S，具体的，预设每个弹幕类中的弹幕数量阈值，根据弹幕数量M以弹幕数量阈值，确定弹幕类的数量S。本方案中，可以根据弹幕数量实时的调整弹幕类的数量，从而提升聚类的准确性。

进一步的，根据每个弹幕类中各条弹幕的句向量，获得每个弹幕类中的聚类中心弹幕。

具体的，请继续参考图3，如图3所示，在对每个子时间段的弹幕进行聚类后，确定每个弹幕类中每一条弹幕的句向量的均值，根据均值，得出每一个弹幕类的聚类中心弹幕。

S203、根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据二级弹幕类中二级弹幕类的弹幕的句向量，获得每个二级弹幕类的聚类中心弹幕。

具体的，获取目标时间段内，多个不同子时间段中所有弹幕类的聚类中心弹幕的句向量，将获取的聚类中心弹幕的句向量进行二次聚类以获得N个二级弹幕类。

为方便理解，请参考图4，图4为本申请另一实示例提供的弹幕处理的原理示意图。如图4所示，采用步骤S202的方法，获取目标时间段内的多个子时间段，以目标时间段为第1天～第T天共T天，每个子时间段均是一天为例，分别获取目标时间段中第1天、第2天…第T天的聚类中心弹幕，将目标之间段T天的聚类中心弹幕进行聚类，以获得N个二级弹幕类：二级弹幕类1、二级弹幕类2…二级弹幕类N。

进一步的，获取N个二级弹幕类中，每个二级弹幕类的聚类中心弹幕。

需要说明的是，步骤S203中的聚类方法以及获得聚类中心弹幕的方法与步骤S202中的方法和原理类似，具体可参考上述，此处不再赘述。

S204、确定二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕，热词弹幕用于供用户快捷输入弹幕。

在实际应用中，二级弹幕类的聚类中心弹幕即为目标时间段产生的热词弹幕。仍以上述为例，对第1天、第2天…第T天共T天的聚类中心弹幕进行聚类，获得N个二级弹幕类中，每个二级弹幕类的聚类中心弹幕即为目标时间段第1天～第T天共T天内的热词弹幕。

本申请实施例提供一种弹幕处理方法，获取目标时间段内多个不同子时间段产生的多条弹幕的句向量；将每个子时间段的多条弹幕聚类为至少一个弹幕类，获得每个弹幕类中的聚类中心弹幕；根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，获得每个二级弹幕类的聚类中心弹幕；确定每个二级弹幕类的聚类中心弹幕为目标时间段产生的热词弹幕。由于根据弹幕的句向量实现对弹幕的语义理解，再利用聚类算法对弹幕进行聚类，无需对弹幕进行分词，无需统计分析弹幕中的特征信息，从而可以在提升热词弹幕的准确性的同时，简化热词弹幕获取过程，提升热词弹幕的获得效率。

图5为本申请另一实施例提供的弹幕处理方法的流程图。在上述实施例的基础上，本实施例对本申请技术方案进行更详细的描述，如图5所示，本申请实施例提供的方法可以包括以下步骤：

S301、获取目标时间段内多个不同子时间段产生的多条弹幕，并获取多条弹幕的句向量。

需要说明的是，步骤S301与图2所示实施例中步骤S201的方法和原理类似，具体可参考图2所示的实施例，此处不再赘述。

S302、针对同一子时间段，将子时间段的多条弹幕的句向量进行降维和归一化处理。

在实际应用中，由于每个视频或者每个直播间中的弹幕内容存在差异，且弹幕的句向量的分布不同，因此需要对获得的弹幕的句向量进行降维处理和归一化处理，使得数据集更易使用，从而降低不同直播间或者视频的弹幕差异对热词弹幕带来的影响，进一步提升热词弹幕的准确性。

需要说明的是，本申请实施例对于句向量的降维处理的方式不做具体限定，示例性的，可以使用主成分分析技术(principal components analysis，PCA)对句向量进行降维处理。

S303、根据子时间段处理后的每条弹幕的句向量，将子时间段的多条弹幕聚类为至少一个弹幕类。

具体的，针对每个子时间段，根据子时间段内处理后的任意两条弹幕的句向量，获得任意两条弹幕的句向量间的余弦距离；

进一步的，根据预设距离分别与子时间段中任意两条弹幕的句向量的余弦距离之差，采用DBSCAN聚类算法，将子时间段的多条弹幕聚类为至少一个弹幕类。

需要说明的是，由于两个句向量之间的余弦距离越大，则该两个句向量之间的相似度越高，而采用DBSCAN聚类算法时，两个句向量之间的距离越小，该两个句向量之间的相似度越高，因此，需要以预设距离与子时间段中任意两条弹幕的句向量的余弦距离之差作为DBSCAN聚类算法的输入。

其中，DBSCAN聚类算法的参数包括：eps、min_samples，其中，eps用于表示一个弹幕类中任意两个句向量之间的最大距离，min_samples用于表示一个弹幕类中的最少弹幕个数。需要说明的是，本步骤中聚类为至少一个弹幕类所采用的聚类算法参考的聚类参数可以根据需求设定为任意值，示例性的，设定eps＝0.22，min_samples＝2。

S304、针对每个弹幕类，根据弹幕类中包含的弹幕的句向量，获取弹幕类的句向量均值为聚类中心向量。

具体的，对每个弹幕类中各弹幕的句向量求均值，以获得每个弹幕类中的聚类中心向量。

S305、根据弹幕类中多条弹幕的句向量和聚类中心向量，获得多条弹幕的句向量到聚类中心向量的欧式距离。

S306、确定到聚类中心向量的欧式距离最小的句向量对应的弹幕，为聚类中心弹幕。

需要说明的是，获得每个弹幕的句向量到聚类中心向量的欧式距离的方法可参考现有技术，本申请实施例不做具体限定。

S307、根据同一子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据二级弹幕类中包含的弹幕的句向量，获得二级弹幕类的聚类中心弹幕。

在实际应用中，将同一子时间段的多条弹幕聚类为至少一个弹幕类所采用的聚类算法与将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类所采用的聚类算法相同，即采用DBSCAN聚类算法，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类。

需要说明的是，由于不同子时间段内的弹幕的差异可能较大，使得难以对不同子时间段之间的句向量进行聚类，此时可以适当调整聚类参数。一方面，可以增大eps参数的值，即增大弹幕类中任意两个句向量之间的最大距离，降低弹幕之间的相似度要求，另一方面，也可以降低min_samples的值，即减小每个弹幕类中的最少弹幕个数。上述两种方式均可以解决因不同子时间段的弹幕差异而导致聚类失败的技术问题，提升聚类效果，最终提升热词弹幕的准确性。

进一步的，根据N个二级弹幕类中每个二级弹幕类的弹幕的句向量，获得每个二级弹幕类的聚类中心弹幕。

可以理解的是，步骤S307与图2所示实施例中的步骤S203以及本实施例中步骤S303中所示的方法与原理类似，具体可参考上述的实施例的方案，此处不再赘述。

S308、接收用户的终端设备发送的弹幕开始输入指令。

一种可选的方案中，服务器生成热词弹幕后，实时接收用户的终端设备发送的弹幕开始输入指令，其中，弹幕开始输入指令可以包括一下任意一种：用户进入视频播放界面/直播界面、用户开启弹幕输入界面等。

S309、根据弹幕开始输入指令，向终端设备发送至少一个热词弹幕，以使终端设备在播放画面中显示至少一个热词弹幕，使得用户从至少一个热词弹幕中选择所需输入的弹幕。

当接收到弹幕开始输入指令后，将热词弹幕发送至终端设备进行显示。需要说明的是，本申请实施例对于发送的热词弹幕的数量以及种类不做具体限定。示例性的，可以将该视频/直播间所有的弹幕热词均发送至终端设备，在直播界面中供用户滑动选择，也可以发送部分弹幕热词至终端设备，具体的，统计每个类别中出现的数量进行排名，作为热词弹幕的排名依据，从而根据排序选择预设数量的热词弹幕发送至终端设备进行显示。

为方便理解，请参考图6，图6为本申请一实示例提供的热词弹幕发送示意图。图6以直播场景为例示出，如图6所示，用户在终端设备的直播间A的直播界面中点选“发送弹幕”等弹幕开始输入操作，服务器接收到终端设备发送的弹幕开始输入指令，当服务器接收到弹幕开始输入指令后，将热词弹幕发送至终端设备的界面中的热词弹幕显示区域进行显示。

一方面，可以将该视频/直播间所有的弹幕热词均发送至终端设备，在直播界面中供用户滑动选择，用户按照滑动方向滑动选择需要输入的弹幕，需要说明的是，对于滑动方向，本申请实施例不做具体限定，例如，可以为左右滑动，也可以为上下滑动，图中以上下滑动为例示出。

另一方面，也可以发送部分弹幕热词至终端设备，具体的，统计每个类别中出现的数量，根据数量从多到少对热词弹幕进行排序，从而根据排序选择预设数量的热词弹幕发送至终端设备显示界面中的热词弹幕显示区域中进行显示。

进一步的，用户点选界面中显示的热词弹幕即可发送弹幕。

图7为本申请一实施例提供的弹幕处理装置的结构示意图。如图7所示，本申请实施例提供的弹幕处理装置70可以包括：

获取模块701，用于获取目标子时间段内多个不同子时间段产生的多条弹幕，并获取每条弹幕的句向量；

处理模块702，用于根据每个子时间段的每条弹幕的句向量，将每个子时间段的多条弹幕聚类为至少一个弹幕类，根据每个弹幕类中弹幕的句向量，获得每个弹幕类中的聚类中心弹幕；以及根据每个子时间段的至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的各个弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据N个二级弹幕类中每个二级弹幕类的弹幕的句向量，获得每个二级弹幕类的聚类中心弹幕；

确定模块703，用于确定每个二级弹幕类的聚类中心弹幕为目标子时间段产生的热词弹幕，热词弹幕用于供用户快捷输入弹幕。

可以理解的是，本实施例所提供的弹幕处理装置，可用于执行如上述任一方法实施例的技术方案，其实现原理和技术效果类似，具体可参考上述方法实施例，此处不再赘述。

可选的，获取模块701具体用于，针对每条弹幕，获取弹幕中每个字的字向量；

根据弹幕中各字的字向量，获取弹幕的字向量均值；

根据字向量均值，获得弹幕的句向量。

可选的，获取模块701具体用于，针对每条弹幕，将弹幕输入至预先训练好的bert模型，获得bert模型输出的弹幕中每个字的字向量；

可选的，处理模块702具体用于，针对同一子时间段，将子时间段的多条弹幕的句向量进行降维和归一化处理；

可选的，处理模块702具体用于，针对同一子时间段，根据子时间段任意两条弹幕的句向量，获得任意两条弹幕的句向量间的余弦距离；

可选的，处理模块702具体用于，针对每个弹幕类，根据弹幕类中包含的弹幕的句向量，获取弹幕类的句向量均值为聚类中心向量；

可选的，处理模块701还用于，接收用户的终端设备发送的弹幕开始输入指令；

图8为本申请一实施例提供的电子设备的结构示意图。如图8所示，电子设备80包括处理组件801，其进一步包括一个或多个处理器，以及由存储器802所代表的存储器资源，用于存储可由处理组件801的执行的指令，例如应用程序。存储器802中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件801被配置为执行指令，以执行如图2～图5所示的实施例，具体参见上述方法实施例中的说明，此处不再赘述。

电子设备80还可以包括一个有线或无线网络接口803被配置为将电子设备80连接到网络，和一个输入输出(I/O)接口804。电子设备80可以操作基于存储在存储器802的操作系统，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

本领域技术人员可以理解的是，图8中示出的电子设备的结构并不构成对本电子设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

在此需要说明的是，本申请提供的上述电子设备，用于实现上述方法实施例中描述的对应于服务器的方法，且能够达到相同的技术效果，在此不再对本实施例中与方法实施例相同的部分及有益效果进行具体赘述。

本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时用于实现如上任一实施例的弹幕处理方法。

本申请实施例还提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如上任一实施例的弹幕处理方法。

在上述的实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个模块可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能模块的形式实现的集成的模块，可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本申请各个实施例方法的部分步骤。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

1.一种弹幕处理方法，其特征在于，包括：

获取目标时间段内多个不同子时间段产生的多条弹幕，并获取所述多条弹幕的句向量；

根据同一子时间段的所述弹幕的句向量，将所述同一子时间段的多条弹幕聚类为至少一个弹幕类，根据所述弹幕类中包含的弹幕的句向量，获得所述弹幕类中的聚类中心弹幕；

根据所述同一子时间段的所述至少一个弹幕类的聚类中心弹幕的句向量，将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类，根据所述二级弹幕类中包含的弹幕的句向量，获得所述二级弹幕类的聚类中心弹幕；

确定所述二级弹幕类的聚类中心弹幕为所述目标时间段产生的热词弹幕，所述热词弹幕用于供用户快捷输入弹幕。

2.根据权利要求1所述的方法，其特征在于，所述获取多条弹幕的句向量，包括：

针对每条弹幕，获取所述弹幕中每个字的字向量；

根据所述弹幕中各字的字向量，获取所述弹幕的字向量均值；

根据所述字向量均值，获得所述弹幕的句向量。

3.根据权利要求2所述的方法，其特征在于，所述获取目标时间段内多个不同子时间段产生的多条弹幕，并获取所述多条弹幕的句向量，包括：

针对每条弹幕，将所述弹幕输入至预先训练好的bert模型，获得所述bert模型输出的所述弹幕中每个字的字向量；

将所述弹幕中各字的字向量输入至预先训练好的双向LSTM网络，获取所述LSTM网络输出的所述弹幕的字向量均值。

4.根据权利要求1所述的方法，其特征在于，所述根据同一子时间段的所述弹幕的句向量，将同一子时间段的多条弹幕聚类为至少一个弹幕类，包括：

针对同一子时间段，将所述子时间段的多条弹幕的句向量进行降维和归一化处理；

根据所述子时间段经过降维和归一化处理后的多条弹幕的句向量，将所述同一子时间段的多条弹幕聚类为至少一个弹幕类。

5.根据权利要求1所述的方法，其特征在于，所述根据同一所述子时间段的每条弹幕的句向量，将同一所述子时间段的多条弹幕聚类为至少一个弹幕类，包括：

针对同一子时间段，根据所述子时间段任意两条弹幕的句向量，获得所述任意两条弹幕的句向量间的余弦距离；

根据预设距离分别与所述子时间段中任意两条弹幕的句向量的余弦距离之差，采用DBSCAN聚类算法，将所述子时间段的多条弹幕聚类为至少一个弹幕类。

6.根据权利要求1所述的方法，其特征在于，将同一子时间段的多条弹幕聚类为至少一个弹幕类所采用的聚类算法与将多个不同子时间段的弹幕类的聚类中心弹幕聚类为N个二级弹幕类所采用的聚类算法相同；

7.根据权利要求1-6任一项所述的方法，其特征在于，所述根据所述弹幕类中包含的弹幕的句向量，获得所述弹幕类中的聚类中心弹幕，包括：

针对每个弹幕类，根据所述弹幕类中包含的多条弹幕的句向量，获取所述弹幕类的句向量均值为聚类中心向量；

根据所述弹幕类中多条弹幕的句向量和所述聚类中心向量，获得多条弹幕的句向量到所述聚类中心向量的欧式距离；

确定到所述聚类中心向量的欧式距离最小的句向量对应的弹幕，为所述弹幕类中的聚类中心弹幕。

8.根据权利要求1-6任一项所述的方法，其特征在于，所述确定所述二级弹幕类的聚类中心弹幕为所述目标时间段产生的热词弹幕之后，还包括：

接收用户的终端设备发送的弹幕开始输入指令；

根据所述弹幕开始输入指令，向所述终端设备发送所述至少一个热词弹幕，以使所述终端设备在播放画面中显示所述至少一个热词弹幕，使得所述用户从所述至少一个热词弹幕中选择所需输入的弹幕。

9.一种电子设备，其特征在于，包括：

存储器，用于存储程序指令；

处理器，用于调用并执行所述存储器中的程序指令，执行如权利要求1至8中任一向所述的弹幕处理方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至8中任一向所述的弹幕处理方法。