CN115767204A

CN115767204A - 一种视频处理方法、电子设备及存储介质

Info

Publication number: CN115767204A
Application number: CN202211407810.XA
Authority: CN
Inventors: 柳政
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2022-11-10
Filing date: 2022-11-10
Publication date: 2023-03-07

Abstract

本发明实施例提供了一种视频处理方法、电子设备及存储介质，涉及视频处理技术领域。通过对视频的弹幕数据中的若干条弹幕文本进行聚类，确定出若干个弹幕类别。再从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据目标弹幕文本确定出各弹幕类别所对应的主题信息。然后依据若干条弹幕文本对应的弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。最后依据弹幕分布信息，从视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。可以解决短视频内容质量低等的技术问题。提升短视频的内容质量，满足更多用户的观看需求。

Description

一种视频处理方法、电子设备及存储介质

技术领域

本发明涉及视频处理技术领域，特别是涉及一种视频处理方法、电子设备及存储介质。

背景技术

随着消费者快节奏的视频观看需求的增长，需要将播放时长较长的视频，通过剪辑、处理的方式变成短视频，以满足用户需求。当前，从长视频中剪辑出短视频普遍采用的是人工观看长视频，并选定其中的多个片段，再将多个片段剪辑形成。由于不同用户确定长视频中的精彩之处受用户主观因素影响较大，采用上述方式得到的短视频的内容质量不能保证，且可能影响用户的观看体验。

发明内容

本发明实施例的目的在于提供一种视频处理方法、电子设备及存储介质，以实现通过用户观看视频的弹幕数据来自动生成短视频，提升短视频的内容质量，满足更多用户的观看需求。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种视频处理方法，所述方法包括：

获取视频的弹幕数据，所述弹幕数据包括若干条弹幕文本和各弹幕文本对应的弹幕发送时间；

对若干条弹幕文本进行聚类，确定出若干个弹幕类别；

从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息；

依据所述弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息；

依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。

可选的，所述对若干条弹幕文本进行聚类，确定出若干个弹幕类别，包括：

对若干条弹幕文本进行过滤，得到过滤后的若干条弹幕文本；

对过滤后的若干条弹幕文本进行聚类，确定出若干个弹幕类别。

可选的，所述对过滤后的若干条弹幕文本进行聚类，确定出若干个弹幕类别，包括：

分别计算过滤后的若干条弹幕文本中的每两条弹幕文本之间的第一文本相似度；

在所述第一文本相似度满足预设相似条件的情况下，将第一文本相似度对应的两条弹幕文本分别作为两个节点，并依据所述第一文本相似度关联对应的两个节点，生成弹幕关联图谱，所述连接线的长度与第一文本相似度成反比关系；

对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别。

可选的，所述对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别，包括：

选定所述弹幕关联图谱中的任一节点作为起始节点，依据与所述起始节点连接的其中一条连接线游走到下一节点，并确定对应的游走概率值；

依据与所述下一节点连接的其中一条连接线游走到另一节点，确定对应的第二个游走概率值；

直至游走遍所述弹幕关联图谱中的所有节点，确定对应的若干个游走概率值，并依据若干个游走概率值，确定弹幕关联值；

在所述弹幕关联值满足预设聚类条件时，依据所述弹幕关联值确定出若干个弹幕类别。

可选的，所述对若干条弹幕文本进行过滤，得到过滤后的若干条弹幕文本，包括：

依据预设的屏蔽关键词对若干条弹幕文本分别进行匹配，并清除匹配成功的弹幕文本，得到过滤后的若干条弹幕文本；和/或，

依据预设的屏蔽模板对若干条弹幕文本分别进行匹配，并清除匹配成功的弹幕文本，得到过滤后的若干条弹幕文本；和/或，

依据预设的文本分类模型对若干条弹幕文本分别进行分类识别，清除屏蔽类的弹幕文本，得到过滤后的若干条弹幕文本。

可选的，所述从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，包括：

针对同一弹幕类别内的若干条弹幕文本，分别计算其中一条弹幕文本与其他弹幕文本之间的第二文本相似度；

对若干个第二文本相似度进行加权，得到其中一条弹幕文本在所述弹幕类别中的评估值；

从若干个评估值筛选出满足目标评估条件的目标评估值，并将所述目标评估值对应的弹幕文本作为目标弹幕文本。

可选的，所述依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息，包括：

将所述目标弹幕文本输入到预设的主题提取模型中进行语义识别，确定出对应的目标关键词，并将所述目标关键词作为所述目标弹幕文本所属弹幕类别所对应的主题信息。

可选的，所述弹幕分布信息包括：

各弹幕主题对应的若干条弹幕文本在若干段时间段内的弹幕条数，若干段时间段通过对所述播放时序分割得到；

或者，

各弹幕主题对应的若干条弹幕文本在若干段时间段内的分布占比，所述分布占比由各段时间段内，各弹幕主题对应的若干条弹幕文本的弹幕条数和所有弹幕文本对应的弹幕条数确定。

可选的，所述依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，包括：

依据所述弹幕分布信息，从所述视频中确定出满足各主题信息对应的第一剪辑条件的若干段时间段；

对所述视频中与各段时间段对应的视频片段进行运镜识别，确定出对应视频片段的片段完整度；

在所述片段完整度未满足第二剪辑条件的情况下，扩大对应视频片段的时间段的时间范围，得到更新后的时间段；

对更新后的时间段对应的视频片段分别进行运镜识别和确定片段完整度是否满足第二剪辑条件；

在所述片段完整度满足第二剪辑条件的情况下，从所述视频中分割出与对应时间段匹配的片段作为视频片段。

在本发明实施的第二方面，还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现上述任一所述的方法步骤。

在本发明实施的又一方面，还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述任一所述的视频处理方法。

在本发明实施的又一方面，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述任一所述的视频处理方法。

本发明实施例提供的一种视频处理方法，通过对视频的弹幕数据中的若干条弹幕文本进行聚类，确定出若干个弹幕类别。再从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据目标弹幕文本确定出各弹幕类别所对应的主题信息。然后依据若干条弹幕文本对应的弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。最后依据弹幕分布信息，从视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。其中，目标视频片段是用户在观看视频时重点关注的主题信息对应的若干段视频片段的集合。由此可以解决因人为主观确定视频的精彩片段导致剪辑的短视频的内容质量不能保证，且可能影响用户的观看体验的技术问题。从而提升短视频的内容质量，满足更多用户的观看需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种视频处理方法的步骤流程示意图；

图2为本发明实施例提供的另一种视频处理方法的步骤流程示意图；

图3为本发明实施例提供的一种弹幕关联图谱的结构示意图；

图4为本发明实施例提供的一种基于弹幕关联图谱确定多个弹幕群组的示意图；

图5为本发明实施例提供的一种视频处理装置的结构示意图；

图6为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

参照图1，本发明实施例提供了一种视频处理方法，所述方法可以包括：

S101、获取视频的弹幕数据，所述弹幕数据包括若干条弹幕文本和各弹幕文本对应的弹幕发送时间。

本发明实施例中，弹幕是在视频播放场景下的一种用户互动功能，在用户基于自己的视频客户端观看目标视频时，会随时唤起弹幕输入框，发布弹幕。其中，所述弹幕文本指的是用户发布的弹幕中的文本内容。用户在发送弹幕之后，服务端可以获取到视频对应的弹幕数据。弹幕数据可以理解为整个视频的播放过程中所获取到的全部弹幕的相关数据。其可以包括若干条弹幕文本和各弹幕文本所对应的弹幕发送时间。其中，弹幕发送时间可以是以视频的播放时序为时间轴确定，与视频的播放时序具有一致性。

S102、对若干条弹幕文本进行聚类，确定出若干个弹幕类别。

本发明实施例中，在获取到视频的弹幕数据之后，可以对弹幕数据中的若干条弹幕文本进行聚类。一种示例中，可以利用两条弹幕文本之间的文本相似度来进行聚类，例如将文本相似度高的两条弹幕文本聚成一个弹幕类别。从而在执行聚类操作后，得到若干个弹幕类别。其中，每个弹幕类别中分别包括若干条弹幕文本。

S103、从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息。

本发明实施例中，所述目标弹幕文本用于表征弹幕类别中的所有弹幕文本的语义信息，其可以体现出所述弹幕类别对应的中心思想。一种示例中，针对同一弹幕类别中的若干条弹幕文本，可以从若干条弹幕文本中随机选定一条弹幕文本作为目标弹幕文本。从而在确定出目标弹幕文本之后，基于目标弹幕文本的语义信息确定出对应弹幕类别所对应的主题信息。其中，主题信息是根据目标弹幕文本的语义信息确定到的目标关键词。其用于表征各弹幕类别中的弹幕文本所表达的弹幕观点，换句话说，也可以理解为通过主题信息对若干个弹幕类别分别进行分类标记。

S104、依据所述弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。

本发明实施例中，在确定出若干个弹幕类别对应的主题信息之后，可以依据弹幕数据中每个弹幕文本对应的弹幕发送时间，按照时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。例如，对视频的播放时序进行分割，得到若干段时间段。则，所述弹幕分布信息可以理解为各主题信息对应的弹幕文本在若干段时间段内的分布情况。从而可以根据弹幕分布信息，筛选出用户重点关注的主题信息对应的时间段，并基于时间段剪辑对应的视频片段。

S105、依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。

本发明实施例中，可以预先预设各主题信息对应的第一剪辑条件，其中，各主题信息对应的第一剪辑条件可以相同，也可以存在差异，在此不做过多限定。例如，第一剪辑条件可以是某一时间段内的对应主题信息的弹幕文本的弹幕条数大于或等于预设条数阈值等。从而可以基于弹幕分布信息，从视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段。并且，用户在观看满足第一剪辑条件的视频片段的过程中发送的弹幕文本的条数越多，说明对应视频片段的视频内容越精彩，或越受用户欢迎。因此，可以分别将若干段视频片段剪辑在一起，得到各主题信息对应的目标视频片段。从而提升短视频的内容质量，满足更多用户的观看需求。

参照图2，本发明实施例提供了另一种视频处理方法，所述方法可以包括：

S201、获取视频的弹幕数据，所述弹幕数据包括若干条弹幕文本和各弹幕文本对应的弹幕发送时间。

本发明实施例中，对步骤S201的描述内容参照对步骤S101的描述内容。

例如，针对某一综艺节目，获取到的若干条弹幕文本可以为如下：“莹莹好会说呀”、“蓓蓓的好好看”、“好可爱呀宝蓓”、“蓓蓓颜值高怎么照都好看呀”、“蓓蓓有点欠打”、“这一季最好了都很体面”、“这季大家相处的好棒”、“这季好和谐”、“这季真的好好呀”、“不喜欢就直说”、“不喜欢就随心”、“就是不喜欢”、“不喜欢还吊着，真垃圾”、“不喜欢就要拒绝”。

S202、对若干条弹幕文本进行过滤，得到过滤后的若干条弹幕文本。

本发明实施例中，可以预先对生成目标视频片段的无关弹幕文本进行过滤，可以提高后续弹幕文本的聚类效率和效果。其中，无关弹幕文本的语义信息类别可以包括但不限于涉黄、暴力、涉政、态度消极等内容。例如，可以通过以下三种过滤方式来进行过滤：

一种示例中，可以预设一些屏蔽关键词用于弹幕文本的过滤。例如，屏蔽关键词可以为“垃圾”、“欠打”等分词。依据所述屏蔽关键词对若干条弹幕文本分别进行匹配，若在弹幕文本中成功匹配到对应的屏蔽关键词，则清除匹配成功的弹幕文本。例如，上述弹幕文本“蓓蓓有点欠打”和“不喜欢还吊着，真垃圾”中分别含有屏蔽关键词，对上述两条弹幕文本进行清除，从而得到过滤后的若干条弹幕文本。

另一种示例中，还可以预设一些屏蔽模板用于弹幕文本的过滤。所述屏蔽模板可以为涉黄涉赌类的常见业务模板，如“线下XXX，联系方式XXX”。从而依据预设的屏蔽模板对若干条弹幕文本分别进行匹配，若在弹幕文本中成功匹配到对应的屏蔽模板，则清除匹配成功的弹幕文本，从而得到过滤后的若干条弹幕文本。

又一种示例中，还可以预设一个文本分类模型对若干条弹幕文本分别进行分类识别，所述文本分类模型可以采用LSTM(Long Short-Term Memory，长短期记忆网络)或BERT(BidirectionalEncoder Representations from Transformer，基于Transformer的双向编码器表示)确定。其可以是基于弹幕文本的语义信息的语义识别，输出对应弹幕文本的文本类别。例如，文本类别可以包括屏蔽类和非屏蔽类两种类型，若对应弹幕文本被识别为屏蔽类，则清除屏蔽类的弹幕文本，从而得到过滤后的若干条弹幕文本。其中，所述文本分类模型是基于人工审核分类的样本弹幕文本训练得到。

本领域技术人员可以根据实际业务需求选取上述三种过滤方式中的至少一种进行弹幕文本的过滤，在此不作具体限定。通过上述方式对弹幕文本过滤，可以提高过滤后的若干条弹幕文本的文本质量。

S203、分别计算过滤后的若干条弹幕文本中的每两条弹幕文本之间的第一文本相似度。

S204、在所述第一文本相似度满足预设相似条件的情况下，将第一文本相似度对应的两条弹幕文本分别作为两个节点，并依据所述第一文本相似度关联对应的两个节点，生成弹幕关联图谱。

S205、对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别。

本发明实施例中，可以通过两条弹幕文本之间的第一文本相似度来初步判定两条弹幕文本之间的语义信息是否存在关联。其中，可以预先设置相似条件，如所述相似条件为第一文本相似度大于或等于第一文本阈值等。一种示例中，可以采用BERT网络训练出一个第一相似度模型，从而可以将若干条弹幕文本中的每两条弹幕文本输入到第一相似度模型中进行相似度计算，分别计算出过滤后的若干条弹幕文本中的每两条弹幕文本之间的第一文本相似度，接着判定若干个第一文本相似度是否满足预设的相似条件。

参照图3所示，在所述第一文本相似度满足预设相似条件的情况下，将第一文本相似度所对应的两条弹幕文本分别作为两个节点，所述节点在图3中采用圆圈来表示。并依据所述第一文本相似度关联对应的两个节点。所述第一文本相似度在图3中采用连接线来表示。其中，所述连接线的长度与第一文本相似度成反比关系。如，第一文本相似度越高，则对应的两个节点之间的连接线的长度越短；第一文本相似度越低，则对应的两个节点之间的连接线的长度越短。

在过滤后的若干条弹幕文本中的每两条弹幕文本之间的第一文本相似度均计算之后，可以依据若干个节点和若干条连接线，形成一弹幕关联图谱，如图3所示。其中，可以根据预设的社群检测算法(即通过最小化熵来寻求最优的聚类方案)，对所述弹幕关联图谱进行图聚类，从而确定出若干个弹幕类别。

一种示例中，参照图4所示，可以随机选定所述弹幕关联图谱中的任一节点作为起始节点，依据与所述起始节点连接的其中一条连接线游走到下一节点，并确定对应的游走概率值。由于连接线的长度与第一文本相似度成反比关系，游走概率值可以是根据第一文本相似度来确定，例如，游走概率值可以为所述连接线对应的第一文本相似度进行归一化后的值。依据与所述下一节点连接的其中一条连接线游走到另一节点，确定对应的第二个游走概率值。直至游走遍所述弹幕关联图谱中的所有节点(同一节点在游走过程中可以游走多遍)，确定对应的若干个游走概率值，并依据若干个游走概率值，确定弹幕关联值。例如，弹幕关联值可以通过若干个游走概率值进行加权得到。所述预设聚类条件可以为弹幕关联值最小化。由此，可以从若干个弹幕关联值筛选出满足预设聚类条件的弹幕关联值。并且，在弹幕关联值最小化时，其对应的是最优的游走方案。如图4所示，在确定出最优的游走方案后，会得到一些潜在的弹幕类别。例如依序匹配两个节点之间的第一文本相似度，确定出若干个第一文本相似度高的节点，作为其中一组弹幕类别，并依序匹配除该弹幕类别之外的其他节点，确定出另一组弹幕类别。以此类推，可以得到若干个弹幕类别。例如，在图4中每个弹幕类别通过虚线的圆圈进行表示。两个弹幕类别之间建立起关联的第一文本相似度低，对应图4中的连接线的长度较长。从而在所述弹幕关联值满足预设聚类条件时，依据所述弹幕关联值确定出若干个弹幕类别。

例如，基于以下若干条弹幕文本“莹莹好会说呀”、“蓓蓓的好好看”、“好可爱呀宝蓓”、“蓓蓓颜值高怎么照都好看呀”、“这一季最好了都很体面”、“这季大家相处的好棒”、“这季好和谐”、“这季真的好好呀”“不喜欢就直说”、“不喜欢就随心”、“就是不喜欢”、“不喜欢就要拒绝”可以确定出3组弹幕类别，其每组对应的弹幕文本可以如下所示：

【弹幕类别1】“莹莹好会说呀”、“蓓蓓的好好看”、“好可爱呀宝蓓”、“蓓蓓颜值高怎么照都好看呀”。

【弹幕类别2】“这一季最好了都很体面”、“这季大家相处的好棒”、“这季好和谐”、“这季真的好好呀”。

【弹幕类别3】“不喜欢就直说”、“不喜欢就随心”、“就是不喜欢”、“不喜欢就要拒绝”。

S206、从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息。

本发明实施例中，目标弹幕文本用于表征弹幕类别中的所有弹幕文本的语义信息，其可以体现出所述弹幕类别对应的中心思想。一种示例中，针对同一弹幕类别中的若干条弹幕文本，可以从若干条弹幕文本中随机选定一条弹幕文本作为目标弹幕文本。从而在确定出目标弹幕文本之后，基于目标弹幕文本的语义信息确定出对应弹幕类别所对应的主题信息。其中，主题信息是根据目标弹幕文本的语义信息确定到的目标关键词。其用于表征各弹幕类别中的弹幕文本所表达的弹幕观点，换句话说，也可以理解为通过主题信息对若干个弹幕类别分别进行分类标记。

另一种可选的发明实施例中，为了提高后续确定弹幕类别对应的主题信息的精确度，可以依据文本相似度来选定对应的目标弹幕文本。针对同一弹幕类别内的若干条弹幕文本，分别计算其中一条弹幕文本与其他弹幕文本之间的第二文本相似度。对若干个第二文本相似度进行加权，得到其中一条弹幕文本在所述弹幕类别中的评估值。其中，所述评估值用于评估弹幕文本表征对应弹幕类别整体所体现的语义信息的准确程度。例如，所述评估值越高，则说明对应的弹幕文本与其他的弹幕文本的第二文本相似度越高，所述弹幕文本就越接近其他弹幕文本的真实语义信息。所述目标评估条件可以为评估值最高，从若干个评估值筛选出满足目标评估条件的目标评估值，并将所述目标评估值对应的弹幕文本作为目标弹幕文本，其可以体现出所述弹幕类别对应的中心语义，从而可以提高依据目标弹幕文本确定主题信息的精确度。

例如针对上述【弹幕类别1】，计算弹幕文本“莹莹好会说呀”与其他3条弹幕文本之间的第二文本相似度，其经过3个第二文本相似度的加权，得到对应的评估值为2.4；计算弹幕文本“蓓蓓的好好看”与其他3条弹幕文本之间的第二文本相似度，其经过3个第二文本相似度的加权，得到对应的评估值为2.95；计算弹幕文本“好可爱呀宝蓓”与其他3条弹幕文本之间的第二文本相似度，其经过3个第二文本相似度的加权，得到对应的评估值为2.8；计算弹幕文本“蓓蓓颜值高怎么照都好看呀”与其他3条弹幕文本之间的第二文本相似度，其经过3个第二文本相似度的加权，得到对应的评估值为2.75。其中，弹幕文本“蓓蓓的好好看”所对应的评估值最高，由此确定为目标评估值，并选定【弹幕类别1】中目标弹幕文本为“蓓蓓的好好看”。

由于聚类过程中并没有明确类别数目和类别名称，由此，可以通过主题提取模型对所述目标弹幕文本进行语义识别，得到各聚类群组的主题信息。由此，主题信息也可以理解为根据目标弹幕文本的语义信息确定到的目标关键词。其中，主题提取模型可以是基于BERT等模型预先训练得到，对应的主题信息预先确定。例如，所述主题信息可以包括夸颜值、夸特效、夸性格、夸剧情等相关分词，还可以包括用户在观看目标视频时所普遍关注的点所对应的相关分词。

将目标弹幕文本“蓓蓓的好好看”输入到主题提取模型中进行语义识别，其得到的主题信息可以是：主题【颜值】程度【高】。由此，主题信息是用于表征各弹幕类别中的弹幕文本所表达的弹幕观点，换句话说，也可以理解为通过主题信息对若干个弹幕类别分别进行分类标记。并且，在此过程中，可以筛选掉其中一部分提取不到主题信息的弹幕类别。从而在生成短视频的过程中只生成具有明确主题信息的目标视频片段，既保证了若干段视频片段剪辑生成目标视频片段的内容统一性，又保证了目标视频片段能够满足更多用户的观看需求，提高用户的观看体验。

S207、依据所述弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。

本发明实施例中，在确定出若干个弹幕类别对应的主题信息之后，可以依据弹幕数据中每个弹幕文本对应的弹幕发送时间，按照时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。则，所述弹幕分布信息可以理解为各主题信息对应的弹幕文本在若干段时间段内的分布情况。从而可以根据弹幕分布信息，筛选出用户重点关注的主题信息对应的时间段，并基于时间段剪辑对应的视频片段。

一种示例中，对视频的播放时序进行分割，得到若干段时间段，例如，视频的播放时序为0-240s，对应的，可以按照预设时间间隔对播放时序进行分割，从而得到若干段时间段。例如，所述预设时间间隔可以为10S，则对应的若干段时间段分别可以为：0-10S、10-20S、...、230S-240S。本领域技术人员可以根据对应视频的播放时序合理确定预设时间间隔，在此不做过多限定。

一种示例中，所述弹幕分布信息可以包括各弹幕主题对应的若干条弹幕文本在若干段时间段内的弹幕条数。例如，基于上述若干段时间段得到的弹幕分布信息可以为：0-10s：颜值高【10条】，特效好【5条】；10-20S：颜值高【20条】，特效好【1条】；...；230S-240S：颜值高【20条】，特效好【3条】。

或者，在另一种示例中，各弹幕主题对应的若干条弹幕文本在若干段时间段内的分布占比，所述分布占比由各段时间段内，各弹幕主题对应的若干条弹幕文本的弹幕条数和所有弹幕文本对应的弹幕条数确定。例如，基于上述若干段时间段得到的弹幕分布信息可以为：0-10s：颜值高【10％】，特效好【5％】；10-20S：颜值高【20％】，特效好【1％】；...；230S-240S：颜值高【20％】，特效好【3％】。其中，所述分布占比可以是对应时间段内，各弹幕主题对应的若干条弹幕文本的弹幕条数和此时间段内的所有弹幕文本对应的弹幕条数之间的比值。

S208、依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。

本发明实施例中，可以预先预设各主题信息对应的第一剪辑条件，其中，各主题信息对应的第一剪辑条件可以相同，也可以存在差异，在此不做过多限定。例如，第一剪辑条件可以是某一时间段内的对应主题信息的弹幕文本的弹幕条数大于或等于预设条数阈值等，如预设调条数阈值设置为20。又或者是分布占比大于或等于预设占比阈值等，如预设占比阈值为20％。

从而可以基于弹幕分布信息，从视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段。并且，用户在观看满足第一剪辑条件的视频片段的过程中发送的弹幕文本的条数越多，说明对应视频片段的视频内容越精彩，或越受用户欢迎。例如，基于上述弹幕分布信息可知，10-20S：颜值高【20条】和230S-240S：颜值高【20条】满足主题信息【颜值高】对应的第一剪辑条件，从而从视频中将对应时段(10-20S和230S-240S)的视频片段分割出来，并将两段视频片段进行组合，形成一突出视频中相关人物【颜值高】的目标视频片段。基于上述方式可以分别将若干段视频片段剪辑在一起，得到各主题信息对应的目标视频片段。从而提升短视频的内容质量，满足更多用户的观看需求。

一种可选的发明实施例中，为了使多个视频片段中的视频内容不会莫名的开始和结束。可以在从所述视频中确定出满足各主题信息对应的第一剪辑条件的若干段时间段，例如10-20S：颜值高【20条】和230S-240S：颜值高【20条】满足主题信息【颜值高】对应的第一剪辑条件。并对所述视频中与各段时间段对应的视频片段进行运镜识别(场景识别和镜头识别)，确定出对应视频片段的片段完整度。并判定所述片段完整度是否满足第二剪辑条件。其中，运镜识别可以采用卷积神经网络，所述片段完整度可以是根据场景识别后的场景完整度和镜头识别后的镜头完整度进行加权得到的。

一实施例中，所述第二剪辑条件可以是某一时间段内的视频片段对应的片段完整度大于或等于预设完整度阈值等。如，预设完整度阈值为90％等。在所述片段完整度未满足第二剪辑条件的情况下，扩大对应视频片段的时间段的时间范围，例如，10-20S的视频片段的结尾的片段完整度未满足第二剪辑条件，则可以将对应时间段由10-20S扩大到10-22S，并将10-22S作为更新后的时间段。对更新后的时间段对应的视频片段分别进行运镜识别和确定片段完整度是否满足第二剪辑条件。在所述片段完整度未满足第二剪辑条件的情况下，继续扩大对应视频片段的时间段的时间范围，更新对应时间段。并重复执行对更新后的时间段对应的视频片段分别进行运镜识别和确定片段完整度是否满足第二剪辑条件的方法步骤。只有在所述片段完整度满足第二剪辑条件的情况下，从所述视频中分割出与对应时间段匹配的片段作为视频片段。例如，10-22S和230S-240S均满足第二剪辑条件，则从所述视频中分割出10-22S和230S-240S的视频作为视频片段，用于生成目标视频片段，从而能够通过保证各视频片段的视频完整度，来提高目标视频片段的视频质量。

一种可选的发明实施例中，还可以将与各主题信息对应的目标弹幕文本确定为目标片段标题。一方面，可以实现目标片段标题的自动生成，另一方面，目标片段标题基于用户发送的弹幕文本确定，其可以增加目标视频片段的趣味性，从而提高用户的观看体验。在确定出对应的目标片段标题后，再依据各片段标题和对应的若干个视频片段，生成各主题信息对应的目标视频片段。由此基于用户观看视频的弹幕数据来自动生成短视频，其中弹幕数据包括用户观看视频之后的感受和想法，通过其自动生成短视频的方式可以提升短视频的内容质量，满足更多用户的观看需求。并且，弹幕数据是业务方内部特有的数据，其他业务方不容易获取到对应的弹幕数据，从而可以有利于业务方根据弹幕数据生产差异性较高的业务内容。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请实施例并不受所描述的动作顺序的限制，因为依据本申请实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本申请实施例所必须的。

参照图5，本发明实施例提供了一种视频处理装置，所述装置可以包括：

数据获取模块501，用于获取视频的弹幕数据，所述弹幕数据包括若干条弹幕文本和各弹幕文本对应的弹幕发送时间。

文本聚类模块502，用于对若干条弹幕文本进行聚类，确定出若干个弹幕类别。

主题确定模块503，用于从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，并依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息。

分布信息统计模块504，用于依据所述弹幕发送时间，按时序统计各主题信息对应的若干条弹幕文本的弹幕分布信息。

目标视频片段生成模块505，用于依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，并生成各主题信息对应的目标视频片段。

一种可选的发明实施例中，所述文本聚类模块502可以包括：

文本过滤子模块，用于对若干条弹幕文本进行过滤，得到过滤后的若干条弹幕文本。

文本聚类子模块，用于对过滤后的若干条弹幕文本进行聚类，确定出若干个弹幕类别。

一种可选的发明实施例中，所述文本聚类子模块可以包括：

第一相似度计算单元，用于分别计算过滤后的若干条弹幕文本中的每两条弹幕文本之间的第一文本相似度。

关联图谱确定单元，用于在所述第一文本相似度满足预设相似条件的情况下，将第一文本相似度对应的两条弹幕文本分别作为两个节点，并依据所述第一文本相似度关联对应的两个节点，生成弹幕关联图谱，所述连接线的长度与第一文本相似度成反比关系。

图聚类单元，用于对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别。

一种可选的发明实施例中，所述图聚类单元还可以用于：

选定所述弹幕关联图谱中的任一节点作为起始节点，依据与所述起始节点连接的其中一条连接线游走到下一节点，并确定对应的游走概率值。

依据与所述下一节点连接的其中一条连接线游走到另一节点，确定对应的第二个游走概率值。

直至游走遍所述弹幕关联图谱中的所有节点，确定对应的若干个游走概率值，并依据若干个游走概率值，确定弹幕关联值。

一种可选的发明实施例中，所述文本过滤子模块还可以用于：

一种可选的发明实施例中，所述主题确定模块503包括：

第二相似度计算子模块，用于针对同一弹幕类别内的若干条弹幕文本，分别计算其中一条弹幕文本与其他弹幕文本之间的第二文本相似度。

评估值确定子模块，用于对若干个第二文本相似度进行加权，得到其中一条弹幕文本在所述弹幕类别中的评估值。

目标弹幕确定子模块，用于从若干个评估值筛选出满足目标评估条件的目标评估值，并将所述目标评估值对应的弹幕文本作为目标弹幕文本。

一种可选的发明实施例中，所述弹幕分布信息可以包括：

各弹幕主题对应的若干条弹幕文本在若干段时间段内的弹幕条数，若干段时间段通过对所述播放时序分割得到。

或者，

一种可选的发明实施例中，所述目标视频片段生成模块505可以包括：

时间段确定子模块，用于依据所述弹幕分布信息，从所述视频中确定出满足各主题信息对应的第一剪辑条件的若干段时间段。

完整度确定子模块，用于对所述视频中与各段时间段对应的视频片段进行运镜识别，确定出对应视频片段的片段完整度。

时间段更新子模块，用于在所述片段完整度未满足第二剪辑条件的情况下，扩大对应视频片段的时间段的时间范围，得到更新后的时间段。

条件判定子模块，用于对更新后的时间段对应的视频片段分别进行运镜识别和确定片段完整度是否满足第二剪辑条件。

视频片段确定子模块，用于在所述片段完整度满足第二剪辑条件的情况下，从所述视频中分割出与对应时间段匹配的片段作为视频片段。

本发明实施例还提供了一种电子设备，如图6所示，包括处理器601、通信接口602、存储器603和通信总线604，其中，处理器601，通信接口602，存储器603通过通信总线604完成相互间的通信，

存储器603，用于存放计算机程序；

处理器601，用于执行存储器603上所存放的程序时，实现如下步骤：

对若干条弹幕文本进行聚类，确定出若干个弹幕类别；

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频处理方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一所述的视频处理方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种视频处理方法，其特征在于，所述方法包括：

对若干条弹幕文本进行聚类，确定出若干个弹幕类别；

2.根据权利要求1所述的视频处理方法，其特征在于，所述对若干条弹幕文本进行聚类，确定出若干个弹幕类别，包括：

3.根据权利要求2所述的视频处理方法，其特征在于，所述对过滤后的若干条弹幕文本进行聚类，确定出若干个弹幕类别，包括：

对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别。

4.根据权利要求3所述的视频处理方法，其特征在于，所述对所述弹幕关联图谱进行图聚类，确定出若干个弹幕类别，包括：

5.根据权利要求2所述的视频处理方法，其特征在于，所述对若干条弹幕文本进行过滤，得到过滤后的若干条弹幕文本，包括：

6.根据权利要求1所述的视频处理方法，其特征在于，所述从各弹幕类别对应的若干条弹幕文本中选定目标弹幕文本，包括：

7.根据权利要求6所述的视频处理方法，其特征在于，所述依据所述目标弹幕文本确定出各弹幕类别所对应的主题信息，包括：

8.根据权利要求1所述的视频处理方法，其特征在于，所述弹幕分布信息包括：

或者，

9.根据权利要求8所述的视频处理方法，其特征在于，所述依据所述弹幕分布信息，从所述视频中分别筛选出满足各主题信息对应的第一剪辑条件的若干段视频片段，包括：

10.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-9任一所述的方法步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-9中任一所述的方法。