CN112511766A

CN112511766A - 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质

Info

Publication number: CN112511766A
Application number: CN202011321123.7A
Authority: CN
Inventors: 张珊珊; 梁志婷; 张明洋
Original assignee: Shanghai Minglue Artificial Intelligence Group Co Ltd
Current assignee: Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date: 2020-11-23
Filing date: 2020-11-23
Publication date: 2021-03-16

Abstract

本发明提出一种基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质，其方法技术方案包括弹幕获取步骤，获取视频弹幕数据，并将所述弹幕数据根据时间段进行划分；弹幕分析步骤，使用一自动化工具对所述弹幕数据进行分析，并生成分析结果；可视化步骤，对所述弹幕数据的分析结果可视化后输出；视频剪辑步骤，根据所述分析结果对视频进行剪辑。本发明通过弹幕分类，运用文本的自然语言处理技术，提取弹幕特征，辅助剪辑师进行视频内容的选取，提高了剪辑效率。

Description

基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质

技术领域

本发明属于自然语言处理领域，尤其涉及一种基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质。

背景技术

在影音娱乐资源体量飞速增长的今天，这些影音娱乐资源的增加，一方面会增加创作的素材，但同时也对影音娱乐资源的处理速度和准确性提出了更高的挑战。以其中的视频为例，在直播、实时游戏录制等领域创作了大量的视频资源，这些视频资源是二次创作的优质素材，需要进行剪辑处理。视频剪辑师在工作过程中，常常需要对视频素材进行二次创作。剪辑师在进行二次创作时，需要根据创作目的、风格、画面内容、情感等等因素选定需要剪辑的视频画面，这就要求剪辑师需要反复观看视频以确定内容，造成剪辑耗时较长，效率低下。

视频弹幕是指在网络上观看视频时弹出的评论性字幕，用户在观看视频时，在当前时间点发送弹幕，此条弹幕只会显示在视频流中此刻的位置。虽然不同弹幕的发送时间不同，但是其只会在视频中特定的一个时间点出现，因此在相同时刻发送的弹幕基本上也具有相同的主题，能够表现视频在当前时间点的内容上的特征。

发明内容

本申请实施例提供了一种基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质，以至少解决现有视频剪辑方法剪辑耗时较长，效率低下的问题。

第一方面，本申请实施例提供了一种基于弹幕NLP的视频剪辑方法，包括：弹幕获取步骤，获取视频弹幕数据，并将所述弹幕数据根据时间段进行划分；弹幕分析步骤，使用一自动化工具对所述弹幕数据进行分析，并生成分析结果；可视化步骤，对所述弹幕数据的分析结果可视化后输出；视频剪辑步骤，根据所述分析结果对视频进行剪辑。

优选的，所述弹幕获取步骤还包括：根据一预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的时间段内的所述弹幕数据舍弃；所述预设标准包括一数量阈值。

优选的，所述弹幕分析步骤包括：通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。

优选的，所述可视化步骤包括：以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示；所述可视化形式包括文本形式。

第二方面，本申请实施例提供了一种基于弹幕NLP的视频剪辑系统，适用于上述一种基于弹幕NLP的视频剪辑方法，包括：弹幕获取单元，获取视频弹幕数据，并将所述弹幕数据根据时间段进行划分；弹幕分析单元，使用一自动化工具对所述弹幕数据进行分析，并生成分析结果；可视化单元，对所述弹幕数据的分析结果可视化后输出；视频剪辑单元，根据所述分析结果对视频进行剪辑。

在其中一些实施例中，所述弹幕获取单元还包括：弹幕过滤模块，根据一预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的时间段内的所述弹幕数据舍弃；所述预设标准包括一数量阈值。

在其中一些实施例中，所述弹幕分析单元包括：通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。

在其中一些实施例中，所述可视化单元包括：以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示；所述可视化形式包括文本形式。

第三方面，本申请实施例提供了一种电子设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述第一方面所述的一种基于弹幕NLP的视频剪辑方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上述第一方面所述的一种基于弹幕 NLP的视频剪辑方法。

相比于相关技术，本申请实施例提供的一种基于弹幕NLP的视频剪辑方法通过弹幕分类，运用文本的自然语言处理技术，提取弹幕特征，辅助剪辑师进行视频内容的选取，提高剪辑效率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本发明的基于弹幕NLP的视频剪辑方法流程图；

图2为本发明的基于弹幕NLP的视频剪辑系统的框架图；

图3为本发明的电子设备的框架图；

以上图中：

1、弹幕获取单元；2、弹幕分析单元；3、可视化单元；4、视频剪辑单元； 11、弹幕过滤模块；60、总线；61、处理器；62、存储器；63、通信接口。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

显而易见地，下面描述中的附图仅仅是本申请的一些示例或实施例，对于本领域的普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图将本申请应用于其他类似情景。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

视频剪辑师在工作过程中，常常需要对视频素材进行二次创作。剪辑师在进行二次创作时，需要根据创作目的、风格、画面内容、情感等等因素选定需要剪辑的视频画面。这就要求剪辑师需要反复观看视频以确定内容，造成剪辑耗时较长，效率低下。

自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系，但又有重要的区别。自然语言处理并不是一般地研究自然语言，而在于研制能有效地实现自然语言通信的计算机系统，特别是其中的软件系统。因而它是计算机科学的一部分。自然语言处理(NLP)是计算机科学，人工智能，语言学关注计算机和人类(自然)语言之间的相互作用的领域。

视频弹幕是指在网络上观看视频时弹出的评论性字幕，用户在观看视频时，在当前时间点发送弹幕，此条弹幕只会显示在视频流中此刻的位置。虽然不同弹幕的发送时间不同，但是其只会在视频中特定的一个时间点出现，因此在相同时刻发送的弹幕基本上也具有相同的主题，能够表现视频在当前时间点的内容上的特征。弹幕可以给观众一种“实时互动”的错觉，虽然不同弹幕的发送时间有所区别，但是其只会在视频中特定的一个时间点出现，因此在相同时刻发送的弹幕基本上也具有相同的主题，在参与评论时就会有与其他观众同时评论的错觉。而传统的播放器评论系统是独立于播放器之外的，因此评论的内容大多围绕在整个视频上，话题性不强，也没有“实时互动”的感觉。

在机器学习、模式识别和图像处理中，特征提取从初始的一组测量数据开始，并建立旨在提供信息和非冗余的派生值(特征)，从而促进后续的学习和泛化步骤，并且在某些情况下带来更好的可解释性。特征提取与降维有关。特征的好坏对泛化能力有至关重要的影响。至今为止特征没有万能和精确的定义。特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣” 的部分，它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”：同一场景的不同图像所提取的特征应该是相同的。文本特征提取有两个非常重要的模型：词集模型：单词构成的集合，集合中每个元素都只有一个，也即词集中的每个单词都只有一个；词袋模型：如果一个单词在文档中出现不止一次，并统计其出现的次数(频数)。文本处理领域还有一种特征提取方法，叫做TF-IDF 模型(term frequency–inverse document frequency，词频与逆向文件频率)。 TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索应用，作为文件与用户查询之间相关程度的度量或评级。TF-IDF的主要思想是：如果某个词或短语在一篇文章中出现的频率TF(Term Frequency，词频)，词频高，并且在其他文章中很少出现，则认为此词或者短语具有很好的类别区分能力，适合用来分类。TF-IDF实际上是：TF*IDF。TF表示词条在文档d中出现的频率。IDF(inverse document frequency，逆向文件频率)的主要思想是：如果包含词条t的文档越少，也就是n越小，IDF越大，则说明词条t具有很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m，而其它类包含t的文档总数为k，显然所有包含t的文档数n＝m+k，当m大的时候，n也大，按照IDF公式得到的IDF的值会小，就说明该词条t类别区分能力不强。但是实际上，如果一个词条在一个类的文档中频繁出现，则说明该词条能够很好代表这个类的文本的特征，这样的词条应该给它们赋予较高的权重，并选来作为该类文本的特征词以区别与其它类文档。TF-IDF模型通常和词袋模型配合使用，对词袋模型(binary参数需要设置为True)生成的数组进一步处理。

网页爬取器，是指网页搜索集子系统中根据url完成一篇见面爬取的进程或者线程，通常一个搜索子系统上会同时启动多个gatherer并行工作。通常包括如下步骤：获取初始的URL。初始的URL地址可以由用户人为地指定，也可以由用户指定的某个或某几个初始爬取网页决定。根据初始的URL爬取页面并获得新的URL。获得初始的URL地址之后，首先需要爬取对应URL地址中的网页，爬取了对应的URL地址中的网页后，将网页存储到原始数据库中，并且在爬取网页的同时，发现新的URL地址，同时将已爬取的URL地址存放到一个URL列表中，用于去重及判断爬取的进程。将新的URL放到URL队列中。获取了下一个新的URL地址之后，会将新的URL地址放到URL队列中。从URL队列中读取新的URL，并依据新的URL爬取网页，同时从新网页中获取新URL，并重复上述的爬取过程。满足爬虫系统设置的停止条件时，停止爬取。在编写爬虫的时候，一般会设置相应的停止条件。如果没有设置停止条件，爬虫则会一直爬取下去，一直到无法获取新的URL地址为止，若设置了停止条件，爬虫则会在停止条件满足时停止爬取。

视频剪辑工具是对视频源进行非线性编辑的软件，属多媒体制作软件范畴。软件通过对加入的图片、背景音乐、特效、场景等素材与视频进行重混合，对视频源进行切割、合并，通过二次编码，生成具有不同表现力的新视频。视频剪辑软件实现对视频的剪辑，主要有两种方式，一种是通过转换实现，多媒体领域亦称之为剪辑转换，一种是直接剪辑，不进行转换。除剪辑外还可以对视频进行编辑，编辑器其实是对图片、视频、源音频等素材进行重组编码工作的多媒体软件。重组编码是将图片、视频、音频等素材进行线性编辑后，根据视频编码规范进行重新编码，转换成新的格式。

本申请实施例主要应用视频弹幕数据，以时间流为标准对弹幕进行分类，在此基础之上，运用文本的自然语言处理技术，提取弹幕特征，辅助剪辑师进行视频内容的选取，提高剪辑效率。

以下，结合附图详细介绍本发明的实施例：

图1为本发明的基于弹幕NLP的视频剪辑方法流程图，请参见图1，本发明基于弹幕NLP的视频剪辑方法包括如下步骤：

S1：获取一个已发布的、需二次剪辑创作的视频的全部弹幕数据，并将所述弹幕数据按照时间段进行划分；可选的，还包括一弹幕过滤步骤，提前制定一个预设的标准，根据该预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的某个时间段的弹幕数据进行舍弃；可选的，所述预设标准可以是一数量阈值，对不满足该数量阈值、即数量较少的某个时间段内的弹幕数据进行舍弃，以保证数据选取的可用性。视频是一种时间流媒体，内容的呈现与时间相关，因此弹幕内容与时间有紧密联系。设定阈值可以保证时间单位内的弹幕数量，一方面可以过滤出有价值的视频片段，另一方面数据可以支撑后续的特征提取。

可选的，获取弹幕数据可通过前端爬取技术实现，爬取步骤如下：

通过视频url获取弹幕文件url；

爬取弹幕文件url；

提取数据。

S2：使用一自动化工具对获取到的所述弹幕数据进行分析，并生成分析结果；可选的，这里的自动化工具为一种自然语言处理算法，通过该自然语言处理算法对弹幕数据的文本进行特征提取，任意一种可实现特征提取的自然语言处理算法均在本申请实施例的考虑范围内。

S3：对所述弹幕数据的分析结果可视化后输出；可选的，分析结果包括但不限于时间段的信息，以及该时间段内弹幕的特征提取的信息；可选的，这里的可视化包括但不限于以文本的形式进行输出；可选的，可将该可视化后的分析结果直接输出至一视频剪辑工具并显示。

S4：根据所述分析结果对视频进行剪辑。

需要说明的是，在上述流程中或者附图的流程图中示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例提供了一种基于弹幕NLP的视频剪辑系统，适用于上述的一种基于弹幕NLP的视频剪辑方法。如以下所使用的，术语“单元”、“模块” 等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件、或者软件和硬件的组合的实现也是可能并被构想的。

图2为根据本发明的基于弹幕NLP的视频剪辑系统的框架图，请参见图2，包括：

弹幕获取单元1，获取一个已发布的、需二次剪辑创作的视频的全部弹幕数据，并将所述弹幕数据按照时间段进行划分；可选的，还包括一弹幕过滤模块11，提前制定一个预设的标准，根据该预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的某个时间段的弹幕数据进行舍弃；可选的，所述预设标准可以是一数量阈值，对不满足该数量阈值、即数量较少的某个时间段内的弹幕数据进行舍弃，以保证数据选取的可用性。

通过视频url获取弹幕文件url；

爬取弹幕文件url；

提取数据。

弹幕分析单元2，使用一自动化工具对获取到的所述弹幕数据进行分析，并生成分析结果；可选的，这里的自动化工具为一种自然语言处理算法，通过该自然语言处理算法对弹幕数据的文本进行特征提取，任意一种可实现特征提取的自然语言处理算法均在本申请实施例的考虑范围内。

可视化单元3，对所述弹幕数据的分析结果可视化后输出；可选的，分析结果包括但不限于时间段的信息，以及该时间段内弹幕的特征提取的信息；可选的，这里的可视化包括但不限于以文本的形式进行输出；可选的，可将该可视化后的分析结果直接输出至一视频剪辑工具并显示。

视频剪辑单元4，根据所述分析结果对视频进行剪辑。

另外，结合图1描述的一种基于弹幕NLP的视频剪辑方法可以由电子设备来实现。图3为本发明的电子设备的框架图。

电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。

具体地，上述处理器61可以包括中央处理器(CPU)，或者特定集成电路(Application Specific Integrated Circuit，简称为ASIC)，或者可以被配置成实施本申请实施例的一个或多个集成电路。

其中，存储器62可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器62可包括硬盘驱动器(Hard Disk Drive，简称为HDD)、软盘驱动器、固态驱动器(Solid State Drive，简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerial Bus，简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器62可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器62可在数据处理装置的内部或外部。在特定实施例中，存储器62是非易失性(Non-Volatile)存储器。在特定实施例中，存储器62包括只读存储器(Read-Only Memory，简称为ROM) 和随机存取存储器(Random Access Memory，简称为RAM)。在合适的情况下，该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory，简称为PROM)、可擦除PROM(ErasableProgrammable Read-Only Memory，简称为EPROM)、电可擦除PROM(ElectricallyErasable Programmable Read-Only Memory，简称为EEPROM)、电可改写ROM(ElectricallyAlterable Read-Only Memory，简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下，该RAM可以是静态随机存取存储器(Static Random-AccessMemory，简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory，简称为DRAM)，其中，DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode DynamicRandom Access Memory，简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDate Out Dynamic Random Access Memory，简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory，简称SDRAM)等。

存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文件，以及处理器61所执行的可能的计算机程序指令。

处理器61通过读取并执行存储器62中存储的计算机程序指令，以实现上述实施例中的任意一种基于弹幕NLP的视频剪辑方法。

在其中一些实施例中，电子设备还可包括通信接口63和总线60。其中，如图3所示，处理器61、存储器62、通信接口63通过总线60连接并完成相互间的通信。

通信端口63可以实现与其他部件例如：外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。

总线60包括硬件、软件或两者，将电子设备的部件彼此耦接在一起。总线60包括但不限于以下至少之一：数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制，总线60可包括图形加速接口(Accelerated Graphics Port，简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture，简称为EISA)总线、前端总线(Front Side Bus，简称为FSB)、超传输(Hyper Transport，简称为HT)互连、工业标准架构 (Industry Standard Architecture，简称为ISA)总线、无线带宽(InfiniBand) 互连、低引脚数(Low Pin Count，简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture，简称为MCA)总线、外围组件互连(Peripheral Component Interconnect，简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment，简称为SATA) 总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus，简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线60可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线，但本申请考虑任何合适的总线或互连。

该电子设备可以执行本申请实施例中的一种基于弹幕NLP的视频剪辑方法。

另外，结合上述实施例中的一种基于弹幕NLP的视频剪辑方法，本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述实施例中的任意一种基于弹幕NLP的视频剪辑方法。

而前述的存储介质包括：U盘、移动硬盘、只读存储器(ReadOnly Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.基于弹幕NLP的视频剪辑方法，其特征在于，包括：

弹幕获取步骤，获取视频弹幕数据，并将所述弹幕数据根据时间段进行划分；

弹幕分析步骤，使用一自动化工具对所述弹幕数据进行分析，并生成分析结果；

可视化步骤，对所述弹幕数据的分析结果可视化后输出；

视频剪辑步骤，根据所述分析结果对视频进行剪辑。

2.如权利要求1所述的基于弹幕NLP的视频剪辑方法，其特征在于，所述弹幕获取步骤还包括：

弹幕过滤步骤，根据一预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的时间段内的所述弹幕数据舍弃；所述预设标准包括一数量阈值。

3.如权利要求1所述的基于弹幕NLP的视频剪辑方法，其特征在于，所述弹幕分析步骤包括：通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。

4.如权利要求3所述的基于弹幕NLP的视频剪辑方法，其特征在于，所述可视化步骤包括：以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示；所述可视化形式包括文本形式。

5.基于弹幕NLP的视频剪辑系统，其特征在于，包括：

弹幕获取单元，获取视频弹幕数据，并将所述弹幕数据根据时间段进行划分；

弹幕分析单元，使用一自动化工具对所述弹幕数据进行分析，并生成分析结果；

可视化单元，对所述弹幕数据的分析结果可视化后输出；

视频剪辑单元，根据所述分析结果对视频进行剪辑。

6.如权利要求5所述的基于弹幕NLP的视频剪辑系统，其特征在于，所述弹幕获取单元还包括：

弹幕过滤模块，根据一预设标准对所述弹幕数据进行过滤，将不符合所述预设标准的时间段内的所述弹幕数据舍弃；所述预设标准包括一数量阈值。

7.如权利要求5所述的基于弹幕NLP的视频剪辑系统，其特征在于，所述弹幕分析单元包括：通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。

8.如权利要求7所述的基于弹幕NLP的视频剪辑系统，其特征在于，所述可视化单元包括：以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示；所述可视化形式包括文本形式。

9.一种电子设备，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的基于弹幕NLP的视频剪辑方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至4中任一项所述的基于弹幕NLP的视频剪辑方法。