CN112511766A - 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质 - Google Patents

基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质 Download PDF

Info

Publication number
CN112511766A
CN112511766A CN202011321123.7A CN202011321123A CN112511766A CN 112511766 A CN112511766 A CN 112511766A CN 202011321123 A CN202011321123 A CN 202011321123A CN 112511766 A CN112511766 A CN 112511766A
Authority
CN
China
Prior art keywords
bullet screen
screen data
video
bullet
nlp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011321123.7A
Other languages
English (en)
Inventor
张珊珊
梁志婷
张明洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Minglue Artificial Intelligence Group Co Ltd
Original Assignee
Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Minglue Artificial Intelligence Group Co Ltd filed Critical Shanghai Minglue Artificial Intelligence Group Co Ltd
Priority to CN202011321123.7A priority Critical patent/CN112511766A/zh
Publication of CN112511766A publication Critical patent/CN112511766A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • H04N21/4314Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations for fitting data in a restricted space on the screen, e.g. EPG data in a rectangular grid
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

本发明提出一种基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质,其方法技术方案包括弹幕获取步骤,获取视频弹幕数据,并将所述弹幕数据根据时间段进行划分;弹幕分析步骤,使用一自动化工具对所述弹幕数据进行分析,并生成分析结果;可视化步骤,对所述弹幕数据的分析结果可视化后输出;视频剪辑步骤,根据所述分析结果对视频进行剪辑。本发明通过弹幕分类,运用文本的自然语言处理技术,提取弹幕特征,辅助剪辑师进行视频内容的选取,提高了剪辑效率。

Description

基于弹幕NLP的视频剪辑方法、系统、电子设备及存储介质
技术领域
本发明属于自然语言处理领域,尤其涉及一种基于弹幕NLP的视频剪辑 方法、系统、电子设备及存储介质。
背景技术
在影音娱乐资源体量飞速增长的今天,这些影音娱乐资源的增加,一方面 会增加创作的素材,但同时也对影音娱乐资源的处理速度和准确性提出了更高 的挑战。以其中的视频为例,在直播、实时游戏录制等领域创作了大量的视频 资源,这些视频资源是二次创作的优质素材,需要进行剪辑处理。视频剪辑师 在工作过程中,常常需要对视频素材进行二次创作。剪辑师在进行二次创作时, 需要根据创作目的、风格、画面内容、情感等等因素选定需要剪辑的视频画面, 这就要求剪辑师需要反复观看视频以确定内容,造成剪辑耗时较长,效率低下。
视频弹幕是指在网络上观看视频时弹出的评论性字幕,用户在观看视频时, 在当前时间点发送弹幕,此条弹幕只会显示在视频流中此刻的位置。虽然不同 弹幕的发送时间不同,但是其只会在视频中特定的一个时间点出现,因此在相 同时刻发送的弹幕基本上也具有相同的主题,能够表现视频在当前时间点的内 容上的特征。
发明内容
本申请实施例提供了一种基于弹幕NLP的视频剪辑方法、系统、电子设备 及存储介质,以至少解决现有视频剪辑方法剪辑耗时较长,效率低下的问题。
第一方面,本申请实施例提供了一种基于弹幕NLP的视频剪辑方法,包 括:弹幕获取步骤,获取视频弹幕数据,并将所述弹幕数据根据时间段进行划 分;弹幕分析步骤,使用一自动化工具对所述弹幕数据进行分析,并生成分析 结果;可视化步骤,对所述弹幕数据的分析结果可视化后输出;视频剪辑步骤, 根据所述分析结果对视频进行剪辑。
优选的,所述弹幕获取步骤还包括:根据一预设标准对所述弹幕数据进行 过滤,将不符合所述预设标准的时间段内的所述弹幕数据舍弃;所述预设标准 包括一数量阈值。
优选的,所述弹幕分析步骤包括:通过一自然语言处理算法对所述弹幕数 据进行弹幕特征提取。
优选的,所述可视化步骤包括:以可视化形式将所述时间段的信息、所述 弹幕特征的信息输出至一视频剪辑工具并显示;所述可视化形式包括文本形式。
第二方面,本申请实施例提供了一种基于弹幕NLP的视频剪辑系统,适 用于上述一种基于弹幕NLP的视频剪辑方法,包括:弹幕获取单元,获取视频 弹幕数据,并将所述弹幕数据根据时间段进行划分;弹幕分析单元,使用一自 动化工具对所述弹幕数据进行分析,并生成分析结果;可视化单元,对所述弹 幕数据的分析结果可视化后输出;视频剪辑单元,根据所述分析结果对视频进 行剪辑。
在其中一些实施例中,所述弹幕获取单元还包括:弹幕过滤模块,根据一 预设标准对所述弹幕数据进行过滤,将不符合所述预设标准的时间段内的所述 弹幕数据舍弃;所述预设标准包括一数量阈值。
在其中一些实施例中,所述弹幕分析单元包括:通过一自然语言处理算法 对所述弹幕数据进行弹幕特征提取。
在其中一些实施例中,所述可视化单元包括:以可视化形式将所述时间段 的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示;所述可视化形式 包括文本形式。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及 存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行 所述计算机程序时实现如上述第一方面所述的一种基于弹幕NLP的视频剪辑 方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计 算机程序,该程序被处理器执行时实现如上述第一方面所述的一种基于弹幕 NLP的视频剪辑方法。
相比于相关技术,本申请实施例提供的一种基于弹幕NLP的视频剪辑方法 通过弹幕分类,运用文本的自然语言处理技术,提取弹幕特征,辅助剪辑师进 行视频内容的选取,提高剪辑效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部 分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不 当限定。在附图中:
图1为本发明的基于弹幕NLP的视频剪辑方法流程图;
图2为本发明的基于弹幕NLP的视频剪辑系统的框架图;
图3为本发明的电子设备的框架图;
以上图中:
1、弹幕获取单元;2、弹幕分析单元;3、可视化单元;4、视频剪辑单元; 11、弹幕过滤模块;60、总线;61、处理器;62、存储器;63、通信接口。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用 以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通 技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本 申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于 本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些 附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过 程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关 的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些 设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的 内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或 特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短 语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的 实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施 例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属 技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一 个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申 请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖 不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、 产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤 或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单 元。
视频剪辑师在工作过程中,常常需要对视频素材进行二次创作。剪辑师在 进行二次创作时,需要根据创作目的、风格、画面内容、情感等等因素选定需 要剪辑的视频画面。这就要求剪辑师需要反复观看视频以确定内容,造成剪辑 耗时较长,效率低下。
自然语言处理(NLP)是计算机科学领域与人工智能领域中的一个重要方向。 它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自 然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领 域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有 着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言, 而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。 因而它是计算机科学的一部分。自然语言处理(NLP)是计算机科学,人工智能, 语言学关注计算机和人类(自然)语言之间的相互作用的领域。
视频弹幕是指在网络上观看视频时弹出的评论性字幕,用户在观看视频时, 在当前时间点发送弹幕,此条弹幕只会显示在视频流中此刻的位置。虽然不同 弹幕的发送时间不同,但是其只会在视频中特定的一个时间点出现,因此在相 同时刻发送的弹幕基本上也具有相同的主题,能够表现视频在当前时间点的内 容上的特征。弹幕可以给观众一种“实时互动”的错觉,虽然不同弹幕的发送 时间有所区别,但是其只会在视频中特定的一个时间点出现,因此在相同时刻 发送的弹幕基本上也具有相同的主题,在参与评论时就会有与其他观众同时评 论的错觉。而传统的播放器评论系统是独立于播放器之外的,因此评论的内容 大多围绕在整个视频上,话题性不强,也没有“实时互动”的感觉。
在机器学习、模式识别和图像处理中,特征提取从初始的一组测量数据开 始,并建立旨在提供信息和非冗余的派生值(特征),从而促进后续的学习和泛 化步骤,并且在某些情况下带来更好的可解释性。特征提取与降维有关。特征 的好坏对泛化能力有至关重要的影响。至今为止特征没有万能和精确的定义。 特征的精确定义往往由问题或者应用类型决定。特征是一个数字图像中“有趣” 的部分,它是许多计算机图像分析算法的起点。因此一个算法是否成功往往由 它使用和定义的特征决定。因此特征提取最重要的一个特性是“可重复性”:同 一场景的不同图像所提取的特征应该是相同的。文本特征提取有两个非常重要 的模型:词集模型:单词构成的集合,集合中每个元素都只有一个,也即词集 中的每个单词都只有一个;词袋模型:如果一个单词在文档中出现不止一次, 并统计其出现的次数(频数)。文本处理领域还有一种特征提取方法,叫做TF-IDF 模型(term frequency–inverse document frequency,词频与逆向文件频率)。 TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其 中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加, 但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常 被搜索应用,作为文件与用户查询之间相关程度的度量或评级。TF-IDF的主要 思想是:如果某个词或短语在一篇文章中出现的频率TF(Term Frequency,词频), 词频高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区 分能力,适合用来分类。TF-IDF实际上是:TF*IDF。TF表示词条在文档d中 出现的频率。IDF(inverse document frequency,逆向文件频率)的主要思想 是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有 很好的类别区分能力。如果某一类文档C中包含词条t的文档数为m,而其它类 包含t的文档总数为k,显然所有包含t的文档数n=m+k,当m大的时候,n也 大,按照IDF公式得到的IDF的值会小,就说明该词条t类别区分能力不强。但是实际上,如果一个词条在一个类的文档中频繁出现,则说明该词条能够很 好代表这个类的文本的特征,这样的词条应该给它们赋予较高的权重,并选来 作为该类文本的特征词以区别与其它类文档。TF-IDF模型通常和词袋模型配合 使用,对词袋模型(binary参数需要设置为True)生成的数组进一步处理。
网页爬取器,是指网页搜索集子系统中根据url完成一篇见面爬取的进程 或者线程,通常一个搜索子系统上会同时启动多个gatherer并行工作。通常包 括如下步骤:获取初始的URL。初始的URL地址可以由用户人为地指定,也可以 由用户指定的某个或某几个初始爬取网页决定。根据初始的URL爬取页面并获 得新的URL。获得初始的URL地址之后,首先需要爬取对应URL地址中的网页, 爬取了对应的URL地址中的网页后,将网页存储到原始数据库中,并且在爬取 网页的同时,发现新的URL地址,同时将已爬取的URL地址存放到一个URL列 表中,用于去重及判断爬取的进程。将新的URL放到URL队列中。获取了下一 个新的URL地址之后,会将新的URL地址放到URL队列中。从URL队列中读取 新的URL,并依据新的URL爬取网页,同时从新网页中获取新URL,并重复上述 的爬取过程。满足爬虫系统设置的停止条件时,停止爬取。在编写爬虫的时候, 一般会设置相应的停止条件。如果没有设置停止条件,爬虫则会一直爬取下去, 一直到无法获取新的URL地址为止,若设置了停止条件,爬虫则会在停止条件 满足时停止爬取。
视频剪辑工具是对视频源进行非线性编辑的软件,属多媒体制作软件范畴。 软件通过对加入的图片、背景音乐、特效、场景等素材与视频进行重混合,对 视频源进行切割、合并,通过二次编码,生成具有不同表现力的新视频。视频 剪辑软件实现对视频的剪辑,主要有两种方式,一种是通过转换实现,多媒体 领域亦称之为剪辑转换,一种是直接剪辑,不进行转换。除剪辑外还可以对视 频进行编辑,编辑器其实是对图片、视频、源音频等素材进行重组编码工作的 多媒体软件。重组编码是将图片、视频、音频等素材进行线性编辑后,根据视 频编码规范进行重新编码,转换成新的格式。
本申请实施例主要应用视频弹幕数据,以时间流为标准对弹幕进行分类, 在此基础之上,运用文本的自然语言处理技术,提取弹幕特征,辅助剪辑师进 行视频内容的选取,提高剪辑效率。
以下,结合附图详细介绍本发明的实施例:
图1为本发明的基于弹幕NLP的视频剪辑方法流程图,请参见图1,本发 明基于弹幕NLP的视频剪辑方法包括如下步骤:
S1:获取一个已发布的、需二次剪辑创作的视频的全部弹幕数据,并将所 述弹幕数据按照时间段进行划分;可选的,还包括一弹幕过滤步骤,提前制定 一个预设的标准,根据该预设标准对所述弹幕数据进行过滤,将不符合所述预 设标准的某个时间段的弹幕数据进行舍弃;可选的,所述预设标准可以是一数 量阈值,对不满足该数量阈值、即数量较少的某个时间段内的弹幕数据进行舍 弃,以保证数据选取的可用性。视频是一种时间流媒体,内容的呈现与时间相 关,因此弹幕内容与时间有紧密联系。设定阈值可以保证时间单位内的弹幕数 量,一方面可以过滤出有价值的视频片段,另一方面数据可以支撑后续的特征 提取。
可选的,获取弹幕数据可通过前端爬取技术实现,爬取步骤如下:
通过视频url获取弹幕文件url;
爬取弹幕文件url;
提取数据。
S2:使用一自动化工具对获取到的所述弹幕数据进行分析,并生成分析结 果;可选的,这里的自动化工具为一种自然语言处理算法,通过该自然语言处 理算法对弹幕数据的文本进行特征提取,任意一种可实现特征提取的自然语言 处理算法均在本申请实施例的考虑范围内。
S3:对所述弹幕数据的分析结果可视化后输出;可选的,分析结果包括但 不限于时间段的信息,以及该时间段内弹幕的特征提取的信息;可选的,这里 的可视化包括但不限于以文本的形式进行输出;可选的,可将该可视化后的分 析结果直接输出至一视频剪辑工具并显示。
S4:根据所述分析结果对视频进行剪辑。
需要说明的是,在上述流程中或者附图的流程图中示出的步骤可以在诸如 一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻 辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步 骤。
本申请实施例提供了一种基于弹幕NLP的视频剪辑系统,适用于上述的 一种基于弹幕NLP的视频剪辑方法。如以下所使用的,术语“单元”、“模块” 等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较 佳地以软件来实现,但是硬件、或者软件和硬件的组合的实现也是可能并被构 想的。
图2为根据本发明的基于弹幕NLP的视频剪辑系统的框架图,请参见图2, 包括:
弹幕获取单元1,获取一个已发布的、需二次剪辑创作的视频的全部弹幕 数据,并将所述弹幕数据按照时间段进行划分;可选的,还包括一弹幕过滤模 块11,提前制定一个预设的标准,根据该预设标准对所述弹幕数据进行过滤, 将不符合所述预设标准的某个时间段的弹幕数据进行舍弃;可选的,所述预设 标准可以是一数量阈值,对不满足该数量阈值、即数量较少的某个时间段内的 弹幕数据进行舍弃,以保证数据选取的可用性。
可选的,获取弹幕数据可通过前端爬取技术实现,爬取步骤如下:
通过视频url获取弹幕文件url;
爬取弹幕文件url;
提取数据。
弹幕分析单元2,使用一自动化工具对获取到的所述弹幕数据进行分析, 并生成分析结果;可选的,这里的自动化工具为一种自然语言处理算法,通过 该自然语言处理算法对弹幕数据的文本进行特征提取,任意一种可实现特征提 取的自然语言处理算法均在本申请实施例的考虑范围内。
可视化单元3,对所述弹幕数据的分析结果可视化后输出;可选的,分析 结果包括但不限于时间段的信息,以及该时间段内弹幕的特征提取的信息;可 选的,这里的可视化包括但不限于以文本的形式进行输出;可选的,可将该可 视化后的分析结果直接输出至一视频剪辑工具并显示。
视频剪辑单元4,根据所述分析结果对视频进行剪辑。
另外,结合图1描述的一种基于弹幕NLP的视频剪辑方法可以由电子设 备来实现。图3为本发明的电子设备的框架图。
电子设备可以包括处理器61以及存储有计算机程序指令的存储器62。
具体地,上述处理器61可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配 置成实施本申请实施例的一个或多个集成电路。
其中,存储器62可以包括用于数据或指令的大容量存储器。举例来说而 非限制,存储器62可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘 驱动器、固态驱动器(Solid State Drive,简称为SSD)、闪存、光盘、磁光 盘、磁带或通用串行总线(UniversalSerial Bus,简称为USB)驱动器或者 两个或更多个以上这些的组合。在合适的情况下,存储器62可包括可移除或不 可移除(或固定)的介质。在合适的情况下,存储器62可在数据处理装置的内 部或外部。在特定实施例中,存储器62是非易失性(Non-Volatile)存储器。 在特定实施例中,存储器62包括只读存储器(Read-Only Memory,简称为ROM) 和随机存取存储器(Random Access Memory,简称为RAM)。在合适的情况下, 该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory, 简称为PROM)、可擦除PROM(ErasableProgrammable Read-Only Memory,简 称为EPROM)、电可擦除PROM(ElectricallyErasable Programmable Read-Only Memory,简称为EEPROM)、电可改写ROM(ElectricallyAlterable Read-Only Memory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。 在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-AccessMemory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory, 简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode DynamicRandom Access Memory,简称为FPMDRAM)、扩展数据输出动态 随机存取存储器(ExtendedDate Out Dynamic Random Access Memory,简称 为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。
存储器62可以用来存储或者缓存需要处理和/或通信使用的各种数据文 件,以及处理器61所执行的可能的计算机程序指令。
处理器61通过读取并执行存储器62中存储的计算机程序指令,以实现上 述实施例中的任意一种基于弹幕NLP的视频剪辑方法。
在其中一些实施例中,电子设备还可包括通信接口63和总线60。其中, 如图3所示,处理器61、存储器62、通信接口63通过总线60连接并完成相互 间的通信。
通信端口63可以实现与其他部件例如:外接设备、图像/数据采集设备、 数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线60包括硬件、软件或两者,将电子设备的部件彼此耦接在一起。总 线60包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(Control Bus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线60可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(Front Side Bus, 简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构 (Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand) 互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架 构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、 串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA) 总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的 组合。在合适的情况下,总线60可包括一个或多个总线。尽管本申请实施例描 述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该电子设备可以执行本申请实施例中的一种基于弹幕NLP的视频剪辑方 法。
另外,结合上述实施例中的一种基于弹幕NLP的视频剪辑方法,本申请 实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储 有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任 意一种基于弹幕NLP的视频剪辑方法。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(ReadOnly Memory, 简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、磁碟或 者光盘等各种可以存储程序代码的介质。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对 上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技 术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详 细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领 域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形 和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所 附权利要求为准。

Claims (10)

1.基于弹幕NLP的视频剪辑方法,其特征在于,包括:
弹幕获取步骤,获取视频弹幕数据,并将所述弹幕数据根据时间段进行划分;
弹幕分析步骤,使用一自动化工具对所述弹幕数据进行分析,并生成分析结果;
可视化步骤,对所述弹幕数据的分析结果可视化后输出;
视频剪辑步骤,根据所述分析结果对视频进行剪辑。
2.如权利要求1所述的基于弹幕NLP的视频剪辑方法,其特征在于,所述弹幕获取步骤还包括:
弹幕过滤步骤,根据一预设标准对所述弹幕数据进行过滤,将不符合所述预设标准的时间段内的所述弹幕数据舍弃;所述预设标准包括一数量阈值。
3.如权利要求1所述的基于弹幕NLP的视频剪辑方法,其特征在于,所述弹幕分析步骤包括:通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。
4.如权利要求3所述的基于弹幕NLP的视频剪辑方法,其特征在于,所述可视化步骤包括:以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示;所述可视化形式包括文本形式。
5.基于弹幕NLP的视频剪辑系统,其特征在于,包括:
弹幕获取单元,获取视频弹幕数据,并将所述弹幕数据根据时间段进行划分;
弹幕分析单元,使用一自动化工具对所述弹幕数据进行分析,并生成分析结果;
可视化单元,对所述弹幕数据的分析结果可视化后输出;
视频剪辑单元,根据所述分析结果对视频进行剪辑。
6.如权利要求5所述的基于弹幕NLP的视频剪辑系统,其特征在于,所述弹幕获取单元还包括:
弹幕过滤模块,根据一预设标准对所述弹幕数据进行过滤,将不符合所述预设标准的时间段内的所述弹幕数据舍弃;所述预设标准包括一数量阈值。
7.如权利要求5所述的基于弹幕NLP的视频剪辑系统,其特征在于,所述弹幕分析单元包括:通过一自然语言处理算法对所述弹幕数据进行弹幕特征提取。
8.如权利要求7所述的基于弹幕NLP的视频剪辑系统,其特征在于,所述可视化单元包括:以可视化形式将所述时间段的信息、所述弹幕特征的信息输出至一视频剪辑工具并显示;所述可视化形式包括文本形式。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4中任一项所述的基于弹幕NLP的视频剪辑方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至4中任一项所述的基于弹幕NLP的视频剪辑方法。
CN202011321123.7A 2020-11-23 2020-11-23 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质 Withdrawn CN112511766A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011321123.7A CN112511766A (zh) 2020-11-23 2020-11-23 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011321123.7A CN112511766A (zh) 2020-11-23 2020-11-23 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN112511766A true CN112511766A (zh) 2021-03-16

Family

ID=74959458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011321123.7A Withdrawn CN112511766A (zh) 2020-11-23 2020-11-23 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112511766A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709561A (zh) * 2021-04-14 2021-11-26 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060014546A1 (en) * 2004-07-13 2006-01-19 International Business Machines Corporation Dynamic media content for collaborators including disparate location representations
CN106210902A (zh) * 2016-07-06 2016-12-07 华东师范大学 一种基于弹幕评论数据的影视片段剪辑方法
CN109309880A (zh) * 2018-10-08 2019-02-05 腾讯科技(深圳)有限公司 视频播放方法、装置、计算机设备及存储介质
CN110020437A (zh) * 2019-04-11 2019-07-16 江南大学 一种视频和弹幕相结合的情感分析及可视化方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060014546A1 (en) * 2004-07-13 2006-01-19 International Business Machines Corporation Dynamic media content for collaborators including disparate location representations
CN106210902A (zh) * 2016-07-06 2016-12-07 华东师范大学 一种基于弹幕评论数据的影视片段剪辑方法
CN109309880A (zh) * 2018-10-08 2019-02-05 腾讯科技(深圳)有限公司 视频播放方法、装置、计算机设备及存储介质
CN110020437A (zh) * 2019-04-11 2019-07-16 江南大学 一种视频和弹幕相结合的情感分析及可视化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709561A (zh) * 2021-04-14 2021-11-26 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质
CN113709561B (zh) * 2021-04-14 2024-04-19 腾讯科技(深圳)有限公司 视频剪辑方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN111866585B (zh) 一种视频处理方法及装置
CN110008378B (zh) 基于人工智能的语料收集方法、装置、设备及存储介质
CN113709561A (zh) 视频剪辑方法、装置、设备及存储介质
CN112929746B (zh) 视频生成方法和装置、存储介质和电子设备
CN108241856B (zh) 资讯信息生成方法及设备
CN110377817B (zh) 搜索词条挖掘方法和装置及其在多媒体资源的应用
JP2016035607A (ja) ダイジェストを生成するための装置、方法、及びプログラム
CN109508448A (zh) 基于长篇文章生成短资讯方法、介质、装置和计算设备
JP2004274768A (ja) 注釈付きビデオファイルを生成する方法
CN112287168A (zh) 用于生成视频的方法和装置
CN113841417A (zh) 影片生成方法、终端设备、拍摄设备及影片生成系统
CN112511766A (zh) 基于弹幕nlp的视频剪辑方法、系统、电子设备及存储介质
WO2022078363A1 (zh) 视频预览内容生成方法和装置、计算机装置和存储介质
JP2014153977A (ja) コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム
WO2014114143A1 (en) Method, apparatus and computer storage medium for acquiring hot content
KR101804679B1 (ko) 스토리에 기초하는 멀티미디어 콘텐츠 개발 장치 및 방법
US7610554B2 (en) Template-based multimedia capturing
CN109933691B (zh) 用于内容检索的方法、装置、设备和存储介质
CN112270177A (zh) 基于内容相似性的新闻封面配图方法、装置及计算设备
CN103514196B (zh) 一种信息处理方法及电子设备
JP2010049384A (ja) 動画評価方法、装置及びプログラム
CN104978404B (zh) 一种视频专辑名称的生成方法及装置
CN103514300A (zh) 一种视频宣传片剧本生成系统
JP2007079736A (ja) データ編集装置、データ編集方法およびデータ編集プログラム
JP2004341948A (ja) 概念抽出システム、概念抽出方法、プログラム及び記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210316

WW01 Invention patent application withdrawn after publication