CN116055825A

CN116055825A - 一种生成视频标题的方法及装置

Info

Publication number: CN116055825A
Application number: CN202310033339.0A
Authority: CN
Inventors: 王文倩; 王心莹; 杨杰; 余意; 孙钱丽
Original assignee: Hunan MgtvCom Interactive Entertainment Media Co Ltd
Current assignee: Hunan MgtvCom Interactive Entertainment Media Co Ltd
Priority date: 2023-01-10
Filing date: 2023-01-10
Publication date: 2023-05-02

Abstract

本申请实施例提供了一种生成视频标题的方法，用于自动生成与视频内容相关的视频标题，提高视频标题质量，该方法包括：获取与待生成标题视频相关联的文本数据，文本数据包括台词数据和弹幕数据，弹幕数据为原视频中与待生成标题视频相同片段处的弹幕，对台词数据和弹幕数据进行筛选，得到台词处理数据和弹幕处理数据，提取台词处理数据和弹幕处理数据中的关键词，得到关键词数据集，根据关键词数据集生成台词标题，对弹幕处理数据进行分词，根据弹幕处理数据的分词生成弹幕标题，若台词处理数据与预设模板数据相同，则生成模板标题，对模板标题、台词标题和弹幕标题进行评分，将评分最高的标题作为待生成标题视频的标题。

Description

一种生成视频标题的方法及装置

技术领域

本申请涉及计算机自然语言处理技术领域，特别是一种生成视频标题的方法及装置。

背景技术

随着视频平台的普及，大量的信息通过视频或短视频的方式进行传播，为实现视频标题的自动生成，现有技术直接基于输入视频生成一段描述文本，然而在含有多个场景、人物及事件的复杂视频中，根据现有技术自动生成的视频标题与视频内容的关联系较差。因此，如何自动生成与视频内容关联性较高的视频标题，成为当前所需解决的技术问题。

发明内容

鉴于上述问题，本发明的目的在于提供一种生成视频标题的方法及装置，分别根据台词、弹幕和模板生成视频标题，并将评分最高的标题作为视频标题，从而自动生成与视频内容相关的视频标题，提高视频标题质量，具体方案如下：

第一方面，本申请实施例提供了一种生成视频标题的方法，所述方法包括：

获取与待生成标题视频相关联的文本数据；待生成标题视频为原视频中的片段；所述文本数据包括台词数据和弹幕数据；所述弹幕数据为所述原视频中与所述待生成标题视频相同片段处的弹幕；

对所述台词数据和所述弹幕数据进行筛选，得到台词处理数据和弹幕处理数据；

提取所述台词处理数据和所述弹幕处理数据中的关键词，得到关键词数据集；

根据所述关键词数据集生成台词标题；

对所述弹幕处理数据进行分词，根据所述弹幕处理数据的分词生成弹幕标题；

若所述台词处理数据与预设模板数据相同，则生成模板标题；

对所述模板标题、所述台词标题和所述弹幕标题进行评分，将评分最高的标题作为所述待生成标题视频的标题。

可选的，所述对所述台词数据和所述弹幕数据进行筛选，得到台词处理数据和弹幕处理数据，包括：

去除所述台词数据中的错误识别字符，得到所述台词处理数据；

去除所述弹幕数据中的非中文字符和重复字符，得到第一弹幕预处理数据；

对所述第一弹幕预处理数据中存在敏感字符的弹幕进行去除，得到第二弹幕预处理数据；

将所述第二弹幕预处理数据中字符长度大于预设长度的弹幕数据作为所述弹幕处理数据。

可选的，所述提取所述台词处理数据和所述弹幕处理数据中的关键词，得到关键词数据集，包括：

根据预设算法对所述台词处理数据进行关键词提取，得到所述台词关键词；

根据预设分词组件对所述弹幕处理数据进行分词，得到多个待确定关键词；

对所述多个待确定关键词的词频进行统计；

将词频符合预设条件的待确定关键词作为所述弹幕关键词

对所述台词关键词和所述弹幕关键词进行合并去重处理，生成所述关键词数据集。

可选的，所述若所述台词处理数据与预设模板数据相同，则生成模板标题，包括：

所述文本数据还包括情绪识别结果和行为识别结果；

若所述台词处理数据中包含模板关键词，则确定与所述模板关键词对应的模板行为和模板情绪；

若所述情绪识别结果与所述模板情绪相同，或所述行为识别结果与所述模板行为相同，则将与所述模板关键词对应的预设模板标题作为模板标题。

可选的，所述根据所述关键词数据集生成台词标题，包括：

所述文本数据还包括参演人员列表；

确定所述台词处理数据中包含所述关键词数据集中关键词的台词语句；

对所述台词语句进行分词，确定各个分词的词性；

若所述分词词性为动词或连接词，且所述分词位于所述台词语句的句首或句尾，则对所述台词语句进行前后拼接，得到拼接后的台词语句；

将所述拼接后的台词语句中的代词替换为所述参演人员列表中与所述代词对应的人名，得到所述台词标题。

可选的，所述对所述弹幕处理数据进行分词，根据所述弹幕处理数据的分词生成弹幕标题，包括：

所述文本数据还包括参演人员列表；

对所述弹幕处理数据进行分词，确定所述弹幕处理数据中各个弹幕中的分词词性；

若所述分词词性为名词，且所述名词为人名数据，则确定所述人名数据是否包含于所述参演人员列表中；

若包含，则将与所述人名数据对应的弹幕作为弹幕标题。

将所述弹幕处理数据的分词与所述关键词数据进行比对；

若所述关键词数据集中包含所述分词，则将与所述分词对应的弹幕处理数据作为所述弹幕标题。

可选的，所述对所述模板标题、所述台词标题和所述弹幕标题进行评分，将评分最高的标题作为所述待生成标题视频的标题，包括：

检测所述模板标题、所述台词标题和所述弹幕标题的完整性，若存在不满足所述完整性的标题，则对所述标题进行去除，得到完整标题集；

对所述完整标题集中各个标题中出现的关键词数和人名数量进行统计，确定标题得分；

根据所述标题得分进行排序，并按照排序顺序输出所述待生成标题视频的标题。

第二方面，本申请实施例提供了一种生成视频标题的装置，所述装置包括：

数据获取单元，用于获取与待生成标题视频相关联的文本数据；待生成标题视频为原视频中的片段；所述文本数据包括台词数据和弹幕数据；所述弹幕数据为所述原视频中与所述待生成标题视频相同片段处的弹幕；

筛选单元，用于对所述台词数据和所述弹幕数据进行筛选，得到台词处理数据和弹幕处理数据；

关键词获取单元，用于提取所述台词处理数据和所述弹幕处理数据中的关键词，得到关键词数据集；

标题生成单元，用于根据所述关键词数据集生成台词标题；

第三方面，本申请实施例提供了一种计算机可读存储介质，其特征在于，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现上述任意一种生成视频标题的方法。

相对于现有技术，本申请具有以下有益效果：

通过对与视频相关联的台词数据和弹幕数据进行筛选，并对筛选后的数据提取关键词，分别生成与台词对应的台词标题、与弹幕对应的弹幕标题以及模板标题，确定出评分最高的标题作为待生成标题视频的标题，从而实现基于弹幕和台词生成标题，使得生成的标题语句通顺，且与视频内容相关，提高视频标题质量。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种生成视频标题的方法的流程示意图；

图2为本申请实施例提供的一种生成视频标题的装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示，本申请实施例提供了一种生成视频标题的方法该方法包括：

S101：获取与待生成标题视频相关联的文本数据；待生成标题视频为原视频中的片段；文本数据包括台词数据和弹幕数据；弹幕数据为原视频中与待生成标题视频相同片段处的弹幕；

确定与待生成标题视频对应的原视频，待生成标题视频为由原视频中的多个片段构成的视频。其中，与待生成标题视频相关联的文本数据可以包括待生成标题视频中出现的台词、参演人员列表(如参演人员名字、在视频中饰演的角色名字、在待生成标题视频中出现的时长和参演人员性别等)、行为识别结果、情绪识别结果、与待生成标题视频片段对应的原视频中同一片段所出现的弹幕数据、待生成标题视频所属合集名称。

需要说明的是，行为识别结果和情绪识别结果分别为待生成标题视频中参演人员的行为和情绪。

S102：对台词数据和弹幕数据进行筛选，得到台词处理数据和弹幕处理数据。

在一种可选的实施例中，对台词数据和弹幕数据进行筛选，得到台词处理数据和弹幕处理数据，包括：

去除台词数据中的错误识别字符，得到台词处理数据；

去除弹幕数据中的非中文字符和重复字符，得到第一弹幕预处理数据；

对第一弹幕预处理数据中存在敏感字符的弹幕进行去除，得到第二弹幕预处理数据；

将第二弹幕预处理数据中字符长度大于预设长度的弹幕数据作为弹幕处理数据。

通过OCR识别方式获取待生成标题视频中出现的台词数据，并对台词数据进行筛选，以去除台词数据中识别错误的符号，得到台词处理数据。在获取弹幕数据后，通过正则表达式将弹幕中的非中文字符和重复字符进行去除，得到第一弹幕预处理数据，并将第一弹幕预处理数据中包含敏感字符的弹幕进行剔除，得到第二弹幕预处理数据，将第二弹幕预处理数据中字符长度大于预设字符长度的弹幕数据作为弹幕处理数据，以充分利用现有的弹幕数据，得到与视频内容相关的弹幕数据。其中，预设字符长度可根据实际情况进行选择，在一种可选的实施例中，预设字符长度为4。

为便于理解下面进行举例说明，若弹幕数据为“hhhhh”、“来了来了”、“yyds”、“永远在一起”，则对非中文字符和重复字符进行去除后的弹幕数据为“来了”和“永远在一起”，此时长度大于4个字符且不包含敏感词的弹幕数据为“永远在一起”，将“永远在一起”作为弹幕处理数据。

需要说明的是，本申请实施例在检测到弹幕中包含非中文字符和重复字符时，还可直接将重复字符和非中文字符所位于的弹幕直接从弹幕数据中去除，具体可结合实际需求进行选择。

S103：提取台词处理数据和弹幕处理数据中的关键词，得到关键词数据集。

在一种可选的实施例中，提取台词处理数据和弹幕处理数据中的关键词，得到关键词数据集，包括：

根据预设算法对台词处理数据进行关键词提取，得到台词关键词；

根据预设分词组件对弹幕处理数据进行分词，得到多个待确定关键词；

对多个待确定关键词的词频进行统计；

将词频符合预设条件的待确定关键词作为弹幕关键词；

对台词关键词和弹幕关键词进行合并去重处理，生成关键词数据集。

通过RAKE和TextRank算法提取台词中的关键词，得到台词关键词，通过jieba对弹幕处理数据进行分词，得到多个待确定关键词，统计各个待确定关键词的词频，将词频由高到低进行排序，选取排行前10的高频词作为弹幕关键词。将弹幕关键词和台词关键词进行合并汇总，并进行去重得到关键词数据集。如，当弹幕关键词和台词关键词中都包含关键词A时，在合并汇总后，关键词数据集中存在一个关键词A，另一关键词A被去重。

S104：根据关键词数据集生成台词标题。

在一种可选的实施例中，根据关键词数据集生成台词标题，包括：

文本数据还包括参演人员列表；

确定台词处理数据中包含关键词数据集中关键词的台词语句；

对台词语句进行分词，确定各个分词的词性；

若分词词性为动词或连接词，且分词位于台词语句的句首或句尾，则对台词语句进行前后拼接，得到拼接后的台词语句；

将拼接后的台词语句中的代词替换为参演人员列表中与代词对应的人名，得到台词标题。

筛选出台词处理数据中包含关键词数据集中关键词的台词语句，通过LTP对包含关键词数据集中关键词的台词语句进行分词，并确定各个分词的词性，将动词或连接词位于台词语句的句首或句尾的句子进行前后拼接，并将台词语句中的代词替换为参演人员列表中的名称或角色名称，得到台词标题。如，当关键词为水壶，包含关键词的台词语句为“拿走厨房的水壶”和“然后用水壶去接山上的泉水”，则台词标题为“拿走厨房的水壶然后用水壶去接山上的泉水”。

S105：对弹幕处理数据进行分词，根据弹幕处理数据的分词生成弹幕标题。

在一种可选的实施例中，对弹幕处理数据进行分词，根据弹幕处理数据的分词生成弹幕标题，包括：

文本数据还包括参演人员列表；

对弹幕处理数据进行分词，确定弹幕处理数据中各个弹幕中的分词词性；

若分词词性为名词，且名词为人名数据，则确定人名数据是否包含于参演人员列表中；

若包含，则将与人名数据对应的弹幕作为弹幕标题。

对弹幕处理数据进行分词，当分词中出现词性为nr(代表人名)，且该人名出现在参演人员列表或台词处理数据中，则将该分词所对应的弹幕处理数据作为弹幕标题。如，弹幕处理数据的分词包括：小明、准时、赶到、车站，若“小明”出现在参演人员列表或台词处理数据中，则弹幕标题为“小明准时赶到车站”，从而筛选出与参演人员相关的弹幕，保证生成的弹幕标题与视频内容相关。

在另一种可选的实施例中，对弹幕处理数据进行分词，根据弹幕处理数据的分词生成弹幕标题，包括：

将弹幕处理数据的分词与关键词数据进行比对；

若关键词数据集中包含分词，则将与分词对应的弹幕处理数据作为弹幕标题。

对弹幕处理数据进行分词，当存在与关键词数据集中关键词相同的分词时，将与该分词对应的弹幕处理数据作为弹幕标题，从而确定出与视频内容相关的弹幕处理数据，将与视频剧情相关的弹幕作为弹幕标题。

S106：若台词处理数据与预设模板数据相同，则生成模板标题。

在一种可选的实施例中，若台词处理数据与预设模板数据相同，则生成模板标题，包括：

文本数据还包括情绪识别结果和行为识别结果；

若台词处理数据中包含模板关键词，则确定与模板关键词对应的模板行为和模板情绪；

若情绪识别结果与模板情绪相同，或行为识别结果与模板行为相同，则将与模板关键词对应的预设模板标题作为模板标题。

预先建立模板，模板包括预设模板标题、模板关键词、模板行为和模板情绪，当台词处理数据中包含模板关键词时，判断与该台词处理数据对应的情绪与模板情绪是否相同，或与该台词处理数据对应的行为与模板行为是否相同，若情绪识别结果与模板情绪相同，或行为识别结果与模板行为相同，则将与该模板关键词对应的预设模板标题作为输出的模板标题。

S107：对模板标题、台词标题和弹幕标题进行评分，将评分最高的标题作为待生成标题视频的标题。

在一种可选的实施例中，对模板标题、台词标题和弹幕标题进行评分，将评分最高的标题作为待生成标题视频的标题，包括：

检测模板标题、台词标题和弹幕标题的完整性，若存在不满足完整性的标题，则对标题进行去除，得到完整标题集；

对完整标题集中各个标题中出现的关键词数和人名数量进行统计，确定标题得分；

根据标题得分进行排序，并按照排序顺序输出待生成标题视频的标题。

通过ltp的语义角色分析结果，分别判断模板标题、台词标题和弹幕标题的完整性，若任意标题不满足完整性，则对不满足完整性的标题进行去除，得到完整标题集。

统计完整标题集中各个标题出现的关键词和人名数量，根据各个标题出现的关键词和人名数量，确定各个标题的得分，并按照得分进行排序，将得分最高的标题作为待生成标题视频的标题。

需要说明的是，在按照各个标题的得分对各个标题进行排序后，本申请实施例还可以直接将排序结果和与排序结果对应的标题进行输出，由相关技术人员或另一模型选择出与待生成标题视频内容相关性程度最高的标题作为待生成标题视频的标题。

在一种可选的实施例中，生成视频标题的方法还包括：

若完整标题集中不包含任何一个标题，则生成保底标题，其中，保底标题由合集标题和视频编号组成。从而避免在模板标题、台词标题和弹幕标题都不满足完整性时，无法自动生成视频标题。

如图2，本申请实施例提供了一种生成视频标题的装置，该装置包括：

数据获取单元201，用于获取与待生成标题视频相关联的文本数据；待生成标题视频为原视频中的片段；文本数据包括台词数据和弹幕数据；弹幕数据为原视频中与待生成标题视频相同片段处的弹幕；

筛选单元202，用于对台词数据和弹幕数据进行筛选，得到台词处理数据和弹幕处理数据；

关键词获取单元203，用于提取台词处理数据和弹幕处理数据中的关键词，得到关键词数据集；

标题生成单元204，用于根据关键词数据集生成台词标题；

对弹幕处理数据进行分词，根据弹幕处理数据的分词生成弹幕标题；

若台词处理数据与预设模板数据相同，则生成模板标题；

对模板标题、台词标题和弹幕标题进行评分，将评分最高的标题作为待生成标题视频的标题。

在一种可选的实施例中筛选单元202，具体用于：

在一种可选的实施例中关键词获取单元203，具体用于：

对所述多个待确定关键词的词频进行统计；

将词频符合预设条件的待确定关键词作为所述弹幕关键词；

在一种可选的实施例中标题生成单元204，具体用于：

所述文本数据还包括情绪识别结果和行为识别结果；

在一种可选的实施例中标题生成单元204，具体用于：

所述文本数据还包括参演人员列表；

对所述台词语句进行分词，确定各个分词的词性；

在一种可选的实施例中标题生成单元204，具体用于：

所述文本数据还包括参演人员列表；

若包含，则将与所述人名数据对应的弹幕作为弹幕标题。

在一种可选的实施例中标题生成单元204，具体用于：

将所述弹幕处理数据的分词与所述关键词数据进行比对；

在一种可选的实施例中标题生成单元204，具体用于：

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其中，计算机程序被处理器执行时实现上述任意一种生成视频标题的方法。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

以上对本发明所提供的技术内容进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种生成视频标题的方法，其特征在于，所述方法包括：

根据所述关键词数据集生成台词标题；

2.根据权利要求1所述的方法，其特征在于，所述对所述台词数据和所述弹幕数据进行筛选，得到台词处理数据和弹幕处理数据，包括：

3.根据权利要求1所述的方法，其特征在于，所述提取所述台词处理数据和所述弹幕处理数据中的关键词，得到关键词数据集，包括：

对所述多个待确定关键词的词频进行统计；

将词频符合预设条件的待确定关键词作为所述弹幕关键词；

4.根据权利要求1所述的方法，其特征在于，所述若所述台词处理数据与预设模板数据相同，则生成模板标题，包括：

所述文本数据还包括情绪识别结果和行为识别结果；

5.根据权利要求1所述的方法，其特征在于，所述根据所述关键词数据集生成台词标题，包括：

所述文本数据还包括参演人员列表；

对所述台词语句进行分词，确定各个分词的词性；

6.根据权利要求1所述的方法，其特征在于，所述对所述弹幕处理数据进行分词，根据所述弹幕处理数据的分词生成弹幕标题，包括：

所述文本数据还包括参演人员列表；

若包含，则将与所述人名数据对应的弹幕作为弹幕标题。

7.根据权利要求1所述的方法，其特征在于，所述对所述弹幕处理数据进行分词，根据所述弹幕处理数据的分词生成弹幕标题，包括：

将所述弹幕处理数据的分词与所述关键词数据进行比对；

8.根据权利要求1所述的方法，其特征在于，所述对所述模板标题、所述台词标题和所述弹幕标题进行评分，将评分最高的标题作为所述待生成标题视频的标题，包括：

9.一种生成视频标题的装置，其特征在于，所述装置包括：

标题生成单元，用于根据所述关键词数据集生成台词标题；

10.一种计算机可读存储介质，其特征在于，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1至8中任一所述的生成视频标题的方法。