CN114860992A - 视频的标题生成方法、装置、设备及存储介质 - Google Patents

视频的标题生成方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114860992A
CN114860992A CN202210426714.3A CN202210426714A CN114860992A CN 114860992 A CN114860992 A CN 114860992A CN 202210426714 A CN202210426714 A CN 202210426714A CN 114860992 A CN114860992 A CN 114860992A
Authority
CN
China
Prior art keywords
title
video
scenario
brief introduction
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210426714.3A
Other languages
English (en)
Inventor
于洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202210426714.3A priority Critical patent/CN114860992A/zh
Publication of CN114860992A publication Critical patent/CN114860992A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种视频的标题生成方法、装置、设备及存储介质,其中,所述方法包括:提取所述视频的台词集合;获取与所述台词集合对应的剧情简介文本;根据所述剧情简介文本,生成所述视频的初始标题。本申请用以解决现有技术中,人工起标题的工作量大,浪费人力的技术问题。

Description

视频的标题生成方法、装置、设备及存储介质
技术领域
本申请涉及多媒体智能处理技术领域,尤其涉及一种视频的标题生成方法、装置、设备及存储介质。
背景技术
短视频是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容,几秒到几分钟不等。内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。目前,短视频深受用户喜爱。
目前,为短视频起标题的工作基本由人工完成,但是,每天需要生产的短视频数量庞大,人工起标题的工作量很大,浪费人力。
发明内容
本申请提供了一种视频的标题生成方法、装置、设备及存储介质,用以解决现有技术中,人工起标题的工作量大,浪费人力的技术问题。
第一方面,本申请提供了一种视频的标题生成方法,包括:
提取所述视频的台词集合;
获取与所述台词集合对应的剧情简介文本;
根据所述剧情简介文本,生成所述视频的初始标题。
可选的,所述获取与所述台词集合对应的剧情简介文本,包括:
获取与所述视频对应的完整剧情简介;
提取所述台词集合的第一特征,以及提取所述完整剧情简介中的每一句文本的第二特征;
对于每个所述第二特征,将所述第一特征和所述第二特征进行特征融合,得到融合后的特征;其中,所述融合后的特征用于表征所述台词集合和所述完整剧情简介中的各句文本之间的相似度;
基于各个融合后的特征进行分类,得到与所述台词集合对应的剧情简介文本。
可选的,所述根据所述剧情简介文本,生成所述视频的初始标题,包括:
对所述剧情简介文本进行概括,得到所述视频的初始标题。
可选的,所述根据所述剧情简介文本,生成所述视频的初始标题之后,还包括:
对所述初始标题进行文本风格迁移,得到润色标题;
合并所述初始标题和所述润色标题,得到最终的标题。
可选的,所述提取所述视频的台词集合,包括:
提取所述视频的初始台词集合;
从所述初始台词集合中,去除重复台词以及不通顺的台词,得到所述台词集合。
可选的,所述获取与所述视频对应的完整剧情简介,包括:
从所述视频中,提取所述视频的标识信息;其中,所述标识信息用于确定所述视频对应的完整视频;
根据所述标识信息,检索与所述完整视频对应的完整剧情简介。
第二方面,本申请提供了一种视频的标题生成装置,包括:
提取模块,用于提取所述视频的台词集合;
获取模块,用于获取与所述台词集合对应的剧情简介文本;
生成模块,用于根据所述剧情简介文本,生成所述视频的初始标题。
可选的,还包括:润色模块,用于对所述初始标题进行文本风格迁移,得到润色标题;合并所述初始标题和所述润色标题,得到最终的标题。
第三方面,本申请提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现第一方面所述的视频的标题生成方法。
第四方面,本申请提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的视频的标题生成方法。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:本申请实施例提供的该方法,根据视频的台词集合,确定剧情简介文本,根据剧情简介文本,生成视频的初始标题。通过本申请实施例提供的方法,能够实现全自动的给视频起标题,无需大量人工起标题,节省人力,也能够提高起标题的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本申请实施例提供的一种视频的标题生成方法的流程示意图;
图2为本申请实施例提供的一种视频的标题生成方法的总体技术构思框图;
图3为本申请实施例提供的确定台词集合对应的剧情简介文本的原理框图;
图4为本申请实施例提供的一种视频的标题生成装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
为了解决现有技术中,人工起标题效率低的技术问题,本申请实施例提供了一种视频的标题生成方法,如图1所示,本申请实施例提供的一种视频的标题生成方法,具体包括如下步骤:
步骤101,提取视频的台词集合;
其中,视频具体可以是短视频,视频的台词集合可以通过光学字符识别(OpticalCharacter Recognition,OCR)技术识别得到。具体的,对视频进行OCR识别,提取得到视频的初始台词集合,还需要对初始台词集合做进一步数据清洗,从初始台词集合中,去除重复台词和由于OCR识别错误导致的不通顺的台词。
其中,对于重复的台词,通过比较各个台词,即可确定重复的台词。对于识别不通顺的台词,可以利用语言模型确定。语言模型用于评估文本序列是否符合人类语言使用习惯的程度,简单来说,就是判断一句话是否是人话的概率,这个概率又叫困惑度,困惑度越高,说明这句话越不符合人类语言使用习惯,很可能是错误识别的语句。在具体实现时,将困惑度高于预设阈值的台词判定为不通顺的台词,由此来判断初始台词集合中的每一句是否通顺,从而去除由于OCR识别错误导致的不通顺的台词。
其中,语音模型可以采用任何一种语音模型,例如:可以采用NGram语言模型,当然也可以采用其他语言模型,这里并不做限定。
步骤102,获取与台词集合对应的剧情简介文本;
具体的,获取与视频对应的完整剧情简介;提取台词集合的第一特征,以及提取完整剧情简介中的每一句文本的第二特征;对于每个第二特征,将第一特征和第二特征进行特征融合,得到融合后的特征;其中,融合后的特征用于表征台词集合和完整剧情简介中的各句文本之间的相似度;基于各个融合后的特征进行分类,得到与台词集合对应的剧情简介文本。
其中,在具体实现时,可以利用融合模型来实现对台词集合以及完整剧情简介中的每一句文本之间的特征融合;在分类时,可以利用分类模型,例如:分类器进行分类。在具体实现时,可以将融合模型和分类模型进行级联,将台词集合和完成剧情简介作为融合模型的输入,融合模型的输出为台词集合与完整剧情简介的每一句各自融合后的特征,同时也作为分类模型的输入,经过分类模型分类,确定与台词集合对应的剧情简介文本。
在具体实现时,可以通过获取与视频对应的完整剧情简介;获取融合模型和分类模型;将台词集合和完整剧情简介输入到融合模型中,得到台词集合与完整剧情简介的每一句各自融合后的特征;将各个特征输入到分类模型中,确定与台词集合对应的剧情简介文本。
其中,在获取与视频对应的完整剧情简介时,可以从视频中,提取视频的标识信息;其中,标识信息用于确定视频对应的完整视频;例如:标识信息可以是从视频中提取到的剧名、集名、集数、人物姓名等能够反映视频来源的信息;根据标识信息,检索与完整视频对应的完整剧情简介。
其中,根据标识信息检索与完整视频对应的完整剧情时,可以将上述标识信息作为关键词进行检索,也可以利用Bert模型来进行检索,具体实现的检索的方式这里并不做限定。
其中,对于融合模型,可以采用任何一种特征融合方法,例如:基于贝叶斯理论的特征融合算法,再例如:基于深度学习理论的特征融合算法,例如:Bert模型。
对于分类模型,可以采用神经网络模型的分类器实现,在本申请实施例中,可以采用全连接层连接两个一维卷积(1DCNN)的结构实现,其中,两个1DCNN并联,其中一个分支用于预测起点,另一个分支用于预测终点,从而从完整剧情简介中,确定与台词集合对应的剧情简介文本。
例如:通过视频的台词集合确定的剧情简介文本为:朱怡贞看到了报纸,得知纪中原死的消息,她非常的震惊也非常的难过。
在本申请实施例中,将台词集合和剧情简介进行特征融合,再进行分类,通过融合可以有效提高匹配结果的准确率。
步骤103,根据剧情简介文本,生成视频的初始标题;
具体的,对剧情简介文本进行概括,得到视频的初始标题。在具体实现时,步骤103主要是使用训练好的标题生成模型,以匹配到的剧情简介文本作为输入,生成初始标题,初始标题为对剧情简介文本的相关内容进行精炼和概括。
具体的,可以获取标题生成模型;标题生成模型用于生成视频的初始标题;将剧情简介文本输入到标题生成模型中,得到视频的初始标题。
其中,标题生成模型可以采用seq2seq结构的模型,其中,seq2seq结构中的编码器是transformer编码器(transformer-encoder),解码器是transformer解码器(transformer-decoder)。
例如:将剧情简介文本:朱怡贞看到了报纸,得知纪中原死的消息,她非常的震惊也非常的难过,输入到标题生成模型中,得到的标题为:朱怡贞得知事情真相。
在一个具体实施例中,在步骤103之后,还包括:对初始标题进行文本风格迁移,得到润色标题;合并初始标题和润色标题,得到最终的标题。
在具体实现时,主要是使用训练好的标题润色模型,对步骤103中生成的初始标题进行进一步的润色,增加标题的吸引力和流畅度。
具体的,可以获取标题润色模型;标题润色模型用于对初始标题进行润色改写;将初始标题输入到标题润色模型中,得到视频的最终标题。
其中,在具体实现时,标题润色模型可以采用seq2seq模型。但是,在训练标题润色模型时,缺少训练数据,在本申请实施例中,利用中文的句法分析,构建出训练标题润色模型的数据集。
具体的,获取多个训练标题;其中,每个所述训练标题满足如下条件中的至少一个:所述训练标题对应的目标视频的用户点击率超过预设值;所述目标视频的标题的评分超过预设分数;提取所述多个训练标题各自的句子主干结构;利用所述多个训练标题和多个所述句子主干结构训练初始标题润色模型,得到所述标题润色模型。
在具体实现时,根据用户点击率、打分模型等收集质量较高的训练标题,利用依存句法分析,分析标题的语法结构,将句子中的部分成分去除(状语、定语、修饰语等),只保留得到训练标题的主干结构:三元组(主语、谓语、宾语等),作为算法的输入,同时,将训练标题作为监督数据,以调整网络参数,使得模型的输出不断接近训练标题,得到最终训练好的标题润色模型。
其中,在本申请实施例中,标题润色模型的结构可以采用seq2seq结构的模型,模型对初始标题的主干结构进行编码并提取特征后,输入到解码模型中进行解码,得到最终的润色好的标题。
在本申请实施例中,润色模型的数据集的构建方式,由于没有训练数据,创新性的利用依存词法分析,将一个标题中的修饰词,定语状语等去除,得到算法的输入,通过这种形式构建数据集。实验证明,通过此数据集训练出来的模型可以有效提高标题的吸引力。
举例:将上述生成的初始标题:朱怡贞得知事情真相,输入到标题润色模型中进行润色,得到最终的标题:朱怡贞得知事情真相,这下事情大了。
此外,对于预设值和预设分数可以根据实际需要预先设定。
在本申请实施例中,根据视频的台词集合,确定剧情简介文本,根据剧情简介文本,生成视频的初始标题,使得起的初始标题更加贴切,之后对初始标题进行润色,得到视频的最终标题,通过对初始标题进行润色,使得标题更加具有吸引力。通过本申请实施例提供的方法,能够实现全自动的给视频起标题,无需大量人工起标题,节省人力,也能够提高起标题的效率。
在得到视频的最终标题后,可以输出最终标题以及与最终标题对应的剧情简介文本,具体的,可以向用户(例如:编辑)反馈最终标题和剧情简介文本,用户只需要对标题进行些许修改,大大提高了编辑的起标题效率,且由于存在匹配的剧情简介,使得用户不需要看视频就可以了解剧情梗概,提高了视频的分发效率。
为了进一步理解本申请实施例提供的一种视频的标题生成方法,如图2所示,图2示出了本申请实施例提供的一种视频的标题生成方法的总体技术构思框图。
如图2所示,主要分为三个部分:首先,将视频的台词和完整剧情简介进行匹配,匹配得到台词集合对应的剧情简介文本,然后,利用剧情简介文本生成初始标题,之后,对初始标题进行润色,得到视频最终的标题。
为了进一步理解本申请的技术方案,以短视频为例,从上述三个方面展开描述。
1、根据短视频匹配得到相关的剧情简介(即剧情简介文本),匹配到的剧情简介文本即描述了短视频中的主要剧情。
该算法的输入是OCR台词数据(即短视频的台词集合)和短视频对应的整个长视频的完整剧情简介,目的是根据短视频的台词,匹配到描述短视频的相关的剧情简介,用于生成标题。
首先,对利用OCR技术识别得到的台词数据进行清理,去除重复台词以及由于OCR识别错误导致的不通顺的台词;然后使用训练好的融合模型,提取完整剧情简介和台词集合融合后的特征;最后使用训练好的分类模型(又叫剧情简介定位模型),预测与该短视频相关的剧情简介文本。
这里需要说明的是,在将完整剧情简介和台词集合进行融合时,是完整剧情简介的每一句与台词集合分别进行融合,例如:完整剧情简介有100句,则得到100个融合后的特征。
如图3所示,定义长视频的完整剧情简介由N句组成{dn|n=0,...,N},其中,di表示第i个描述语句;将完整剧情简介和视频的台词集合输入到融合编码器(Fusion Encoder)中,得到每一句剧情简介融合后的特征,将所有的融合特征输入到分类器中,通过分类器预测剧情简介和台词是否匹配,若匹配,则将匹配到的剧情简介的起始点和终止点区间内对应的句子作为输出,从而得到台词集合对应的剧情简介文本,例如:通过匹配到的相关剧情简介为:朱怡贞看到了报纸,得知纪中原死的消息,她非常的震惊也非常的难过。如果不匹配,则输出为空。
2、利用标题生成模型,根据匹配到的剧情简介文本生成初始标题,此初始标题可以概括匹配到的剧情简介。
使用训练好的标题生成模型,以匹配到的剧情简介文本作为输入,生成初始标题,此初始标题可以对剧情简介相关内容进行精炼和概括。
在具体实现时,标题生成模型是传统的seq2seq结构,编码器是transformer编码器,解码器是transformer解码器。在训练标题生成模型时,可以先利用多组预训练数据进行预训练,得到预训练的标题生成模型。其中,每组预训练数据包括:一段剧情简介文本和一个精炼概括的标题,但是,对于预训练数据不要求标题概括十分精炼、恰当。然后,再利用质量较高的标题和对应的剧情简介文本对模型参数进行微调,以实现快速训练。其中,质量较高的标题是指用户点击率超过预设值的视频的标题,或者,标题评分超过预设分数的视频的标题,或者,用户通过观看视频,认为起的比较恰当的标题。
在本申请实施例中,通过预训练和微调这两个阶段对标题生成模型进行训练,能够减少人工观看视频以确定标题是否恰当的时间成本和人工成本,训练的效率更高。
为了便于理解本申请的标题生成模型,这里举例说明:将上述剧情简介后得到的标题:朱怡贞看到了报纸,得知纪中原死的消息,她非常的震惊也非常的难过,输入到标题生成模型中,得到的精炼和概括的初始标题为:朱怡贞得知事情真相。
3、利用标题润色模型对生成的初始标题进行润色改写,从而增加标题的吸引力和流畅度。
使用训练好的标题润色模型,对上一步骤中生成的初始标题进行进一步的润色,增加标题的吸引力和流畅度。
由于缺少训练数据,在本申请实施例中,利用中文的句法分析,构建出训练润色模型的数据集,具体操作为:根据用户点击率、打分模型等收集质量较高的训练标题,利用依存句法分析,分析训练标题的语法结构,将训练标题中的部分成分去除(状语、定语、修饰语等),只保留得到训练标题的主干结构:三元组(主语、谓语、宾语等),作为算法的输入,将训练标题作为监督数据,以调整网络参数,使得模型的输出不断接近训练标题,得到最终训练好的标题润色模型。
其中,在本申请实施例中,标题润色模型的结构可以采用seq2seq结构的模型,模型对初始标题的主干结构进行编码并提取特征后,输入到解码模型中进行解码,得到最终的润色好的标题。
为了便于理解,这里举例说明:将上述生成的初始标题:朱怡贞得知事情真相,输入到标题润色模型中进行润色改写,得到视频的最终标题为:朱怡贞得知事情真相,这下事情大了。
标题润色模型也是传统的seq2seq结构,编码器是transformer编码器,解码器是transformer编码器。
基于同一构思,本申请实施例中提供了一种视频的标题生成装置,该装置的具体实施可参见方法实施例部分的描述,重复之处不再赘述。如图4所示,该装置主要包括:
提取模块401,用于提取所述视频的台词集合;
获取模块402,用于获取与所述台词集合对应的剧情简介文本;
生成模块403,用于根据所述剧情简介文本,生成所述视频的初始标题。
在一个具体实施例中,获取模块402,用于获取与所述视频对应的完整剧情简介;提取所述台词集合的第一特征,以及提取所述完整剧情简介中的每一句文本的第二特征;对于每个所述第二特征,将所述第一特征和所述第二特征进行特征融合,得到融合后的特征;其中,所述融合后的特征用于表征所述台词集合和所述完整剧情简介中的各句文本之间的相似度;基于各个融合后的特征进行分类,得到与所述台词集合对应的剧情简介文本。
在一个具体实施例中,生成模块403,用于对所述剧情简介文本进行概括,得到所述视频的初始标题。
在一个具体实施例中,本申请实施例提供的一种视频的标题生成装置还包括:润色模块404,用于对所述初始标题进行文本风格迁移,得到润色标题;合并所述初始标题和所述润色标题,得到最终的标题。
在一个具体实施例中,提取模块401,用于提取所述视频的初始台词集合;从所述初始台词集合中,去除重复台词以及不通顺的台词,得到所述台词集合。
在一个具体实施例中,获取模块402,用于从所述视频中,提取所述视频的标识信息;其中,所述标识信息用于确定所述视频对应的完整视频;根据所述标识信息,检索与所述完整视频对应的完整剧情简介。
在本申请实施例中,根据视频的台词集合,确定剧情简介文本,根据剧情简介文本,生成视频的初始标题,对初始标题进行润色,得到视频的最终标题。
通过本申请实施例提供的方法,可以全自动的给视频起标题,编辑只需要对标题进行些许修改,大大提高的编辑的起标题效率,且由于存在匹配的剧情简介,使得编辑不需要看视频就可以了解剧情梗概,提高了视频的分发效率。
基于同一构思,本申请实施例中还提供了一种电子设备,如图5所示,该电子设备主要包括:处理器501、存储器502和通信总线503,其中,处理器501和存储器502通过通信总线503完成相互间的通信。其中,存储器502中存储有可被处理器501执行的程序,处理器501执行存储器502中存储的程序,实现如下步骤:
提取所述视频的台词集合;
获取与所述台词集合对应的剧情简介文本;
根据所述剧情简介文本,生成所述视频的初始标题。
上述电子设备中提到的通信总线503可以时外设部件互连标准(PeripheralComponent Interconnect,简称PCI)总线或扩展工业标准结构(Extended IndustryStandard Architecture,简称EISA)总线等。该通信总线503可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器502可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器501的存储装置。
上述的处理器501可以是通用处理器,包括中央处理器(Central ProcessingUnit,简称CPU)、网络处理器(Network Processor,简称NP)等,还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本申请的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述实施例中所描述的一种视频的标题生成方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机指令时,全部或部分地产生按照本申请实施例所述的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令从一个网站站点、计算机、服务器或者数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、微波等)方式向另外一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如软盘、硬盘、磁带等)、光介质(例如DVD)或者半导体介质(例如固态硬盘)等。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种视频的标题生成方法,其特征在于,包括:
提取所述视频的台词集合;
获取与所述台词集合对应的剧情简介文本;
根据所述剧情简介文本,生成所述视频的初始标题。
2.根据权利要求1所述的视频的标题生成方法,其特征在于,所述获取与所述台词集合对应的剧情简介文本,包括:
获取与所述视频对应的完整剧情简介;
提取所述台词集合的第一特征,以及提取所述完整剧情简介中的每一句文本的第二特征;
对于每个所述第二特征,将所述第一特征和所述第二特征进行特征融合,得到融合后的特征;其中,所述融合后的特征用于表征所述台词集合和所述完整剧情简介中的各句文本之间的相似度;
基于各个融合后的特征进行分类,得到与所述台词集合对应的剧情简介文本。
3.根据权利要求1或2所述的视频的标题生成方法,其特征在于,所述根据所述剧情简介文本,生成所述视频的初始标题,包括:
对所述剧情简介文本进行概括,得到所述视频的初始标题。
4.根据权利要求1所述的视频的标题生成方法,其特征在于,所述根据所述剧情简介文本,生成所述视频的初始标题之后,还包括:
对所述初始标题进行文本风格迁移,得到润色标题;
合并所述初始标题和所述润色标题,得到最终的标题。
5.根据权利要求1所述的视频的标题生成方法,其特征在于,所述提取所述视频的台词集合,包括:
提取所述视频的初始台词集合;
从所述初始台词集合中,去除重复台词以及不通顺的台词,得到所述台词集合。
6.根据权利要求2所述的视频的标题生成方法,其特征在于,所述获取与所述视频对应的完整剧情简介,包括:
从所述视频中,提取所述视频的标识信息;其中,所述标识信息用于确定所述视频对应的完整视频;
根据所述标识信息,检索与所述完整视频对应的完整剧情简介。
7.一种视频的标题生成装置,其特征在于,包括:
提取模块,用于提取所述视频的台词集合;
获取模块,用于获取与所述台词集合对应的剧情简介文本;
生成模块,用于根据所述剧情简介文本,生成所述视频的初始标题。
8.根据权利要求7所述的视频的标题生成装置,其特征在于,还包括:润色模块,用于对所述初始标题进行文本风格迁移,得到润色标题;合并所述初始标题和所述润色标题,得到最终的标题。
9.一种电子设备,包括:处理器、存储器和通信总线,其中,处理器和存储器通过通信总线完成相互间的通信;所述存储器,用于存储计算机程序;所述处理器,用于执行所述存储器中所存储的程序,实现权利要求1至6任一项所述的视频的标题生成方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6任一项所述的视频的标题生成方法。
CN202210426714.3A 2022-04-21 2022-04-21 视频的标题生成方法、装置、设备及存储介质 Pending CN114860992A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210426714.3A CN114860992A (zh) 2022-04-21 2022-04-21 视频的标题生成方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210426714.3A CN114860992A (zh) 2022-04-21 2022-04-21 视频的标题生成方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114860992A true CN114860992A (zh) 2022-08-05

Family

ID=82633804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210426714.3A Pending CN114860992A (zh) 2022-04-21 2022-04-21 视频的标题生成方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114860992A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116033207A (zh) * 2022-12-09 2023-04-28 北京奇艺世纪科技有限公司 视频标题的生成方法、装置、电子设备及可读存储介质
CN116156271A (zh) * 2022-12-14 2023-05-23 北京奇艺世纪科技有限公司 视频标题的生成方法、装置、电子设备及可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116033207A (zh) * 2022-12-09 2023-04-28 北京奇艺世纪科技有限公司 视频标题的生成方法、装置、电子设备及可读存储介质
CN116156271A (zh) * 2022-12-14 2023-05-23 北京奇艺世纪科技有限公司 视频标题的生成方法、装置、电子设备及可读存储介质

Similar Documents

Publication Publication Date Title
JP7142737B2 (ja) マルチモーダルに基づくテーマ分類方法、装置、機器及び記憶媒体
CN110717017B (zh) 一种处理语料的方法
US11070879B2 (en) Media content recommendation through chatbots
WO2020103899A1 (zh) 用于生成图文信息的方法和用于生成图像数据库的方法
CN104735468B (zh) 一种基于语义分析将图像合成新视频的方法及系统
WO2018045646A1 (zh) 基于人工智能的人机交互方法和装置
KR102041621B1 (ko) 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
CN114580382A (zh) 文本纠错方法以及装置
CN114860992A (zh) 视频的标题生成方法、装置、设备及存储介质
US11120802B2 (en) Diarization driven by the ASR based segmentation
CN108281139A (zh) 语音转写方法和装置、机器人
CN113076720B (zh) 长文本的分段方法及装置、存储介质、电子装置
US11699034B2 (en) Hybrid artificial intelligence system for semi-automatic patent infringement analysis
Dufour et al. Characterizing and detecting spontaneous speech: Application to speaker role recognition
CN111859950A (zh) 一种自动化生成讲稿的方法
CN111414735A (zh) 文本数据的生成方法和装置
CN114281948A (zh) 一种纪要确定方法及其相关设备
US10468031B2 (en) Diarization driven by meta-information identified in discussion content
US20240037941A1 (en) Search results within segmented communication session content
CN116910251A (zh) 基于bert模型的文本分类方法、装置、设备及介质
CN113869049B (zh) 基于法律咨询问题的具有法律属性的事实抽取方法及装置
CN113470617B (zh) 语音识别方法以及电子设备、存储装置
US20170293597A1 (en) Methods and systems for data processing
CN112015928B (zh) 多媒体资源的信息提取方法、装置、电子设备及存储介质
CN116226677B (zh) 平行语料构建方法及装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination