CN114564952A

CN114564952A - 一种文本标题生成方法、装置、设备及介质

Info

Publication number: CN114564952A
Application number: CN202210147545.XA
Authority: CN
Inventors: 卢家辉
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2022-02-17
Filing date: 2022-02-17
Publication date: 2022-05-31

Abstract

本公开关于一种文本标题生成方法、装置、设备及介质，用以解决相关技术中播放内容封面描述不准确，用户体验差的问题，所述方法包括：获取播放数据，所述播放数据中包括视频数据和音频数据；基于所述音频数据，得到具有设定数据结构的语义数据；根据所述语义数据生成所述播放数据对应的文本标题；根据预设的标题贴纸模板生成至少包括所述文本标题的标题贴纸，并将所述标题贴纸合并至所述视频数据中。

Description

一种文本标题生成方法、装置、设备及介质

技术领域

本公开涉及机器学习领域，尤其涉及一种文本标题生成方法、装置、设备及介质。

背景技术

短视频是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，几秒到几分钟不等。内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于内容较短，可以单独成片，也可以成为系列栏目。截至2020年12月，中国短视频用户规模为8.73亿，较2020年3月增长1.00亿，占网民整体的88.3％。

目前，在短视频软件上，视频创作者可以给视频添加带文字的封面，视频剪辑用户在添加视频的封面文字的时候,常常会想不到最为贴切的文字标题，如果封面文案添加不当或者吸引力不够,会阻碍视频作品的传播。短视频的封面文字应该是跟短视频内容高度相关的文字，并且这些文字能够对短视频内容进行凝练和概括。使得短视频的观众能够通过封面的文字能够快速地了解短视频的内容。

纵观目前市场上的移动端视频剪辑软件，并没有提供方便地生成视频封面文字的方案。

发明内容

本公开提供一种文本标题生成方法、装置、设备及介质，以至少解决相关技术中代码难以维护，研发投入人力过大的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种文本标题生成方法，包括：

获取播放数据，播放数据中包括视频数据和音频数据；

基于音频数据，得到具有设定数据结构的语义数据；

根据语义数据生成播放数据对应的文本标题；

根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。

在一种可能的实施方式中，本公开提供的方法中，根据语义数据生成播放数据对应的文本标题，包括：

基于语义数据确定音频数据中至少一个关键词；

根据关键词生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的方法中，根据关键词生成播放数据对应的文本标题，包括：

基于预设规则，在至少一个关键词中确定目标关键词；

根据目标关键词生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的方法中，在获取播放数据之后，方法还包括：

基于视频数据，得到具有设定数据结构的文本数据。

根据目标关键词和文本数据，通过模板生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的方法中，标题贴纸包括与语义数据对应的动画效果，方法还包括：

基于动画效果，展示标题贴纸。

在一种可能的实施方式中，本公开提供的方法中，基于音频数据，得到具有设定数据结构的语义数据，包括：

基于音频数据和语音识别技术，得到具有设定数据结构的语义数据。

根据本公开实施例的第二方面，提供一种文本标题生成装置，包括：

获取单元，被配置为执行获取播放数据，播放数据中包括视频数据和音频数据；

处理单元，被配置为执行基于音频数据，得到具有设定数据结构的语义数据；

生成单元，被配置为执行根据语义数据生成播放数据对应的文本标题；

合并单元，被配置为执行根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。

在一种可能的实施方式中，本公开提供的装置中，生成单元具体被配置为：

执行基于语义数据确定音频数据中至少一个关键词；

执行根据关键词生成播放数据对应的文本标题。

执行基于预设规则，在至少一个关键词中确定目标关键词；

执行根据目标关键词生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的装置中，标题贴纸包括与语义数据对应的动画效果，合并单元还被配置为：

基于动画效果，展示标题贴纸。

在一种可能的实施方式中，本公开提供的装置中，处理单元还被配置为：

执行基于视频数据，得到具有设定数据结构的文本数据。

执行根据目标关键词和文本数据，通过模板生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的装置中，处理单元具体被配置为：

执行基于音频数据和语音识别技术，得到具有设定数据结构的语义数据。

根据本公开实施例的第三方面，提供一种电子设备，包括：处理器；

用于存储处理器可执行指令的存储器；

其中，处理器被配置为执行所述指令，以实现本公开实施例第一方面中任一项所述的文本标题生成方法。

根据本公开实施例的第四方面，提供一种计算机程序产品，包括：处理器；

用于存储处理器可执行指令的存储器；

根据本公开实施例的第五方面，提供一种存储介质，当存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行本公开实施例第一方面中任一项所述的文本标题生成方法。

本公开的实施例提供的技术方案至少带来以下有益效果：

获取播放数据，播放数据中包括视频数据和音频数据，基于音频数据，得到具有设定数据结构的语义数据，根据语义数据生成播放数据对应的文本标题，根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。与现有技术的方案相比，提供与播放数据高度相关的标题文字，使得用户能够快速了解播放内容，提高视频传播速度，提升用户体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理，并不构成对本公开的不当限定。

图1是根据一示例性实施例示出的一种文本标题生成方法的流程图。

图2是根据一示例性实施例示出的一种文本标题生成方法的具体流程示意图。

图3是根据一示例性实施例示出的一种文本标题生成方法的具体流程示意图。

图4是根据一示例性实施例示出的一种文本标题生成方法的封面结构示意图。

图5是根据一示例性实施例示出的另一文本标题生成方法的具体流程示意图。

图6是根据一示例性实施例示出的一种文本标题生成装置的结构示意图。

图7是根据一示例性实施例示出的一种文本标题生成设备的结构示意图。

图8是根据一示例性实施例示出的应用文本标题生成方法的终端的结构示意图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

下面对文中出现的一些词语进行解释：

1、本发明实施例中术语“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

2、文本分割(Text segmentation)指将书面文本分割成有意义单位的过程，如单词、句子或主题。这个术语既适用于人类阅读文本时的心理过程，也适用于在计算机中实现的人工过程，后者属于自然语言处理的领域。一些书面语言有明确的单词分界标记，例如英语的词之间有空格标识，阿拉伯语有独特的首、中、末字母形状，但这种标记不是所有书面语言都有。

3、语音识别(Speech Recognition)，即语音识别技术，也被称为自动语音识别(Automatic Speech Recognition,ASR)、电脑语音识别(Computer Speech Recognition，CSR)或是语音转文本识别(Speech To Text,STT)，其目标是以电脑自动将人类的语音内容转换为相应的文字。

有鉴于此，本公开提供一种交互方式，使得用户在完成视频剪辑时，可以通过语音识别将视频的语音内容识别成为文字，进而生成视频的封面文字内容。

图1是根据一示例性实施例示出的一种文本标题生成方法的流程图，如图1所示的文本标题生成方法，包括以下步骤。

在步骤S101中，获取播放数据，播放数据中包括视频数据和音频数据。

具体实施时，先获取播放数据，播放数据可以是用户上传的视频文件或音频文件，其中视频文件中一定包含有对应的视频数据和音频数据，为方便本公开实施例的描述，以下以播放数据为视频文件进行说明。

在步骤S102中，基于音频数据，得到具有设定数据结构的语义数据。

具体实施时，基于音频数据和语音识别技术，得到具有设定数据结构的语义数据，语音识别技术，也被称为自动语音识别，其目标是以通过设备自动将人类的语音内容转换为相应的文字。

在本步骤，也可以基于视频数据，得到具有设定数据结构的文本数据，具体可以是根据视频中的场景生成文本数据，也可以是根据视频的类型，如该视频为游戏视频或动漫或唱歌跳舞等，对应生成文本数据。

在步骤S103中，根据语义数据生成播放数据对应的文本标题。

具体实施时，通过文本分割技术，将语义数据分割成至少一个有意义的关键词，如单词、句子或主题等，在从多个关键词中确定出目标关键词，通常选用出现次数最多的关键词为目标关键词，当然也可以通过其他判断依据确定目标关键词，如当前热度最高的关键词，与视频数据最接近的关键词，最后根据目标关键词生成播放数据对应的文本标题。

当然，如果在S102中对视频数据获取到了文本数据，也可以根据目标关键词和文本数据，通过模板生成播放数据对应的文本标题。

在步骤S104中，根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。

具体实施时，通过预先设置的标题贴纸模板，生成包含有文本标题的标题贴纸，该标题贴纸中还可以带有动画效果，如进入、进出，闪烁等。最终在视频数据的展示界面中以动画效果的形式来展示文本标题。

下面结合图2，对本公开实施例提供的文本标题生成方法的具体过程进行详细说明。

在步骤S201中，获取播放数据，播放数据中包括视频数据和音频数据。

在步骤S202中，基于音频数据，得到具有设定数据结构的语义数据。

在步骤S203中，基于视频数据，得到具有设定数据结构的文本数据。

具体实施时，可以是根据视频中的场景生成文本数据，也可以是根据视频的类型，如该视频为游戏视频或动漫或唱歌跳舞等，对应生成文本数据。

在步骤S204中，通过文本分割技术，将语义数据分割成至少一个有意义的关键词。

具体实施时，通过文本分割技术，将语义数据分割成至少一个有意义的关键词，如单词、句子或主题等，在从多个关键词中确定出目标关键词，通常选用出现次数最多的关键词为目标关键词，当然也可以通过其他判断依据确定目标关键词，如当前热度最高的关键词，与视频数据最接近的关键词。

在步骤S205中，根据目标关键词和文本数据，生成播放数据对应的文本标题。

具体实施时，模板通常是指一些文字模板，结合关键字可以生成有意义的文案，如“美妆很有趣,大家要来看看吗？”；结合关键字，如“钓鱼”和文本数据“湖边”,生成“在湖边钓鱼很有趣，大家要来看看吗？”这样的文案。

在步骤S206中，根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。

下面结合图3，对本公开实施例提供文本标题生成方法在软件中的应用方式进行详细说明。

在步骤S301中，视频创作者在移动端视频剪辑软件中剪辑出视频。

在一个示例中，视频创作者拍摄一段美妆视频，并上传至移动端剪辑软件中。

在步骤S302中，用户完成剪辑,并导出播放数据。

仍沿用上述示例，用户通过移动端剪辑软件对视频进行剪辑，以及一些简单的后期加工，然后到处播放数据。

在步骤S303中，询问用户是否生成智能封面文案。

如果用户选择“否”，跳转步骤S309，如果用户选择“是”，则进行步骤S304步。

仍沿用上述示例，弹出一个弹窗询问用户“是否对该视频生成智能封面文案”。

在步骤S304中，基于音频数据，得到具有设定数据结构的语义数据。

在步骤S305中，基于语义数据，确定目标关键词。

具体实施时，对语义数据进行分词，并且统计每一个分词出现次数。将次数出现最高的词语作为关键词。

在步骤S306中，根据关键词，通过模板生成播放数据对应的文本标题。

具体实施时，模板通常是指一些文字模板，结合关键字可以生成有意义的文案，如“美妆很有趣,大家要来看看吗？”。

在步骤S307中，询问是否使用文本标题。

具体实施时，将步骤S306生成的文案，以对话框的形式弹出，并询问用户这是智能生成的封面文案，是否要生成字幕插入到视频开始的地方，形成视频封面。

如果用户选择是，跳转步骤S308，则将文字转换成为字幕内容,插入到视频开始的地方,形成封面；如果选择否，则跳转步骤S309。

仍沿用上述示例，弹出一个弹窗询问客户，“是否使用‘美妆很有趣,大家要来看看吗？’作为该视频的封面文案吗？”。

在步骤S308中，用文本标题生成视频封面。

具体实施时，以手机端为例，通过预设的标题贴纸模板，生成标题贴纸，然后以标题贴纸中的动画效果展示文本标题，生成如图4所示的视频封面。

仍沿用上述示例，通过进入的动画效果展示文本标题“美妆很有趣,大家要来看看吗？”和视频某一帧的截图，生成视频封面。

在步骤S309中，结束。

下面结合图5，对本公开实施例提供的另一文本标题生成方法在软件中的应用方式进行详细说明。

在步骤S501中，视频创作者在移动端视频剪辑软件中剪辑出视频。

在一个示例中，视频创作者拍摄一段钓鱼视频，并上传至移动端剪辑软件中。

在步骤S502中，用户完成剪辑，并导出播放数据。

在步骤S503中，询问用户是否生成智能封面文案。

如果用户选择“否”，跳转步骤S509，如果用户选择“是”，则进行步骤S504步。

在步骤S504中，基于音频数据，得到具有设定数据结构的语义数据。

在步骤S505中，基于视频数据，得到具有设定数据结构的文本数据。

在步骤S506中，基于语义数据，确定目标关键词。

在步骤S507中，根据关键词和文本数据，通过模板生成播放数据对应的文本标题。

具体实施时，模板通常是指一些文字模板，结合关键字可以生成有意义的文案，如“钓鱼”和文本数据“湖边”,生成“在湖边钓鱼很有趣，大家要来看看吗？”。

在步骤S508中，询问是否使用文本标题。

具体实施时，将步骤S507生成的文案，以对话框的形式弹出，并询问用户这是智能生成的封面文案，是否要生成字幕插入到视频开始的地方，形成视频封面。

如果用户选择是，跳转步骤S509，则将文字转换成为字幕内容,插入到视频开始的地方,形成封面，如果选择否，则跳转步骤S510。

仍沿用上述示例，弹出一个弹窗询问客户，“是否使用‘在湖边钓鱼很有趣，大家要来看看吗？’作为该视频的封面文案吗？”。

在步骤S509中，用文本标题生成视频封面。

仍沿用上述示例，用闪烁的动画效果展示文本标题“在湖边钓鱼很有趣，大家要来看看吗？”和视频某一帧的截图，生成视频封面。

在步骤S510中，结束。

图6是根据一示例性实施例示出的一种文本标题生成装置框图。参照图6，该装置包括获取单元601，处理单元602、生成单元603和合并单元604。

获取单元601，被配置为执行获取播放数据，播放数据中包括视频数据和音频数据；

处理单元602，被配置为执行基于音频数据，得到具有设定数据结构的语义数据；

生成单元603，被配置为执行根据语义数据生成播放数据对应的文本标题；

合并单元604，被配置为执行根据预设的标题贴纸模板生成至少包括文本标题的标题贴纸，并将标题贴纸合并至视频数据中。

在一种可能的实施方式中，本公开提供的装置中，生成单元603具体被配置为：

执行基于语义数据确定音频数据中至少一个关键词；

执行根据关键词生成播放数据对应的文本标题。

执行基于预设规则，在至少一个关键词中确定目标关键词；

执行根据目标关键词生成播放数据对应的文本标题。

在一种可能的实施方式中，本公开提供的装置中，处理单元602还被配置为：

执行基于视频数据，得到具有设定数据结构的文本数据。

在一种可能的实施方式中，本公开提供的装置中，标题贴纸包括与语义数据对应的动画效果，合并单元604具体被配置为：

基于所述动画效果，展示所述标题贴纸。

在一种可能的实施方式中，本公开提供的装置中，处理单元602具体被配置为：

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种电子设备700的框图。

处理器710；

用于存储所述处理器710可执行指令的存储器730；

其中，所述处理器710被配置为执行所述指令，以实现本公开实施例中的文本标题生成方法。

在示例性实施例中，还提供了一种包括指令的存储介质，例如包括指令的存储器730，上述指令可由设备700的处理器710执行以完成上述方法。可选地，存储介质可以是非临时性计算机可读存储介质，例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

在本公开实施例中，如图8所示，本公开实施例给出一种应用本公开实施例提供的文本标题生成方法的终端800，包括：射频(Radio Frequency，RF)电路810、电源820、处理器830、存储器840、输入单元850、显示单元860、摄像头870、通信接口880、以及无线保真(Wireless Fidelity，Wi-Fi)模块890等部件。本领域技术人员可以理解，图8中示出的终端的结构并不构成对终端的限定，本申请实施例提供的终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图8对所述终端800的各个构成部件进行具体的介绍：

所述RF电路810可用于通信或通话过程中，数据的接收和发送。特别地，所述RF电路810在接收到基站的下行数据后，发送给所述处理器830处理；另外，将待发送的上行数据发送给基站。通常，所述RF电路810包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，LNA)、双工器等。

此外，RF电路810还可以通过无线通信与网络和其他终端通信。所述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯系统(Global System of Mobilecommunication，GSM)、通用分组无线服务(General Packet Radio Service，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code DivisionMultiple Access，WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

Wi-Fi技术属于短距离无线传输技术，所述终端800通过Wi-Fi模块890可以连接接入点(Access Point，AP)，从而实现数据网络的访问。所述Wi-Fi模块890可用于通信过程中，数据的接收和发送。

所述终端800可以通过所述通信接口880与其他终端实现物理连接。可选的，所述通信接口880与所述其他终端的通信接口通过电缆连接，实现所述终端800和其他终端之间的数据传输。

由于在本申请实施例中，所述终端800能够实现通信业务，向其他联系人发送信息，因此所述终端800需要具有数据传输功能，即所述终端800内部需要包含通信模块。虽然图8示出了所述RF电路810、所述Wi-Fi模块890、和所述通信接口880等通信模块，但是可以理解的是，所述终端800中存在上述部件中的至少一个或者其他用于实现通信的通信模块(如蓝牙模块)，以进行数据传输。

例如，当所述终端800为手机时，所述终端800可以包含所述RF电路810，还可以包含所述Wi-Fi模块890；当所述终端800为计算机时，所述终端800可以包含所述通信接口880，还可以包含所述Wi-Fi模块890；当所述终端800为平板电脑时，所述终端800可以包含所述Wi-Fi模块。

所述存储器840可用于存储软件程序以及模块。所述处理器830通过运行存储在所述存储器840的软件程序以及模块，从而执行所述终端800的各种功能应用以及数据处理，并且当处理器830执行存储器840中的程序代码后，可以实现本公开实施例图7、图8中的部分或全部过程。

可选的，所述存储器840可以主要包括存储程序区和存储数据区。其中，存储程序区可存储操作系统、各种应用程序(比如通信应用)以及执行弹窗模块等；存储数据区可存储根据所述终端的使用所创建的数据(比如各种图片、视频文件等多媒体文件，以及弹窗信息模板)等。

此外，所述存储器840可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述输入单元850可用于接收用户输入的数字或字符信息，以及产生与所述终端800的用户设置以及功能控制有关的键信号输入。

可选的，输入单元850可包括触控面板851以及其他输入终端853。

其中，所述触控面板851，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在所述触控面板851上或在所述触控面板851附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，所述触控面板851可以包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给所述处理器830，并能接收所述处理器830发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现所述触控面板851。

可选的，所述其他输入终端853可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

所述显示单元860可用于显示由用户输入的信息或提供给用户的信息以及所述终端800的各种菜单。所述显示单元860即为所述终端800的显示系统，用于呈现界面，实现人机交互。

所述显示单元860可以包括显示面板861。可选的，所述显示面板871可以采用液晶显示屏(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-EmittingDiode，OLED)等形式来配置。

进一步的，所述触控面板851可覆盖所述显示面板861，当所述触控面板851检测到在其上或附近的触摸操作后，传送给所述处理器830以确定触摸事件的类型，随后所述处理器830根据触摸事件的类型在所述显示面板861上提供相应的视觉输出。

虽然在图8中，所述触控面板851与所述显示面板861是作为两个独立的部件来实现所述终端800的输入和输入功能，但是在某些实施例中，可以将所述触控面板851与所述显示面板861集成而实现所述终端800的输入和输出功能。

所述处理器830是所述终端800的控制中心，利用各种接口和线路连接各个部件，通过运行或执行存储在所述存储器840内的软件程序和/或模块，以及调用存储在所述存储器840内的数据，执行所述终端800的各种功能和处理数据，从而实现基于所述终端的多种业务。

可选的，所述处理器830可包括一个或多个处理单元。可选的，所述处理器830可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到所述处理器830中。

所述摄像头870，用于实现所述终端800的拍摄功能，拍摄图片或视频。所述摄像头870还可以用于实现终端800的扫描功能，对扫描对象(二维码/条形码)进行扫描。

所述终端800还包括用于给各个部件供电的电源830(比如电池)。可选的，所述电源830可以通过电源管理系统与所述处理器830逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗等功能。

需要说明的是，本公开实施例处理器830可以执行图7中处理器710的功能，存储器840存储处理器710中的内容。

另外，在示例性实施例中，本公开还提供了一种存储介质，当存储介质中的指令由上述文本标题生成设备的处理器执行时，使得上述文本标题生成设备能够实现本公开实施例中的文本标题生成方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种文本标题生成方法，其特征在于，包括：

获取播放数据，所述播放数据中包括视频数据和音频数据；

基于所述音频数据，得到具有设定数据结构的语义数据；

根据所述语义数据生成所述播放数据对应的文本标题；

根据预设的标题贴纸模板生成至少包括所述文本标题的标题贴纸，并将所述标题贴纸合并至所述视频数据中。

2.根据权利要求1所述的方法，其特征在于，所述根据所述语义数据生成所述播放数据对应的文本标题，包括：

基于所述语义数据确定所述音频数据中至少一个关键词；

根据所述关键词生成所述播放数据对应的文本标题。

3.根据权利要求2所述的方法，其特征在于，所述根据所述关键词生成所述播放数据对应的文本标题，包括：

基于预设规则，在至少一个关键词中确定目标关键词；

根据所述目标关键词生成所述播放数据对应的文本标题。

4.根据权利要求1所述的方法，其特征在于，在所述获取播放数据之后，所述方法还包括：

基于所述视频数据，得到具有设定数据结构的文本数据。

5.根据权利要求3和4所述的方法，其特征在于，所述根据所述关键词生成所述播放数据对应的文本标题，包括：

根据所述目标关键词和所述文本数据，通过所述模板生成所述播放数据对应的文本标题。

6.根据权利要求1所述的方法，其特征在于，所述标题贴纸包括与所述语义数据对应的动画效果，所述方法还包括：

基于所述动画效果，展示所述标题贴纸。

7.根据权利要求1所述的方法，其特征在于，所述基于所述音频数据，得到具有设定数据结构的语义数据，包括：

基于所述音频数据和语音识别技术，得到具有设定数据结构的语义数据。

8.一种文本标题生成装置，其特征在于，包括：

获取单元，被配置为执行获取播放数据，所述播放数据中包括视频数据和音频数据；

处理单元，被配置为执行基于所述音频数据，得到具有设定数据结构的语义数据；

生成单元，被配置为执行根据所述语义数据生成所述播放数据对应的文本标题；

合并单元，被配置为执行根据预设的标题贴纸模板生成至少包括所述文本标题的标题贴纸，并将所述标题贴纸合并至所述视频数据中。

9.一种文本标题生成电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至7中任一项所述的文本标题生成方法。

10.一种存储介质，当所述存储介质中的指令由文本标题生成电子设备的处理器执行时，使得文本标题生成电子设备能够执行如权利要求1至7中任一项所述的文本标题生成方法。