WO2022110844A1

WO2022110844A1 - 自动加载字幕的方法及电子设备

Info

Publication number: WO2022110844A1
Application number: PCT/CN2021/107903
Authority: WO
Inventors: 吴丹
Original assignee: 北京达佳互联信息技术有限公司
Priority date: 2020-11-27
Filing date: 2021-07-22
Publication date: 2022-06-02
Also published as: CN112988005A; CN112988005B

Abstract

本公开关于一种自动加载字幕的方法及电子设备。该自动加载字幕的方法包括：响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。

Description

自动加载字幕的方法及电子设备

本申请基于申请号为202011367465.2、申请日为2020年11月27日的中国专利申请提出，并要求该中国专利申请的优先权，该中国专利申请的全部内容在此引入本申请作为参考。

技术领域

本公开涉及视频制作领域，尤其涉及一种自动加载字幕的方法及电子设备。

背景技术

相关技术中，制作视频的过程中，需要手动添加字幕，字幕的添加过程为：拖动视频轨道选择要添加字幕的视频帧，点击输入文本，手动输入或粘贴所需的字幕文本，再拖到下一个要添加字幕的视频帧，重复该过程。

发明内容

本公开提供了一种自动加载字幕的方法、装置、电子设备以及非易失性存储介质。

根据本公开实施例的一方面，提供一种自动加载字幕的方法，包括：响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。

根据本公开实施例的另一方面，提供一种自动加载字幕的装置，包括：第一获取单元，被配置为执行响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；第一显示单元，被配置为执行在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。

根据本公开实施例的另一方面，提供一种电子设备，包括：处理器；用于存储所述处理器可执行指令的存储器；其中，所述处理器被配置为执行所述指令，以实现如下操作：响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。

根据本公开实施例的另一方面，提供一种非易失性存储介质，当所述非易失性存储介质中的指令由电子设的处理器执行时，使得电子设备能够执行任一种上述的自动加载字幕的方法。

根据本公开实施例的另一方面，提供一种计算机程序产品，当所述计算机程序产品中的指令由电子设备的处理器执行时，使得电子设备能够执行如下操作：响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。

附图说明

图1是根据一示例性实施例示出的一种自动加载字幕的方法的应用场景的架构图。

图2是根据一示例性实施例示出的一种自动加载字幕的方法的流程示意图。

图3是根据另一示例性实施例示出的一种自动加载字幕的方法的流程示意图。

图4是根据再一示例性实施例示出的一种自动加载字幕的方法的流程示意图。

图5是根据一示例性实施例示出的一种自动加载字幕的方法对应的显示界面的示意图。

图6是根据另一示例性实施例示出的一种自动加载字幕的方法对应的显示界面的示意图。

图7是根据又一示例性实施例示出的一种自动加载字幕的方法的流程示意图。

图8是根据另一示例性实施例示出的一种自动加载字幕的方法的流程示意图。

图9是根据一示例性实施例示出的一种自动加载字幕的装置的结构框图。

图10是根据另一示例性实施例示出的一种自动加载字幕的装置的结构框图。

图11是根据再一示例性实施例示出的一种自动加载字幕的装置的结构框图。

图12是根据一示例性实施例示出的一种用于执行自动加载字幕的方法的电子设备的结构框图。

具体实施方式

相关技术中，在编辑视频的过程中，需要用户手动添加或者粘贴字幕文本，添加字幕的效率较低。

图1是根据一示例性实施例示出的一种实施环境的架构图，如图1所示，下述自动加载字幕的方法应用于该实施环境中。该实施环境包括电子设备01和服务器02。其中，电子设备01和服务器02通过网络互连并通信。

其中，电子设备01为显示第一字幕信息的设备。电子设备01从服务器02获取对应的第一字幕信息，并在视频编辑界面中显示该第一字幕信息。或者，电子设备01生成第一字幕信息，显示该第一字幕信息。

电子设备01是任一种可与用户通过键盘、触摸板、触摸屏、遥控器、语音交互或手写设备等一种或多种方式进行人机交互的电子产品，例如电子设备为手机、平板电脑、掌上电脑、个人计算机(Personal Computer，PC)、可穿戴设备、智能电视等。

服务器02是一台服务器，或者是由多台服务器组成的服务器集群，或者是一个云计算服务中心。服务器02包括处理器、存储器以及网络接口等。

本领域技术人员应能理解上述电子设备和服务器仅为举例，其他现有的或今后可能出现的电子设备或服务器如可适用于本公开，也应包含在本公开保护范围以内，并在此以引用方式包含于此。

基于图1所示的实施环境，本公开的实施例提供了一种自动加载字幕的方法、装置、电子设备以及非易失性存储介质。

本公开实施例提供的显示方法的执行主体为上述的电子设备或者服务器，或者为该电子设备或者服务器中能够实现该视频内容显示方法的功能模块和/或功能实体，能够根据实际使用需求确定，本公开实施例不作限定。下面以执行主体为电子设备为例，对本公开实施例提供的自动加载字幕的方法进行示例性的说明。

图2是根据一示例性实施例示出的一种自动加载字幕的方法的流程图，如图2所示，该自动加载字幕的方法应用于电子设备中，包括以下步骤：

在步骤210中，响应于用于复制第一文字信息的第一预定操作，获取第一文字信息。

其中，第一预定操作为用于复制第一文字信息的任何单个操作，或者为一系列操作形成的操作组。在该电子设备为个人计算机的情况下，该第一预定操作为键鼠操作，例如，第一预定操作为“Ctrl+C”的键鼠操作。在该电子设备为手机或者PAD等设备时，该第一预定操作为点击操作或者长按操作等。

其中，第一预定操作可称为第一操作，上述步骤210，也即是电子设备响应于第一操作，获取第一文字信息，该第一操作用于复制第一文字信息。

在一些实施例中，电子设备响应于第一操作，将复制的第一文字信息存储在内存区域中，在对目标视频进行编辑时，从该内存区域中获取该第一文字信息。其中内存区域用于存储通过对目标文字进行复制操作得到的文字信息。

在步骤220中，在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息。即根据第一文字信息生成第一字幕信息，并将该第一字幕信息显示在视频编辑区域的第一字幕区域中。

本公开实施例中，首先，响应于用于复制第一文字信息的第一预定操作，获取第一文字信息；之后，根据该第一文字信息在视频编辑界面上显示第一字幕信息。该方案中，根据复制的文字，在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率较高。

在实际的应用过程中，在存在多个复制文字信息的预定操作，且复制的多个文字信息中的部分文字信息用于视频的字幕的情况下，为了提高字幕的准确率，先在编辑界面上显示提示信息，基于显示的提示信息获取第一文字信息，下面通过图3所示的实施例对获取文字信息的过程进行说明。如图3所示，该自动加载字幕的方法应用于电子设备中，包括以下步骤：

在步骤310中，响应于第一预定操作，在视频编辑界面上显示提示信息，该提示信息用于提醒是否根据第一文字信息确定第一字幕信息。即该提示信息用于提醒是否基于第一文字信息生成第一字幕信息。实际的应用过程中，该提示信息为提示弹窗，该提示弹窗显示有“系统检测到您进行了文字复制，是否自动添加为字幕”。当然，并不限于显示有上述文字的提示弹窗，还能够为其他在视频编辑器中的规定的提示信息，例如，该提示信息为一个显示有“copy？”的矩形图标。本领域技术人员能够根据实际情况设置合适的提示信息，例如提示信息为提示图标等。

在步骤320中，响应于作用在提示信息上的第二预定操作，获取第一文字信息。该第二预定操作为点击操作、长按操作、双击操作和滑动操作中的至少一个，根据实际情况来确定。在接收到作用在该提示信息上的第二预定操作的情况下，即能够确定根据第一文字信息来确定第一字幕信息，因而，基于该第二预定操作，获取第一文字信息。

其中，第一预定操作可称为第一操作，第二预定操作可称为第二操作，上述步骤302，也即是响应于第一操作，在视频编辑界面上显示提示信息，响应于作用在提示信息上的第二操作，获取第一文字信息。

在步骤330中，在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息。该步骤330的实施方式与上述步骤220的实施方式同理。

在一些实施例中，电子设备需要先生成第一字幕信息，再在第一字幕区域显示该第一字幕信息，下面通过图4所示的实施例对确定第一字幕信息的过程进行说明。如图4所示，该自动加载字幕的方法应用于电子设备中，包括以下步骤：

在步骤410中，响应于用于复制第一文字信息的第一预定操作，获取第一文字信息。该步骤410的实施方式与上述步骤210的实施方式同理。

在步骤420中，根据第一文字信息确定第一字幕信息。

在步骤430中，在第一字幕区域显示第一字幕信息。

在实际的应用过程中，在一些实施例中，例如，在第一文字信息按照预定方式显示时的时长和正在编辑的视频的时长一致的情况下，或者，在虽然第一文字信息按照预定方式显示时的时长相对正在编辑的视频的时长较短，但是，该视频仅部分需要字幕的情况中，第一文字信息为第一字幕信息，也即是在第一文字信息按照预定方式显示的时长小于正在编辑的视频的时长，且只需对视频中的视频片段添加字幕的情况下，将第一文字信息确定为第一字幕信息。对应地，上述步骤420包括：将第一文字信息确定为第一字幕信息。

在一些实施例中，第一文字信息不能满足第一字幕信息对应的需求，第一文字信息作为第一字幕信息中的一部分，为了进一步准确、高效且完整地显示第一字幕信息，上述步骤420包括：确定第一文字信息按照预定方式显示的预定时长是否小于正在编辑的视频的时长；在预定时长小于视频的时长的情况下，将第一文字信息与字幕数据库中的预定字幕段进行比较，其中，字幕数据库包括多个预定字幕段；在第一文字信息与目标部分的相似度大于第一预定阈值的情况下，根据正在编辑的视频的长度，确定目标字幕段的包括目标部分的至少部分为第一字幕信息，其中，目标部分为目标字幕段中与第一文字信息的预定时长相同的一部分，目标字幕段为多个预定字幕段中包括目标部分的一个。该方案中，根据第一文字信息自动补全正在编辑的视频对应的第一字幕信息。

例如，第一文字信息为“曾经有一份真诚的爱情放在我面前，我没有珍惜”，字幕数据库为电影中的经典台词片段的数据库，其中的一个预定字幕段为“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此，如果上天能够给我一个再来一次的机会，我会对那个女孩子说三个字，我爱你，如果非要在这份爱上加上一个期限，我希望是一万年”，这个预定字幕片段就是目标字幕片段，其中的目标部分为的“曾经有一份真诚的爱情放在我面前，我没有珍惜”，如果第一预定阈值为90％，目标部分和第一文字信息的相似度为100％大于第一预定阈值，因此，能够确定预定字幕段“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此，如果上天能够给我一个再来一次的机会，我会对那个女孩子说三个字，我爱你，如果非要在这份爱上加上一个期限，我希望是一万年”为目标字幕段，后续根据编辑的视频的时长来确定对应的第一字幕信息，首先确定编辑的视频时长与该目标字幕段按照预定方式显示的时长是否相同，如果相同，则确定目标字幕段为第一字幕信息。如果编辑的视频时长大于该目标字幕段按照预定方式显示的时长，则根据该目标字幕段作为第一字幕信息，并根据编辑的视频的时长来调整对应的第一字幕信息的显示方式，例如，一句话对应的显示时长为2s，为了使得第一字幕信息的显示时长和视频的时长相同，则将一句话的显示时长增加。如果编辑的视频时长小于该目标字幕段按照预定方式显示的时长，则将目标字幕段的包括目标部分的且时长与编辑的视频时长相同的部分作为第一字幕信息，结合视频的语音信息和目标部分来截取目标字幕段的部分作为第一字幕信息。

在一些实施例中，字幕数据库实际上就是一个素材库，其中的预定字幕段为电影中经典片段的台词，或者为网路上流行的经典的段子，或者为诗词库等其他任何合适的文字片段，本领域技术人员根据实际情况选择合适的字幕数据库。

当然，实际的应用过程中，该方法还包括构建字幕数据库的步骤，该构建过程能够参考其他的语言数据库的构建过程，此处就不再赘述了。

在一些实施例中，字幕数据库中的预定字幕段可称为字幕段，第一预定阈值可称为第一阈值，目标部分可称为参考文字信息，预定时长可称为第一时长，预定方式可称为目标方式。电子设备基于第一文字信息，生成第一字幕信息，包括：电子设备对比第一文字信息与字幕数据库中的多个字幕段；在第一文字信息与参考文字信息的相似度大于第一阈值的情况下，从多个字幕段中选取目标字幕段；基于目标字幕段和正在编辑的视频，确定第一字幕信息。其中，字幕数据库包括多个字幕段，目标字幕段为多个字幕段中包括参考文字信息的任一字幕段，第一文字信息对应的第一时长等于参考文字信息对应的第二时长，第一时长为第一文字信息按照目标方式显示的时长，第二时长为参考文字信息按照目标方式显示的时长。目标方式为字幕信息的显示方式，例如，目标方式是指每个字的显示时长固定，基于字幕信息包括的字数确定字幕信息显示的时长，或者目标方式为其他方式，本公开对目标方式不做限制。

在一些实施例中，对于每个字幕段，电子设备基于第一文字信息，确定该字幕段中按照目标方式显示的时长与第一时长相同的文字信息，确定的文字信息即为参考文字信息，之后确定第一文字信息与该参考文字信息的相似度。其中，一个字幕段包括一个或多个参考文字信息。

在一些实施例中，在第一时长小于视频的时长的情况下，对比第一文字信息与多个字幕段；而在第一时长大于正在编辑的视频的时长的情况下，将该第一文字信息确定为第一字幕信息，即可满足视频的字幕需求，无需再将第一文字信息与字幕数据库中的多个字幕段进行对此。

在一些实施例中，至少部分可称为目标文字信息。基于视频的时长与目标字幕段按照目标方式显示的时长之间的关系，确定是将完整的目标字幕段作为第一字幕信息，还是将目标字幕段中的部分文字信息作为第一字幕信息。也即是在视频的时长等于目标字幕段按照目标方式显示的时长的情况下，将目标字幕段确定为第一字幕信息。例如，视频的时长为5秒，目标字幕段按照目标方式显示的时长为5秒，此时直接将目标字幕段确定为第一字幕信息。在视频的时长大于目标字幕段按照目标方式显示的时长的情况下，将目标字幕段确定为第一字幕信息，之后还需要调整目标字幕段显示时的目标方式，以使目标字幕段按照调整后的目标方式显示的时长等于视频的时长。

在视频的时长小于目标字幕段按照目标方式显示的时长的情况下，从目标字幕段中选取目标文字信息，将目标文字信息确定为第一字幕信息，该目标文字信息包括参考文字信息，且目标文字信息按照目标方式显示的时长等于视频的时长。例如，视频的时长为4秒，目标字幕段“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此，如果上天能够给我一个再来一次的机会，我会对那个女孩子说三个字，我爱你，如果非要在这份爱上加上一个期限，我希望是一万年”对应的时长为10秒，参考文字信息为“曾经有一份真诚的爱情放在我面前，我没有珍惜”，视频的时长小于目标字幕段对应的时长，此时，从目标字幕段中选取包括参考文字信息，且对应的时长为4秒的目标文字信息，即选取出目标文字信息“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此”。

为了更加精确地在第一字幕区域中显示第一字幕信息，在一些实施例中，在第一字幕区域显示第一字幕信息步骤包括：确定第一字幕子区域的位置信息，位置信息包括长度和起始位置，第一字幕子区域的长度为第一字幕子区域的显示长度，第一字幕子区域的长度表征第一字幕子区域中的第一字幕段对应的视频时长，第一字幕子区域的起始位置表征第一字幕段对应的第一个视频帧图像，根据位置信息就能够确定该第一字幕段对应的视频帧图像为哪些，其中，第一字幕段为根据第一字幕信息划分得到的；根据位置信息，在第一字幕区域显示多个第一字幕子区域，即根据第一字幕子区域的长度和起始位置，显示对应的第一字幕子区域，第一字幕段一一对应地位于第一字幕子区域中，如图5所示。

也就是说，电子设备分别确定第一字幕区域中每个第一字幕子区域的位置信息，基于每个第一字幕子区域的位置信息，在每个第一字幕子区域显示对应的第一字幕段。其中，每个第一字幕子区域中显示一个对应的第一字幕段。

在一些实施例中，视频编辑界面还包括图像区域，图像区域显示有多个视频帧图像，多个视频帧图像沿着预定方向依次排列，多个第一字幕子区域沿着预定方向依次排列，一个第一字幕子区域的位于对应的多个视频帧图像的一侧，多个视频帧图像和其对应的第一字幕子区域对应显示，预定方向为第一字幕子区域的长度方向。第一字幕子区域的起始位置与对应的多个视频帧图像中的第一个视频帧图像的起始位置对齐，即第一字幕子区域的起始位置在视频帧图像区域的投影位于第一个视频帧图像的起始边上。第一字幕子区域的长度与对应的多个视频帧图像的显示长度相同。第一字幕子区域的起始位置在视频帧图像区域的投影位于对应的多个视频帧图像的第一个视频帧图像内，第一字幕子区域的长度小于对应的多个视频帧图像的显示总长度。如图5所示，第一字幕子区域510的一侧五个视频帧图像520就是该第一字幕子区域中的第一字幕段对应的五个视频帧图像530。

在一些实施例中，预定方向可称为目标方向，视频编辑界面中多个视频帧图像和多个第一字幕子区域的显示方式包括：电子设备在视频编辑界面的图像区域中，沿着目标方向显示多个视频帧图像，该目标方向为第一字幕子区域的长度方向；在第一字幕区域中，沿着目标方向显示多个第一字幕子区域，第一字幕子区域位于对应的多个视频帧图像的一侧。例如，如图5所示，第一字幕子区域的长度方向是从左向右的方向，多个视频帧图像即是从左向右依次显示的，多个第一字幕子区域即是从左向右依次显示的。

当然，实际的应用过程中，第一字幕子区域并不限于图5所示的位于视频帧图像的一侧(以面对屏幕的视角观看图5，以下的上侧、左侧和右侧均以该视角观察)，还能够位于视频帧图像的上侧。

需要说明的是，第一字幕子区域的还显示在其他的显示位置，例如，第一字幕子区域位于对应的多个视频帧图像的左侧或者右侧。图像帧显示的区域为主轨道，字幕显示的区域为副轨道，副轨道和主轨道在垂直于预定方向的方向上分布，参见图5所示，图5中的第一字幕区域530为副轨道，帧图像区域540为主轨道。

为了更准确地确定第一字幕子区域的位置信息，从而更加准确地显示第一字幕段，在一些实施例中，确定第一字幕子区域的位置信息步骤还包括：将第一字幕信息分为多个第一字幕段，例如，一句话划分为一个第一字幕段；获取正在编辑的视频的时长；根据第一字幕段的数量和时长，确定每个第一字幕子区域的长度。由于第一字幕子区域的长度表征其对应的视频的时长，所以根据视频的时长和第一字幕段的数量，能够确定每个第一字幕子区域中的第一字幕段对应的视频时长，根据第一字幕段对应的视频时长，即可确定该第一字幕段对应的视频帧图像的数量，从而根据对应的视频帧图像的数量确定对应的第一字幕子区域的长度。

在一些实施例中，第一字幕子区域的长度等于该第一字幕子区域对应的多个视频帧图像的显示总长度，或者第一字幕子区域的长度小于对应的多个视频帧图像的显示总长度；确定第一字幕区域的起始点为第一个第一字幕子区域的起始位置，其他的第一字幕子区域的起始位置在前一个第一字幕子区域的终止位置，这里的“之后”是指在第一字幕子区域的长度方向上的之后，相邻的两个第一字幕段的分布间隔根据实际情况确定，在一些实施例中，相邻的两个第一字幕段接触，即间隔距离为0，或者相邻的两个第一字幕段不接触，间隔距离大于0。

也即是电子设备将第一字幕区域的起始点确定为第一个字幕子区域的起始位置，将任一第一字幕子区域的终止位置确定为下一个第一字幕子区域的起始位置，或者将任一字幕子区域的终止位置之后的位置确定为下一个字幕子区域的起始位置。即相邻的两个第一字幕子区域之间间隔目标距离，在目标距离为0的情况下，当前第一字幕子区域的终止位置即为下一个第一字幕子区域的起始位置，在目标大于0的情况下，当前第一字幕子区域的终止位置之后、与该终止距离间隔目标距离的位置即为下一个第一字幕子区域的起始位置。

为了更准确且高效地确定第一字幕段对应的视频帧图像，在一些实施例中，根据第一文字信息确定第一字幕信息步骤包括：获取正在编辑的视频的语音内容对应的文字内容；确定第一文字信息与文字内容的相似度是否大于第二预定阈值；在第一文字信息与文字内容的相似度大于第二预定阈值的情况下，确定文字内容为第一字幕信息。

在一些实施例中，确定第一字幕子区域的位置信息步骤包括：根据文字内容与视频帧图像的对应关系，确定第一字幕段的位置信息。其中文字内容与语音内容有对应关系，语音内容与视频帧图像有对应关系，因此，文字内容和视频帧图像具有对应关系，根据该对应关系，更加准确地确定每一部分的文字内容(第一字幕段)对应的视频帧图像，从而更准确地确定第一字幕子区域的位置信息，即确定第一字幕子区域的起始位置和长度，第一字幕子区域的起始位置与对应的第一个帧图像的起始位置对应，或者在第一个帧图像的起始位置之后，第一字幕子区域的长度与对应的多个帧图像的显示总长度相同，或者小于对应的多个帧图像的显示总长度。

在实际的应用过程中，在一些实施例中，在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，上述方法还包括：响应于作用在第一目标字幕子区域上的第三预定操作，第一目标字幕子区域的起始位置从初始位置变更至预定位置。通过调整第一目标字幕子区域的起始位置，进而调整第一目标字幕子区域的显示位置，进一步保证调整后的第一目标字幕子区域的显示位置更加准确，从而进一步保证第一目标字幕子区域中的第一字幕段对应的视频时长以及视频帧图像更加准确。

其中，第三预定操作可称为第三操作，预定位置可称为目标位置。电子设备在第一字幕区域显示第一字幕信息之后，响应于作用在第一目标字幕子区域的第三操作，将第一目标字幕子区域的起始位置变更至目标位置。其中，目标位置与起始位置不同，第三操作为对第一目标字幕子区域的拖动操作、拉伸操作或其他操作，本公开实施例对第三操作的操作方式不做限制。

在一些实施例中，在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，上述方法还包括：响应于作用在第二目标字幕子区域上的第四预定操作，第二目标字幕子区域的长度从初始长度变为预定长度，且第二目标字幕子区域对应的视频帧图像的数量从第一预定数量变为第二预定数量。通过该方式，调整第二目标字幕子区域的显示位置，从而进一步保证调整后的第二目标字幕子区域的显示位置更加准确，从而进一步保证第二目标字幕子区域中的第一字幕段对应的视频时长以及视频帧图像更加准确。

其中，第四预定操作可称为第四操作，预定长度可称为目标长度，电子设备在第一字幕区域显示第一字幕信息后，响应于作用在第二目标字幕子区域上的第四操作，将第二目标字幕子区域的长度变为目标长度。其中，第二目标字幕子区域的原长度与目标长度不同，第四操作为拉伸操作或其他操作，本公开实施例对第四操作的操作方式不做限制。

在一些实施例中，在视频需要加载双字幕的情况下，例如在视频需要加载中文字幕和英文字幕的情况下，为了更好地对视频的字幕进行加载，在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，上述方法还包括：响应于复制第二文字信息的第五预定操作，获取第二文字信息，也即是电子设备响应于第五操作，获取第二文字信息，该第五操作用于复制第二文字信息；根据第二文字信息，在视频编辑界面的第二字幕区域显示第二字幕信息。其中，第二字幕信息是基于第二文字信息生成的，该第二字幕区域位于第的任一侧，能够根据实际情况进行设置。在一些实施例中，如图6所示，第二字幕区域610位于第一字幕区域620远离视频帧图像区域630的一侧。

还需要说明的是，本公开实施例中的第二字幕信息的显示过程能够参考关于第一字幕信息的显示过程的描述，此处就不再赘述了。

在一些实施例中，在视频的字幕加载完之后，上述方法还包括：响应于第五预定操作，播放包括第一字幕信息的视频。也即是电子设备响应于第六操作，播放包括第一字幕信息的视频。

图7是根据一示例性实施例示出的一种自动加载字幕的方法的流程图，如图7所示，该自动加载字幕的方法应用于电子设备中，包括以下步骤710-步骤730。

在步骤710中，检测是否存在用于复制第一文字信息的第一预定操作。也即是检测是否存在第一操作，该第一操作用于复制第一文字信息。

在步骤720中，在检测到第一预定操作的情况下，获取第一文字信息。

在步骤730中，基于第一文字信息生成第一字幕信息，并在视频编辑界面的字幕区域显示第一字幕信息。

本公开实施例提供的方法中，在检测到第一预定操作的情况下，在在视频编辑界面的字幕区域显示基于第一文字信息生成的第一字幕信息。该方案中，根据复制的文字，在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率。

上述步骤720的实施过程和步骤730的实施过程与上述步骤210和220的实施过程同理，此处就不再赘述了。

图8是根据一示例性实施例示出的一种自动加载字幕的方法的流程图，如图8所示，该自动加载字幕的方法应用于电子设备中，包括以下步骤810-步骤820。

在步骤810中，在对目标视频进行编辑时，从用于存储文本信息的内存区域中获取第一文本信息，其中，内存区域用于存储通过对目标文本进行复制操作(第一预定操作)得到的文本信息。

其中，第一文本信息可称为第一文字信息，目标文本可称为目标文字。上述步骤801也即是，在对目标视频进行编辑时，从内存区域中获取第一文字信息，其中内存区域用于存储通过对目标文字进行复制操作得到的文字信息。其中，目标视频为任一视频，目标文字为任意可被复制的文字。

在一些实施例中，内存区域中存储的文字信息是在对目标视频进行编辑之前，通过对目标文字进行复制操作得到的，或者是在对目标视频进行编辑的过程中，通过对目标文字进行复制操作得到的，本公开实施例对内存区域中文字信息的存储时间不做限制。

在步骤820中，基于第一文本信息生成第一字幕信息，并在视频编辑界面的第一字幕区域展示第一字幕信息。也即是基于第一文字信息，生成第一文字信息对应的第一字幕信息，在视频编辑几面的第一字幕区域显示第一字幕信息。

本公开实施例中，根据复制得到的第一文本信息来生成第一字幕信息，并且，将对应的第一字幕信息显示在第一字幕区域中。该方案中，根据复制的文字，在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率。

上述步骤810的实施过程和步骤820的实施过程与上述步骤210和220的实施过程同理，此处就不再赘述了。不同的是，步骤810中是从内存区域中获取存储的第一文字信息，而步骤210则是对第一文字信息进行复制操作，获取第一文字信息。

需要说明的是，本公开实施例中的第一预定操作、第二预定操作、第三预定操作、第四预定操作以及第五预定操作均能够为任何可行的操作，例如包括点击操作、滑动操作、长按操作与双击操作中的至少一个的操作。本领域技术人员根据实际情况选择合适的操作或者操作组合来对应于本公开的五个预定操作。

图9是根据一示例性实施例示出的一种自动加载字幕的装置框图。参照图9，该装置包括第一获取单元910和第一显示单元920。

该第一获取单元910被配置为执行响应于用于复制第一文字信息的第一预定操作，获取第一文字信息。也即是第一获取单元910被配置为执行响应于第一操作，获取第一文字信息，第一操作用于复制第一文字信息。

该第一显示单元920被配置为执行在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息。也即是第一显示单元920被配置为在视频编辑界面的第一字幕区域显示第一字幕信息，第一字幕信息是基于第一文字信息生成的。

上述的方案中，根据复制的文字，在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率。

在实际的应用过程中，在存在多个复制文字信息的预定操作，且复制的多个文字信息中，的部分文字信息是用于视频的字幕的情况下，为了提高字幕的准确率，本公开实施例中，第一获取单元包括第一显示模块和获取模块。

第一显示模块被配置为执行响应于第一预定操作，在视频编辑界面上显示提示信息，该提示信息用于提醒是否根据第一文字信息确定第一字幕信息，即该提示信息用于提醒是否基于第一文字信息生成第一字幕信息。实际的应用过程中，该提示信息为提示弹窗，该提示弹窗显示有“系统检测到您进行了文字复制，是否自动添加为字幕”。当然，并不限于显示有文字的提示弹窗，还为其他在视频编辑器中的规定的提示信息，例如，该提示信息为一个显示有“copy？”的矩形图标。本领域技术人员能够根据实际情况设置合适的提示信息。

获取模块被配置为执行响应于作用在提示信息上的第二预定操作，获取第一文字信息。该第二预定操作为点击操作、长按操作、双击操作和滑动操作中的至少一个，根据实际情况来确定。在接收到在该提示信息上的第二预定操作的情况下，即能够确定根据第一文字信息来确定第一字幕信息，因而，基于该第二预定操作，获取第一文字信息。

也即是获取模块被配置为执行响应于第一操作，在视频编辑界面上显示提示信息，响应于作用在提示信息上的第二操作，获取第一文字信息。

第一显示单元包括确定模块和第二显示模块，其中，确定模块被配置为执行根据第一文字信息确定第一字幕信息；第二显示模块被配置为执行在第一字幕区域显示第一字幕信息。

在实际的应用过程中，在一些实施例中，例如，在第一文字信息按照预定方式显示时的时长和正在编辑的视频的时长一致的情况下，或者，在虽然第一文字信息按照预定方式显示时的时长相对正在编辑的视频的时长较短，但是，该视频仅部分需要字幕的情况中，第一文字信息为第一字幕信息，也即是第一文字信息按照预定方式显示的时长小于正在编辑的视频的时长，且只需对视频中的视频片段添加字幕的情况下，将第一文字信息确定为第一字幕信息。对应地，确定模块被配置为执行确定第一文字信息为第一字幕信息，也即是确定模块被配置为执行将第一文字信息确定为第一字幕信息。

在一些实施例中，第一文字信息不能满足第一字幕信息对应的需求，第一文字信息作为第一字幕信息中的一部分，为了进一步准确、高效且完整地显示第一字幕信息，本确定模块还包括第一确定子模块、第二确定子模块和第三确定子模块，其中，第一确定子模块被配置为执行确定第一文字信息按照预定方式显示的预定时长是否小于正在编辑的视频的时长；第二确定子模块被配置为执行在预定时长小于视频的时长的情况下，将第一文字信息与字幕数据库中的预定字幕段进行比较，其中，字幕数据库包括多个预定字幕段；第三确定子模块被配置为执行在第一文字信息与目标部分的相似度大于第一预定阈值的情况下，根据正在编辑的视频的长度，确定目标字幕段的包括目标部分的至少部分为第一字幕信息，其中，目标部分为目标字幕段中与第一文字信息的预定时长相同的一部分，目标字幕段为多个预定字幕段中包括目标部分的一个。该方案中，根据第一文字信息自动补全正在编辑的视频对应的第一字幕信息。

例如，第一文字信息为“曾经有一份真诚的爱情放在我面前，我没有珍惜”，字幕数据库为电影中的经典台词片段的数据库，其中的一个预定字幕段为“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此，如果上天能够给我一个再来一次的机会，我会对那个女孩子说三个字，我爱你，如果非要在这份爱上加上一个期限，我希望是一万年”，这个预定字幕片段就是目标字幕片段，其中的目标部分为的“曾经有一份真诚的爱情放在我面前，我没有珍惜”，如果第一预定阈值为90％，目标部分和第一文字信息的相似度为100％大于第一预定阈值，因此，能够确定预定字幕段为“曾经有一份真诚的爱情放在我面前，我没有珍惜，等我失去的时候我才后悔莫及，人世间最痛苦的事莫过于此，如果上天能够给我一个再来一次的机会，我会对那个女孩子说三个字，我爱你，如果非要在这份爱上加上一个期限，我希望是一万年”为目标字幕段，后续根据编辑的视频的时长来确定对应的第一字幕信息，首先确定编辑的视频时长与该目标字幕段按照预定方式显示的时长是否相同，如果相同，则确定目标字幕段为第一字幕信息。如果编辑的视频时长大于该目标字幕段按照预定方式显示的时长，则根据该目标字幕段作为第一字幕信息，并根据编辑的视频的时长来调整对应的第一字幕信息的显示方式，例如，一句话对应的显示时长为2s，为了使得第一字幕信息的显示时长和视频的时长相同，则能够将一句话的显示时长增加。如果编辑的视频时长小于该目标字幕段按照预定方式显示的时长，则将目标字幕段的包括目标部分的且时长与编辑的视频时长相同的部分作为第一字幕信息，结合视频的语音信息和目标部分来截取目标字幕段的部分作为第一字幕信息。

在一些实施例中，上述的字幕数据库实际上就是一个素材库，其中的预定字幕段为电影中经典片段的台词，或者为网路上流行的经典的段子，或者为诗词库等其他任何合适的文字片段，本领域技术人员根据实际情况选择合适的字幕数据库。

当然，实际的应用过程中，该方法还包括构建字幕数据库的步骤，该构建过程参考其他的语言数据库的构建过程，此处就不在赘述了。

也即是第二确定子模块被配置为执行对比第一文字信息与字幕数据库中的多个字幕段；第三确定子模块，被配置为执行在第一文字信息与参考文字信息的相似度大于第一阈值的情况下，从多个字幕段中选取目标字幕段；第三确定子模块，还被配置为执行基于目标字幕段和正在编辑的视频，确定第一字幕信息。其中，字幕数据库包括多个字幕段，目标字幕段为多个字幕段中包括参考文字信息的任一字幕段，第一文字信息对应的第一时长等于参考文字信息对应的第二时长，第一时长为第一文字信息按照目标方式显示的时长，第二时长为参考文字信息按照目标方式显示的时长。

在一些实施例中，第二确定子模块，被配置为执行在第一时长小于视频的时长的情况下，对比第一文字信息与多个字幕段。

在一些实施例中，第三确定子模块，被配置为执行在视频的时长小于目标字幕段按照目标方式显示的时长的情况下，从目标字幕段中选取目标文字信息，将目标文字信息确定为第一字幕信息，目标文字信息包括参考文字信息，且目标文字信息按照目标方式显示的时长等于视频的时长；在视频的时长不小于目标字幕段按照目标方式显示的时长的情况下，将目标字幕段确定为第一字幕信息。

为了更加精确地在第一字幕区域中显示第一字幕信息，在一些实施例中，第二显示模块包括第四确定子模块和第一显示子模块。

其中，第四确定子模块被配置为执行确定第一字幕子区域的位置信息，位置信息包括长度和起始位置，第一字幕子区域的长度为第一字幕子区域的显示长度，第一字幕子区域的长度表征第一字幕子区域中的第一字幕段对应的视频时长，第一字幕子区域的起始位置表征第一字幕段对应的第一个视频帧图像，根据位置信息就能够确定该第一字幕段对应的视频帧图像为哪些，其中，第一字幕段为根据第一字幕信息划分得到的。

第一显示子模块被配置为执行根据位置信息，在第一字幕区域显示多个第一字幕子区域，即根据第一字幕子区域的长度和起始位置，确定第一字幕子区域的长度和起始位置，第一字幕段一一对应地位于第一字幕子区域中，如图5所示。

也即是第四确定子模块被配置为执行分别确定第一字幕区域中每个第一字幕子区域的位置信息，第一显示子模块被配置为执行基于每个第一字幕子区域的位置信息，在每个第一字幕子区域显示对应的第一字幕段。

在一些实施例中，视频编辑界面还包括图像区域，图像区域显示有多个视频帧图像，多个视频帧图像沿着预定方向依次排列，多个第一字幕子区域沿着预定方向依次排列，一个第一字幕子区域的位于对应的多个的视频帧图像的一侧，多个视频帧图像和其对应的第一字幕子区域对应显示，预定方向为第一字幕子区域的长度方向。第一字幕子区域的起始位置与对应的多个视频帧图像中的第一个视频帧图像的起始位置对齐，即第一字幕子区域的起始位置在视频帧图像区域的投影位于第一个视频帧图像的起始边上。第一字幕子区域的长度与对应的多个视频帧图像的显示长度相同。第一字幕子区域的起始位置在视频帧图像区域的投影位于对应的多个视频帧图像的第一个视频帧图像内，第一字幕子区域的长度小于对应的多个视频帧图像的显示总长度。如图5所示，第一字幕子区域510的一侧五个视频帧图像520就是该第一字幕子区域中的第一字幕段对应的五个视频帧图像520。

也即是第一显示单元，还被配置为执行在视频编辑界面的图像区域中，沿着目标方向显示多个视频帧图像，该目标方向为第一字幕子区域的长度方向；在第一字幕区域中，沿着目标方向显示多个第一字幕子区域，第一字幕子区域位于对应的多个视频帧图像的一侧。

需要说明的是，第一字幕子区域的还能够显示在其他的显示位置，例如，第一字幕子区域位于对应的多个视频帧图像的左侧或者右侧。图像帧显示的区域为主轨道，字幕显示的区域为副轨道，副轨道和主轨道在垂直于预定方向的方向上分布，参见图5所示，图5中的第一字幕区域530为副轨道，帧图像区域540为主轨道。

为了更准确地确定第一字幕子区域的位置信息，从而更加准确地显示第一字幕段，在一些实施例中，第四确定子模块包括划分子模块、第一获取子模块、第五确定子模块和第六确定子模块。

其中，划分子模块被配置为执行将第一字幕信息分为多个第一字幕段，例如，一句话划分为一个第一字幕段。

第一获取子模块被配置为执行获取正在编辑的视频的时长。

第五确定子模块被配置为执行根据第一字幕段的数量和时长，确定每个第一字幕子区域的长度。由于第一字幕子区域的长度表征其对应的视频的时长，所以根据视频的时长和第一字幕段的数量，能够确定每个第一字幕子区域中的第一字幕段对应的视频时长，根据第一字幕段对应的视频时长，即可确定该第一字幕段对应的视频帧图像的数量，从而根据对应的视频帧图像的数量确定对应的第一字幕子区域的长度。

在一些实施例中，第一字幕子区域的长度等于该第一字幕子区域对应的多个视频帧图像的显示总长度，或者第一字幕子区域的长度小于对应的多个视频帧图像的显示总长度。

第六确定子模块被配置为执行确定第一字幕区域的起始点为第一个所述第一字幕子区域的起始位置，其他的所述第一字幕子区域的所述起始位置在前一个所述第一字幕子区域的终止位置，这里的“之后”是指在第一字幕子区域的长度方向上的之后，具体地，相邻的两个第一字幕段的分布间隔根据实际情况确定，在一些实施例中，相邻的两个第一字幕段接触，即间隔距离为0，或者相邻的两个第一字幕段不接触，间隔距离大于0。

也即是第六确定子模块被配置为执行将第一字幕区域的起始点确定为第一个字幕子区域的起始位置，将任一第一字幕子区域的终止位置确定为下一个第一字幕子区域的起始位置。

为了更准确且高效地确定第一字幕段对应的视频帧图像，在一些实施例中，确定模块包括第二获取子模块、第七确定子模块和第八确定子模块。

其中，第二获取子模块被配置为执行获取正在编辑的视频的语音内容对应的文字内容。

第七确定子模块被配置为执行确定第一文字信息与文字内容的相似度是否大于第二预定阈值。

第八确定子模块被配置为执行在第一文字信息与上述文字内容的相似度大于第二预定阈值的情况下，确定文字内容为第一字幕信息。

第四确定子模块被配置为执行根据文字内容与视频帧图像的对应关系，确定第一字幕段的位置信息，具体地，文字内容与语音内容有对应关系，语音内容与视频帧图像有对应关系，因此，文字内容和视频帧图像具有对应关系，根据该对应关系，更加准确地确定每一部分的文字内容(第一字幕段)对应的视频帧图像，从而更准确地确定第一字幕子区域的位置信息，即确定第一字幕子区域的起始位置和长度，第一字幕子区域的起始位置与对应的第一个帧图像的起始位置对应，或者在第一个帧图像的起始位置之后，第一字幕子区域的长度与对应的多个帧图像的显示总长度相同，或者小于对应的多个帧图像的显示总长度。

在实际的应用过程中，在一些实施例中，装置还包括第一调整单元，第一调整单元被配置为执行在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，响应于作用在第一目标字幕子区域上的第三预定操作，第一目标字幕子区域的起始位置从初始位置变更至预定位置。通过调整第一目标字幕子区域的起始位置，进而调整第一目标字幕子区域的显示位置，进一步保证调整后的第一目标字幕子区域的显示位置更加准确，从而进一步保证第一目标字幕子区域中的第一字幕段对应的视频时长以及视频帧图像更加准确。

也即是第一调整单元被配置为执行响应于作用在第一目标字幕子区域的第三操作，将第一目标字幕子区域的起始位置变更至目标位置。

在一些实施例中，上述装置还包括第二调整单元，第二调整单元被配置为执行在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，响应于作用在第二目标字幕子区域上的第四预定操作，第二目标字幕子区域的长度从初始长度变为预定长度，且第二目标字幕子区域对应的视频帧图像的数量从第一预定数量变为第二预定数量。通过该方式，调整第二目标字幕子区域的显示位置，从而进一步保证调整后的第二目标字幕子区域的显示位置更加准确，从而进一步保证第二目标字幕子区域中的第一字幕段对应的视频时长以及视频帧图像更加准确。

也即是第二调整单元被配置为执行响应于作用在第二目标字幕子区域上的第四操作，将第二目标字幕子区域的长度变为目标长度。

在一些实施例中，在视频需要加载双字幕的情况下，例如在视频需要加载中文字幕和英文字幕的情况下，上述装置还包括第二获取单元和第二显示单元，其中，第二获取单元被配置为执行在在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息之后，响应于复制第二文字信息的第五预定操作，获取第二文字信息，也即是第二获取单元被配置为执行响应于第五操作，获取第二文字信息，该第五操作用于复制第二文字信息；第二显示单元被配置为执行根据第二文字信息，在视频编辑界面的第二字幕区域显示第二字幕信息。其中，第二字幕信息是基于第二文字信息生成的，该第二字幕区域位于第一字幕区域的任一侧，能够根据实际情况进行设置。在一些实施例中，如图6所示，第二字幕区域610位于第一字幕区域620远离视频帧图像620的一侧。

在一些实施例中，上述装置还包括播放单元，播放单元被配置为执行在视频的字幕加载完之后，响应于第五预定操作，播放包括第一字幕信息的视频。

图10是根据一示例性实施例示出的一种自动加载字幕的装置框图，如图10所示，该自动加载字幕的装置包括检测单元1010、第二获取单元1020和第二显示单元1030。

检测单元1010被配置为执行检测是否存在用于复制第一文字信息的第一预定操作。

第二获取单元1020被配置为执行在检测到第一预定操作的情况下，获取第一文字信息。

第二显示单元1030被配置为执行基于第一文字信息生成第一字幕信息，并在视频编辑界面的字幕区域显示第一字幕信息。

本公开实施例提供的装置中，在检测到第一预定操作的情况下，第一显示单元在视频编辑界面的字幕区域显示基于第一文字信息生成的第一字幕信息。该方案中，根据复制的文字，就能够在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率。

上述的第一获取单元和第一显示单元的实施过程参考上述方案中的描述，此处就不再赘述了。

图11是根据一示例性实施例示出的一种自动加载字幕的方法的流程图，如图11所示，该自动加载字幕的方法用于电子设备中，包括第三获取单元1110和第三显示单元1120。

其中，第三获取单元1110被配置为执行在对目标视频进行编辑时，从用于存储文本信息的内存区域中获取第一文本信息，其中，内存区域用于存储通过对目标文本进行复制操作(第一预定操作)得到的文本信息。

第三显示单元1120被配置为执行基于第一文本信息生成第一字幕信息，并在视频编辑界面的第一字幕区域展示第一字幕信息。

上述的实施例中，根据复制得到的第一文本信息来生成第一字幕信息，并且，将对应的第一字幕信息显示在第一字幕区域中。该方案中，根据复制的文字，在视频编辑界面的第一字幕区域中生成第一字幕信息，提高了编辑字幕的效率。

关于上述实施例中的装置，其中各个模块执行操作的实施方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种用于执行字幕自动加载的电子设备01的框图。

在示例性实施例中，还提供了一种包括可执行指令的存储介质，例如用于存储可执行指令的存储器1210，上述指令可由电子设备01的处理器1220执行以完成上述方法。存储介质可以是非临时性计算机可读存储介质，例如，上述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本公开的实施例还提供了一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，处理器被配置为执行指令，以实现如下操作：响应于第一操作，获取第一文字信息，第一操作用于复制第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，第一字幕信息是基于第一文字信息生成的。

在一些实施例中，处理器被配置为执行指令，以实现上述方法实施例中的其他实施例提供的自动加载字幕的方法。

本公开实施例还提出了一种非易失性存储介质，当非易失性存储介质中的指令由电子设的处理器执行时，使得电子设备能够执行如下操作：响应于第一操作，获取第一文字信息，第一操作用于复制第一文字信息；在视频编辑界面的第一字幕区域显示第一字幕信息，第一字幕信息是基于第一文字信息生成的。

在一些实施例中，当非易失性存储介质中的指令由电子设的处理器执行时，使得电子设备能够执行上述方法实施例中的其他实施例提供的自动加载字幕的方法。

本公开实施例提供了一种自动加载字幕的方法，包括：响应于用于复制第一文字信息的第一预定操作，获取第一文字信息；在视频编辑界面的第一字幕区域显示基于第一文字信息生成的第一字幕信息。

在一些实施例中，根据第一文字信息确定第一字幕信息步骤包括：确定第一文字信息按照预定方式显示的预定时长是否小于正在编辑的视频的时长；在预定时长小于视频的时长的情况下，将第一文字信息与字幕数据库中的预定字幕段进行比较，其中，字幕数据库包括多个预定字幕段；在第一文字信息与目标部分的相似度大于第一预定阈值的情况下，根据正在编辑的视频的长度，确定目标字幕段的包括目标部分的至少部分为第一字幕信息，其中，目标部分为目标字幕段中与第一文字信息的预定时长相同的部分，目标字幕段为多个预定字幕段中包括目标部分的一个。

在一些实施例中，在第一字幕区域显示第一字幕信息步骤包括：确定第一字幕子区域的位置信息，位置信息包括长度和起始位置，第一字幕子区域的长度为第一字幕子区域的显示长度，第一字幕子区域的长度表征第一字幕子区域中的第一字幕段对应的视频时长，第一字幕子区域的起始位置表征第一字幕段对应的第一个视频帧图像，第一字幕段为根据第一字幕信息划分得到的；根据位置信息，在第一字幕区域显示多个第一字幕子区域，其中，一个第一字幕子区域中具有一个第一字幕段。

在一些实施例中，视频编辑界面还包括图像区域，图像区域显示有多个视频帧图像，多个视频帧图像沿着预定方向依次排列，多个第一字幕子区域沿着预定方向依次排列，一个第一字幕子区域的位于对应的多个的视频帧图像的一侧，预定方向为第一字幕子区域的长度方向。

在一些实施例中，确定第一字幕子区域的位置信息步骤还包括：将第一字幕信息分为多个第一字幕段；获取正在编辑的视频的时长；根据第一字幕段的数量和时长，确定每个第一字幕子区域的长度；确定第一字幕区域的起始点为第一个第一字幕子区域的起始位置，其他的第一字幕子区域的起始位置在前一个第一字幕子区域的终止位置。

在一些实施例中，根据第一文字信息确定第一字幕信息步骤包括：获取正在编辑的视频的语音内容对应的文字内容；确定第一文字信息与文字内容的相似度是否大于第二预定阈值；在第一文字信息与文字内容的相似度大于第二预定阈值的情况下，确定文字内容为第一字幕信息；确定第一字幕子区域的位置信息步骤包括：根据文字内容与视频帧图像的对应关系，确定第一字幕段的位置信息。

本公开实施例提供了一种自动加载字幕的方法，包括：检测是否存在用于复制第一文字信息的第一预定操作；在检测到第一预定操作的情况下，获取第一文字信息；基于第一文字信息生成第一字幕信息，并在视频编辑界面的字幕区域显示第一字幕信息。

本公开实施例提供了一种自动加载字幕的方法，包括：在对目标视频进行编辑时，从用于存储文本信息的内存区域中获取第一文本信息，其中，内存区域用于存储通过对目标文本进行复制操作得到的文本信息；基于第一文本信息生成第一字幕信息，并在视频编辑界面的第一字幕区域展示第一字幕信息。

本公开所有实施例均可以单独被执行，也可以与其他实施例相结合被执行，均视为本公开要求的保护范围。

Claims

一种自动加载字幕的方法，包括：

响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；

在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。
根据权利要求1所述的方法，其中，所述响应于第一操作，获取第一文字信息，包括：

响应于所述第一操作，在所述视频编辑界面上显示提示信息，所述提示信息用于提醒是否基于所述第一文字信息生成所述第一字幕信息；

响应于作用在所述提示信息上的第二操作，获取所述第一文字信息。
根据权利要求1所述的方法，其中，所述方法还包括：

基于所述第一文字信息，生成所述第一字幕信息。
根据权利要求3所述的方法，其中，所述基于所述第一文字信息，生成所述第一字幕信息，包括：

将所述第一文字信息确定为所述第一字幕信息。
根据权利要求3所述的方法，其中，所述基于所述第一文字信息，生成所述第一字幕信息，包括：

对比所述第一文字信息与字幕数据库中的多个字幕段；

在所述第一文字信息与参考文字信息的相似度大于第一阈值的情况下，从多个所述字幕段中选取目标字幕段，其中所述目标字幕段为多个所述字幕段中包括所述参考文字信息的字幕段，所述第一文字信息对应的第一时长等于所述参考文字信息对应的第二时长，所述第一时长为所述第一文字信息按照目标方式显示的时长，所述第二时长为所述参考文字信息按照所述目标方式显示的时长；

基于所述目标字幕段和正在编辑的视频，确定所述第一字幕信息。
根据权利要求5所述的方法，其中，所述基于所述目标字幕段和正在编辑的视频，确定所述第一字幕信息，包括：

在所述视频的时长小于所述目标字幕段按照所述目标方式显示的时长的情况下，从所述目标字幕段中选取目标文字信息，将所述目标文字信息确定为所述第一字幕信息，所述目标文字信息包括所述参考文字信息，且所述目标文字信息按照所述目标方式显示的时长等于所述视频的时长；

在所述视频的时长不小于所述目标字幕段按照所述目标方式显示的时长的情况下，将所述目标字幕段确定为所述第一字幕信息。
根据权利要求5所述的方法，其中，所述对比所述第一文字信息与字幕数据库中的多个字幕段，包括：

在所述第一时长小于所述视频的时长的情况下，对比所述第一文字信息与多个所述字幕段。
根据权利要求3所述的方法，其中，所述在视频编辑界面的第一字幕区域显示所述第一字幕信息，包括：

分别确定所述第一字幕区域中每个第一字幕子区域的位置信息，所述位置信息包括长度和起始位置，所述第一字幕子区域的长度表征所述第一字幕子区域中第一字幕段对应的视频时长，所述第一字幕子区域的起始位置表征所述第一字幕段对应的第一个视频帧图像，所述第一字幕段为基于所述第一字幕信息划分得到的；

基于每个所述第一字幕子区域的位置信息，在每个所述第一字幕子区域显示对应的所述第一字幕段。
根据权利要求8所述的方法，其中，所述方法还包括：

在所述视频编辑界面的图像区域中，沿着目标方向显示多个视频帧图像，所述目标方向为所述第一字幕子区域的长度方向；

在所述第一字幕区域中，沿着所述目标方向显示多个所述第一字幕子区域，所述第一字幕子区域位于对应的多个所述视频帧图像的一侧。
根据权利要求8所述的方法，其中，所述分别确定所述第一字幕区域中每个第一字幕子区域的位置信息，包括：

将所述第一字幕信息分为多个所述第一字幕段；

获取正在编辑的视频的时长；

基于所述第一字幕段的数量和所述时长，确定每个所述第一字幕子区域的长度；

将所述第一字幕区域的起始点确定为第一个所述第一字幕子区域的所述起始位置，将任一所述第一字幕子区域的终止位置确定为下一个所述第一字幕子区域的所述起始位置。
根据权利要求8所述的方法，其中，所述基于所述第一文字信息，生成所述第一字幕信息，包括：

获取正在编辑的所述视频的语音内容对应的文字内容；

确定所述第一文字信息与所述文字内容的相似度；

在所述第一文字信息与所述文字内容的相似度大于第二阈值的情况下，将所述文字内容确定为所述第一字幕信息；

所述分别确定所述第一字幕区域中每个第一字幕子区域的位置信息，包括：

基于所述文字内容与每个所述视频帧图像的对应关系，确定每个所述第一字幕子区域的所述位置信息。
根据权利要求1至11中任一项所述的方法，其中，所述方法还包括：

响应于作用在第一目标字幕子区域的第三操作，将所述第一目标字幕子区域的起始位置变更至目标位置。
根据权利要求1至11中任一项所述的方法，其中，所述方法还包括：

响应于作用在第二目标字幕子区域上的第四操作，将所述第二目标字幕子区域的长度变为目标长度。
根据权利要求1至11中任一项所述的方法，其中，所述方法还包括：

响应于第五操作，获取第二文字信息，所述第五操作用于复制所述第二文字信息；

基于所述第二文字信息，在所述视频编辑界面的第二字幕区域显示第二字幕信息，所述第二字幕区域位于所述第一字幕区域的一侧，所述第二字幕信息是基于所述第二文字信息生成的。
根据权利要求1-11任一项所述的方法，其中，所述响应于第一操作，获取第一文字信息，包括：

响应于所述第一操作，将复制的所述第一文字信息存储在内存区域中；

在对目标视频进行编辑时，从所述内存区域中获取所述第一文字信息。
一种自动加载字幕的装置，包括：

第一获取单元，被配置为执行响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；

第一显示单元，被配置为执行在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。
一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；

在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。
根据权利要求17所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于所述第一操作，在所述视频编辑界面上显示提示信息，所述提示信息用于提醒是否基于所述第一文字信息生成所述第一字幕信息；

响应于作用在所述提示信息上的第二操作，获取所述第一文字信息。
根据权利要求17所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

基于所述第一文字信息，生成所述第一字幕信息。
根据权利要求19所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

将所述第一文字信息确定为所述第一字幕信息。
根据权利要求19所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

对比所述第一文字信息与字幕数据库中的多个字幕段；

在所述第一文字信息与参考文字信息的相似度大于第一阈值的情况下，从多个所述字幕段中选取目标字幕段，其中所述目标字幕段为多个所述字幕段中包括所述参考文字信息的任一字幕段，所述第一文字信息对应的第一时长等于所述参考文字信息对应的第二时长，所述第一时长为所述第一文字信息按照目标方式显示的时长，所述第二时长为所述参考文字信息按照所述目标方式显示的时长；

基于所述目标字幕段和正在编辑的视频，确定所述第一字幕信息。
根据权利要求21所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

在所述视频的时长小于所述目标字幕段按照所述目标方式显示的时长的情况下，从所述目标字幕段中选取目标文字信息，将所述目标文字信息确定为所述第一字幕信息，所述目标文字信息包括所述参考文字信息，且所述目标文字信息按照所述目标方式显示的时长等于所述视频的时长；

在所述视频的时长不小于所述目标字幕段按照所述目标方式显示的时长的情况下，将所述目标字幕段确定为所述第一字幕信息。
根据权利要求21所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

在所述第一时长小于所述视频的时长的情况下，对比所述第一文字信息与多个所述字幕段。
根据权利要求21所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

分别确定所述第一字幕区域中每个第一字幕子区域的位置信息，所述位置信息包括长度和起始位置，所述第一字幕子区域的长度表征所述第一字幕子区域中第一字幕段对应的视频时长，所述第一字幕子区域的起始位置表征所述第一字幕段对应的第一个视频帧图像，所述第一字幕段为基于所述第一字幕信息划分得到的；

基于每个所述第一字幕子区域的位置信息，在每个所述第一字幕子区域显示对应的所述第一字幕段。
根据权利要求24所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

在所述视频编辑界面的图像区域中，沿着目标方向显示多个视频帧图像，所述目标方向为所述第一字幕子区域的长度方向；

在所述第一字幕区域中，沿着所述目标方向显示多个所述第一字幕子区域，所述第一字幕子区域位于对应的多个所述视频帧图像的一侧。
根据权利要求24所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

将所述第一字幕信息分为多个所述第一字幕段；

获取正在编辑的视频的时长；

基于所述第一字幕段的数量和所述时长，确定每个所述第一字幕子区域的长度；

将所述第一字幕区域的起始点确定为第一个所述第一字幕子区域的所述起始位置，将任一所述第一字幕子区域的终止位置确定为下一个所述第一字幕子区域的所述起始位置。
根据权利要求24所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

获取正在编辑的所述视频的语音内容对应的文字内容；

确定所述第一文字信息与所述文字内容的相似度；

在所述第一文字信息与所述文字内容的相似度大于第二阈值的情况下，将所述文字内容确定为所述第一字幕信息；

基于所述文字内容与每个所述视频帧图像的对应关系，确定每个所述第一字幕子区域的所述位置信息。
根据权利要求17至27任一项所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于作用在第一目标字幕子区域的第三操作，将所述第一目标字幕子区域的起始位置变更至目标位置。
根据权利要求17至27任一项所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于作用在第二目标字幕子区域上的第四操作，将所述第二目标字幕子区域的长度变为目标长度。
根据权利要求17至27任一项所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于第五操作，获取第二文字信息，所述第五操作用于复制所述第二文字信息；

基于所述第二文字信息，在所述视频编辑界面的第二字幕区域显示第二字幕信息，所述第二字幕区域位于所述第一字幕区域的一侧，所述第二字幕信息是基于所述第二文字信息生成的。
根据权利要求17至27任一项所述的电子设备，其中，所述处理器被配置为执行所述指令，以实现如下操作：

响应于所述第一操作，将复制的所述第一文字信息存储在内存区域中；

在对目标视频进行编辑时，从所述内存区域中获取所述第一文字信息。
一种非易失性存储介质，当所述非易失性存储介质中的指令由电子设的处理器执行时，使得电子设备能够执行如下操作：

响应于第一操作，获取第一文字信息，所述第一操作用于复制所述第一文字信息；

在视频编辑界面的第一字幕区域显示第一字幕信息，所述第一字幕信息是基于所述第一文字信息生成的。