WO2022063093A1

WO2022063093A1 - 用于生成文字模式的视频的方法、装置、设备和介质

Info

Publication number: WO2022063093A1
Application number: PCT/CN2021/119438
Authority: WO
Inventors: 吴怡颖; 孙辉; 王道裕
Original assignee: 北京字跳网络技术有限公司
Priority date: 2020-09-25
Filing date: 2021-09-18
Publication date: 2022-03-31
Also published as: US20230130806A1; JP2023534757A; JP7450112B2; KR20230023804A; EP4171047A4; CN112153475B; CN112153475A; US20240170026A1; KR102613143B1; EP4171047A1; US11922975B2

Abstract

在本公开中，提供了用于生成文字模式的视频的方法、装置、设备和介质。在一种方法中，从信息共享应用的用户接收用于生成视频的请求。在信息共享应用中，显示用于生成视频的初始页面，初始页面包括用于输入文字的提示。响应于在初始页面所在的区域中检测到用户的触摸，获取来自用户的文字输入。基于文字输入生成视频，以用于在信息共享应用中发布。根据本公开的示例性实现方式，提供了相应的装置、设备和介质。利用本公开的示例性实现方式，在信息共享应用内部，用户可以直接基于文字输入来生成相应的视频。以此方式，可以降低用户操作的复杂度，并且向用户提供更为丰富的发布内容。

Description

用于生成文字模式的视频的方法、装置、设备和介质

技术领域

本公开的各实现方式涉及计算机领域，具体地，涉及用于生成文字模式的视频方法、装置、设备和计算机存储介质。

背景技术

随着信息技术的发展，目前已经提供了多种信息共享应用。用户可以编辑文字、拍摄照片或者视频，并且在信息共享应用中进行发布。由于视频可以包括例如声音、图像、文字等多方面的信息，视频信息已经成为广大用户乐于接受的信息类型。目前已经开发了支持向视频中插入文字的视频编辑应用。然而，当用户希望在信息共享应用中发布文字模式的视频时，不得不首先在视频编辑应用中生成视频并存储，继而在信息共享应用中上传该视频。此时，如何以更为方便并且有效的方式来生成文字模式的视频，成为一个研究热点。

发明内容

在本公开的第一方面，提供了一种用于在信息共享应用中生成文字模式的视频的方法。在该方法中，从信息共享应用的用户接收用于生成视频的请求。在信息共享应用中，显示用于生成视频的初始页面，初始页面包括用于输入文字的提示。响应于在初始页面所在的区域中检测到用户的触摸，获取来自用户的文字输入。基于文字输入生成视频，以用于在信息共享应用中发布。

在本公开的第二方面，提供了一种用于在信息共享应用中生成文字模式的视频的装置。该装置包括：接收模块，配置用于从信息共享应用的用户接收用于生成视频的请求；显示模块，配置用于在信息共享应用中，显示用于生成视频的初始页面，初始页面包括用于输入文字的提示；获取模块，配置用于响应于在初始页面所在的区域中检测到用户的触摸，获取来自用户的文字输入；以及生成模块，配置用于基于文字输入生成视频，以用于在信息共享应用中发布。

在本公开的第三方面，提供了一种电子设备。该电子设备包括：存储器和处理器；其中存储器用于存储一条或多条计算机指令，其中一条或多条计算机指令被处理器执行以实现根据本公开的第一方面的方法。

在本公开的第四方面，提供了一种计算机可读存储介质，其上存储有一条或多条计算机指令，其中一条或多条计算机指令被处理器执行实现根据本公开的第一方面的方法。

利用本公开的示例性实现方式，用户可以在信息共享应用内部直接基于文字输入来生成相应的视频。以此方式，可以降低用户操作的复杂度，并且向用户提供更为丰富的发布内容。

附图说明

结合附图并参考以下详细说明，本公开各实现方式的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标注表示相同或相似的元素，其中：

图1示意性示出了根据本公开的示例性实现方式的应用环境的框图；

图2示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的用户界面的框图；

图3示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的方法的流程图；

图4示意性示出了根据本公开的示例性实现方式的用于输入文字的用户界面的框图；

图5示意性示出了根据本公开的示例性实现方式的用于选择视频背景的用户界面的框图；

图6示意性示出了根据本公开的示例性实现方式的用于编辑视频的用户界面的框图；

图7示意性示出了根据本公开的示例性实现方式的用于预览视频的用户界面的框图；

图8示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的装置的框图；以及

图9示出了能够实施本公开的多个实现方式的计算设备的框图。

具体实施方式

下面将参照附图更详细地描述本公开的实现方式。虽然附图中显示了本公开的某些实现方式，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实现方式，相反提供这些实现方式是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实现方式仅用于示例性作用，并非用于限制本公开的保护范围。

在本公开的实现方式的描述中，术语“包括”及其类似用语应当理解为开放性包含，即“包括但不限于”。术语“基于”应当理解为“至少部分地基于”。术语“一个实现方式”或“该实现方式”应当理解为“至少一个实现方式”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

目前已经提供了多种信息共享应用(简称为应用)。由于视频可以包括多方面的信息，广大用户更乐于接受视频类型的媒体信息。为便于描述起见，首先参见图1概述根据本公开的示例性实现方式的应用环境。具体地，该图1示意性示出了根据本公开的示例性实现方式的应用环境100的框图。在图1中，用户可以通过应用110来观看和/或发布视频。例如，应用110可以向用户推送视频120，并且用户可以通过搜索、下滑、翻页等操作来观看喜爱的视频。此外，用户可以按下“发布”按钮130来发布视频。

已经开发出了多种视频发布模式，例如，用户可以利用拍照、分段拍、快拍、从相册中上传等方式来发布视频。各个用户可以选择自己喜好的方式来发布视频。有些用户可能希望发布基于文字制作的视频，例如，用户期望输入诸如“中秋快乐”、“生日快乐”等祝福语，并且生成相应的视频来用于发布。

目前，已经开发了支持向视频中插入文字的视频编辑应用。然而，应用110的用户不得不首先在视频编辑应用中生成视频并存储，继而在应用110中上传该视频以便发布。上述操作涉及多个应用，导致用户的操作复杂并且难以在例如手机等具有较小屏幕区域的终端设备处实现。此时，如何以更为方便并且有效的方式来为信息共享应用的用户生成文字模式的视频，成为一个研究热点。

为了至少部分地解决已有技术方案中的上述和/或其他不足，根据本公开的示例性实现方式，提出了一种用于在信息共享应用中生成文字模式的视频的方法。在该方法中，可以从信息共享应用的用户接收用于生成视频的请求，继而启动用于生成文字模式的视频的方法。在下文中，将参见图2描述根据本公开的示例性实现方式的概要，该图2示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的用户界面200的框图。

当用户按下图1中的发布按钮130之后，可以进入如图2所示的用户界面200。用户可以在用户界面200底部的菜单中选择文字模式220，以便启动根据本公开的示例性实现方式的生成方法。此时，在应用110中，可以显示用于生成视频的初始页面210。在此初始页面210可以包括用于输入文字的提示：“轻触即可输入文字”。用户可以在初始页面210中输入相应的文字。例如，用户可以在初始页面210所在的区域中执行触摸操作，以便启动输入文字的过程。

继而，应用110从用户获取文字输入，并且生成包括该文字输入的视频以便用于发布。将会理解，图2所示的页面布局仅仅是示意性的，根据本公开的示例性实现方式，可以采用其他页面布局，只要能够实现根据本公开的示例性实现方式的方法即可。

利用本公开的示例性实现方式，用户不必单独调用视频编辑应用，而是可以在信息共享应用内部直接基于文字输入来生成相应的视频。以此方式，可以降低用户操作的复杂度，避免用户在多个应用之间切换期间可能造成的错误，并且向用户提供更为丰富的发布内容。

在下文中，将参见图3描述根据本公开的示例性实现方式的更多细节。图3示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的方法300的流程图。在框310处，从信息共享应用的用户接收用于生成视频的请求。根据本公开的示例性实现方式，用户可以滑动如图2所示的用户界面200底部的菜单，并且从多种视频模式中选择文字模式220。

在图3的框320处，在信息共享应用中，显示用于生成视频的初始页面210，在此初始页面210包括用于输入文字的提示。根据本公开的示例性实现方式，可以在初始页面中的醒目位置处显示输入提示。用户可以根据提示来输入期望的文字，例如，用户可以通过触摸初始页面210中的任何空白区域来调用输入对话框，以便输入文字。

在框330处，响应于在初始页面210所在的区域中检测到用户的触摸，获取来自用户的文字输入。用户可以触摸初始页面210中的任意空白区域以便输入文字，在下文中将参见图4描述有关文字输入的更多细节。该图4示意性示出了根据本公开的示例性实现方式的用于输入文字的用户界面400的框图。如图4所示，当用户触摸初始页面210的空白区域之后，可以弹出输入框410以用于接收文字输入。例如，用户可以输入纯文本内容“中秋快乐”。

根据本公开的示例性实现方式，文字输入可以包括文本和表情符号。此时，用户还可以输入例如“笑脸”的表情符号。将会理解，在此的表情符号可以是由移动终端上的操作系统所绘制的表情符号，每个表情符号可以具有唯一的代码。对于某个代码而言，绘制的表情符号图像可以随着操作系统的不同而有所区别。例如，在两种操作系统所绘制的“笑脸”中，嘴角上扬的程度可以有所不同。

在框340处，基于文字输入生成视频，以用于在信息共享应用中发布。在已经获得了文字输入的情况下，可以生成包括该文字输入的视频以便用于发布。将会理解，文字输入是用于生成视频的最基本要素，对于其他要素而言，可以基于默认的视频背景来生成默认长度的视频。例如，应用110可以基于文字的内容来选择月夜背景并生成包括文字“中秋快乐”的视频。

根据本公开的示例性实现方式，初始页面210可以包括更多的选项。在下文中，返回图2描述有关初始页面210的更多细节。根据本公开的示例性实现方式，初始页面210可以进一步包括用于选择视频背景的选项234。用户可以点击选项234来选择期望的视频背景，例如，可以从图像、视频、表情符号以及表情动画中选择一个或者多个作为背景。可以基于用户选择的视频背景，来生成视频。假设用户选择月饼的图像，则生成的视频的背景将包括月饼图案。

根据本公开的示例性实现方式，在选择视频背景的对话框中，可以进一步指定图像位置、图像的数量、图像的运动轨迹，等等。参见图5描述有关视频背景的更多细节，该图5示意性示出了根据本公开的示例性实现方式的用于选择视频背景的用户界面500的框图。用户可以选择月饼图像作为背景，并且可以指定在视频中包括随机分布的3个图像。此时，生成的视频中将包括图像510、520和530。进一步，可以指定图像沿着某个方向运动。例如，可以预先定义运动轨迹，例如，直线、曲线等；备选地和/或附加地，可以随机生成运动轨迹。根据本公开的示例性实现方式，可以设置附加规则：例如，可以指定在显示多个图像的情况下，应当避免图像之间的碰撞；又例如，可以指定当图像到达显示边界时改变运动方向，等等。

根据本公开的示例性实现方式，可以选择视频来作为背景，并且可以指定使用视频中的某个时间段内的部分(例如，指定时间段的开始时间和终止时间)，可以选择视频中的某个区域(例如，指定使用某个窗口范围内的部分)，等等。根据本公开的示例性实现方式，可以选择表情符号或者表情动画来作为视频背景。利用本公开的示例性实现方式，可以为生成视频提供更为丰富的素材，进而满足广大用户多方面的需求。

返回图2，继续描述有关初始页面210的更多细节。根据本公开的示例性实现方式，初始页面210可以进一步包括用于朗读文字输入的朗读选项230。用户可以通过点击操作来启动或者取消自动朗读功能。当用户启动自动朗读功能时，应用110可以基于人工智能技术来自动朗读用户输入的文字，并且基于朗读的音频来生成视频。此时，生成的视频可以包括朗读的音频；备选地和/或附加地，生成的视频可以包括文字内容和音频内容两者。

根据本公开的示例性实现方式，朗读选项可以进一步包括以下中的至少任一项：朗读者的性别、年龄、声音风格以及语速。以此方式，用户可以选择不同性别、不同年龄的朗读者。根据本公开的示例性实现方式，可以提供多种声音风格来满足不同用户的需求。例如，声音风格可以包括但不限于：浑厚型、甜美型、活泼型，等等。用户可以选择高、中或者低的不同的语速，以便支持对于朗读效果的个性化设置。

根据本公开的示例性实现方式，用户可以取消朗读选项，此时生成的视频仅包括文字内容。根据本公开的示例性实现方式，可以向用户提供生成视频的多种素材，从而提供更为丰富的媒体表现方式。

上文已经参见附图描述了有关初始页面210的内容。用户可以在初始页面210中进行设置，以便定义生成视频的各项参数。当用户确认初始页面210中的设置之后，可以点击“下一步”按钮232以便显示编辑页面。在下文中，将参见图6描述有关编辑页面的更多细节，该图6示意性示出了根据本公开的示例性实现方式的用于编辑视频的用户界面600的框图。用户可以在编辑页面610中进行操作，并且应用110可以基于用户对编辑页面610的用户操作来生成相应的视频。

根据本公开的示例性实现方式，编辑页面610可以包括以下中的至少任一项：用于编辑朗读设置的选项620、用于编辑文字输入的选项622、以及用于编辑视频背景的选项624。在编辑页面610中，用户可以经由选项620来启动或者关闭自动朗读功能；用户可以经由选项622来编辑已经输入的文字，可以设置文字的字体、字号、颜色、显示位置，等等；用户可以经由选项624来编辑已经选择的背景、重新选择背景或者添加新的背景，等等。

在已经编辑了希望调整的参数之后，用户可以按下“下一步”按钮640，以便基于用户在编辑页面610中指定的编辑后的选项，生成相应的视频。利用本公开的示例性实现方式，编辑页面610可以向用户提供修改各项参数的功能。以此方式，在用户在不满意先前设置时提供可以修改机会，进而便于用户操作并且生成满意的视频。

根据本公开的示例性实现方式，编辑页面610可以进一步包括：用于选择向视频中添加背景声音的选项630。在此的背景声音可以包括背景音乐和/或例如人物解说等其他声音。例如，用户可以按下选项630来选择视频的背景音乐或者其他音频。备选地和/或附加地，用户可以录入旁白，例如，用户可以朗读有关中秋的诗歌，等等。

在用户已经选择了期望的背景声音之后，应用110可以基于用户操作指定的背景声音，生成相应的视频。利用本公开的示例性实现方式，可以允许用户向视频中加入更为多样的声音文件，以便生成更为丰富的视频内容。

根据本公开的示例性实现方式，编辑页面610可以进一步包括：用于选择向视频中添加贴纸的选项632。在此贴纸可以包括文字贴纸以及图像贴纸。文字贴纸可以包括文字，例如，各种艺术字体的常用语等。图像贴纸可以包括图标、常用表情、以及画框等内容。用户可以按下选项632来向视频中插入贴纸，例如，用户可以插入文字贴纸“阖家团圆”，并且插入图像贴纸“红心”等。进一步，用户可以通过触摸、拖动、旋转、缩放等操作来调整贴纸的位置、大小和方向，等等。

在用户已经选择了期望的贴纸之后，应用110可以基于用户操作指定的贴纸，生成相应的视频。利用本公开的示例性实现方式，可以允许用户向视频中加入更多的个性元素。以此方式，可以提高视频的趣味性并且提供更为丰富的媒体表现。

根据本公开的示例性实现方式，编辑页面610可以进一步包括：用于指定视频的长度的选项。视频可以具有例如3秒(或者其他数值)的默认长度。为了提供更优质的定制服务，可以允许用户自定义视频的长度。进一步，当用户选择了背景声音(或视频)时，可以允许用户进一步设置背景声音(或视频)和视频长度之间的匹配关系。在默认情况下，可以从背景声音(或视频)中截取与视频长度相匹配的声音(或视频)片段。如果用户指定的长度大于背景声音(或视频)的长度，则用户可以设置循环播放。备选地和/或附加地，可以基于背景声音(或视频)的长度来设置所生成视频的长度。

在用户已经选择了期望的长度之后，可以基于用户操作指定的长度，生成相应的视频。利用本公开的示例性实现方式，允许用户调整视频生成的更多参数，进而便于用户生成满意的视频作品。

根据本公开的示例性实现方式，编辑页面610可以进一步包括：用于指定文字输入和视频背景中的至少任一项的动画模式的选项。在此的动画模式可以包括文字输入和视频背景的多种显示方式。例如，用于文字输入的动画模式可以指定以渐变方式、运动轨迹方式来显示文字输入。

根据本公开的示例性实现方式，用于视频背景的动画模式可以指定显示背景的方式。当视频背景为图像时，动画模式可以指定图像的显示区域、数量、显示方式(伸缩显示或者平铺显示)、显示轨迹，等等。当视频背景为视频时，动画模式可以指定将视频中的某个时间段内的部分用作生成视频的背景，可以指定视频背景与生成视频的分辨率之间的关系，等等。当视频背景为表情符号(或表情动画)时，可以指定在生成视频中包括的表情符号的数量、表情符号的显示位置以及运动轨迹，等等。

进一步，可以基于用户操作指定的动画模式，生成相应的视频。假设用户指定从屏幕上方向下循环地移动文字输入，背景中包括3个图像，每个图像分别按照随机选择的直线方向运动，并且在到达显示区域的边界时改变运动方向。此时，生成的视频将如图7所示。图7示意性示出了根据本公开的示例性实现方式的用于预览视频的用户界面700的框图。在图7中，文字输入将沿着箭头720所示方向运动，在移出显示区域下部之后重新出现在显示区域的上部，如此循环。3个图像510、512和514可以沿着随机选择的直线方向运动。例如，图像512可以沿着方向710运动，并且在到达显示区域的边界时重新确定运动方向。

根据本公开的示例性实现方式，可以提供预定的默认动画模式，此时用户不必逐一选择有关动画显示的各项参数，而是可以直接选择的静态的背景图像来生成动态的视频。在一个示例中，用于背景图像的一个默认动画模式可以指定显示3个图像，并且图像在视频中跳跃。此时，当用户选择月饼图案时，生成的视频将包括3个月饼图案的跳跃效果。备选地和/或附加地，另一默认动画模式可以指定显示1个图像，并且指定图像在视频中旋转。此时，生成的视频将包括月饼图案的旋转动画。在另一示例中，用于文字输入的默认动画模式可以指定在视频的中心位置处显示文字输入。

利用本公开的示例性实现方式，可以基于静态的文字输入来生成动态的视频画面。以此方式，可以向用户提供更为丰富的视觉表达，进而满足不同用户的需求。

根据本公开的示例性实现方式，如果接收到来自用户的用于发布视频的请求，在信息共享应用中发布视频。根据本公开的示例性实现方式，当用户已经在编辑页面610中完成操作之后，可以按下“下一步”按钮640，以便生成视频。将会理解，在此的视频可以是由应用110所支持的各种格式的视频文件。利用本公开的示例性实现方式，可以在单一应用中生成并且发布文字模式的视频。相对于在视频编辑应用和信息共享应用之间切换的已有技术方案而言，采用上文描述的方法可以在无需切换应用的情况下，以更为简单并且有效的方式生成并且发布视频。

根据本公开的示例性实现方式，如果用户输入的文字和/或所选择的背景图像包括依赖于终端设备的表情符号，则可以与视频相关联地存储表情符号的代码。将会理解，当终端设备采用不同的操作系统时表情符号的绘制可以存在区别。假设用户输入了表情符号“笑脸”，并且该表情符号的代码为“001”，此时可以直接存储代码“001”，而不是在视频内容中直接加入基于用户的终端设备的操作系统所绘制的表情符号。以此方式，当另一用户播放生成的视频时，则可以基于另一用户的终端设备的操作系统的类型，来在视频中显示相应的“笑脸”。利用本公开的示例性实现方式，可以跨越多种操作系统来为用户提供更多的选择。

上文已经参见图1至图7描述根据本公开的示例性实现方式的方法300的详细信息。根据本公开的示例性实现方式，进一步提供了用于实现上述方法或过程的相应装置。图8示意性示出了根据本公开的示例性实现方式的用于生成文字模式的视频的装置800的框图。具体地，该装置800包括：接收模块810，配置用于从信息共享应用的用户接收用于生成视频的请求；显示模块820，配置用于在信息共享应用中，显示用于生成视频的初始页面，初始页面包括用于输入文字的提示；获取模块830，配置用于响应于在初始页面所在的区域中检测到用户的触摸，获取来自用户的文字输入；以及生成模块840，配置用于基于文字输入生成视频，以用于在信息共享应用中发布。

根据本公开的示例性实现方式，初始页面进一步包括用于选择视频背景的选项；以及生成模块840进一步配置用于包括：响应于接收到用户选择的视频背景，基于视频背景生成视频，视频背景包括以下中的至少任一项：图像、视频、表情符号以及表情动画。

根据本公开的示例性实现方式，初始页面进一步包括用于朗读文字输入的朗读选项；以及生成模块840进一步配置用于包括：响应于接收到用户对朗读选项的选择，基于朗读文字输入的音频来生成视频。

根据本公开的示例性实现方式，朗读选项包括以下中的至少任一项：朗读者的性别、年龄、声音风格以及语速。

根据本公开的示例性实现方式，生成模块840进一步配置用于：响应于接收到用户取消对朗读选项的选择，基于文字输入来生成视频。

根据本公开的示例性实现方式，生成模块840包括：编辑页面显示模块，配置用于响应于检测到用户确认初始页面，在信息共享应用中显示用于生成视频的编辑页面；以及生成模块840进一步包括：视频生成模块，配置用于基于用户对编辑页面的用户操作，生成视频。

根据本公开的示例性实现方式，编辑页面包括：用于编辑文字输入、视频背景以及朗读选项中的至少任一项的选项；以及视频生成模块进一步配置用于：基于由用户操作指定的编辑后的选项，生成视频。

根据本公开的示例性实现方式，编辑页面包括：用于选择向视频中添加背景声音的选项；以及视频生成模块进一步配置用于：基于用户操作指定的背景声音，生成视频。

根据本公开的示例性实现方式，编辑页面包括：用于选择向视频中添加贴纸的选项；以及视频生成模块进一步配置用于：基于用户操作指定的贴纸，生成视频，贴纸包括文字贴纸以及图像贴纸。

根据本公开的示例性实现方式，编辑页面包括：用于指定视频的长度的选项；以及视频生成模块进一步配置用于：基于用户操作指定的长度，生成视频。

根据本公开的示例性实现方式，编辑页面包括：用于指定文字输入和视频背景中的至少任一项的动画模式的选项；以及视频生成模块进一步配置用于：基于用户操作指定的动画模式或者预定动画模式，生成视频。

根据本公开的示例性实现方式，文字输入包括表情符号，以及生成模块840包括：表情符号存储模块，配置用于与视频相关联地存储表情符号的代码，以用于按照用于播放视频的终端设备的类型来显示与代码相对应的表情符号。

根据本公开的示例性实现方式，该装置800进一步包括：发布模块，配置用于响应于来自用户的用于发布视频的请求，在信息共享应用中发布视频。

根据本公开的示例性实现方式，装置800中所包括的单元可以利用各种方式来实现，包括软件、硬件、固件或其任意组合。在一些实现方式中，一个或多个单元可以使用软件和/或固件来实现，例如存储在存储介质上的机器可执行指令。除了机器可执行指令之外或者作为替代，装置800中的部分或者全部单元可以至少部分地由一个或多个硬件逻辑组件来实现。作为示例而非限制，可以使用的示范类型的硬件逻辑组件包括现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准品(ASSP)、片上系统(SOC)、复杂可编程逻辑器件(CPLD)，等等。

图9示出了其中可以实施本公开的一个或多个实现方式的计算设备/服务器900的框图。应当理解，图9所示出的计算设备/服务器900仅仅是示例性的，而不应当构成对本文所描述的实现方式的功能和范围的任何限制。

如图9所示，计算设备/服务器900是通用计算设备的形式。计算设备/服务器900的组件可以包括但不限于一个或多个处理器或处理单元910、存储器920、存储设备930、一个或多个通信单元940、一个或多个输入设备950以及一个或多个输出设备960。处理单元910可以是实际或虚拟处理器并且能够根据存储器920中存储的程序来执行各种处理。在多处理器系统中，多个处理单元并行执行计算机可执行指令，以提高计算设备/服务器900的并行处理能力。

计算设备/服务器900通常包括多个计算机存储介质。这样的介质可以是计算设备/服务器900可访问的任何可以获得的介质，包括但不限于易失性和非易失性介质、可拆卸和不可拆卸介质。存储器920可以是易失性存储器(例如寄存器、高速缓存、随机访问存储器(RAM))、非易失性存储器(例如，只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、闪存)或它们的某种组合。存储设备930可以是可拆卸或不可拆卸的介质，并且可以包括机器可读介质，诸如闪存驱动、磁盘或者任何其他介质，其可以能够用于存储信息和/或数据(例如用于训练的训练数据)并且可以在计算设备/服务器900内被访问。

计算设备/服务器900可以进一步包括另外的可拆卸/不可拆卸、易失性/非易失性存储介质。尽管未在图9中示出，可以提供用于从可拆卸、非易失性磁盘(例如“软盘”)进行读取或写入的磁盘驱动和用于从可拆卸、非易失性光盘进行读取或写入的光盘驱动。在这些情况中，每个驱动可以由一个或多个数据介质接口被连接至总线(未示出)。存储器920可以包括计算机程序产品925，其具有一个或多个程序模块，这些程序模块被配置为执行本公开的各种实现方式的各种方法或动作。

通信单元940实现通过通信介质与其他计算设备进行通信。附加地，计算设备/服务器900的组件的功能可以以单个计算集群或多个计算机器来实现，这些计算机器能够通过通信连接进行通信。因此，计算设备/服务器900可以使用与一个或多个其他服务器、网络个人计算机(PC)或者另一个网络节点的逻辑连接来在联网环境中进行操作。

输入设备950可以是一个或多个输入设备，例如鼠标、键盘、追踪球等。输出设备960可以是一个或多个输出设备，例如显示器、扬声器、打印机等。计算设备/服务器900还可以根据需要通过通信单元940与一个或多个外部设备(未示出)进行通信，外部设备诸如存储设备、显示设备等，与一个或多个使得用户与计算设备/服务器900交互的设备进行通信，或者与使得计算设备/服务器900与一个或多个其他计算设备通信的任何设备(例如，网卡、调制解调器等)进行通信。这样的通信可以经由输入/输出(I/O)接口(未示出)来执行。

根据本公开的示例性实现方式，提供了一种计算机可读存储介质，其上存储有一条或多条计算机指令，其中一条或多条计算机指令被处理器执行以实现上文描述的方法。

这里参照根据本公开实现的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其他可编程数据处理装置的处理单元执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上，使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实现的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实现，上述说明是示例性的，并非穷尽性的，并且也不限于所公开的各实现。在不偏离所说明的各实现的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实现的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其他普通技术人员能理解本文公开的各实现。

Claims

一种用于在信息共享应用中生成文字模式的视频的方法，包括：

从所述信息共享应用的用户接收用于生成所述视频的请求；

在所述信息共享应用中，显示用于生成所述视频的初始页面，所述初始页面包括用于输入文字的提示；

响应于在所述初始页面所在的区域中检测到所述用户的触摸，获取来自所述用户的文字输入；以及

基于所述文字输入生成所述视频，以用于在所述信息共享应用中发布。
根据权利要求1所述的方法，其中所述初始页面进一步包括用于选择视频背景的选项；以及

生成所述视频进一步包括：响应于接收到所述用户选择的视频背景，基于所述视频背景生成所述视频，所述视频背景包括以下中的至少任一项：图像、视频、表情符号以及表情动画。
根据权利要求1所述的方法，其中所述初始页面进一步包括用于朗读所述文字输入的朗读选项；以及

生成所述视频进一步包括：响应于接收到所述用户对所述朗读选项的选择，基于朗读所述文字输入的音频来生成所述视频。
根据权利要求3所述的方法，其中所述朗读选项包括以下中的至少任一项：朗读者的性别、年龄、声音风格以及语速。
根据权利要求3所述的方法，其中生成所述视频进一步包括：响应于接收到所述用户取消对所述朗读选项的选择，基于所述文字输入来生成所述视频。
根据权利要求1所述的方法，其中生成所述视频包括：

响应于检测到所述用户确认所述初始页面，在所述信息共享应用中显示用于生成所述视频的编辑页面；以及

基于所述用户对所述编辑页面的用户操作，生成所述视频。
根据权利要求6所述的方法，其中所述编辑页面包括：用于编辑所述文字输入、所述视频背景以及所述朗读选项中的至少任一项的选项；以及

基于所述用户操作生成所述视频包括：基于由所述用户操作指定的编辑后的选项，生成所述视频。
根据权利要求6所述的方法，其中所述编辑页面包括：用于选择向所述视频中添加背景声音的选项；以及

基于所述用户操作生成所述视频包括：基于所述用户操作指定的背景声音，生成所述视频。
根据权利要求6所述的方法，其中所述编辑页面包括：用于选择向所述视频中添加贴纸的选项；以及

基于所述用户操作来生成所述视频包括：基于所述用户操作指定的贴纸，生成所述视频，所述贴纸包括文字贴纸以及图像贴纸。
根据权利要求6所述的方法，其中所述编辑页面包括：用于指定所述视频的长度的选项；以及

基于所述用户操作生成所述视频包括：基于所述用户操作指定的长度，生成所述视频。
根据权利要求6所述的方法，其中所述编辑页面包括：用于指定所述文字输入和所述视频背景中的至少任一项的动画模式的选项；以及

基于所述用户操作生成所述视频包括：基于所述用户操作指定的动画模式或者预定动画模式，生成所述视频。
根据权利要求1所述的方法，其中所述文字输入包括表情符号，以及

生成所述视频包括：与所述视频相关联地存储所述表情符号的代码，以用于按照用于播放所述视频的终端设备的类型来显示与所述代码相对应的表情符号。
根据权利要求1所述的方法，进一步包括：响应于来自所述用户的用于发布所述视频的请求，在所述信息共享应用中发布所述视频。
一种用于在信息共享应用中生成文字模式的视频的装置，包括：

接收模块，配置用于从所述信息共享应用的用户接收用于生成所述视频的请求；

显示模块，配置用于在所述信息共享应用中，显示用于生成所述视频的初始页面，所述初始页面包括用于输入文字的提示；

获取模块，配置用于响应于在所述初始页面所在的区域中检测到所述用户的触摸，获取来自所述用户的文字输入；以及

生成模块，配置用于基于所述文字输入生成所述视频，以用于在所述信息共享应用中发布。
一种电子设备，包括：

存储器和处理器；

其中所述存储器用于存储一条或多条计算机指令，其中所述一条或多条计算机指令被所述处理器执行以实现根据权利要求1至13中任一项所述的方法。
一种计算机可读存储介质，其上存储有一条或多条计算机指令，其中所述一条或多条计算机指令被处理器执行以实现根据权利要求1至13中任一项所述的方法。