CN117999584A

CN117999584A - 使用外部网格使现实世界对象变形

Info

Publication number: CN117999584A
Application number: CN202280063032.9A
Authority: CN
Inventors: 马坦·祖海尔; 赵艳丽; 布赖恩·富尔克森; 勒扎·阿尔普·居莱尔
Original assignee: Snap Inc
Current assignee: Snap Inc
Priority date: 2021-09-20
Filing date: 2022-09-20
Publication date: 2024-05-07
Also published as: KR20240071398A; US20240046587A1; US11836866B2; WO2023044151A1; US20230090645A1

Abstract

公开了用于执行操作的方法和系统，所述操作包括：接收视频，该视频包括对现实世界对象的描绘；生成与现实世界对象相关联的三维(3D)身体网格，该三维(3D)身体网格跟踪现实世界对象跨视频的帧的移动；确定视频中描绘的现实世界对象的UV位置，以获得与UV位置相关联的像素值；基于与UV位置相关联的像素值，生成表示现实世界对象的外部网格和相关联的增强现实(AR)元素；基于3D身体网格的改变和变形参数，使外部网格变形；以及基于经变形的外部网格来修改视频以用AR元素替换现实世界对象。

Description

使用外部网格使现实世界对象变形

优先权申明

本申请要求2021年9月20日提交的序列号为17/448,158的美国专利申请的优先权权益，该美国专利申请通过引用整体并入本文。

技术领域

本公开内容总体上涉及使用消息收发应用提供增强现实体验。

背景技术

增强现实(AR)是对虚拟环境的修改。例如，在虚拟现实(VR)中，用户完全沉浸在虚拟世界中，而在AR中，用户沉浸在将虚拟对象与现实世界组合或将虚拟对象覆盖在现实世界上的世界中。AR系统旨在生成并呈现与现实世界环境真实地交互并且彼此之间进行交互的虚拟对象。AR应用的示例可以包括单人或多人视频游戏、即时消息收发系统等。

附图说明

在附图(其不一定按比例绘制)中，相似的附图标记可以在不同视图中描述类似部件。为了容易地标识对任何特定元素或动作的讨论，附图标记中的一个或多个最高有效数字是指该元素被首次引入时所在的图号。在附图中示出了一些非限制性示例，在附图中：

图1是根据一些示例的可以部署本公开内容的联网环境的图解表示。

图2是根据一些示例的消息收发客户端应用的图解表示。

图3是根据一些示例的在数据库中维持的数据结构的图解表示。

图4是根据一些示例的消息的图解表示。

图5是示出根据示例的示例外部网格变形系统的框图。

图6、图7和图8是根据一些示例的外部网格变形系统的输出的图解表示。

图9是示出根据一些示例的外部网格变形系统的示例操作的流程图。

图10是根据一些示例的呈计算机系统形式的机器的图解表示，在该机器内可以执行一组指令以使该机器执行本文讨论的方法中的任何一种或更多种方法。

图11是示出可以在其中实现示例的软件架构的框图。

具体实施方式

下面的描述包括实施本公开内容的说明性示例的系统、方法、技术、指令序列和计算机器程序产品。在以下描述中，出于说明的目的，阐述了许多具体细节以便提供对各种示例的理解。然而，对于本领域技术人员而言明显的是，可以在没有这些具体细节的情况下实践示例。通常，不需要详细示出公知的指令实例、协议、结构和技术。

通常，VR和AR系统通过捕获用户的图像并另外地使用深度传感器获得在图像中描绘的现实世界身体的深度图来显示表示给定用户的图像。通过一起处理深度图和图像，VR和AR系统可以检测用户在图像中的定位，并且可以适当地修改图像中的用户或背景。虽然这样的系统可以很好地工作，但对深度传感器的需求限制了它们的应用范围。这是因为出于修改图像的目的而向用户设备添加深度传感器增加了设备的总成本和复杂度，从而使得它们的吸引力降低。

某些系统不需要使用深度传感器来修改图像。例如，某些系统允许用户替换在其中检测用户的面部的视频会议中的背景。具体地，这样的系统可以使用被优化以用于识别用户的面部的专门技术来识别描绘了用户的面部的图像中的背景。然后，这些系统可以仅替换描绘背景的那些像素，使得在图像中现实世界背景被替选背景代替。然而，这样的系统通常无法识别用户的全身。因此，如果用户距摄像装置大于阈值距离，使得不仅仅是用户的面部被摄像装置捕获，则将背景替换为替选背景开始失效。在这种情况下，图像质量受到严重影响，并且用户的面部和身体中的多个部分可能被系统无意中移除，因为系统错误地将这样的部分识别为属于图像的背景而不是前景。此外，当在图像或视频馈送中描绘多于一个用户时，这样的系统无法适当地替换背景。因为这样的系统通常无法将图像中的用户的整个身体与背景区分开，因此这些系统也不能将视觉效果应用于用户身体的某些部分，例如将身体部位(例如，面部)转换、混合、变换、改变或形变(morph)成AR图形。

一些AR系统允许将AR图形或AR元素添加至图像或视频，以提供吸引人的AR体验。这样的系统可以从设计者接收AR图形，并且可以在图像或视频中缩放和定位AR图形。为了改进AR图形在图像或视频中描绘的人身上的放置和定位，这样的系统检测图像或视频中描绘的人，并且生成表示人的骨头的骨架(rig)。然后，该骨架被用于基于骨架的移动的改变来调整AR图形。虽然这样的方法通常很好地工作，但需要实时生成人的骨架以调整AR图形的放置，从而增加了处理复杂度、功率和内存需求。这使得这样的系统为低效的，或者无法在不牺牲计算资源或处理速度的情况下在小规模移动设备上运行。此外，骨架仅表示图像或视频中的人的骨骼或骨头结构的移动，并且不考虑人的任何种类的外部物理性质，例如密度、重量、皮肤属性等。因此，这些系统中的任何AR图形均可以在比例(scale)和定位上被调整，但不能基于人的其他物理性质进行变形。此外，AR图形设计者通常需要为其AR图形创建兼容的骨架。

所公开的技术通过生成图像中描绘的对象(例如人)的身体网格并且与身体网格对应地使外部网格(基于图像中描绘的人生成的)变形，提高了使用电子设备的效率。通过基于所描绘的对象的身体网格的改变来使外部网格变形，所公开的技术可以在不需要生成所描绘的对象的骨架或骨头结构的情况下以更高效的方式将一个或更多个视觉效果与图像或视频中描绘的人相关联地应用于图像或视频。特别地，考虑到通过人的身体网格的改变确定的人的移动和姿态信息，所公开的技术可以将图像或视频中描绘的人的一个或更多个身体部位形变、变换、改变或混合成一个或更多个AR元素。

这简化了将AR图形添加至图像或视频的过程，从而显著地减少了生成这样的AR图形时的设计约束和成本，并且降低了处理复杂度、功率和内存需求量。这也改善了AR图形作为描绘对象的图像或视频中描绘的现实世界环境的一部分的错觉。这使得在小规模移动设备上能够实时地将AR图形无缝且高效地添加至底层图像或视频。所公开的技术可以专门或主要应用于移动设备上，而不需要移动设备将图像/视频发送至服务器。在其他示例中，所公开的技术可以专门或主要应用于远程服务器，或者可以在移动设备与服务器之间进行分配。

此外，所公开的技术允许AR图形设计者为其AR图形生成外部网格，而不需要为AR图形创建兼容的骨架，这节省了时间、精力和创建复杂度。所公开的技术通过在身体网格与AR图形或AR时尚品的外部网格之间创建对应，使得AR图形(AR时尚品)能够随着用户的形状(重量、高度、身体形状等)进行变形。所公开的技术还使用外部网格与身体网格之间的对应信息以及基于与身体网格相关联的移动信息，使得现实世界对象的某些部分能够混合或形变成AR图形。

因此，可以以对于用户进行交互和选择而言直观的方式提供逼真的显示，所述显示示出用户在三维(3D)上在视频中四处移动的同时正在形变成AR图形，包括体形、身体状态、身体性质、位置和旋转的改变。如本文中使用的，“衣服制品”、“时尚品”和“服装”可互换地使用，并且应当被理解为具有相同的含义。这改善了用户在使用电子设备时的总体体验。此外，通过在不使用深度传感器的情况下提供这样的AR体验，减少了完成任务所需的系统资源的总量。

联网计算环境

图1是示出用于通过网络来交换数据(例如，消息和相关联的内容)的示例消息收发系统100的框图。消息收发系统100包括客户端设备102的多个实例，多个实例中的每个实例托管包括消息收发客户端104和其他外部应用109(例如，第三方应用)的若干应用。每个消息收发客户端104经由网络112(例如，因特网)通信地耦接至(例如，托管在相应的其他客户端设备102上的)消息收发客户端104的其他实例、消息收发服务器系统108以及外部应用服务器110。消息收发客户端104还可以使用应用程序接口(API)与本地托管的第三方应用例如外部应用109进行通信。

消息收发客户端104能够经由网络112与其他消息收发客户端104和消息收发服务器系统108进行通信并且交换数据。在消息收发客户端104之间以及在消息收发客户端104与消息收发服务器系统108之间交换的数据包括功能(例如，用于激活功能的命令)以及净荷数据(例如，文本、音频、视频或其他多媒体数据)。

消息收发服务器系统108经由网络112向特定消息收发客户端104提供服务器侧功能。虽然消息收发系统100的某些功能在本文被描述为由消息收发客户端104或由消息收发服务器系统108执行，但是某些功能的位置是在消息收发客户端104内还是在消息收发服务器系统108内可以是设计选择。例如，在技术上可能优选是：最初将某些技术和功能部署在消息收发服务器系统108内，但是后面将该技术和功能迁移至客户端设备102具有足够处理能力的消息收发客户端104。

消息收发服务器系统108支持向消息收发客户端104提供的各种服务和操作。这样的操作包括向消息收发客户端104发送数据、从消息收发客户端104接收数据以及对由消息收发客户端104生成的数据进行处理。作为示例，该数据可以包括消息内容、客户端设备信息、地理位置信息、媒体增强和覆盖、消息内容持久化条件、社交网络信息和实况事件信息。通过经由消息收发客户端104的用户界面可用的功能来激活和控制消息收发系统100内的数据交换。

现在具体地转至消息收发服务器系统108，API服务器116耦接至应用服务器114并且向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器120，该数据库服务器120有助于对数据库126进行访问，该数据库126存储与由应用服务器114处理的消息相关联的数据。类似地，web服务器128耦接至应用服务器114并且向应用服务器114提供基于web的接口。为此，web服务器128通过超文本传输协议(HTTP)和若干其他相关协议处理传入的网络请求。

API服务器116在客户端设备102与应用服务器114之间接收和发送消息数据(例如，命令和消息净荷)。具体地，API服务器116提供一组接口(例如，例程和协议)，该组接口可以由消息收发客户端104调用或查询以激活应用服务器114的功能。API服务器116公开由应用服务器114支持的各种功能，包括：帐户注册；登录功能；经由应用服务器114将消息从特定消息收发客户端104发送至另一消息收发客户端104；将媒体文件(例如，图像或视频)从消息收发客户端104发送至消息收发服务器118并用于另一消息收发客户端104的可能访问；设置媒体数据集合(例如，故事)；检索客户端设备102的用户的朋友列表；检索这样的集合；检索消息和内容；在实体图(例如，社交图)中添加和删除实体(例如，朋友)；在社交图中定位朋友；以及打开(例如，与消息收发客户端104相关的)应用事件。

应用服务器114托管若干服务器应用和子系统，包括例如消息收发服务器118、图像处理服务器122和社交网络服务器124。消息收发服务器118实现若干消息处理技术和功能，特别是与从消息收发客户端104的多个实例接收到的消息中包括的内容(例如，文本和多媒体内容)的汇总和其他处理相关的消息处理技术和功能。如将进一步详细描述的，来自多个源的文本和媒体内容可以被汇总成内容的集合(例如，称为故事或图库(gallery))。然后，使这些集合对消息收发客户端104可用。鉴于数据的其他处理器和存储器密集型处理的硬件要求，也可以由消息收发服务器118在服务器侧执行这样的处理。

应用服务器114还包括图像处理服务器122，该图像处理服务器122专用于执行各种图像处理操作，通常针对在从消息收发服务器118发送或者在消息收发服务器118处接收的消息的净荷内的图像或视频，执行各种图像处理操作。

图像处理服务器122用于实现增强系统208(图2中所示)的扫描功能。扫描功能包括当由客户端设备102捕获到图像时，在客户端设备102上激活并提供一个或更多个AR体验。具体地，客户端设备102上的消息收发客户端104可以用于激活摄像装置。摄像装置向用户显示一个或更多个实时图像或视频以及一个或更多个AR体验的一个或更多个图标或标识符。用户可以选择标识符中的给定标识符来启动对应的AR体验或执行所期望的图像修改(例如，替换视频中的用户穿着的服装或将人或用户的身体的一部分形变、改变、混合或变换成AR图形例如AR狼人或AR蝙蝠)。

社交网络服务器124支持各种社交联网功能和服务并使这些功能和服务对消息收发服务器118可用。为此，社交网络服务器124维持并且访问数据库126内的实体图308(如图3所示)。由社交网络服务器124支持的功能和服务的示例包括识别消息收发系统100的特定用户与之有关系或该特定用户正在“关注”的其他用户，并且还包括识别特定用户的兴趣和其他实体。

返回至消息收发客户端104，外部资源(例如，第三方应用109或小程序(applet))的特征和功能经由消息收发客户端104的接口对用户可用。消息收发客户端104接收对用于启动或访问诸如外部应用109的外部资源(例如，第三方资源)的特征的选项的用户选择。外部资源可以是安装在客户端设备102上的第三方应用(外部应用109)(例如，“原生应用”)，或者托管在客户端设备102上或者位于客户端设备102的远端(例如，在第三方服务器110上)的第三方应用的小规模版本(例如，“小程序”)。第三方应用的小规模版本包括第三方应用(例如，第三方独立应用的全规模、原生版本)的特征和功能的子集，并且使用标记语言文档来实现。在一个示例中，第三方应用的小规模版本(例如，“小程序”)是第三方应用的基于web的标记语言版本，并且被嵌入在消息收发客户端104中。除了使用标记语言文档(例如，.*ml文件)之外，小程序可以包括脚本语言(例如，.*js文件或.json文件)和样式表(例如，.*ss文件)。

响应于接收到对用于启动或访问外部资源(外部应用109)的特征的选项的用户选择，消息收发客户端104确定所选择的外部资源是基于web的外部资源还是本地安装的外部应用。在一些情况下，本地安装在客户端设备102上的外部应用109可以例如通过在客户端设备102的主页画面上选择与外部应用109对应的图标来独立于消息收发客户端104并且与消息收发客户端104分开地启动。这样的外部应用的小规模版本可以经由消息收发客户端104启动或访问，并且在一些示例中，小规模外部应用的任何部分都不能(或者有限部分才能)在消息收发客户端104之外被访问。可以通过消息收发客户端104从外部应用服务器110接收与小规模外部应用相关联的标记语言文档并对这样的文档进行处理来启动小规模外部应用。

响应于确定外部资源是本地安装的外部应用109，消息收发客户端104指示客户端设备102通过执行与外部应用109对应的本地存储的代码来启动外部应用109。响应于确定外部资源是基于web的资源，消息收发客户端104与外部应用服务器110进行通信以获得与所选择的资源对应的标记语言文档。消息收发客户端104然后处理获得的标记语言文档以在消息收发客户端104的用户界面内呈现基于web的外部资源。

消息收发客户端104可以向客户端设备102的用户或与这样的用户有关的其他用户(例如，“朋友”)通知一个或更多个外部资源中发生的活动。例如，消息收发客户端104可以向消息收发客户端104中的对话(例如，聊天会话)中的参与者提供与用户组中的一个或更多个成员当前或最近使用外部资源有关的通知。可以邀请一个或更多个用户加入活跃的外部资源或者启动(该朋友组中)最近使用过但当前不活跃的外部资源。外部资源可以向对话中的各自使用相应的消息收发客户端104的参与者提供与进入聊天会话中的用户组中的一个或更多个成员分享外部资源中的项、状况、状态或定位的能力。共享项可以是交互式聊天卡，聊天的成员可以利用该交互式聊天卡进行交互，以例如启动对应的外部资源、查看外部资源内的特定信息或者将聊天的成员带到外部资源内的特定位置或状态。在给定的外部资源内，可以在消息收发客户端104上向用户发送响应消息。外部资源可以基于外部资源的当前上下文将不同的媒体项选择性地包括在响应中。

消息收发客户端104可以向用户呈现可用的外部资源(例如，第三方或外部应用109或小程序)的列表以启动或访问给定的外部资源。该列表可以被呈现在上下文相关菜单中。例如，表示外部应用109(或小程序)中的不同外部应用的图标可以基于用户如何启动(例如，从对话界面或从非对话界面启动)菜单而变化。

消息收发客户端104可以向用户呈现一个或更多个AR体验。作为示例，消息收发客户端104可以检测由客户端设备102捕获的图像或视频中的人或用户。消息收发客户端104可以为图像或视频中描绘的人生成身体网格。身体网格可以是3D网格或多边形网格，其包括限定图像或视频中描绘的多面体对象的形状的顶点、边和面的集合。网格可以是若干封闭面的集合。在数学矢量代数意义(这可能对计算而言是重要的)上，网格可以是组织成若干矩阵的数字的集合。在几何描述中，网格可以由点组成，这些点通过线段连接在一起并且通过多边形表面化(surfaced)。

消息收发客户端104可以接收AR体验(例如，变形参数)的用户选择，以修改图像中描绘的人或用户的3D网格，例如修改(放大、扩张、缩小、减小等)用户或人的一部分(例如，身体部位，例如手、头部、腿、躯干或其任何组合)。作为响应，消息收发客户端104可以基于与图像中描绘的人或用户对应的3D网格和纹理，生成外部网格。消息收发客户端104可以例如通过将与3D身体网格相关联的位置信息复制到与外部网格相关联的放置信息中，自动地生成或确定外部网格与3D身体网格之间的对应。消息收发客户端104可以基于与3D身体网格相关联的移动信息来自动地调整与外部网格相关联的放置信息，使得外部网格以与3D身体网格类似的方式在3D空间中扩张、收缩、旋转以及/或者重新定位。消息收发客户端104可以获得二维(2D)空间中表示与3D身体网格相关联的人或用户的像素的UV图，并且可以使用UV图来生成外部网格的纹理。UV图(mapping)是将2D图像投影到3D模型的表面以进行纹理映射的3D建模过程。字母“U”和“V”表示2D纹理的轴线，因为“X”、“Y”和“Z”已经用来表示3D对象在模型空间中的轴线。外部网格的纹理可以表示图像或视频中描绘的人的身体的视觉属性，例如，相同的肤色、斑痕、雀斑、头发、指甲、褶皱等。以这种方式，产生AR图形，该AR图形表示图像或视频中描绘的人或用户并且随着人或用户在图像或视频中四处移动而四处移动并重新定位。

AR图形可以与外部网格相关联，以修改AR图形在3D空间中的移动。可以从用户接收包括变形参数的输入，以修改AR图形，例如放大或缩小由AR图形表示的身体部位。例如，变形参数可以指定使由AR图形表示的身体的腰部大小减小的量。作为响应，消息收发客户端104可以将外部网格中的与身体的腰部对应的一部分缩小从用户接收到的输入中指定的量。因此，与外部网格的腰部部分对应的AR图形纹理的腰部部分类似地在大小上减小或缩小。然后，消息收发客户端104可以修改图像或视频，以用已经修改的AR图形替换UV像素和/或3D身体网格的对应位置。在示例中，消息收发客户端104可以根据混合参数，将图像或视频中描绘的人或用户的UV像素混合到AR图形中，例如以将图像或视频中的人或用户的描绘缓慢过渡到表示具有减小的腰部部分的同一人或用户的AR图形中。

作为另一示例，除了减小AR图形的一部分的大小之外(或作为减小AR图形的一部分的大小的替选)，还可以接收附加输入以增大AR图形的第二部分的大小。即，可以从用户接收包括变形参数的输入，以修改AR图形，例如以放大或缩小由AR图形表示的第二身体部位。例如，变形参数可以指定使由AR图形表示的身体的腿的长度增加的量。作为响应，消息收发客户端104可以将外部网格中的与身体的腿对应的一部分放大从用户接收到的输入中指定的量。因此，与外部网格的腿部分对应的AR图形纹理的腿部分类似地在大小上增大。作为使AR图形的一部分的大小增大的过程的一部分，消息收发客户端104可以确定与在大小上被增大的该部分的边缘对应的AR图形的像素值。例如，消息收发客户端104可以获得AR图形的腿部分的顶部周围的像素值。然后，消息收发客户端104可以将腿的顶部周围的像素值混合到腿的经放大的部分中，以提供原始腿大小与经放大的腿大小之间的连续性。然后，消息收发客户端104可以修改图像或视频，以用已经修改(以具有更长的腿和减小的腰部大小)的AR图形替换UV像素和/或3D身体网格的对应位置。在示例中，消息收发客户端104可以根据混合参数，将图像或视频中描绘的人或用户的UV像素混合到AR图形中，例如以将图像或视频中的人或用户的描绘缓慢过渡到表示具有减小的腰部部分和更长的腿的同一人或用户的AR图形中。

作为另一示例，除了缩小AR图形的一部分的大小之外(或作为缩小AR图形的一部分的大小的替选)，还可以接收附加输入，以改变颜色或者向AR图形的第三部分添加图形元素(例如，AR纹身)。即，可以从用户接收包括变形参数的输入，以添加图形元素或改变AR图形的一部分的颜色，例如以改变由AR图形表示的第三身体部位的颜色。作为响应，消息收发客户端104可以选择外部网格中的与AR图形的第三部分对应的一部分，例如身体的左臂。消息收发客户端104可以修改AR图形第三部分的纹理，以与请求的新颜色对应，或者覆盖图形元素，从而使其看起来好像纹身已经被添加到AR图形的第三部分。然后，消息收发客户端104可以修改图像或视频，以用已经修改(以具有更长的腿、减小的腰部大小和包括添加AR纹身的身体的左臂的修改的颜色)的AR图形替换UV像素和/或3D身体网格的对应位置。在示例中，消息收发客户端104可以根据混合参数，将图像或视频中描绘的人或用户的UV像素混合到AR图形中，例如以将图像或视频中的人或用户的描绘缓慢过渡到表示具有减小的腰部部分、更长的腿和经修改的左臂的同一人或用户的AR图形中。虽然所公开的示例是关于修改图像或视频中描绘的人或用户进行讨论的，但类似的技术也可以应用于修改任何其他现实世界对象，例如动物、家具、建筑物等。

如以上所提及的，与AR图形相关联的外部网格可以包括混合参数，用于控制如何将现实世界对象部分形变、混合、改变或变换成经修改的AR图形，该经修改的AR图形表示图像或视频中描绘的人或用户。混合参数可以包括线性或非线性函数，该线性或非线性函数控制现实世界对象部分多快或多慢地混合到AR图形中。AR图形还可以包括指示现实世界对象、人或用户的哪些部分要混合到AR图形中以及不改变哪些部分的信息。例如，AR图形可以指定将对象、人或用户的头部变换成AR图形的头部，而不改变或影响对象、人或用户的其他部分(例如，手臂、腿、手和躯干)。

消息收发客户端104可以自动地建立身体网格(例如，3D身体网格)与外部网格之间的对应。消息收发客户端104可以将外部网格定位在图像或视频中的3D身体网格上或相对于3D身体网格定位外部网格。消息收发客户端104可以(基于与外部网格相关联的放置信息)确定外部网格的第一部分或第一组部分，所述第一部分或第一组部分基于与3D身体网格相关联的移动信息而进行变形。例如，如果AR图形是动物的头部，则放置信息可以指定外部网格的头部部分(外部网格中的与动物或AR狼人的头部对应的部分)将基于与3D身体网格的头部部分相关联的移动信息进行变形。然后，消息收发客户端104可以在基于3D身体网格的移动信息使外部网格变形的同时，根据混合参数将3D身体网格的头部部分混合、变换、形变或改变成AR图形。这允许图像或视频中描绘的对象、用户或人在对象、用户或人的一部分被混合、形变、变换或改变成AR图形的同时继续四处移动。这向用户提供了与所选择的AR图形相结合的人的图像或视频描绘的逼真显示。

以这种方式，消息收发客户端104可以基于与图像或视频中描绘的对象(例如人)相关联的身体网格的移动和其他改变(例如，身体形状、位置、旋转和比例的改变)实时地调整外部网格(以及因此，调整与外部网格相关联的AR图形)以及同时还根据混合参数(例如，线性或非线性函数)将现实世界对象的至少一部分混合到AR图形中。这提供了关于AR图形实际上包括在图像或视频中描绘的现实世界环境中的错觉，这样改善了整体用户体验。下文结合图5提供了外部网格相对于身体网格的变形和混合参数的另外的细节。

系统架构

图2是示出根据一些示例的关于消息收发系统100的另外的细节的框图。具体地，消息收发系统100被示为包括消息收发客户端104和应用服务器114。消息收发系统100包含若干子系统，这些子系统在客户端侧由消息收发客户端104支持并且在服务器侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、游戏系统212、以及外部资源系统220。

短暂定时器系统202负责实施消息收发客户端104和消息收发服务器118对内容的临时或时间受限访问。短暂定时器系统202包含若干定时器，这些定时器基于与消息或消息的集合(例如，故事)相关联的持续时间和显示参数，选择性地实现经由消息收发客户端104对消息和相关联的内容进行访问(例如，用于呈现和显示)。下面提供关于短暂定时器系统202的操作的另外的细节。

集合管理系统204负责管理媒体的合集或集合(例如，文本、图像视频和音频数据的集合)。内容(例如，消息，包括图像、视频、文本和音频)的集合可以被组织成“事件图库”或“事件故事”。这样的集合可以在指定的时间段内(例如，与内容相关的事件的持续时间内)可用。例如，可以使与音乐会有关的内容在音乐会的持续时间内作为“故事”可用。集合管理系统204还可以负责向消息收发客户端104的用户界面发布提供特定集合的存在的通知的图标。

此外，集合管理系统204还包括策展接口206，策展接口206允许集合管理者管理和策展特定内容集合。例如，策展接口206使得事件组织器能够策展与特定事件有关的内容的集合(例如，删除不适当的内容或冗余消息)。此外，集合管理系统204采用机器视觉(或图像识别技术)和内容规则来对内容集合进行自动策展。在某些示例中，可以针对将用户生成的内容包括到集合中而向用户支付补偿。在这样的情况下，集合管理系统204进行操作以自动地向这样的用户支付费用以使用其内容。

增强系统208提供使得用户能够增强(例如，注解或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如，增强系统208提供与生成和发布针对由消息收发系统100处理的消息的媒体覆盖(media overlay)有关的功能。增强系统208基于客户端设备102的地理位置可操作地向消息收发客户端104提供媒体覆盖或增强(例如，图像过滤器)。在另一示例中，增强系统208基于诸如客户端设备102的用户的社交网络信息的其他信息可操作地向消息收发客户端104提供媒体覆盖。媒体覆盖可以包括音频和视觉内容以及视觉效果。音频和视觉内容的示例包括图片、文本、标识、动画和声音效果。视觉效果的示例包括颜色覆盖。音频和视觉内容或视觉效果可以被应用于客户端设备102处的媒体内容项(例如，照片)。例如，媒体覆盖可以包括可以覆盖在由客户端设备102拍摄的照片上的文本、图形元素或者图像。在另一示例中，媒体覆盖包括定位标识覆盖(例如，威尼斯海滩)、实况事件的名称或商家名称覆盖(例如，海滩咖啡馆)。在另一示例中，增强系统208使用客户端设备102的地理位置来标识包括客户端设备102的地理位置处的商家名称的媒体覆盖。媒体覆盖可以包括与商家相关联的其他标记。媒体覆盖可以被存储在数据库126中并且通过数据库服务器120进行访问。

在一些示例中，增强系统208提供基于用户的发布平台，该基于用户的发布平台使得用户能够在地图上选择地理位置并上传与所选择的地理位置相关联的内容。用户还可以指定特定媒体覆盖应当被提供给其他用户的环境。增强系统208生成包括所上传的内容并且将所上传的内容与所选择的地理位置相关联的媒体覆盖。

在其他示例中，增强系统208提供基于商家的发布平台，该基于商家的发布平台使得商家能够经由竞标过程选择与地理位置相关联的特定媒体覆盖。例如，增强系统208使最高出价商家的媒体覆盖与对应地理位置相关联达预定义时间量。增强系统208与图像处理服务器122通信以获得增强现实体验，并且在一个或更多个用户界面中呈现这样的体验的标识符(例如，作为实时图像或视频上的图标，或作为专用于所呈现的增强现实体验的标识符的界面中的缩略图或图标)。一旦选择了AR体验，则检索一个或更多个图像、视频或AR图形元素，并将其呈现为在由客户端设备102捕获的图像或视频之上的覆盖物。在一些情况下，摄像装置被切换至正面视角(例如，客户端设备102的前置摄像装置响应于特定AR体验的激活而被激活)，并且来自客户端设备102的前置摄像装置而不是客户端设备102的后置摄像装置的图像开始显示在客户端设备102上。一个或更多个图像、视频或AR图形元素被检索并呈现为在由客户端设备102的前置摄像装置捕获和显示的图像之上的覆盖物。

在其他示例中，增强系统208能够经由网络112与另一客户端设备102上的另一增强系统208以及服务器通信并交换数据。交换的数据可以包括：标识共享AR会话的会话标识符；第一客户端设备102与第二客户端设备102(例如，多个客户端设备102，包括第一设备和第二设备)之间的变换，该变换用于将共享AR会话对准至共同原点；共同坐标系；和功能(例如，用于激活函数的命令)以及其他净荷数据(例如，文本、音频、视频或其他多媒体数据)。

增强系统208将变换发送至第二客户端设备102，使得第二客户端设备102可以基于该变换来调整AR坐标系。以这种方式，第一客户端设备102和第二客户端设备102将它们的坐标系(coordinate systems and frames)同步以显示AR会话中的内容。具体地，增强系统208计算第二客户端设备102在第一客户端设备102的坐标系中的原点。然后，增强系统208可以基于从第二客户端设备102的角度来看的该原点在第二客户端设备102的坐标系中的位置来确定第二客户端设备102的坐标系中的偏移量。使用该偏移量生成变换，使得第二客户端设备102根据与第一客户端设备102的共同坐标系生成AR内容。

增强系统208可以与客户端设备102通信，以建立单独或共享的AR会话。增强系统208还可以耦接至消息收发服务器118以在共享AR会话中为客户端设备102建立电子群组通信会话(例如，群组聊天、即时消息收发)。可以使电子群组通信会话与由客户端设备102提供的会话标识符相关联以获得对电子群组通信会话和共享AR会话的访问权限。在一个示例中，客户端设备102首先获得对电子群组通信会话的访问权限，并且然后在电子群组通信会话中获得允许客户端设备102访问共享AR会话的会话标识符。在一些示例中，客户端设备102能够在无需应用服务器114中的增强系统208的帮助或与应用服务器114中的增强系统208通信的情况下访问共享AR会话。

地图系统210提供各种地理位置功能，并且支持由消息收发客户端104呈现基于地图的媒体内容和消息。例如，地图系统210使得能够在地图上显示(例如，存储在简档数据316中的)用户图标或化身，以指示用户的“朋友”的当前或过去位置，以及由这样的朋友在地图的上下文内生成的媒体内容(例如，包括照片和视频的消息的集合)。例如，可以在消息收发客户端104的地图界面上将用户从特定地理位置发布到消息收发系统100的消息在地图的该特定位置的上下文内显示给特定用户的“朋友”。用户还可以经由消息收发客户端104与消息收发系统100的其他用户(例如，使用适当的状态化身)共享他或她的位置和状态信息，其中该位置和状态信息在消息收发客户端104的地图界面的上下文内被类似地显示给选定用户。

游戏系统212在消息收发客户端104的上下文中提供各种游戏功能。消息收发客户端104提供游戏界面，该游戏界面提供可以由用户在消息收发客户端104的上下文内启动并且与消息收发系统100的其他用户一起玩的可用游戏(例如，基于web的游戏或基于web的应用)的列表。消息收发系统100还使得特定用户能够通过从消息收发客户端104向其他用户发出邀请来邀请这样的其他用户参与玩特定游戏。消息收发客户端104还支持玩游戏上下文内的语音消息收发和文本消息收发两者(例如，聊天)、为游戏提供排行榜，并且还支持提供游戏内奖励(例如，游戏币和物品)。

外部资源系统220向消息收发客户端104提供用于与外部应用服务器110通信以启动或访问外部资源的接口。每个外部资源(应用)服务器110托管例如基于标记语言(例如，HTML5)的应用或外部应用的小规模版本(例如，消息收发客户端104外部的游戏、实用程序、支付或骑乘共享应用)。消息收发客户端104可以通过从与基于web的资源相关联的外部资源(应用)服务器110访问HTML5文件来启动该基于web的资源(例如，应用)。在某些示例中，利用由消息收发服务器118提供的软件开发工具包(SDK)以JavaScript对由外部资源服务器110托管的应用进行编程。SDK包括具有可以由基于web的应用调用或激活的功能的API。在某些示例中，消息收发服务器118包括JavaScript库，该JavaScript库向给定的第三方资源提供对消息收发客户端104的某些用户数据的访问。HTML5被用作用于对游戏进行编程的示例技术，但是可以使用基于其他技术编程的应用和资源。

为了将SDK的功能集成到基于web的资源中，由外部资源(应用)服务器110从消息收发服务器118下载SDK或者由外部资源(应用)服务器110以其他方式来接收SDK。一旦被下载或接收，SDK就被包括为基于web的外部资源的应用代码的一部分。基于web的资源的代码然后可以调用或激活SDK的某些功能以将消息收发客户端104的特征集成至基于web的资源中。

存储在消息收发服务器118上的SDK有效地提供了外部资源(例如，第三方或外部应用109或小程序与消息收发客户端104)之间的桥接。这为用户提供了与消息收发客户端104上的其他用户交流的无缝体验，同时还保留了消息收发客户端104的外观和感觉。为了桥接外部资源与消息收发客户端104之间的通信，在某些示例中，SDK促进外部资源服务器110与消息收发客户端104之间的通信。在某些示例中，在客户端设备102上运行的WebViewJavaScriptBridge在外部资源与消息收发客户端104之间建立两个单向通信通道。在外部资源与消息收发客户端104之间经由这些通信通道异步地发送消息。每个SDK功能激活被作为消息和回调而发送。每个SDK功能通过构造唯一的回调标识符以及发送具有该回调标识符的消息来实现。

通过使用SDK，并非所有来自消息收发客户端104的信息都与外部资源服务器110共享。SDK基于外部资源的需求来限制共享哪些信息。在某些示例中，每个外部资源服务器110将与基于web的外部资源对应的HTML5文件提供给消息收发服务器118。消息收发服务器118可以在消息收发客户端104中添加基于web的外部资源的视觉表示(例如，盒设计(boxart)或其他图形)。一旦用户选择视觉表示或者指示消息收发客户端104通过消息收发客户端104的GUI访问基于web的外部资源的特征，消息收发客户端104则获得HTML5文件并且将访问基于web的外部资源的特征所需的资源实例化。

消息收发客户端104呈现针对外部资源的图形用户界面(例如，登录页面或标题画面)。在呈现登录页面或标题画面期间、之前或之后，消息收发客户端104确定所启动的外部资源是否先前已经被授权访问消息收发客户端104的用户数据。响应于确定启动的外部资源先前已被授权访问消息收发客户端104的用户数据，消息收发客户端104呈现外部资源的另一图形用户界面，其包括外部资源的功能和特征。响应于确定所启动的外部资源先前未被授权访问消息收发客户端104的用户数据，在显示外部资源的登录页面或标题画面的阈值时间段(例如，3秒)之后，消息收发客户端104滑动用于授权外部资源访问用户数据的菜单(例如，将菜单动画化为从画面底部浮现到画面的中间或其他部分)。该菜单标识外部资源将被授权使用的用户数据的类型。响应于接收到对接受选项的用户选择，消息收发客户端104将外部资源添加到已授权外部资源的列表，并且使得外部资源能够访问来自消息收发客户端104的用户数据。在一些示例中，由消息收发客户端104根据OAuth 2框架来授权外部资源访问用户数据。

消息收发客户端104基于被授权的外部资源的类型来控制与外部资源共享的用户数据的类型。例如，向包括全规模的外部应用(例如，第三方或外部应用109)的外部资源提供对第一类型的用户数据(例如，具有或不具有不同化身特性的用户的仅2D化身)的访问。作为另一示例，向包括外部应用的小规模版本(例如，第三方应用的基于web的版本)的外部资源提供对第二类型的用户数据(例如，支付信息、用户的2D化身、用户的3D化身、以及具有各种化身特性的化身)的访问。化身特性包括定制化身的外观和感觉(例如，不同姿态、面部特征、衣服等)的不同方式。

外部网格变形系统224基于图像或视频中描绘的现实世界对象的3D身体网格的实时改变来使外部网格进行变形，并且将现实世界对象的至少一部分形变、改变、变换或混合成由外部网格表示的AR图形。在示例中，外部网格变形系统224可以接收对与AR图形相关联的变形参数的选择，例如用于减小AR图形的腰部大小、延长AR图形的腿和/或改变AR图形的手臂的颜色或向AR图形的手臂添加图形元素的指示。外部网格变形系统224例如基于与AR图形相关联的放置信息，识别图像或视频中描绘的现实世界对象的与AR图形对应的身体部位。外部网格变形系统224基于与3D身体网格相关联的移动信息，使与AR图形对应的外部网格变形。外部网格变形系统224获得混合参数，并且将现实世界对象的3D身体网格的至少身体部位改变、混合、变形、变换或形变成外部网格，同时继续基于与3D身体网格相关联的移动信息使外部网格更新和变形。

在一个示例中，外部网格变形系统224在给定时间间隔内线性地将现实世界对象的3D身体网格的至少身体部位改变、混合、变形、变换或形变成外部网格，使得在相等间隔的时间点处重复地进行对3D身体网格的更新。在另一示例中，外部网格变形系统224在给定时间间隔内非线性地至少将现实世界对象的身体部位的3D身体网格改变、混合、变形、变换或形变成外部网格，使得以第一速率例如在相等间隔的时间点处重复地进行对3D身体网格的现实世界身体部位的第一组更新，以创建部分混合的3D身体网格。随后，修改(增大或减小)第一速率，使得继续以较快或较慢的速度对部分混合的现实世界3D身体网格进行第二组更新，直到3D身体网格的现实世界身体部位完全变换成外部网格(例如，变换成AR图形)。因此，外部网格变形系统224连续地或定期地表示和描绘对图像或视频中的身体部位的改变，以表示身体部位正在形变、改变、混合或变换成具有更小的腰部、更长的腿和修改的左臂。下文结合图5示出并描述了外部网格变形系统224的示意性实现方式。

具体地，外部网格变形系统224是可以由在客户端设备102上实现的AR/VR应用访问的部件。AR/VR应用使用RGB摄像装置来捕获用户的单目图像。AR/VR应用在所捕获的用户的图像上应用各种经训练的机器学习技术，以生成表示图像中描绘的用户的3D身体网格，并且通过使与AR视觉效果相关联的一个或更多个外部网格变形，将一个或更多个AR视觉效果应用于所捕获的图像。在一些实现方式中，AR/VR应用连续捕获用户的图像并且实时地或定期地更新3D身体网格和外部网格，以连续地或定期地更新所应用的一个或更多个视觉效果。这使得用户能够在现实世界中四处移动并且实时地查看一个或更多个视觉效果更新。在一些示例中，外部网格变形系统224在运行时间之前(例如，在AR图形被呈现给用户之前)自动地建立外部网格与3D身体网格之间的对应一次，并且然后外部网格和3D身体网格在运行时间期间相对于彼此变形，以更新与外部网格相关联的AR图形的显示。在其他示例中，可以在运行时间期间连续地更新和生成自动的对应，同时还使外部网格变形。

在训练中，外部网格变形系统224获得包括对具有不同的体型和特性的一个或更多个用户的描绘的第一多个输入训练图像。这些训练图像还提供了基准真实值(groundtruth)信息，其包括与每个图像中描绘的一个或更多个用户对应的身体网格。基于多个训练图像的特征来训练机器学习技术(例如，深度神经网络)。具体地，机器学习技术从给定训练图像中提取一个或更多个特征，并且估计给定训练图像中描绘的用户的3D身体网格。机器学习技术获得与训练图像对应的包括3D身体网格的基准真实值信息并且调整或更新一个或更多个系数或参数以改进对身体网格的后续估计。

数据架构

图3是示出根据某些示例的可以存储在消息收发服务器系统108的数据库126中的数据结构300的示意图。虽然数据库126的内容被示为包括若干表，但是应当理解，数据可以以其他类型的数据结构进行存储(例如，作为面向对象的数据库)。

数据库126包括存储在消息表302中的消息数据。对于任何特定的一个消息，该消息数据至少包括消息发送方数据、消息接收方(或接收者)数据和净荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储于消息表302中的消息数据内的信息的另外的细节。

实体表306存储实体数据，并且(例如，以参考的方式)链接至实体图308和简档数据316。其记录被维护在实体表306内的实体可以包括个人、公司实体、组织、对象、地点、事件等。与实体类型无关地，消息收发服务器系统108存储关于其的数据的任何实体可以是被识别的实体。每个实体被提供唯一标识符以及实体类型标识符(未示出)。

实体图308存储与实体之间的关系和关联有关的信息。仅作为示例，这样的关系可以是基于社交的、基于职业的(例如，在共同的公司或组织工作)、基于兴趣的或基于活动的。

简档数据316存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置，简档数据316可以被选择性地使用并呈现给消息收发系统100的其他用户。在实体是个人的情况下，简档数据316包括例如用户名、电话号码、地址和设置(例如，通知和隐私设置)以及用户选择的化身表示(或这样的化身表示的集合)。然后，特定用户可以将这些化身表示中的一个或更多个选择性地包括在经由消息收发系统100传送的消息的内容内以及由消息收发客户端104向其他用户显示的地图界面上。化身表示的集合可以包括“状态化身”，其呈现用户可以选择在特定时间传达的状态或活动的图形表示。

在实体是团体的情况下，除了团体名称、成员以及针对相关团体的各种设置(例如，通知)之外，针对团体的简档数据316还可以类似地包括与团体相关联的一个或更多个化身表示。

数据库126还在增强表310中存储增强数据，例如覆盖物(overlay)或过滤器(filters)。增强数据与视频(视频的数据被存储在视频表304中)和图像(图像的数据被存储在图像表312中)相关联并且被应用于视频和图像。

数据库126还可以存储与单独的和共享的AR会话有关的数据。该数据可以包括在第一客户端设备102的AR会话客户端控制器与第二客户端设备102的另一AR会话客户端控制器之间传送的数据，以及在AR会话客户端控制器与增强系统208之间传送的数据。数据可以包括用于建立共享AR场景的共同坐标系、设备之间的变换、会话标识符、描绘身体的图像、骨骼关节位置、腕关节位置、脚等的数据。

在一个示例中，过滤器是在向接收方用户呈现期间被显示为覆盖在图像或视频上的覆盖物。过滤器可以是各种类型的，包括当发送用户正在编写消息时由消息收发客户端104呈现给发送用户的一组过滤器中的用户选择的过滤器。其他类型的过滤器包括地理位置过滤器(也称为地理过滤器)，可以基于地理定位将其呈现给发送用户。例如，可以基于由客户端设备102的全球定位系统(GPS)单元确定的地理位置信息，由消息收发客户端104在用户界面内呈现特定于附近或特定位置的地理位置过滤器。

另一类型的过滤器是数据过滤器，该数据过滤器可以由消息收发客户端104基于在消息创建过程期间由客户端设备102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定位置处的当前温度、发送用户行进的当前速度、客户端设备102的电池寿命或当前时间。

可以被存储在图像表312内的其他增强数据包括AR内容项(例如，与应用增强现实体验对应)。AR内容项或AR项可以是可以被添加至图像或视频的实时特殊效果和声音。

如上所述，增强数据包括AR内容项、覆盖物、图像变换、AR图像、AR徽标或徽章以及涉及可以应用于图像数据(例如，视频或图像)的修改的类似项。这包括实时修改，实时修改在使用客户端设备102的设备传感器(例如，一个或多个摄像装置)捕获到图像时对图像进行修改并且然后在客户端设备102的屏幕上显示具有所述修改的图像。这还包括对所存储的内容(例如，图库中可以被修改的视频剪辑)的修改。例如，在能够访问多个AR内容项的客户端设备102中，用户可以将单个视频剪辑与多个AR内容项一起使用来查看不同的AR内容项将如何修改所存储的剪辑。例如，通过为内容选择不同的AR内容项，可以将应用不同伪随机移动模型的多个AR内容项应用于相同内容。类似地，可以将实时视频捕获与所示修改一起使用，以示出当前由客户端设备102的传感器捕获的视频图像将如何修改所捕获的数据。这样的数据可以仅在屏幕上显示而不存储在存储器中，或者由设备传感器捕获的内容可以在进行或不进行修改的情况(或者在这两种情况)下被记录并存储在存储器中。在一些系统中，预览特征可以同时示出不同的AR内容项在显示器中的不同窗口内看起来如何。这可以例如使得能够同时在显示器上查看具有不同伪随机动画的多个窗口。

因此，数据以及使用AR内容项的各种系统或使用该数据来修改内容的其他这样的变换系统可以涉及：现实世界对象(例如，面部、手、身体、猫、狗、表面、对象等)的检测；视频帧中在这样的对象离开视场、进入视场以及在视场四处移动时对其进行跟踪；以及在跟踪这样的对象时对其进行修改或变换。在各种示例中，可以使用用于实现这样的变换的不同的方法。一些示例可以涉及：生成一个或多个对象的3D网格模型，以及在视频内使用模型的变换和动画纹理来实现变换。在其他示例中，可以利用对对象上的点进行跟踪来将图像或纹理(其可以是2D或3D的)放置在跟踪位置处。在又一示例中，可以使用对视频帧的神经网络分析来将图像、模型或纹理放置在内容(例如，图像或视频的帧)中。因此，AR内容项或元素涉及以下两者：用于创建内容中的变换的图像、模型和纹理，以及利用对象检测、跟踪和放置来实现这样的变换所需的附加建模及分析信息。

可以利用保存在任何种类的计算机化系统的存储器中的任何种类的视频数据(例如，视频流、视频文件等)来执行实时视频处理。例如，用户可以加载视频文件并将其保存在设备的存储器中，或者可以使用设备的传感器来生成视频流。此外，可以使用计算机动画模型来处理任何对象，例如人的面部和人体部位、动物、或非生命事物(例如椅子、汽车或其他对象)。

在一些示例中，当连同要变换的内容一起选择特定修改时，由计算设备来识别要变换的元素，并且然后如果所述元素存在于视频的帧中，则检测并跟踪它们。根据修改请求来修改对象的元素，从而变换视频流的帧。针对不同类型的变换，可以通过不同的方法来执行对视频流的帧的变换。例如，对于主要涉及改变对象的元素的形式的帧变换，计算针对对象的每个元素的特征点(例如，使用主动形状模型(Active Shape Model，ASM)或其他已知方法)。然后，针对对象的至少一个元素中的每个元素生成基于特征点的网格。该网格被用于跟踪视频流中的对象的元素的后续阶段。在跟踪过程中，将所提及的用于各元素的网格与各元素的位置对准。然后，在网格上生成附加点。基于修改请求针对每个元素生成第一组第一点，并且基于该组第一点和修改请求针对每个元素生成一组第二点。然后，可以通过基于该组第一点、该组第二点和网格修改对象的元素来对视频流的帧进行变换。在这样的方法中，也可以通过跟踪和修改背景来改变经修改对象的背景或使其发生扭曲。

在一些示例中，可以通过计算对象的每个元素的特征点以及基于所计算的特征点生成网格来执行使用对象的元素改变对象的一些区域的变换。在网格上生成点，然后基于所述点生成各种区域。然后通过将针对每个元素的区域与针对至少一个元素中的每个元素的位置对准来跟踪对象的元素，并且可以基于修改请求来修改区域的属性，从而对视频流的帧进行变换。取决于具体的修改请求，可以以不同的方式对所提及区域的属性进行变换。这样的修改可以涉及改变区域的颜色；从视频流的帧中移除区域的至少一些部分；将一个或更多个新对象包括到基于修改请求的区域中；以及修改或扭曲区域或对象的元素。在各种示例中，可以使用这样的修改的任何组合或其他类似修改。对于要被动画化的某些模型，可以选择一些特征点作为要用于确定针对模型动画的选项的整个状态空间的控制点。

在某些示例中，可以生成与不同对象相关联的两个网格，并且彼此对应地使两个网格进行变形。第一网格(也被称为身体网格)可以与图像或视频中描绘的现实世界对象(例如，人)相关联并且表示该现实世界对象的移动。第二网格(也被称为外部网格)可以与应用于现实世界对象的AR图形或效果相关联。第二网格可以与放置信息相关联，该放置信息指定如何在3D空间中相对于第一网格放置或定位第二网格。放置信息可以基于第一网格的一个或更多个顶点与第二网格的一个或更多个顶点之间的接近度(由最小或最大距离阈值或控制顶点的数目来控制)捕获自动生成的对应信息。放置信息也可以按照UV空间信息被指定，该UV空间信息指示相对于第一网格的UV坐标在UV空间中将第二网格放置得有多近或多远。放置信息还可以基于对应第一网格的移动来指定要变形的第一组部分，并且基于变形参数来指定要变形的第二组部分。当在图像或视频的捕获期间实时地使第一网格变形时，类似地使第二网格的第一组部分和第二组部分变形，以实现被渲染以在图像或视频中显示的对应AR图形的改变。

在使用身体/人检测来变换图像数据的计算机动画模型的一些示例中，在使用特定的身体/人检测算法(例如，3D人体姿态估计和网格重建过程)的情况下在图像上检测身体/人。然后，将ASM算法应用于图像的身体/人区域以检测身体/人特征参考点。

可以使用适于身体/人检测的其他方法和算法。例如，在一些示例中，使用界标来定位特征，界标表示存在于所考虑的大多数图像中的可区分点。例如，对于身体/人界标，可以使用左手臂的位置。如果初始界标不可标识，则可以使用次级界标。这样的界标标识过程可以用于任何这样的对象。在一些示例中，一组界标形成形状。可以使用形状中的点的坐标来将形状表示为矢量。利用使形状点之间的平均欧几里得距离最小化的相似性变换(其允许平移、缩放和旋转)来将一个形状与另一个形状对准。平均形状(mean shape)是经对准的训练形状的平均值。

在一些示例中，从与由全局身体/人检测器确定的身体/人的位置和大小对准的平均形状开始搜索界标。然后，这样的搜索重复以下步骤：通过对每个点周围的图像纹理进行模板匹配以调整形状点的位置来建议暂定形状，并且然后使暂定形状符合全局形状模型，直到发生收敛。在一些系统中，单独的模板匹配是不可靠的，并且形状模型对弱模板匹配的结果进行池化，以形成较强的整体分类器。在从粗分辨率到细分辨率的图像金字塔中的每一级处重复整个搜索。

变换系统可以在客户端设备(例如，客户端设备102)上捕获图像或视频流，并且在维持适当的用户体验、计算时间和功耗的同时，在客户端设备102上本地执行复杂的图像操纵。复杂的图像操纵可以包括大小和形状改变、情绪转变(例如，将面部从皱眉改变为微笑)、状态转变(例如，使被摄体变老、减小外表年龄、改变性别)、风格转变、图形元素应用、3D人体姿态估计、3D身体网格重建以及由已经被配置成在客户端设备102上高效地执行的卷积神经网络实现的任何其他合适的图像或视频操纵。

在一些示例中，用于变换图像数据的计算机动画模型可以由下述系统使用：在所述系统中，用户可以使用具有神经网络的客户端设备102来捕获用户的图像或视频流(例如，自拍)，其中神经网络作为在客户端设备102上操作的消息收发客户端104的一部分来操作。在消息收发客户端104内操作的变换系统确定图像或视频流内的身体/人的存在，并且提供与用于变换数据图像的计算机动画模型相关联的修改图标，或者计算机动画模型可以与本文描述的界面相关联地存在。修改图标包括下述改变，所述改变可以是作为修改操作的一部分的用于修改图像或视频流内的用户的身体/人的基础。一旦选择了修改图标，则变换系统发起转换用户的图像以反映所选择的修改图标(例如，为用户生成微笑面部)的处理。一旦图像或视频流被捕获并且指定的修改被选择，则经修改的图像或视频流可以呈现在客户端设备102上显示的图形用户界面中。变换系统可以针对图像或视频流的一部分实施复杂的卷积神经网络，以生成并应用所选择的修改。也就是说，用户可以捕获图像或视频流，并且一旦选择了修改图标，就可以实时或接近实时地向用户呈现修改后的结果。此外，在正捕获视频流并且所选择的修改图标保持切换时，修改可以是持久的。机器学习的神经网络可以用于实现这样的修改。

呈现由变换系统执行的修改的图形用户界面可以向用户提供附加的交互选项。这样的选项可以基于用于发起对特定计算机动画模型的选择和内容捕获的界面(例如，从内容创建者用户界面来发起)。在各种示例中，在最初选择了修改图标之后，修改可以是持久的。用户可以通过轻击或以其他方式选择正由变换系统修改的身体/人来将修改切换为开启或关闭，并将其存储以供后面观看或浏览到成像应用的其他区域。在由变换系统修改了多个面部的情况下，用户可以通过轻击或选择在图形用户界面内修改和显示的单个身体/人来全局地将修改切换为开启或关闭。在一些示例中，可以单独修改一组多个身体/人中的各个身体/人，或者可以通过轻击或选择图形用户界面内显示的单个身体/人或一系列单独身体/人来单独切换这样的修改。

故事表314存储与消息和相关联的图像、视频或音频数据的集合有关的数据，这些消息和相关联的图像、视频或音频数据被汇编成集合(例如，故事或图库)。特定集合的创建可以由特定用户(例如，其记录被维护在实体表306中的每个用户)发起。用户可以创建呈已经由该用户创建和发送/广播的内容的集合的形式的“个人故事”。为此，消息收发客户端104的用户界面可以包括用户可选择的图标，以使得发送用户能够将特定内容添加至他或她的个人故事。

集合还可以构成“实况故事”，该“实况故事”是手动地、自动地或使用手动技术和自动技术的组合创建的来自多个用户的内容的集合。例如，“实况故事”可以构成来自各种位置和事件的用户提交的内容的策展流。其客户端设备启用了位置服务并且在特定时间处于共同位置事件处的用户可以例如经由消息收发客户端104的用户界面而被呈现将内容贡献给特定实况故事的选项。可以由消息收发客户端104基于用户的位置向他或她标识实况故事。最终结果是从社区角度讲述的“实况故事”。

另外的类型的内容集合被称为“位置故事”，“位置故事”使得其客户端设备102位于特定地理位置(例如，在学院或大学校园)内的用户能够对特定集合做出贡献。在一些实施方式中，对位置故事的贡献可能需要二级认证，以验证最终用户属于特定的组织或其他实体(例如，是大学校园的学生)。

如以上提及的，视频表304存储视频数据，在一个示例中，该视频数据与其记录被维护在消息表302内的消息相关联。类似地，图像表312存储与其消息数据被存储在实体表306中的消息相关联的图像数据。实体表306可以使来自增强表310的各种增强与存储在图像表312和视频表304中的各种图像和视频相关联。

经训练的机器学习技术307存储在外部网格变形系统224的训练期间已训练的参数。例如，经训练的机器学习技术307存储一个或更多个神经网络机器学习技术的经训练的参数。

数据通信架构

图4是示出根据一些示例的消息400的结构的示意图，消息400由消息收发客户端104生成，以用于传送至另外的消息收发客户端104或消息收发服务器118。特定消息400的内容用于填充存储在可由消息收发服务器118访问的数据库126内的消息表302。类似地，消息400的内容作为客户端设备102或应用服务器114的“运输中(in-transit)”或“飞行中(in-flight)”数据存储库在存储器中。消息400被示出为包括以下示例组成部分：

·消息标识符402：标识消息400的唯一标识符。

·消息文本净荷404：要由用户经由客户端设备102的用户界面生成并且包括在消息400中的文本。

·消息图像净荷406：由客户端设备102的摄像装置部件捕获的或从客户端设备102的存储器部件检索的并且包括在消息400中的图像数据。针对已发送或接收的消息400的图像数据可以存储在图像表312中。

·消息视频净荷408：由摄像装置部件捕获的或者从客户端设备102的存储器部件检索的并且包括在消息400中的视频数据。针对已发送或接收的消息400的视频数据可以存储在视频表304中。

·消息音频净荷410：由麦克风捕获的或从客户端设备102的存储器部件检索的并且包括在消息400中的音频数据。

·消息增强数据412：表示要应用于消息400的消息图像净荷406、消息视频净荷408或消息音频净荷410的增强的增强数据(例如，过滤器、标贴或其他标注或增强)。针对已发送或接收的消息400的增强数据可以存储在增强表310中。

·消息持续时间参数414：以秒为单位指示消息的内容(例如，消息图像净荷406、消息视频净荷408、消息音频净荷410)将经由消息收发客户端104呈现给用户或使其可由用户访问的时间量的参数值。

·消息地理位置参数416：与消息的内容净荷相关联的地理位置数据(例如，纬度坐标和经度坐标)。在净荷中可以包括多个消息地理位置参数416值，这些参数值中的每个参数值都与包括在内容中的内容项(例如，消息图像净荷406内的特定图像，或消息视频净荷408中的特定视频)相关联。

·消息故事标识符418：标识与消息400的消息图像净荷406中的特定内容项相关联的一个或更多个内容集合(例如，故事表314中标识的“故事”)的标识符值。例如，可以使用标识符值将消息图像净荷406内的多个图像各自与多个内容集合相关联。

·消息标签420：每个消息400可以用多个标签来标记，所述多个标签中的每一个指示消息净荷中包括的内容的主题。例如，在消息图像净荷406中包括的特定图像描绘动物(例如，狮子)的情况下，指示相关动物的标签值可以被包括在消息标签420内。标签值可以基于用户输入手动生成，或者可以使用例如图像识别自动生成。

·消息发送者标识符422：指示在其上生成消息400以及从其发送消息400的客户端设备102的用户的标识符(例如，消息收发系统标识符、电子邮件地址或设备标识符)。

·消息接收者标识符424：指示消息400寻址到的客户端设备102的用户的标识符(例如，消息收发系统标识符、电子邮件地址或设备标识符)。

消息400的各组成部分的内容(例如，值)可以是指向在其内存储内容数据值的表中的位置的指针。例如，消息图像净荷406中的图像值可以是指向图像表312内的位置的指针(或图像表312内的位置的地址)。类似地，消息视频净荷408内的值可以指向存储在视频表304内的数据，存储在消息增强数据412中的值可以指向存储在增强表310中的数据，存储在消息故事标识符418中的值可以指向存储在故事表314中的数据，并且存储在消息发送者标识符422和消息接收者标识符424中的值可以指向存储在实体表306中的用户记录。

外部网格变形系统

图5是示出根据示例的示例外部网格变形系统224的框图。外部网格变形系统224包括一组部件510，该组部件510对一组输入数据(例如，描绘现实世界对象例如人的单目图像或训练数据)进行操作。该组输入数据是在训练阶段期间从一个或更多个数据库(图3)获得的，并且是在例如由消息收发客户端104使用AR/VR应用时从客户端设备102的RGB摄像装置获得的。外部网格变形系统224包括机器学习技术模块512、骨骼关键点模块511、身体网格模块514、图像修改模块518、AR效果模块519、外部网格模块530、变形参数模块532、3D身体跟踪模块513、全身分割模块515和图像显示模块520。

在训练期间，外部网格变形系统224从训练数据501接收给定的训练图像或视频。外部网格变形系统224使用机器学习技术模块512将一个或更多个机器学习技术应用于给定训练图像或视频上。机器学习技术模块512从给定的训练图像或视频中提取一个或更多个特征以估计图像或视频中描绘的人或用户的3D身体网格。

机器学习技术模块512检索与给定训练图像或视频相关联的3D身体网格信息。机器学习技术模块512将估计的3D身体网格与作为训练数据502的一部分提供的基准真实值服装3D身体网格(ground truth garment 3D body mesh)进行比较。基于所述比较的差异阈值或偏差，机器学习技术模块512更新一个或更多个系数或参数并获得一个或更多个附加的训练图像或视频。在处理了指定数目时期(epoch)或批次(batch)的训练图像之后以及/或者当差异阈值或偏差达到指定值时，机器学习技术模块512完成训练并且机器学习技术模块512的参数和系数被存储在经训练的机器学习技术307中。

在一些示例中，在训练期间，机器学习技术模块512从骨骼关键点模块511接收2D骨骼关节信息。骨骼关键点模块511跟踪给定训练图像中描绘的用户的骨骼关键点(例如，头部关节、肩关节、髋关节、腿关节等)，并且提供骨骼关键点的2D或3D坐标。由机器学习技术模块512使用该信息来标识训练图像中描绘的用户的区别属性并且生成3D身体网格。

由机器学习技术模块512生成的3D身体网格被提供给身体网格模块514。身体网格模块514可以跟踪图像或视频中描绘的对象，并且更新与该对象相关联的3D身体网格。在示例中，身体网格模块514可以基于由3D身体跟踪模块513提供的3D身体跟踪信息来跟踪对象。身体网格模块514可以在3D上更新3D身体网格，并且可以调整3D身体网格的位置、体型、旋转或任何其他参数。图6是根据一些示例的外部网格变形系统224的输出的图解表示。具体地，图6示出了由身体网格模块514生成并跟踪的3D身体网格600。在一个示例中，身体网格模块514可以跟踪3D身体网格跨视频的帧的改变。身体网格模块514可以在3D身体网格混合到外部网格中时将3D身体网格的改变提供给外部网格模块530，以基于3D身体网格的改变来更新外部网格并使外部网格变形。

外部网格模块530可以基于从身体网格模块514接收到的3D身体网格来生成外部网格。外部网格模块530还可以生成对应的AR图形，该对应的AR图形表示与3D身体网格相关联的人或用户。在示例中，外部网格模块530可以将图像或视频转换成UV像素值。外部网格模块530可以识别图像或视频中的与图像或视频中描绘的人或用户对应的一部分。外部网格模块530可以获得与图像或视频中描绘的人或用户对应的图像中的一部分的UV像素值。然后，外部网格模块530可以为AR图形生成纹理，该纹理镜像或包括所获得的UV像素值的副本。外部网格模块530还生成从身体网格模块514接收到的3D身体网格的副本，并且使用该副本作为外部网格。外部网格模块530可以生成外部网格与3D身体网格之间的对应信息，以随着用户或人在图像或视频中四处移动(由3D身体网格的移动表示)更新外部网格(和对应的AR图形)的改变。

在示例中，身体网格模块514可以针对视频的帧中的第一帧确定3D身体网格在法线-切线空间中的第一组坐标，并且可以针对视频的帧中的第二帧确定3D身体网格在法线-切线空间中的第二组坐标。身体网格模块514可以实时地计算法线-切线空间中的第一组坐标与第二组坐标之间的改变，并且将法线-切线空间中的第一组坐标与第二组坐标之间的改变传输至外部网格模块530。具体地，外部网格模块530可以基于法线-切线空间中的第一组坐标与第二组坐标之间的改变，更新和调整外部网格的3D位置和3D取向。以这种方式，外部网格模块530可以在不需要使用现实世界对象的骨架或骨头信息的情况下，使与AR图形相关联的外部网格变形。

在示例中，外部网格模块530可以计算在法线-切线空间(或任何其他合适的空间)中第一组坐标改变成第二组坐标的速率。外部网格模块530可以基于在法线-切线空间(或任何其他合适的空间)中第一组坐标改变成第二组坐标的速率来使外部网格变形。例如，如果图像或视频中描绘的人以特定的速率或速度转动或扭转，身体网格模块514可以计算表示人转动或扭转的方向和速度的第一速率。将该第一速率提供给外部网格模块530，外部网格模块530然后基于第一速率改变外部网格或使外部网格变形。

外部网格模块530可以接收来自AR效果模块519的AR体验的指示。AR效果模块519可以接收用户输入，该用户输入选择用于调整AR图形的给定变形参数，该AR图形表示图像或视频中描绘的人或用户。AR效果模块519可以将变形参数提供给变形参数模块532。在一些情况下，用户输入可以指定混合参数，该混合参数也存储在变形参数模块532中。

外部网格模块530可以获得外部网格的放置信息。放置信息可以指定关于现实世界对象或相对于现实世界对象将AR图形放置在图像或视频中的何处，AR图形的哪些部分基于现实世界对象的移动而进行变形，并且可以指定外部网格的混合参数。放置信息可以包括图像或视频中描绘的用户或人的当前位置和取向，使得将外部网格放置在图像或视频中描绘的人或用户上。混合参数可以包括线性或非线性函数，该线性或非线性函数控制指示多快或多慢地将现实世界对象部分混合到AR图形中。AR图形还可以包括指示将3D身体网格的哪些部分混合到AR图形中以及哪些部分不改变的信息。以这种方式，外部网格模块530可以与身体网格模块514通信，以修改身体网格模块，以混合到外部网格中。具体地，3D身体网格可以与现实世界的人对应。在这种情况下，可以例如通过将视频中描绘的人的身体部位形变成AR元素动画化，对图像或视频进行修改，以描绘现实世界的人的一部分正被改变成AR元素。人的身体部位的形变可以考虑到身体部位在发生形变时的移动以及身体部位或人的姿态信息。

在一个示例中，放置信息可以指定附着至外部网格或与外部网格交叠的与现实世界图形对应的3D身体网格的边缘或身体部位(例如，左手臂、右手臂、头部等)。放置信息还可以指定边缘或身体部位与可以被渲染以进行显示的对应AR图形(外部网格)的边缘之间远离的最小距离。作为响应，外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置维持在至少距身体网格的边缘或身体部分的最小距离处。在3D身体网格被混合或变换成外部网格时，可以相对于3D身体网格维持外部网格的位置。

在一个示例中，放置信息可以指定附着至外部网格或与外部网格交叠的与现实世界图形对应的身体网格的边缘或身体部位(例如，左手臂、右手臂、头部等)。放置信息还可以指定边缘或身体部位与可以被渲染以用于显示的对应AR图形(外部网格)的边缘之间远离的最大距离。作为响应，外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置维持在最多距身体网格的边缘或身体部位的最大距离处。以这种方式，在3D身体网格被混合或变换成外部网格时，可以相对于3D身体网格维持外部网格的位置。

在一个示例中，放置信息可以指定附着至外部网格的与现实世界图形对应的身体网格的边缘或身体部位(例如，左手臂、右手臂、头部等)。放置信息还可以指定边缘或身体部位与可以被渲染以用于显示的对应AR图形(外部网格)的边缘之间远离的距离范围。作为响应，外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置维持在距身体网格的边缘或身体部位的距离范围的最小值与最大值之间。以这种方式，在3D身体网格被混合或变换成外部网格时，可以相对于3D身体网格维持外部网格的位置。放置信息可以指定3D身体网格的哪个身体部位、UV通道坐标、体素或其他位置信息要变形或混合成外部网格。在这种情况下，身体网格模块514接收放置信息，并且可以将3D身体网格中被指定的部分变形、混合、变换或改变成外部网格。

在一个示例中，放置信息可以指定要变换或混合成外部网格的3D身体网格的相对UV通道坐标。相对UV通道坐标可以用于在描绘对象的图像或视频中维持和放置外部网格(以及对应的AR图形)，并且识别3D身体网格的哪些部分要混合到外部网格中。在这种情况下，外部网格模块530可以获得与图像或视频中描绘的现实世界对象对应的3D身体网格的UV通道坐标。外部网格模块530还可以基于与3D身体网格相关联的UV坐标和放置信息中的相对UV通道坐标来计算外部网格的一组UV通道坐标。例如，放置信息可以指定距可以放置外部网格的3D身体网格的特定UV通道坐标的最小距离或最大距离。作为响应，外部网格模块530可以将外部网格放置在一组UV通道坐标处，该组UV通道坐标在距3D身体网格的UV坐标的最小距离或最大距离内。此外，将在距UV坐标的最小距离或最大距离内的3D身体网格部分混合或改变成外部网格。因此，与外部网格相关联的对应AR图形可以用于在与一组UV坐标对应的位置处将图像或视频中描绘的现实世界对象的一部分混合到AR图形中。当现实世界对象在视频中四处移动时，可以具体地基于从身体网格模块514接收到的移动信息将现实世界对象的一部分混合或形变成AR图形。

基于针对3D身体网格检测到的改变和放置信息，外部网格模块530可以与3D身体网格中检测到的改变对应地使外部网格变形。在一个示例中，可以在3D身体网格被形变或混合成外部网格时，响应于检测到3D身体网格的3D位置的改变，使外部网格变形以在3D上改变相对于3D身体网格的位置。例如，在3D身体网格的某部分被形变或混合成外部网格时，如果确定3D身体网格沿第一轴线移动了第一量，则外部网格类似地沿第一轴线移动第一量(或被计算为第一量的因子的一些其他量)。作为另一示例，可以以与3D身体网格对应的方式旋转或扭转外部网格。具体地，在3D身体网格的某个其他部分被形变或混合成外部网格时，如果确定3D身体网格沿旋转轴线旋转第二量，则外部网格类似地沿旋转轴线旋转第二量(或被计算为第二量的因子的一些其他量)。

作为另一示例，可以基于身体形状、身体状态或身体性质跨图像或视频的各帧的改变，使外部网格变形。具体地，如果3D身体网格的一部分在大小上减小(例如，由于外力(例如手放在腰部)，腰部缩进了指定量)，则外部网格的对应部分也按相同的量或其他指定量在大小上减小或在3D空间中重新定位。这样的改变也反映在3D身体网格到外部网格的形变或混合中。以这种方式，如果现实世界对象的结果部分正在实时地改变(例如，由于外力)，则现实世界对象的一部分所成为的对应AR图形也以类似的方式实时地改变。在另一示例中，3D身体网格可以基于图像中描绘的人的呼吸循环定期地扩张和收缩3D身体网格的胸部部分(或上身部分)。在这种情况下，3D身体网格被混合、变形或变换成的外部网格的对应部分也进行变形，以与呼吸循环对应地在大小上扩张和收缩。

在示例中，身体网格模块514可以计算对应对象的法线-切线空间中的改变。也就是说，身体网格模块514可以确定3D身体网格在法线-切线空间中的移动，并且可以将该移动的指示提供给外部网格模块530。外部网格模块530可以基于法线-切线空间中的移动对外部网格应用改变。以这种方式，可以基于对应对象在法线-切线空间中的改变，将3D身体网格混合、形变、改变或变换成外部网格。

变形参数模块532可以指定对AR图形进行的一个或更多个改变。例如，变形参数模块532可以指定由AR图形表示的身体的腰部部分将减小或增大的量。在这种情况下，外部网格模块530可以改变外部网格的腰部部分，以使大小增大或减小指定量。因此，对应的AR图形也改变，例如通过从纹理中删除某些像素或通过将腰部部分的边缘的像素值复制或混合到经放大的腰部部分将更多像素添加至纹理，来具有较大或较小的腰部部分。具体地，外部网格模块530可以确定变形参数指定使腰部部分增大一定量。作为响应，外部网格模块530可以仅扩张外部网格的腰部部分，并且使外部网格的其他部分保持不变。外部网格模块530可以在外部网格的被放大的一部分周围绘制边界，并且识别AR图形的包括被放大的部分的纹理的对应区域。外部网格模块530可以获得AR图形的边界或边缘周围的像素值或像素值的平均值。AR图形的腰部部分最初可以是具有第一大小的多边形。在使外部网格的腰部大小增大之后，AR图形的腰部部分在大小上增大，从而产生具有大于第一大小的第二大小的多边形。为了在具有第一大小的多边形的边缘与具有第二大小的多边形的边缘之间的空间区域中填充像素，可以将边界或边缘周围的像素值混合或复制到空间区域中。这产生具有较大腰部部分的AR图形的逼真视图，因为较小的腰部和较大的腰部具有相似的像素值。然后，变形参数模块532可以指示AR效果模块519用表示具有较大腰部部分的人或用户的AR图形替换描绘人或用户的图像或视频的一部分。

作为另一示例，除了改变腰部部分(或外部网格或AR图形的第一部分)之外或代替改变外部网格或AR图形的第一部分的腰部部分(或进行以上讨论的任何其他改变)，变形参数模块532还可以指定改变AR图形的第二部分的另一个量。例如，变形参数模块532可以指定由AR图形表示的身体的颈部部分将减小的量。在这种情况下，外部网格模块530可以改变外部网格的颈部部分，以将大小减小指定的量。这可以与改变腰部或第一部分同时执行，在改变腰部或第一部分之后执行，或者代替改变腰部或第一部分。因此，例如通过从与颈部部分对应的纹理中删除某些像素，对应的AR图形也改变成具有较小颈部部分。具体地，外部网格模块530可以确定变形参数指定使颈部部分减小给定的量。作为响应，外部网格模块530可以仅减小外部网格的颈部部分，并且使外部网格的其他部分保持不变(除了由变形参数模块532指定将这样的其他部分改变另一个量)。外部网格模块530可以在被减小的外部网格的一部分周围绘制边界，并且识别AR图形的包括被减小的部分的纹理的对应区域。AR图形的颈部部分最初可以是具有第一大小的多边形。在使外部网格的颈部大小减小之后，AR图形的颈部部分在大小上减小，从而产生具有小于第一大小的第二大小的多边形。这产生具有较短颈部部分的AR图形的逼真视图。然后，变形参数模块532可以指示AR效果模块519用表示具有较小或较短的颈部部分的人或用户的AR图形替换描绘人或用户的图像或视频中的一部分。

作为另一示例，除了改变腰部部分(或外部网格或AR图形的第一部分)之外或代替改变外部网格或AR图形的第一部分的腰部部分(或进行以上讨论的任何其他改变)，变形参数模块532还可以指定AR图形的第三部分的颜色改变。例如，变形参数模块532可以为由AR图形表示的身体的腿部分指定新的颜色。在这种情况下，外部网格模块530可以将与外部网格对应的AR图形的腿部分的颜色改变成指定的颜色。这可以与改变腰部或第一部分同时执行，在改变腰部或第一部分之后执行，或者代替改变腰部或第一部分。因此，在基于图像或视频中描绘的人或用户的移动通过外部网格跟踪腿部分的移动的同时，将AR图形的腿部分改变成具有不同的颜色。然后，变形参数模块532可以指示AR效果模块519用表示具有不同颜色的腿部分的人或用户的AR图形替换描绘人或用户的图像或视频的一部分。

作为另一示例，除了改变腰部部分(或外部网格或AR图形的第一部分)之外或代替改变外部网格或AR图形的第一部分的腰部部分(或进行以上讨论的任何其他改变)，变形参数模块532还可以指定AR元素以添加到AR图形的第四部分。例如，变形参数模块532可以指定AR纹身(例如，图像、视频、图形元素、表情符号等)以添加到由AR图形表示的身体的手臂部分。在这种情况下，外部网格模块530可以将与外部网格对应的AR图形的手臂的一部分改变成包括指定的AR图形。这可以与改变腰部或第一部分同时执行，在改变腰部或第一部分之后执行，或者代替改变腰部或第一部分。因此，在基于图像或视频中描绘的人或用户的移动通过外部网格跟踪手臂部分的移动的同时，将AR图形的手臂部分改变成具有AR元素。然后，变形参数模块532可以指示AR效果模块519用表示具有添加至手臂的AR元素的人或用户的AR图形替换描绘人或用户的图像或视频的一部分。

变形参数模块532可以控制与外部网格对应的3D身体网格部分被变换、混合或改变成外部网格的速率。例如，变形参数模块532可以根据线性函数来控制3D身体网格部分到外部网格中的混合。在这种情况下，3D身体网格的部分在时间上线性地混合到外部网格中。具体地，线性函数可以指定用于实现混合的最大时间间隔，例如，5秒。在这种情况下，3D身体网格部分以在5秒过去之后导致变换完成的速率被变换成外部网格。

在另一示例中，变形参数模块532可以根据非线性函数来控制3D身体网格部分到外部网格中的混合。在这种情况下，3D身体网格的部分可以在给定时间间隔的第一部分中以第一速率线性地混合到外部网格中，以创建部分形变的3D身体网格。在给定时间间隔的第一部分过去之后，在给定时间间隔的第二部分中，继续以第二速率将部分形变的3D身体网格混合到外部网格中。例如，3D身体网格的头部部分可以以第一速率混合到外部网格的第一部分中，例如以在5秒的第一时间间隔内完成。然后，3D身体网格的腿部分可以以第二速率混合到外部网格的第二部分中，例如以在2秒或10秒的第二时间间隔内完成。第二速率可以比第一速率快或慢。在另一示例中，3D身体网格的头部部分可以以第一速率部分地混合到外部网格中，使得头部部分在第一时间间隔结束时不完全混合到外部网格中。然后，在第一时间间隔过去之后，部分混合的头部部分可以继续以第二较快或较慢的速率混合到外部网格中，以完全混合到外部网格中。

在一些示例中，身体网格模块514与变形参数模块532通信，以控制3D身体网格的部分被形变或混合成由外部网格模块530正在进行变形的外部网格的速率。例如，变形参数模块532可以计算混合完成进度，该混合完成进度表示在一定时间段内3D身体网格中有多少已被混合到外部网格中。混合完成进度可以表示为3D身体网格的指定区域内的与外部网格相匹配的像素或体素相对于与3D身体网格相匹配的像素或体素的百分比。在3D身体网格的指定区域中的像素或体素的数目随着时间增加时，混合完成进度也增加。当3D身体网格的指定区域中的阈值数目或百分比的像素或体素与外部网格的对应像素或体素相匹配时，确定混合完成。

例如，响应于确定混合完成进度小于阈值，以第一速率将3D身体网格的一部分线性地混合到外部网格中，以创建部分形变的3D身体网格。例如在完成部分形变的3D身体网格之后，继续计算和测量混合完成进度。在示例中，可以确定混合完成进度已达到阈值(例如，3D身体网格的头部部分中的多于50％的像素与外部网格的头部部分相匹配)，并且作为响应，修改部分形变的3D身体网格继续被混合到外部网格中的第一速率，例如使第一速率增大或减小。在一些情况下，使第一速率增大，以使部分形变的3D身体网格继续以比初始速度快的速度混合到外部网格中。在一些情况下，使第一速率减小，以使部分形变的3D身体网格继续以比初始速度慢的速度混合到外部网格中。

在示例中，变形参数模块532可以计算混合完成进度，该混合完成进度表示在一定时间段内3D身体网格中有多少已被混合到外部网格中。响应于确定混合完成进度小于阈值(例如，3D身体网格的头部部分中少于50％的像素与外部网格的头部部分相匹配)，以第一速率将3D身体网格的该部分线性地混合到外部网格中，以创建部分形变的3D身体网格。例如在完成部分形变的3D身体网格之后，继续计算和测量混合完成进度。在示例中，可以确定混合完成进度已达到阈值(例如，3D身体网格的头部部分中多于50％的像素与外部网格的头部部分相匹配)，并且作为响应，部分变形的3D身体网格继续根据弹跳效果被混合到外部网格中，例如立即形变成外部网格。以这种方式，3D身体网格的头部部分例如可以在初始时间段例如3秒内，开始缓慢地混合到外部网格的头部部分中。在3秒过去之后，当3D身体网格部分部分地(但不完全地)混合到外部网格中时，3D身体网格的其余部分被立即绑定(bound)或形变到外部网格中。

在示例中，AR效果选择模块519基于从身体网格模块514接收到的与对象相关联的身体网格，选择一个或更多个AR元素或图形并将一个或更多个AR元素或图形应用于图像或视频中描绘的对象。与图像或视频中描绘的现实世界对象结合的这些AR图形被提供给图像修改模块518，以渲染描绘穿着AR对象(例如，AR钱包或耳环)的人的图像或视频。

图像修改模块518可以基于由视觉效果选择模块519选择的AR效果来调整由摄像装置捕获的图像。图像修改模块518例如通过基于用户的3D身体网格的改变和外力模拟而改变AR服装或时尚饰品的物理性质(变形)并应用一个或更多个AR元素(AR图形元素)来调整在图像或视频中呈现图像或视频中描绘的用户或人身上放置的(一个或多个)AR服装或时尚饰品的方式。图像显示模块520将由图像修改模块518进行的调整组合到所接收的描绘用户的身体的单目图像或视频中。该图像或视频由图像显示模块520提供给客户端设备102，并且然后可以被发送给另一用户或者被存储以供以后访问和显示。

在一些示例中，图像修改模块518可以从3D身体跟踪模块513接收表示图像中描绘的用户的3D位置的3D身体跟踪信息。3D身体跟踪模块513通过使用附加的机器学习技术对训练数据501进行处理来生成3D身体跟踪信息。图像修改模块518还可以从另一机器学习技术接收全身分割，该全身分割表示图像中哪些像素与用户的全身对应。可以从全身分割模块515接收全身分割。全身分割模块515通过使用机器学习技术对训练数据501进行处理来生成全身分割。

在一个示例中，如图7所示，AR效果选择模块519可以使用外部网格720将一个或更多个AR效果应用于与由客户端设备102捕获的3D身体网格710对应的在图像或视频700中描绘的对象。AR效果选择模块519可以接收请求将对象的一部分改变或混合成外部网格或AR效果的输入。输入可以选择要混合的对象的哪个部分、混合对象的速率，并且/或者可以仅识别自动地确定对象的位置和速率的AR效果。

外部网格720可以包括附着至3D身体网格710或与3D身体网格710交叠的部分。在示例中，外部网格720可以表示AR人、AR动物、AR图形、AR元素、AR部件、AR图像、AR视频、AR角色、AR化身或其他现实世界对象。例如，外部网格模块530可以接收3D身体网格710。外部网格模块530可以生成外部网格720，以镜像3D身体网格710的位置、取向和物理属性。外部网格模块530可以基于3D身体网格710的当前位置和取向，生成与外部网格720相关联的放置信息740。以这种方式，外部网格可以用来用表示人或用户的改变的AR图形替换图像或视频中对用户或人的描绘。放置信息740可以指定接近度参数742、UV通道坐标744、和/或变形参数746。基于放置信息740，外部网格模块530可以指定在图像或视频中将外部网格720(以及对应AR图形730)放置和定位在何处，以及3D身体网格710的哪些部分要混合或形变到外部网格720中。基于放置信息740，外部网格模块530可以向变形参数模块532指示用于控制3D身体网格710变换、混合、形变或改变到外部网格720中的速率和函数。

外部网格模块530还可以生成AR图形730，该AR图形730表示图像或视频中描绘的人或用户的视觉属性。即，外部网格模块530可以获得图像或视频中描绘的人的UV通道像素值。外部网格模块530可以将这些UV通道或像素值复制到与AR图形730相关联的纹理中。以这种方式，AR图形730看起来与图像或视频中描绘的人或用户相同。将AR图形730放置在外部网格720上，以呈现图像或视频中的人或用户的AR视觉描绘，该AR视觉描绘具有与现实世界的人或用户相同的姿态和视觉属性。以这种方式，当人或用户在图像或视频中四处移动时，基于外部网格720的更新，使对应的AR图形730类似地移动。

变形参数746可以指定改变，例如使手臂变长、使腰部变小、添加图形元素和/或改变AR图形730的纹理中的一部分的颜色。外部网格模块530可以基于变形参数746来修改AR图形730和/或外部网格720。以这种方式，可以使AR图形730的手臂看起来比与3D身体网格710对应的现实世界的人的手臂更长或更短。或者，可以使AR图形730的腰部看起来比与3D身体网格710对应的现实世界的人的腰部更小或更大。变形参数746还可以指定混合参数，该混合参数控制多快地将人或用户的现实世界描绘改变、变换或混合成表示人或用户的现实世界描绘的改变的AR图形。

在示例中，外部网格模块530可以计算外部网格720与3D身体网格710之间的对应722。如以上所讨论的，当3D身体网格710的一部分被形变或混合成外部网格720时，对应可以用于基于3D身体网格710如何变形来使外部网格720沿一个或更多个轴线724在3D上变形。当外部网格模块530使外部网格变形720时，类似地使对应的AR图形730变形和渲染，以基于放置信息740在图像或视频内显示。即，当外部网格模块530使外部网格720变形时，3D身体网格的指定部分被混合到其中的对应的AR图形730类似地进行变形并且被渲染，以基于放置信息740在图像或视频中显示。

如图8所示，图像800描绘了由客户端设备102的摄像装置捕获的现实世界的人或用户。在外部网格被变形并用于变换或混合3D身体网格710的一部分之后，将对应的AR图形渲染，以在图像或视频上显示。在示例中，如图像810所示，AR图形替换对现实世界的人或用户的描绘。图像810示出了与图像800中描绘的人相同但具有根据变形参数746进行的改变的人。作为示例，在图像810中示出的人的手臂在与该人对应的AR图形中更长。此外，图像810中示出的人的腹部部分或腰部部分在与该人对应的AR图形中更宽。此外，图像810中示出的人的腿部分不包括AR元素，该AR元素已经添加至与该人对应的AR图形中的腿部分，例如通过将AR纹身添加至腿部分。

图9是根据一些示例的由外部网格变形系统224执行的过程900的流程图。尽管流程图可以将操作描述为顺序过程，但是这些操作中的许多操作可以被并行或同时执行。此外，可以对操作的顺序进行重新排列。在过程的操作完成时，过程被终止。过程可以对应于方法、程序等。方法的步骤可以全部或部分地执行，可以结合其他方法中的一些或全部步骤来执行，并且可以由任何数目的不同系统或其任何部分(例如，包括在任何系统中的处理器)来执行。

在操作901处，如以上所讨论的，外部网格变形系统224(例如，客户端设备102或服务器)接收视频，该视频包括对现实世界对象的描绘。

在操作902处，如以上所讨论的，外部网格变形系统224生成与现实世界对象相关联的3D身体网格，该3D身体网格跟踪现实世界对象跨视频的帧的移动。

在操作903处，如以上所讨论的，外部网格变形系统224确定视频中描绘的现实世界对象的UV位置，以获得与UV位置相关联的像素值。

在操作904处，如以上所讨论的，外部网格变形系统224基于与UV位置相关联的像素值，生成外部网格和相关联的AR元素以表示现实世界对象。

在操作905处，如以上所讨论的，外部网格变形系统224基于3D身体网格的改变和变形参数来使外部网格变形。

在操作906处，如以上所讨论的，外部网格变形系统224基于经变形的外部网格来修改视频以用AR元素替换现实世界对象。

机器结构

图10是机器1000的图解表示，在该机器1000内可以执行用于使机器1000执行本文所讨论的方法中的任何一种或更多种方法的指令1008(例如，软件、程序、应用、小程序、app或其他可执行代码)。例如，指令1008可以使机器1000执行本文中描述的方法中的任何一个或更多个方法。指令1008将通用的未编程的机器1000变换成被编程为以所描述的方式执行所描述和所示出的功能的特定机器1000。机器1000可以作为独立设备操作，或者可以耦接(例如，联网)至其他机器。在联网部署中，机器1000可以在服务器客户端网络环境中以服务器机器或客户端机器的身份来操作，或者在对等(或分布式)网络环境中作为对等机器来操作。机器1000可以包括但不限于：服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如，智能手表)、智能家居设备(例如，智能电器)、其他智能设备、web装置、网络路由器、网络交换机、网络桥接器或能够顺序地或以其他方式执行指定要由机器1000采取的动作的指令1008的任何机器。此外，虽然仅示出了单个机器1000，但是术语“机器”还应被认为包括单独地或联合地执行指令1008以执行本文中讨论的任何一种或更多种方法的机器的集合。例如，机器1000可可以包括客户端设备102或者形成消息收发服务器系统108的一部分的若干服务器设备中的任何一个。在一些示例中，机器1000还可以包括客户端系统和服务器系统两者，其中特定方法或算法的某些操作在服务器侧执行，并且所述特定方法或算法的某些操作在客户端侧执行。

机器1000可以包括可以被配置成经由总线1040彼此通信的处理器1002、存储器1004和输入/输出(I/O)部件1038。在示例中，处理器1002(例如，中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、另外的处理器或其任何合适的组合)可以包括例如执行指令1008的处理器1006和处理器1010。术语“处理器”旨在包括多核处理器，所述多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图10示出了多个处理器1002，但是机器1000可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如，多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器、或者其任何组合。

存储器1004包括主存储器1012、静态存储器1014以及存储单元1016，其均可由处理器1002经由总线1040访问。主存储器1004、静态存储器1014和存储单元1016存储体现本文所描述的方法或功能中的任何一种或更多种的指令1008。指令1008在其由机器1000执行期间还可以完全地或部分地驻留在主存储器1012内、驻留在静态存储器1014内、驻留在存储单元1016内的机器可读介质1018内、驻留在处理器1002中的至少一个处理器内(例如，在处理器的高速缓存存储器内)或者驻留在其任何合适的组合内。

I/O部件1038可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量结果等的各种部件。包括在特定机器中的特定I/O部件1038将取决于机器的类型。例如，便携式机器诸如移动电话可以包括触摸输入设备或其他这样的输入机构，而无头服务器机器将很可能不包括这样的触摸输入设备。应当理解，I/O部件1038可以包括图10中未示出的许多其他部件。在各种示例中，I/O部件1038可以包括用户输出部件1024和用户输入部件1026。用户输出部件1024可以包括视觉部件(例如，显示器诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学部件(例如，扬声器)、触觉部件(例如，振动马达、阻力机构)、其他信号发生器等。用户输入部件1026可以包括字母数字输入部件(例如，键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如，鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如，物理按钮、提供触摸或触摸姿势的位置和力的触摸屏或其他触觉输入部件)、音频输入部件(例如，麦克风)等。

在其他示例中，I/O部件1038可以包括生物计量部件1028、运动部件1030、环境部件1032、或定位部件1034以及各种其他部件。例如，生物计量部件1028包括用于检测表达(例如，手表达、面部表达、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如，血压、心率、体温、出汗或脑波)、识别人(例如，语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件1030包括加速度传感器部件(例如，加速度计)、重力传感器部件、旋转传感器部件(例如，陀螺仪)。

环境部件1032包括例如一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如，光度计)、温度传感器部件(例如，检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如，气压计)、声学传感器部件(例如，检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如，检测附近对象的红外传感器)、气体传感器(例如，为了安全而检测危险气体的浓度或者测量大气中的污染物的气体检测传感器)，或者可以提供与周围物理环境对应的指示、测量或信号的其他部件。

关于摄像装置，客户端设备102可以具有摄像装置系统，该摄像装置系统包括例如在客户端设备102的前表面上的前置摄像装置和在客户端设备102的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端设备102的用户的静止图像和视频(例如，“自拍”)，该静止图像和视频然后可以用上述增强数据(例如，过滤器)进行增强。例如，后置摄像装置可以用于以更常规的摄像装置模式捕获静止图像和视频，其中，这些图像类似地用增强数据进行增强。除了前置摄像装置和后置摄像装置之外，客户端设备102还可以包括用于捕获360°照片和视频的360°的摄像装置。

此外，客户端设备102的摄像装置系统可以包括双后置摄像装置(例如，主摄像装置以及深度感测摄像装置)，或者甚至在客户端设备102的前后侧包括三重、四重或五重后置摄像装置配置。例如，这些多个摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。

定位部件1034包括位置传感器部件(例如，GPS接收器部件)、海拔高度传感器部件(例如，检测气压的高度计或气压计，根据气压可以得到海拔高度)、取向传感器部件(例如，磁力计)等。

可以使用各种各样的技术来实现通信。I/O部件1038还包括通信部件1036，该通信部件1036可操作以经由相应的耦接或连接将机器1000耦接至网络1020或设备1022。例如，通信部件1036可以包括与网络1020对接的网络接口部件或其他合适的设备。在另外的示例中，通信部件1036可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如，/>低功耗)、/>部件以及经由其他模态提供通信的其他通信部件。设备1022可以是另一机器或各种外围设备中的任何外围设备(例如，经由USB耦接的外围设备)。

此外，通信部件1036可以检测标识符或包括能够进行操作以检测标识符的部件。例如，通信部件1036可以包括射频标识(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如，用于检测一维条形码诸如通用产品代码(UPC)条形码、多维条形码诸如快速响应(QR)码、Aztec码、数据矩阵、数据符号(Dataglyph)、最大码(MaxiCode)、PDF417、超码(Ultra Code)、UCC RSS-2D条形码以及其他光学码的光学传感器)或声学检测部件(例如，用于识别所标记的音频信号的麦克风)。此外，可以经由通信部件1036得出各种信息，例如经由因特网协议(IP)地理位置得出位置、经由信号三角测量得出位置、经由检测可以指示特定位置的NFC信标信号得出位置等。

各种存储器(例如，主存储器1012、静态存储器1014以及处理器1002的存储器)以及存储单元1016可以存储由本文中所描述的方法或功能中的任何一种或更多种方法或功能实现或使用的一组或更多组指令和数据结构(例如，软件)。在由处理器1002执行的情况下，这些指令(例如，指令1008)使各种操作实现所公开的示例。

可以利用传输介质经由网络接口设备(例如，通信部件1036中包括的网络接口部件)并且使用若干公知的传输协议中的任何一种传输协议(例如，超文本传输协议(HTTP))，通过网络1020来发送或接收指令1008。类似地，可以利用传输介质经由与设备1022的耦接(例如，对等耦接)来发送或接收指令1008。

软件架构

图11是示出可以安装在本文中描述的设备中的任何一个或更多个设备上的软件架构1104的框图1100。软件架构1104由硬件支持，该硬件例如是包括处理器1120、存储器1126和I/O部件1138的机器1102。在该示例中，软件架构1104可以被概念化为层的堆栈，其中每个层提供特定功能。软件架构1104包括下述层，例如操作系统1112、库1110、框架1108和应用1106。在操作上，应用1106通过软件堆栈来激活API调用1150并且响应于API调用1150而接收消息1152。

操作系统1112管理硬件资源并提供公共服务。操作系统1112包括例如：核1114、服务1116以及驱动器1122。核1114用作硬件与其他软件层之间的抽象层。例如，核1114提供存储器管理、处理器管理(例如，调度)、部件管理、联网和安全设置等功能。服务1116可以针对其他软件层提供其他公共服务。驱动器1122负责控制底层硬件或与底层硬件对接(interface)。例如，驱动器1122可以包括显示驱动器、摄像装置驱动器、或/>低能耗驱动器、闪存驱动器、串行通信驱动器(例如，USB驱动器)、/>驱动器、音频驱动器、电力管理驱动器等。

库1110提供由应用1106使用的共用低级基础设施。库1110可以包括系统库1118(例如，C标准库)，该系统库1118提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。此外，库1110可以包括API库1124，例如媒体库(例如，用于支持各种媒体格式的呈现和操纵的库，所述各种媒体格式例如运动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层-3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如，用于在显示器上的图形内容中以2D和3D进行呈现的OpenGL框架)、数据库库(例如，提供各种关系数据库功能的SQLite)、web库(例如，提供web浏览功能的WebKit)等。库1110还可以包括各种其他库1128，以向应用1106提供许多其他API。

框架1108提供由应用1106使用的共用高级基础设施。例如，框架1108提供各种图形用户界面功能、高级资源管理以及高级定位服务。框架1108可以提供可以由应用1106使用的广泛的其他API，其中一些API可以特定于特定操作系统或平台。

在示例中，应用1106可以包括家庭应用1136、联系人应用1130、浏览器应用1132、书籍阅读器应用1134、定位应用1142、媒体应用1144、消息收发应用1146、游戏应用1148和诸如外部应用1140的各种各样的其他应用。应用1106是执行程序中定义的功能的程序。可以采用各种编程语言来创建以各种方式构造的应用1106中的一个或更多个，所述编程语言例如面向对象的编程语言(例如，Objective-C、Java或C++)或过程编程语言(例如，C或汇编语言)。在特定示例中，外部应用1140(例如，由特定平台的供应商之外的实体使用ANDROID^TM或IOS^TMSDK开发的应用)可以是在诸如IOS^TM、ANDROID^TM、Phone的移动操作系统或其他移动操作系统上运行的移动软件。在该示例中，外部应用1140可以激活由操作系统1112提供的API调用1150以促进本文中描述的功能。

术语表

“载波信号”是指能够存储、编码或携载用于由机器执行的指令的任何无形介质，并且包括数字或模拟通信信号或其他无形介质以促进这样的指令的传送。可以经由网络接口设备利用传输介质在网络上发送或接收指令。

“客户端设备”是指与通信网络接口以从一个或更多个服务器系统或其他客户端设备获得资源的任何机器。客户端设备可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、笔记本电脑、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信设备。

“通信网络”是指网络的一个或更多个部分，网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、其他类型的网络或两个或更多个这样的网络的组合。例如，网络或网络的一部分可以包括无线网络或蜂窝网络，并且耦接可以是码分多址(CDMA)连接、全局移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中，耦接可以实现各种类型的数据传输技术中的任何数据传输技术，诸如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、GSM演进的增强数据速率(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动通讯系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。

“部件”是指具有边界的设备、物理实体或逻辑，该边界由功能或子例程调用、分支点、API或者对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由它们的接口与其他部件对接以执行机器过程。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元，并且是通常执行相关功能中的特定功能的程序的一部分。

部件可以构成软件组件(例如，在机器可读介质上实施的代码)或硬件部件。“硬件部件”是能够执行某些操作并且可以以某种物理方式来配置或布置的有形单元。在各种示例中，可以通过软件(例如，应用或应用部分)将一个或更多个计算机系统(例如，独立计算机系统、客户端计算机系统或服务器计算机系统)或者计算机系统的一个或更多个硬件部件(例如，处理器或处理器组)配置为进行操作以执行本文中所描述的某些操作的硬件部件。

也可以机械地、电子地或其任何合适的组合来实现硬件部件。例如，硬件部件可以包括被永久配置成执行某些操作的专用电路或逻辑。硬件部件可以是专用处理器，例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。硬件部件还可以包括通过软件临时配置成执行某些操作的可编程逻辑或电路。例如，硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件而配置，硬件部件就成为被唯一地定制成执行所配置功能的特定机器(或机器的特定部件)，而不再是通用处理器。将认识到，可以出于成本和时间考虑来决定是机械地在专用且永久配置的电路中实现硬件部件还是在临时配置(例如，通过软件配置)的电路中实现硬件部件。因此，短语“硬件部件”(或“硬件实现的部件”)应当被理解成包含有形实体，即被物理构造、永久配置(例如，硬连线)或临时配置(例如，编程)成以某种方式进行操作或者执行本文中描述的某些操作的实体。

考虑硬件部件被临时配置(例如，被编程)的示例，无需在任一时刻对硬件部件中的每一个进行配置或实例化。例如，在硬件部件包括通过软件进行配置而变成专用处理器的通用处理器的情况下，可以在不同时间处将该通用处理器分别配置成不同的专用处理器(例如，包括不同的硬件部件)。软件相应地配置一个或多个特定处理器，以例如在一个时刻处构成特定硬件部件并且在不同时刻处构成不同的硬件部件。

硬件部件可以向其他硬件部件提供信息并且从其他硬件部件接收信息。因此，所描述的硬件部件可以被认为是通信地耦接的。在同时存在多个硬件部件的情况下，可以通过在硬件部件中的两个或更多个硬件部件之间或之中的信号传输(例如，通过适当的电路和总线)来实现通信。在多个硬件部件在不同时间处被配置或被实例化的示例中，可以例如通过将信息存储在多个硬件部件具有访问权限的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如，一个硬件部件可以执行操作并且将该操作的输出存储在与其通信地耦接的存储器设备中。然后，其他硬件部件可以在随后的时间处访问该存储器设备以检索所存储的输出并对其进行处理。硬件部件还可以发起与输入设备或输出设备的通信，并且可以对资源(例如，信息的集合)进行操作。

本文描述的示例方法的各种操作可以至少部分地由被临时配置(例如，通过软件)或被永久配置成执行相关操作的一个或更多个处理器来执行。无论是被临时地配置还是永久地配置，这样的处理器可以构成进行操作以执行本文中所描述的一个或更多个操作或功能的处理器实现的部件。如本文所使用的，“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地，在本文中描述的方法可以至少部分地由处理器实现，其中特定的一个或多个处理器是硬件的示例。例如，方法的至少一些操作可以由一个或更多个处理器1002或处理器实现的部件来执行。此外，一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或者作为“软件即服务”(SaaS)操作。例如，操作中的至少一些可以由一组计算机(作为包括处理器的机器的示例)来执行，其中这些操作可以经由网络(例如，因特网)并且经由一个或更多个适当的接口(例如，API)来访问。某些操作的执行可以分布在处理器之间，不是仅驻留在单个机器内，而是被跨若干机器部署。在一些示例中，处理器或处理器实现的部件可以位于单个地理位置(例如，在家庭环境、办公室环境或服务器群内)。在其他示例中，处理器或处理器实现的部件可以跨若干地理位置分布。

“计算机可读存储介质”是指机器存储介质和传输介质二者。因此，术语包括存储设备/介质和载波/调制数据信号二者。术语“机器可读介质”、“计算机可读介质”和“设备可读介质”意指相同的事物并且可以在本公开内容中互换使用。

“短暂消息”是指可访问达有限持续时间的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送方设置。可替选地，访问时间可以是默认设置或者由接收方指定的设置。无论设置技术如何，该消息都是暂态的。

“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储设备和介质(例如，集中式或分布式数据库，以及相关联的高速缓存和服务器)。因此，该术语应当被视为包括但不限于固态存储器以及光学和磁介质，包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和设备存储介质的具体示例包括：非易失性存储器，包括例如半导体存储器设备，例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存设备；磁盘，例如内部硬盘和可移除盘；磁光盘；以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“设备存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换使用。术语“机器存储介质”、“计算机存储介质”和“设备存储介质”明确地排除了载波、调制数据信号和其他这样的介质，其中的至少一些被涵盖在术语“信号介质”中。

“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。

“信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质，并且包括数字或模拟通信信号或有利于软件或数据的通信的其他无形介质。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”指的是其特性中的一个或更多个特性被以将信息编码在该信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”指的是相同的事物，并且可以在本公开内容中互换使用。

在不脱离本公开内容的范围的情况下，可以对所公开的示例进行改变和修改。这些以及其他改变或修改旨在包括在如所附权利要求书中所表达的本公开内容的范围内。

Claims

1.一种方法，包括：

由客户端设备的一个或更多个处理器接收视频，所述视频包括对现实世界对象的描绘；

由所述一个或更多个处理器生成与所述现实世界对象相关联的三维(3D)身体网格，所述三维(3D)身体网格跟踪所述现实世界对象跨所述视频的帧的移动；

确定所述视频中描绘的所述现实世界对象的UV位置，以获得与所述UV位置相关联的像素值；

基于与所述UV位置相关联的像素值，生成外部网格和相关联的增强现实(AR)元素以表示所述现实世界对象；

基于所述3D身体网格的改变和变形参数，使所述外部网格变形；以及

基于经变形的外部网格来修改所述视频以用所述AR元素替换所述现实世界对象。

2.根据权利要求1所述的方法，其中，所述现实世界对象包括人；并且

其中，所述AR元素包括表示所述人的身体的视觉属性的纹理。

3.根据权利要求1至2中任一项所述的方法，还包括：自动地建立与所述现实世界对象相关联的所述3D身体网格与所述外部网格之间的对应，其中，所述对应包括：将所述外部网格放置在与所述3D身体网格相同的位置和取向处。

4.根据权利要求1至3中任一项所述的方法，其中，所述UV位置表示所述现实世界对象在二维(2D)空间中的纹理。

5.根据权利要求1至4中任一项所述的方法，其中，在所述现实世界对象在描绘的现实世界环境中移动时，实时地修改所述视频以描绘所述现实世界对象正被改变成所述AR元素。

6.根据权利要求1至5中任一项所述的方法，其中，根据包括线性函数或非线性函数的混合参数，用所述AR元素替换所述现实世界对象。

7.根据权利要求1至6中任一项所述的方法，还包括：获得所述外部网格的放置信息，所述放置信息描述相对于所述3D身体网格将所述外部网格定位在何处。

8.根据权利要求1至7中任一项所述的方法，还包括：

计算所述现实世界对象的身体形状、身体状态或身体性质跨所述视频的帧的改变；以及

基于所述形状、所述身体状态或所述身体性质的改变，调整所述外部网格的形状。

9.根据权利要求1至8中任一项所述的方法，还包括：

计算所述现实世界对象的位置或比例跨所述视频的帧的改变；以及

基于所述位置或所述比例的改变，调整所述外部网格的位置或比例。

10.根据权利要求1至9中任一项所述的方法，还包括：

计算所述现实世界对象的旋转跨所述视频的帧的改变；以及

基于所述旋转的改变，3D地旋转所述外部网格。

11.根据权利要求1至10中任一项所述的方法，还包括：

针对所述视频的帧中的第一帧，确定所述身体网格在法线-切线空间中的第一组坐标；

针对所述视频的帧中的第二帧，确定所述身体网格在所述法线-切线空间中的第二组坐标；

实时地计算所述法线-切线空间中的所述第一组坐标与所述第二组坐标之间的改变；以及

将所述法线-切线空间中的所述第一组坐标与所述第二组坐标之间的改变传递至所述外部网格。

12.根据权利要求1至11中任一项所述的方法，还包括：

通过消息收发应用从所述外部网格的第三方设计者接收所述外部网格的放置信息；以及

基于所述放置信息，将所述外部网格添加至所述身体网格。

13.根据权利要求1至12中任一项所述的方法，还包括：

生成所述视频的帧的二维(2D)纹理图；

识别与所述现实世界对象对应的所述2D纹理图中的一部分；以及

基于与所述现实世界对象对应的所述2D纹理图中的一部分，确定所述视频中描绘的所述现实世界对象的UV位置，以获得与所述UV位置相关联的像素值。

14.根据权利要求1至13中任一项所述的方法，其中，所述变形参数标识所述外部网格的一部分，并且包括对所述外部网格的一部分的修改。

15.根据权利要求14所述的方法，其中，所述修改包括：放大所述外部网格的一部分的大小，以生成被放大的所述外部网格的一部分。

16.根据权利要求14至15中任一项所述的方法，还包括：

确定与被放大的所述外部网格的一部分的边缘对应的所述AR元素的像素值；以及

将所述外部网格的一部分的边缘的与所述AR元素相关联的像素值混合到与所述被放大的所述外部网格的一部分对应的所述AR元素的一部分中。

17.根据权利要求14至16中任一项所述的方法，其中，所述修改包括：减小所述外部网格的一部分的大小。

18.根据权利要求14至17中任一项所述的方法，其中，所述修改包括所述外部网格的一部分的颜色的改变，还包括：基于所述颜色的改变来调整与所述外部网格的一部分对应的所述AR元素的像素值。

19.一种系统，包括：

客户端设备的处理器；以及

存储器部件，所述存储器部件上存储有指令，所述指令在由所述处理器执行时使所述处理器执行操作，所述操作包括：

接收视频，所述视频包括对现实世界对象的描绘；

生成与所述现实世界对象相关联的三维(3D)身体网格，所述三维(3D)身体网格跟踪所述现实世界对象跨所述视频的帧的移动；

20.一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质上存储有指令，所述指令在由客户端设备的处理器执行时使所述处理器执行操作，所述操作包括：

接收视频，所述视频包括对现实世界对象的描绘；