CN117916776A - 利用物理模拟的适配身体的配件 - Google Patents
利用物理模拟的适配身体的配件 Download PDFInfo
- Publication number
- CN117916776A CN117916776A CN202280060842.9A CN202280060842A CN117916776A CN 117916776 A CN117916776 A CN 117916776A CN 202280060842 A CN202280060842 A CN 202280060842A CN 117916776 A CN117916776 A CN 117916776A
- Authority
- CN
- China
- Prior art keywords
- external
- mesh
- video
- grid
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004088 simulation Methods 0.000 title claims description 63
- 238000000034 method Methods 0.000 claims abstract description 100
- 230000033001 locomotion Effects 0.000 claims abstract description 74
- 230000003190 augmentative effect Effects 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 57
- 230000015654 memory Effects 0.000 claims description 35
- 230000008859 change Effects 0.000 claims description 23
- 230000004044 response Effects 0.000 claims description 19
- 239000004744 fabric Substances 0.000 claims description 12
- 230000037237 body shape Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 description 44
- 238000012986 modification Methods 0.000 description 44
- 238000004891 communication Methods 0.000 description 35
- 238000012549 training Methods 0.000 description 26
- 238000010801 machine learning Methods 0.000 description 23
- 238000012545 processing Methods 0.000 description 23
- 230000009466 transformation Effects 0.000 description 23
- 230000000007 visual effect Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 15
- 230000000694 effects Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 239000000463 material Substances 0.000 description 8
- 230000005484 gravity Effects 0.000 description 7
- 230000006855 networking Effects 0.000 description 7
- 230000011218 segmentation Effects 0.000 description 7
- 210000000988 bone and bone Anatomy 0.000 description 6
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 230000008602 contraction Effects 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000001624 hip Anatomy 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000010079 rubber tapping Methods 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000002085 persistent effect Effects 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000282320 Panthera leo Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 210000004247 hand Anatomy 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 210000004394 hip joint Anatomy 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 210000002414 leg Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 210000000323 shoulder joint Anatomy 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 210000003857 wrist joint Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/16—Cloth
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2210/00—Indexing scheme for image generation or computer graphics
- G06T2210/28—Force feedback
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2021—Shape modification
Landscapes
- Engineering & Computer Science (AREA)
- Computer Graphics (AREA)
- Computer Hardware Design (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Architecture (AREA)
- Information Transfer Between Computers (AREA)
- Processing Or Creating Images (AREA)
Abstract
公开了用于执行以下操作的方法和系统,该操作包括:接收视频,该视频包括对现实世界对象的描绘;生成与现实世界对象相关联的三维(3D)身体网格,该3D身体网格跟踪现实世界对象跨视频的帧的移动;获得与增强现实(AR)元素相关联的外部网格;确定外部网格的第一部分与3D身体网格的移动信息相关联;确定外部网格的第二部分与外力模型的移动信息相关联;分别基于3D身体网格的移动信息和外力模型的移动信息使外部网格的第一部分和第二部分变形;以及基于外部网格的经变形的第一部分和经变形的第二部分来修改视频以包括AR元素的显示。
Description
优先权要求
本申请要求于2021年9月8日提交的序列号为17/468,774的美国专利申请的优先权的权益,该美国专利申请通过引用整体并入本文。
技术领域
本公开内容总体上涉及使用消息收发应用提供增强现实(AR)体验。
背景技术
增强现实(AR)是对虚拟环境的修改。例如,在虚拟现实(VR)中,用户完全沉浸在虚拟世界中,而在AR中,用户沉浸在将虚拟对象与现实世界组合或将虚拟对象覆盖在现实世界上的世界中。AR系统旨在生成并呈现与现实世界环境真实地交互并且彼此之间进行交互的虚拟对象。AR应用的示例可以包括单人或多人视频游戏、即时消息收发系统等。
附图说明
在附图(其不一定按比例绘制)中,相像的数字可以在不同视图中描述类似部件。为了容易地标识对任何特定元素或动作的讨论,附图标记中的一个或多个最高有效数字是指该元素被首次引入时所在的图号。在附图的图中示出了一些非限制性示例,在附图中:
图1是根据一些示例的可以部署本公开内容的联网环境的图解表示。
图2是根据一些示例的消息收发客户端应用的图解表示。
图3是根据一些示例的在数据库中维护的数据结构的图解表示。
图4是根据一些示例的消息的图解表示。
图5是示出根据示例性示例的示例外部网格变形系统的框图。
图6、图7和图8是根据一些示例的外部网格变形系统的输出的图解表示。
图9是示出根据一些示例的外部网格变形系统的示例操作的流程图。
图10是根据一些示例的呈计算机系统形式的机器的图解表示,在该机器内可以执行一组指令以使该机器执行本文讨论的方法中的任何一种或更多种方法。
图11是示出可以在其中实现示例的软件架构的框图。
具体实施方式
下面的描述包括实施本公开内容的说明性示例的系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于说明的目的,阐述了许多具体细节以提供对各种示例的理解。然而,对于本领域技术人员而言明显的是,可以在没有这些具体细节的情况下实践示例。通常,不需要详细示出公知的指令实例、协议、结构和技术。
通常,VR和AR系统通过捕获用户的图像并另外地使用深度传感器获得图像中描绘的现实世界身体的深度图来显示表示给定用户的图像。通过一起处理深度图和图像,VR和AR系统可以检测用户在图像中的定位,并且可以适当地修改图像中的用户或背景。虽然这样的系统可以很好地工作,但是对深度传感器的需求限制了它们的应用范围。这是因为出于修改图像的目的而向用户设备添加深度传感器增加了设备的总成本和复杂度,从而使得它们的吸引力降低。
某些系统不需要使用深度传感器来修改图像。例如,某些系统允许用户替换在其中检测用户的面部的视频会议中的背景。具体地,这样的系统可以使用被优化用于识别用户的面部的专门技术来标识描绘用户面部的图像中的背景。然后,这些系统可以仅替换描绘背景的那些像素,使得在图像中现实世界背景被替选背景代替。然而,这样的系统通常无法识别用户的全身。因此,如果用户距摄像装置大于阈值距离,使得不仅仅是用户的面部被摄像装置捕获,则将背景替换为替选背景开始失效。在这种情况下,图像质量受到严重影响,并且用户的面部和身体中的多个部分可能被系统无意地移除,因为系统错误地标识出这样的部分属于图像的背景而不是前景。此外,当在图像或视频馈送中描绘多于一个用户时,这样的系统无法适当地替换背景。因为这样的系统通常无法将图像中的用户的全身与背景区分别,因此这些系统也不能将视觉效果应用于用户身体的某些部分例如衣服制品或时尚配件(例如,珠宝、手提包、手袋等)。
一些AR系统允许将AR图形添加至图像或视频,以提供引人入胜的AR体验。这样的系统可以从设计者接收AR图形,并且可以在图像或视频内缩放和定位AR图形。为了改进AR图形在图像或视频中描绘的人上的放置和定位,这样的系统检测图像或视频中描绘的人,并且生成表示人的骨骼的装备(rig)。然后,将该装备用于基于装备的移动的改变来调整AR图形。虽然这样的方法通常运行良好,但是实时生成人的装备以调整AR图形放置的需要增加了处理复杂性以及功率和存储器需求。这使得这样的系统效率低下或者不能在不牺牲计算资源或处理速度的情况下在小规模移动设备上运行。此外,装备仅表示图像或视频中人的骨骼或骨骼结构的移动,而没有考虑人的任何种类的外部物理属性,例如密度、重量、皮肤属性等。因此,这些系统中的任何AR图形可以在比例和定位方面进行调整,但是不能基于人的其他物理属性而变形。另外,AR图形设计师通常需要为他们的AR图形或AR时尚品创建兼容的装备。
所公开的技术通过生成图像中描绘的对象例如人的身体网格并使外部网格与身体网格相对应地变形来提高使用电子设备的效率。通过基于所描绘的对象的身体网格的改变来使外部网格变形,所公开的技术可以在不需要生成所描绘对象的装备或骨骼结构的情况下并以更高效的方式将一个或更多个视觉效果与图像或视频中描绘的人相关联地应用于图像或视频。特别地,所公开的技术可以将一个或更多个AR元素应用于图像或视频中描绘的人或对象,并且然后基于通过对象的身体网格的改变所确定的对象的移动来修改一个或更多个AR元素。
所公开的技术还可以基于不同的标准分别对AR元素的不同部分进行变形和修改。例如,可以基于对象的身体网格的改变来对与所描绘的对象附接或交叠的AR元素的第一部分(例如,手袋的带子)进行变形或修改。可以基于与外力(例如,物理模拟模型、碰撞模拟模型、链物理、布料模拟模型、重力位移等)相关联的信息使可以延伸超过并远离所描绘的对象和/或AR元素的第一部分悬吊的AR元素的第二部分与第一部分(一起、同时和/或分别)变形。这简化了将AR图形添加至图像或视频的过程,从而显著降低了生成这样的AR图形的设计约束和成本,并降低了处理复杂度以及功率和存储器需求。这也改进了AR图形是描绘对象的图像或视频中描绘的现实世界环境的一部分的错觉。这使得能够在小型移动设备上实时地将AR图形无缝且高效地添加至底层图像或视频。所公开的技术可以专门或主要应用于移动设备,而不需要移动设备向服务器发送图像/视频。在其他示例中,所公开的技术专门或主要应用于远程服务器,或者可以在移动设备与服务器之间进行分配。
此外,所公开的技术允许AR图形设计者为他们的AR图形生成外部网格,而不需要为AR图形创建兼容的装备,这节省了时间、精力和创建复杂度。所公开的技术通过创建身体网格与AR图形或AR时尚品的外部网格之间的对应关系,使得AR图形(AR时尚品)能够随着用户的形状(重量、高度、身体形状等)而变形。所公开的技术还使得AR图形的某些部分(通过使相关联的外部网格变形)能够基于外力模型或信息而不是基于身体网格和/或与身体网格移动信息组合而被修改或变形。在实现方式中,外力模型可以利用与身体网格模型的移动相关联的信息来计算对外部网格(和相关联的AR图形)的与外力模型相关联的部分的修改和变形。
因此,可以提供示出穿戴AR时尚品的用户的逼真显示,同时基于用户的三维(3D)移动——包括身体形状、身体状态、身体属性、位置和旋转的改变——以对于用户进行交互和选择来说直观的方式使AR时尚品变形。如本文中所使用的,“衣服制品”、“时尚品”和“服装”可互换地使用,并且应当被理解为具有相同的含义。这改善了用户在使用电子设备时的整体体验。此外,通过在不使用深度传感器的情况下提供这样的AR体验,减少了完成任务所需的系统资源的总量。
联网计算环境
图1是示出用于通过网络来交换数据(例如,消息及相关联的内容)的示例消息收发系统100的框图。消息收发系统100包括客户端设备102的多个实例,多个实例中的每个实例托管包括消息收发客户端104和其他外部应用109(例如,第三方应用)的多个应用。每个消息收发客户端104经由网络112(例如,因特网)通信地耦接至(例如,托管在相应的其他客户端设备102上的)消息收发客户端104的其他实例、消息收发服务器系统108以及外部应用服务器110。消息收发客户端104还可以使用应用编程接口(API)与本地托管的第三方应用(例如,外部app)109进行通信。
消息收发客户端104能够经由网络112与其他消息收发客户端104和消息收发服务器系统108进行通信并且交换数据。在消息收发客户端104之间以及在消息收发客户端104与消息收发服务器系统108之间交换的数据包括功能(例如,用于激活功能的命令)以及净荷数据(例如,文本、音频、视频或其他多媒体数据)。
消息收发服务器系统108经由网络112向特定消息收发客户端104提供服务器侧功能。虽然消息收发系统100的某些功能在本文被描述为由消息收发客户端104或由消息收发服务器系统108执行,但是某些功能的位置是在消息收发客户端104内还是在消息收发服务器系统108内可以是设计选择。例如,在技术上可能优选是:最初将某些技术和功能部署在消息收发服务器系统108内,但是后面将该技术和功能迁移至客户端设备102具有足够处理能力的消息收发客户端104。
消息收发服务器系统108支持向消息收发客户端104提供的各种服务和操作。这样的操作包括向消息收发客户端104发送数据、从消息收发客户端104接收数据以及对由消息收发客户端104生成的数据进行处理。作为示例,该数据可以包括消息内容、客户端设备信息、地理位置信息、媒体增强和覆盖、消息内容持久化条件、社交网络信息和实况事件信息。通过经由消息收发客户端104的用户界面(UI)可用的功能来激活和控制消息收发系统100内的数据交换。
现在具体地转至消息收发服务器系统108,API服务器116耦接至应用服务器114并且向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器120,该数据库服务器120有助于对数据库126进行访问,该数据库126存储与由应用服务器114处理的消息相关联的数据。类似地,web服务器128耦接至应用服务器114并且向应用服务器114提供基于web的接口。为此,web服务器128通过超文本传输协议(HTTP)和若干其他相关协议处理传入的网络请求。
API服务器116在客户端设备102与应用服务器114之间接收和发送消息数据(例如,命令和消息净荷)。具体地,API服务器116提供一组接口(例如,例程和协议),该组接口可以由消息收发客户端104调用或查询以激活应用服务器114的功能。API服务器116公开由应用服务器114支持的各种功能,包括:账户注册;登录功能;经由应用服务器114将消息从特定消息收发客户端104发送至另一消息收发客户端104;将媒体文件(例如,图像或视频)从消息收发客户端104发送至消息收发服务器118并用于另一消息收发客户端104的可能访问;设置媒体数据集合(例如,故事);检索客户端设备102的用户的朋友列表;检索这样的集合;检索消息和内容;在实体图(例如,社交图)中添加和删除实体(例如,朋友);在社交图中定位朋友;以及打开(例如,与消息收发客户端104相关的)应用事件。
应用服务器114托管多个服务器应用和子系统,包括例如消息收发服务器118、图像处理服务器122和社交网络服务器124。消息收发服务器118实现多个消息处理技术和功能,特别是与从消息收发客户端104的多个实例接收到的消息中包括的内容(例如,文本和多媒体内容)的汇总和其他处理相关的消息处理技术和功能。如将进一步详细描述的,来自多个源的文本和媒体内容可以被汇总成内容的集合(例如,称为故事或图库(gallery))。然后,使这些集合对消息收发客户端104可用。鉴于数据的其他处理器和存储器密集型处理的硬件要求,也可以由消息收发服务器118在服务器侧执行这样的处理。
应用服务器114还包括图像处理服务器122,该图像处理服务器122专用于执行各种图像处理操作,通常针对在从消息收发服务器118发送或者在消息收发服务器118处接收的消息的净荷内的图像或视频,执行各种图像处理操作。
图像处理服务器122用于实现增强系统208(如图2所示)的扫描功能。扫描功能包括当由客户端设备102捕获到图像时,在客户端设备102上激活并提供一个或更多个AR体验。具体地,客户端设备102上的消息收发应用104可以用于激活摄像装置。摄像装置向用户显示一个或更多个实时图像或视频以及一个或更多个AR体验的一个或更多个图标或标识符。用户可以选择标识符中的给定标识符来启动对应的AR体验或执行所期望的图像修改(例如,替换视频中的用户穿着的服装或者为视频中的用户穿着的服装重新着色或者基于用户所执行的姿势修改服装)。
社交网络服务器124支持各种社交联网功能和服务并使这些功能和服务对消息收发服务器118可用。为此,社交网络服务器124维护并且访问数据库126内的实体图308(如图3所示)。由社交网络服务器124支持的功能和服务的示例包括识别消息收发系统100的特定用户与之有关系或该特定用户正在“关注”的其他用户,并且还包括识别特定用户的兴趣和其他实体。
返回至消息收发客户端104,外部资源(例如,第三方应用109或小程序(applet))的特征和功能经由消息收发客户端104的接口对用户可用。消息收发客户端104接收对用于启动或访问诸如外部应用109的外部资源(例如,第三方资源)的特征的选项的用户选择。外部资源可以是安装在客户端设备102上的第三方应用(外部应用109)(例如,“原生应用”),或者托管在客户端设备102上或者位于客户端设备102的远端(例如,在第三方服务器110上)的第三方应用的小规模版本(例如,“小程序”)。第三方应用的小规模版本包括第三方应用(例如,第三方独立应用的全规模、原生版本)的特征和功能的子集,并且使用标记语言文档来实现。在一个示例中,第三方应用的小规模版本(例如,“小程序”)是第三方应用的基于web的标记语言版本,并且被嵌入在消息收发客户端104中。除了使用标记语言文档(例如,*ml文件)之外,小程序可以包括脚本语言(例如,.*js文件或.json文件)和样式表(例如,*ss文件)。
响应于接收到对用于启动或访问外部资源(外部应用109)的特征的选项的用户选择,消息收发客户端104确定所选择的外部资源是基于web的外部资源还是本地安装的外部应用。在一些情况下,本地安装在客户端设备102上的外部应用109可以例如通过在客户端设备102的主页画面上选择与外部应用109对应的图标来独立于消息收发客户端104并且与消息收发客户端104分别地启动。这样的外部应用的小规模版本可以经由消息收发客户端104启动或访问,并且在一些示例中,小规模外部应用的任何部分都不能(或者有限部分才能)在消息收发客户端104之外被访问。可以通过消息收发客户端104从外部APP服务器110接收与小规模外部应用相关联的标记语言文档并对这样的文档进行处理来启动小规模外部应用。
响应于确定外部资源是本地安装的外部应用109,消息收发客户端104指示客户端设备102通过执行与外部应用109对应的本地存储的代码来启动外部应用109。响应于确定外部资源是基于web的资源,消息收发客户端104与外部应用服务器110进行通信以获得与所选择的资源对应的标记语言文档。消息收发客户端104然后处理获得的标记语言文档以在消息收发客户端104的用户界面内呈现基于web的外部资源。
消息收发客户端104可以向客户端设备102的用户或与这样的用户有关的其他用户(例如,“朋友”)通知一个或更多个外部资源中发生的活动。例如,消息收发客户端104可以向消息收发客户端104中的对话(例如,聊天会话)中的参与者提供与用户组中的一个或更多个成员当前或最近使用外部资源有关的通知。可以邀请一个或更多个用户加入活跃的外部资源或者启动(该朋友组中)最近使用过但当前不活跃的外部资源。外部资源可以向对话中的各自使用相应的消息收发客户端104的参与者提供与进入聊天会话中的用户组中的一个或更多个成员分享外部资源中的项、状况、状态或定位的能力。共享项可以是交互式聊天卡,聊天的成员可以利用该交互式聊天卡进行交互,以例如启动对应的外部资源、查看外部资源内的特定信息或者将聊天的成员带到外部资源内的特定位置或状态。在给定的外部资源内,可以在消息收发客户端104上向用户发送响应消息。外部资源可以基于外部资源的当前上下文将不同的媒体项选择性地包括在响应中。
消息收发客户端104可以向用户呈现可用的外部资源(例如,第三方或外部应用109或小程序)的列表以启动或访问给定的外部资源。该列表可以被呈现在上下文相关菜单中。例如,表示外部应用109(或小程序)中的不同外部应用的图标可以基于用户如何启动(例如,从对话界面或从非对话界面启动)菜单而变化。
消息收发客户端104可以向用户呈现一个或更多个AR体验。作为示例,消息收发客户端104可以检测由客户端设备102捕获的图像或视频中的人。消息收发客户端104可以为图像或视频中描绘的人生成身体网格。身体网格可以是3D网格或多边形网格,其包括定义图像或视频中描绘的多面体对象的形状的顶点、边和面的集合。网格可以是几个封闭表面的集合。在数学矢量代数意义——这可能对于计算是重要的——上,网格可以是组织成几个矩阵的数字的集合。在几何描述中,网格可以由点组成,这些点通过线段连接在一起并且通过多边形被表面化。
消息收发客户端104可以接收对AR图形的用户选择,以添加至图像或视频。消息收发客户端104可以获得与AR图形相关联的外部网格。AR图形可以表示具有附接至所描绘的对象例如人的第一部分和从所描绘的对象的第一部分自由悬挂或悬吊的第二部分的时尚配件或其他项。例如,AR图形可以表示附接至人的耳朵或其他身体部位并且具有自由悬吊在空中的部分的耳饰。例如,AR图形可以表示缠绕在人的身体的腰部或其他身体部位周围并且具有自由悬吊在空中的部分的腰带。例如,AR图形可以表示缠绕在人的身体的头发或其他身体部位周围并且具有自由悬吊在空中的部分的发带。例如,AR图形可以表示附接至人的身体或其他身体部位并且具有自由悬吊在空中的部分的幻想项或对象(例如AR尾巴、额外的四肢、额外的头、长皮毛等)。AR图形可以表示一端附接至人的身体并且另一端自由悬吊的兔子耳朵。AR图形可以表示具有与图像或视频中描绘的人的身体交叠或附接的带子的手袋或手提包,并且该手袋或手提包具有从带子自由悬吊的容器部分(手袋)。与AR图形相关联的外部网格可以包括不同的部分,这些部分基于这些部分是否与图像或视频中描绘的对象附接或相关联或者从图像或视频中描绘的对象自由悬吊而分别变形。
消息收发客户端104可以自动地建立身体网格(例如,3D身体网格)与外部网格之间的对应关系。消息收发客户端104可以在图像或视频内将外部网格定位在3D身体网格上或相对于3D身体网格定位。消息收发客户端104可以(基于与外部网格相关联的放置信息)确定第一部分或第一组部分,该第一部分或第一组部分是基于与3D身体网格相关联的移动信息而变形的。消息收发客户端104可以(基于与外部网格相关联的放置信息)确定第二部分或第二组部分,该第二部分或第二组部分是基于外力模拟而变形的,该第二部分或第二组部分的变形与基于与3D身体网格相关联的移动信息使第一部分或第一组部分变形分别进行。然后,消息收发客户端104可以在图像或视频内显示AR图形(其已经基于外部网格的变形而变形)。这向用户提供了与具有以不同方式移动(基于人的移动或诸如重力或碰撞的外力的施加)的不同部分的所选AR图形相结合的人的图像或视频描述的逼真显示。在示例中,AR图形可以是诸如衬衫、裤子、裙子、连衣裙、珠宝、手袋、家具项、家居项、护目镜、眼镜、AR徽标、AR标志的时尚品或任何其他合适的项或对象。虽然关于添加至图像或视频的AR手袋(或客户端设备102的用户)讨论了所公开的示例,但是可以将类似的技术应用于任何其他AR项或衣服制品或时尚品,例如连衣裙、裤子、短裤、裙子、夹克、t恤衫、衬衫、眼镜、珠宝、耳饰、兔子耳朵、帽子、耳罩等。
以这种方式,消息收发客户端104可以基于与图像或视频中描绘的对象例如人相关联的身体网格的移动和其他改变(例如,身体形状、位置、旋转和比例的改变)并且基于外力的施加,来实时调整外部网格(并且因此调整与外部网格相关联的AR图形)。这提供了AR图形实际上包括在图像或视频中所描绘的现实世界环境中的错觉,从而改善了整体用户体验。下面结合图5提供外部网格相对于身体网格和外力的变形的进一步细节。
系统架构
图2是示出根据一些示例的关于消息收发系统100的另外的细节的框图。具体地,消息收发系统100被示为包括消息收发客户端104和应用服务器114。消息收发系统100包含多个子系统,这些子系统在客户端侧由消息收发客户端104支持并且在服务器侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、游戏系统212、以及外部资源系统220。
短暂定时器系统202负责实施消息收发客户端104和消息收发服务器118对内容的临时或时间受限访问。短暂定时器系统202包含多个定时器,这些定时器基于与消息或消息的集合(例如,故事)相关联的持续时间和显示参数,选择性地实现经由消息收发客户端104对消息和相关联的内容进行访问(例如,用于呈现和显示)。下面提供关于短暂定时器系统202的操作的另外的细节。
集合管理系统204负责管理媒体的合集或集合(例如,文本、图像视频和音频数据的集合)。内容(例如,消息,包括图像、视频、文本和音频)的集合可以被组织成“事件图库”或“事件故事”。这样的集合可以在指定的时间段内(例如,与内容相关的事件的持续时间内)可用。例如,可以使与音乐会有关的内容在音乐会的持续时间内作为“故事”可用。集合管理系统204还可以负责向消息收发客户端104的用户界面发布提供特定集合的存在的通知的图标。
此外,集合管理系统204还包括策展接口206,策展接口206允许集合管理者管理和策展特定内容集合。例如,策展接口206使得事件组织器能够策展与特定事件有关的内容的集合(例如,删除不适当的内容或冗余消息)。此外,集合管理系统204采用机器视觉(或图像识别技术)和内容规则来对内容集合进行自动策展。在某些示例中,可以针对将用户生成的内容包括到集合中而向用户支付补偿。在这样的情况下,集合管理系统204进行操作以自动地向这样的用户支付费用以使用其内容。
增强系统208提供使得用户能够增强(例如,注解或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如,增强系统208提供与生成和发布针对由消息收发系统100处理的消息的媒体覆盖(media overlay)有关的功能。增强系统208基于客户端设备102的地理位置可操作地向消息收发客户端104提供媒体覆盖或增强(例如,图像过滤器)。在另一示例中,增强系统208基于诸如客户端设备102的用户的社交网络信息的其他信息可操作地向消息收发客户端104提供媒体覆盖。媒体覆盖可以包括音频和视觉内容以及视觉效果。音频和视觉内容的示例包括图片、文本、徽标、动画和声音效果。视觉效果的示例包括颜色覆盖。音频和视觉内容或视觉效果可以被应用于客户端设备102处的媒体内容项(例如,照片)。例如,媒体覆盖可以包括可以覆盖在由客户端设备102拍摄的照片上的文本、图形元素或者图像。在另一示例中,媒体覆盖包括定位标识覆盖(例如,威尼斯海滩)、实况事件的名称或商家名称覆盖(例如,海滩咖啡馆)。在另一示例中,增强系统208使用客户端设备102的地理位置来标识包括客户端设备102的地理位置处的商家名称的媒体覆盖。媒体覆盖可以包括与商家相关联的其他标记。媒体覆盖可以被存储在数据库126中并且通过数据库服务器120进行访问。
在一些示例中,增强系统208提供基于用户的发布平台,该基于用户的发布平台使得用户能够在地图上选择地理位置并上传与所选择的地理位置相关联的内容。用户还可以指定特定媒体覆盖应当被提供给其他用户的环境。增强系统208生成包括所上传的内容并且将所上传的内容与所选择的地理位置相关联的媒体覆盖。
在其他示例中,增强系统208提供基于商家的发布平台,该基于商家的发布平台使得商家能够经由竞标过程选择与地理位置相关联的特定媒体覆盖。例如,增强系统208使最高出价商家的媒体覆盖与对应地理位置相关联达预定义时间量。增强系统208与图像处理服务器122通信以获得AR体验,并且在一个或更多个用户界面中呈现这样的体验的标识符(例如,作为实时图像或视频上的图标,或作为专用于所呈现的AR体验的标识符的界面中的缩略图或图标)。一旦选择了AR体验,则检索一个或更多个图像、视频或AR图形元素,并将其呈现为在由客户端设备102捕获的图像或视频之上的覆盖物。在一些情况下,摄像装置被切换至正面视角(例如,客户端设备102的前置摄像装置响应于特定AR体验的激活而被激活),并且来自客户端设备102的前置摄像装置而不是客户端设备102的后置摄像装置的图像开始显示在客户端设备102上。一个或更多个图像、视频或AR图形元素被检索并呈现为在由客户端设备102的前置摄像装置捕获和显示的图像之上的覆盖物。
在其他示例中,增强系统208能够经由网络112与另一客户端设备102上的另一增强系统208以及服务器通信并交换数据。交换的数据可以包括:标识共享AR会话的会话标识符;第一客户端设备102与第二客户端设备102(例如,多个客户端设备102,包括第一设备和第二设备)之间的变换,该变换用于将共享AR会话对准至共同原点;共同坐标系;功能(例如,用于激活函数的命令)以及其他净荷数据(例如,文本、音频、视频或其他多媒体数据)。
增强系统208将变换发送至第二客户端设备102,使得第二客户端设备102可以基于该变换来调整AR坐标系。以这种方式,第一客户端设备102和第二客户端设备102将它们的坐标系(coordinate systems and frames)同步以显示AR会话中的内容。具体地,增强系统208计算第二客户端设备102在第一客户端设备102的坐标系中的原点。然后,增强系统208可以基于从第二客户端设备102的角度来看的该原点在第二客户端设备102的坐标系中的位置来确定第二客户端设备102的坐标系中的偏移量。使用该偏移量生成变换,使得第二客户端设备102根据与第一客户端设备102的共同坐标系生成AR内容。
增强系统208可以与客户端设备102通信,以建立单独或共享的AR会话。增强系统208还可以耦接至消息收发服务器118以在共享AR会话中为客户端设备102建立电子群组通信会话(例如,群组聊天、即时消息收发)。可以使电子群组通信会话与由客户端设备102提供的会话标识符相关联以获得对电子群组通信会话和共享AR会话的访问权限。在一个示例中,客户端设备102首先获得对电子群组通信会话的访问权限,并且然后在电子群组通信会话中获得允许客户端设备102访问共享AR会话的会话标识符。在一些示例中,客户端设备102能够在无需应用服务器114中的增强系统208的帮助或与应用服务器114中的增强系统208通信的情况下访问共享AR会话。
地图系统210提供各种地理位置功能,并且支持由消息收发客户端104呈现基于地图的媒体内容和消息。例如,地图系统210使得能够在地图上显示(例如,存储在简档数据316中的)用户图标或化身,以指示用户的“朋友”的当前或过去位置,以及由这样的朋友在地图的上下文内生成的媒体内容(例如,包括照片和视频的消息的集合)。例如,可以在消息收发客户端104的地图界面上将用户从特定地理位置发布到消息收发系统100的消息在地图的该特定位置的上下文内显示给特定用户的“朋友”。用户还可以经由消息收发客户端104与消息收发系统100的其他用户(例如,使用适当的状态化身)共享他或她的位置和状态信息,其中该位置和状态信息在消息收发客户端104的地图界面的上下文内被类似地显示给选定用户。
游戏系统212在消息收发客户端104的上下文中提供各种游戏功能。消息收发客户端104提供游戏界面,该游戏界面提供可以由用户在消息收发客户端104的上下文内启动并且与消息收发系统100的其他用户一起玩的可用游戏(例如,基于web的游戏或基于web的应用)的列表。消息收发系统100还使得特定用户能够通过从消息收发客户端104向其他用户发出邀请来邀请这样的其他用户参与玩特定游戏。消息收发客户端104还支持玩游戏上下文内的语音消息收发和文本消息收发两者(例如,聊天)、为游戏提供排行榜,并且还支持提供游戏内奖励(例如,游戏币和物品)。
外部资源系统220向消息收发客户端104提供用于与外部应用服务器110通信以启动或访问外部资源的接口。每个外部资源(应用)服务器110托管例如基于标记语言(例如,HTML5)的应用或外部应用的小规模版本(例如,消息收发客户端104外部的游戏、实用程序、支付或骑乘共享应用)。消息收发客户端104可以通过从与基于web的资源相关联的外部资源(应用)服务器110访问HTML5文件来启动该基于web的资源(例如,应用)。在某些示例中,利用由消息收发服务器118提供的软件开发工具包(SDK)以JavaScript对由外部资源服务器110托管的应用进行编程。SDK包括具有可以由基于web的应用调用或激活的功能的API。在某些示例中,消息收发服务器118包括JavaScript库,该JavaScript库向给定的第三方资源提供对消息收发客户端104的某些用户数据的访问。HTML5被用作用于对游戏进行编程的示例技术,但是可以使用基于其他技术编程的应用和资源。
为了将SDK的功能集成到基于web的资源中,由外部资源(应用)服务器110从消息收发服务器118下载SDK或者由外部资源(应用)服务器110以其他方式来接收SDK。一旦被下载或接收,SDK就被包括为基于web的外部资源的应用代码的一部分。基于web的资源的代码然后可以调用或激活SDK的某些功能以将消息收发客户端104的特征集成至基于web的资源中。
存储在消息收发服务器118上的SDK有效地提供了外部资源(例如,第三方或外部应用109或小程序与消息收发客户端104)之间的桥接。这为用户提供了与消息收发客户端104上的其他用户交流的无缝体验,同时还保留了消息收发客户端104的外观。为了桥接外部资源与消息收发客户端104之间的通信,在某些示例中,SDK促进外部资源服务器110与消息收发客户端104之间的通信。在某些示例中,在客户端设备102上运行的WebViewJavaScriptBridge在外部资源与消息收发客户端104之间建立两个单向通信通道。在外部资源与消息收发客户端104之间经由这些通信通道异步地发送消息。每个SDK功能激活被作为消息和回调而发送。每个SDK功能通过构造唯一的回调标识符以及发送具有该回调标识符的消息来实现。
通过使用SDK,并非所有来自消息收发客户端104的信息都与外部资源服务器110共享。SDK基于外部资源的需求来限制共享哪些信息。在某些示例中,每个外部资源服务器110将与基于web的外部资源对应的HTML5文件提供给消息收发服务器118。消息收发服务器118可以在消息收发客户端104中添加基于web的外部资源的视觉表示(例如,盒设计(boxart)或其他图形)。一旦用户选择视觉表示或者指示消息收发客户端104通过消息收发客户端104的GUI访问基于web的外部资源的特征,消息收发客户端104则获得HTML5文件并且将访问基于web的外部资源的特征所需的资源实例化。
消息收发客户端104呈现针对外部资源的图形用户界面(例如,登录页面或标题画面)。在呈现登录页面或标题画面期间、之前或之后,消息收发客户端104确定所启动的外部资源是否先前已经被授权访问消息收发客户端104的用户数据。响应于确定启动的外部资源先前已被授权访问消息收发客户端104的用户数据,消息收发客户端104呈现外部资源的另一图形用户界面,其包括外部资源的功能和特征。响应于确定所启动的外部资源先前未被授权访问消息收发客户端104的用户数据,在显示外部资源的登录页面或标题画面的阈值时间段(例如,3秒)之后,消息收发客户端104滑动用于授权外部资源访问用户数据的菜单(例如,将菜单动画化为从画面底部浮现到画面的中间或其他部分)。该菜单标识外部资源将被授权使用的用户数据的类型。响应于接收到对接受选项的用户选择,消息收发客户端104将外部资源添加到已授权外部资源的列表,并且使得外部资源能够访问来自消息收发客户端104的用户数据。在一些示例中,由消息收发客户端104根据OAuth 2框架来授权外部资源访问用户数据。
消息收发客户端104基于被授权的外部资源的类型来控制与外部资源共享的用户数据的类型。例如,向包括全规模的外部应用(例如,第三方或外部应用109)的外部资源提供对第一类型的用户数据(例如,具有或不具有不同化身特性的用户的仅二维(2D)化身)的访问。作为另一示例,向包括外部应用的小规模版本(例如,第三方应用的基于web的版本)的外部资源提供对第二类型的用户数据(例如,支付信息、用户的2D化身、用户的3D化身、以及具有各种化身特性的化身)的访问。化身特性包括定制化身的外观(例如,不同姿态、面部特征、衣服等)的不同方式。
外部网格变形系统224基于图像或视频中描绘的对象的身体网格的实时改变并且基于外力模拟模型来使外部网格变形。在示例中,外部网格变形系统224基于与身体网格相关联的移动信息使外部网格的附接至身体网格的一部分或与身体网格的一部分交叠的第一部分变形。外部网格变形系统224基于外力模拟模型使外部网格的不与身体网格的任何部分交叠(例如,自由悬吊在空中但附接至第一部分)的第二部分变形。作为响应,外部网格变形系统224例如通过呈现适配于图像(或视频)中描绘的用户的时尚品或者在图像(或视频)中描绘的多个用户上呈现多个AR时尚品,来在图像或视频中呈现与外部网格相关联的AR图形。在一些示例中,外部网格变形系统224可以向AR图形添加基于外力模拟模型以与AR图形移动的方式类似的方式移动的附加视觉效果(例如粒子或火花)。下面结合图5示出并描述了外部网格变形系统224的说明性实现方式。
具体地,外部网格变形系统224是可以由在客户端设备102上实现的AR/VR应用访问的部件。AR/VR应用使用RGB摄像装置来捕获用户的单目图像。AR/VR应用对捕获的用户图像应用各种经过训练的机器学习技术,以生成表示图像中描绘的用户的3D身体网格,并且通过使与AR视觉效果相关联的一个或更多个外部网格变形来将一个或更多个AR视觉效果应用于所捕获的图像。在一些实现方式中,AR/VR应用实时地或定期地连续捕获用户的图像并更新3D身体网格和外部网格,以连续地或定期地更新所应用的一个或更多个视觉效果。这允许用户在现实世界中四处移动并实时查看一个或更多个视觉效果更新。在一些示例中,外部网格变形系统224在运行时间之前(例如,在AR图形被呈现给用户之前)自动地建立外部网格与3D身体网格之间的对应关系,并且然后在运行时间期间,外部网格和3D身体网格相对于彼此变形,以更新与外部网格相关联的AR图形的显示。在其他示例中,可以在运行时间期间连续地更新和生成自动对应关系,同时还使外部网格变形。
在训练中,外部网格变形系统224获得包括对具有不同体型和特性的一个或更多个用户的描绘的第一多个输入训练图像。这些训练图像还提供包括与每个图像中描绘的一个或更多个用户相对应的身体网格的真值(ground truth)信息。基于多个训练图像的特征来训练机器学习技术(例如,深度神经网络)。具体地,机器学习技术从给定训练图像中提取一个或更多个特征,并且估计针对给定训练图像中描绘的用户的3D身体网格。机器学习技术获得与训练图像相对应的包括3D身体网格的真值信息,并且调整或更新一个或更多个系数或参数,以改进对身体网格的后续估计。
数据架构
图3是示出根据某些示例的可以存储在消息收发服务器系统108的数据库126中的数据结构300的示意图。虽然数据库126的内容被示为包括多个表,但是应当理解,数据可以以其他类型的数据结构进行存储(例如,作为面向对象的数据库)。
数据库126包括存储在消息表302中的消息数据。对于任何特定的一个消息,该消息数据至少包括消息发送方数据、消息接收方(或接收者)数据和净荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储于消息表302中的消息数据内的信息的另外的细节。
实体表306存储实体数据,并且(例如,以参考的方式)链接至实体图308和简档数据316。其记录被维护在实体表302内的实体可以包括个人、公司实体、组织、对象、地点、事件等。与实体类型无关地,消息收发服务器系统108存储关于其的数据的任何实体可以是被识别的实体。每个实体被提供唯一标识符以及实体类型标识符(未示出)。
实体图308存储与实体之间的关系和关联有关的信息。仅作为示例,这样的关系可以是基于社交的、基于职业的(例如,在共同的公司或组织工作)、基于兴趣的或基于活动的。
简档数据316存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置,简档数据316可以被选择性地使用并呈现给消息收发系统100的其他用户。在实体是个人的情况下,简档数据316包括例如用户名、电话号码、地址、以及设置(例如,通知和隐私设置)以及用户选择的化身表示(或这样的化身表示的集合)。然后,特定用户可以将这些化身表示中的一个或更多个选择性地包括在经由消息收发系统100传送的消息的内容内以及由消息收发客户端104向其他用户显示的地图界面上。化身表示的集合可以包括“状态化身”,其呈现用户可以选择在特定时间传达的状态或活动的图形表示。
在实体是团体的情况下,除了团体名称、成员以及针对相关团体的各种设置(例如,通知)之外,针对团体的简档数据316还可以类似地包括与团体相关联的一个或更多个化身表示。
数据库126还在增强表310中存储增强数据,例如覆盖物(overlay)或过滤器(filters)。增强数据与视频(视频的数据被存储在视频表304中)和图像(图像的数据被存储在图像表312中)相关联并且被应用于视频和图像。
数据库126还可以存储与单独的和共享的AR会话有关的数据。该数据可以包括在第一客户端设备102的AR会话客户端控制器与第二客户端设备102的另一AR会话客户端控制器之间传送的数据,以及在AR会话客户端控制器与增强系统208之间传送的数据。数据可以包括用于建立共享AR场景的共同坐标系、设备之间的变换、会话标识符、描绘身体的图像、骨骼关节位置、腕关节位置、脚等的数据。
在一个示例中,过滤器是在向接收方用户呈现期间被显示为覆盖在图像或视频上的覆盖物。过滤器可以是各种类型的,包括当发送用户正在编写消息时由消息收发客户端104呈现给发送用户的一组过滤器中的用户选择的过滤器。其他类型的过滤器包括地理位置过滤器(也称为地理过滤器),可以基于地理定位将其呈现给发送用户。例如,可以基于由客户端设备102的全球定位系统(GPS)单元确定的地理位置信息,由消息收发客户端104在用户界面内呈现特定于附近或特定位置的地理位置过滤器。
另一类型的过滤器是数据过滤器,该数据过滤器可以由消息收发客户端104基于在消息创建过程期间由客户端设备102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定位置处的当前温度、发送用户行进的当前速率、客户端设备102的电池寿命或当前时间。
可以被存储在图像表312内的其他增强数据包括AR内容项(例如,与应用AR体验对应)。AR内容项或AR项可以是可以被添加至图像或视频的实时特殊效果和声音。
如上所述,增强数据包括AR内容项、覆盖物、图像变换、AR图像、AR徽标或标志以及涉及可以应用于图像数据(例如,视频或图像)的修改的类似项。这包括实时修改,实时修改在使用客户端设备102的设备传感器(例如,一个或多个摄像装置)捕获到图像时对图像进行修改并且然后在客户端设备102的屏幕上显示具有所述修改的图像。这还包括对所存储的内容(例如,图库中可以被修改的视频剪辑)的修改。例如,在能够访问多个AR内容项的客户端设备102中,用户可以将单个视频剪辑与多个AR内容项一起使用来查看不同的AR内容项将如何修改所存储的剪辑。例如,通过为内容选择不同的AR内容项,可以将应用不同伪随机移动模型的多个AR内容项应用于相同内容。类似地,可以将实时视频捕获与所示修改一起使用,以示出当前由客户端设备102的传感器捕获的视频图像将如何修改所捕获的数据。这样的数据可以仅在屏幕上显示而不存储在存储器中,或者由设备传感器捕获的内容可以在进行或不进行修改的情况(或者在这两种情况)下被记录并存储在存储器中。在一些系统中,预览特征可以同时示出不同的AR内容项在显示器中的不同窗口内看起来如何。这可以例如使得能够同时在显示器上查看具有不同伪随机动画的多个窗口。
因此,数据以及使用AR内容项的各种系统或使用该数据来修改内容的其他这样的变换系统可以涉及:对现实世界对象(例如,面部、手、身体、猫、狗、表面、对象等)的检测;在这样的对象离开视频帧中的视场、进入视频帧中的视场以及在视频帧中的视场四处移动时对这样的对象的跟踪;以及在跟踪这样的对象时对这样的对象的修改或变换。在各种示例中,可以使用用于实现这样的变换的不同的方法。一些示例可以涉及:生成一个或多个对象的3D网格模型,以及在视频内使用模型的变换和动画纹理来实现变换。在其他示例中,可以利用对对象上的点进行跟踪来将图像或纹理(其可以是2D或3D的)放置在跟踪位置处。在又一示例中,可以使用对视频帧的神经网络分析来将图像、模型或纹理放置在内容(例如,图像或视频的帧)中。因此,AR内容项或元素涉及以下两者:用于创建内容中的变换的图像、模型和纹理,以及利用对象检测、跟踪和放置来实现这样的变换所需的附加建模及分析信息。
可以利用保存在任何种类的计算机化系统的存储器中的任何种类的视频数据(例如,视频流、视频文件等)来执行实时视频处理。例如,用户可以加载视频文件并将其保存在设备的存储器中,或者可以使用设备的传感器来生成视频流。此外,可以使用计算机动画模型来处理任何对象,例如人的面部和人体部位、动物、或非生命事物(例如椅子、汽车或其他对象)。
在一些示例中,当连同要变换的内容一起选择特定修改时,由计算设备来识别要变换的元素,并且然后如果所述元素存在于视频的帧中,则检测并跟踪它们。根据修改请求来修改对象的元素,从而变换视频流的帧。针对不同类型的变换,可以通过不同的方法来执行对视频流的帧的变换。例如,对于主要涉及改变对象的元素的形式的帧变换,计算对象的每个元素的特征点(例如,使用主动形状模型(Active Shape Model,ASM)或其他已知方法)。然后,针对对象的至少一个元素中的每个元素生成基于特性点的网格。该网格被用于跟踪视频流中的对象的元素的后续阶段。在跟踪过程中,将所提及的用于各元素的网格与各元素的位置对准。然后,在网格上生成附加点。基于修改请求针对每个元素生成第一组第一点,并且基于该组第一点和修改请求针对每个元素生成一组第二点。然后,可以通过基于该组第一点、该组第二点和网格修改对象的元素来对视频流的帧进行变换。在这样的方法中,也可以通过跟踪和修改背景来改变经修改对象的背景或使其发生扭曲。
在一些示例中,可以通过计算对象的每个元素的特性点以及基于所计算的特性点生成网格来执行使用对象的元素改变对象的一些区域的变换。在网格上生成点,并且然后生成基于所述点的各种区域。然后通过将针对每个元素的区域与针对至少一个元素中的每个元素的位置对准来跟踪对象的元素,并且可以基于修改请求来修改区域的属性,从而对视频流的帧进行变换。取决于具体的修改请求,可以以不同的方式对所提及区域的属性进行变换。这样的修改可以涉及改变区域的颜色;从视频流的帧中移除区域的至少一些部分;将一个或更多个新对象包括到基于修改请求的区域中;以及修改或扭曲区域或对象的元素。在各种示例中,可以使用这样的修改的任何组合或其他类似修改。对于要被动画化的某些模型,可以选择一些特征点作为要用于确定针对模型动画的选项的整个状态空间的控制点。
在一些示例中,可以生成与不同对象相关联的两个网格,并且使两个网格彼此相对应地变形。第一网格(也被称为身体网格)可以与图像或视频中描绘的现实世界对象例如人相关联并且表示现实世界对象的移动。第二网格(也被称为外部网格)可以与要应用于现实世界对象的AR图形或效果相关联。第二网格可以与放置信息相关联,该放置信息指定如何在3D空间中相对于第一网格放置或定位第二网格。放置信息可以基于第一网格的一个或更多个顶点与第二网格的一个或更多个顶点之间的接近度(由最小或最大距离阈值或控制顶点的数目来控制)来捕获自动生成的对应关系信息。还可以根据UV空间信息来指定放置信息,该UV空间信息指示相对于第一网格的UV坐标在UV空间中将第二网格放置得多近或多远。放置信息还可以指定基于对应的第一网格的移动变形的第一组部分以及基于外力模拟模型变形的定第二组部分。当在图像或视频的捕获期间使第一网格实时变形时,第二网格的第一组部分和第二组部分类似地变形(基于第一网格和/或外力模拟模型的输出的改变),以实现对被渲染以在图像或视频中进行显示的对应AR图形的改变。
在使用身体/人检测来变换图像数据的计算机动画模型的一些示例中,使用特定的身体/人检测算法(例如,3D人体姿态估计和网格重建过程)在图像上检测身体/人。然后,将ASM算法应用于图像的身体/人区域,检测身体/人特征参考点。
可以使用适于身体/人检测的其他方法和算法。例如,在一些示例中,使用界标来定位特征,界标表示存在于所考虑的大多数图像中的可区分点。例如,对于身体/人界标,可以使用左臂的位置。如果初始界标不可标识,则可以使用次级界标。这样的界标标识过程可以用于任何这样的对象。在一些示例中,一组界标形成形状。可以使用形状中的点的坐标来将形状表示为矢量。利用使形状点之间的平均欧几里得距离最小化的相似性变换(其允许平移、缩放和旋转)来将一个形状与另一个形状对准。平均形状(mean shape)是经对准的训练形状的平均值。
在一些示例中,从与由全局身体/人检测器确定的身体/人的位置和大小对准的平均形状开始搜索界标。然后,这样的搜索重复以下步骤:通过对每个点周围的图像纹理进行模板匹配以调整形状点的位置来建议暂定形状,并且然后使暂定形状符合全局形状模型,直到发生收敛。在一些系统中,单独的模板匹配是不可靠的,并且形状模型对弱模板匹配的结果进行池化,以形成较强的整体分类器。在从粗分辨率到细分辨率的图像金字塔中的每一级处重复整个搜索。
变换系统可以在客户端设备(例如,客户端设备102)上捕获图像或视频流,并且在维持适当的用户体验、计算时间和功耗的同时,在客户端设备102上本地执行复杂的图像操纵。复杂的图像操纵可以包括大小和形状改变、情绪转变(例如,将面部从皱眉改变为微笑)、状态转变(例如,使主体变老、减小外表年龄、改变性别)、风格转变、图形元素应用、3D人体姿态估计、3D身体网格重建以及由已经被配置成在客户端设备102上有效地执行的卷积神经网络实现的任何其他合适的图像或视频操纵。
在一些示例中,用于变换图像数据的计算机动画模型可以由下述系统使用:在所述系统中,用户可以使用具有神经网络的客户端设备102来捕获用户的图像或视频流(例如,自拍),其中神经网络作为在客户端设备102上操作的消息收发客户端104的一部分来操作。在消息收发客户端104内操作的变换系统确定图像或视频流内的身体/人的存在,并且提供与用于变换数据图像的计算机动画模型相关联的修改图标,或者计算机动画模型可以与本文描述的界面相关联地存在。该修改图标包括下述改变,所述改变可以是作为修改操作的一部分的用于修改图像或视频流内的用户的身体/人的基础。一旦选择了修改图标,则变换系统发起转换用户的图像以反映所选择的修改图标(例如,为用户生成微笑面部)的处理。一旦捕获到图像或视频流并且选择了指定的修改,就可以在客户端设备102上显示的图形用户界面中呈现经修改的图像或视频流。变换系统可以针对图像或视频流的一部分实施复杂的卷积神经网络,以生成并应用所选择的修改。也就是说,用户可以捕获图像或视频流,并且一旦选择了修改图标,就可以实时或接近实时地向用户呈现修改后的结果。此外,在正捕获视频流并且所选择的修改图标保持切换时,修改可以是持久的。机器学习的神经网络可以用于实现这样的修改。
呈现由变换系统执行的修改的图形用户界面可以向用户提供附加的交互选项。这样的选项可以基于用于发起对特定计算机动画模型的选择和内容捕获的界面(例如,从内容创建者用户界面来发起)。在各种示例中,在最初选择了修改图标之后,修改可以是持久的。用户可以通过轻击或以其他方式选择正由变换系统修改的身体/人来开启或关闭修改,并将其存储以供后面观看或浏览到成像应用的其他区域。在由变换系统修改了多个面部的情况下,用户可以通过轻击或选择在图形用户界面内修改和显示的单个身体/人来全局地将修改切换为打开或关闭。在一些示例中,可以单独修改一组多个身体/人中的各个身体/人,或者可以通过轻击或选择图形用户界面内显示的单个身体/人或一系列身体/人来单独切换这样的修改。
故事表314存储与消息和相关联的图像、视频或音频数据的集合有关的数据,这些消息和相关联的图像、视频或音频数据被汇编成集合(例如,故事或图库)。特定集合的创建可以由特定用户(例如,其记录被维护在实体表306中的每个用户)发起。用户可以创建呈已经由该用户创建和发送/广播的内容的集合的形式的“个人故事”。为此,消息收发客户端104的用户界面可以包括用户可选择的图标,以使得发送用户能够将特定内容添加至他或她的个人故事。
集合可以构成“实况故事”,该“实况故事”是手动地、自动地或使用手动技术和自动技术的组合创建的来自多个用户的内容的集合。例如,“实况故事”可以构成来自各种位置和事件的用户提交的内容的策展流。其客户端设备启用了位置服务并且在特定时间处于共同位置事件处的用户可以例如经由消息收发客户端104的用户界面而被呈现将内容贡献给特定实况故事的选项。可以由消息收发客户端104基于用户的位置向他或她标识实况故事。最终结果是从社区角度讲述的“实况故事”。
另一类型的内容集合被称为“位置故事”,“位置故事”使得其客户端设备102位于特定地理位置(例如,在学院或大学校园)内的用户能够对特定集合做出贡献。在一些实施方式中,对位置故事的贡献可能需要二级认证,以验证最终用户属于特定的组织或其他实体(例如,是大学校园的学生)。
如以上提及的,视频表304存储视频数据,在一个示例中,该视频数据与其记录被维护在消息表302内的消息相关联。类似地,图像表312存储与其消息数据被存储在实体表306中的消息相关联的图像数据。实体表306可以使来自增强表310的各种增强与存储在图像表312和视频表304中的各种图像和视频相关联。
经训练的机器学习技术307存储在外部网格变形系统224的训练期间已训练的参数。例如,经训练的机器学习技术307存储一个或更多个神经网络机器学习技术的经训练的参数。
数据通信架构
图4是示出根据一些示例的消息400的结构的示意图,消息400由消息收发客户端104生成,以用于传送至另外的消息收发客户端104或消息收发服务器118。特定消息400的内容用于填充存储在可由消息收发服务器118访问的数据库126内的消息表302。类似地,消息400的内容作为客户端设备102或应用服务器114的“运输中(in-transit)”或“飞行中(in-flight)”数据存储库在存储器中。消息400被示出为包括以下示例组成部分。
·消息标识符402:标识消息400的唯一标识符。
·消息文本净荷404:要由用户经由客户端设备102的用户界面生成并且包括在消息400中的文本。
·消息图像净荷406:由客户端设备102的摄像装置部件捕获的或从客户端设备102的存储器部件检索的并且包括在消息400中的图像数据。针对已发送或接收的消息400的图像数据可以存储在图像表312中。
·消息视频净荷408:由摄像装置部件捕获的或者从客户端设备102的存储器部件检索的并且包括在消息400中的视频数据。针对已发送或接收的消息400的视频数据可以存储在视频表304中。
·消息音频净荷410:由麦克风捕获的或从客户端设备102的存储器部件检索的并且包括在消息400中的音频数据。
·消息增强数据412:表示要应用于消息400的消息图像净荷406、消息视频净荷408或消息音频净荷410的增强的增强数据(例如,过滤器、标贴或其他标注或增强)。针对已发送或接收的消息400的增强数据可以存储在增强表310中。
·消息持续时间参数414:以秒为单位指示消息的内容(例如,消息图像净荷406、消息视频净荷408、消息音频净荷410)将经由消息收发客户端104呈现给用户或使其可由用户访问的时间量的参数值。
·消息地理位置参数416:与消息的内容净荷相关联的地理位置数据(例如,纬度坐标和经度坐标)。在净荷中可以包括多个消息地理位置参数416值,这些参数值中的每个参数值都与包括在内容中的内容项(例如,消息图像净荷406内的特定图像,或消息视频净荷408中的特定视频)相关联。
·消息故事标识符418:标识与消息400的消息图像净荷406中的特定内容项相关联的一个或更多个内容集合(例如,故事表314中标识的“故事”)的标识符值。例如,可以使用标识符值将消息图像净荷406内的多个图像各自与多个内容集合相关联。
·消息标签420:每个消息400可以用多个标签来标记,所述多个标签中的每一个指示消息净荷中包括的内容的主题。例如,在消息图像净荷406中包括的特定图像描绘动物(例如,狮子)的情况下,指示相关动物的标签值可以被包括在消息标签420内。标签值可以基于用户输入手动生成,或者可以使用例如图像识别自动生成。
·消息发送者标识符422:指示在其上生成消息400以及从其发送消息400的客户端设备102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或设备标识符)。
·消息接收者标识符424:指示消息400寻址到的客户端设备102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或设备标识符)。
消息400的各组成部分的内容(例如,值)可以是指向在其内存储内容数据值的表中的位置的指针。例如,消息图像净荷406中的图像值可以是指向图像表312内的位置的指针(或图像表312内的位置的地址)。类似地,消息视频净荷408内的值可以指向存储在视频表304内的数据,存储在消息增强数据412中的值可以指向存储在增强表310中的数据,存储在消息故事标识符418中的值可以指向存储在故事表314中的数据,并且存储在消息发送者标识符422和消息接收者标识符424中的值可以指向存储在实体表306中的用户记录。
外部网格变形系统
图5是示出根据示例性示例的示例外部网格变形系统224的框图。外部网格变形系统224包括一组部件510,该组部件对一组输入数据(例如,描绘现实世界对象(例如人)的单目图像或训练数据)进行操作。该组输入数据在训练阶段期间从一个或更多个数据库(图3)获得,并且在例如由消息收发客户端104使用AR/VR应用时从客户端设备102的RGB摄像装置获得。外部网格变形系统224包括机器学习技术模块512、骨骼关键点模块511、身体网格模块514、图像修改模块518、AR效果选择模块519、外部网格模块530、外力模拟模块532、3D身体跟踪模块513、全身分割模块515和图像显示模块520。
在训练期间,外部网格变形系统224从训练数据501接收给定的训练图像或视频。外部网格变形系统224使用机器学习技术模块512对给定的训练图像或视频应用一个或更多个机器学习技术。机器学习技术模块512从给定的训练图像或视频中提取一个或更多个特征,以估计图像或视频中描绘的人或用户的3D身体网格。
机器学习技术模块512检索与给定的训练图像或视频相关联的3D身体网格信息。机器学习技术模块512将所估计的3D身体网格与作为训练数据502的一部分提供的真值服装3D身体网格进行比较。基于比较的差异阈值或偏差,机器学习技术模块512更新一个或更多个系数或参数,并且获得一个或更多个附加的训练图像或视频。在已经处理了指定数目时期(epoch)或批次(batch)训练图像之后以及/或者当差异阈值或偏差达到指定值时,机器学习技术模块512完成训练,并且机器学习技术模块512的参数和系数被存储在经训练的机器学习技术307中。
在一些示例中,在训练期间,机器学习技术模块512从骨骼关键点模块511接收2D骨骼关节信息。骨骼关键点模块511跟踪在给定训练图像中描绘的用户的骨骼关键点(例如,头关节、肩关节、髋关节、腿关节等),并且提供骨骼关键点的2D或3D坐标。机器学习技术模块512使用该信息来识别训练图像中描绘的用户的区别属性并且生成3D身体网格。
由机器学习技术模块512生成的3D身体网格被提供给身体网格模块514。身体网格模块514可以跟踪图像或视频中描绘的对象,并且更新与该对象相关联的3D身体网格。在示例中,身体网格模块514可以基于由3D身体跟踪模块513提供的3D身体跟踪信息来跟踪对象。身体网格模块514可以在3D上更新3D身体网格,并且可以调整3D身体网格的位置、体型、旋转或任何其他参数。
图6是根据一些示例的外部网格变形系统224的输出的图解表示。具体地,图6示出了由身体网格模块514生成并跟踪的3D身体网格600。在一个示例中,身体网格模块514可以跟踪3D身体网格跨视频帧的改变。身体网格模块514可以将3D身体网格的改变提供给外部网格模块530,以基于3D身体网格的改变来更新外部网格的附接至3D身体网格或与3D身体网格交叠的第一部分并使该第一部分变形。
外部网格模块530可以识别与3D身体网格的改变分别变形的外部网格的第二部分。具体地,外部网格模块530可以识别外部网格的远离对应的3D身体网格延伸的一组顶点、体素、像素、UV位置或其他部分。这些部分可以被标记或识别为基于外力模拟(例如,物理模拟)而变形的外部网格的第二部分。外部网格模块530可以与外力模拟模块532通信,以获得与识别的第二部分相关联的变形或移动信息。外部网格模块530可以向外力模拟模块532提供3D身体网格的移动信息。外部网格模块530可以基于从外力模拟模块532接收的变形或移动信息来使识别的外部网格的第二部分(与第一部分分别地)变形。例如,外部网格模块530可以从外力模拟模块532接收以下指示:移动或位移方向、旋转或者形状、大小或位置的调整,并且然后可以基于所接收的指示使第二部分变形。以这种方式,外部网格模块530使外部网格的基于3D身体网格的移动的、连接至3D身体网格或与3D身体网格交叠的部分与从3D身体网格自由悬吊的部分分别变形。
在示例中,身体网格模块514可以针对视频的帧中的第一帧确定3D身体网格在法线切线空间中的第一组坐标,并且可以针对视频的帧中的第二帧确定3D身体网格在法线切线空间中的第二组坐标。身体网格模块514可以实时计算法线切线空间中的第一组坐标与第二组坐标之间的改变,并且可以将法线切线空间中的第一组坐标与第二组坐标之间的改变传输至外部网格。具体地,外部网格模块530可以基于法线切线空间中的第一组坐标与第二组坐标之间的改变来更新和调整附接至3D身体网格或与3D身体网格交叠的外部网格部分的3D位置和3D取向。以这种方式,外部网格模块530可以在不使用现实世界对象的装备或骨骼信息的情况下使与AR图形相关联的外部网格的第一部分变形。在示例中,外部网格模块530可以计算法线切线空间(或任何其他合适的空间)中的第一组坐标改变为第二组坐标的速度。外部网格模块530可以基于法线切线空间(或任何其他合适的空间)中的第一组坐标改变为第二组坐标的速度来使外部网格的第二部分变形。例如,如果图像或视频中描绘的人以特定速度或速率转动或扭转,身体网格模块514可以计算表示人转动或扭转的方向和速率的第一速度。该第一速度被提供给外部网格模块530,该外部网格模块然后基于第一速度使外部网格的自由悬挂或悬吊部分改变或变形。在示例中,第一速度可以包括第一值,在这种情况下,外部网格的第二部分以与人转动或扭转相同的速率沿着z轴在与人转动或扭转的方向相反的方向上移动。
外部网格模块530可以从AR效果模块519接收AR图形的指示。AR效果模块519可以接收选择给定的AR图形(例如,AR手袋、AR项链、AR布臂带、AR腰带等)以实时添加至底层图像或视频的用户输入。外部网格模块530可以访问数据库,并且在数据库中搜索与给定的AR图形相关联的外部网格。外部网格模块530可以获得外部网格的放置信息。放置信息可以指定:在图像或视频中将AR图形关于或相对于现实世界对象放置在何处,以及AR图形的哪些部分基于现实世界对象的移动而变形,以及AR图形的哪些其他部分基于外力模拟(例如,风、碰撞、物理、重力等)而变形。
在一个示例中,放置信息可以指定与附接至外部网格的第一部分或与外部网格的第一部分交叠的现实世界图形(例如,左臂、右臂、头部等)相对应的3D身体网格的边缘或身体部位。放置信息还可以指定边缘或身体部位之间的最小距离,距该最小距离可以渲染对应的AR图形(外部网格的第一部分)的边缘以进行显示。作为响应,外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置保持在至少距身体网格的边缘或身体部位的最小距离处。同时,基于外力模拟模块532的输出,使外部网格的第二部分移动、移位和变形。
在一个示例中,放置信息可以指定与附接至外部网格的第一部分或与外部网格的第一部分交叠的现实世界图形(例如,左臂、右臂、头部等)相对应的身体网格的边缘或身体部位。放置信息还可以指定边缘或身体部位之间的最大距离,距该最大距离可以渲染对应的AR图形(外部网格)的边缘以进行显示。作为响应,外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置保持在最多距身体网格的边缘或身体部位的最大距离处。同时,基于外力模拟模块532的输出,使外部网格的第二部分移动、移位和变形。
在一个示例中,放置信息可以指定与附接至外部网格的第一部分或与外部网格的第一部分交叠的现实世界图形(例如,左臂、右臂、头部等)相对应的身体网格的边缘或身体部位。放置信息还可以指定边缘或身体部位之间的距离范围,距该距离范围可以渲染对应的AR图形(外部网格)的边缘以进行显示。作为响应,外部网格模块530可以遍及多个视频帧将外部网格(和对应的AR图形)的位置保持在距身体网格的边缘或身体部位的距离范围的最小值与最大值之间。同时,基于外力模拟模块532的输出,使外部网格的第二部分移动、移位和变形。
在一个示例中,放置信息可以指定附接至外部网格的第一部分或与外部网格的第一部分交叠的3D身体网格的相对UV通道坐标。相对UV通道坐标可以用于将外部网格(和对应的AR图形)保持和放置在描绘对象的图像或视频内。在这种情况下,外部网格模块530可以获得与图像或视频中描绘的现实世界对象相对应的3D身体网格的UV通道坐标。外部网格模块530还可以基于与3D身体网格相关联的UV坐标和放置信息中的相对UV通道坐标来计算外部网格的第一部分的一组UV通道坐标。例如,放置信息可以指定距3D身体网格的特定UV通道坐标的最小或最大距离,可以在该最小或最大距离处放置外部网格的第一部分。作为响应,外部网格模块530可以将外部网格放置在处于距3D身体网格的UV坐标的最小或最大距离内的一组UV通道坐标处。因此,在与该组UV坐标对应的位置处将与外部网格相关联的对应AR图形添加至图像或视频。同时,基于外力模拟模块532的输出,使外部网格的第二部分移动、移位和变形。即,外部网格模块530可以识别外部网格的附接至外部网格的第一部分或与外部网格的第一部分相邻且不附接至3D身体网格的第二部分。该第二部分可以基于从外力模拟模块532接收的信息而变形和移动。
放置信息可以指定外部网格的哪些顶点、像素、UV坐标或位置与3D身体网格相关联、附接至3D身体网格以及/或者与3D身体网格交叠。对于这样的第一部分,放置信息包括基于3D身体网格的对应部分的移动信息使外部网格变形的指示。放置信息可以指定外部网格的哪些顶点、像素、UV坐标或位置自由地悬吊于3D身体网格。对于这些第二部分,放置信息包括基于由外力模拟模块提供的计算和变形来使外部网格变形的指示。在一个示例中,放置信息可以包括外力细节,该外力细节指定用于计算第二部分的对应变形的外力函数。外力函数可以包括物理模拟、碰撞模拟、链物理、布料模拟和/或其他合适的外力模拟函数。
基于针对3D身体网格检测到的改变和放置信息,外部网格模块530可以与3D身体网格中检测到的改变相对应地使外部网格的第一部分变形。在一个示例中,可以响应于检测到3D身体网格的3D位置的改变,使外部网格变形以改变相对于3D身体网格的3D上的位置。例如,如果确定3D身体网格沿第一轴线移动了第一量,则外部网格类似地沿第一轴线移动第一量(或被计算为第一量的因子的一些其他量)。基于从外力模拟模块532接收的外力模拟信息,外部网格的第二部分可以沿第二轴线移动。作为另一示例,可以以与3D身体网格对应的方式旋转或扭转外部网格。具体地,如果确定3D身体网格沿旋转轴线旋转了第二量,则外部网格类似地沿旋转轴线旋转第二量(或被计算为第二量的因子的一些其他量)。
作为另一示例,可以在不使外部网格的第二部分变形的情况下基于身体形状、身体状态或身体属性跨图像或视频的帧的改变使外部网格的第一部分变形。具体地,如果3D身体网格的一部分在大小上减小(例如,腰部由于外力例如手放在腰部上而缩进了指定量),则外部网格的对应部分也按相同的量或其他指定量在大小上减小或在3D空间中重新定位。即,如果外部网格与覆盖在图像或视频中描绘的人的顶部上的AR手袋带相关联,则由于3D身体网格在大小上减小或缩进,AR手袋的带子(与对应于腰部的AR手袋带相关联的外部网格的部分)也在大小上减小或缩进。在另一示例中,3D身体网格可以基于图像中描绘的人的呼吸循环定期地扩展和收缩3D身体网格的胸部部分(或上身部分)。在这样的情况下,使放置在3D身体网格的胸部或上身部分(但不是外部网格的任何其他部分)上的外部网格的对应部分变形,以根据呼吸循环在大小上扩展和收缩。
在示例中,身体网格模块514可以计算对应对象的法线切线空间中的改变。即,身体网格模块514可以确定3D身体网格在法线切线空间中的移动,并且可以将该移动的指示提供给外部网格模块530。外部网格模块530可以基于法线切线空间中的移动对外部网格应用改变。在一些情况下,外部网格模块530可以使外部网格的第一部分变形,以反映法线切线空间中的相同移动。在一些情况下,外部网格模块530可以按照法线切线空间中的移动的因子使外部网格的第一部分变形。同时,外部网格模块530可以基于对应对象的法线切线空间中的变化速度使外部网格的第二部分变形。即,可以使外部网格的第一部分变形以反映3D身体网格的法线切线空间中的改变,而可以根据发生这样的改变的速度使外部网格的第二部分变形。
外力模拟模块532可以实现多个不同的外力模拟模型,并且可以组合它们的输出以生成外部网格的第二部分的移动和变形信息。例如,外力模拟模块532可以实现重力模拟模型,该重力模拟模型基于与图像或视频中描绘的给定对象相关联的移动信息来计算外部网格的新轨迹。重力模拟模型接收对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向、当对象处于过去位置时外部网格的第二部分的位置以及方向重力函数作为输入。重力模拟模型基于将方向重力函数应用于对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向或当对象处于过去位置时外部网格的第二部分的位置,来输出与对象的当前位置相对应的外部网格的第二部分的新的一组坐标和位置。外部网格的第二部分的新的该组坐标和位置被提供给外部网格模块530,该外部网格模块然后基于外部网格的第二部分的先前位置、新的一组坐标和位置以及3D身体网格和外部网格的第一部分的相对位置来使第二部分变形。
作为另一示例,外力模拟模块532可以实现布料模拟模型,该布料模拟模型基于与图像或视频中描绘的给定对象相关联的运动信息以及与对应于外部网格的AR元素相关联的布料或材料类型来计算外部网格的新轨迹。布料模拟模型接收对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向、当对象处于过去位置时外部网格的第二部分的位置、与外部网格的第二部分相关联的材料或布料类型以及布料模拟函数作为输入。布料模拟模型基于将布料模拟函数应用于对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向、第二部分的布料或材料类型或者当对象处于过去位置时外部网格的第二部分的位置,来输出与对象的当前位置相对应的外部网格的第二部分的新的一组坐标和位置。外部网格的第二部分的新的该组坐标和位置被提供给外部网格模块530,该外部网格模块然后基于外部网格的第二部分的先前位置、新的一组坐标和位置、布料或材料类型以及3D身体网格和外部网格的第一部分的相对位置来使第二部分变形。
作为另一示例,外力模拟模块532可以实现链物理模拟模型,该链物理模拟模型基于与图像或视频中描绘的给定对象相关联的运动信息来计算外部网格的新轨迹。链物理模拟模型接收对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向、当对象处于过去位置时外部网格的第二部分的位置以及链物理函数作为输入。链物理模拟模型基于将链物理函数应用于对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向或者当对象处于过去位置时外部网格的第二部分的位置,来输出与对象的当前位置相对应的外部网格的第二部分的新的一组坐标和位置。外部网格的第二部分的新的该组坐标和位置被提供给外部网格模块530,该外部网格模块然后基于外部网格的第二部分的先前位置、新的一组坐标和位置以及3D身体网格和外部网格的第一部分的相对位置来使第二部分变形。
作为另一示例,外力模拟模块532可以实现碰撞模拟模型,该碰撞模拟模型基于与图像或视频中描绘的给定对象相关联的运动信息来计算外部网格的新轨迹。碰撞模拟模型接收对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向、当对象处于过去位置时外部网格的第二部分的位置以及碰撞函数作为输入。碰撞模拟模型基于将碰撞函数应用于对象的当前位置、对象的过去位置、对象的移动矢量、对象的取向或者当对象处于过去位置时外部网格的第二部分的位置,来输出与对象的当前位置相对应的外部网格的第二部分的扩展或收缩量。例如,如果碰撞模拟模型将外部网格的第二部分确定为以第一速度与对象的边缘碰撞或交叠,则扩展或收缩量被计算为第一值。第一值也可以是由外部网格和/或对象的材料或类型表示的AR元素的材料或类型的因子。如果碰撞模拟模型将外部网格的第二部分确定为以第二速度(大于第一速度)与对象的边缘碰撞或交叠,则扩展或收缩量被计算为比第一值大的第二值。外部网格的第二部分的扩展或收缩量被提供给外部网格模块530,该外部网格模块然后基于外部网格的第二部分的先前位置、新的一组坐标和位置、3D身体网格和外部网格的第一部分的相对位置以及扩展或收缩量来使第二部分变形。以这种方式,外部网格的第二部分可以基于碰撞模拟而扩展或收缩,而外部网格的第一部分仅基于3D身体网格的移动而变形并且可能不一定扩展或收缩。
在示例中,AR效果选择模块519基于从身体网格模块514接收到的与对象相关联的身体网格,选择一个或更多个AR元素或图形并将一个或更多个AR元素或图形应用于图像或视频中描绘的对象。与图像或视频中描绘的现实世界对象结合的这些AR图形被提供给图像修改模块518,以渲染描绘穿戴AR对象(例如AR手袋或耳饰)的人的图像或视频。
图像修改模块518可以基于由视觉效果选择模块519选择的AR效果来调整由摄像装置捕获的图像。图像修改模块518例如通过基于用户的3D身体网格的改变和外力模拟来改变AR服装或时尚配件的物理属性(变形)并应用一个或更多个AR元素(AR图形元素),来调整在图像或视频中呈现图像或视频中描绘的用户或人身上放置的AR服装或时尚配件的方式。图像显示模块520将由图像修改模块518进行的调整组合到所接收的描绘用户的身体的单目图像或视频中。该图像或视频由图像显示模块520提供给客户端设备102,并且然后可以被发送给另一用户或者被存储以供以后访问和显示。
在一些示例中,图像修改模块518和/或外部网格模块530从3D身体跟踪模块513接收表示图像中描绘的用户的3D位置的3D身体跟踪信息。3D身体跟踪模块513通过使用附加的机器学习技术对训练数据501进行处理来生成3D身体跟踪信息。图像修改模块518还可以从另一机器学习技术接收全身分割,该全身分割表示图像中的哪些像素与用户的全身相对应。可以从全身分割模块515接收全身分割。全身分割模块515通过使用机器学习技术对训练数据501进行处理来生成全身分割。
在一个示例中,如图7所示,AR效果选择模块519可以使用外部网格720将一个或更多个AR效果应用于与由客户端设备102捕获的3D身体网格710相对应的在图像或视频700中描绘的对象。外部网格720可以包括第一部分750(其附接至3D身体网格710或与3D身体网格710交叠)和第二部分752,该第二部分从身体网格710的边缘自由悬吊并远离3D身体网格710的边缘延伸。在示例中,第一部分750可以包括手袋的带子,并且第二部分752可以包括容器或手袋本身。例如,外部网格模块530可以接收3D身体网格710,并且还可以例如从存储设备获得与AR图形730(例如,AR手袋)相关联的外部网格720。外部网格模块530可以获得与外部网格720相关联的放置信息740。放置信息740可以指定接近度参数742、UV通道坐标744和/或外力细节746。基于放置信息740,外部网格模块530可以指定在图像或视频中将外部网格720(并且对应的AR图形730)放置和定位在何处。基于放置信息740,外部网格模块530可以指示外力模拟模块532激活、组合和使用哪一个或更多个外力函数来计算第二部分752的变形。
在示例中,外部网格模块530可以计算外部网格720的第一部分750与3D身体网格710之间的对应关系722。如上所述,该对应关系可以用于基于3D身体网格710如何变形,沿一个或更多个轴线724在3D上使外部网格720的第一部分750变形。当外部网格模块530使外部网格720的第一部分750变形时,基于放置信息740类似地使对应的AR图形730变形和渲染以在图像或视频内显示。外部网格模块530可以从外力模拟模块532获得第二部分752的变形信息。基于由外力模拟模块532提供的计算,外部网格模块530可以使第二部分752(独立于第一部分、与第一部分分别以及/或者与第一部分一起)变形。
在一个示例中,为了生成放置信息740,可以在客户端设备102上向AR图形设计者提供参考3D身体网格。AR图形设计者可以将图形设计者与AR图形相关联地创建的外部网格拖放到参考3D身体网格上。AR图形设计者可以输入相对放置参数,例如接近度参数和UV通道坐标,或者客户端设备102可以基于外部网格的不同边缘或像素相对于3D身体网格的不同边缘、像素或身体部位有多近和多远来自动地计算放置参数。使用该信息,与AR图形相关联地生成和存储位置放置信息740。在一些情况下,自动地创建放置信息740并将其呈现给AR设计者。AR设计者可以为外部网格的每个边缘或一条或更多个边缘或像素或体素指定范围、最小值或最大值。外部网格模块530使用这些范围、最小值或最大值以基于图像或视频中描绘的对象的3D身体网格来控制外部网格(和对应的AR图形)在图像或视频内的放置和定位。
还可以向AR图形设计者提供用于输入与AR图形730相关联的材料或类型属性的图形用户界面。基于对材料或类型属性的选择,客户端设备102可以自动地选择外力函数的子集以包括在外力细节746中。AR图形设计者还可以在外力细节746中指定第二部分752的UV坐标、体素位置、放置位置和/或坐标。AR图形设计者可以输入自定义的外力函数并且/或者可以选择外力函数的子集以应用于第二部分752,并且这样的信息与外部网格720相关联地被存储在外力细节746中。
如图8所示,在基于变形信息和3D身体网格710的移动使外部网格变形之后,对对应的AR图形730进行渲染以显示在图像或视频上。具体地,图像或视频800包括对用户或人810以及AR图形730(例如,AR手袋)的已经基于3D身体网格的移动而变形的第一部分820的描绘。图像或视频800包括对用户或人810以及AR图形730(例如,AR手袋)的已经基于由外力模拟模块532提供的外力的计算而变形的第二部分822的描绘。在另一示例中,图像或视频800包括对用户或人810以及AR图形730的已经基于3D身体网格的移动而变形的第一部分820(例如,AR耳饰的AR扣)的描绘。图像或视频800包括对用户或人810以及AR图形730的已经基于由外力模拟模块532提供的外力的计算而变形的第二部分822(例如,从AR扣悬挂的AR耳饰)的描绘。
图9是根据一些示例的由外部网格变形系统224执行的处理900的流程图。尽管流程图可以将操作描述为顺序过程,但是可以并行或并发执行这些操作中的许多操作。另外,可以重新布置操作的顺序。过程在其操作完成时终止。过程可以对应于方法、程序等。方法的步骤可以全部或部分地执行,可以结合其他方法中的一些或全部步骤执行,并且可以由任何数目的不同系统或其任何部分(例如包括在任何系统中的处理器)来执行。
在操作901处,如上所述,外部网格变形系统224(例如,客户端设备102或服务器)接收视频,该视频包括对现实世界对象的描绘。
在操作902处,如上所述,外部网格变形系统224生成与现实世界对象相关联的3D身体网格,该3D身体网格跟踪现实世界对象跨视频的帧的移动。
在操作903处,如上所述,外部网格变形系统224获得与AR元素相关联的外部网格。
在操作904处,如上所述,外部网格变形系统224确定外部网格的第一部分与3D身体网格的移动信息相关联。
在操作905处,如上所述,外部网格变形系统224确定外部网格的第二部分与外力的移动信息相关联。
在操作906处,如上所述,外部网格变形系统224分别基于3D身体网格的移动信息和外力的移动信息使外部网格的第一部分和第二部分变形。
在操作907处,如上所述,外部网格变形系统224基于外部网格的经变形的第一部分和和经变形的第二部分来修改视频以包括AR元素的显示。
机器架构
图10是机器1000的图解表示,在该机器1000内可以执行用于使机器1000执行本文所讨论的方法中的任何一种或更多种方法的指令1008(例如,软件、程序、应用、小程序、app或其他可执行代码)。例如,指令1008可以使机器1000执行本文中描述的方法中的任何一个或更多个方法。指令1008将通用的未编程的机器1000变换成被编程为以所描述的方式执行所描述和所示出的功能的特定机器1000。机器1000可以作为独立设备操作,或者可以耦接(例如,联网)至其他机器。在联网部署中,机器1000可以在服务器客户端网络环境中以服务器机器或客户端机器的身份来操作,或者在对等(或分布式)网络环境中作为对等机器来操作。机器1000可以包括但不限于:服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能电器)、其他智能设备、web装置、网络路由器、网络交换机、网络桥接器或能够顺序地或以其他方式执行指定要由机器1000采取的动作的指令1008的任何机器。此外,虽然仅示出了单个机器1000,但是术语“机器”还应被认为包括单独地或联合地执行指令1008以执行本文中讨论的任何一种或更多种方法的机器的集合。例如,机器1000可以包括客户端设备102或者形成消息收发服务器系统108的一部分的若干服务器设备中的任何一个。在一些示例中,机器1000还可以包括客户端系统和服务器系统两者,其中特定方法或算法的某些操作在服务器侧执行,并且所述特定方法或算法的某些操作在客户端侧执行。
机器1000可以包括可以被配置成经由总线1040彼此通信的处理器1002、存储器1004和输入/输出(I/O)部件1038。在示例中,处理器1002(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、另外的处理器或其任何合适的组合)可以包括例如执行指令1008的处理器1006和处理器1010。术语“处理器”旨在包括多核处理器,所述多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图10示出了多个处理器1002,但是机器1000可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器、或者其任何组合。
存储器1004包括主存储器1012、静态存储器1014以及存储单元1016,其均可由处理器1002经由总线1040访问。主存储器1004、静态存储器1014和存储单元1016存储体现本文所描述的方法或功能中的任何一种或更多种的指令1008。指令1008在其由机器1000执行期间还可以完全地或部分地驻留在主存储器1012内、驻留在静态存储器1014内、驻留在存储单元1016内的机器可读介质内、驻留在处理器1002中的至少一个处理器内(例如,在处理器的高速缓存存储器内)或者驻留在其任何合适的组合内。
I/O部件1038可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量结果等的各种部件。包括在特定机器中的特定I/O部件1038将取决于机器的类型。例如,便携式机器诸如移动电话可以包括触摸输入设备或其他这样的输入机构,而无头服务器机器将很可能不包括这样的触摸输入设备。应当认识到的是,I/O部件1038可以包括图10中未示出的许多其他部件。在各种示例中,I/O部件1038可以包括用户输出部件1024和用户输入部件1026。用户输出部件1024可以包括视觉部件(例如,显示器诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号发生器等。用户输入部件1026可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,物理按钮、提供触摸或触摸姿势的位置和力的触摸屏或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
在其他示例中,I/O部件1038可以包括生物计量部件1028、运动部件1030、环境部件1032、或定位部件1034以及各种其他部件。例如,生物计量部件1028包括用于检测表达(例如,手表达、面部表达、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件1030包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
环境部件1032包括例如一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,为了安全而检测危险气体的浓度或者测量大气中的污染物的气体检测传感器),或者可以提供与周围物理环境对应的指示、测量或信号的其他部件。
关于摄像装置,客户端设备102可以具有摄像装置系统,该摄像装置系统包括例如在客户端设备102的前表面上的前置摄像装置和在客户端设备102的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端设备102的用户的静止图像和视频(例如,“自拍”),该静止图像和视频然后可以用上述增强数据(例如,过滤器)进行增强。例如,后置摄像装置可以用于以更常规的摄像装置模式捕获静止图像和视频,其中,这些图像类似地用增强数据进行增强。除了前置摄像装置和后置摄像装置之外,客户端设备102还可以包括用于捕获360°照片和视频的360°的摄像装置。
此外,客户端设备102的摄像装置系统可以包括双后置摄像装置(例如,主摄像装置以及深度感测摄像装置),或者甚至在客户端设备102的前后侧包括三重、四重或五重后置摄像装置配置。例如,这些多个摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。
定位部件1034包括位置传感器部件(例如,GPS接收器部件)、海拔高度传感器部件(例如,检测气压的高度计或气压计,根据气压可以得到海拔高度)、取向传感器部件(例如,磁力计)等。
可以使用各种各样的技术来实现通信。I/O部件1038还包括通信部件1036,该通信部件1036可操作以经由相应的耦接或连接将机器1000耦接至网络1020或设备1022。例如,通信部件1036可以包括与网络1020对接的网络接口部件或其他合适的设备。在另外的示例中,通信部件1036可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如,/>低功耗)、/>部件以及经由其他模态提供通信的其他通信部件。设备1022可以是另一机器或各种外围设备中的任何外围设备(例如,经由USB耦接的外围设备)。
此外,通信部件1036可以检测标识符或包括能够进行操作以检测标识符的部件。例如,通信部件1036可以包括射频标识(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如,用于检测一维条形码诸如通用产品代码(UPC)条形码,多维条形码诸如快速响应(QR)码、Aztec码、数据矩阵、数据符号(Dataglyph)、最大码(MaxiCode)、PDF417、超码(Ultra Code)、UCC RSS-2D条形码以及其他光学码的光学传感器)或声学检测部件(例如,用于识别所标记的音频信号的麦克风)。此外,可以经由通信部件1036得出各种信息,例如经由因特网协议(IP)地理位置得出位置、经由信号三角测量得出位置、经由检测可以指示特定位置的NFC信标信号得出位置等。
各种存储器(例如,主存储器1012、静态存储器1014以及处理器1002的存储器)以及存储单元1016可以存储由本文中所描述的方法或功能中的任何一种或更多种方法或功能实现或使用的一组或更多组指令和数据结构(例如,软件)。在由处理器1002执行的情况下,这些指令(例如,指令1008)使各种操作实现所公开的示例。
可以利用传输介质经由网络接口设备(例如,通信部件1036中包括的网络接口部件)并且使用若干公知的传输协议中的任何一种传输协议(例如,HTTP),通过网络1020来发送或接收指令1008。类似地,可以利用传输介质经由与设备1022的耦接(例如,对等耦接)来发送或接收指令1008。
软件架构
图11是示出可以安装在本文中描述的设备中的任何一个或更多个设备上的软件架构1104的框图1100。软件架构1104由硬件支持,该硬件例如是包括处理器1120、存储器1126和I/O部件1138的机器1102。在该示例中,软件架构1104可以被概念化为层的堆栈,其中每个层提供特定功能。软件架构1104包括下述层,例如操作系统1112、库1110、框架1108和应用1106。在操作上,应用1106通过软件堆栈来激活API调用1150并且响应于API调用1150而接收消息1152。
操作系统1112管理硬件资源并提供公共服务。操作系统1112包括例如:核1114、服务1116以及驱动器1122。核1114用作硬件与其他软件层之间的抽象层。例如,核1114提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置等功能。服务1116可以针对其他软件层提供其他公共服务。驱动器1122负责控制底层硬件或与底层硬件对接(interface)。例如,驱动器1122可以包括显示驱动器、摄像装置驱动器、或/>低能耗驱动器、闪存驱动器、串行通信驱动器(例如,USB驱动器)、/>驱动器、音频驱动器、电力管理驱动器等。
库1110提供由应用1106使用的共用低级基础设施。库1110可以包括系统库1118(例如,C标准库),该系统库1118提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。此外,库1110可以包括API库1124,例如媒体库(例如,用于支持各种媒体格式的呈现和操纵的库,所述各种媒体格式例如运动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层-3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形内容中以2D和3进行呈现的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供web浏览功能的WebKit)等。库1110还可以包括各种其他库1128,以向应用1106提供许多其他API。
框架1108提供由应用1106使用的共用高级基础设施。例如,框架1108提供各种图形用户界面功能、高级资源管理和高级定位服务。框架1108可以提供可以由应用1106使用的广泛的其他API,其中一些API可以特定于特定操作系统或平台。
在示例中,应用1106可以包括家庭应用1136、联系人应用1130、浏览器应用1132、书籍阅读器应用1134、位置应用1142、媒体应用1144、消息收发应用1146、游戏应用1148和诸如外部应用1140的各种各样的其他应用。应用1106是执行程序中定义的功能的程序。可以采用各种编程语言来创建以各种方式构造的应用1106中的一个或更多个,所述编程语言例如面向对象的编程语言(例如,Objective-C、Java或C++)或过程编程语言(例如,C或汇编语言)。在特定示例中,外部应用1140(例如,由特定平台的供应商之外的实体使用ANDROIDTM或IOSTMSDK开发的应用)可以是在诸如IOSTM、ANDROIDTM、Phone的移动操作系统或其他移动操作系统上运行的移动软件。在该示例中,外部应用1140可以激活由操作系统1112提供的API调用1150以促进本文中描述的功能。
术语表
“载波信号”是指能够存储、编码或携载用于由机器执行的指令的任何无形介质,并且包括数字或模拟通信信号或其他无形介质以促进这样的指令的传送。可以经由网络接口设备利用传输介质在网络上发送或接收指令。
“客户端设备”是指与通信网络接口以从一个或更多个服务器系统或其他客户端设备获得资源的任何机器。客户端设备可以是但不限于移动电话、桌上型计算机、膝上型计算机、PDA、智能电话、平板计算机、超级本、上网本、笔记本电脑、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信设备。
“通信网络”是指网络的一个或更多个部分,网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、其他类型的网络或两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全局移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,诸如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、GSM演进的增强数据速率(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动通讯系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
“部件”是指具有边界的设备、物理实体或逻辑,该边界由功能或子例程调用、分支点、API或者对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由它们的接口与其他部件对接以执行机器过程。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元,并且是通常执行相关功能中的特定功能的程序的一部分。
部件可以构成软件部件(例如,在机器可读介质上实施的代码)或硬件部件。“硬件部件”是能够执行某些操作并且可以以某种物理方式来配置或布置的有形单元。在各种示例性示例中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或者计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置为进行操作以执行本文中所描述的某些操作的硬件部件。
也可以机械地、电子地或其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久配置成执行某些操作的专用电路或逻辑。硬件部件可以是专用处理器,例如现场可编程门阵列(FPGA)或ASIC。硬件部件还可以包括通过软件临时配置成执行某些操作的可编程逻辑或电路。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件而配置,硬件部件就成为被唯一地定制成执行所配置功能的特定机器(或机器的特定部件),而不再是通用处理器。将认识到,可以出于成本和时间考虑来决定是机械地在专用且永久配置的电路中实现硬件部件还是在临时配置(例如,通过软件配置)的电路中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成包含有形实体,即被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式进行操作或者执行本文中描述的某些操作的实体。
考虑硬件部件被临时配置(例如,被编程)的示例,无需在任一时刻对硬件部件中的每一个进行配置或实例化。例如,在硬件部件包括通过软件进行配置而变成专用处理器的通用处理器的情况下,可以在不同时间处将该通用处理器分别配置成不同的专用处理器(例如,包括不同的硬件部件)。软件相应地配置一个或多个特定处理器,以例如在一个时刻处构成特定硬件部件并且在不同时刻处构成不同的硬件部件。
硬件部件可以向其他硬件部件提供信息并且从其他硬件部件接收信息。因此,所描述的硬件部件可以被认为是通信地耦接的。在同时存在多个硬件部件的情况下,可以通过在硬件部件中的两个或更多个硬件部件之间或之中的信号传输(例如,通过适当的电路和总线)来实现通信。在多个硬件部件在不同时间处被配置或被实例化的示例中,可以例如通过将信息存储在多个硬件部件具有访问权限的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作并且将该操作的输出存储在与其通信地耦接的存储器设备中。然后,其他硬件部件可以在随后的时间处访问该存储器设备以检索所存储的输出并对其进行处理。硬件部件还可以发起与输入设备或输出设备的通信,并且可以对资源(例如,信息的集合)进行操作。
本文描述的示例方法的各种操作可以至少部分地由被临时配置(例如,通过软件)或被永久配置成执行相关操作的一个或更多个处理器来执行。无论是被临时地配置还是永久地配置,这样的处理器可以构成进行操作以执行本文中所描述的一个或更多个操作或功能的处理器实现的部件。如本文所使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,在本文中描述的方法可以至少部分地由处理器实现,其中特定的一个或多个处理器是硬件的示例。例如,方法的至少一些操作可以由一个或更多个处理器1002或处理器实现的部件来执行。此外,一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或者作为“软件即服务”(SaaS)操作。例如,操作中的至少一些可以由一组计算机(作为包括处理器的机器的示例)来执行,其中这些操作可以经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,API)来访问。某些操作的执行可以分布在处理器之间,不是仅驻留在单个机器内,而是被跨多个机器部署。在一些示例中,处理器或处理器实现的部件可以位于单个地理位置(例如,在家庭环境、办公室环境或服务器群内)。在其他示例中,处理器或处理器实现的部件可以跨多个地理位置分布。
“计算机可读存储介质”是指机器存储介质和传输介质二者。因此,术语包括存储设备/介质和载波/调制数据信号二者。术语“机器可读介质”、“计算机可读介质”和“设备可读介质”意指相同的事物并且可以在本公开内容中互换使用。
“短暂消息”是指可访问达有限持续时间的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送方设置。可替选地,访问时间可以是默认设置或者由接收方指定的设置。无论设置技术如何,该消息都是暂态的。
“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储设备和介质(例如,集中式或分布式数据库,以及相关联的高速缓存和服务器)。因此,该术语应当被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和设备存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器设备,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存设备;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“设备存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换地使用。术语“机器存储介质”、“计算机存储介质”和“设备存储介质”明确地排除了载波、调制数据信号和其他这样的介质,其中的至少一些被涵盖在术语“信号介质”中。
“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
“信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质,并且包括数字或模拟通信信号或有利于软件或数据的通信的其他无形介质。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”指的是其特性中的一个或更多个特性被以将信息编码在该信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”指的是相同的事物,并且可以在本公开内容中互换使用。
在不脱离本公开内容的范围的情况下,可以对所公开的示例进行改变和修改。这些以及其他改变或修改旨在包括在如所附权利要求书中所表达的本公开内容的范围内。
Claims (20)
1.一种方法,包括:
由客户端设备的一个或更多个处理器接收视频,所述视频包括对现实世界对象的描绘;
由所述一个或更多个处理器生成与所述现实世界对象相关联的三维(3D)身体网格,所述3D身体网格跟踪所述现实世界对象跨所述视频的帧的移动;
获得与增强现实(AR)元素相关联的外部网格;
确定所述外部网格的第一部分与所述3D身体网格的移动信息相关联;
确定所述外部网格的第二部分与外力模型的移动信息相关联;
分别基于所述3D身体网格的移动信息和所述外力模型的移动信息使所述外部网格的第一部分和第二部分变形;以及
基于所述外部网格的经变形的第一部分和经变形的第二部分来修改所述视频以包括所述AR元素的显示。
2.根据权利要求1所述的方法,还包括:
自动地建立与所述现实世界对象相关联的所述3D身体网格与所述外部网格之间的对应关系,其中,所述现实世界对象包括人;并且
其中,所述3D身体网格表示所述视频中描绘的所述人的全身。
3.根据权利要求1至2中任一项所述的方法,其中,所述AR元素包括时尚品。
4.根据权利要求1至3中任一项所述的方法,还包括:
获得与所述外部网格相关联的放置信息;以及
基于所述放置信息确定所述外部网格的与所述3D身体网格的一个或更多个顶点交叠的第一组顶点,其中,所述外部网格的第一部分响应于确定所述外部网格的第一组顶点与所述3D身体网格的一个或更多个顶点交叠而确定。
5.根据权利要求4所述的方法,还包括:
基于所述放置信息确定所述外部网格的延伸超过所述3D身体网格的一个或更多个边缘的第二组顶点,其中,所述外部网格的第二部分响应于确定所述外部网格的第二组顶点延伸超过所述3D身体网格的一个或更多个边缘而确定。
6.根据权利要求1至5中任一项所述的方法,其中,所述外力模型由物理模拟、碰撞模拟、链物理或布料模拟中的至少之一来定义。
7.根据权利要求6所述的方法,还包括:获得描述所述外力模型的移动的函数。
8.根据权利要求6至7中任一项所述的方法,其中,根据描述所述外力模型的移动的函数使所述外部网格的第二部分变形。
9.根据权利要求1至8中任一项所述的方法,其中,所述AR元素包括手袋,其中,所述外部网格的第一部分包括所述手袋的带子;并且
其中,所述外部网格的第二部分包括所述手袋的远离所述现实世界对象悬挂或悬吊的部分。
10.根据权利要求1至9中任一项所述的方法,其中,所述AR元素包括耳饰,其中,所述外部网格的第一部分包括所述耳饰的扣;并且
其中,所述外部网格的第二部分包括所述耳饰的远离所述现实世界对象悬挂或悬吊的部分。
11.根据权利要求1至10中任一项所述的方法,还包括:获得所述外部网格的放置信息,所述外部网格的放置信息描述所述外部网格的哪些部分基于所述现实世界对象的移动而变形以及所述外部网格的哪些部分基于物理函数而变形或被控制。
12.根据权利要求1至11中任一项所述的方法,其中,使所述外部网格的第一部分变形包括:
计算所述现实世界对象的身体形状、身体状态或身体属性跨所述视频的帧的改变;以及
基于所述形状、所述身体状态或所述身体属性的改变来调整所述外部网格的形状。
13.根据权利要求1至12中任一项所述的方法,其中,使所述外部网格的第一部分变形包括:
计算所述现实世界对象的位置或比例跨所述视频的帧的改变;以及
基于所述位置或所述比例的改变来调整所述外部网格的位置或比例。
14.根据权利要求1至13中任一项所述的方法,其中,使所述外部网格的第一部分变形包括:
计算所述现实世界对象的旋转跨所述视频的帧的改变;以及
基于所述旋转的改变使所述外部网格在3D上旋转。
15.根据权利要求1至14中任一项所述的方法,还包括:
针对所述视频的帧中的第一帧确定所述身体网格在法线切线空间中的第一组坐标;
针对所述视频的帧中的第二帧确定所述身体网格在所述法线切线空间中的第二组坐标;
实时地计算所述法线切线空间中的所述第一组坐标与所述第二组坐标之间的改变;以及
将所述法线切线空间中的所述第一组坐标与所述第二组坐标之间的改变传输至所述外部网格的第一部分。
16.根据权利要求15所述的方法,其中,基于所述法线切线空间中的所述第一组坐标与所述第二组坐标之间的改变来调整所述外部网格的第一部分的3D位置和3D取向。
17.根据权利要求15至16中任一项所述的方法,还包括:
计算所述法线切线空间中所述第一组坐标改变为所述第二组坐标的速度;以及
基于所述法线切线空间中所述第一组坐标改变为所述第二组坐标的所述速度,使所述外部网格的第二部分变形。
18.根据权利要求1至17中任一项所述的方法,还包括:
由消息收发应用从所述外部网格的第三方设计者接收所述外部网格的放置信息;以及
基于所述放置信息将所述外部网格添加至所述身体网格。
19.一种系统,包括:
客户端设备的处理器;以及
存储器部件,所述存储器部件具有存储在其上的指令,所述指令在由所述处理器执行时使所述处理器执行操作,所述操作包括:
接收视频,所述视频包括对现实世界对象的描绘;
生成与所述现实世界对象相关联的三维(3D)身体网格,所述3D身体网格跟踪所述现实世界对象跨所述视频的帧的移动;
获得与增强现实(AR)元素相关联的外部网格;
确定所述外部网格的第一部分与所述3D身体网格的移动信息相关联;
确定所述外部网格的第二部分与外力模型的移动信息相关联;
分别基于所述3D身体网格的移动信息和所述外力模型的移动信息使所述外部网格的第一部分和第二部分变形;以及
基于所述外部网格的经变形的第一部分和经变形的第二部分来修改所述视频以包括所述AR元素的显示。
20.一种非暂态计算机可读存储介质,具有存储在其上的指令,所述指令在由客户端设备的处理器执行时使所述处理器执行操作,所述操作包括:
接收视频,所述视频包括对现实世界对象的描绘;
生成与所述现实世界对象相关联的三维(3D)身体网格,所述3D身体网格跟踪所述现实世界对象跨所述视频的帧的移动;
获得与增强现实(AR)元素相关联的外部网格;
确定所述外部网格的第一部分与所述3D身体网格的移动信息相关联;
确定所述外部网格的第二部分与外力模型的移动信息相关联;
分别基于所述3D身体网格的移动信息和所述外力模型的移动信息使所述外部网格的第一部分和第二部分变形;以及
基于所述外部网格的经变形的第一部分和经变形的第二部分来修改所述视频以包括所述AR元素的显示。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/468,774 US11663792B2 (en) | 2021-09-08 | 2021-09-08 | Body fitted accessory with physics simulation |
US17/468,774 | 2021-09-08 | ||
PCT/US2022/076095 WO2023039462A1 (en) | 2021-09-08 | 2022-09-08 | Body fitted accessory with physics simulation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117916776A true CN117916776A (zh) | 2024-04-19 |
Family
ID=83558209
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280060842.9A Pending CN117916776A (zh) | 2021-09-08 | 2022-09-08 | 利用物理模拟的适配身体的配件 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11663792B2 (zh) |
EP (1) | EP4399671A1 (zh) |
KR (1) | KR20240063945A (zh) |
CN (1) | CN117916776A (zh) |
WO (1) | WO2023039462A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11908083B2 (en) | 2021-08-31 | 2024-02-20 | Snap Inc. | Deforming custom mesh based on body mesh |
US11663792B2 (en) | 2021-09-08 | 2023-05-30 | Snap Inc. | Body fitted accessory with physics simulation |
US11798238B2 (en) | 2021-09-14 | 2023-10-24 | Snap Inc. | Blending body mesh into external mesh |
US11836866B2 (en) | 2021-09-20 | 2023-12-05 | Snap Inc. | Deforming real-world object using an external mesh |
US11790614B2 (en) | 2021-10-11 | 2023-10-17 | Snap Inc. | Inferring intent from pose and speech input |
US11836862B2 (en) | 2021-10-11 | 2023-12-05 | Snap Inc. | External mesh with vertex attributes |
US11763481B2 (en) | 2021-10-20 | 2023-09-19 | Snap Inc. | Mirror-based augmented reality experience |
US20240331246A1 (en) * | 2023-03-30 | 2024-10-03 | Lemon Inc. | Kinematic joint and chain physics tools for augmented reality |
Family Cites Families (191)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7859551B2 (en) | 1993-10-15 | 2010-12-28 | Bulman Richard L | Object customization and presentation system |
US5880731A (en) | 1995-12-14 | 1999-03-09 | Microsoft Corporation | Use of avatars with automatic gesturing and bounded interaction in on-line chat session |
US6023270A (en) | 1997-11-17 | 2000-02-08 | International Business Machines Corporation | Delivery of objects in a virtual world using a descriptive container |
US6842779B1 (en) | 1998-03-11 | 2005-01-11 | Yasuo Nishizawa | Agent accessory tool cooperating with integrated application on WEB server by HTTP protocol |
US6268846B1 (en) | 1998-06-22 | 2001-07-31 | Adobe Systems Incorporated | 3D graphics based on images and morphing |
US20020067362A1 (en) | 1998-11-06 | 2002-06-06 | Agostino Nocera Luciano Pasquale | Method and system generating an avatar animation transform using a neutral face image |
US6223165B1 (en) | 1999-03-22 | 2001-04-24 | Keen.Com, Incorporated | Method and apparatus to connect consumer to expert |
US6772195B1 (en) | 1999-10-29 | 2004-08-03 | Electronic Arts, Inc. | Chat clusters for a virtual world application |
JP2001230801A (ja) | 2000-02-14 | 2001-08-24 | Sony Corp | 通信システムとその方法、通信サービスサーバおよび通信端末装置 |
US6922685B2 (en) | 2000-05-22 | 2005-07-26 | Mci, Inc. | Method and system for managing partitioned data resources |
US8117281B2 (en) | 2006-11-02 | 2012-02-14 | Addnclick, Inc. | Using internet content as a means to establish live social networks by linking internet users to each other who are simultaneously engaged in the same and/or similar content |
US6910186B2 (en) | 2000-12-08 | 2005-06-21 | Kyunam Kim | Graphic chatting with organizational avatars |
US7925703B2 (en) | 2000-12-26 | 2011-04-12 | Numedeon, Inc. | Graphical interactive interface for immersive online communities |
MXPA03000966A (es) | 2002-02-28 | 2003-09-04 | Pfizer Prod Inc | Agentes antidiabeticos. |
AU2003217528A1 (en) | 2002-03-26 | 2003-10-08 | So-Woon Kim | System and method for 3-dimension simulation of glasses |
KR100493525B1 (ko) | 2002-05-03 | 2005-06-07 | 안현기 | 아바타 메일 제공시스템 및 방법 |
US8495503B2 (en) | 2002-06-27 | 2013-07-23 | International Business Machines Corporation | Indicating the context of a communication |
US7636755B2 (en) | 2002-11-21 | 2009-12-22 | Aol Llc | Multiple avatar personalities |
US7484176B2 (en) | 2003-03-03 | 2009-01-27 | Aol Llc, A Delaware Limited Liability Company | Reactive avatars |
US20070113181A1 (en) | 2003-03-03 | 2007-05-17 | Blattner Patrick D | Using avatars to communicate real-time information |
US20070168863A1 (en) | 2003-03-03 | 2007-07-19 | Aol Llc | Interacting avatars in an instant messaging communication session |
WO2004081878A1 (en) | 2003-03-11 | 2004-09-23 | National University Of Singapore | Method and apparatus for generating morphing sequence |
KR20040091331A (ko) | 2003-04-21 | 2004-10-28 | 홍지선 | 자연어처리기술을 이용하여 입력된 문자메시지와 그 문장내용에 상응하는 아바타 표현 방법 및 시스템 |
US7378011B2 (en) | 2003-07-28 | 2008-05-27 | Phelps Dodge Corporation | Method and apparatus for electrowinning copper using the ferrous/ferric anode reaction |
KR100762629B1 (ko) | 2003-08-26 | 2007-10-01 | 삼성전자주식회사 | 휴대단말기의 백업서비스 처리방법 |
US7385603B2 (en) | 2004-06-30 | 2008-06-10 | Warner Bros. Entertainment, Inc. | Method for simulating motion of cloth |
US7342587B2 (en) | 2004-10-12 | 2008-03-11 | Imvu, Inc. | Computer-implemented system and method for home page customization and e-commerce support |
US7468729B1 (en) | 2004-12-21 | 2008-12-23 | Aol Llc, A Delaware Limited Liability Company | Using an avatar to generate user profile information |
KR100714192B1 (ko) | 2005-04-08 | 2007-05-02 | 엔에이치엔(주) | 노출 부위가 가변되는 아바타 제공 시스템 및 그 방법 |
US20060294465A1 (en) | 2005-06-22 | 2006-12-28 | Comverse, Inc. | Method and system for creating and distributing mobile avatars |
US8963926B2 (en) | 2006-07-11 | 2015-02-24 | Pandoodle Corporation | User customized animated video and method for making the same |
US7775885B2 (en) | 2005-10-14 | 2010-08-17 | Leviathan Entertainment, Llc | Event-driven alteration of avatars |
WO2007076721A2 (fr) | 2005-12-31 | 2007-07-12 | Tencent Technology (Shenzhen) Company Limited | Affichage, procédé de présentation, système d'affichage et appareil de présentation d'image virtuelle 3d |
US20070176921A1 (en) | 2006-01-27 | 2007-08-02 | Koji Iwasaki | System of developing urban landscape by using electronic data |
WO2007093813A1 (en) | 2006-02-16 | 2007-08-23 | Weeworld Limited | Portable account information |
EP2016562A4 (en) | 2006-05-07 | 2010-01-06 | Sony Computer Entertainment Inc | METHOD FOR IMPLEMENTING AFFECTIVE PROPERTIES IN A COMPUTER GENERATED AVATAR DURING A COMPUTER GAME |
WO2007134402A1 (en) | 2006-05-24 | 2007-11-29 | Mor(F) Dynamics Pty Ltd | Instant messaging system |
US20080158222A1 (en) | 2006-12-29 | 2008-07-03 | Motorola, Inc. | Apparatus and Methods for Selecting and Customizing Avatars for Interactive Kiosks |
US8504926B2 (en) | 2007-01-17 | 2013-08-06 | Lupus Labs Ug | Model based avatars for virtual presence |
GB2447094B (en) | 2007-03-01 | 2010-03-10 | Sony Comp Entertainment Europe | Entertainment device and method |
GB0703974D0 (en) | 2007-03-01 | 2007-04-11 | Sony Comp Entertainment Europe | Entertainment device |
CN101669090A (zh) | 2007-04-26 | 2010-03-10 | 福特全球技术公司 | 情绪提示系统和方法 |
CN101071457B (zh) | 2007-04-28 | 2010-05-26 | 腾讯科技(深圳)有限公司 | 一种网络游戏中改变角色形象的方法、装置以及服务器 |
US20110115798A1 (en) | 2007-05-10 | 2011-05-19 | Nayar Shree K | Methods and systems for creating speech-enabled avatars |
WO2008151424A1 (en) | 2007-06-11 | 2008-12-18 | Darwin Dimensions Inc. | Metadata for avatar generation in virtual environments |
GB2450757A (en) | 2007-07-06 | 2009-01-07 | Sony Comp Entertainment Europe | Avatar customisation, transmission and reception |
US20090016617A1 (en) | 2007-07-13 | 2009-01-15 | Samsung Electronics Co., Ltd. | Sender dependent messaging viewer |
US8726194B2 (en) | 2007-07-27 | 2014-05-13 | Qualcomm Incorporated | Item selection using enhanced control |
US8146005B2 (en) | 2007-08-07 | 2012-03-27 | International Business Machines Corporation | Creating a customized avatar that reflects a user's distinguishable attributes |
US20090055484A1 (en) | 2007-08-20 | 2009-02-26 | Thanh Vuong | System and method for representation of electronic mail users using avatars |
US20090070688A1 (en) | 2007-09-07 | 2009-03-12 | Motorola, Inc. | Method and apparatus for managing interactions |
US8924250B2 (en) | 2007-09-13 | 2014-12-30 | International Business Machines Corporation | Advertising in virtual environments based on crowd statistics |
WO2009046342A1 (en) | 2007-10-04 | 2009-04-09 | Playspan, Inc. | Apparatus and method for virtual world item searching |
US20090106672A1 (en) | 2007-10-18 | 2009-04-23 | Sony Ericsson Mobile Communications Ab | Virtual world avatar activity governed by person's real life activity |
US8892999B2 (en) | 2007-11-30 | 2014-11-18 | Nike, Inc. | Interactive avatar for social network services |
US8151191B2 (en) | 2007-12-07 | 2012-04-03 | International Business Machines Corporation | Managing objectionable material in 3D immersive virtual worlds |
US20090158170A1 (en) | 2007-12-14 | 2009-06-18 | Rajesh Narayanan | Automatic profile-based avatar generation |
US20090177976A1 (en) | 2008-01-09 | 2009-07-09 | Bokor Brian R | Managing and presenting avatar mood effects in a virtual world |
US8495505B2 (en) | 2008-01-10 | 2013-07-23 | International Business Machines Corporation | Perspective based tagging and visualization of avatars in a virtual world |
EP2263190A2 (en) | 2008-02-13 | 2010-12-22 | Ubisoft Entertainment S.A. | Live-action image capture |
CN101978374A (zh) | 2008-03-03 | 2011-02-16 | 耐克国际有限公司 | 交互式运动设备系统 |
US9744466B2 (en) | 2008-03-13 | 2017-08-29 | Mattel, Inc. | Widgetized avatar and a method and system of creating and using same |
US8832552B2 (en) | 2008-04-03 | 2014-09-09 | Nokia Corporation | Automated selection of avatar characteristics for groups |
US20090265604A1 (en) | 2008-04-21 | 2009-10-22 | Microsoft Corporation | Graphical representation of social network vitality |
US20090300525A1 (en) | 2008-05-27 | 2009-12-03 | Jolliff Maria Elena Romera | Method and system for automatically updating avatar to indicate user's status |
US20090303984A1 (en) | 2008-06-09 | 2009-12-10 | Clark Jason T | System and method for private conversation in a public space of a virtual world |
US8095878B2 (en) | 2008-06-23 | 2012-01-10 | International Business Machines Corporation | Method for spell check based upon target and presence of avatars within a virtual environment |
US8839327B2 (en) | 2008-06-25 | 2014-09-16 | At&T Intellectual Property Ii, Lp | Method and apparatus for presenting media programs |
CA2729630C (en) | 2008-06-30 | 2017-09-12 | Accenture Global Services Limited | Modification of avatar attributes for use in a gaming system via a moderator interface |
US20120246585A9 (en) | 2008-07-14 | 2012-09-27 | Microsoft Corporation | System for editing an avatar |
MX2011001060A (es) | 2008-07-28 | 2011-07-29 | Breakthrough Performancetech Llc | Metodos y sistemas para entrenamiento de habilidades interactivo computarizado. |
US8384719B2 (en) | 2008-08-01 | 2013-02-26 | Microsoft Corporation | Avatar items and animations |
US8832201B2 (en) | 2008-08-18 | 2014-09-09 | International Business Machines Corporation | Method, system and program product for providing selective enhanced privacy and control features to one or more portions of an electronic message |
US8108774B2 (en) | 2008-09-26 | 2012-01-31 | International Business Machines Corporation | Avatar appearance transformation in a virtual universe |
US8648865B2 (en) | 2008-09-26 | 2014-02-11 | International Business Machines Corporation | Variable rendering of virtual universe avatars |
US8869197B2 (en) | 2008-10-01 | 2014-10-21 | At&T Intellectual Property I, Lp | Presentation of an avatar in a media communication system |
US8683354B2 (en) | 2008-10-16 | 2014-03-25 | At&T Intellectual Property I, L.P. | System and method for distributing an avatar |
US20100115426A1 (en) | 2008-11-05 | 2010-05-06 | Yahoo! Inc. | Avatar environments |
US8745152B2 (en) | 2008-11-06 | 2014-06-03 | Disney Enterprises, Inc. | System and method for server-side avatar pre-rendering |
US8458601B2 (en) | 2008-12-04 | 2013-06-04 | International Business Machines Corporation | System and method for item inquiry and information presentation via standard communication paths |
WO2010074786A2 (en) | 2008-12-04 | 2010-07-01 | Total Immersion Software, Inc. | System and methods for dynamically injecting expression information into an animated facial mesh |
US20100162149A1 (en) | 2008-12-24 | 2010-06-24 | At&T Intellectual Property I, L.P. | Systems and Methods to Provide Location Information |
US9105014B2 (en) | 2009-02-03 | 2015-08-11 | International Business Machines Corporation | Interactive avatar in messaging environment |
KR101558553B1 (ko) | 2009-02-18 | 2015-10-08 | 삼성전자 주식회사 | 아바타 얼굴 표정 제어장치 |
US20100227682A1 (en) | 2009-03-04 | 2010-09-09 | Microsoft Corporation | Awarding of avatar items in video game environment |
US20110093780A1 (en) | 2009-10-16 | 2011-04-21 | Microsoft Corporation | Advertising avatar |
JP5553141B2 (ja) | 2009-11-11 | 2014-07-16 | ソニー株式会社 | 画像処理システム、画像処理装置、画像処理方法、およびプログラム |
KR20110070056A (ko) | 2009-12-18 | 2011-06-24 | 한국전자통신연구원 | 사용자 맞춤형 고품질 3d 아바타 생성 방법 및 그 장치 |
TWI434227B (zh) | 2009-12-29 | 2014-04-11 | Ind Tech Res Inst | 動畫產生系統及方法 |
US8484158B2 (en) | 2010-02-01 | 2013-07-09 | International Business Machines Corporation | Managing information about avatars across virtual worlds |
US20110239136A1 (en) | 2010-03-10 | 2011-09-29 | Oddmobb, Inc. | Instantiating widgets into a virtual social venue |
US9086776B2 (en) | 2010-03-29 | 2015-07-21 | Microsoft Technology Licensing, Llc | Modifying avatar attributes |
TWI439960B (zh) | 2010-04-07 | 2014-06-01 | Apple Inc | 虛擬使用者編輯環境 |
US8692830B2 (en) | 2010-06-01 | 2014-04-08 | Apple Inc. | Automatic avatar creation |
US10628729B2 (en) | 2010-06-08 | 2020-04-21 | Styku, LLC | System and method for body scanning and avatar creation |
US8564621B2 (en) | 2010-08-11 | 2013-10-22 | International Business Machines Corporation | Replicating changes between corresponding objects |
JP2012065263A (ja) | 2010-09-17 | 2012-03-29 | Olympus Imaging Corp | 撮影機器 |
US8884984B2 (en) | 2010-10-15 | 2014-11-11 | Microsoft Corporation | Fusing virtual content into real content |
KR101514327B1 (ko) | 2010-11-04 | 2015-04-22 | 한국전자통신연구원 | 얼굴 아바타 생성 장치 및 방법 |
US20120124458A1 (en) | 2010-11-17 | 2012-05-17 | Nazareno Brier Cruzada | Social networking website & web-based system for collecting & presenting real-time user generated information on parties & events. |
US20120130717A1 (en) | 2010-11-19 | 2012-05-24 | Microsoft Corporation | Real-time Animation for an Expressive Avatar |
KR20120059994A (ko) | 2010-12-01 | 2012-06-11 | 삼성전자주식회사 | 표정 제어점을 이용한 아바타 제어 장치 및 방법 |
KR101445263B1 (ko) | 2010-12-22 | 2014-09-30 | 주식회사 케이티 | 맞춤형 콘텐츠 제공 시스템 및 방법 |
US9839844B2 (en) | 2011-03-01 | 2017-12-12 | Disney Enterprises, Inc. | Sprite strip renderer |
US20140043329A1 (en) | 2011-03-21 | 2014-02-13 | Peng Wang | Method of augmented makeover with 3d face modeling and landmark alignment |
US20130103760A1 (en) | 2011-04-11 | 2013-04-25 | Robert K. Golding | Location-sensitive virtual identity system, apparatus, method and computer-readable medium |
US9330483B2 (en) | 2011-04-11 | 2016-05-03 | Intel Corporation | Avatar facial expression techniques |
US8989786B2 (en) | 2011-04-21 | 2015-03-24 | Walking Thumbs, Llc | System and method for graphical expression during text messaging communications |
US8811719B2 (en) | 2011-04-29 | 2014-08-19 | Microsoft Corporation | Inferring spatial object descriptions from spatial gestures |
US9241184B2 (en) | 2011-06-01 | 2016-01-19 | At&T Intellectual Property I, L.P. | Clothing visualization |
US20130201187A1 (en) | 2011-08-09 | 2013-08-08 | Xiaofeng Tong | Image-based multi-view 3d face generation |
KR20130022434A (ko) | 2011-08-22 | 2013-03-07 | (주)아이디피쉬 | 통신단말장치의 감정 컨텐츠 서비스 장치 및 방법, 이를 위한 감정 인지 장치 및 방법, 이를 이용한 감정 컨텐츠를 생성하고 정합하는 장치 및 방법 |
US20130249948A1 (en) | 2011-08-26 | 2013-09-26 | Reincloud Corporation | Providing interactive travel content at a display device |
US8559980B2 (en) | 2011-09-02 | 2013-10-15 | John J. Pujol | Method and system for integrated messaging and location services |
CA3207408A1 (en) | 2011-10-28 | 2013-06-13 | Magic Leap, Inc. | System and method for augmented and virtual reality |
US8890926B2 (en) | 2011-11-02 | 2014-11-18 | Microsoft Corporation | Automatic identification and representation of most relevant people in meetings |
US9782680B2 (en) | 2011-12-09 | 2017-10-10 | Futurewei Technologies, Inc. | Persistent customized social media environment |
CN106961621A (zh) | 2011-12-29 | 2017-07-18 | 英特尔公司 | 使用化身的通信 |
US8810513B2 (en) | 2012-02-02 | 2014-08-19 | Kodak Alaris Inc. | Method for controlling interactive display system |
US10702773B2 (en) | 2012-03-30 | 2020-07-07 | Videx, Inc. | Systems and methods for providing an interactive avatar |
US9402057B2 (en) | 2012-04-02 | 2016-07-26 | Argela Yazilim ve Bilisim Teknolojileri San. ve Tic. A.S. | Interactive avatars for telecommunication systems |
US9357174B2 (en) | 2012-04-09 | 2016-05-31 | Intel Corporation | System and method for avatar management and selection |
US9183676B2 (en) | 2012-04-27 | 2015-11-10 | Microsoft Technology Licensing, Llc | Displaying a collision between real and virtual objects |
US10155168B2 (en) | 2012-05-08 | 2018-12-18 | Snap Inc. | System and method for adaptable avatars |
US9196089B2 (en) | 2012-05-17 | 2015-11-24 | Disney Enterprises, Inc. | Techniques for processing reconstructed three-dimensional image data |
JP5497931B2 (ja) | 2012-05-30 | 2014-05-21 | 株式会社コナミデジタルエンタテインメント | アプリケーション装置、アプリケーション装置の制御方法、及びプログラム |
AU2013206649A1 (en) | 2012-07-05 | 2014-01-23 | Aristocrat Technologies Australia Pty Limited | A gaming system and a method of gaming |
US20140125678A1 (en) | 2012-07-11 | 2014-05-08 | GeriJoy Inc. | Virtual Companion |
US9424233B2 (en) | 2012-07-20 | 2016-08-23 | Veveo, Inc. | Method of and system for inferring user intent in search input in a conversational interaction system |
US9465833B2 (en) | 2012-07-31 | 2016-10-11 | Veveo, Inc. | Disambiguating user intent in conversational interaction system for large corpus information retrieval |
US10116598B2 (en) | 2012-08-15 | 2018-10-30 | Imvu, Inc. | System and method for increasing clarity and expressiveness in network communications |
US20150206349A1 (en) | 2012-08-22 | 2015-07-23 | Goldrun Corporation | Augmented reality virtual content platform apparatuses, methods and systems |
US9461876B2 (en) | 2012-08-29 | 2016-10-04 | Loci | System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction |
WO2014036708A1 (en) | 2012-09-06 | 2014-03-13 | Intel Corporation | System and method for avatar creation and synchronization |
US9314692B2 (en) | 2012-09-21 | 2016-04-19 | Luxand, Inc. | Method of creating avatar from user submitted image |
US11397462B2 (en) | 2012-09-28 | 2022-07-26 | Sri International | Real-time human-machine collaboration using big data driven augmented reality technologies |
US9746990B2 (en) | 2012-09-28 | 2017-08-29 | Intel Corporation | Selectively augmenting communications transmitted by a communication device |
US9501942B2 (en) | 2012-10-09 | 2016-11-22 | Kc Holdings I | Personalized avatar responsive to user physical state and context |
US20140129343A1 (en) | 2012-11-08 | 2014-05-08 | Microsoft Corporation | Dynamic targeted advertising avatar |
US9256860B2 (en) | 2012-12-07 | 2016-02-09 | International Business Machines Corporation | Tracking participation in a shared media session |
US9990373B2 (en) | 2013-02-06 | 2018-06-05 | John A. Fortkort | Creation and geospatial placement of avatars based on real-world interactions |
EP2976749A4 (en) | 2013-03-20 | 2016-10-26 | Intel Corp | AVATAR-BASED TRANSMISSION PROTOCOLS, SYMBOL GENERATION AND PUPPET ANIMATION |
US9460541B2 (en) | 2013-03-29 | 2016-10-04 | Intel Corporation | Avatar animation, social networking and touch screen applications |
US9589357B2 (en) | 2013-06-04 | 2017-03-07 | Intel Corporation | Avatar-based video encoding |
US9378576B2 (en) | 2013-06-07 | 2016-06-28 | Faceshift Ag | Online modeling for real-time facial animation |
US9177410B2 (en) | 2013-08-09 | 2015-11-03 | Ayla Mandel | System and method for creating avatars or animated sequences using human body features extracted from a still image |
US9706040B2 (en) | 2013-10-31 | 2017-07-11 | Udayakumar Kadirvel | System and method for facilitating communication via interaction with an avatar |
US9508197B2 (en) | 2013-11-01 | 2016-11-29 | Microsoft Technology Licensing, Llc | Generating an avatar from real time image data |
US9489760B2 (en) | 2013-11-14 | 2016-11-08 | Intel Corporation | Mechanism for facilitating dynamic simulation of avatars corresponding to changing user performances as detected at computing devices |
US9361510B2 (en) | 2013-12-13 | 2016-06-07 | Intel Corporation | Efficient facial landmark tracking using online shape regression method |
US9544257B2 (en) | 2014-04-04 | 2017-01-10 | Blackberry Limited | System and method for conducting private messaging |
US9503845B2 (en) | 2014-04-17 | 2016-11-22 | Paypal, Inc. | Image customization to enhance transaction experience |
WO2015164951A1 (en) | 2014-05-01 | 2015-11-05 | Abbas Mohamad | Methods and systems relating to personalized evolving avatars |
US20160134840A1 (en) | 2014-07-28 | 2016-05-12 | Alexa Margaret McCulloch | Avatar-Mediated Telepresence Systems with Enhanced Filtering |
EP3614304A1 (en) | 2014-11-05 | 2020-02-26 | INTEL Corporation | Avatar video apparatus and method |
WO2016090605A1 (en) | 2014-12-11 | 2016-06-16 | Intel Corporation | Avatar selection mechanism |
KR101671649B1 (ko) * | 2014-12-22 | 2016-11-01 | 장석준 | 신체 데이터와 의류 데이터를 조합한 3d 합성 이미지 생성 방법 및 시스템 |
JP6462386B2 (ja) | 2015-02-05 | 2019-01-30 | 任天堂株式会社 | プログラム、通信端末及び表示方法 |
US20170087473A1 (en) | 2015-09-29 | 2017-03-30 | Sportsworld, Inc. | Virtual environments for managing and interacting with virtual sports leagues |
US20170118145A1 (en) | 2015-10-21 | 2017-04-27 | Futurefly Ltd. | Method of using emoji to control and enrich 3d chat environments |
KR101710521B1 (ko) * | 2015-11-18 | 2017-02-27 | (주)에프엑스기어 | 사용자 신체의 cg 표현 기능이 구비된 가상 피팅을 위한 시뮬레이션 장치, 방법 및 이를 위한 컴퓨터 프로그램 |
WO2017101094A1 (en) | 2015-12-18 | 2017-06-22 | Intel Corporation | Avatar animation system |
US20170199855A1 (en) | 2016-01-11 | 2017-07-13 | BuilderFish, LLC | System and method for providing a time-based presentation of a user-navigable project model |
BR112018016726B1 (pt) * | 2016-02-18 | 2023-03-14 | Apple Inc | Método de processamento de imagem para realidade mista e dispositivo usado na cabeça |
US9911073B1 (en) | 2016-03-18 | 2018-03-06 | Snap Inc. | Facial patterns for optical barcodes |
US9933855B2 (en) | 2016-03-31 | 2018-04-03 | Intel Corporation | Augmented reality in a field of view including a reflection |
US20170312634A1 (en) | 2016-04-28 | 2017-11-02 | Uraniom | System and method for personalized avatar generation, especially for computer games |
US11112963B2 (en) | 2016-05-18 | 2021-09-07 | Apple Inc. | Devices, methods, and graphical user interfaces for messaging |
US10657701B2 (en) | 2016-06-30 | 2020-05-19 | Sony Interactive Entertainment Inc. | Dynamic entering and leaving of virtual-reality environments navigated by different HMD users |
US10573048B2 (en) | 2016-07-25 | 2020-02-25 | Oath Inc. | Emotional reaction sharing |
US10534809B2 (en) | 2016-08-10 | 2020-01-14 | Zeekit Online Shopping Ltd. | Method, system, and device of virtual dressing utilizing image processing, machine learning, and computer vision |
US20180047200A1 (en) | 2016-08-11 | 2018-02-15 | Jibjab Media Inc. | Combining user images and computer-generated illustrations to produce personalized animated digital avatars |
WO2018057272A1 (en) | 2016-09-23 | 2018-03-29 | Apple Inc. | Avatar creation and editing |
US10432559B2 (en) | 2016-10-24 | 2019-10-01 | Snap Inc. | Generating and displaying customized avatars in electronic messages |
US10242503B2 (en) | 2017-01-09 | 2019-03-26 | Snap Inc. | Surface aware lens |
US10242477B1 (en) | 2017-01-16 | 2019-03-26 | Snap Inc. | Coded vision system |
US11893647B2 (en) | 2017-04-27 | 2024-02-06 | Snap Inc. | Location-based virtual avatars |
US10949872B2 (en) | 2017-04-28 | 2021-03-16 | Snap Inc. | Methods and systems for server generation of interactive advertising with content collections |
US9980100B1 (en) | 2017-08-31 | 2018-05-22 | Snap Inc. | Device location based on machine learning classifications |
US10657695B2 (en) | 2017-10-30 | 2020-05-19 | Snap Inc. | Animated chat presence |
US20190228580A1 (en) | 2018-01-24 | 2019-07-25 | Facebook, Inc. | Dynamic Creation of Augmented Reality Effects |
US11176737B2 (en) | 2018-11-27 | 2021-11-16 | Snap Inc. | Textured mesh building |
US10943400B2 (en) | 2019-01-07 | 2021-03-09 | Cerence Operating Company | Multimodal user interface for a vehicle |
US11972529B2 (en) | 2019-02-01 | 2024-04-30 | Snap Inc. | Augmented reality system |
US10810782B1 (en) | 2019-04-01 | 2020-10-20 | Snap Inc. | Semantic texture mapping system |
US11462000B2 (en) | 2019-08-26 | 2022-10-04 | Apple Inc. | Image-based detection of surfaces that provide specular reflections and reflection modification |
US20220185625A1 (en) | 2020-12-15 | 2022-06-16 | Abacus Sensor, Inc. | Camera-based sensing devices for performing offline machine learning inference and computer vision |
US11509819B2 (en) | 2021-01-19 | 2022-11-22 | Adobe Inc. | Providing contextual augmented reality photo pose guidance |
US11908083B2 (en) | 2021-08-31 | 2024-02-20 | Snap Inc. | Deforming custom mesh based on body mesh |
US11663792B2 (en) | 2021-09-08 | 2023-05-30 | Snap Inc. | Body fitted accessory with physics simulation |
US11798238B2 (en) | 2021-09-14 | 2023-10-24 | Snap Inc. | Blending body mesh into external mesh |
-
2021
- 2021-09-08 US US17/468,774 patent/US11663792B2/en active Active
-
2022
- 2022-09-08 EP EP22783659.0A patent/EP4399671A1/en active Pending
- 2022-09-08 CN CN202280060842.9A patent/CN117916776A/zh active Pending
- 2022-09-08 WO PCT/US2022/076095 patent/WO2023039462A1/en active Application Filing
- 2022-09-08 KR KR1020247011511A patent/KR20240063945A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
US20230074826A1 (en) | 2023-03-09 |
US11663792B2 (en) | 2023-05-30 |
EP4399671A1 (en) | 2024-07-17 |
WO2023039462A1 (en) | 2023-03-16 |
KR20240063945A (ko) | 2024-05-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11836862B2 (en) | External mesh with vertex attributes | |
US12086946B2 (en) | Blending body mesh into external mesh | |
US11663792B2 (en) | Body fitted accessory with physics simulation | |
CN117897734A (zh) | 基于身体姿势控制交互式时尚 | |
US11908083B2 (en) | Deforming custom mesh based on body mesh | |
CN117157667A (zh) | 服装分割 | |
US11836866B2 (en) | Deforming real-world object using an external mesh | |
CN117940962A (zh) | 基于面部表情控制交互时尚 | |
CN118076971A (zh) | 将增强现实元素应用于出现在人的单目图像上的服装 | |
US20240013463A1 (en) | Applying animated 3d avatar in ar experiences | |
CN118435243A (zh) | 实时上身服装交换 | |
CN118414636A (zh) | 实时运动和外观转移 | |
CN118613834A (zh) | 实时服装交换 | |
US20240249444A1 (en) | Synthetic view for try-on experience |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |