CN117203676A - 可定制的化身生成系统 - Google Patents
可定制的化身生成系统 Download PDFInfo
- Publication number
- CN117203676A CN117203676A CN202280026531.0A CN202280026531A CN117203676A CN 117203676 A CN117203676 A CN 117203676A CN 202280026531 A CN202280026531 A CN 202280026531A CN 117203676 A CN117203676 A CN 117203676A
- Authority
- CN
- China
- Prior art keywords
- avatar
- text data
- personalized
- text
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 70
- 238000012545 processing Methods 0.000 claims abstract description 26
- 230000015654 memory Effects 0.000 claims description 33
- 238000013528 artificial neural network Methods 0.000 claims description 28
- 230000008451 emotion Effects 0.000 claims description 13
- 230000009471 action Effects 0.000 claims description 6
- 230000036651 mood Effects 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 42
- 230000004048 modification Effects 0.000 description 34
- 238000012986 modification Methods 0.000 description 34
- 238000004891 communication Methods 0.000 description 30
- 230000009466 transformation Effects 0.000 description 19
- 241000282322 Panthera Species 0.000 description 13
- 230000003190 augmentative effect Effects 0.000 description 13
- 230000001052 transient effect Effects 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 230000004044 response Effects 0.000 description 11
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000000007 visual effect Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 7
- 238000010801 machine learning Methods 0.000 description 7
- 238000000844 transformation Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 210000000887 face Anatomy 0.000 description 6
- 230000006855 networking Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000001815 facial effect Effects 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 238000010079 rubber tapping Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 230000003416 augmentation Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000282320 Panthera leo Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 235000019788 craving Nutrition 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002996 emotional effect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/20—Editing of 3D images, e.g. changing shapes or colours, aligning objects or positioning parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/06—Message adaptation to terminal or network requirements
- H04L51/063—Content adaptation, e.g. replacement of unsuitable content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2004—Aligning objects, relative positioning of parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2219/00—Indexing scheme for manipulating 3D models or images for computer graphics
- G06T2219/20—Indexing scheme for editing of 3D models
- G06T2219/2024—Style variation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Tourism & Hospitality (AREA)
- Architecture (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
用于可定制的化身生成系统的系统、方法和计算机可读介质,其中,方法包括:访问文本数据,使用至少一个处理器来处理文本数据以确定文本数据的第一特性,基于将第一特性与多个个性化化身的第二特性进行匹配来选择多个个性化化身中针对该文本数据的个性化化身,基于文本数据和所选择的个性化化身来生成定制化身,以及使定制化身被显示在计算设备的显示器上。
Description
优先权要求
本申请根据35USC 119(e)要求于2021年3月31日提交的美国临时专利申请第63/169,083号的优先权的权益,该美国临时专利申请的全部内容通过引用并入本文中。
技术领域
本公开内容的示例总体上涉及消息收发系统内的定制化身生成。更具体地,但不作为限制,本公开内容的示例涉及基于用户的个性化化身和由用户输入的文本来生成定制化身。
背景技术
消息收发系统包括数千万或数亿用户。消息收发系统中的每个用户可以在他或她的个人社交网络的成员之间或向他们的社交网络之外的个人传送媒体内容项。
用户越来越多地彼此共享媒体内容项,例如电子图像、动画或视频。这些媒体内容项通常是个性化的,并且因此反映出对个性化媒体内容项的需求。然而,生成定制媒体内容项对于用户来说常常是耗时或令人沮丧的。
附图说明
在附图(其不一定按比例绘制)中,相同的附图标记可以在不同的视图中描述类似的部件。为了容易地识别对任何特定元素或动作的讨论,附图标记中的一个或多个最高有效数字指首次引入该元素的图号。在附图的图中示出了一些非限制性示例,在附图中:
图1是根据一些示例的其中可以部署本公开内容的联网环境的图解表示。
图2是根据一些示例的具有客户端侧功能和服务器侧功能两者的消息收发系统的图解表示。
图3是根据一些示例的如在数据库中维护的数据结构的图解表示。
图4是根据一些示例的消息的图解表示。
图5示出了根据一些示例的用于化身生成的系统的细节的图解表示。
图6示出了根据一些示例的用于基于用户输入来生成化身的方法的流程图。
图7示出了根据一些示例的描绘由客户端设备显示的基础化身的用户界面的示例。
图8示出了根据一些示例的描绘由客户端设备显示的定制化身和化身界面的用户界面的示例。
图9示出了根据一些示例的描绘由客户端设备显示的可扩展定制化身界面的用户界面的示例。
图10示出了根据一些示例的描绘化身框架边界框的示例后端编辑器界面。
图11是根据一些示例的访问限制过程的流程图。
图12是根据一些示例的呈计算机系统形式的机器的图解表示,在该机器内可以执行一组指令以使该机器执行本文所讨论的方法中的任何一个或更多个方法。
图13是示出了可以在其中实现示例的软件架构的框图。
图14是根据一些示例的处理环境的图解表示。
具体实施方式
下面的描述包括体现本公开内容的说明性示例的系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于说明的目的,阐述了许多具体细节以便提供对本发明主题的各种示例的理解。然而,对于本领域技术人员来说,将明显的是,没有这些具体细节也可以实现本发明主题的这些示例。通常,不必详细示出公知的指令实例、协议、结构和技术。
在消息收发系统中,可以基于用户的个性或肖像来创建用户的数字表示。被称为化身的数字表示可以以二维或三维形式来呈现,并且可以被集成到虚拟游戏、社交媒体消息收发平台或交互式软件应用中。化身是在后端设计的并且被存储在图像数据库中,以供用户检索用于个体用户配置,例如添加特征以与用户的肖像相像。
一个技术问题是如何生成个性化化身并将其与用户书写的文本消息进行匹配。在一些示例中,通过利用神经网络生成个性化化身来解决该技术问题,所述神经网络可以是利用生成式对抗网络(GAN)训练的生成式神经网络(GNN),其中生成式对抗网络基于用户的基础化身来针对各种特性生成个性化化身。个性化化身包括文本放置区域,该文本放置区域包括文本的各种限制或特性,诸如字体类型、字母或单词数量、字体大小等等。在一些示例中,用户创建他们自己的个性化化身,并且NN确定用户创建的个性化化身的特性。
基于确定文本的特性与个性化化身的特性匹配,将个性化化身与用户书写的文本消息匹配。在一些示例中,使用被训练成确定文本消息具有个性化化身的每个特性的概率的NN来确定文本的特性。这些特性包括文本本身的各种属性,诸如字体、字体大小、特殊字符、情绪等。特性还包括文本的上层特性,例如文本消息是否是问候语、节日祝福消息等。基于特性匹配程度的加权和来进行文本和个性化化身的匹配。一些特性必须精确匹配或者能够被容纳,诸如个性化化身能够容纳的单词或字符的数量。
匹配系统选择多个匹配的个性化化身中的一个或更多个,并且通过将文本消息添加到个性化化身的文本区域来定制每个匹配的个性化化身,从而生成定制化身。定制化身被作为选项呈现给用户,用户选择定制化身,以将其包括在给其他用户的消息中或者用于其他应用(诸如游戏、虚拟现实交互等)内的其他用途。
联网计算环境
图1是示出用于通过网络来交换数据(例如,消息和相关联的内容)的示例消息收发系统100的框图。消息收发系统100包括客户端设备102的多个实例,所述多个实例中的每个实例托管包括消息收发客户端104和其他应用106的若干应用。每个消息收发客户端104经由网络112(例如,因特网)通信地耦接至消息收发客户端104(例如,托管在相应的其他客户端设备102上)的其他实例、消息收发服务器系统108和第三方服务器110。消息收发客户端104还可以使用应用程序接口(API)与本地托管的应用106通信。
消息收发客户端104能够经由网络112与其他消息收发客户端104和消息收发服务器系统108通信并交换数据。在消息收发客户端104之间以及在消息收发客户端104与消息收发服务器系统108之间交换的数据包括功能(例如,激活功能的命令)以及有效载荷数据(例如,文本、音频、视频或其他多媒体数据)。
消息收发服务器系统108经由网络112向特定消息收发客户端104提供服务器侧功能。虽然消息收发系统100的某些功能在本文中被描述为由消息收发客户端104或由消息收发服务器系统108执行,但是某些功能是在消息收发客户端104内还是在消息收发服务器系统108内的定位可以是设计选择。例如,在技术上可能优选的是:最初将某些技术和功能部署在消息收发服务器系统108内,但是后期将该技术和功能迁移至客户端设备102具有足够处理能力的消息收发客户端104。
消息收发服务器系统108支持向消息收发客户端104提供的各种服务和操作。这样的操作包括向消息收发客户端104发送数据、从消息收发客户端104接收数据以及对由消息收发客户端104生成的数据进行处理。作为示例,该数据可以包括消息内容、客户端设备信息、地理定位信息、媒体增强和覆盖、消息内容持续条件、社交网络信息和实况事件信息。通过经由消息收发客户端104的用户界面(UI)可用的功能来激活和控制消息收发系统100内的数据交换。
现在具体地转至消息收发服务器系统108,应用程序接口(API)服务器116耦接至应用服务器114并向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器120,数据库服务器120促进访问数据库126,该数据库126存储与通过应用服务器114处理的消息相关联的数据。类似地,web服务器128耦接至应用服务器114,并且向应用服务器114提供基于web的接口。为此,web服务器128通过超文本传输协议(HTTP)和若干其他相关协议处理传入的网络请求。
应用程序接口(API)服务器116在客户端设备102与应用服务器114之间接收和发送消息数据(例如,命令和消息有效载荷)。具体地,应用程序接口(API)服务器116提供一组接口(例如,例程和协议),消息收发客户端104可以调用或查询该组接口以激活应用服务器114的功能。应用程序接口(API)服务器116公开由应用服务器114支持的各种功能,包括:账户注册;登录功能;经由应用服务器114将消息从特定消息收发客户端104发送至另一消息收发客户端104;将媒体文件(例如,图像或视频)从消息收发客户端104发送至消息收发服务器118以及供另一消息收发客户端104的可能访问;设置媒体数据集合(例如,故事);检索客户端设备102的用户的朋友列表;检索这样的集合;检索消息和内容;针对实体图(例如,社交图)添加和删除实体(例如,朋友);定位社交图中的朋友;以及打开(例如,与消息收发客户端104相关的)应用事件。
应用服务器114托管若干服务器应用和子系统,包括例如消息收发服务器118、图像处理服务器122以及社交网络服务器124。消息收发服务器118实现了若干消息处理技术和功能,特别是与从消息收发客户端104的多个实例接收到的消息中包括的内容(例如,文本和多媒体内容)的汇总和其他处理有关的消息处理技术和功能。如将进一步详细地描述的,来自多个源的文本和媒体内容可以被汇总成内容的集合(例如,被称为故事(story)或图库(gallery))。然后,使这些集合对消息收发客户端104可用。鉴于对数据的其他处理器和存储器密集型处理的硬件要求,也可以由消息收发服务器118在服务器侧执行这样的处理。
应用服务器114还包括图像处理服务器122,该图像处理服务器122专用于执行各种图像处理操作,通常针对在从消息收发服务器118发送或者在消息收发服务器118处接收的消息的有效载荷内的图像或视频执行各种图像处理操作。
社交网络服务器124支持各种社交联网功能和服务并使这些功能和服务可用于消息收发服务器118。为此,社交网络服务器124维护和访问数据库126内的实体图308(如图3所示)。由社交网络服务器124支持的功能和服务的示例包括识别特定用户与之有关系或该特定用户正在“关注”的其他用户,以及识别特定用户的兴趣和其他实体。
返回到消息收发客户端104,外部资源(例如,应用106或小应用(applet))的特征和功能经由消息收发客户端104的接口对用户可用。在该上下文中,“外部”指的是应用106或小应用在消息收发客户端104外部的事实。外部资源通常由第三方提供,但也可以由消息收发客户端104的创建者或提供者提供。消息收发客户端104接收对用于启动或访问这样的外部资源的特征的选项的用户选择。外部资源可以是安装在客户端设备102上的应用106(例如,“本地app”),或者托管在客户端设备102上或者远离客户端设备102(例如,在第三方服务器110上)的应用的小规模版本(例如,“小应用”)。应用的小规模版本包括应用(例如,应用的完整规模、本地版本)的特征和功能的子集,并且使用标记语言文档来实现。在一个示例中,应用的小规模版本(例如,“小应用”)是应用的基于web的标记语言版本,并且被嵌入在消息收发客户端104中。除了使用标记语言文档(例如,.*ml文件)以外,小应用可以并入脚本语言(例如,.*js文件或.json文件)和样式表(例如,.*ss文件)。
响应于接收到对用于启动或访问外部资源的特征的选项的用户选择,消息收发客户端104确定所选择的外部资源是基于web的外部资源还是本地安装的应用106。在一些情况下,可以例如通过在客户端设备102的主页画面上选择与应用106对应的图标而独立于消息收发客户端104并且与消息收发客户端104分开地启动本地安装在客户端设备102上的应用106。这样的应用的小规模版本可以经由消息收发客户端104启动或访问,并且,在一些示例中,小规模应用的任何部分都不能(或有限部分才能)在消息收发客户端104之外被访问。可以由消息收发客户端104例如从第三方服务器110接收与小规模应用相关联的标记语言文档并处理这样的文档来启动小规模应用。
响应于确定外部资源是本地安装的应用106,消息收发客户端104通过执行与外部资源对应的本地存储的代码来指示客户端设备102启动外部资源。响应于确定外部资源是基于web的资源,消息收发客户端104与(例如)第三方服务器110通信以获得与所选择的外部资源对应的标记语言文档。然后,消息收发客户端104处理所获得的标记语言文档以在消息收发客户端104的用户界面内呈现基于web的外部资源。
消息收发客户端104可以向客户端设备102的用户或与这样的用户有关的其他用户(例如,“朋友”)通知在一个或更多个外部资源中发生的活动。例如,消息收发客户端104可以向消息收发客户端104中的对话(例如,聊天会话)中的参与者提供与用户群组中的一个或更多个成员对外部资源的当前或新近使用有关的通知。可以邀请一个或更多个用户加入活动的外部资源或者启动(在朋友群组中)新近使用过但当前不活动的外部资源。外部资源可以向对话中的各自使用相应的消息收发客户端104的参与者提供与一组用户中的一个或更多个成员将外部资源中的项目、状态、状况或位置共享到聊天会话中的能力。共享项目可以是交互式聊天卡,聊天的成员可以利用该交互式聊天卡进行交互,例如,以启动相应的外部资源,查看外部资源内的特定信息,或将聊天的成员带到外部资源内的特定位置或状态。在给定的外部资源内,可以在消息收发客户端104上向用户发送响应消息。外部资源可以基于外部资源的当前情境在响应中选择性地包括不同的媒体项。
消息收发客户端104可以向用户呈现可用外部资源(例如,应用106或小应用)的列表以启动或访问给定的外部资源。该列表可以以上下文相关菜单的方式呈现。例如,表示不同的应用106(或小应用)的图标可以基于用户如何启动菜单(例如,从对话界面启动菜单或从非对话界面启动菜单)而变化。
系统架构
图2是示出根据一些示例的关于消息收发系统100的另外的细节的框图。具体地,消息收发系统100被显示为包括消息收发客户端104和应用服务器114。消息收发系统100包含若干子系统,这些子系统在客户端侧由消息收发客户端104支持并且在服务器侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、游戏系统212、外部资源系统214以及化身生成系统216。
短暂定时器系统202负责强制由消息收发客户端104和消息收发服务器118对内容进行临时或限时访问。短暂定时器系统202包含若干个定时器,这些定时器基于与消息或消息集合(例如,故事)相关联的持续时间和显示参数,选择性地实现经由消息收发客户端104访问(例如,用于呈现和显示)消息和相关联的内容。下面提供关于短暂定时器系统202的操作的另外的细节。
集合管理系统204负责管理媒体的合集或集合(例如,文本、图像视频和音频数据的集合)。可以将内容(例如,消息,包括图像、视频、文本和音频)的集合组织成“事件图库”或“事件故事”。这样的集合可以在指定的时间段内(例如,与内容有关的事件的持续时间)可用。例如,可以在音乐会的持续时间内使与音乐会有关的内容作为“故事”可用。集合管理系统204还可以负责向消息收发客户端104的用户界面发布提供特定集合存在的通知的图标。
此外,集合管理系统204还包括策展接口206,策展接口206使得集合管理者能够管理和策展特定内容集合。例如,策展接口206使得事件组织者能够策展与特定事件有关的内容集合(例如,删除不适当的内容或冗余消息)。此外,集合管理系统204采用机器视觉(或图像识别技术)和内容规则来自动地策展内容集合。在某些示例中,可以为将用户生成的内容包括到集合中而向用户支付补偿。在这样的情况下,集合管理系统204进行操作以自动地为使用用户的内容而向这样的用户进行支付。
增强系统208提供使得用户能够增强(例如,注释或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如,增强系统208提供与生成和发布针对由消息收发系统100处理的消息的媒体覆盖有关的功能。增强系统208基于客户端设备102的地理定位可操作地向消息收发客户端104提供媒体覆盖或增强(例如,图像过滤器)。在另一示例中,增强系统208基于诸如客户端设备102的用户的社交网络信息的其他信息可操作地向消息收发客户端104供应媒体覆盖。媒体覆盖可以包括音频和视觉内容以及视觉效果。音频和视觉内容的示例包括图片、文本、标志、动画和声音效果。视觉效果的示例包括颜色覆盖。音频和视觉内容或视觉效果可以应用于客户端设备102处的媒体内容项(例如,照片)。例如,媒体覆盖可以包括可以覆盖在由客户端设备102拍摄的照片之上的文本或图像。在另一示例中,媒体覆盖包括定位标识(例如,威尼斯海滩)覆盖、实况事件的名称或商家名称(例如,海滩咖啡馆)覆盖。在另一示例中,增强系统208使用客户端设备102的地理定位来标识包括客户端设备102的地理定位处的商家的名称的媒体覆盖。媒体覆盖可以包括与商家相关联的其他标记。媒体覆盖可以被存储在数据库126中并且通过数据库服务器120访问。
在一些示例中,增强系统208提供基于用户的发布平台,该基于用户的发布平台使得用户能够选择地图上的地理定位并上传与所选择的地理定位相关联的内容。用户还可以指定应当向其他用户提供特定媒体覆盖的环境。增强系统208生成媒体覆盖,该媒体覆盖包括所上传的内容并将所上传的内容与所选择的地理定位相关联。
在其他示例中,增强系统208提供基于商家的发布平台,该基于商家的发布平台使得商家能够选择经由投标处理与地理定位相关联的特定媒体覆盖。例如,增强系统208使最高出价商家的媒体覆盖与相应地理定位相关联达预定义时间量。
地图系统210提供各种地理定位功能,并且支持由消息收发客户端104呈现基于地图的媒体内容和消息。例如,地图系统210能够在地图上显示(例如,存储在简档数据316中的)用户图标或化身,以指示用户的“朋友”的当前或过去位置,以及由这些朋友在地图的上下文内生成的媒体内容(例如,包括照片和视频的消息的集合)。例如,可以在消息收发客户端104的地图界面上将用户从特定地理位置发布到消息收发系统100的消息在地图的该特定位置的上下文内显示给特定用户的“朋友”。用户还可以经由消息收发客户端104与消息收发系统100的其他用户(例如,使用适当的状态化身)共享他的或她的定位和状态信息,该定位和状态信息在消息收发客户端104的地图界面的上下文内被类似地显示给所选择的用户。
游戏系统212在消息收发客户端104的上下文内提供各种游戏功能。消息收发客户端104提供游戏界面,该游戏界面提供可用游戏的列表,该游戏可以由用户在消息收发客户端104的上下文中启动并与消息收发系统100的其他用户一起玩。消息收发系统100还使得特定用户能够通过从消息收发客户端104向其他用户发出邀请来邀请这样的其他用户参与玩特定游戏。消息收发客户端104还支持游戏上下文内进行语音消息收发和文本消息收发两者(例如,聊天)、为游戏提供排行榜,并且还支持提供游戏内奖励(例如,游戏币和物品)。
外部资源系统214为消息收发客户端104提供接口以与远程服务器(例如,第三方服务器110)进行通信以用于启动或访问外部资源即应用或小应用。每个第三方服务器110托管例如基于标记语言(例如,HTML5)的应用或应用的小规模版本(例如,游戏、实用程序、支付或骑乘共享应用)。消息收发客户端104可以通过从与基于web的资源相关联的第三方服务器110访问HTML5文件来启动基于web的资源(例如,应用)。在某些示例中,利用由消息收发服务器118提供的软件开发工具包(SDK)通过JavaScript对第三方服务器110托管的应用进行编程。SDK包括应用编程接口(API),API具有可以由基于web的应用调用或激活的功能。在某些示例中,消息收发服务器118包括JavaScript库,该库向给定的外部资源提供对消息收发客户端104的某些用户数据的访问。HTML5被用作对游戏进行编程的示例技术,但是可以使用基于其他技术编程的应用和资源。
为了将SDK的功能集成到基于web的资源中,SDK由第三方服务器110从消息收发服务器118下载或者由第三方服务器110以其他方式接收。一旦被下载或接收,SDK将被包括作为基于web的外部资源的应用代码的一部分。然后,基于web的资源的代码可以调用或激活SDK的某些功能以将消息收发客户端104的特征集成到基于web的资源中。
存储在消息收发服务器118上的SDK有效地提供外部资源(例如,应用106或小应用)与消息收发客户端104之间的桥接。这为用户提供了在消息收发客户端104上与其他用户通信的无缝体验,同时还保留了消息收发客户端104的外观和感觉。为了桥接外部资源与消息收发客户端104之间的通信,在某些示例中,SDK促进第三方服务器110与消息收发客户端104之间的通信。在某些示例中,在客户端设备102上运行的WebViewJavaScriptBridge在外部资源与消息收发客户端104之间建立两个单向通信通道。经由这些通信通道在外部资源与消息收发客户端104之间异步发送消息。每个SDK功能激活都作为消息和回调被发送。每个SDK功能都是通过构造唯一的回调标识符并发送具有该回调标识符的消息来实现的。
通过使用SDK,并非来自消息收发客户端104的所有信息都被与第三方服务器110共享。SDK基于外部资源的需要来限制共享哪些信息。在某些示例中,每个第三方服务器110将与基于web的外部资源对应的HTML5文件提供给消息收发服务器118。消息收发服务器118可以在消息收发客户端104中添加基于web的外部资源的视觉表示(例如,盒艺术(box art)或其他图形)。一旦用户通过消息收发客户端104的GUI选择视觉表示或指示消息收发客户端104访问基于web的外部资源的特征,消息收发客户端104就获得HTML5文件并且使访问基于web的外部资源的特征所需的资源实例化。
消息收发客户端104呈现用于外部资源的图形用户界面(例如,登录页面或标题画面)。在呈现登录页面或标题画面期间、之前或之后,消息收发客户端104确定所启动的外部资源是否先前已被授权访问消息收发客户端104的用户数据。响应于确定所启动的外部资源先前已被授权访问消息收发客户端104的用户数据,消息收发客户端104呈现外部资源的另一图形用户界面,该界面包括外部资源的功能和特征。响应于确定所启动的外部资源先前未被授权访问消息收发客户端104的用户数据,在显示外部资源的登录页面或标题画面的阈值时间段(例如,3秒)之后,消息收发客户端104向上滑动用于授权外部资源访问用户数据的菜单(例如,将菜单动画化为从屏幕的底部浮现到屏幕的中间部分或其他部分)。该菜单标识了外部资源将被授权使用的用户数据的类型。响应于接收到对接受选项的用户选择,消息收发客户端104将外部资源添加至经授权外部资源列表,并且允许外部资源从消息收发客户端104访问用户数据。在一些示例中,外部资源由消息收发客户端104根据OAuth 2框架授权访问用户数据。
消息收发客户端104基于被授权的外部资源的类型来控制与外部资源共享的用户数据的类型。例如,包括完整规模的应用(例如,应用106)的外部资源被提供有对第一类型的用户数据(例如,仅用户的具有或不具有不同化身特征的二维化身)的访问。作为另一示例,包括应用的小规模版本(例如,应用的基于web的版本)的外部资源被提供有对第二类型的用户数据(例如,支付信息、用户的二维化身、用户的三维化身以及具有各种化身特征的化身)的访问。化身特性包括用于定制化身的外观和感觉(例如不同的姿势、面部特征、服装等)的不同方式。
化身生成系统216提供用于生成定制化身的功能、操作和例程,定制化身包括由用户在诸如消息收发应用的应用中输入的整合用户输入文本数据。在一些示例中,化身生成系统216对用户输入文本数据进行分析并且识别与用户输入文本数据相关联的特性。在一个示例中,与用户输入文本数据相关联的特性包括字体类型、字体间距、字体大小、文本行数、语法和句法、文本数据语言、字母间距、诸如假日、问候语等各种含义。
在示例中,化身生成系统216对生成并存储在数据库126的图像表312中或别处的个性化化身进行检索和分析,并且识别与个性化化身相关联的特性。在一些示例中,与个性化化身相关联的特性包括在图像帧内的定位、对准、取向、宽度、高度、长度、分辨率、颜色方案以及关于与个性化化身相关联的文本区域的特性。与文本数据和个性化化身相关联的特性结合图5进一步讨论。化身生成系统216通过对与个性化化身相关联的特性进行比较并确定哪些特性和与用户输入数据相关联的特性相兼容来计算加权匹配组合。
一旦确定了加权匹配组合,化身生成系统216就利用加权匹配组合来识别所分析的个性化化身内的包含与用户输入文本数据特性兼容的特性的个性化化身的子集,以便生成用户输入文本数据并将其呈现为个性化化身的子集。例如,如果用户以全大写字母、无间隔、单行和标准字体输入短语“hello leo”,化身生成系统216将对个性化化身进行比较并识别具有与用户输入文本数据特性匹配的特性的个性化化身的子集,以用于将短语“helloleo”整合到个性化化身中以生成个性化化身中包括短语“hello leo”的定制化身。
数据架构
图3是示出根据某些示例的可以存储在消息收发服务器系统108的数据库126中的数据结构300的示意图。虽然数据库126的内容被示为包括若干表,但是应当理解的是,数据可以被存储在其他类型的数据结构中(例如,作为面向对象的数据库)。
数据库126包括存储在消息表302内的消息数据。对于任何特定的消息,该消息数据包括至少消息发送者数据、消息接收方(或接收者)数据和有效载荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储在消息表302中的消息数据中的信息的另外的细节。
实体表306存储实体数据,并且(例如,参考地)链接到实体图308和简档数据316。在实体表306内针对其保存记录的实体可以包括个人、公司实体、组织、对象、地点、事件等。不管实体类型如何,消息收发服务器系统108存储关于其的数据的任何实体可以是识别的实体。针对每个实体提供唯一标识符以及实体类型标识符(未示出)。
实体图308存储关于实体之间的关系和关联的信息。仅作为示例,这样的关系可以是基于兴趣或基于活动的职业关系(例如,在共同的公司或组织工作)、社交关系。
简档数据316存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置,简档数据316可以被选择性地使用并呈现给消息收发系统100的其他用户。在实体是个人的情况下,简档数据316包括例如用户名、电话号码、地址、设置(例如,通知和隐私设置),以及用户选择的化身表示(或这样的化身表示的集合)。然后,特定用户可以将这些化身表示中的一个或更多个选择性地包括在经由消息收发系统100传送的消息的内容中以及在由消息收发客户端104向其他用户显示的地图界面上。化身表示的集合可以包括“状态化身”,其呈现用户可以选择在特定时间进行传送的状态或活动的图形表示。
在实体是组的情况下,除了组名称、成员以及针对相关组的各种设置(例如,通知)之外,针对组的简档数据316还可以类似地包括与组相关联的一个或更多个化身表示。
数据库126还在增强表310中存储例如覆盖物或过滤器的增强数据和化身数据。增强数据与视频(其数据被存储在视频表304中)和图像(其数据被存储在图像表312)相关联并且应用于视频和图像。
在一个示例中,过滤器是在向接收方用户呈现期间被显示为覆盖在图像或视频上的覆盖物。过滤器可以是各种类型的,包括当发送方用户正在编写消息时由消息收发客户端104呈现给发送用户的一组过滤器中用户选择的过滤器。其他类型的过滤器包括地理定位过滤器(也称为地理过滤器),其可以基于地理定位被呈现给发送用户。例如,可以基于由客户端设备102的全球定位系统(GPS)单元确定的地理定位信息,由消息收发客户端104在用户界面内呈现特定于附近或特殊定位的地理定位过滤器。
另一种类型的过滤器是数据过滤器,其可以由消息收发客户端104基于在消息创建处理期间由客户端设备102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定定位处的当前温度、发送用户行进的当前速度、客户端设备102的电池寿命或当前时间。
可以存储在图像表312内的其他增强数据包括增强现实内容项(例如,对应于应用镜头(Lenses)或增强现实体验)。增强现实内容项可以是可以添加至图像或视频的实时特殊效果和声音。
如上所述,增强数据包括增强现实内容项、覆盖物、图像变换、AR图像以及涉及可以应用于图像数据(例如,视频或图像)的修改的类似术语。这包括实时修改,其在使用客户端设备102的设备传感器(例如,一个或更多个摄像装置)捕获到图像并且然后在客户端设备102的屏幕上显示图像时利用所述修改对图像进行修改。这还包括对所存储的内容的修改,例如对图库中可以被修改的视频片段的修改。例如,在可以访问多个增强现实内容项的客户端设备102中,用户可以使用具有多个增强现实内容项的单个视频片段来查看不同的增强现实内容项将如何修改所存储的片段。例如,通过针对内容选择不同的增强现实内容项,可以将应用不同伪随机运动模型的多个增强现实内容项应用于该内容。类似地,实时视频捕获可以与所说明的修改一起使用,以显示当前由客户端设备102的传感器捕获的视频图像将如何修改所捕获的数据。这样的数据可以仅显示在屏幕上而不存储在存储器中,或者可以在具有或不具有修改(或两者)的情况下将由设备传感器捕获的内容记录并存储在存储器中。在一些系统中,预览特征可以同时显示不同的增强现实内容项在显示器的不同窗口中将看起来如何。例如,这可以使得具有不同伪随机动画的多个窗口能够同时在显示器上被查看。
因此,使用增强现实内容项的数据和各种系统或者其他这样的利用该数据来修改内容的变换系统可以涉及对视频帧中的对象(例如,脸、手、身体、猫、狗、表面、对象等)的检测,在这些对象离开视场、进入视场以及在视场四处移动时对这些对象的跟踪,以及在跟踪这些对象时对其进行的修改或变换。在各种示例中,可以使用用于实现这样的变换的不同方法。一些示例可以涉及生成一个或更多个对象的三维网格模型,以及使用视频内模型的变换和动画纹理来实现变换。在其他示例中,可以使用对象上的跟踪点将图像或纹理(其可以是二维或三维的)放置在所跟踪的位置处。在更进一步的示例中,可以使用视频帧的神经网络分析将图像、模型或纹理放置在内容(例如,图像或视频帧)中。因此,增强现实内容项既指代用于在内容中创建变换的图像、模型和纹理,也指代通过对象检测、跟踪和放置实现这样的变换所需的附加建模和分析信息。
可以用保存在任何类型的计算机化系统的存储器中的任何类型的视频数据(例如,视频流、视频文件等)来执行实时视频处理。例如,用户可以加载视频文件并将其保存在设备的存储器中,或者可以使用设备的传感器生成视频流。另外,任何对象,例如人的面部和人体的各部位、动物,或者诸如椅子、汽车的非生物,或者其他对象都可以使用计算机动画模型来进行处理。
在一些示例中,当与要变换的内容一起选择特定修改时,由计算设备识别要变换的元素,并且然后如果要变换的元素存在于视频的帧中,则检测并跟踪要变换的元素。根据修改请求来修改对象的元素,从而对视频流的帧进行变换。对于不同类型的变换,可以通过不同的方法对视频流的帧进行变换。例如,对于主要涉及改变对象的元素的形式的帧变换,计算对象的每个元素的特征点(例如,使用主动形状模型(ASM)或其他已知方法)。然后,针对对象的至少一个元素中的每个元素生成基于特征点的网格。该网格被用于跟踪视频流中的对象的元素的下一阶段。在跟踪处理中,将所提及的每个元素的网格与每个元素的位置对准。然后,在网格上生成附加点。基于修改请求针对每个元素生成第一点的第一集合,并且基于第一点的集合和修改请求针对每个元素生成第二点的集合。然后,可以通过基于第一点的集合和第二点的集合以及网格修改对象的元素来对视频流的帧进行变换。在这种方法中,也可以通过跟踪和修改背景来使所修改对象的背景改变或变形。
在一些示例中,使用对象的元素改变对象的一些区域的变换可以通过计算对象的每个元素的特征点以及基于所计算的特征点生成网格来执行。在网格上生成点,并且然后生成基于这些点的各种区域。然后通过将每个元素的区域与至少一个元素中的每个元素的位置对准来跟踪对象的元素,并且可以基于修改请求来修改区域的属性,从而对视频流的帧进行变换。根据具体的修改请求,可以以不同的方式变换所提及的区域的属性。这样的修改可以涉及:改变区域的颜色;从视频流的帧中移除区域的至少一些部分;将一个或更多个新对象包括在基于修改请求的区域中;以及对区域或对象的元素进行修改或使之变形。在各种示例中,可以使用这样的修改或其他类似修改的任何组合。对于某些要被动画化的模型,可以选择一些特征点作为控制点,以用于确定模型动画的选项的整个状态空间。
在使用面部检测来变换图像数据的计算机动画模型的一些示例中,使用特定面部检测算法(例如,Viola-Jones)在图像上检测面部。然后,将主动形状模型(ASM)算法应用于图像的面部区域以检测面部特征参考点。
可以使用适合于面部检测的其他方法和算法。例如,在一些示例中,使用界标来定位特征,该界标表示存在于所考虑的大多数图像中的可区分点。例如,对于面部界标,可以使用左眼瞳孔的位置。如果初始界标不可识别(例如,如果人带有眼罩),则可以使用次级界标。这样的界标识别程序可以用于任何这样的对象。在一些示例中,一组界标形成形状。可以使用形状中的点的坐标将形状表示为矢量。一个形状通过相似变换(允许平移、缩放和旋转)与另一形状对准,该相似变换使形状点之间的平均欧几里得距离最小化。平均形状是对准的训练形状的平均值。
在一些示例中,从与由全局面部检测器确定的面部的位置和大小对准的平均形状开始搜索界标。然后,这样的搜索重复以下步骤:通过对每个点周围的图像纹理进行模板匹配以调整形状点的位置来建议暂定形状,并且然后使暂定形状符合全局形状模型,直至发生收敛。在一些系统中,个体模板匹配是不可靠的,并且形状模型将弱模板匹配的结果进行池化,以形成更强的整体分类器。整个搜索从粗分辨率到细分辨率在图像金字塔的每个级别上重复。
变换系统可以在客户端设备(例如,客户端设备102)上捕获图像或视频流,并在客户端设备102上本地执行复杂的图像操纵,同时保持适当的用户体验、计算时间和功耗。复杂的图像操纵可以包括大小和形状变化、情绪变换(例如,将面部从皱眉变为微笑)、状态变换(例如,使对象变老、减少表观年龄、改变性别)、风格变换、图形元素应用,以及由已经被配置成在客户端设备102上高效执行的卷积神经网络实现的任何其他合适的图像或视频操纵。
在一些示例中,用于变换图像数据的计算机动画模型可以由系统使用,在该系统中,用户可以使用具有作为在客户端设备102上操作的消息收发客户端104的一部分的神经网络的客户端设备102来捕获用户的图像或视频流(例如,自拍)。在消息收发客户端104内操作的变换系统确定图像或视频流中的面部的存在并且提供与计算机动画模型相关联的修改图标以变换图像数据,或者计算机动画模型可以被呈现为与本文中描述的接口相关联。修改图标包括以下变化,该变化可以是作为修改操作的一部分而修改图像或视频流中的用户面部的基础。一旦选择了修改图标,则变换系统发起用于将用户的图像转换成反映所选择的修改图标(例如,在用户上生成笑脸)的处理。
一旦图像或视频流被捕获并且指定修改被选择,就可以在客户端设备102上显示的图形用户界面中呈现经修改的图像或视频流。变换系统可以在图像或视频流的一部分上实施复杂的卷积神经网络,以生成并应用所选择的修改。也就是说,一旦选择了修改图标,用户就可以捕获图像或视频流并且实时或近乎实时地呈现修改结果。此外,当正在捕获视频流并且所选择的修改图标保持被切换时,修改可以是持久的。机器学习的神经网络可以用于实现这样的修改。
呈现由变换系统执行的修改的图形用户界面可以为用户提供附加的交互选项。这样的选项可以基于用于发起对特定计算机动画模型的选择和内容捕获的接口(例如,从内容创建者用户界面发起)。在各种示例中,修改可以在修改图标的初始选择之后持续存在。用户可以通过轻击或以其他方式选择正由变换系统修改的面部来打开或关闭修改,并将其存储以供以后查看或浏览成像应用的其他区域。在由变换系统修改多个面部的情况下,用户可以通过轻击或选择在图形用户界面内修改和显示的单个面部来全局地打开或关闭修改。在一些示例中,可以单独修改一组多个面部中的各个面部,或者可以通过轻击或选择图形用户界面内显示的各个面部或一系列各个面部来单独切换这样的修改。
故事表314存储关于消息和相关联的图像、视频或音频数据的集合的数据,所述消息和相关联的图像、视频或音频数据被汇编成集合(例如,故事或库)。特定集合的创建可以由特定用户(例如,在实体表306中维护其记录的每个用户)发起。用户可以以已经由该用户创建和发送/广播的内容集合的形式创建“个人故事”。为此,消息收发客户端104的用户界面可以包括用户可选择的图标,以使得发送用户能够将特定内容添加到他或她的个人故事。
集合还可以构成作为来自多个用户的内容集合的“实况故事”,该内容集合是手动地、自动地或者使用手动技术和自动技术的组合创建的。例如,“实况故事”可以构成来自各种定位和事件的用户提交内容的策展流。可以例如经由消息收发客户端104的用户界面向其客户端设备启用了定位服务并且在特定时间处于共同定位事件处的用户呈现用于将内容贡献给特定实况故事的选项。可以由消息收发客户端104基于用户的定位向他或她标识实况故事。最终结果是从群体角度讲述的“实况故事”。
另外类型的内容集合被称为“定位故事”,其使得其客户端设备102位于特定地理定位(例如,在学院或大学校园)内的用户能够对特定集合做出贡献。在一些示例中,对定位故事的贡献可能需要二级认证来验证终端用户属于特定组织或其他实体(例如,是大学校园中的学生)。
如上面提到的,视频表304存储视频数据,在一个示例中,该视频数据与针对其的记录保存在消息表302内的消息相关联。类似地,图像表312存储与针对其的消息数据被存储在实体表306中的消息相关联的图像数据。实体表306可以使来自增强表310的各种增强与存储在图像表312和视频表304中的各种图像和视频相关联。在另一示例中,图像表312存储由内容创建者创建的个性化化身、数字图标、媒体内容项、媒体覆盖图标、三维(3D)动画图形和对象。
个性化化身还包括描述性特性、多个个性化化片段,这些个性化化片段也可以被称为化身特性,其包括与用户的化身数字肖像、图像和个性有关的组成部分和特性。例如,一旦创建者生成具有化身特性的组合的个性化化身,则该个性化化身被存储在图像表312中以供检索。在另一示例中,附加的个性化化身特性包括在图像帧内的化身定位、化身对准、化身取向、化身宽度、化身高度、化身长度、化身分辨率和化身颜色方案。
数据通信架构
图4是示出根据一些示例的消息400的结构的示意图,消息400由消息收发客户端104生成,以供传送至另外的消息收发客户端104或消息收发服务器118。特定消息400的内容用于填充存储在数据库126中的消息表302,该消息表302可由消息收发服务器118访问。类似地,消息400的内容被作为客户端设备102或应用服务器114的“传输中(in-transit)”或“飞行中(in-flight)”数据存储在存储器中。消息400被示为包括以下示例组成部分:
●消息标识符402:标识消息400的唯一标识符。
●消息文本有效载荷404:要由用户经由客户端设备102的用户界面生成并且包括在消息400中的文本。
●消息图像有效载荷406:由客户端设备102的摄像装置部件捕获的或从客户端设备102的存储器检索到的、并且包括在消息400中的图像数据。针对发送或接收的消息400的图像数据可以被存储在图像表312中。
●消息视频有效载荷408:由摄像装置部件捕获的或从客户端设备102的存储器部件检索到的、并且包括在消息400中的视频数据。针对发送或接收的消息400的视频数据可以被存储在视频表304中。
●消息音频有效载荷410:由麦克风捕获的或从客户端设备102的存储器部件检索到的、并且包括在消息400中的音频数据。
●消息增强数据412:表示要应用于消息400的消息图像有效载荷406、消息视频有效载荷408或消息音频有效载荷410的增强的增强数据(例如,过滤器、标贴或其他注解或增强)。针对发送或接收的消息400的增强数据可以被存储在增强表310中。
●消息持续时间参数414:以秒为单位指示消息的内容(例如,消息图像有效载荷406、消息视频有效载荷408、消息音频有效载荷410)将经由消息收发客户端104呈现给用户或使用户可访问的时间量的参数值。
●消息地理定位参数416:与消息的内容有效载荷相关联的地理定位数据(例如,纬度和经度坐标)。多个消息地理定位参数416值可以被包括在有效载荷中,这些参数值中的每个参数值与内容中所包括的内容项(例如,消息图像有效载荷406内的特定图像或消息视频有效载荷408中的特定视频)相关联。
●消息故事标识符418:标识一个或更多个内容集合(例如,在故事表314中标识的“故事”)的标识符值,其中消息400的消息图像有效载荷406中的特定内容项与一个或更多个内容集合相关联。例如,可以利用标识符值将消息图像有效载荷406内的多个图像各自与多个内容集合相关联。
●消息标签420:每个消息400可以用多个标签来标记,这些标签中的每个标签指示消息有效载荷中包括的内容的主题。例如,在消息图像有效载荷406中包括的特定图像描绘动物(例如狮子)的情况下,标签值可以包括在指示相关动物的消息标签420中。标签值可以基于用户输入手动地生成,或者可以利用例如图像识别自动地生成。
●消息发送者标识符422:指示在其上生成消息400以及从其发送消息400的客户端设备102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或设备标识符)。
●消息接收者标识符424:指示消息400寻址到的客户端设备102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或设备标识符)。
消息400的各个组成部分的内容(例如,值)可以是指向在其中存储内容数据值的表中的位置的指针。例如,消息图像有效载荷406中的图像值可以是指向图像表312内的位置的指针(或地址)。类似地,消息视频有效载荷408内的值可以指向存储在视频表304内的数据,存储在消息增强412内的值可以指向存储在增强表310中的数据,存储在消息故事标识符418内的值可以指向存储在故事表314中的数据,以及存储在消息发送者标识符422和消息接收者标识符424内的值可以指向存储在实体表306内的用户记录。
化身生成系统
图5示出了根据一些示例的用于化身生成的系统500的细节的图解表示。用户(未示出)将文本数据506输入到用户界面504中。例如,用户界面504用于输入包括字母、数字或特殊字符的内容,所述内容将被单独地发送给另一用户或被包括在媒体内容项、短暂消息、内容集合或短暂内容集合中。例如,客户端设备102的用户输入文本数据“hello leo”,并且经由消息收发系统100向另一客户端设备102的另一用户发送短暂消息。
化身生成系统508获取文本数据506,并且基于存储在化身存储装置542中的个性化化身544来生成化身匹配509。文本数据506的特性507包括字母的大小写、间距、行数、字体类型、字体大小、字体间距、文本行数、特殊字符、图标、语法、句法、文本含义、短语、标题、标语、动作、情绪、情感、问候语、感情、动作、事件、地点、对象等。情感或感情包括快乐、激动、悲伤、困惑、沉思、愤怒、激动、失望、震惊等。问候语包括您好、再见等。动作包括发送电子邮件、给我打电话等。
机器学习(ML)模型520将文本数据506作为输入并且输出特性507。在一些示例中,ML模型520是利用具有特性507的文本数据集训练的以确定文本数据506是否具有特性507的神经网络(NN)。例如,对于诸如快乐的特性507,训练集中的文本数据506包括表达快乐的数千个单词、短语、句子和图标。特性507中的每个特性可以包括对应的NN以确定文本数据506是否可以被表征为具有特性507。在一些示例中,确定文本的特性518输出从0到1的数字,0意指文本数据506不具有特性,1意指文本数据506具有特性。一些特性507是诸如单词的数目的值。
确定化身的特性528模块确定化身例如基础化身547和个性化化身544的特性。基础化身547是个人诸如客户端设备102的用户的基础化身。例如,图7的基础化身706示出客户端设备的用户并且下面将更详细地讨论。化身包括以下中的一个或更多个:图像、视频、数字照片、内容集合、虚拟现实数字表示、混合现实数字表示、混合现实图形表示或三维数字表示。
个性化化身544包括文本放置549区域和化身区域。根据一些示例,个性化化身544是基础化身547的变型。在一些示例中,生成化身540模块根据基础化身547生成个性化化身544。例如,在一些示例中,生成化身540模块利用生成式对抗网络(GAN)来训练神经网络(NN)以生成个性化化身544,其中基础化身547和特性541被输入至GAN NN,并且GAN NN生成具有该特性541的个性化化身544。GAN NN被训练成根据基础化身547来生成不同版本的个性化化身544。在一些示例中,使用化身集来训练GAN NN以根据具有特性541的基础化身547生成个性化化身544。使用相同或类似的化身集来训练确定化身的特性528模块的ML模型530,以识别个性化化身544中通过GAN NN不同地编辑或创建的特性546。另外,根据一些示例,特性541对应于特性507。
例如,特性546可以是上面针对个性化化身544的化身和文本放置549区域两者所包括的特性507,以及个性化化身544的化身部分所特有的附加特性,诸如化身定位、化身宽度、化身高度、化身取向、化身旋转、化身框架边界框等。另外,用户可以定制设计个性化化身544并将特性546与个性化化身544相关联,或者确定化身的特性528模块将确定个性化化身544的特性546。化身具有化身框架边界绑定框(frame boundary bound box),其使得能够如结合图10所公开的那样缩放化身框架边界。
化身至文本匹配模块536将特性507与个性化化身544的特性546进行匹配。化身至文本匹配模块536确定文本数据506是否将适配个性化化身544的文本放置549区域。在示例中,化身至文本匹配模块536通过对与个性化化身相关联的特性546和与用户输入文本数据506相关联的特性507进行比较并确定与个性化化身相关联的特性546和与用户输入文本数据506相关联的特性507兼容的加权因子比例来计算加权匹配组合。例如,确定文本的特性518确定文本数据506具有七个特性507。化身至文本匹配模块536针对这七个特性507中的每一个确定关于个性化化身544是否具有特性507的从0到1的度量。一些特性507被给予较大权重。
例如,情绪特性507被给予比字体类型特性大的权重,因为不正确的情绪将很可能是用户不可接受的个性化化身544。根据一些示例,化身至文本匹配模块536使用ML模型538来确定文本数据506的特性507与个性化化身544的特性546之间的相似度。根据一些示例,ML模型538是基于成对的具有特性507的文本数据506和具有特性546的个性化化身544根据基本事实训练的NN,其中基本事实指示每对的相似度数值,该数值从0到1。
化身至文本匹配模块536检查文本数据506是否将适配个性化化身544的文本放置549区域。化身至文本匹配模块536使用化身调整534来调整文本放置549和/或个性化化身544的化身的大小以容纳文本数据506。文本放置549区域具有化身至文本匹配模块536用来选择化身匹配509的特性546。化身至文本匹配模块536将文本数据506插入到文本放置549区域中。
在一些示例中,化身至文本匹配模块536基于与文本数据506最佳匹配的个性化化身544来生成化身匹配509。例如,文本数据506通常包括多个单词并且可选地包括其他字符和图标,化身至文本匹配模块536将单词的大小和数目与个性化化身544的文本放置549区域进行匹配,以确定文本数据506是否可以被放置在文本放置549区域内。文本放置549区域通常具有定制的字体和字母。例如,参照图10,单词“test”可以用在字母的数量上与“test”相似的另一单词来代替。单词“font here”可以由与单词“font here”具有相似数目的字母的两个单词来代替。单词“font here”可以是上下跳动的字体。化身至文本匹配模块536首先对个性化化身544进行过滤以仅包括其中文本放置549区域可以容纳文本数据506的个性化化身544。化身至文本匹配模块536使用化身调整534模块来检查文本放置549区域是否可以被调整以适应文本数据506,并且包括其中文本放置549区域可以被调整以容纳文本数据506的那些个性化化身544。例如,文本放置549区域可以被扩展以附加地包括单词的字母。
化身至文本匹配模块536然后仅针对文本放置549区域可以容纳文本数据506的那些个性化化身544执行匹配。在一些示例中,化身至文本匹配模块536执行匹配,并且然后选择至少一个具有与特性列表539匹配的特性546的个性化化身544。例如,特性列表539可以包括诸如沉思、愤怒、激动等感情。化身至文本匹配模块536然后针对每种感情选择一个个性化化身544,其可以被选择为具有每种感情的最高匹配分数的个性化化身544。化身匹配509包括定制化身,其中每个定制化身可以容纳文本数据506,并且针对特性列表539中的每个特性546存在一个定制化身。
例如,文本数据506可以是如图8中的“hello leo”。参照图5和图8,化身至文本匹配模块536生成化身匹配509,化身匹配509包括:具有无聊个性化化身的定制化身1 510“hello leo”、具有运动个性化化身的定制化身2 512“hello leo”、具有沉思个性化化身的定制化身3 514“hello leo”、以及具有激动个性化化身的定制化身4 516“hello leo”。
化身匹配509包括一个至阈值数目个诸如二十个化身匹配509。如图所示,定制化身1 510、定制化身2 512、定制化身3 514和定制化身4 516由化身至文本匹配模块536生成。
检索系统532从存储系统检索个性化化身544。例如,个性化化身544被存储在客户端设备102的存储系统和/或图像表312中。根据一些示例,客户端设备102查询消息收发系统100以检索个性化化身544。化身调整534的操作结合图10来讨论。
图6示出了根据一些示例的用于基于用户输入来生成化身的方法600的流程图。虽然方法600的某些操作被描述为由某些设备执行,但是在不同的示例中,不同的设备或设备的组合可以执行这些操作。例如,以下描述为由客户端设备102执行的操作也可以由服务器侧计算设备(例如,消息收发服务器系统108)或第三方服务器计算设备执行或者与服务器侧计算设备(例如,消息收发服务器系统108)或第三方服务器计算设备组合执行。
方法600开始于操作602,使用至少一个处理器来处理文本数据以确定文本数据的第一特性。例如,确定文本的特性518模块对文本数据506进行处理以利用ML模型520来确定特性507。取决于个性化化身544是由GAN NN生成还是定制设计的,通过生成化身540模块或确定化身的特性528模块来确定个性化化身544的特性546。
方法600在操作604处继续,基于将第一特性与多个个性化化身的第二特性进行匹配来选择多个个性化化身中具有文本数据的个性化化身。例如,化身至文本匹配模块536对文本数据506的特性507和个性化化身544的特性546进行比较,以确定化身匹配509,这些化身匹配是与文本数据506最接近匹配的个性化化身544。
方法600在操作606处继续,基于文本数据和所选择的个性化化身生成定制化身。化身至文本匹配536模块将文本数据506放置在个性化化身544的文本放置549区域中。化身调整534模块调整文本放置549区域以适配文本数据506。
方法600在操作608处继续进行,使定制化身被显示在计算设备的显示器上。例如,化身生成系统508使得一个或更多个化身匹配509被显示在客户端设备102上,如图8中所示出的。
方法600的一个或更多个操作可以是可选的。方法600可以包括一个或更多个附加操作。根据一些示例,方法600的操作可以以不同的顺序来执行。
图7示出了根据一些示例的描绘由客户端设备102显示的基础化身的用户界面700的示例。用户界面700包括用户简档按钮702、菜单选项704、基础化身706和用户界面504。如上所述,基础化身706可以是任何图像、视频、动画、内容集合、短暂消息或短暂内容集合。出于说明的目的,图7包括在与作为朋友的另一用户的短暂聊天期间显示的客户端设备102的用户的图像。
菜单选项704在被激活的情况下显示多个菜单选项,包括但不限于访问朋友列表、查看内容集合生成分数、查看奖励、访问设置等。用户简档按钮702提供对客户端设备102的用户的用户简档的访问,用户简档包括但不限于用户名、喜好、用户肖像、用户情绪、在线访问内容集合的持续时间、联系人数据库内的联系人列表等。用户简档按钮702还允许用户向联系人数据库添加另外的联系人,以及管理在客户端设备102与经由社交网络服务器124连接至客户端设备102的另一计算设备之间接收和/或发送的内容集合。
用户界面700还包括用户输入文本数据506,在一个示例中,该用户输入文本数据针对被设计成接收可以包括图标的字母数字字符串形式的用户输入的数据字段。用户输入文本数据706是用户输入文本数据506的实施方式。可以存在关于在用户输入文本数据706中允许多少字符的预定限制。字母数字字符串也可以被称为聊天字段,其在访问和查看内容集合或短暂消息时被覆盖或叠加在媒体内容项之上。
图8示出了根据一些示例的描绘由客户端设备102显示的定制化身和化身界面802的用户界面800的示例。如在基础化身706下面所描绘的,化身界面802显示定制化身,诸如由于字体大小匹配而匹配的定制化身1510、由于尺寸匹配而匹配的定制化身2 512、由于对准匹配而匹配的定制化身3 514、以及由于字体匹配而匹配的定制化身4 516。与文本数据506“Hello Leo”匹配的个性化化身544具有与“Hello Leo”兼容的文本放置549区域。例如,所选择的个性化化身544中的每一个被设计用于大约为“hello”和“leo”大小的两个单词。定制化身包括如用户输入文本数据506中所示的用户输入文本数据506“HELLO LEO”。
在一个示例中,如果用户进行选择,则他/她可以从化身界面802中显示的定制化身510、512、514或516之一中进行选择,以便允许用户回复第二计算设备。显示器可以显示来自第二用户的媒体内容项而不是基础化身547。摄像装置图标804允许用户访问客户端设备102中集成的摄像装置。在一些示例中,定制化身扩展按钮806生成扩展化身界面,该扩展化身界面包含由化身至文本匹配模块536生成的附加定制化身。先前内容收集按钮808允许用户检索先前存储的或观看的内容集合。在检测到用户姿势时,客户端设备102可以激活或停用键盘接口810。
图9示出了根据一些示例的描绘由客户端设备102显示的可扩展定制化身界面902的用户界面900的示例。如图9所示,基于用户姿势或通过激活定制化身扩展按钮806,生成可扩展定制化身界面902。在一个示例中,可扩展定制化身界面902显示由化身至文本匹配模块536生成并且可以由客户端设备102的用户发送给第二计算设备的定制化身。化身至文本匹配模块536通过降低与文本数据506匹配的程度的阈值来生成更多定制化身。在一些示例中,第二计算设备是经由社交网络服务器124与客户端设备102连接的另一客户端设备。图9中示出了内容集合工具栏904,其包含各种设计工具,在被激活的情况下允许用户在内容集合生成期间对媒体内容项、数字表达对象、媒体覆盖图标进行管理或者编辑媒体内容项。
图10示出了根据一些示例的描绘化身框架边界框的示例后端编辑器界面1000。如图10所示,后端编辑器界面1000包括被定位在样本文本数据1006周围以便放大、缩小或重新定位样本文本数据1006的文本边界框1002。文本边界框1002对应于个性化化身544的文本放置549区域。化身1007是个性化化身544的另一部分。化身调整534模块和/或化身至文本匹配模块536在将用户输入文本数据506整合到文本放置549区域期间调整化身1007的大小或位置和/或文本边界框1002的大小和位置。在一些示例中,后端编辑器界面1000包括分段按钮1004以便放大或缩小化身1007。样本文本数据1006包括两行,其中第一行上有四个字母的一个单词,且第二行上有各自具有四个字母的两个单词。
化身调整534模块被配置成使用分段按钮1004来操纵化身框架边界绑定框,以将化身框架边界绑定框缩放到边界大小,从而容纳文本数据506。化身调整534模块被配置成操纵文本边界框1002以容纳文本数据506。化身调整534模块确定文本数据506能够还是不能够被个性化化身544所容纳。
基于时间的访问限制架构
图11是示出访问限制处理1100的示意图,根据该访问限制处理,对内容(例如,短暂消息1102和相关联的数据的多媒体有效载荷)或内容集合(例如,短暂消息组1104)的访问可以是时间受限的(例如,使得是短暂的)。
短暂消息1102被示出为与消息持续时间参数1106相关联,消息持续时间参数1106的值确定消息收发客户端104将向短暂消息1102的接收用户显示短暂消息1102的时间量。在一个示例中,接收用户可查看短暂消息1102上至最多10秒,这取决于发送用户利用消息持续时间参数1106指定的时间量。
消息持续时间参数1106和消息接收者标识符424被示出为是消息定时器1110的输入,消息定时器1110负责确定向由消息接收者标识符424标识的特定接收用户示出短暂消息1102的时间量。特别地,将仅在由消息持续时间参数1106的值确定的时间段内向相关接收用户示出短暂消息1102。消息定时器1110被示出为向更一般化短暂定时器系统202提供输出,该短暂定时器系统202负责向接收用户显示内容(例如,短暂消息1102)的总体定时。
在图11中短暂消息1102被示出为包括在短暂消息组1104(例如,个人故事或事件故事中的消息的集合)内。短暂消息组1104具有相关联的组持续时间参数1108,组持续时间参数1108的值确定短暂消息组1104被呈现并可由消息收发系统100的用户访问的持续时间。例如,组持续时间参数1108可以是音乐会的持续时间,其中短暂消息组1104是关于该音乐会的内容的集合。替选地,用户(拥有用户或者策展者用户)可以在执行短暂消息组1104的设置和创建时指定组持续时间参数1108的值。
另外,短暂消息组1104内的每个短暂消息1102具有相关联的组参与参数1112,组参与参数1112的值确定在短暂消息组1104的上下文内将可访问短暂消息1102的持续时间。因此,在短暂消息组1104本身根据组持续时间参数1108到期之前,特定短暂消息组1104可能“到期”并且在短暂消息组1104的上下文中变得不可访问。组持续时间参数1108、组参与参数1112和消息接收者标识符424各自向组定时器1114提供输入,组定时器1114可操作地首先确定短暂消息组1104中的特定短暂消息1102是否将被显示给特定接收用户,并且如果为是,则确定显示多长时间。注意,由于消息接收者标识符424,短暂消息组1104也知道具体接收用户的身份。
因此,组定时器1114可操作地控制相关联的短暂消息组1104以及包括在短暂消息组1104中的个体短暂消息1102的总寿命。在一个示例中,短暂消息组1104内的每个短暂消息1102在由组持续时间参数1108指定的时间段内保持可查看且可访问。在另一示例中,在短暂消息组1104的上下文内,某个短暂消息1102可以基于组参与参数1112而到期。注意,即使在短暂消息组1104的上下文内,消息持续时间参数1106也仍然可以确定向接收用户显示特定短暂消息1102的持续时间。因此,消息持续时间参数1106确定向接收用户显示特定短暂消息1102的持续时间,而不管接收用户是在短暂消息组1104的上下文之内还是之外查看该短暂消息1102。
短暂定时器系统202还可以基于确定已经超过相关联的组参与参数1112而从短暂消息组1104中可操作地移除特定短暂消息1102。例如,在发送用户已经建立了从发布起24小时的组参与参数1112的情况下,短暂定时器系统202将在指定的24小时之后从短暂消息组1104中移除相关短暂消息1102。短暂定时器系统202还进行操作以在针对短暂消息组1104内的每个短暂消息1102的组参与参数1112已经到期时,或者在短暂消息组1104本身根据组持续时间参数1108已经到期时,移除短暂消息组1104。
在某些使用情况下,特定短暂消息组1104的创建者可以指定无限期的组持续时间参数1108。在这种情况下,短暂消息组1104内最后剩余的短暂消息1102的组参与参数1112的过期将确定短暂消息组1104本身何时过期。在这种情况下,添加至短暂消息组1104的具有新的组参与参数1112的新的短暂消息1102有效地将短暂消息组1104的寿命延长至等于组参与参数1112的值。
响应于短暂定时器系统202确定短暂消息组1104已经到期(例如,不再是可访问的),短暂定时器系统202与消息收发系统100(并且例如特别是消息收发客户端104)通信,以使与相关短暂消息组1104相关联的标记(例如,图标)不再显示在消息收发客户端104的用户界面内。类似地,当短暂定时器系统202确定针对特定短暂消息1102的消息持续时间参数1106已经到期时,短暂定时器系统202使消息收发客户端104不再显示与短暂消息1102相关联的标记(例如,图标或文本标识)。
机器架构
图12是机器1200的图解表示,在该机器1200内可以执行用于使机器1200执行本文所讨论的方法中的任一种或更多种方法的指令1210(例如,软件、程序、应用、小应用、app或其他可执行代码)。例如,指令1210可以使机器1200执行本文中描述的方法中的任一种或更多种方法。指令1210将通用的未经编程的机器1200变换为特定机器1200,该特定机器1200被编程为以所描述的方式执行所描述和所示的功能。机器1200可以作为独立设备操作或者可以耦接(例如,联网)至其他机器。在联网部署中,机器1200可以在服务器客户端网络环境中以服务器机器或客户端机器的身份进行操作,或者在对等(或分布式)网络环境中作为对等机器进行操作。机器1200可以包括但不限于:服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能电器)、其他智能设备、web装置、网络路由器、网络交换机、网络桥接器或者能够顺序地或以其他方式执行指定要由机器1200采取的动作的指令1210的任何机器。此外,虽然仅示出了单个机器1200,但是术语“机器”还应被视为包括单独或联合执行指令1210以执行本文中讨论的方法中的任一种或更多种方法的机器的集合。例如,机器1200可以包括客户端设备102或者形成消息收发服务器系统108的一部分的若干个服务器设备中的任何一个。在一些示例中,机器1200还可以包括客户端系统和服务器系统二者,其中在服务器侧执行特定方法或算法的某些操作,并且在客户端侧执行特定方法或算法的某些操作。
机器1200可以包括可以被配置成经由总线1240彼此通信的处理器1204、存储器1206和输入/输出(I/O)部件1202。在示例中,处理器1204(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、另一处理器或其任何合适的组合)可以包括例如可以执行指令1210的处理器1208和处理器1212。术语“处理器”旨在包括多核处理器,多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图12示出了多个处理器1204,但是机器1200可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器或其任何组合。
存储器1206包括主存储器1214、静态存储器1216和存储单元1218,其均可由处理器1204经由总线1240访问。主存储器1206、静态存储器1216和存储单元1218存储实现本文所述的方法或功能中的任何一种或更多种的指令1210。指令1210还可以在其被机器1200执行期间完全地或部分地驻留在主存储器1214内、在静态存储器1216内、在存储单元1218内的机器可读介质1220内、在处理器1204中的至少一个处理器内(例如,在处理器的高速缓存存储器内)或其任何合适的组合内。
I/O部件1202可以包括用于接收输入、提供输出、产生输出、传送信息、交换信息、捕获测量结果等的各种各样的部件。包括在特定机器中的特定I/O部件1202将取决于机器的类型。例如,便携式机器诸如移动电话可以包括触摸输入设备或其他这样的输入机构,而无头服务器机器将不太可能包括这样的触摸输入设备。应当理解,I/O部件1202可以包括图12中未示出的许多其他部件。在各种示例中,I/O部件1202可以包括用户输出部件1226和用户输入部件1228。用户输出部件1226可以包括视觉部件(例如,显示器诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号发生器等。用户输入部件1228可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触觉输入部件(例如,物理按钮、提供触摸或触摸手势的位置和力的触摸屏、或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
在其他示例中,I/O部件1202可以包括生物计量部件1230、运动部件1232、环境部件1234或位置部件1236以及各种其他部件。例如,生物计量部件1230包括用于检测表达(例如,手表达、面部表情、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件1232包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
环境部件1234包括例如一个或更多个摄像装置(具有静态图像/照片和视频功能)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如,检测附近物体的红外传感器)、气体传感器(例如,用于出于安全考虑而检测危险气体的浓度或用于测量大气中的污染物的气体检测传感器),或者可以提供与周围物理环境相对应的指示、测量或信号的其他部件。
关于摄像装置,客户端设备102可以具有摄像装置系统,该摄像装置系统包括例如客户端设备102的前表面上的前置摄像装置和客户端设备102的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端设备102的用户的静止图像和视频(例如,“自拍”),然后可以用上述增强数据(例如,过滤器)对该静止图像和视频进行增强。例如,后置摄像装置可以用于以更传统的摄像装置模式捕获静止图像和视频,这些图像被类似地使用增强数据进行增强。除了前置摄像装置和后置摄像装置之外,客户端设备102还可以包括用于捕获360°照片和视频的360°摄像装置。
此外,客户端设备102的摄像装置系统可以包括双后置摄像装置(例如,主摄像装置以及深度感应摄像装置),或者甚至在客户端设备102的前后侧包括三重、四重或五重后置摄像装置配置。例如,这些多摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。
位置部件1236包括定位传感器部件(例如,GPS接收器部件)、海拔传感器部件(例如,检测气压的高度计或气压计,可以根据气压得到海拔)、取向传感器部件(例如,磁力计)等。
可以使用各种各样的技术来实现通信。I/O部件1202还包括通信部件1238,通信部件1238可操作以经由相应的耦接或连接将机器1200耦接至网络1222或设备1224。例如,通信部件1238可以包括与网络1222接口连接的网络接口部件或其他合适的设备。在其他示例中,通信部件1238可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如,/>低能耗)、/>部件以及用于经由其他模态提供通信的其他通信部件。设备1224可以是其他机器或各种外围设备中的任何外围设备(例如,经由USB耦接的外围设备)。
此外,通信部件1238可以检测标识符或包括可操作以检测标识符的部件。例如,通信部件1238可以包括射频识别(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如,用于检测诸如通用产品码(UPC)条形码的一维条形码、诸如快速响应(QR)码的多维条形码、Aztec码、数据矩阵、数据符号(Dataglyph)、最大编码(MaxiCode)、PDF417、超代码(Ultra Code)、UCC RSS-2D条形码和其他光代码的光学传感器)或声学检测部件(例如,用于识别标记的音频信号的麦克风)。另外,可以经由通信部件1238得到各种信息,例如经由互联网协议(IP)地理定位得到位置、经由信号三角测量得到位置、通过检测可以指示特定位置的NFC信标信号得到位置等。
各种存储器(例如,主存储器1214、静态存储器1216以及处理器1204的存储器)以及存储单元1218可以存储由本文中描述的方法或功能中的任何一个或更多个方法或功能实施或使用的一组或更多组指令和数据结构(例如,软件)。这些指令(例如,指令1210)在由处理器1204执行时使各种操作实现所公开的示例。
可以经由网络接口设备(例如,通信部件1238中包括的网络接口部件),使用传输介质并且使用若干公知的传输协议中的任一种传输协议(例如,超文本传输协议(HTTP)),通过网络1222来发送或接收指令1210。类似地,可以使用传输介质经由到设备1224的耦接(例如,对等耦接)来发送或接收指令1210。
软件架构
图13是示出软件架构1304的框图1300,软件架构1304可以被安装在本文中描述的设备中的任何一个或更多个设备上。软件架构1304由硬件例如包括处理器1320、存储器1326和I/O部件1338的机器1302支持。在该示例中,可以将软件架构1304概念化为层的堆栈,在该层的堆栈中,每个层提供特定的功能。软件架构1304包括诸如操作系统1312、库1310、框架1308和应用1306的层。在操作上,应用1306通过软件堆栈来激活API调用1350并且响应于API调用1350而接收消息1352。
操作系统1312管理硬件资源并提供公共服务。操作系统1312包括例如核1314、服务1316和驱动器1322。核1314充当硬件层与其他软件层之间的抽象层。例如,核1314提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置以及其他功能。服务1316可以为其他软件层提供其他公共服务。驱动器1322负责控制底层硬件或与底层硬件对接。例如,驱动器1322可以包括显示驱动器、摄像装置驱动器、或低能耗驱动器、闪存驱动器、串行通信驱动器(例如,USB驱动器)、驱动器、音频驱动器、电力管理驱动器等。
库1310提供由应用1306使用的公共低级基础设施。库1310可以包括系统库1318(例如,C标准库),系统库1318提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。另外,库1310可以包括API库1324,例如媒体库(例如,用于支持各种媒体格式的呈现和操纵的库,所述各种媒体格式诸如运动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层-3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形环境中以二维(2D)和三维(3D)进行渲染的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供web浏览功能的WebKit)等。库1310还可以包括多种其他库1328,以向应用1306提供许多其他API。
框架1308提供由应用1306使用的公共高级基础设施。例如,框架1308提供各种图形用户界面(GUI)功能、高级资源管理和高级定位服务。框架1308可以提供可以由应用1306使用的广泛的其他API,其中的一些API可以专用于特定的操作系统或平台。
在示例中,应用1306可以包括家庭应用1336、联系人应用1330、浏览器应用1332、书籍阅读器应用1334、定位应用1342、媒体应用1344、消息收发应用1346、游戏应用1348和诸如第三方应用1340的各种各样的其他应用。应用1306是执行在程序中限定的功能的程序。可以使用各种编程语言来创建以各种方式构造的应用1306中的一个或更多个,所述编程语言例如面向对象的编程语言(例如,Objective-C、Java或C++)或过程编程语言(例如,C或汇编语言)。在特定示例中,第三方应用1340(例如,由特定平台的供应商以外的实体使用ANDROIDTM或IOSTM软件开发工具包(SDK)开发的应用)可以是在诸如IOSTM、ANDROIDTM、Phone的移动操作系统或另外的移动操作系统上运行的移动软件。在该示例中,第三方应用1340可以调用操作系统1312所提供的API调用1350来促进本文描述的功能。
处理部件
现在转向图14,图14示出了处理环境1400的图解表示,处理环境1400包括处理器1402、处理器1406和处理器1408(例如,GPU、CPU或其组合)。
处理器1402被示出为耦接至电源1404,并且包括(永久配置或临时实例化的)模块,即化身至文本匹配部件1410、确定化身和文本的特性部件1412以及化身调整部件1414。化身至文本匹配部件1410执行如结合图5所讨论的化身至文本匹配模块536的功能。化身至文本匹配部件1410选择针对用户已经输入的文本数据最佳匹配的个性化化身。确定化身和文本的特性部件1412执行确定化身的特性528以及确定文本的特性518的功能,其中,对个性化化身和文本数据进行分析以评估其特性。化身调整部件1414将由用户输入的文本数据整合到用户的个性化化身中,以生成用户可以在与另一用户交流时或出于另一目的而包括的定制化身。如图所示,处理器1402通信地耦接至处理器1406和处理器1408两者。
术语表
“载波信号”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或其他无形介质以便于这些指令的传送。可以使用传输介质经由网络接口设备来通过网络发送或接收指令。
“客户端设备”是指与通信网络对接以从一个或更多个服务器系统或其他客户端设备获得资源的任何机器。客户端设备可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器的或可编程的消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信设备。
“通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、其他类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全球移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、增强数据速率的GSM演进(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
“部件”是指具有以下边界的设备、物理实体或逻辑,该边界由功能或子例程调用、分支点、API或者对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由它们的接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元并且可以是通常执行相关功能中的特定功能的程序的一部分。部件可以构成软件组件(例如,体现在机器可读介质上的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或者计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置为进行操作以执行如本文描述的某些操作的硬件部件。也可以机械地、电子地或以其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)的专用处理器。硬件部件还可以包括通过软件临时配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件部件成为特定机器(或机器的特定部件),该特定机器(或机器的特定部件)被唯一地定制成执行配置的功能并且不再是通用处理器。将理解,可以出于成本和时间考虑来决定是机械地在专用且永久配置的电路系统中实现硬件部件还是在临时配置(例如,由软件配置)的电路系统中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成涵盖有形实体,即被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或者执行本文中所描述的某些操作的实体。考虑硬件部件被临时配置(例如,被编程)的示例,无需在任一时刻对硬件部件中的每个硬件部件进行配置或实例化。例如,在硬件部件包括通过软件配置而成为专用处理器的通用处理器的情况下,通用处理器可以在不同时间处被配置成各自不同的专用处理器(例如,包括不同的硬件部件)。软件相应地对一个或多个特定处理器进行配置,以例如在一个时刻处构成特定硬件部件并且在不同的时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息以及从其他硬件部件接收信息。因此,所描述的硬件部件可以被认为通信地耦接。在同时存在多个硬件部件的情况下,可以通过在两个或更多个硬件部件之间或之中(例如,通过适当的电路和总线)进行信号传输来实现通信。在其中多个硬件部件在不同时间处被配置或被实例化的示例中,可以例如通过将信息存储在多个硬件部件可以访问的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在与其通信地耦接的存储器设备中。然后,另外的硬件部件可以在随后的时间处访问存储器设备,以检索和处理所存储的输出。硬件部件还可以发起与输入设备或输出设备的通信,并且可以对资源(例如,信息的集合)进行操作。在本文中描述的示例方法的各种操作可以至少部分地由(例如,通过软件)临时地配置或永久地配置成执行相关操作的一个或更多个处理器来执行。无论是临时配置还是永久配置,这样的处理器可以构成进行操作以执行本文描述的一个或更多个操作或功能的处理器实现的部件。如本文中使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,本文中描述的方法可以至少部分地由处理器实现,其中特定的一个或多个处理器是硬件的示例。例如,方法的至少一些操作可以由一个或更多个处理器或处理器实现的部件来执行。此外,所述一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或者作为“软件即服务”(SaaS)操作。例如,操作中的至少一些操作可以由计算机组(作为包括处理器的机器的示例)执行,其中,这些操作能够经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,API)进行访问。某些操作的执行可以分布在处理器之间,不是仅驻留在单个机器内,而是跨多个机器被部署。在一些示例中,处理器或处理器实现的部件可以位于单个地理定位中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例中,处理器或处理器实现的部件可以跨多个地理定位而分布。
“计算机可读存储介质”是指机器存储介质和传输介质两者。因此,这些术语包括存储设备/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“设备可读介质”意指相同的事物,并且可以在本公开内容中可互换地使用。
“短暂消息”是指在时间有限的持续时间内可访问的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送方设置。可替选地,访问时间可以是默认设置或者由接收方指定的设置。无论设置技术如何,消息都是暂时的。
“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储设备和介质(例如,集中式或分布式数据库,以及相关联的高速缓存和服务器)。因此,该术语应被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和设备存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器设备,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存设备;磁盘,诸如内部硬盘和可移除盘;磁光盘;以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“设备存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换地使用。术语“机器存储介质”、“计算机存储介质”和“设备存储介质”明确地排除了载波、调制数据信号和其他这样的介质,所述载波、调制数据信号和其他这样的介质中的至少一些被涵盖在术语“信号介质”中。
“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
“信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质,并且包括数字或模拟通信信号或其他无形介质以有助于软件或数据的通信。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指使其特性中的一个或更多个特性以将信息编码在信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”指相同的事物并且可以在本公开内容中互换使用。
Claims (20)
1.一种方法,包括:
获取文本数据;
使用至少一个处理器来处理所述文本数据以确定所述文本数据的第一特性;
基于将所述第一特性与多个个性化化身的第二特性进行匹配来选择所述多个个性化化身中针对所述文本数据的个性化化身;
基于所述文本数据和所选择的个性化化身来生成定制化身;以及
使所述定制化身被显示在计算设备的显示器上。
2.根据权利要求1所述的方法,其中,所述生成还包括:
将所述文本数据插入到所选择的个性化化身的文本放置区域中。
3.根据权利要求1所述的方法,其中,所述文本数据的第一特性包括以下中的一个或更多个:字体类型、字体间距值和字体大小。
4.根据权利要求3所述的方法,其中,所述第一特性还包括以下中的一个或更多个:语法、字母的数目、单词的数目、感情、行数、特殊字符、图标、语法、文本的含义、短语、标题、标语、动作、情绪、情感、问候语、事件、地点和对象。
5.根据权利要求1所述的方法,其中,所述第二特性包括以下中的一个或更多个:字体类型、字体间距值和字体大小。
6.根据权利要求5所述的方法,其中,所述第二特性还包括以下中的一个或更多个:语法、字母的数目、单词的数目、感情、行数、特殊字符、图标、语法、文本的含义、短语、标题、标语、动作、情绪、情感、问候语、事件、地点和对象。
7.根据权利要求1至6中任一项所述的方法,其中,所述个性化化身包括文本放置区域和化身区域。
8.根据权利要求7所述的方法,其中,所述生成定制化身还包括调整所述文本放置区域或所述化身区域的大小以容纳所述文本数据。
9.根据权利要求1至6中任一项所述的方法,还包括:
获取第一用户对所述定制化身的选择;
获取利用消息收发系统来将所述定制化身发送给第二用户的选择;以及
使所述定制化身被发送给所述第二用户。
10.根据权利要求1至6中任一项所述的方法,其中,所述个性化化身包括:图像、视频、数字照片、内容集合,或者虚拟现实数字表示、混合现实数字表示、混合现实图形表示或三维数字表示。
11.根据权利要求1至6中任一项所述的方法,其中,处理所述文本数据以确定所述文本数据的第一特性还包括:
将所述文本数据输入到一个或更多个第一神经网络中,所述一个或更多个第一神经网络是经过训练的以针对所述第一特性中的每个第一特性对所述文本数据进行分类,其中,所述一个或更多个第一神经网络的第一输出指示所述文本数据具有所述第一特性中的每个第一特性的概率。
12.根据权利要求11所述的方法,还包括:
将所述多个个性化化身输入到一个或更多个第二神经网络中,所述一个或更多个第二神经网络是经过训练的以针对所述第二特性中的每个第二特性对所述多个个性化化身进行分类,其中,所述一个或更多个第二神经网络的第二输出指示所述多个个性化化身中的每个个性化化身具有所述第二特性中的每个第二特性的概率。
13.根据权利要求12所述的方法,其中,选择还包括:
将所述第一输出与所述第二输出进行比较以确定与所述文本数据最接近匹配的个性化化身。
14.根据权利要求11所述的方法,还包括:
利用生成式对抗网络(GAN)神经网络(NN),基于第二特性和基础化身来生成所述多个个性化化身。
15.根据权利要求1至6中任一项所述的方法,还包括:
从所述多个个性化化身中滤除不能在个性化化身的文本放置区域中容纳所述文本数据的个性化化身。
16.一种系统,包括:
处理器;以及
存储器,其存储指令,所述指令在由所述处理器执行时将所述系统配置成执行操作,所述操作包括:
获取文本数据;
使用所述处理器来处理所述文本数据以确定所述文本数据的第一特性;
基于将所述第一特性与多个个性化化身的第二特性进行匹配来选择所述多个个性化化身中针对所述文本数据的个性化化身;
基于所述文本数据和所选择的个性化化身来生成定制化身;以及
使所述定制化身被显示在计算设备的显示器上。
17.根据权利要求16所述的系统,其中,处理所述文本数据以确定所述文本数据的第一特性还包括:
将所述文本数据输入到一个或更多个第一神经网络中,所述一个或更多个第一神经网络是经过训练的以针对所述第一特性中的每个第一特性对所述文本数据进行分类,其中,所述一个或更多个第一神经网络的第一输出指示所述文本数据属于所述第一特性中的每个第一特性的概率。
18.根据权利要求16或17所述的系统,还包括:
将所述多个个性化化身输入到一个或更多个第二神经网络中,所述一个或更多个第二神经网络是经过训练的以针对所述第二特性中的每个第二特性对所述多个个性化化身进行分类,其中,所述一个或更多个第二神经网络的第二输出指示所述多个个性化化身中的每个个性化化身具有所述第二特性中的每个第二特性的概率。
19.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质包括指令,所述指令在由计算机执行时使所述计算机执行操作,所述操作包括:
获取文本数据;
处理所述文本数据以确定所述文本数据的第一特性;
基于将所述第一特性与多个个性化化身的第二特性进行匹配来选择所述多个个性化化身中针对所述文本数据的个性化化身;
基于所述文本数据和所选择的个性化化身来生成定制化身;以及
使所述定制化身被显示在计算设备的显示器上。
20.根据权利要求19所述的非暂态计算机可读存储介质,其中,所述操作还包括:
将所述文本数据插入到所选择的个性化化身的文本放置区域中。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163169083P | 2021-03-31 | 2021-03-31 | |
US63/169,083 | 2021-03-31 | ||
PCT/US2022/071441 WO2022213088A1 (en) | 2021-03-31 | 2022-03-30 | Customizable avatar generation system |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117203676A true CN117203676A (zh) | 2023-12-08 |
Family
ID=81648419
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280026531.0A Pending CN117203676A (zh) | 2021-03-31 | 2022-03-30 | 可定制的化身生成系统 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220319078A1 (zh) |
EP (1) | EP4315267A1 (zh) |
KR (1) | KR20230163528A (zh) |
CN (1) | CN117203676A (zh) |
WO (1) | WO2022213088A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220319075A1 (en) * | 2021-03-30 | 2022-10-06 | Snap Inc. | Customizable avatar modification system |
US11941227B2 (en) | 2021-06-30 | 2024-03-26 | Snap Inc. | Hybrid search system for customizable media |
US11941232B2 (en) * | 2022-06-06 | 2024-03-26 | Adobe Inc. | Context-based copy-paste systems |
US20240180466A1 (en) * | 2022-12-02 | 2024-06-06 | Paradox, Inc. | Three-Dimensional Animated Personality Assessment |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20010049596A1 (en) * | 2000-05-30 | 2001-12-06 | Adam Lavine | Text to animation process |
US7512537B2 (en) * | 2005-03-22 | 2009-03-31 | Microsoft Corporation | NLP tool to dynamically create movies/animated scenes |
CN105791692B (zh) * | 2016-03-14 | 2020-04-07 | 腾讯科技(深圳)有限公司 | 一种信息处理方法、终端及存储介质 |
KR102338357B1 (ko) * | 2016-05-18 | 2021-12-13 | 애플 인크. | 그래픽 메시징 사용자 인터페이스 내의 확인응답 옵션들의 적용 |
US10559111B2 (en) * | 2016-06-23 | 2020-02-11 | LoomAi, Inc. | Systems and methods for generating computer ready animation models of a human head from captured data images |
US10855632B2 (en) * | 2016-07-19 | 2020-12-01 | Snap Inc. | Displaying customized electronic messaging graphics |
US10454857B1 (en) * | 2017-01-23 | 2019-10-22 | Snap Inc. | Customized digital avatar accessories |
CN109598775B (zh) * | 2017-09-30 | 2023-03-31 | 腾讯科技(深圳)有限公司 | 一种动态图像合成方法、装置、终端和存储介质 |
DK201870374A1 (en) * | 2018-05-07 | 2019-12-04 | Apple Inc. | AVATAR CREATION USER INTERFACE |
CA3104549A1 (en) * | 2018-06-22 | 2019-12-26 | Virtual Album Technologies Llc | Multi-modal virtual experiences of distributed content |
US10762121B2 (en) * | 2018-06-28 | 2020-09-01 | Snap Inc. | Content sharing platform profile generation |
US10990246B1 (en) * | 2018-10-31 | 2021-04-27 | Amazon Technologies, Inc. | Techniques for generating digital content |
CN110782510B (zh) * | 2019-10-25 | 2024-06-11 | 北京达佳互联信息技术有限公司 | 一种贴纸生成方法及装置 |
US11048384B2 (en) * | 2019-10-25 | 2021-06-29 | Facebook, Inc. | Generating content to be shared between users |
US20210375023A1 (en) * | 2020-06-01 | 2021-12-02 | Nvidia Corporation | Content animation using one or more neural networks |
JP2023528063A (ja) * | 2020-06-04 | 2023-07-03 | グーグル エルエルシー | 敵対的生成ネットワークを使用したビジュアルアセット開発 |
US20230281940A1 (en) * | 2022-03-07 | 2023-09-07 | Meta Platforms Technologies, Llc | Providing context-aware avatar editing within an extended-reality environment |
-
2022
- 2022-03-30 WO PCT/US2022/071441 patent/WO2022213088A1/en active Application Filing
- 2022-03-30 CN CN202280026531.0A patent/CN117203676A/zh active Pending
- 2022-03-30 KR KR1020237037320A patent/KR20230163528A/ko unknown
- 2022-03-30 EP EP22723321.0A patent/EP4315267A1/en active Pending
- 2022-03-30 US US17/657,286 patent/US20220319078A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220319078A1 (en) | 2022-10-06 |
KR20230163528A (ko) | 2023-11-30 |
EP4315267A1 (en) | 2024-02-07 |
WO2022213088A1 (en) | 2022-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115552403B (zh) | 用于媒体内容项的私人集合的邀请媒体覆盖物 | |
CN115777194B (zh) | 包括外部资源停靠栏和抽屉的消息收发系统 | |
CN115803723A (zh) | 在消息收发系统中更新化身状态 | |
KR102577630B1 (ko) | 메시징 애플리케이션에서의 증강 현실 콘텐츠의 디스플레이 | |
CN117203676A (zh) | 可定制的化身生成系统 | |
CN115668119A (zh) | 用于消息收发系统的具有标贴的回复界面 | |
CN115867882A (zh) | 用于图像的基于出行的增强现实内容 | |
CN115668888A (zh) | 特色内容集合界面 | |
CN115917506A (zh) | 第三方资源授权 | |
CN118176711A (zh) | 用于创建动画化的自定义贴纸的方法和系统 | |
CN115516445A (zh) | 对于检测到的对象对增强现实内容的基于语音的选择 | |
CN115885247A (zh) | 用于启动应用的视觉搜索 | |
CN115701304A (zh) | 上下文发送菜单 | |
CN115867905A (zh) | 旅行情况下基于增强现实的语音翻译 | |
CN115812217A (zh) | 用于评论的基于出行的增强现实内容 | |
CN115668169A (zh) | 自动生成的个性化消息 | |
CN116349215A (zh) | 利用微声音剪辑来聊天 | |
CN117337430A (zh) | 消息系统内根据扫描操作的快捷方式 | |
KR20230019968A (ko) | 메시지 인터페이스 확장 시스템 | |
CN116235194A (zh) | 媒体内容传输和管理 | |
CN116724314A (zh) | 生成式对抗网络操纵的图像效果 | |
CN117597940A (zh) | 用于呈现适用于摄像装置的功能的用户界面 | |
CN116034577A (zh) | 上下文应用菜单 | |
US11768587B2 (en) | Electronic transaction activated augmented reality experiences | |
CN117396849A (zh) | 在消息系统内将功能组合成快捷方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |