CN115699097B - 用于图像处理的软件开发工具包 - Google Patents
用于图像处理的软件开发工具包 Download PDFInfo
- Publication number
- CN115699097B CN115699097B CN202180041630.1A CN202180041630A CN115699097B CN 115699097 B CN115699097 B CN 115699097B CN 202180041630 A CN202180041630 A CN 202180041630A CN 115699097 B CN115699097 B CN 115699097B
- Authority
- CN
- China
- Prior art keywords
- sdk
- image processing
- application
- content generator
- app
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000003190 augmentative effect Effects 0.000 claims abstract description 23
- 230000008569 process Effects 0.000 claims abstract description 14
- 230000015654 memory Effects 0.000 claims description 30
- 238000002372 labelling Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims description 2
- 230000026676 system process Effects 0.000 claims 1
- 239000008186 active pharmaceutical agent Substances 0.000 abstract 4
- 230000000694 effects Effects 0.000 description 61
- 230000006870 function Effects 0.000 description 32
- 238000004891 communication Methods 0.000 description 24
- 238000003860 storage Methods 0.000 description 24
- 230000009471 action Effects 0.000 description 17
- 230000004044 response Effects 0.000 description 16
- 230000033001 locomotion Effects 0.000 description 14
- 230000018109 developmental process Effects 0.000 description 11
- 230000004048 modification Effects 0.000 description 11
- 238000012986 modification Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 238000010079 rubber tapping Methods 0.000 description 8
- 238000007726 management method Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 6
- 238000000844 transformation Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000001413 cellular effect Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 230000002452 interceptive effect Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000004040 coloring Methods 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000009118 appropriate response Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 231100001261 hazardous Toxicity 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008261 resistance mechanism Effects 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/541—Interprogram communication via adapters, e.g. between incompatible applications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/54—Indexing scheme relating to G06F9/54
- G06F2209/547—Messaging middleware
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/24—Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Information Transfer Between Computers (AREA)
- Processing Or Creating Images (AREA)
Abstract
模块化图像处理SDK包括API,该API从在包括摄像装置的便携式设备上运行的第三方软件接收API调用。SDK逻辑接收并处理从API接收的命令和参数,该命令和参数基于从第三方软件接收的API调用。标注系统基于由标注系统从SDK逻辑接收的图像处理指令和参数对来自摄像装置的馈送执行图像处理操作。图像处理至少部分地基于增强现实内容生成器数据(或AR内容生成器)、用户输入和传感器数据。
Description
相关申请的交叉引用
本申请要求于2020年6月10日提交的美国临时专利申请序列第63/037,348号以及于2021年5月3日提交的美国专利申请序列第17/302,424号的权益,上述申请中的每一个的内容通过引用整体并入本文中。
背景技术
随着数字图像的使用的增加、便携式计算设备的可负担性、数字存储介质的增加的容量的可得性以及网络连接的增加的带宽和可访问性,数字图像和视频已成为越来越多人日常生活的一部分。另外,设备用户的预期还在于,在便携式计算设备上使用app的体验将继续变得更加复杂巧妙和媒体丰富。
附图说明
在不一定按比例绘制的附图中,相似的附图标记可以在不同视图中描述类似的部件。为了容易地识别对任何特定元件或动作的讨论,附图标记中的一个或多个最高位数字指代该元件被首次引入时所在的图号。在附图的图中,通过示例而非限制的方式示出了实施方式,在附图中:
图1是根据一些示例的其中可以部署本公开内容的联网环境的图解表示。
图2是图1中示出的app的架构及其与图1的开发者数据库和SDK服务器系统的关系的图解表示。
图3是示出图2的标注系统的各种模块的框图。
图4示出了描绘用于选择AR内容生成器数据并将其应用于媒体内容的轮播的示例用户界面。
图5示出了描绘可以被提供给图4的用户界面的可选特征的示例用户界面。
图6示出了可能由对图4和图5的用户界面的进一步用户动作产生的示例用户界面。
图7示出了如果存在仅一个可用的AR内容生成器则可以显示的用户界面。
图8是示出用于导航图4至图7的用户界面的示例方法的流程图。
图9是根据一些示例的呈计算机系统形式的机器的图解表示,在该计算机系统内可以执行指令的集合以使机器执行本文中讨论的方法中任何一种或更多种。
图10是示出可以在其中实现示例的软件架构的框图。
具体实施方式
具有一系列兴趣并且来自不同位置的用户可以捕获各种被摄体的数字图像,并且使其他人能够经由网络例如因特网获得捕获的图像。使得计算设备能够对在各种各样的变化条件(例如,图像比例、噪声、照明、移动或几何失真的改变)下捕获的各种对象和/或特征执行图像处理或图像增强操作可以是具有挑战性的且计算密集型的。
另外,用于在个人设备上使用的app的第三方开发者可能想要提供增强的视觉效果,但是可能不具有在他们的app中提供这样的效果的技术知识或预算。支持增强的视觉效果的系统和技术的原始开发者(SDK提供者)可以通过提供模块化软件开发工具包(SDK)来使得能够在由第三方app开发者发布的app中使用这样的效果,如以下更详细地描述的。如本文中所使用的,术语“第三方开发者”、“app开发者”和“开发者”不限于实际开发者本身,而是包括托管、提供或拥有可能最初由其他人开发的相关软件、app、SDK或服务的人和实体。
在一些情况下,SDK的提供者还提供如本文中所述的包括图像修改能力的消息收发应用。SDK向第三方提供对这样的图像修改能力的访问,以使得第三方能够独立于启动SDK提供者的消息收发应用而在第三方的app中提供图像修改特征。
如本文中所讨论的,主题基础设施支持在由app开发者发布的app中创建、查看和/或共享交互式或增强的二维或三维媒体。主题系统还支持由第三方开发者创建、存储和加载外部效果和资产数据,以供在客户端设备上运行的app使用。
如本文中所述的,用于增强的图像、视频或其他媒体可以从现场摄像装置捕获,或者可以从本地或远程数据存储装置检索。在一个示例中,除了常规的图像纹理之外,还使用主题系统来呈现图像以使摄像装置所看到的空间细节/几何形状可视化。当观看者通过移动客户端设备与该图像交互时,该移动触发向观看者呈现图像和几何形状的视角的对应改变。
如本文中所提及的,短语“增强现实体验”包括或指代与如本文中进一步描述的图像修改、过滤器、媒体覆盖、变换等对应的各种图像处理操作。在一些示例中,这些图像处理操作提供了真实世界环境的交互体验,其中真实世界中的对象、表面、背景、照明等通过计算机生成的感知信息增强。在该上下文中,“增强现实内容生成器”包括将选择的增强现实体验应用于图像或视频馈送所需的数据、参数和其他资产的集合。在一些示例中,增强现实内容生成器由Snap公司以注册商标LENSES提供。
在一些示例中,增强现实内容生成器包括被配置成以某种方式修改或变换在客户端设备的GUI内呈现的图像数据的增强现实(或“AR”)内容。例如,可以使用AR内容生成器数据来执行对内容图像的复杂添加或变换,例如向视频片段中的人的头部添加兔耳、向视频片段添加具有背景着色的浮动心、改变视频片段内的人的特征的比例、向在客户端设备上观看的场景中的界标添加增强或者许多其他这样的变换。这包括实时修改以及对存储的内容(例如图库中的视频片段)的修改,实时修改在使用与客户端设备相关联的摄像装置捕获图像时修改图像,该图像然后在有AR内容生成器修改的情况下显示在客户端设备的屏幕上,存储的内容例如可以使用AR内容生成器修改。例如,在具有多个AR内容生成器的创建者简档中,授权的第三方开发者可以使用具有多个AR内容生成器的单个视频片段来查看不同的AR内容生成器将如何修改存储的片段。类似地,实时视频捕获可以与AR内容生成器一起使用以在其显示器上向客户端设备的用户示出当前正由设备的传感器捕获的视频图像将如何修改捕获的数据。这样的数据可以简单地显示在屏幕上而不存储在存储器中,由设备传感器捕获的内容可以在有或没有AR内容生成器修改(或两者)的情况下被记录和存储在存储器中,或者由设备传感器捕获的内容可以与AR内容生成器修改一起通过网络102发送至服务器或另一客户端设备。
因此,AR内容生成器以及用于使用AR内容生成器来修改内容的相关联的系统和模块可以涉及:对象(例如,面部、手、身体、猫、狗、表面、对象等)的检测,在这样的对象离开、进入视频帧中的视场以及在视频帧中的视场四处移动时对这样的对象的跟踪,以及在这样的对象被跟踪时对这样的对象的修改或变换。在各种示例中,可以使用用于实现这样的变换的不同方法。例如,一些示例可能涉及生成一个或多个对象的3D网格模型,并且在视频内使用模型的变换和动画纹理来实现变换。在其他示例中,可以使用对对象上的点的跟踪来将图像或纹理(其可以是二维或三维的)放置在所跟踪的位置处。在更进一步的示例中,可以使用视频帧的神经网络分析来将图像、模型或纹理放置在内容(例如,视频的帧或图像)中。因此,AR内容生成器数据可以包括以下两者:用于在内容中创建变换的图像、模型和纹理,以及通过对象检测、跟踪和放置(placement)实现这样的变换所需的附加建模和分析信息。
在一个方面,一种软件开发工具包(SDK)包括:应用编程接口(API),其从在便携式设备上运行的第三方应用接收API调用,该便携式设备包括摄像装置;SDK逻辑,其接收和处理从API接收的命令和参数,该命令和参数基于从第三方应用接收的API调用;以及标注系统,其基于由标注系统从SDK逻辑接收的图像处理指令和参数,为第三方应用对来自摄像装置的馈送执行图像处理操作。
标注系统可以基于AR内容生成器数据对来自摄像装置的馈送进行操作。SDK逻辑可以从由SDK的提供者托管的服务器获得图像处理指令和参数。
SDK还可以包括与在消息收发应用上可获得的图像处理操作对应的图像处理操作,该图像处理操作能够在消息收发应用不启动的情况下经由SDK被获得。图像处理操作可以对应于在消息收发应用上可获得的图像处理操作,第三方应用被配置成独立于消息收发应用执行图像处理操作。AR内容生成器数据可以由SDK逻辑从由SDK的提供者托管的服务器接收。第三方应用可以从由第三方应用的提供者或开发者托管的服务器接收用于处理的第三方数据。
图像处理指令和参数可以存储在便携式设备上的本地数据存储装置中。如果SDK不能从便携式设备中的本地数据存储装置检索到图像处理指令和参数,则SDK逻辑可以从由SDK的提供者托管的服务器获得图像处理指令和参数。
图像处理操作可以对应于在消息收发应用上可获得的图像处理操作,图像处理操作能够在消息收发应用不启动的情况下经由SDK被获得,并且SDK的提供者也可以是消息收发应用的提供者。
在另一方面,一种系统包括机器的一个或更多个处理器、摄像装置和显示器。系统还包括存储器,该存储器存储包括SDK和第三方软件应用的指令,该SDK包括:应用编程接口(API),其从第三方软件应用接收API调用;SDK逻辑,其基于从第三方软件应用接收的API调用来接收和处理从API接收的命令和参数;以及标注系统,其基于由标注系统从SDK逻辑接收的图像处理指令和参数,对来自摄像装置的馈送执行图像处理操作。
SDK还可以包括AR内容生成器的集合,该AR内容生成器包括用于将增强现实体验应用于图像或视频馈送的指令和参数,标注系统在使用中基于对特定AR内容生成器的用户选择来执行图像处理操作。SDK可以集成到第三方软件应用中。
标注系统可以基于系统的配置、指定的对象跟踪模型、用户输入和位置传感器数据来处理来自摄像装置的馈送。图像处理操作可以对应于在消息收发应用上可获得的图像处理操作,该图像处理操作能够在消息收发应用不启动的情况下经由SDK被获得。AR内容生成器可以从由SDK的提供者托管的服务器下载。
第三方软件应用可以从由第三方软件应用的提供者或开发者托管的服务器接收用于处理的第三方数据。可以根据第三方软件应用的提供者的标识将可下载的AR内容生成器分组。AR内容生成器的参数可以包括地理限制和时间限制。根据所附附图、描述和权利要求,其他技术特征对于本领域技术人员而言是非常明显的。AR内容生成器的集合还可以本地存储在系统存储器中。
根据以下附图、描述和权利要求,其他技术特征对于本领域技术人员可以是非常明显的。
图1是示出用于通过网络交换数据(例如,消息、AR内容生成器、媒体和相关联的内容)的示例系统100的框图。系统100包括客户端设备106的多个实例,每个实例托管包括app110的多个应用。每个客户端设备106可以经由网络102(例如,因特网)通信地耦接至也运行app110的实例的其他客户端设备106、SDK服务器系统104和开发者数据库132。客户端设备还可以经由网络耦接至app商店,可以从该app商店下载app 110并将其安装在客户端设备106上。app 110可以是可以在客户端设备106上运行的任何种类的app。其可以是但不需要是传统上不与增强现实(AR)交互性或效果相关联的app类型(例如消息收发或社交网络app)。
app 110能够经由网络102与另一app 110以及与SDK服务器系统104通信和交换数据。在app 110之间交换的数据取决于具体的app并且由app的开发者定义,并且可以包括文本、音频、视频或可以使用或可以不使用本文中描述的系统和方法来修改的其他多媒体数据。在app 110与SDK服务器系统104之间交换的信息可以包括功能和激活功能的命令、有效载荷数据(例如,文本、音频、视频或其他多媒体数据以及增强现实内容生成器数据)以及性能或使用度量。在app 110与开发者数据库132之间交换的数据包括特定于具体app 110或具体app 110所需的任何数据,或者是特定于app的用户并且由app开发者托管或用于app开发者的数据。
系统还可以包括开发者设备108,该开发者设备托管可以由开发者用来创建用于由app 110使用的定制AR内容生成器的效果软件112。效果软件112可以由SDK提供者提供为经由SDK服务器系统104的云服务或可下载软件。开发者设备108还可以包括app开发软件114或者用于访问由开发者在开发app 110时使用的app开发平台。
SDK服务器系统104包括具有可以由app 110或效果软件112调用或激活的功能的应用编程接口(API)。在某些示例中,SDK服务器系统104包括JavaScript库,该JavaScript库向第三方开发者提供对SDK服务器系统104的某些特征和资产的访问,但是可以使用基于其他技术的应用和资源。
为了将SDK的功能(进一步参见图2和SDK 216的相关联描述)集成到app 110中,SDK由开发者设备108从SDK服务器系统104下载或者以其他方式由开发者设备108接收。一旦被下载或接收,SDK被包括作为app 110的应用代码的一部分。然后,由开发者创建的app110的代码可以调用或激活SDK的某些功能以集成传统上在由SDK提供者发布的app中提供的图像处理技术和特征。
SDK服务器系统104还经由网络102向特定app 110以及向托管在开发者设备108上的效果软件112提供服务器侧功能。虽然系统100的某些功能在本文中被描述为由app 110、SDK服务器系统104或效果软件112执行,但是某些功能的位置在app 110、SDK服务器系统104或效果软件112内可以是设计选择。例如,在技术上优选的是:可以最初将某些技术和功能部署在SDK服务器系统104内,但是稍后当客户端设备106具有足够处理能力时将该技术和功能迁移至app 110。类似地,由效果软件112提供的功能可以由SDK服务器系统104作为web或云服务来托管。
SDK服务器系统104支持提供给app 110、效果软件112和app开发软件114的各种服务和操作,如将在下面更详细地描述的。这样的操作包括向效果软件112发送数据、从效果软件接收数据和处理由效果软件生成的数据、托管模块化SDK以供开发者结合app开发软件114使用、以及提供AR内容生成器以供app 110使用。当SDK与由第三方开发者开发的app集成时,SDK提供下载、缓存和执行利用效果软件112构建的AR内容生成器所需的所有核心功能。系统100内的数据交换通过经由效果软件112和app 110的用户界面(UI)可用的功能来激活和控制。
现在具体地转至SDK服务器系统104,应用程序接口(API)服务器118耦接至应用服务器116并向应用服务器提供编程接口。应用服务器116通信地耦接至数据库服务器122,数据库服务器促进对数据库130的访问,该数据库存储与应用服务器116的功能相关联的数据。类似地,web服务器134耦接至应用服务器116,并且向应用服务器116提供基于web的接口。为此,web服务器134通过超文本传输协议(HTTP)和若干其他相关协议处理传入的网络请求。
应用程序接口(API)服务器118在客户端设备106与应用服务器116之间以及在开发者设备108与应用服务器116之间接收和发送数据(例如,命令和其他有效载荷,例如AR内容生成器和相关联的元数据)。具体地,应用程序接口(API)服务器118提供一组接口(例如,例程和协议),该组接口可以被调用或查询以激活应用服务器116的功能。应用程序接口(API)服务器118公开由应用服务器116支持的各种功能,如在下面更详细地描述的。
应用服务器116托管若干服务器应用和子系统,包括例如效果提交服务120、效果调度器124、SDK托管服务126和web UI模块128。效果提交服务120实现若干技术和功能,特别是涉及对已经由开发者使用效果软件112在开发者设备108上生成的视觉效果的AR内容生成器的聚合、存储和访问的技术和功能。如将进一步详细描述的,由开发者生成的AR内容生成器可以从开发者设备108上传至SDK服务器系统104,在SDK服务器系统104处AR内容生成器由效果提交服务120聚合成AR内容生成器的集合,与各个开发者相关联并且存储在数据库130中。然后,使这些集合可用于由效果调度器124指定的app 110。
应用服务器116还包括效果调度器124,该效果调度器是可以由开发者用来管理其AR内容生成器的管理工具。效果调度器124经由通过web UI模块128提供的基于web的接口来访问,用于管理AR内容生成器和相关联的元数据。与每个AR内容生成器相关联的元数据可以包括AR内容生成器ID(用于涉及AR内容生成器的所有事务的唯一标识符)、公开AR内容生成器名称、AR内容生成器图标图像、任何预览媒体、可见性设置、优选激活相机(例如,后置摄像装置或前置摄像装置)、以及AR内容生成器最后通过效果软件112提交的日期。相关联的元数据还可以例如指定可见性(即,AR内容生成器是公开的或私有的,或者开启或关闭)、用于限制组内的任何AR内容生成器可用性的“开始日期”和“结束日期”、以及高级调度选项例如重现时间(每天、每周、每月、每年)。相关联的元数据还可以例如指定地理围栏限制,使得AR内容生成器仅在某些位置可用。
用于访问效果调度器124的web接口向开发者提供各种视图,包括具有与开发者相关联的所有AR内容生成器的总列表的视图,以及其中将列出开发者定义的组中的AR内容生成器的组视图。只有由特定开发者创建或拥有的AR内容生成器将出现在当开发者访问效果调度器124时示出的AR内容生成器的列表中。每个开发者及其app 110注册在SDK门户(未示出)中的组织名称之下,开发者通过该SDK门户向SDK服务器系统104注册。
为了向开发者对使用情况的开发提供另外的灵活性,效果调度器124还提供向每个AR内容生成器或每组AR内容生成器添加开发者数据的能力,这可以增强app 110对AR内容生成器的使用。AR内容生成器元数据中包括的所有开发者数据被提供给客户端设备106以供app 110使用。该开发者数据可以例如包括搜索关键字、高级权益、附加UI指南或其他可见性标签(例如,“这是生日LENS”)。该开发者数据主要旨在用于客户端设备106的用户与app 110之间的交互。尽管不是不可能,但是在一个示例中,效果调度器124和SDK 216均不对该数据进行操作。
AR内容生成器组提供了将AR内容生成器收集成有序列表中以递送至app 110的方式,该AR内容生成器通常由app 110可视地呈现给用户,如将在下面更详细地描述。由于AR内容生成器被成组地递送至app 110,因此为了使AR内容生成器呈现在app中,其需要与组相关联。组可以由开发者基于使用情况来创建和定义,例如命名为“Los Angeles”(“洛杉矶”)和“Tokyo”(“东京”)以用于在不同位置建立不同内容。每个组具有可以用于组管理的特定组ID。
效果调度器124提供用于以下操作的接口:创建和删除组,从各个组添加或移除AR内容生成器,以及将附加的开发者数据应用于与开发者相关联的所有AR内容生成器(全局元数据),应用于成组AR内容生成器(组元数据)以及应用于单独的AR内容生成器,直接应用于AR内容生成器或者当将AR内容生成器添加至组时。全局、组和单独AR内容生成器元数据嵌套在元数据中的单独的键(key)内,因此app 110可以选择用一个等级中的元数据覆写(override)另一等级中的元数据。app 110可以按原样使用或呈现一组AR内容生成器,或者基于与AR内容生成器相关联的元数据中的任何元数据来过滤成组AR内容生成器。
效果调度器124还从app 110接收性能和使用数据。这可以涉及SDK的性能(例如,关于跟踪、呈现、AR内容生成器初始化和拆卸时间等的统计)以及AR内容生成器自身的使用度量(例如,使用哪些AR内容生成器,何时使用以及使用多长时间,在AR内容生成器使用期间触发的app中的事件)两者。该性能和使用数据以及从其得出的分析可以在由效果调度器124生成的性能和度量仪表板中提供给开发者。
web UI模块128支持各种功能和服务,并且使这些功能和服务直接可用于第三方开发者以及/或者可用于效果软件112。
SDK托管服务126向开发者提供对SDK的访问(在下面参照图2更详细地描述),包括任何更新或补丁以及任何相关联的SDK文档。
在系统100的使用中,开发者在向SDK门户注册之后,从SDK托管服务126下载SDK以用于开发app 110。SDK提供下载、缓存和执行利用效果软件112构建的AR内容生成器所需的所有核心功能。开发者使用app开发软件114将SDK集成到他们的app 110中。然后,使app110可用于由用户经由已知手段例如经由app商店下载。
开发者还使用效果软件112生成AR内容生成器,该AR内容生成器然后经由效果提交服务120上传至SDK服务器系统104,其中AR内容生成器由效果提交服务120聚合成与开发者相关联并且存储在数据库130中的AR内容生成器的集合。然后,开发者可以使用如以上所讨论的效果调度器124来管理AR内容生成器的集合,以将AR内容生成器分组并管理AR内容生成器元数据。然后,响应于在app 110中提供的用户提示,通过包括在app 110的更新中,或者响应于来自开发者的指令从SDK服务器系统104推送,一组AR内容生成器可以下载至客户端设备106以供app 110使用。另外,当最初例如从app商店下载时,app 110可以包括AR内容生成器或一组或更多组AR内容生成器。
图2示出了图1的app 110的架构及其与图1的开发者数据库132和SDK服务器系统104的关系。如从图中可以看出,app 110包括app逻辑202和SDK 216,该SDK 216包括API204、SDK工具包逻辑206、标注系统208、SDK UI 218和本地数据存储装置210。
app逻辑202是开发者特定的,并且提供由app 110的用户预期的功能和用户界面。当app 110正在运行但SDK 216尚未被调用时,app逻辑202定义所有可见的交互UI元素并将其呈现给客户端设备106的用户。app逻辑202从用户输入部件928接收输入,该用户输入部件包括例如触摸屏、摄像装置212和麦克风214。app逻辑202通过网络102与开发者数据库132和/或app 110的常规操作所需的任何其他所需信息资源通信。app逻辑202还向SDK 216提供对摄像装置212和麦克风214的访问。
app逻辑202经由提供给API 204的调用与SDK 216交互。这样的调用的示例可以是获得AR内容生成器组、获得用于组中的AR内容生成器的AR内容生成器元数据、以及预取(prefetch)AR内容生成器以进行缓存。就涉及获得AR内容生成器组、AR内容生成器或任何附加AR内容生成器资产而言,“下载”通常是指按需下载。如果需要某些东西但其在本地数据存储装置210中不可获得,则其将被下载。“预取”是基于用户与app 110或客户端设备的预期或可能的交互,在需要本地数据存储装置210中不可得的资产之前预测性地下载该资产。“缓存”是指正在被下载或预取的所有资产在本地数据存储装置210中的存储,这意味着这些资产立即可用,并且还意味着对应的AR内容生成器可以离线使用。
在一个示例中,SDK 216从app逻辑202接收调用和参数,并且基于调用和参数来接收和增强来自摄像装置212的馈送。摄像装置馈送由SDK 216处理,如在下面更详细地描述的,并且呈现的体验被合成到返回视频馈送中以供输出和显示在客户端设备106上。在另一示例中,基于从app逻辑202接收的调用和参数,SDK 216增强存储在客户端设备106上或由其接收的一个或更多个图像或视频文件。
API 204是app逻辑202与SDK 216之间的集成链路,以允许app逻辑202访问由SDK216提供的特征和服务。API 204从app逻辑202接收命令和参数(例如,获得AR内容生成器组、获得用于组中的AR内容生成器的AR内容生成器元数据、预取AR内容生成器以进行缓存、应用具有特定AR内容生成器ID的AR内容生成器、用户输入、AR内容生成器参数等),并且适当地转换它们以用于提供给SDK工具包逻辑206。
SDK工具包逻辑206可以通过网络102与SDK服务器系统104通信,以从SDK服务器系统104接收或请求适当的AR内容生成器资产(一组或更多组AR内容生成器和相关联元数据),以存储在本地数据存储装置210中。如上所述,SDK工具包逻辑206还将来自客户端设备106的性能和使用数据提供给SDK服务器系统104。出于这样的目的,SDK工具包逻辑206还处理客户端设备106与SDK服务器系统104之间的认证,并且调用正确的端点来取得AR内容生成器组和相关联的元数据。
SDK工具包逻辑206还负责协调API 204、标注系统208和本地数据存储装置210之间的交互。在一个示例中,SDK工具包逻辑206从API 204接收经转换的命令和参数,并且将适当的AR内容生成器资产(指定的AR内容生成器和相关联元数据)、设备配置和跟踪模型(例如,用于对图像序列执行图像单应性以检测和跟踪来自摄像装置212的馈送中的对象的算法和参数)从本地数据存储装置210提供给标注系统208。SDK工具包逻辑206还基于从API204接收的来自用户的命令或姿势输入(例如,触摸、滑动、双击等)将经转换的或除此以外的适当的指令提供给标注系统208。
标注系统208负责基于选择的AR内容生成器及其元数据、设备的配置、指定的跟踪模型、用户输入以及传感器数据(例如,位置传感器数据)或者从app逻辑202或经由app逻辑202接收的或直接从构成客户端设备106的部件(例如,摄像装置212或麦克风214)接收的其他数据,来处理摄像装置馈送。例如,在一些情况下,标注系统208基于AR内容生成器内的部件或参数来跟踪对象。示例包括面部跟踪(包括监视面部动作触发,如张开嘴巴、扬起眉毛等)、表面跟踪、宠物跟踪等。标注系统208还呈现AR内容生成器中的资产,并且处理AR内容生成器包内的任何JavaScript以执行AR内容生成器内包含的任何逻辑(例如,对象的移动、修改颜色等)。下面参照图3更详细地描述标注系统208。
SDK UI 218负责与SDK工具包逻辑206协作呈现当SDK 216已被调用时显示的用户界面元素。SDK UI 218从SDK工具包逻辑206接收诸如用户交互的相关数据,并且将适当的响应传递回SDK工具包逻辑206。
SDK UI 218使得显示可选图形项,在示例中,该可选图形项以轮播布置来呈现,如下面参照图3至图8所描述和示出的。通过示例的方式,用户可以利用各种输入来以与轮播对应的方式将可选图形项旋转到显示屏上以及旋转离开显示屏,从而提供对图形项的循环查看。轮播布置使得多个图形项能够占据显示屏上的特定图形区域。在示例中,AR内容生成器可以被组织成组以包括在轮播布置上,从而使得能够按组旋转遍历AR内容生成器。
本地数据存储装置210是用于设备配置信息、跟踪模型和AR内容生成器资产的储存库。如果设备配置信息和跟踪模型最初不作为app 110的一部分包括在SDK 216中,则这些设备配置信息和跟踪模型可以由SDK工具包逻辑206从SDK服务器系统104下载。设备配置信息指定SDK 216对AR内容生成器的应用可以如何基于客户端设备106的实际配置而变化。
图3是示出根据特定示例实施方式的标注系统208的各种模块的框图。标注系统208被示出为包括图像和深度数据接收模块302、传感器数据接收模块304、图像和深度数据处理模块306、AR效果模块308和呈现模块310。标注系统208的各种模块被配置成(例如,经由总线、共享的存储器或交换机)彼此通信。可以使用一个或更多个计算机处理器312(例如,由客户端设备106提供的处理器的集合)来实现这些模块中的任何一个或更多个。
描述的模块中的任何一个或更多个可以单独使用硬件来实现(例如,机器(例如机器900)的计算机处理器904中的一个或更多个)或者硬件和软件的组合来实现。例如,标注系统208的任何描述的模块可以物理地包括被配置成执行本文中针对该模块描述的操作的一个或更多个计算机处理器312(例如,机器(例如机器900)的一个或更多个计算机处理器的或之中的子集)的布置。作为另一示例,标注系统208的任何模块可以包括软件、硬件或软件和硬件两者,其将(例如,在机器(例如机器900)的一个或更多个计算机处理器中的)一个或更多个计算机处理器312的布置配置成执行本文中针对该模块描述的操作。因此,标注系统208的不同模块可以包括并配置这样的计算机处理器312在不同时间点处的单个布置或这样的计算机处理器312的不同布置。此外,标注系统208的任何两个或更多个模块可以组合成单个模块,并且本文中针对单个模块描述的功能可以在多个模块之间细分。此外,根据各种示例,本文中描述为在单个机器、数据库或设备内实现的模块可以跨多个机器、数据库或设备分布。
在一个示例中,图像和深度数据接收模块302接收由客户端设备106捕获的图像和深度数据。例如,图像可以是由客户端设备106的光学传感器(例如,摄像装置)捕获的帧。图像可以包括一个或更多个真实世界特征,例如在图像中检测到的用户的面部或真实世界对象。在一些示例中,图像包括描述图像的元数据。例如,深度数据可以包括对应于深度图的数据,深度图包括基于从发光模块发射的指向有着具有不同深度的特征(例如,眼睛、耳朵、鼻子、嘴唇等)的对象(例如,用户的面部)的光线的深度信息。通过示例的方式,深度图类似于图像,但是代替每个像素提供颜色,而是深度图指示从摄像装置到图像的该部分的距离(例如,就绝对值而言或相对于深度图中的其他像素)。
传感器数据接收模块304从客户端设备106接收传感器数据。传感器数据是由客户端设备106的传感器捕获的任何类型的数据。在示例中,传感器数据可以包括由陀螺仪收集的客户端设备106的运动、来自触摸传感器(例如,触摸屏)的触摸输入或姿势输入、GPS或描述客户端设备106的当前地理位置和/或移动的客户端设备106的另一传感器。作为另一示例,传感器数据可以包括指示由客户端设备106的传感器检测到的当前温度的温度数据。作为另一示例,传感器数据可以包括指示客户端设备106处于暗环境还是亮环境的光传感器数据。
图像和深度数据处理模块306对接收到的图像和/或深度数据执行操作。可以由图像和深度数据处理模块306执行各种图像处理和/或深度处理操作。例如,图像和深度数据处理模块306提供由效果软件112支持的跟踪不同对象的能力,不同对象包括面部、宠物、手、身体、骨骼关节、界标(即,可以由标注系统208识别的物理界标,并且AR内容生成器可以应用于该物理界标以用于界标特定效果)和图像标记(即,可以由标注系统208识别的特定图像)。这些特征中的一些可能需要附加设备数据,该附加设备数据将由API 204利用对如陀螺仪、罗盘和位置信息的受保护设备数据的适当用户许可请求来向app逻辑202请求。
为了优化跟踪,每个客户端设备106设备具有其自己的配置简档和针对每个设备进行优化的用于跟踪不同对象的相关联的跟踪模型。如果以及根据需要,SDK工具包逻辑206将向SDK服务器系统104请求这些。
AR效果模块308基于与动画和/或向接收的图像和/或深度数据提供视觉和/或听觉效果对应的算法或技术来执行各种操作。在示例中,给定图像可以由AR效果模块308处理以执行由选择的AR内容生成器指定的呈现AR效果(例如,包括使用深度数据的3D效果或2D效果)等的操作。
呈现模块310基于由以上提及的模块中的至少之一提供的数据来执行图像的呈现以由客户端设备106显示。在示例中,呈现模块310利用图形处理流水线来执行图形操作以呈现图像来进行显示。在示例中,呈现模块310实现可扩展的呈现引擎,该呈现引擎支持与各个AR内容生成器对应的多个图像处理操作。
在一些实现方式中,呈现模块310提供将二维(2D)对象或来自三维(3D)世界(真实或虚构)的对象呈现到2D显示屏上的图形系统。在一些实现方式中,这样的图形系统(例如,客户端设备106上包括的图形系统)包括图形处理单元(GPU),用于执行图像处理操作和呈现图形元素以进行显示。
在实现方式中,GPU包括逻辑图形处理流水线,逻辑图形处理流水线可以接收2D或3D场景的表示且提供表示2D图像的位图的输出以进行显示。现有的应用编程接口(API)已经实现了图形流水线模型。这样的API的示例包括开放图形库(OPENGL)API和METAL API。图形处理流水线包括将一组顶点、纹理、缓冲器和状态信息转换成屏幕上的图像帧的多个阶段。在实现方式中,图形处理流水线的阶段之一是着色器,着色器可以用作应用于输入帧(例如,静止图像或视频帧)的特定AR内容生成器的一部分。着色器可以实现为在通常执行若干计算线程的专用处理单元(也被称为着色器单元或着色器处理器)上运行的代码,代码被编程以对正在被呈现的片段生成适当等级的颜色和/或特殊效果。例如,顶点着色器处理顶点的属性(位置、纹理坐标、颜色等),并且像素着色器处理像素的属性(纹理值、颜色、z深度和α值)。在一些实例中,像素着色器被称为片段着色器。
应当认识到的是,可以提供其他类型的着色器处理。在示例中,在图形处理流水线内利用特定采样率来呈现整个帧,并且/或者以特定每像素速率执行像素着色。以这种方式,给定电子设备(例如,客户端设备106)操作图形处理流水线以将与对象对应的信息转换成可以由电子设备显示的位图。
还可以例如通过图像和深度数据处理模块306对从摄像装置212接收的图像流执行单应性来获得或生成被摄体或场景的3D模型以供本文中描述的示例使用。在一些示例中,可以基于位置部件936报告的客户端设备的位置从服务器下载位置的现有3D模型。这样的3D模型可以与主题系统内的AR内容生成器组合,从而为app 110的用户提供附加交互性元素。
在一些示例中,通过使用深度和图像数据,可以执行将Z轴维度(例如,深度维度)添加至常规2D照片(例如,X轴和Y轴维度)的3D面部和场景重建。该格式使得观看者能够与图像交互,改变由主题系统呈现图像的角度/视角,并且影响在呈现图像中使用的粒子和着色器。
在一个示例中,观看者交互输入来自在观看图像时的移动(例如,来自向观看者显示图像的设备的移动传感器),该移动又被转换为内容、粒子和着色器如何被呈现的视角的改变。交互还可以来自屏幕上触摸姿势和其他设备运动。
图4示出了根据一些示例的描绘轮播的示例用户界面,该轮播用于选择AR内容生成器数据并将所选择的AR内容生成器数据应用于媒体内容(例如,由摄像装置212生成的图像或视频)并且在app 110中呈现应用的AR内容生成器的结果。
在这样的用户界面的示例中,诸如AR内容生成器图标408、AR内容生成器图标422等的可选图形项可以按照轮播布置进行呈现中,在该轮播布置中可选图形项的一部分或子集在给定计算设备(例如,客户端设备106)的显示屏上可见。通过示例的方式,用户可以利用各种输入来将轮播布置中的可选图形项旋转到显示屏上以及旋转离开显示屏,从而提供对图形项的循环查看。因此,在用户界面中提供的轮播布置使得多个图形项能够占据显示屏上的特定图形区域。
在示例中,与不同AR内容生成器对应的各个AR或图像修改体验可以被组织成各个组以包括在轮播布置上,从而使得用户能够滚动或“旋转”遍历可用的AR内容生成器。尽管提供了轮播界面作为示例,但是应当认识到的是,也可以利用其他图形界面。例如,AR内容生成器图标可以按照图形列表、滚动列表、滚动图形或使得能够实现导航和/或选择的另一图形界面来示出。如本文中所使用的,轮播界面是指以类似于环形列表的布置显示图形项,从而使得能够基于用户输入(例如,触摸或姿势)导航遍历环形列表以选择或滚动遍历图形项。在示例中,可以在水平(或竖直)线或轴上呈现一组图形项,其中每个图形项被表示为特定缩略图像(或图标、化身等)。
在任何一个时刻,轮播界面中的图形项中的一些可以被隐藏。如果用户想要查看隐藏的图形项,则在示例中,用户可以提供用户输入(例如,滑动或其他触摸姿势等)以沿特定方向(例如,左、右、上或下等)滚动遍历图形项。响应于用户输入,经由以下动画来显示轮播界面的更新视图:该动画呈现一个或更多个附加图形项以包括在界面上并且在该动画中先前呈现的图形项中的一些可以被隐藏。在一个示例中,以这种方式,用户可以以环形方式来回导航遍历成组图形项。因此,应当认识到的是,轮播界面可以通过以可滚动视图仅显示来自一组图形项的图形项子集来优化屏幕空间。在一些情况下,轮播是连续的(离开一侧的图形项能够重新进入另一侧)或者已经定义了开始和结束点(存在第一图形元素和最后图形元素,轮播将不会滚动超过该第一图形元素和最后图形元素)。
如本文中所述的,AR内容生成器图标被包括在轮播布置(或如以上所讨论的另一界面)上,从而使得能够旋转遍历并选择AR内容生成器之一。如以上更详细地讨论的,在轮播布置中示出的AR内容生成器图标对应于已经根据元数据经策展和过滤的一组可用的AR内容生成器,其中元数据可以定义AR内容生成器可用的时间或地点。在图4的用户界面示例的轮播布置中,轮播布置中示出的AR内容生成器图标来自由app 110提供的可用的AR内容生成器。
如图4中示出的用户界面所示,可选AR内容生成器图标408和422显示在电子设备(例如,客户端设备106)的显示屏上的轮播406中。在一个示例中,经由客户端设备106的触摸屏沿轮播406接收左滑或右滑姿势,并且响应于接收到滑动姿势,实现轮播中的项的左移动或右移动,以便于选择与AR内容生成器图标408、422中之一对应的特定AR内容生成器。然后,经由用户在感兴趣的AR内容生成器图标上的触摸输入,或者通过滚动遍历轮播并且当期望的AR内容生成器图标位于如在用户界面404中能够看到的中心位置410时停止,来选择期望的AR内容生成器图标(例如,AR内容生成器图标408)。轮播参数也可以由SDK的提供者和/或app的开发者定义。例如,可以指定轮播中AR内容生成器图标的最大数目是某个数目,例如25。
用户界面402对应于响应于app逻辑202对SDK 216的调用而示出的初始屏幕,其中AR内容生成器无效,如通过在中心位置410中缺少AR内容生成器图标所能够看到的。即,由摄像装置212捕获并显示在客户端设备106的显示屏上的用户的视图是未装饰的。用户界面402还包括与由SDK的提供者提供的应用(例如,消息收发应用)或SDK的提供者对应的徽标412。还包括前/后摄像装置翻转图标414和闪光启用图标416,用户可以与它们交互以在前摄像装置与后摄像装置之间对换以及启用不同的闪光模式,如本领域中已知的。用户界面402还包括关闭并返回图标418,用户可以在该图标上轻敲或向下滑动以退出用户界面402并返回到由app 110提供的用户界面。
在图4的第二示例中,如用户界面404中所示,一经选择现在占据中心位置410的特定AR内容生成器图标,呈现AR效果420以结合摄像装置馈送显示在客户端设备106上。在该示例中,AR效果420包括3D对象(例如,如图所示的玫瑰花环)以及由与选择的AR内容生成器图标对应的AR内容生成器定义的任何其他效果。效果可以包括基于粒子的效果,其在空间上呈现并响应于观看者的电子设备(例如,客户端设备106)上的传感器信息(例如,陀螺仪数据等)而移动。效果还可以包括颜色过滤和着色器效果,其能够或可以也响应于传感器信息而移动。着色过滤的示例包括日光效果,其与对应于创建消息所在的位置的一天中的时间匹配(例如,基于包括在消息中的位置元数据)。着色器效果的示例包括但不限于液体在屏幕四处移动、闪烁效果、开花效果、彩虹效果、文本效果、基于移动改变背景等。
在用户界面404中还提供轮播返回图标424,当用户触摸该轮播返回图标时,返回到无AR内容生成器有效状态并且显示用户界面402。
图5示出了描绘可以在预期用户界面中提供的可选特征的示例用户界面。在用户界面502中,提供示出有效AR内容生成器的名称和/或其创建者的名称的文本覆盖506。轻敲创建者名称使得能够在由SDK的提供者提供的应用(例如,消息收发应用)上查看创建者的简档。另外,可以提供产品动作UI元素508以供显示和app 110的开发者使用。该元素的内容和轻敲该元素的结果可以由app 110的开发者定制。例如,它可以包含产品名称和到网页或到与该产品有关的app 110的另一部分的链接。
如果轻敲徽标412,则可以显示用户界面504。轻敲该徽标提供了与SDK的提供者有关或与由SDK的提供者提供的app或服务有关的响应。在该示例中,轻敲徽标412导致对话框510呈现给用户。在示出的示例中,向app 110的用户提供以下选择:将消息收发应用以AR内容生成器有效或者查看消息收发应用中的app开发者的简档的其默认视图打开。当选择后一选项时要查看的简档可以由开发者设置,并且例如也可以是AR内容生成器创建者的简档。还包括取消按钮,其将用户界面返回到先前界面,例如用户界面404或用户界面502。
图6示出了可以由进一步的用户动作产生的示例用户界面。在用户界面602中,app110的用户已经向左滚动轮播406,直到不再有可用的AR内容生成器要显示。在这样的情况下,徽标图标606被示出为最后选项,下面是文本“更多LENSES”。轻敲徽标图标606将用户带到可以使用的附加AR内容生成器的储存库,例如在app商店或在由SDK的提供者提供的AR内容生成器商店或应用(例如,消息收发应用)中。徽标图标606是否显示在轮播406的末端还可以取决于可以由SDK的开发者和/或app的开发者定义的各种参数。例如,可以指定徽标图标606仅应用于具有多于10个AR内容生成器的轮播。在一个示例中,轮播406不允许在最后图标(用户界面602中的徽标图标606)已经出现在轮播406中之后进一步向左滚动。替选地,用户进一步向左滚动将使轮播406在中心位置410处以轮播中的第一图标继续,或者返回到用户界面402。
用户界面604是在用户采取用于捕获增强的摄像装置馈送的动作之后示出的界面的示例,例如,用户在AR内容生成器有效以捕获图像时通过在中心位置410上轻敲,或者当AR内容生成器有效以记录视频片段时通过按压并保持中心位置410。一旦该用户动作已经完成,就在用户界面604中示出修改和捕获的图像或视频片段的表示。用户可以通过轻敲保存图标608来将图像或视频片段保存到本地数据存储装置210,或者用户可以通过轻敲转发图标610来打开提供用于转发图像或视频片段的各种选项的对话框,如本领域中已知的。
另外,可以提供app动作图标612,其具有已经由app 110的开发者定义的所产生的步骤。例如,用户界面可以返回到app的用户界面,在app的用户界面,捕获的图像或视频片段可以与app体验一起使用或集成,或者以其他方式在app平台上共享或与app 110的其他用户共享。用户界面604还包括退出图标614,其丢弃捕获的视频片段或图像并且返回到先前用户界面,例如用户界面404、用户界面502或用户界面602。
图7示出了当由app逻辑202调用SDK 216时,如果存在仅一个可用的AR内容生成器则可以显示的用户界面。在这样的情况下,用户界面702可以立即呈现,其中单个AR内容生成器是有效的,并且相关联的AR内容生成器图标处于中心位置410。在这种情况下,不需要示出轮播406和轮播返回图标424,因为默认存在仅一个有效的AR内容生成器。根据需要或优选以及根据app开发者所指定的,将提供或可以提供其他用户界面特征,包括文本覆盖506、产品动作UI元素508、徽标412以及关闭并返回图标418。与这些特征的交互将提供与以上所讨论的相同响应。
图8是示出用于导航图4至图7的用户界面的示例方法的流程图。方法在开始操作802之后在操作804处开始,此时API 204从app逻辑202接收调用以通过SDK 216提供图像增强。作为响应,在操作806处,SDK UI 218生成并显示用户界面402。然后,用户对轮播406进行导航并选择与期望的AR内容生成器对应的AR内容生成器图标408、422等。响应于用户输入(例如,用户左/右滚动、选择按钮或动作项等)对轮播406的导航以及所产生的更新的用户界面的显示(例如,如参照图4至图7所示和所述)由SDK UI 218执行。
在SDK 216在操作808处接收到对AR内容生成器的选择之后,SDK工具包逻辑206在AR内容生成器已经被下载或预先缓存的情况下从本地数据存储装置210获得AR内容生成器,或者通过网络102从SDK服务器系统104或托管AR内容生成器的其他服务器获得AR内容生成器。然后,SDK工具包逻辑向标注系统208提供AR内容生成器和任何相关联的数据,例如设备配置和跟踪模型。然后,208基于选择的AR内容生成器及其元数据、设备的配置、指定的跟踪模型、用户输入和传感器数据(例如,位置传感器数据)或从app逻辑202或经由app逻辑接收的其他数据来处理摄像装置馈送,以在操作810处(结合SDK UI 218)生成和显示用户界面404,用户界面404包括已经如选择的AR内容生成器和相关联的数据所定义的那样被修改的摄像装置馈送。SDK UI 218、标注系统208、本地数据存储装置210和任何远程服务器之间的协调由SDK工具包逻辑206管理。
替选地,如果用户在操作806和操作808处没有选择轮播406中的AR内容生成器图标,而是滚动到轮播的末端,则方法从操作830继续。
从操作810开始,可以由SDK UI 218提供产品动作UI元素508和徽标412以分别在操作812或操作818处显示,如果在选择的AR内容生成器中这样定义或者在来自app逻辑202的API调用中指定的话。如果在操作820处接收到对徽标412的选择,则在操作822处由SDKUI 218显示进一步的选项,如用户界面504中所示以及如上面参照图5所述。在操作824处接收到对选项(除了“取消”之外)的选择致使SDK 216在操作826处以由选择的选项指定的状态打开由SKD提供者提供的app(例如,消息收发应用)。替选地,一旦在操作820处接收到对徽标412的选择,SDK 216就可以直接在操作826处打开由SKD提供者提供的app。
在操作828处,一旦从在操作826打开的app返回(例如,一旦接收到关闭或退出打开的app的用户交互),可以显示app 110的用户界面。替选地,SDK UI 218可以显示用户界面402或用户界面404,并且然后方法可以分别在操作806或操作808处继续。
在操作814处,如果响应于操作812而接收到对产品动作UI元素508的选择,则在操作816处执行由app开发者定义的与该UI元素相关联的动作。一旦完成该动作,app 110可以返回到用户界面402或用户界面404,或者返回到app特定用户界面。
如果在操作806或操作810处,如在操作830处那样接收到与滚动到轮播的末端对应的用户输入,则在操作832处,由SDK UI 218显示轮播中的最后图标,即徽标图标606。如果在操作834处接收到对徽标图标606的选择,则在操作836处打开可用于供用户使用或选择的附加AR内容生成器的储存库。这可以例如通过SDK 216提供对app商店或由SDK的提供者提供的AR内容生成器商店或应用(例如,消息收发应用)的调用来实现。用户对附加AR内容生成器的选择将致使与附加AR内容生成器对应的图标被SDK UI 218包括在轮播406中。在获得或拒绝附加AR内容生成器之后,在操作838处,方法可以返回并且可以显示用户界面402或用户界面404,并且然后方法可以分别在操作806或操作810处继续。
另外,从操作810开始,可以在操作840处接收图像或视频捕获输入。作为响应,SDKUI 218可以在操作842处显示用户界面604,包括呈现保存图标608、转发图标610、app动作图标612和退出图标614。如果在操作844处接收到对app动作图标612的选择,则在操作846处执行已经由app 110的开发者定义的动作。例如,可以呈现由app逻辑202定义的用户界面,其中捕获的图像或视频片段可以与app体验一起使用或集成,或者以其他方式在app平台上共享或与app 110的其他用户共享。在操作848处响应于用户输入从在846中执行的app动作返回到方法的情况下,方法在用户界面之一处继续进行,用户界面例如用户界面402、用户界面404或用户界面502。
机器架构
图9是机器900的图解表示,在该机器内可以执行用于使机器900执行本文中讨论的方法中的任何一种或更多种的指令910(例如,软件、程序、应用、小程序、app或其他可执行代码)。例如,指令910可以使机器900执行本文中描述的方法中的任何一种或更多种。指令910将通用的非编程的机器900变换成被编程成以所描述的方式执行描述和示出的功能的特定机器900。机器900可以作为独立设备操作或者可以耦接(例如,联网)至其他机器。在联网的部署中,机器900可以在服务器-客户端网络环境中以服务器机器或客户端机器的能力进行操作,或者在对等(或分布式)网络环境中作为对等机器进行操作。机器900可以包括但不限于:服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如,智能手表)、智能家居设备(例如,智能电器)、其他智能设备、web装置、网络路由器、网络交换机、网络桥接器或者能够顺序地或以其他方式执行指定要由机器900采取的动作的指令910的任何机器。此外,虽然示出了仅单个机器900,但是术语“机器”也应当被视为包括单独或联合执行指令910以执行本文中讨论的方法中的任何一种或更多种的机器的集合。例如,机器900可以包括客户端设备106或者形成SDK服务器系统104的一部分的多个服务器设备中的任何一个。在一些示例中,机器900还可以包括客户端和服务器系统两者,其中在服务器侧执行特定方法或算法的某些操作,并且在客户端侧执行特定方法或算法的某些操作。
机器900可以包括可以被配置成经由总线940彼此通信的处理器904、存储器906和输入/输出(I/O)部件902。在示例中,处理器904(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、另外的处理器或其任何合适的组合)可以包括例如执行指令910的处理器908和处理器912。术语“处理器”旨在包括多核处理器,该多核处理器可以包括可以同时执行指令的两个或更多个独立的处理器(有时被称为“核”)。尽管图9示出了多个处理器904,但是机器900可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器、或者其任何组合。
存储器906包括处理器904可经由总线940访问的主存储器914、静态存储器916和存储单元918。主存储器906、静态存储器916和存储单元918存储实现本文中描述的方法或功能中的任何一个或更多个的指令910。指令910还可以在其被机器900执行期间完全地或部分地驻留在主存储器914内、在静态存储器916内、在存储单元918内的机器可读介质920内、在处理器904中的至少之一内(例如,在处理器的缓存存储器内)、或其任何合适的组合。
I/O部件902可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量结果等的各种部件。特定机器中包括的特定I/O部件902将取决于机器的类型。例如,便携式机器例如移动电话可以包括触摸输入设备或其他这样的输入机构,而无头服务器机器将不太可能包括这样的触摸输入设备。将认识到的是,I/O部件902可以包括图9中未示出的许多其他部件。在各种示例中,I/O部件902可以包括用户输出部件926和用户输入部件928。用户输出部件926可以包括视觉部件(例如,诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号生成器等。用户输入部件928可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触感输入部件(例如,物理按钮、提供触摸或触摸姿势的位置和力的触摸屏、或其他触感输入部件)、音频输入部件(例如,麦克风)等。
在另外的示例中,I/O部件902可以包括生物计量部件930、运动部件932、环境部件934、或位置部件936以及各种其他部件。例如,生物计量部件930包括用于检测表达(例如,手表达、面部表情、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件932包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
环境部件934包括例如:一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近度传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,为了安全而检测危险气体的浓度或者测量大气中的污染物的气体检测传感器)、或者可以提供与周围物理环境对应的指示、测量或信号的其他部件。
关于摄像装置,客户端设备106可以具有摄像装置系统,该摄像装置系统包括例如客户端设备106的前表面上的前摄像装置和客户端设备106的后表面上的后摄像装置。前摄像装置可以例如用于捕获客户端设备106的用户的静止图像和视频(例如,“自拍”),然后可以用上述增强数据(例如,过滤器)对该静止图像和视频进行增强。例如,后摄像装置可以用于以更常规的摄像装置模式捕获静止图像和视频,这些图像类似地用增强数据进行增强。除了前摄像装置和后摄像装置之外,客户端设备106还可以包括用于捕获360°照片和视频的360°摄像装置。
此外,客户端设备106的摄像装置系统可以包括双后摄像装置(例如,主摄像装置以及深度感测摄像装置),或者甚至在客户端设备106的前后侧上包括三重、四重或五重后摄像装置配置。例如,这些多个摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。
位置部件936包括位置传感器部件(例如,GPS接收器部件)、海拔传感器部件(例如,检测气压的高度计或气压计,根据气压可以得到海拔)、取向传感器部件(例如,磁力计)等。
可以使用各种技术来实现通信。I/O部件902还包括通信部件938,该通信部件可操作以经由相应的耦接或连接将机器900耦接至网络922或设备924。例如,通信部件938可以包括网络接口部件或另一合适的设备以与网络922对接。在其他示例中,通信部件938可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如,/>低能耗)、/>部件、以及用于经由其他模态提供通信的其他通信部件。设备924可以是其他机器或各种外围设备中的任何外围设备(例如,经由USB耦接的外围设备)。
此外,通信部件938可以检测标识符或包括可操作以检测标识符的部件。例如,通信部件938可以包括射频识别(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如,用于检测诸如通用产品代码(UPC)条形码的一维条形码、诸如快速反应(QR)码、Aztec码、数据矩阵、Dataglyph、MaxiCode、PDF417、超码(Ultra Code)、UCC RSS-2D条形码的多维条形码和其他光学码的光学传感器)或声学检测部件(例如,用于识别标记的音频信号的麦克风)。另外,可以经由通信部件938得出各种信息,例如经由因特网协议(IP)地理定位的位置、经由信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等。
各种存储器(例如,主存储器914、静态存储器916以及处理器904的存储器)以及存储单元918可以存储由本文中描述的方法或功能中的任何一个或更多个使用或实施本文中描述的方法或功能中的任何一个或更多个的一组或更多组指令和数据结构(例如,软件)。这些指令(例如,指令910)在由处理器904执行时使各种操作实现所公开的示例。
可以经由网络接口设备(例如,通信部件938中包括的网络接口部件),使用传输介质并且使用若干公知的传输协议中的任何一种传输协议(例如,超文本传输协议(HTTP)),通过网络922来发送或接收指令910。类似地,可以使用传输介质经由至设备924的耦接(例如,对等耦接)来发送或接收指令910。
软件架构
图10是示出软件架构1004的框图1000,该软件架构可以安装在本文中描述的设备中的任何一个或更多个上。软件架构1004由硬件例如包括处理器1020、存储器1026和I/O部件1038的机器1002支持。在该示例中,软件架构1004可以被概念化为层的堆栈,在该层的堆栈中,每个层提供特定的功能。软件架构1004包括诸如操作系统1012、库1010、框架1008和应用1006的层。在操作上,应用1006通过软件堆栈来激活API调用1050并响应于API调用1050来接收消息1052。
操作系统1012管理硬件资源并提供公共服务。操作系统1012包括例如内核1014、服务1016和驱动器1022。内核1014充当硬件层与其他软件层之间的抽象层。例如,内核1014提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置以及其他功能。服务1016可以为其他软件层提供其他公共服务。驱动器1022负责控制底层硬件或与底层硬件对接。例如,驱动器1022可以包括显示驱动器、摄像装置驱动器、或低功耗驱动器、闪存驱动器、串行通信驱动器(例如,USB驱动器)、驱动器、音频驱动器、电源管理驱动器等。
库1010提供由应用1006使用的公共低级基础设施。库1010可以包括系统库1018(例如,C标准库),该系统库提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。另外,库1010可以包括API库1024,例如媒体库(例如,用于支持各种媒体格式的呈现和操纵的库,所述各种媒体格式例如运动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层-3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形内容中以二维(2D)和三维(3D)呈现的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供web浏览功能的WebKit)等。库1010还可以包括各种其他库1028,以向应用1006提供许多其他API。
框架1008提供由应用1006使用的公共高级基础设施。例如,框架1008提供各种图形用户界面(GUI)功能、高级资源管理以及高级位置服务。框架1008可以提供可以由应用1006使用的广泛的其他API,其中的一些API可以特定于特定的操作系统或平台。
在示例中,应用1006可以包括家庭应用1036、联系人应用1030、浏览器应用1032、书籍阅读器应用1034、位置应用1042、媒体应用1044、消息收发应用1046、游戏应用1048和诸如第三方应用1040的各种各样的其他应用。应用1006是执行程序中限定的功能的程序。可以采用各种编程语言来创建以各种方式构造的一个或更多个应用1006,编程语言例如面向对象的编程语言(例如,Objective-C、Java或C++)或过程编程语言(例如,C语言或汇编语言)。在特定示例中,第三方应用1040(例如,由除了特定平台的供应商之外的实体使用ANDROIDTM或IOSTM软件开发工具包(SDK)开发的应用)可以是在诸如IOSTM、ANDROIDTM、Phone的移动操作系统或其他移动操作系统上运行的移动软件。在该示例中,第三方应用1040可以激活由操作系统1012提供的API调用1050以便于本文中描述的功能。
术语表
“载波信号”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或其他无形介质以便于这样的指令的通信。可以使用传输介质经由网络接口设备来通过网络发送或接收指令。
“客户端设备”是指与通信网络接口以从一个或更多个服务器系统或其他客户端设备获得资源的任何机器。客户端设备可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信设备。
“通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、其他类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全局移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、增强数据速率的GSM演进(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
“部件”是指具有以下边界的设备、物理实体或逻辑,该边界由功能或子例程调用、分支点、API或者对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由其接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元,并且可以是通常执行相关功能中的特定功能的程序的一部分。部件可以构成软件部件(例如,在机器可读介质上实施的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例实施方式中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或者计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置为操作以执行本文中描述的某些操作的硬件部件。也可以机械地、电子地或以其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)的专用处理器。硬件部件还可以包括通过软件临时配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,硬件部件就变成被独特地定制成执行所配置的功能的特定机器(或机器的特定部件),而不再是通用处理器。将认识到,可以出于成本和时间考虑来决定机械地、在专用且永久配置的电路系统中还是在临时配置(例如,通过软件配置)的电路系统中实现硬件部件。相应地,短语“硬件部件”(或者“硬件实现的部件”)应当被理解成包含有形实体,即被物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或者执行本文中描述的某些操作的实体。考虑硬件部件被临时配置(例如,被编程)的实施方式,无需在任一时刻处对硬件部件中的每一个进行配置或实例化。例如,在硬件部件包括通过软件配置成变成专用处理器的通用处理器的情况下,该通用处理器可以在不同时间处分别被配置为不同的专用处理器(例如,包括不同的硬件部件)。软件相应地配置一个或多个特定处理器以例如在一个时刻处构成特定硬件部件,并且在不同的时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息以及从其他硬件部件接收信息。因此,描述的硬件部件可以被认为通信地耦接。在同时存在多个硬件部件的情况下,可以通过在两个或更多个硬件部件之间或之中(例如,通过适当的电路和总线)的信号传输来实现通信。在其中多个硬件部件在不同时间处被配置或被实例化的实施方式中,可以例如通过将信息存储在多个硬件部件访问的存储器结构中并且在该存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在其通信地耦接至的存储器设备中。然后,其他硬件部件可以在随后的时间处访问存储器设备以检索和处理存储的输出。硬件部件还可以发起与输入设备或输出设备的通信,并且可以对资源进行操作(例如,信息的集合)。本文中描述的示例方法的各种操作可以至少部分地由临时地被配置(例如,由软件)或永久地被配置成执行相关操作的一个或更多个处理器来执行。无论是临时地被配置还是永久地被配置,这样的处理器可以构成操作以执行本文中描述的一个或更多个操作或功能的处理器实现的部件。如本文中使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,本文中描述的方法可以至少部分地由处理器实现,其中特定的一个或多个处理器是硬件的示例。例如,方法的操作中的至少一些操作可以由一个或更多个处理器1020或处理器实现的部件来执行。此外,一个或更多个处理器还可以操作成支持“云计算”环境中的相关操作的执行或者操作为“软件即服务”(SaaS)。例如,操作中的至少一些操作可以由一组计算机(作为包括处理器的机器的示例)执行,其中这些操作能够经由网络(例如,因特网)并且经由一个或更多个适当的接口(例如,API)进行访问。某些操作的执行可以分布在处理器之间,不是仅驻留在单个机器内,而是跨多个机器被部署。在一些示例实施方式中,处理器或处理器实现的部件可以位于单个地理位置中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例实施方式中,处理器或处理器实现的部件可以跨多个地理位置分布。
“计算机可读存储介质”是指机器存储介质和传输介质两者。因此,这些术语包括存储设备/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“设备可读介质”意指相同的事物,并且可以在本公开内容中可互换地使用。
“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储设备和介质(例如,集中式或分布式数据库,以及相关联的缓存和服务器)。因此,术语应当被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和设备存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器设备,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存设备;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“设备存储介质”、“计算机存储介质”意指相同的事物,并且在本公开内容中可以互换使用。术语“机器存储介质”、“计算机存储介质”和“设备存储介质”明确地排除了载波、调制数据信号和其他这样的介质,所述载波、调制数据信号和其他这样的介质中的至少一些被涵盖在术语“信号介质”中。
“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
“信号介质”是指能够存储、编码或携载由机器执行的指令的任何无形介质,并且包括数字或模拟通信信号或其他无形介质以便于软件或数据的通信。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指使其特性中的一个或更多个特性以将信息编码在信号中的方式来设置或改变的信号。术语“传输介质”和“信号介质”意指相同的事物,并且可以在本公开内容中互换使用。
Claims (15)
1.一种软件开发工具包SDK,包括:
应用编程接口API,其从在便携式设备上运行的第三方应用接收API调用,所述便携式设备包括摄像装置;
SDK逻辑,其接收和处理从所述API接收的命令和参数,所述命令和参数基于从所述第三方应用接收的所述API调用,所述命令和参数识别增强现实内容生成器;以及
标注系统,其使用所述增强现实内容生成器并基于由所述标注系统从所述SDK逻辑接收的图像处理指令和参数,为所述第三方应用对来自所述摄像装置的馈送执行图像处理操作,
其中,基于所述SDK不能从所述便携式设备中的本地数据存储装置检索到所述图像处理指令和参数,所述SDK逻辑从由所述SDK的提供者托管的服务器获得所述增强现实内容生成器,并且
其中,所述增强现实内容生成器已经由所述第三方应用的提供者定制,并且基于所述第三方应用的提供者的标识从由所述SDK的提供者托管的服务器获得。
2.根据权利要求1所述的SDK,其中,所述标注系统基于所述增强现实内容生成器对来自所述摄像装置的馈送进行操作。
3.根据权利要求1所述的SDK,其中,所述第三方应用从由所述第三方应用的提供者或开发者托管的服务器接收用于处理的第三方数据。
4.根据权利要求1所述的SDK,其中,所述图像处理指令和参数存储在所述便携式设备上的本地数据存储装置中。
5.根据权利要求1所述的SDK,其中,所述图像处理操作对应于在消息收发应用上可获得的图像处理操作,所述图像处理操作能够在所述消息收发应用不启动的情况下经由所述SDK被获得。
6.根据权利要求5所述的SDK,其中,所述SDK的提供者也是所述消息收发应用的提供者。
7.根据权利要求1所述的SDK,其中,所述图像处理操作对应于在消息收发应用上可获得的图像处理操作,所述第三方应用被配置成独立于所述消息收发应用执行所述图像处理操作。
8.一种系统,包括:
机器的一个或更多个处理器;
摄像装置;
显示器;以及
存储器,其存储包括SDK和第三方软件应用的指令,所述SDK包括:
应用编程接口API,其从所述第三方软件应用接收API调用,
SDK逻辑,其接收和处理从所述API接收的命令和参数,所述命令和参数基于从所述第三方软件应用接收的所述API调用,所述命令和参数识别增强现实内容生成器;以及
标注系统,其使用所述增强现实内容生成器并基于由所述标注系统从所述SDK逻辑接收的图像处理指令和参数,对来自所述摄像装置的馈送执行图像处理操作,
其中,基于所述SDK不能从所述系统的本地数据存储装置检索到所述图像处理指令和参数,所述SDK逻辑从由所述SDK的提供者托管的服务器获得所述增强现实内容生成器,并且
其中,所述增强现实内容生成器已经由所述第三方软件应用的提供者定制,并且基于所述第三方软件应用的提供者的标识从由所述SDK的提供者托管的服务器获得。
9.根据权利要求8所述的系统,其中,所述SDK还包括增强现实内容生成器的集合,所述增强现实内容生成器包括将增强现实体验应用于图像或视频馈送的指令和参数,所述标注系统在使用中基于对特定增强现实内容生成器的用户选择来执行图像处理操作。
10.根据权利要求8所述的系统,其中,所述第三方软件应用从由所述第三方软件应用的提供者或开发者托管的服务器接收用于处理的第三方数据。
11.根据权利要求9所述的系统,其中,所述增强现实内容生成器的集合的参数包括地理限制和时间限制。
12.根据权利要求8所述的系统,其中,所述SDK被集成到所述第三方软件应用中。
13.根据权利要求8所述的系统,其中,所述标注系统基于所述系统的配置、指定的对象跟踪模型、用户输入和位置传感器数据来处理来自所述摄像装置的馈送。
14.根据权利要求8所述的系统,其中,所述图像处理操作对应于在消息收发应用上可获得的图像处理操作,所述图像处理操作能够在所述消息收发应用不启动的情况下经由所述SDK被获得。
15.根据权利要求8所述的系统,其中,所述图像处理操作对应于能够在消息收发应用上获得的图像处理操作,所述第三方软件应用被配置成独立于所述消息收发应用执行所述图像处理操作。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063037348P | 2020-06-10 | 2020-06-10 | |
US63/037,348 | 2020-06-10 | ||
US17/302,424 US11698822B2 (en) | 2020-06-10 | 2021-05-03 | Software development kit for image processing |
US17/302,424 | 2021-05-03 | ||
PCT/US2021/035092 WO2021252217A1 (en) | 2020-06-10 | 2021-06-01 | Software development kit for image processing |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115699097A CN115699097A (zh) | 2023-02-03 |
CN115699097B true CN115699097B (zh) | 2024-05-31 |
Family
ID=78826530
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180041630.1A Active CN115699097B (zh) | 2020-06-10 | 2021-06-01 | 用于图像处理的软件开发工具包 |
Country Status (5)
Country | Link |
---|---|
US (2) | US11698822B2 (zh) |
EP (1) | EP4165609A4 (zh) |
KR (1) | KR20230021113A (zh) |
CN (1) | CN115699097B (zh) |
WO (1) | WO2021252217A1 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11698822B2 (en) | 2020-06-10 | 2023-07-11 | Snap Inc. | Software development kit for image processing |
US11360733B2 (en) | 2020-09-10 | 2022-06-14 | Snap Inc. | Colocated shared augmented reality without shared backend |
US11880949B2 (en) | 2020-12-31 | 2024-01-23 | Snap Inc. | Post-capture editing of augmented reality content |
KR20230127311A (ko) * | 2020-12-31 | 2023-08-31 | 스냅 인코포레이티드 | 안경류 디바이스 상에서의 증강 현실 콘텐츠의 기록 |
CN116419057A (zh) * | 2021-12-28 | 2023-07-11 | 北京小米移动软件有限公司 | 拍摄方法、装置及存储介质 |
US20230215118A1 (en) * | 2021-12-30 | 2023-07-06 | Snap Inc. | Api to provide product cards generated by augmented reality content generators |
WO2023129996A1 (en) * | 2021-12-30 | 2023-07-06 | Snap Inc. | Dynamically presenting augmented reality content generators |
KR20240131412A (ko) * | 2021-12-30 | 2024-08-30 | 스냅 인코포레이티드 | 증강 현실 콘텐츠 생성기들에 의한 제품 카드들 |
US11949527B2 (en) | 2022-04-25 | 2024-04-02 | Snap Inc. | Shared augmented reality experience in video chat |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107615239A (zh) * | 2015-04-28 | 2018-01-19 | 谷歌有限责任公司 | 用于托管和发布软件包的基础架构 |
CN108141526A (zh) * | 2015-10-30 | 2018-06-08 | 2Mee 有限公司 | 通信系统和方法 |
CN109379548A (zh) * | 2018-09-26 | 2019-02-22 | Oppo广东移动通信有限公司 | 多媒体录制方法、装置、终端及存储介质 |
US10242477B1 (en) * | 2017-01-16 | 2019-03-26 | Snap Inc. | Coded vision system |
US10432559B2 (en) * | 2016-10-24 | 2019-10-01 | Snap Inc. | Generating and displaying customized avatars in electronic messages |
CN110827378A (zh) * | 2019-10-31 | 2020-02-21 | 北京字节跳动网络技术有限公司 | 虚拟形象的生成方法、装置、终端及存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10585727B1 (en) | 2015-06-08 | 2020-03-10 | Google Llc | API manager |
WO2017066801A1 (en) * | 2015-10-16 | 2017-04-20 | Bent Image Lab, Llc | Augmented reality platform |
US10607386B2 (en) * | 2016-06-12 | 2020-03-31 | Apple Inc. | Customized avatars and associated framework |
US11635872B2 (en) | 2016-11-22 | 2023-04-25 | Snap Inc. | Smart carousel of image modifiers |
WO2018143990A1 (en) | 2017-02-02 | 2018-08-09 | Google Llc | Custom digital components |
US10791077B2 (en) | 2017-08-08 | 2020-09-29 | Snap Inc. | Application-independent messaging system |
WO2019173566A1 (en) * | 2018-03-08 | 2019-09-12 | Bose Corporation | Augmented reality software development kit |
US11307584B2 (en) | 2018-09-04 | 2022-04-19 | Skydio, Inc. | Applications and skills for an autonomous unmanned aerial vehicle |
US10778623B1 (en) | 2018-10-31 | 2020-09-15 | Snap Inc. | Messaging and gaming applications communication platform |
US11023261B1 (en) | 2018-12-28 | 2021-06-01 | Snap Inc. | 3RD party application management |
US11153238B2 (en) | 2019-01-08 | 2021-10-19 | Snap Inc. | Dynamic application configuration |
US20200310601A1 (en) | 2019-03-29 | 2020-10-01 | Snap Inc. | Dynamic media selection menu |
US12070682B2 (en) | 2019-03-29 | 2024-08-27 | Snap Inc. | 3D avatar plugin for third-party games |
US11237702B2 (en) | 2019-12-31 | 2022-02-01 | Snap Inc. | Carousel interface for post-capture processing in a messaging system |
US11698822B2 (en) | 2020-06-10 | 2023-07-11 | Snap Inc. | Software development kit for image processing |
-
2021
- 2021-05-03 US US17/302,424 patent/US11698822B2/en active Active
- 2021-06-01 EP EP21822940.9A patent/EP4165609A4/en active Pending
- 2021-06-01 KR KR1020237000545A patent/KR20230021113A/ko not_active Application Discontinuation
- 2021-06-01 WO PCT/US2021/035092 patent/WO2021252217A1/en unknown
- 2021-06-01 CN CN202180041630.1A patent/CN115699097B/zh active Active
-
2023
- 2023-05-24 US US18/201,639 patent/US20230297445A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107615239A (zh) * | 2015-04-28 | 2018-01-19 | 谷歌有限责任公司 | 用于托管和发布软件包的基础架构 |
CN108141526A (zh) * | 2015-10-30 | 2018-06-08 | 2Mee 有限公司 | 通信系统和方法 |
US10432559B2 (en) * | 2016-10-24 | 2019-10-01 | Snap Inc. | Generating and displaying customized avatars in electronic messages |
US10242477B1 (en) * | 2017-01-16 | 2019-03-26 | Snap Inc. | Coded vision system |
CN109379548A (zh) * | 2018-09-26 | 2019-02-22 | Oppo广东移动通信有限公司 | 多媒体录制方法、装置、终端及存储介质 |
CN110827378A (zh) * | 2019-10-31 | 2020-02-21 | 北京字节跳动网络技术有限公司 | 虚拟形象的生成方法、装置、终端及存储介质 |
Non-Patent Citations (2)
Title |
---|
基于AR 技术的广府家具"纸上博物馆"设计应用与研究;汤晓颖等;包装工程;第39卷(第4期);第115-122页 * |
基于UVC相机的跨平台SDK开发;郑荣;中国优秀硕士学位论文全文数据库,信息科技辑(第4期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115699097A (zh) | 2023-02-03 |
KR20230021113A (ko) | 2023-02-13 |
EP4165609A4 (en) | 2024-07-31 |
US11698822B2 (en) | 2023-07-11 |
US20210389996A1 (en) | 2021-12-16 |
WO2021252217A1 (en) | 2021-12-16 |
EP4165609A1 (en) | 2023-04-19 |
US20230297445A1 (en) | 2023-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115698927B (zh) | 用于与图像处理sdk一起使用的界面轮播 | |
CN115699097B (zh) | 用于图像处理的软件开发工具包 | |
KR102635705B1 (ko) | 목적지 위치들을 조직하고 공유하기 위한 인터페이스들 | |
KR102670848B1 (ko) | 증강 현실 의인화 시스템 | |
KR20210143891A (ko) | 시맨틱 텍스처 매핑 시스템 | |
KR20230076843A (ko) | 목적지들을 브라우징하기 위한 증강 현실 콘텐츠 생성기들 | |
KR20230076849A (ko) | 목적지 활동들을 위한 증강 현실 콘텐츠 생성기 | |
KR20230079157A (ko) | 지오로케이션들을 식별하기 위한 증강 현실 콘텐츠 생성기들 | |
CN117043719A (zh) | 具有免提模式的镜像设备 | |
US20220197393A1 (en) | Gesture control on an eyewear device | |
KR20230121919A (ko) | 증강 현실 콘텐츠를 생성하기 위한 응시 방향의 결정 | |
CN115605897A (zh) | 用于消息收发系统中的物理产品的增强现实体验 | |
KR20230122642A (ko) | 안경류 디바이스 상의 3d 페인팅 | |
WO2022140129A1 (en) | Gesture control on an eyewear device | |
KR20230116938A (ko) | 안경류 디바이스 상의 미디어 콘텐츠 플레이어 | |
CN114365198A (zh) | 遮挡检测系统 | |
CN115552366A (zh) | 设备背面部分上的触控板 | |
CN117321534A (zh) | 用于增强现实显示设备的触摸板导航 | |
US11880542B2 (en) | Touchpad input for augmented reality display device | |
CN116724286A (zh) | 眼镜设备上的姿势控制 | |
CN116802590A (zh) | 将ar/vr内容重居中在眼镜设备上 | |
KR20230125293A (ko) | 복합 증강 현실 콘텐츠를 생성하기 위한 자동화된 콘텐츠큐레이션 | |
CN116670632A (zh) | 眼镜设备上的媒体内容播放器 | |
WO2024020908A1 (en) | Video processing with preview of ar effects | |
CN117561497A (zh) | 用于增强现实显示设备的触摸板输入 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |