CN117337563A - 用于立体拼接的硬件编码器 - Google Patents

用于立体拼接的硬件编码器 Download PDF

Info

Publication number
CN117337563A
CN117337563A CN202280035665.9A CN202280035665A CN117337563A CN 117337563 A CN117337563 A CN 117337563A CN 202280035665 A CN202280035665 A CN 202280035665A CN 117337563 A CN117337563 A CN 117337563A
Authority
CN
China
Prior art keywords
image
image data
data
user
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280035665.9A
Other languages
English (en)
Inventor
德米特里·留马
法里德·扎雷赛桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Snap Inc
Original Assignee
Snap Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Snap Inc filed Critical Snap Inc
Priority claimed from PCT/US2022/072284 external-priority patent/WO2022246373A1/en
Publication of CN117337563A publication Critical patent/CN117337563A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/156Mixing image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/161Encoding, multiplexing or demultiplexing different image signal components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/106Processing image signals
    • H04N13/167Synchronising or controlling image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/10Processing, recording or transmission of stereoscopic or multi-view image signals
    • H04N13/194Transmission of image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/296Synchronisation thereof; Control thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/30Image reproducers
    • H04N13/332Displays for viewing with the aid of special glasses or head-mounted displays [HMD]
    • H04N13/344Displays for viewing with the aid of special glasses or head-mounted displays [HMD] with head-mounted left-right displays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/50Constructional details
    • H04N23/51Housings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/698Control of cameras or camera modules for achieving an enlarged field of view, e.g. panoramic image capture

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

用于执行图像帧的立体拼接的系统包括立体摄像装置系统和硬件编码器。硬件编码器同时接收来自立体摄像装置系统的左图像流和右图像流,以及对左图像流和右图像流进行处理以生成单个拼接的编码帧。设备还可以包括处理器以及其上存储有指令的存储器,所述指令当由处理器执行时使处理器执行包括以下的操作:接收左图像流和右图像流;处理左图像流和右图像流;以及生成单个拼接的编码帧。

Description

用于立体拼接的硬件编码器
优先权申明
本申请是要求于2022年4月8日提交的美国非临时申请序列第17/716,786号的优先权的PCT申请,该美国非临时申请要求于2021年5月19日提交的美国临时申请序列第63/201,935号的优先权的权益,上述申请通过引用整体并入本文中。
技术领域
本文的实施方式总体上涉及立体摄像装置。更具体地,但并非通过限制的方式,本文的实施方式描述了用于立体拼接的硬件编码器。
背景技术
立体摄像装置模拟人的双目视觉并且捕获三维图像。立体摄像装置包括两个或更多个镜头,每个镜头具有图像传感器。立体摄像装置系统接收来自每个镜头的图像流,并且在图像颜色域中使用软件将帧拼接在一起,然后将其提供给编码器。
附图说明
在不一定按比例绘制的附图中,相似的附图标记可以在不同的视图中描述类似的部件。为了容易标识对任何特定元素或动作的讨论,附图标记中的一个或多个最高位数字是指该元素被首次引入时所在的图号。在附图的图中示出了一些非限制性示例,在附图中:
图1是根据一些示例的可以在其中部署本公开内容的联网环境的图解表示。
图2是根据一些示例的具有客户端侧功能和服务器侧功能两者的消息收发系统的图解表示。
图3是根据一些示例的如在数据库中维护的数据结构的图解表示。
图4是根据一些示例的消息的图解表示。
图5示出了根据一个示例实施方式的可以在其中实现硬件编码器的头部可穿戴设备。
图6示出了根据一个实施方式的用于对图像帧进行立体拼接的硬件编码器。
图7示出了根据一个实施方式的用于使用硬件编码器来对图像帧进行立体拼接的方法的流程图。
图8是示出可以在其中实现示例的软件架构的框图。
图9是根据一些示例的呈计算机系统形式的机器的图解表示,在该计算机系统内可以执行一组指令以使机器执行本文中讨论的方法中的任何一种或更多种方法。
图10示出了根据一个示例实施方式的可以在其中实现具有硬件编码器的头部可穿戴设备的系统。
具体实施方式
对立体图像进行拼接的传统方法消耗高的计算能力。例如,对立体图像进行拼接的传统系统使用软件来使立体摄像装置中的来自左摄像装置镜头的图像帧与来自右摄像装置镜头的图像帧同步。经同步的图像帧被一起拼接成单个缓冲,该单个缓冲然后被馈送至编码器,该编码器生成经编码的视频帧。因此,经编码的视频中的每一帧都具有左图像帧和右图像帧。
因此,本公开内容的实施方式通过利用用于单个激活的一批输入缓冲对硬件编码器进行配置来改进用于对立体图像进行拼接的系统的功能。编码器同时读取来自存储器中的多个位置的图像数据,以及输出单个缓冲。使用专门配置的硬件编码器来执行立体图像的拼接和同步由于比传统系统消耗较少的计算能力而提高了整个系统的效率。
联网计算环境
图1是示出用于通过网络来交换数据(例如,消息和相关联的内容)的示例消息收发系统100的框图。消息收发系统100包括客户端装置102的多个实例,所述实例中的每一个托管包括消息收发客户端104和其他应用106的多个应用。每个消息收发客户端104经由网络112(例如,因特网)通信地耦接至消息收发客户端104(例如,托管在相应的其他客户端装置102上)、消息收发服务器系统108和第三方服务器110的其他实例。消息收发客户端104还可以使用应用程序接口(API)与本地托管的应用106通信。
消息收发客户端104能够经由网络112与其他消息收发客户端104和消息收发服务器系统108通信并交换数据。在消息收发客户端104之间以及在消息收发客户端104与消息收发服务器系统108之间交换的数据包括功能(例如,激活功能的命令)以及有效载荷数据(例如,文本、音频、视频或其他多媒体数据)。
消息收发服务器系统108经由网络112向特定消息收发客户端104提供服务器侧功能。虽然消息收发系统100的某些功能在本文中被描述为由消息收发客户端104或由消息收发服务器系统108执行,但是某些功能的位置是在消息收发客户端104内还是在消息收发服务器系统108内可以是设计选择。例如,在技术上可能优选的是,最初将某些技术和功能部署在消息收发服务器系统108内,但是后面将该技术和功能迁移至客户端装置102具有足够处理能力的消息收发客户端104。
消息收发服务器系统108支持向消息收发客户端104提供的各种服务和操作。这样的操作包括向消息收发客户端104发送数据、从消息收发客户端104接收数据以及对由消息收发客户端104生成的数据进行处理。作为示例,该数据可以包括消息内容、客户端装置信息、地理定位信息、媒体增强和叠加、消息内容持久性条件、社交网络信息以及实况事件信息。通过经由消息收发客户端104的用户界面(UI)可用的功能来激活和控制消息收发系统100内的数据交换。
现在具体地转至消息收发服务器系统108,应用程序接口(API)服务器116耦接至应用服务器114并且向应用服务器114提供编程接口。应用服务器114通信地耦接至数据库服务器120,数据库服务器120有助于对数据库126进行访问,数据库126存储与由应用服务器114处理的消息相关联的数据。类似地,web服务器128耦接至应用服务器114,并且向应用服务器114提供基于web的接口。为此,web服务器128通过超文本传输协议(HTTP)和若干其他相关协议来处理传入的网络请求。
应用程序接口(API)服务器116在客户端装置102与应用服务器114之间接收和发送消息数据(例如,命令和消息有效载荷)。具体地,应用程序接口(API)服务器116提供一组接口(例如,例程和协议),所述一组接口可以由消息收发客户端104调用或查询以激活应用服务器114的功能。应用程序接口(API)服务器116公开由应用服务器114支持的各种功能,包括:账户注册;登录功能;经由应用服务器114从特定消息收发客户端104向另一消息收发客户端104发送消息,从消息收发客户端104向消息收发服务器118发送媒体文件(例如,图像或视频),以及供另一消息收发客户端104的可能访问;设置媒体数据的集合(例如,故事);检索客户端装置102的用户的朋友列表;检索这样的集合;检索消息和内容;对实体图(例如,社交图)添加和删除实体(例如,朋友);定位社交图内的朋友;以及打开应用事件(例如,与消息收发客户端104有关)。
应用服务器114托管多个服务器应用和子系统,包括例如消息收发服务器118、图像处理服务器122以及社交网络服务器124。消息收发服务器118实现多个消息处理技术和功能,特别地涉及对从消息收发客户端104的多个实例接收的消息中包括的内容(例如,文本和多媒体内容)的聚合和其他处理。如将进一步详细描述的,来自多个源的文本和媒体内容可以被聚合成内容的集合(例如,被称为故事或图库)。然后,使这些集合对消息收发客户端104可用。鉴于对数据的其他处理器和存储器密集处理的硬件要求,也可以由消息收发服务器118在服务器侧执行这样的处理。
应用服务器114还包括图像处理服务器122,图像处理服务器122专用于通常针对从消息收发服务器118处发送或在消息收发服务器118处接收的消息的有效载荷内的图像或视频执行各种图像处理操作。
社交网络服务器124支持各种社交联网功能和服务,并且使这些功能和服务可用于消息收发服务器118。为此,社交网络服务器124维护并访问数据库126内的实体图308(如图3所示)。由社交网络服务器124支持的功能和服务的示例包括标识消息收发系统100中与特定用户有关系或该特定用户正“关注”的其他用户,并且还包括标识特定用户的兴趣和其他实体。
返回到消息收发客户端104,外部资源(例如,应用106或小程序)的特征和功能经由消息收发客户端104的接口对用户可用。在该上下文中,“外部”是指应用106或小程序在消息收发客户端104外部的事实。外部资源通常由第三方提供,但也可以由消息收发客户端104的创建者或提供者提供。消息收发客户端104接收对启动或访问这样的外部资源的特征的选项的用户选择。外部资源可以是安装在客户端装置102上的应用106(例如,“本地app”)、或者托管在客户端装置102上或位于客户端装置102的远端(例如,在第三方服务器110上)的应用的小规模版本(例如,“小程序”)。应用的小规模版本包括应用的特征和功能的子集(例如,应用的全规模本地版本),并且使用标记语言文档来实现。在一个示例中,应用的小规模版本(例如,“小程序”)是应用的基于web的标记语言版本,并且嵌入在消息收发客户端104中。除了使用标记语言文档(例如,.*ml文件)之外,小程序可以包括脚本语言(例如,.*js文件或.json文件)和样式表(例如,.*ss文件)。
响应于接收到对启动或访问外部资源的特征的选项的用户选择,消息收发客户端104确定所选择的外部资源是基于web的外部资源还是本地安装的应用106。在一些情况下,本地安装在客户端装置102上的应用106可以例如通过在客户端装置102的主页画面上选择与应用106对应的图标而独立于消息收发客户端104并且与消息收发客户端104分开启动。可以经由消息收发客户端104启动或访问这样的应用的小规模版本,并且在一些示例中,小规模应用的任何部分都不能(或者有限部分才能)在消息收发客户端104之外被访问。可以通过消息收发客户端104例如从第三方服务器110接收与小规模应用相关联的标记语言文档并处理这样的文档来启动小规模应用。
响应于确定外部资源是本地安装的应用106,消息收发客户端104指示客户端装置102通过执行与外部资源对应的本地存储的代码来启动外部资源。响应于确定外部资源是基于web的资源,消息收发客户端104与(例如)第三方服务器110通信以获得与所选择的外部资源对应的标记语言文档。消息收发客户端104然后处理所获得的标记语言文档以在消息收发客户端104的用户界面内呈现基于web的外部资源。
消息收发客户端104可以向客户端装置102的用户或与这样的用户有关的其他用户(例如,“朋友”)通知在一个或更多个外部资源中发生的活动。例如,消息收发客户端104可以向消息收发客户端104中的对话(例如,聊天会话)中的参与者提供如下通知,所述通知与由用户群组中的一个或更多个成员对外部资源的当前或最近使用有关。可以邀请一个或更多个用户加入活跃的外部资源或者启动最近使用但当前不活跃的(在该朋友群组中)的外部资源。外部资源可以向对话中的参与者——使用相应消息收发客户端104的每个参与者提供与进入聊天会话中的用户群组中的一个或更多个成员共享外部资源中的项、状况、状态或位置的能力。共享项可以是交互式聊天卡,聊天的成员可以利用该交互式聊天卡进行交互,例如,以启动对应的外部资源,查看外部资源内的特定信息,或将聊天的成员带至外部资源内的特定位置或状态。在给定的外部资源内,可以在消息收发客户端104上向用户发送响应消息。外部资源可以基于外部资源的当前上下文在响应中选择性地包括不同的媒体项。
消息收发客户端104可以向用户呈现可用外部资源(例如,应用106或小程序)的列表以启动或访问给定的外部资源。该列表可以呈现在上下文相关菜单中。例如,表示应用106(或小程序)的不同应用(或小程序)的图标可以基于用户如何启动菜单(例如,从对话界面或从非对话界面)而变化。
系统架构
图2是示出根据一些示例的关于消息收发系统100的另外的细节的框图。具体地,消息收发系统100被示出为包括消息收发客户端104和应用服务器114。消息收发系统100包含多个子系统,所述子系统在客户端侧由消息收发客户端104支持并且在服务器侧由应用服务器114支持。这些子系统包括例如短暂定时器系统202、集合管理系统204、增强系统208、地图系统210、游戏系统212、和外部资源系统214。
短暂定时器系统202负责实施消息收发客户端104和消息收发服务器118对内容的临时或时间受限访问。短暂定时器系统202并入了多个定时器,所述定时器基于与消息或消息的集合(例如,故事)相关联的持续时间和显示参数,选择性地实现经由消息收发客户端104访问(例如,用于呈现和显示)消息和相关联的内容。下面提供关于短暂定时器系统202的操作的另外的细节。
集合管理系统204负责管理媒体的集和集合(例如,文本、图像视频和音频数据的集合)。内容(例如,消息,包括图像、视频、文本和音频)的集合可以被组织成“事件图库”或“事件故事”。可以使这样的集合在指定时间段例如在与内容有关的事件的持续时间内可用。例如,可以使与音乐会有关的内容在该音乐会的持续时间内作为“故事”可用。集合管理系统204还可以负责向消息收发客户端104的用户界面发布提供存在特定集合的通知的图标。
此外,集合管理系统204包括使得集合管理器能够管理和策展特定内容集合的策展接口206。例如,策展接口206使得事件组织者能够策展与特定事件有关的内容的集合(例如,删除不适当的内容或冗余消息)。另外,集合管理系统204采用机器视觉(或图像识别技术)和内容规则来自动地策展内容集合。在某些示例中,可以为将用户生成的内容包括到集合中而向用户支付补偿。在这样的情况下,集合管理系统204进行操作以自动地为使用这样的用户的内容而向其进行支付。
增强系统208提供使得用户能够增强(例如,注解或以其他方式修改或编辑)与消息相关联的媒体内容的各种功能。例如,增强系统208提供与生成和发布用于由消息收发系统100处理的消息的媒体叠加有关的功能。增强系统208基于客户端装置102的地理定位可操作地向消息收发客户端104供应媒体叠加或增强(例如,图像过滤器)。在另一示例中,增强系统208基于诸如客户端装置102的用户的社交网络信息的其他信息可操作地向消息收发客户端104供应媒体叠加。媒体叠加可以包括音频内容和视觉内容以及视觉效果。音频内容和视觉内容的示例包括图片、文本、徽标、动画和声音效果。视觉效果的示例包括颜色叠加。音频内容和视觉内容或视觉效果可以被应用于客户端装置102处的媒体内容项(例如,照片)。例如,媒体叠加可以包括可以叠加在由客户端装置102拍摄的照片之上的文本或图像。在另一示例中,媒体叠加包括位置标识叠加(例如,威尼斯海滩)、实况事件名称或商家名称叠加(例如,海滩咖啡馆)。在另一示例中,增强系统208使用客户端装置102的地理定位来标识包括客户端装置102的地理定位处的商家名称的媒体叠加。媒体叠加可以包括与商家相关联的其他标记。媒体叠加可以被存储在数据库126中并通过数据库服务器120访问。
在一些示例中,增强系统208提供基于用户的发布平台,该基于用户的发布平台使得用户能够选择地图上的地理定位,并且上传与所选择的地理定位相关联的内容。用户还可以指定应当向其他用户提供特定媒体叠加的环境。增强系统208生成包括上传的内容的媒体叠加并且将上传的内容与选择的地理定位相关联。
在其他示例中,增强系统208提供基于商家的发布平台,该基于商家的发布平台使得商家能够经由出价过程来选择与地理定位相关联的特定媒体叠加。例如,增强系统208将最高出价商家的媒体叠加与对应地理定位相关联达预定义时间量。
地图系统210提供各种地理位置功能,并且支持由消息收发客户端104呈现基于地图的媒体内容和消息。例如,地图系统210使得能够在地图上显示(例如,存储在简档数据316中的)用户图标或化身,以在地图的上下文中指示用户的“朋友”的当前位置或过去位置以及由这样的朋友生成的媒体内容(例如,包括照片和视频的消息的集合)。例如,可以在消息收发客户端104的地图界面上将用户从特定地理位置发布至消息收发系统100的消息在地图的该特定位置的上下文内显示给特定用户的“朋友”。用户还可以经由消息收发客户端104与消息收发系统100的其他用户(例如,使用适当的状态化身)共享他或她的位置和状态信息,其中,该位置和状态信息在消息收发客户端104的地图界面的上下文内被类似地显示给所选择的用户。
游戏系统212在消息收发客户端104的上下文中提供各种游戏功能。消息收发客户端104提供游戏界面,该游戏界面提供可用游戏的列表,该游戏可以由用户在消息收发客户端104的上下文中启动并与消息收发系统100的其他用户一起玩。消息收发系统100还使得特定用户能够通过从消息收发客户端104向其他用户发出邀请来邀请这样的其他用户参与玩特定游戏。消息收发客户端104还支持在玩游戏的上下文中的语音消息收发和文本消息收发(例如,聊天)两者,提供游戏的排行榜,并且还支持提供游戏内奖励(例如,游戏币和物品)。
外部资源系统214为消息收发客户端104提供接口以与远程服务器(例如,第三方服务器110)进行通信以启动或访问外部资源即应用或小程序。每个第三方服务器110托管例如基于标记语言(例如,HTML5)的应用或应用的小规模版本(例如,游戏应用、实用程序应用、支付应用或乘坐共享应用)。消息收发客户端104可以通过从与基于web的资源相关联的第三方服务器110访问HTML5文件来启动基于web的资源(例如,应用)。在某些示例中,利用由消息收发服务器118提供的软件开发工具包(SDK)以JavaScript对由第三方服务器110托管的应用进行编程。SDK包括应用程序接口(API),该API具有可以由基于web的应用调用或激活的功能。在某些示例中,消息收发服务器118包括JavasScript库,该库提供对消息收发客户端104的某些用户数据的给定外部资源访问。HTML5被用作用于编程游戏的示例技术,但是可以使用基于其他技术编程的应用和资源。
为了将SDK的功能集成到基于web的资源中,SDK由第三方服务器110从消息收发服务器118下载,或者由第三方服务器110以其他方式接收。一旦被下载或接收,SDK被包括作为基于web的外部资源的应用代码的一部分。基于web的资源的代码然后可以调用或激活SDK的某些功能以将消息收发客户端104的特征集成到基于web的资源中。
存储在消息收发服务器118上的SDK有效地提供外部资源(例如,应用106或小应用)与消息收发客户端104之间的桥接。这为用户提供了与消息收发客户端104上的其他用户通信的无缝体验,同时还保留了消息收发客户端104的外观和感觉。为了桥接外部资源与消息收发客户端104之间的通信,在某些示例中,SDK有助于第三方服务器110与消息收发客户端104之间的通信。在某些示例中,在客户端装置102上运行的WebViewJavaScriptBridge在外部资源与消息收发客户端104之间建立两个单向通信信道。消息经由这些通信信道在外部资源与消息收发客户端104之间异步发送。每个SDK功能激活被作为消息和回调来发送。通过构造唯一的回调标识符并且发送具有该回调标识符的消息来实现每个SDK函数。
通过使用SDK,并非来自消息收发客户端104的所有信息都与第三方服务器110共享。SDK基于外部资源的需要来限制共享哪些信息。在某些示例中,每个第三方服务器110向消息收发服务器118提供与基于web的外部资源对应的HTML5文件。消息收发服务器118可以在消息收发客户端104中添加基于web的外部资源的视觉表示(例如盒设计或其他图形)。一旦用户选择视觉表示或通过消息收发客户端104的GUI指示消息收发客户端104访问基于web的外部资源的特征,则消息收发客户端104获得HTML5文件并且对访问基于web的外部资源的特征所需的资源进行实例化。
消息收发客户端104呈现用于外部资源的图形用户界面(例如,登录页面或标题画面)。在呈现登录页面或标题画面期间、之前或之后,消息收发客户端104确定所启动的外部资源是否先前已被授权访问消息收发客户端104的用户数据。响应于确定所启动的外部资源先前已被授权访问消息收发客户端104的用户数据,消息收发客户端104呈现外部资源的另一图形用户界面,该另一图形用户界面包括外部资源的功能和特征。响应于确定所启动的外部资源先前未被授权访问消息收发客户端104的用户数据,在显示外部资源的登录页面或标题画面的阈值时间段(例如,3秒)之后,消息收发客户端104向上滑动(例如,将菜单动画化为从画面底部浮现到画面中间或其他部分)用于授权外部资源访问用户数据的菜单。该菜单标识外部资源将被授权使用的用户数据的类型。响应于接收到对接受选项的用户选择,消息收发客户端104将外部资源添加至被授权的外部资源的列表,并且使得外部资源能够访问来自消息收发客户端104的用户数据。在一些示例中,外部资源由消息收发客户端104根据OAuth 2框架授权访问用户数据。
消息收发客户端104基于被授权的外部资源的类型来控制与外部资源共享的用户数据的类型。例如,向包括全规模应用(例如,应用106)的外部资源提供对第一类型的用户数据(例如,具有或不具有不同化身特性的用户的仅二维化身)的访问。作为另一示例,向包括应用的小规模版本(例如,应用的基于web的版本)的外部资源提供对第二类型的用户数据(例如,支付信息、用户的二维化身、用户的三维化身、以及具有各种化身特性的化身)的访问。化身特性包括定制化身的外观和感觉(例如,不同姿势、面部特征、服装等)的不同方式。
数据架构
图3是示出根据某些示例的可以存储在消息收发服务器系统108的数据库126中的数据结构300的示意图。虽然数据库126的内容被示出为包括多个表,但是将认识到,可以以其他类型的数据结构来存储数据(例如,存储为面向对象的数据库)。
数据库126包括存储在消息表302内的消息数据。对于任何特定的一条消息,该消息数据至少包括消息发送者数据、消息接收方(或接收者)数据和有效载荷。下面参照图4描述关于可以被包括在消息中并且被包括在存储在消息表302中的消息数据内的信息的另外的细节。
实体表306存储实体数据,并且(例如,参考地)链接至实体图308和简档数据316。其记录保持在实体表306内的实体可以包括个人、公司实体、组织、对象、地点、事件等。不管实体类型如何,消息收发服务器系统108存储关于其的数据的任何实体可以是识别的实体。每个实体设置有唯一标识符以及实体类型标识符(未示出)。
实体图308存储关于实体之间的关系和关联的信息。仅作为示例,这样的关系可以是社会的、职业的(例如,在共同的公司或组织工作)、基于兴趣的或者基于活动的。
简档数据316存储关于特定实体的多种类型的简档数据。基于由特定实体指定的隐私设置,简档数据316可以被选择性地使用并呈现给消息收发系统100的其他用户。在实体是个人的情况下,简档数据316包括例如用户名、电话号码、地址、设置(例如,通知和隐私设置)以及用户所选择的化身表示(或这样的化身表示的集合)。然后,特定用户可以将这些化身表示中的一个或更多个选择性地包括在经由消息收发系统100传送的消息的内容内以及由消息收发客户端104向其他用户显示的地图界面上。化身表示的集合可以包括“状态化身”,其呈现用户可以选择在特定时间传送的状态或活动的图形表示。
在实体是团体的情况下,除了团体名称、成员以及针对相关团体的各种设置(例如,通知)之外,针对团体的简档数据316还可以类似地包括与团体相关联的一个或更多个化身表示。
数据库126还在增强表310中存储增强数据,例如叠加(overlay)或过滤器(filters)。增强数据与视频(视频的数据存储在视频表304中)和图像(图像的数据存储在图像表312中)相关联并且被应用于视频和图像。
在一个示例中,过滤器是在向接收方用户呈现期间被显示为叠加在图像或视频上的叠加。过滤器可以是各种类型,包括当发送用户正在编写消息时来自由消息收发客户端104呈现给发送用户的一组过滤器的用户选择的过滤器。其他类型的过滤器包括地理定位过滤器(也称为地理过滤器),所述地理定位过滤器可以基于地理位置被呈现给发送用户。例如,可以基于由客户端装置102的全球定位系统(GPS)单元确定的地理定位信息,由消息收发客户端104在用户界面内呈现特定于附近或特殊位置的地理定位过滤器。
另一种类型的过滤器是数据过滤器,所述数据过滤器可以由消息收发客户端104基于在消息创建过程期间由客户端装置102收集的其他输入或信息选择性地呈现给发送用户。数据过滤器的示例包括特定位置处的当前温度、发送用户行进的当前速度、客户端装置102的电池寿命或当前时间。
可以存储在图像表312内的其他增强数据包括增强现实内容项(例如,对应于应用镜头或增强现实体验)。增强现实内容项可以是可以添加至图像或视频的实时特效和声音。
如上所述,增强数据包括增强现实内容项、叠加、图像变换、AR图像以及指代可以应用于图像数据(例如,视频或图像)的修改的类似术语。这包括实时修改,其在使用客户端装置102的装置传感器(例如,一个或多个摄像装置)捕获图像时对该图像进行修改以及然后在客户端装置102的屏幕上显示具有修改的图像。这还包括对所存储的内容——例如图库中的可以被修改的视频剪辑——的修改。例如,在访问多个增强现实内容项的客户端装置102中,用户可以将单个视频剪辑与多个增强现实内容项一起使用来查看不同的增强现实内容项将如何修改存储的剪辑。例如,通过针对同一内容选择不同的增强现实内容项,可以将应用不同伪随机运动模型的多个增强现实内容项应用于该同一内容。类似地,可以将实时视频捕获与示出的修改一起使用,以示出客户端装置102的传感器当前正捕获的视频图像将如何修改捕获的数据。这样的数据可以仅显示在屏幕上而不存储在存储器中,或者由装置传感器捕获的内容可以在进行或不进行修改(或两者)的情况下被记录并存储在存储器中。在一些系统中,预览特征可以示出不同的增强现实内容项同时在显示器中的不同窗口内看起来如何。例如,这可以使得能够同时在显示器上查看具有不同伪随机动画的多个窗口。
因此,使用增强现实内容项的数据和各种系统或使用该数据来修改内容的其他这样的变换系统可以涉及:对视频帧中对象(例如,面部、手、身体、猫、狗、表面、对象等)的检测;在这样的对象离开视场、进入视场以及在视场四处移动时对其的跟踪;以及在跟踪这样的对象时对其的修改或变换。在各种示例中,可以使用用于实现这样的变换的不同方法。一些示例可以涉及生成一个或多个对象的三维网格模型,以及在视频内使用模型的变换和动画纹理来实现变换。在其他示例中,可以使用对对象上的点的跟踪来将图像或纹理(其可以是二维或三维的)放置在所跟踪的位置处。在另外的示例中,可以使用视频帧的神经网络分析来将图像、模型或纹理放置在内容(例如,图像或视频帧)中。因此,增强现实内容项既指代用于在内容中创建变换的图像、模型和纹理,又指代利用对象检测、跟踪和放置来实现这样的变换所需的附加建模和分析信息。
可以利用保存在任何种类的计算机化系统的存储器中的任何种类的视频数据(例如,视频流、视频文件等)来执行实时视频处理。例如,用户可以加载视频文件并将其保存在装置的存储器中,或者可以使用装置的传感器生成视频流。另外,可以使用计算机动画模型来处理任何对象,例如人的面部和人体的各部位、动物或非生物(例如,椅子、汽车或其他对象)。
在一些示例中,当连同要变换的内容一起选择特定修改时,由计算装置标识要变换的元素,并且然后如果要变换的元素存在于视频的帧中,则检测并跟踪要变换的元素。根据关于修改的请求来修改对象的元素,因此变换视频流的帧。对于不同种类的变换,可以通过不同的方法执行对视频流的帧的变换。例如,对于主要是指改变对象的元素的形式的帧变换,计算对象的每个元素的特性点(例如,使用主动形状模型(Active Shape Model,ASM)或其他已知方法)。然后,针对对象的至少一个元素中的每一个生成基于特性点的网格。该网格被用于在视频流中跟踪对象的各元素的后续阶段。在跟踪过程中,所提及的针对每个元素的网格与每个元素的位置对准。然后,在网格上生成附加点。基于修改请求针对每个元素生成第一组第一点,并且基于该组第一点以及修改请求针对每个元素生成一组第二点。然后,可以通过基于一组第一点、一组第二点和网格修改对象的元素来对视频流的帧进行变换。在这样的方法中,也可以通过跟踪和修改背景来使所修改的对象的背景改变或发生扭曲。
在一些示例中,可以通过计算对象的每个元素的特性点并基于所计算的特性点生成网格来执行使用对象的元素改变对象的一些区域的变换。在网格上生成点,并且然后生成基于这些点的各种区域。然后通过将每个元素的区域与至少一个元素中的每个元素的位置对准来跟踪对象的元素,并且可以基于关于修改的请求来修改区域的特性,从而对视频流的帧进行变换。根据具体的关于修改的请求,可以以不同的方式来变换所提及的区域的属性。这样的修改可以涉及:改变区域的颜色;从视频流的帧中移除至少部分区域;将一个或更多个新对象包括在基于关于修改的请求的区域中;以及对区域或对象的元素进行修改或使其发生扭曲。在各种示例中,可以使用这样的修改或其他类似修改的任何组合。对于要被动画化的某些模型,可以选择一些特性点作为控制点,以用于确定用于模型动画的选项的整个状态空间。
在使用面部检测来变换图像数据的计算机动画模型的一些示例中,利用特定面部检测算法(例如,Viola-Jones)在图像上检测面部。然后,将主动形状模型(ASM)算法应用于图像的面部区域以检测面部特征参考点。
可以使用适用于面部检测的其他方法和算法。例如,在一些示例中,使用界标来定位特征,该界标表示在所考虑的大多数图像中存在的可区分点。例如,对于面部界标,可以使用左眼瞳孔的位置。如果初始界标不可标识(例如,如果人具有眼罩),则可以使用次级界标。这样的界标标识过程可以被用于任何这样的对象。在一些示例中,一组界标形成形状。可以使用形状中的点的坐标将形状表示为矢量。利用使形状点之间的平均欧几里德距离最小化的相似变换(允许平移、缩放和旋转)将一个形状与另一形状对准。均值形状(meanshape)是经对准的训练形状的均值。
在一些示例中,从与由全局面部检测器确定的面部的位置和大小对准的均值形状开始搜索界标。然后,这样的搜索重复以下步骤:通过每个点周围的图像纹理的模板匹配对形状点的位置进行调整来建议暂定形状,并且然后使暂定形状符合全局形状模型,直至发生收敛。在一些系统中,单独模板匹配是不可靠的,并且形状模型对弱模板匹配的结果进行池化,以形成较强的整体分类器。整个搜索从粗略分辨率到精细分辨率在图像金字塔的每一级处重复。
变换系统可以在客户端装置(例如,客户端装置102)上捕获图像或视频流,并且在客户端装置102上本地执行复杂的图像操纵,同时保持适当的用户体验、计算时间和功率消耗。复杂的图像操纵可以包括大小和形状改变、情绪转换(例如,将面部从皱眉变为微笑)、状态转换(例如,使对象变老、减小表观年龄、改变性别)、风格转换、图形元素应用以及由已经被配置成在客户端装置102上高效地执行的卷积神经网络实现的任何其他合适的图像或视频操纵。
在一些示例中,用于变换图像数据的计算机动画模型可以由下述系统使用:在该系统中,用户可以使用具有作为在客户端装置102上操作的消息收发客户端104的一部分而操作的神经网络的客户端装置102来捕获用户的图像或视频流(例如,自拍)。在消息收发客户端104内操作的变换系统确定图像或视频流内的面部的存在,并且提供与计算机动画模型相关联的修改图标以变换数据图像,或者计算机动画模型可以与本文中描述的界面相关联地存在。修改图标包括下述改变:该改变可以是作为修改操作的一部分的用于修改图像或视频流内的用户的面部的基础。一旦选择了修改图标,则变换系统发起将用户的图像转换以反映选择的修改图标(例如,在用户上生成笑脸)的过程。一旦图像或视频流被捕获并且指定的修改被选择,则经修改的图像或视频流可以呈现在客户端装置102上显示的图形用户界面中。变换系统可以在图像或视频流的一部分上实现复杂的卷积神经网络,以生成和应用选择的修改。即,用户可以捕获图像或视频流并且一旦修改图标被选择,修改结果就被实时或接近实时地呈现给用户。此外,当正在捕获视频流时,修改可以是持久的,并且选择的修改图标保持被切换。机器教导的神经网络可以被用于实现这样的修改。
呈现由变换系统执行的修改的图形用户界面可以向用户提供附加的交互选项。这样的选项可以基于用于发起特定计算机动画模型的选择和内容捕获的界面(例如,从内容创建者用户界面发起)。在各种示例中,在对修改图标进行初始选择之后,修改可以是持久的。用户可以通过轻击或以其他方式选择正由变换系统修改的面部来切换以开启或关闭修改,并将其存储以供稍后查看或浏览到成像应用的其他区域。在通过变换系统修改多个面部的情况下,用户可以通过轻击或选择图形用户界面内修改和显示的单个面部来全局地切换以开启或关闭修改。在一些示例中,可以单独地修改一组多个面部中的各个面部,或者可以通过轻击或选择图形用户界面内显示的各个面部或一系列各个面部来单独切换这样的修改。
故事表314存储关于消息和相关联的图像、视频或音频数据的集合的数据,所述消息和相关联的图像、视频或音频数据被汇编成集合(例如,故事或图库)。特定集合的创建可以由特定用户(例如,针对其的记录被维护在实体表306中的每个用户)发起。用户可以以已由该用户创建和发送/广播的内容集合的形式创建“个人故事”。为此,消息收发客户端104的用户界面可以包括用户可选择的图标,以使得发送用户能够将特定内容添加至他或她的个人故事。
集合还可以构成“实况故事”,该“实况故事”是手动地、自动地或使用手动技术和自动技术的组合创建的来自多个用户的内容的集合。例如,“实况故事”可以构成来自各种位置和事件的用户提交的内容的策划流。可以例如经由消息收发客户端104的用户界面向其客户端装置启用了位置服务并且在特定时间处于共同位置事件处的用户呈现将内容贡献给特定实况故事的选项。可以由消息收发客户端104基于用户的位置向他或她标识实况故事。最终结果是从群体角度讲述的“实况故事”。
另一种类型的内容集合被称为“位置故事”,该“位置故事”使得其客户端装置102位于特定地理位置(例如,在学院或大学校园)内的用户能够对特定集合做出贡献。在一些示例中,对位置故事的贡献可能需要二级认证来验证最终用户属于特定组织或其他实体(例如,是大学校园中的学生)。
如以上提及的,视频表304存储视频数据,在一个示例中,该视频数据与其记录被保持在消息表302内的消息相关联。类似地,图像表312存储与其消息数据存储在实体表306中的消息相关联的图像数据。实体表306可以将来自增强表310的各种增强与存储在图像表312和视频表304中的各种图像和视频相关联。
数据通信架构
图4是示出根据一些示例的消息400的结构的示意图,该消息400由消息收发客户端104生成,以传送至另外的消息收发客户端104或消息收发服务器118。特定消息400的内容被用于填充存储在可由消息收发服务器118访问的数据库126内的消息表302。类似地,消息400的内容作为客户端装置102或应用服务器114的“运输中(in-transit)”或“飞行中(in-flight)”数据存储在存储器中。消息400被示出为包括以下示例组成部分:
·消息标识符402:标识消息400的唯一标识符。
·消息文本有效载荷404:要由用户经由客户端装置102的用户界面生成并且包括在消息400中的文本。
·消息图像有效载荷406:由客户端装置102的摄像装置部件捕获或从客户端装置102的存储器部件检索并且包括在消息400中的图像数据。针对发送或接收的消息400的图像数据可以存储在图像表312中。
·消息视频有效载荷408:由摄像装置部件捕获或者从客户端装置102的存储器部件检索并且包括在消息400中的视频数据。针对发送或接收的消息400的视频数据可以存储在视频表304中。
·消息音频有效载荷410:由麦克风捕获或从客户端装置102的存储器部件检索并且包括在消息400中的音频数据。
·消息增强数据412:表示要应用于消息400的消息图像有效载荷406、消息视频有效载荷408或消息音频有效载荷410的增强的增强数据(例如,过滤器、标贴或其他注解或增强)。针对发送或接收的消息400的增强数据可以存储在增强表310中。
·消息持续时间参数414:以秒为单位指示消息的内容(例如,消息图像有效载荷406、消息视频有效载荷408、消息音频有效载荷410)要经由消息收发客户端104呈现给用户或使其对于用户可访问的时间量的参数值。
·消息地理定位参数416:与消息的内容有效载荷相关联的地理定位数据(例如,纬度坐标和经度坐标)。多个消息地理定位参数416值可以被包括在有效载荷中,这些参数值中的每一个关于内容中包括的内容项(例如,消息图像有效载荷406内的特定图像或者消息视频有效载荷408中的特定视频)相关联。
·消息故事标识符418:标识与消息400的消息图像有效载荷406中的特定内容项相关联的一个或更多个内容集合(例如,在故事表314中标识的“故事”)的标识符值。例如,可以使用标识符值将消息图像有效载荷406内的多个图像各自与多个内容集合相关联。
·消息标签420:每个消息400可以用多个标签来标记,所述多个标签中的每一个指示消息有效载荷中包括的内容的主题。例如,在消息图像有效载荷406中包括的特定图像描绘动物(例如,狮子)的情况下,标签值可以被包括在指示相关动物的消息标签420内。标签值可以基于用户输入手动地生成,或者可以使用例如图像识别自动地生成。
·消息发送者标识符422:指示在其上生成消息400并且从其发送消息400的客户端装置102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或装置标识符)。
·消息接收者标识符424:指示消息400寻址到的客户端装置102的用户的标识符(例如,消息收发系统标识符、电子邮件地址或装置标识符)。
消息400的各组成部分的内容(例如,值)可以是指向在其内存储内容数据值的表中的位置的指针。例如,消息图像有效载荷406中的图像值可以是指向图像表312内的位置的指针(或图像表312内的位置的地址)。类似地,消息视频有效载荷408内的值可以指向存储在视频表304内的数据,存储在消息增强412内的值可以指向存储在增强表310中的数据,存储在消息故事标识符418内的值可以指向存储在故事表314中的数据,并且存储在消息发送者标识符422和消息接收者标识符424内的值可以指向存储在实体表306内的用户记录。
图5示出了根据一个示例实施方式的可以在其中实现硬件编码器602的头部可穿戴设备500。图5示出了根据一个示例实施方式的头部可穿戴设备500的透视图。在图5中,头部可穿戴设备500是一副眼镜。在一些实施方式中,头部可穿戴设备500可以是太阳镜或护目镜。一些实施方式可以包括一个或更多个可穿戴装置,例如具有与头部可穿戴设备500或客户端装置102集成、通信或者耦接至头部可穿戴设备500或客户端装置102的集成式摄像装置的挂件。任何期望的可穿戴装置可以与本公开内容的实施方式结合使用,所述可穿戴装置例如手表、耳机、腕带、耳塞、衣服(例如具有集成电子装置的帽子或夹克)、夹式电子装置、或任何其他可穿戴装置。理解的是,尽管未示出,但包括在头部可穿戴设备500中的系统的一个或更多个部分可以被包括在可以与头部可穿戴设备500结合使用的客户端装置102(例如,图10中的机器1004)中。
在图5中,头部可穿戴设备500是包括框架504的一副眼镜,该框架504包括镜框(或边框),所述镜框(或边框)经由铰链和/或端件分别耦接至两个柄部(或镜腿)。框架504的镜框承载或容纳一对镜头(例如,镜头508a和镜头508b)。框架504包括耦接至第一柄部的第一(例如,右)侧和耦接至第二柄部的第二(例如,左)侧。第一侧与框架504的第二侧相对。
头部可穿戴设备500还包括摄像装置模块(未示出),该摄像装置模块包括摄像装置镜头(例如,摄像装置镜头506a、摄像装置镜头506b)和至少一个图像传感器。摄像装置镜头506a和摄像装置镜头506b可以是透视摄像装置镜头或非透视摄像装置镜头。非透视摄像装置镜头可以是例如鱼眼镜头、广角镜头、全向镜头等。图像传感器通过摄像装置镜头506a和摄像装置镜头506b捕获数字视频。图像也可以是静止图像帧或包括多个静止图像帧的视频。摄像装置模块可以耦接至框架504。如图5中所示,框架504以使得摄像装置镜头(例如,摄像装置镜头506a、摄像装置镜头506b)面向前方的方式耦接至摄像装置镜头506a和摄像装置镜头506b。摄像装置镜头506a和摄像装置镜头506b可以垂直于镜头508a和镜头508b。摄像装置模块可以包括双前置摄像装置,所述双前置摄像装置以框架504的宽度或头部可穿戴设备500的用户的头部宽度分开。
在一些示例中,摄像装置模块是立体摄像装置系统。摄像装置镜头506a包括捕获右眼视角的第一图像传感器,以及摄像装置镜头506b包括捕获左眼视角的第二图像传感器。摄像装置模块可以通信地耦接至硬件编码器602(未示出)。
在图5中,两个柄部(或镜腿)分别耦接至麦克风壳体502a和麦克风壳体502b。第一柄部和第二柄部耦接至头部可穿戴设备500的框架504的相对侧。第一柄部耦接至第一麦克风壳体502a,而第二柄部耦接至第二麦克风壳体502b。麦克风壳体502a和麦克风壳体502b可以在框架504的位置与镜腿尖(temple tip)的位置之间耦接至柄部。当用户穿戴头部可穿戴设备500时,麦克风壳体502a和麦克风壳体502b可以位于用户的镜腿的任何一侧。
如图5中所示,麦克风壳体502a和麦克风壳体502b包裹多个麦克风(未示出)。麦克风是将声音转换成电信号的空气接口声音拾取装置。更具体地,麦克风是将声压转换成电信号(例如,声学信号)的换能器。麦克风可以是数字或模拟的微机电系统(MEMS)麦克风。由麦克风生成的声学信号可以是脉冲密度调制(PDM)信号。
图6是用于图像帧的立体拼接的硬件编码器502的示例图示。硬件编码器602可以是客户端装置102或头部可穿戴设备500的一部分。图6被示出为包括两个图像信号处理系统(ISP1 604、ISP2 606)和硬件编码器602。硬件编码器602接收来自第一图像处理系统604(例如,包括第一图像传感器的第一摄像装置镜头)的左帧608以及来自第二图像处理系统606(例如,包括第二图像传感器的第二摄像装置镜头)的右帧610。在一些示例中,左帧608和右帧610以YUV颜色编码格式(Y是意指物理线性空间亮度的亮度分量,U和V是色度分量,其中U是蓝色投影并且V是红色投影)进行编码。要理解的是,左帧608和右帧610可以以任何合适的图像编码格式进行编码。硬件编码器602被配置成接收一批输入缓冲以用于单个激活。例如,硬件编码器602同时接收左帧608和右帧610两者。硬件编码器生成单个拼接的编码器帧612。
尽管下面所描述的流程图可以将操作示出为顺序过程,但操作中的许多操作可以被并行或同时地执行。另外,可以对操作的顺序进行重新排列。处理在其操作完成时终止。处理可以对应于方法、程序、算法等。方法的操作可以被全部或部分执行,可以与其他方法中的操作中的一些或所有操作结合执行,并且可以由任意数目的不同系统(例如,本文中描述的系统)或其任何部分(例如,包括在系统中的任何一个中的处理器)执行。
图7示出了根据一个实施方式的用于使用硬件编码器502来对图像帧进行立体拼接的方法700的流程图。方法700的操作中的一些或全部操作可以由客户端装置102或头部可穿戴设备500上的硬件编码器502来执行。
在操作702处,方法700接收来自第一摄像装置镜头的第一图像数据和来自第二摄像装置镜头的第二图像数据。第一摄像装置镜头和第二摄像装置镜头可以是立体摄像装置系统的一部分。立体摄像装置系统可以是客户端装置102或头部可穿戴设备500的一部分。第一摄像装置镜头包括第一图像传感器,并且第二摄像装置镜头包括第二摄像装置镜头。第一图像数据和第二图像数据可以由硬件编码器同时接收。例如,硬件编码器可以被配置成接收一批输入缓冲以进行单个激活。
在操作704处,方法700处理第一图像数据和第二图像数据。例如,该处理可以包括使第一摄像装置镜头的曝光时间与第二摄像装置镜头的曝光时间同步。在操作706处,方法700基于经处理的第一图像数据和经处理的第二图像数据来生成单个拼接的编码帧。单个拼接的编码帧中的每个帧包括来自第一摄像装置镜头的对应图像帧以及来自第二摄像装置镜头的对应图像帧。
在一些示例中,单个拼接的编码帧被传送至客户端装置(例如,客户端装置102)。客户端装置102可以与用户的联系人(例如,头部可穿戴设备500的用户)相关联。用户的联系人可以是社交消息收发系统(例如,社交网络服务器124)内的联系人。联系人可以存储在头部可穿戴设备500上或服务器(例如,社交网络服务器124)上。
在一些示例中,单个拼接的编码帧被传送至消息收发服务器(例如,消息收发服务器系统108)。
软件架构
图8是示出软件架构804的框图800,该软件架构804可以安装在本文中描述的装置中的任何一个或更多个上。软件架构804由硬件例如包括处理器820、存储器826和I/O部件838的机器802支持。在该示例中,软件架构804可以被概念化为层的堆栈,其中每个层提供特定功能。软件架构804包括例如以下各层:操作系统812、库810、框架808和应用806。在操作上,应用806通过软件堆栈来激活API调用850并且响应于API调用850来接收消息852。
操作系统812管理硬件资源并且提供公共服务。操作系统812包括例如:内核814、服务816、和驱动器822。内核814用作硬件与其他软件层之间的抽象层。例如,内核814提供存储器管理、处理器管理(例如,调度)、部件管理、联网和安全设置等功能。服务816可以为其他软件层提供其他公共服务。驱动器822负责控制底层硬件或者与底层硬件接口。例如,驱动器822可以包括显示驱动器、摄像装置驱动器、或/>低功耗驱动器、闪存驱动器、串行通信驱动器(例如,USB驱动器)、/>驱动器、音频驱动器、电力管理驱动器等。
库810提供由应用806使用的公共低级基础设施。库810可以包括系统库818(例如,C标准库),所述系统库818提供诸如存储器分配功能、字符串操纵功能、数学功能等的功能。另外,库810可以包括API库824,例如媒体库(例如,用于支持各种媒体格式的呈现和操纵的库,所述各种媒体格式例如运动图像专家组-4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层-3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)或便携式网络图形(PNG))、图形库(例如,用于在显示器上的图形内容中以二维(2D)和三维(3D)呈现的OpenGL框架)、数据库库(例如,提供各种关系数据库功能的SQLite)、web库(例如,提供web浏览功能的WebKit)等。库810还可以包括各种其他库828,以向应用806提供许多其他API。
框架808提供由应用806使用的公共高级基础设施。例如,框架808提供各种图形用户界面(GUI)功能、高级资源管理和高级定位服务。框架808可以提供可以由应用806使用的广泛的其他API,其中一些可以专用于特定的操作系统或平台。
在示例中,应用806可以包括家庭应用836、联系人应用830、浏览器应用832、书籍阅读器应用834、位置应用842、媒体应用844、消息收发应用846、游戏应用848和各种各样的其他应用例如第三方应用840。应用806是执行程序中限定的功能的程序。可以采用各种编程语言来创建以各种方式构造的应用806中的一个或更多个,所述编程语言例如面向对象的编程语言(例如,Objective-C、Java或C++)或过程编程语言(例如,C语言或汇编语言)。在特定示例中,第三方应用840(例如,由特定平台的供应商以外的实体使用ANDROIDTM或IOSTM软件开发工具包(SDK)开发的应用)可以是在诸如IOSTM、ANDROIDTMPhone的移动操作系统或另一移动操作系统上运行的移动软件。在该示例中,第三方应用840可以激活由操作系统812提供的API调用850以便于本文中描述的功能。
机器架构
图9是机器900的图解表示,在该机器900内可以执行用于使机器900执行本文中讨论的方法中的任何一种或更多种方法的指令910(例如,软件、程序、应用、小程序、app或其他可执行代码)。例如,指令910可以使机器900执行本文中描述的方法中的任何一种或更多种方法。指令910将通用的未经编程的机器900转换成被编程为以所描述的方式执行所描述和所示出的功能的特定机器900。机器900可以作为独立装置操作,或者可以耦接(例如,联网)至其他机器。在联网部署中,机器900可以在服务器-客户端网络环境中以服务器机器或客户端机器的身份进行操作,或者在对等(或分布式)网络环境中作为对等机器进行操作。机器900可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动装置、可穿戴装置(例如,智能手表)、智能家居装置(例如,智能电器)、其他智能装置、web设备、网络路由器、网络交换机、网络桥接器或能够顺序地或以其他方式执行指定要由机器900采取的动作的指令910的任何机器。此外,虽然仅示出了单个机器900,但是术语“机器”还应当被视为包括单独地或联合地执行指令910以执行本文中讨论的方法中的任何一种或更多种方法的机器的集合。例如,机器900可以包括客户端装置1004或者形成消息收发服务器系统108(已删除)的一部分的多个服务器装置中的任何一个。在一些示例中,机器900还可以包括客户端系统和服务器系统两者,其中特定方法或算法的某些操作在服务器侧执行,并且所述特定方法或算法的某些操作在客户端侧执行。
机器900可以包括可以被配置成经由总线940彼此通信的处理器904、存储器906和输入/输出I/O部件902。在示例中,处理器904(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、另外的处理器或其任何合适的组合)可以包括例如执行指令910的处理器908和处理器912。术语“处理器”旨在包括多核处理器,所述多核处理器可以包括可以同时执行指令的两个或更多个独立处理器(有时被称为“核”)。尽管图9示出了多个处理器904,但是机器900可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器、或者其任何组合。
存储器906包括主存储器914、静态存储器916和存储单元918,均可由处理器904经由总线940访问。主存储器906、静态存储器916和存储单元918存储实施本文中描述的方法或功能中的任何一个或更多个方法或功能的指令910。指令910还可以在其由机器900执行期间完全地或部分地驻留在主存储器914内、静态存储器916内、存储单元918内的机器可读介质920内、处理器904中的至少一个处理器内(例如,在处理器的高速缓存存储器内)或者其任何合适的组合内。
I/O部件902可以包括用于接收输入、提供输出、产生输出、传送信息、交换信息、捕获测量结果等的各种部件。特定机器中包括的特定I/O部件902将取决于机器的类型。例如,诸如移动电话的便携式机器可以包括触摸输入装置或其他这样的输入机构,而无头服务器机器将不太可能包括这样的触摸输入装置。应当认识到,I/O部件902可以包括图9中未示出的许多其他部件。在各种示例中,I/O部件902可以包括用户输出部件926和用户输入部件928。用户输出部件926可以包括视觉部件(例如,诸如等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT)的显示器)、声学部件(例如,扬声器)、触觉部件(例如,振动马达、阻力机构)、其他信号生成器等。用户输入部件928可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光学键盘或其他字母数字输入部件)、基于点的输入部件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向仪器)、触感输入部件(例如,物理按钮、提供触摸或触摸姿势的位置和力的触摸屏或其他触感输入部件)、音频输入部件(例如,麦克风)等。
在其他示例中,I/O部件902可以包括生物识别部件930、运动部件932、环境部件934或位置部件936以及各种其他部件。例如,生物识别部件930包括用于检测表达(例如,手表达、面部表达、声音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、出汗或脑波)、识别人(例如,声音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的部件。运动部件932包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)。
环境部件934包括例如一个或更多个摄像装置(具有静止图像/照片和视频能力)、照明传感器部件(例如,光度计)、温度传感器部件(例如,检测环境温度的一个或更多个温度计)、湿度传感器部件、压力传感器部件(例如,气压计)、声学传感器部件(例如,检测背景噪声的一个或更多个麦克风)、接近传感器部件(例如,检测附近对象的红外传感器)、气体传感器(例如,用于出于安全而检测危险气体的浓度或用于测量大气中的污染物的气体检测传感器)或者可以提供与周围物理环境对应的指示、测量或信号的其他部件。
关于摄像装置,客户端装置1004可以具有摄像装置系统,该摄像装置系统包括例如在客户端装置1004的前表面上的前置摄像装置以及客户端装置1004的后表面上的后置摄像装置。前置摄像装置可以例如用于捕获客户端装置1004的用户的静止图像和视频(例如,“自拍”),然后该静止图像和视频可以用上述增强数据(例如,过滤器)进行增强。例如,后置摄像装置可以用于以更传统的摄像装置模式捕获静止图像和视频,其中这些图像类似地用增强数据进行增强。除了前置摄像装置和后置摄像装置之外,客户端装置1004还可以包括用于捕获360°照片和视频的360°摄像装置。
此外,客户端装置1004的摄像装置系统可以包括双后置摄像装置(例如,主摄像装置以及深度感测摄像装置),或者甚至在客户端装置1004的前侧和后侧上包括三重、四重或五重后置摄像装置配置。例如,这些多摄像装置系统可以包括广角摄像装置、超广角摄像装置、长焦摄像装置、微距摄像装置和深度传感器。
位置部件936包括定位传感器部件(例如,GPS接收器部件)、海拔传感器部件(例如,检测气压的高度计或气压计,根据气压可以得到海拔)、取向传感器部件(例如,磁力计)等。
可以使用各种技术来实现通信。I/O部件902还包括通信部件938,该通信部件938可操作成经由相应的耦接或连接将机器900耦接至网络922或装置924。例如,通信部件938可以包括与网络922接口的网络接口部件或另一合适的装置。在另外的示例中,通信部件938可以包括有线通信部件、无线通信部件、蜂窝通信部件、近场通信(NFC)部件、部件(例如,/>低功耗)、/>部件以及经由其他模态提供通信的其他通信部件。装置924可以是另一机器或各种外围设备中的任何外围装置(例如,经由USB耦接的外围装置)。
此外,通信部件938可以检测标识符,或者包括可操作成检测标识符的部件。例如,通信部件938可以包括射频识别(RFID)标签阅读器部件、NFC智能标签检测部件、光学阅读器部件(例如,用于检测诸如通用产品码(UPC)条形码的一维条形码、诸如快速响应(QR)码的多维条形码、Aztec码、数据矩阵、数据符号(Dataglyph)、最大码(MaxiCode)、PDF417、超码(Ultra Code)、UCC RSS-2D条形码和其他光学码的光学传感器)或者声学检测部件(例如,用于识别标记的音频信号的麦克风)。另外,可以经由通信部件938得到各种信息,例如经由因特网协议(IP)地理定位得到定位、经由信号三角测量得到定位、经由检测可以指示特定定位的NFC信标信号得到定位等。
各种存储器(例如,主存储器914、静态存储器916以及处理器904的存储器)以及存储单元918可以存储由本文中描述的方法或功能中的任何一个或更多个方法或功能实施或使用的一组或更多组指令和数据结构(例如,软件)。这些指令(例如,指令910)在由处理器904执行时使各种操作实现所公开的示例。
可以经由网络接口设备(例如,通信部件938中包括的网络接口部件)使用传输介质并且使用若干公知的传输协议中的任何一个传输协议(例如,超文本传输协议(HTTP))通过网络922来传送或接收指令910。类似地,可以使用传输介质经由与装置924的耦接(例如,对等耦接)来传送或接收指令910。
具有头部可穿戴设备的系统
图10示出了根据一个示例实施方式的可以在其中实现头部可穿戴设备1002的系统1000。图10是示例头部可穿戴设备1002的高级功能框图,该示例头部可穿戴设备1002经由各种网络1040通信地耦接移动客户端装置1004和服务器系统1034。
头部可穿戴设备1002包括摄像装置,例如可见光摄像装置1014、红外发射器1016和红外摄像装置1018中的至少一个。摄像装置可以包括图1中的具有摄像装置镜头104a(已删除)和摄像装置镜头104c(已删除)的摄像装置模块(已删除)。
客户端装置1004可以能够使用低功率无线连接1036和高速无线连接1038两者与头部可穿戴设备1002连接。客户端装置1004连接至服务器系统1034和网络1040。网络1040可以包括有线连接和无线连接的任何组合。
头部可穿戴设备1002还包括光学组件的图像显示器1006的两个图像显示器。光学组件的两个图像显示器1006包括与头部可穿戴设备1002的左横向侧相关联的一个图像显示器和与头部可穿戴设备1002的右横向侧相关联的一个图像显示器。头部可穿戴设备1002还包括图像显示驱动器1010、图像处理器1012、低功耗的低功率电路系统1028和高速电路系统1020。光学组件的图像显示器1006用于向头部可穿戴设备1002的用户呈现图像和视频,所述图像和视频包括可以包括图形用户界面的图像。
图像显示驱动器1010命令和控制光学组件的图像显示器1006的图像显示。图像显示驱动器1010可以将图像数据直接递送至光学组件的图像显示器1006中的图像显示器以用于呈现,或者可以将图像数据转换成适合递送至图像显示装置的信号或数据格式。例如,图像数据可以是根据诸如H.264(MPEG-4第10部分)、HEVC、Theora、Dirac、RealVideo RV40、VP8、VP9等的压缩格式格式化的视频数据,而静止图像数据可以根据诸如便携式网络组(PNG)、联合摄影专家组(JPEG)、标签图像文件格式(TIFF)或可交换图像文件格式(Exif)等的压缩格式格式化。
如上所述,头部可穿戴设备1002包括框架106(已删除)和从框架106的横向侧延伸的柄部(或镜腿)(已删除)。头部可穿戴设备1002还包括用户输入装置1008(例如,触摸传感器或按压按钮),该用户输入设备1008包括头部可穿戴设备1002上的输入表面。用户输入装置1008(例如,触摸传感器或按压按钮)用于从用户接收输入选择以操纵所呈现的图像的图形用户界面。
图10中示出的用于头部可穿戴设备1002的部件位于边框或镜腿中的一个或更多个电路板例如PCB或柔性PCB上。替选地或附加地,所描绘的部件可以位于头部可穿戴设备1002的块、框架、铰链或梁架中。左可见光摄像装置和右可见光摄像装置1014可以包括数字摄像装置元件,例如互补金属氧化物半导体(CMOS)图像传感器、电荷耦合装置、摄像装置镜头104a(已删除)和摄像装置镜头104c(已删除),或者可以用于捕获包括具有未知对象的场景图像的数据的任何其他相应可见光或光捕获元件。
头部可穿戴设备1002包括存储器1024,该存储器1024存储执行本文中描述的功能中的子集或全部功能的指令。存储器1024还可以包括存储装置。
如图10所示,高速电路系统1020包括高速处理器1022、存储器1024和高速无线电路系统1026。在示例中,图像显示驱动器1010被耦接至高速电路系统1020并由高速处理器1022操作,以驱动光学组件的图像显示器1006的左图像显示器和右图像显示器。高速处理器1022可以是能够管理头部可穿戴设备1002所需的任何通用计算系统的高速通信和操作的任何处理器。高速处理器1022包括使用高速无线电路系统1026来管理高速无线连接1038到无线局域网(WLAN)上的高速数据传输所需的处理资源。在某些示例中,高速处理器1022执行操作系统例如LINUX操作系统或头部可穿戴设备1002的其他这样的操作系统,并且该操作系统被存储在存储器1024中以用于执行。除了任何其他职责之外,使用执行用于头部可穿戴设备1002的软件架构的高速处理器1022来管理与高速无线电路系统1026的数据传输。在某些示例中,高速无线电路系统1026被配置成实现电气和电子工程师协会(IEEE)802.11通信标准,在本文中也被称为Wi-Fi。在其他示例中,其他高速通信标准可以通过高速无线电路系统1026来实现。
头部可穿戴设备1002的低功率无线电路系统1032和高速无线电路系统1026可以包括短距离收发器(BluetoothTM)和无线广域网收发器、局域网收发器或广域网收发器(例如,蜂窝或WiFi)。包括经由低功率无线连接1036和高速无线连接1038进行通信的收发器的客户端装置1004可以使用头部可穿戴设备1002的架构的细节来实现,网络1040的其他元件也可以如此。
存储器1024包括能够存储各种数据和应用的任何存储装置,所述各种数据和应用包括由左可见光摄像装置和右可见光摄像装置1014、红外摄像装置1018和图像处理器1012生成的摄像装置数据,以及由在光学组件的图像显示器1006的图像显示器上的图像显示驱动器1010生成的用于显示的图像等。虽然存储器1024被示出为与高速电路系统1020集成,但在其他示例中,存储器1024可以是头部可穿戴设备1002的独立的单独元件。在某些这样的示例中,电气布线可以通过包括高速处理器1022的芯片提供从图像处理器1012或低功率处理器1030到存储器1024的连接。在其他示例中,高速处理器1022可以管理存储器1024的寻址,使得低功率处理器1030将在需要涉及存储器1024的读取或写入操作的任何时间启动高速处理器1022。
如图10所示,头部可穿戴设备1002的低功率处理器1030或高速处理器1022可以耦接至摄像装置(可见光摄像装置1014;红外发射器1016,或红外摄像装置1018)、图像显示驱动器1010、用户输入装置1008(例如,触摸传感器或按压按钮)以及存储器1024。
头部可穿戴设备1002与主机连接。例如,头部可穿戴设备1002经由高速无线连接1038与客户端装置1004配对,或者经由网络1040连接至服务器系统1034。服务器系统1034可以是作为服务或网络计算系统的一部分的一个或更多个计算装置,例如,所述一个或更多个计算装置包括处理器、存储器以及通过网络1040与客户端装置1004和头部可穿戴设备1002通信的网络通信接口。
客户端装置1004包括处理器和耦接至处理器的网络通信接口。网络通信接口允许通过网络1040、低功率无线连接1036或高速无线连接1038进行通信。客户端装置1004还可以将用于生成双声道音频内容的指令的至少部分指令存储在客户端装置1004的存储器中以实现本文中描述的功能。
头部可穿戴设备1002的输出部件包括视觉部件,例如显示器例如液晶显示器(LCD)、等离子体显示面板(PDP)、发光二极管(LED)显示器、投影仪或波导。光学组件的图像显示器由图像显示驱动器1010驱动。头部可穿戴设备1002的输出部件还包括声学部件(例如,扬声器)、触觉部件(例如,振动马达)、其他信号生成器等。头部可穿戴设备1002、客户端装置1004和服务器系统1034的输入部件例如用户输入装置1008可以包括字母数字输入部件(例如,键盘、被配置成接收字母数字输入的触摸屏、光电键盘或其他字母数字输入部件)、基于点的输入部件(例如、鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他指向工具)、触觉输入部件(例如,物理按钮、提供触摸或触摸姿势的位置和力度的触摸屏或其他触觉输入部件)、音频输入部件(例如,麦克风)等。
头部可穿戴设备1002可以可选地包括附加的外围装置元件。这样的外围装置元件可以包括生物识别传感器、附加传感器或与头部可穿戴设备1002集成的显示元件。例如,外围装置元件可以包括任何I/O部件,所述I/O部件包括输出部件、运动部件、定位部件或本文中描述的任何其他这样的元件。
例如,生物识别部件包括用于以下操作的部件:检测表达(例如,手部表达、面部表达、声音表达、身体姿势或眼睛追踪)、测量生物信号(例如,血压、心率、体温、排汗或脑电波)、识别人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等。运动部件包括加速度传感器部件(例如,加速度计)、重力传感器部件、旋转传感器部件(例如,陀螺仪)等。定位部件包括生成位置坐标的位置传感器部件(例如,全球定位系统(GPS)接收器部件)、生成定位系统坐标的WiFi或BluetoothTM收发器、海拔传感器部件(例如,检测气压的高度计或气压计,根据气压可以得到海拔)、取向传感器部件(例如,磁力计)等。这样的定位系统坐标也可以经由低功率无线电路系统1032或高速无线电路系统1026通过低功率无线连接1036和高速无线连接1038从客户端装置1004接收。
在使用类似于“A、B或C中的至少一个”、“A、B和C中的至少一个”、“一个或更多个A、B或C”或者“A、B和C中的一个或更多个”的短语时,旨在将该短语解释为意指A可以单独存在于实施方式中,B可以单独存在于实施方式中,C可以单独存在于实施方式中,或者元素A、B和C的任何组合可以存在于单个实施方式中;例如,A和B、A和C、B和C、或者A和B以及C。
在不脱离本公开内容的范围的情况下,可以对所公开的实施方式进行改变和修改。这些及其他改变或修改旨在包括在所附权利要求书中所表达的本公开内容的范围内。
术语表
“载波信号”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或其他无形介质以有助于这样的指令的通信。可以经由网络接口装置使用传输介质通过网络传送或接收指令。
“客户端装置”是指与通信网络对接以从一个或更多个服务器系统或其他客户端装置获得资源的任何机器。客户端装置可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信装置。
“通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、另外类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全球移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、增强型数据速率GSM演进(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动通信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
“部件”是指具有以下边界的装置、物理实体或逻辑:所述边界由功能或子例程调用、分支点、API或对特定处理或控制功能提供分区或模块化的其他技术来定义。部件可以经由其接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元并且可以是通常执行相关功能中的特定功能的程序的一部分。部件可以构成软件部件(例如,体现在机器可读介质上的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或更多个硬件部件(例如,处理器或处理器组)配置为进行操作以执行如本文中描述的某些操作的硬件部件。也可以机械地、电子地或以其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是专用处理器,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。硬件部件还可以包括通过软件被临时地配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件部件成为被唯一地定制成执行所配置的功能的特定机器(或机器的特定部件),而不再是通用处理器。将认识到,可以出于成本和时间考虑来决定是机械地在专用且永久地配置的电路系统中实现硬件部件还是在临时地配置(例如,通过软件配置)的电路系统中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成包含有形实体,即被物理构造、永久地配置(例如,硬连线)或临时地配置(例如,编程)成以某种方式操作或者执行本文中描述的某些操作的实体。考虑硬件部件被临时地配置(例如,被编程)的示例,无需在任一时刻对硬件部件中的每个硬件部件进行配置或实例化。例如,在硬件部件包括通过软件配置而成为专用处理器的通用处理器的情况下,该通用处理器可以在不同时间处被配置为各自不同的专用处理器(例如,包括不同的硬件部件)。软件相应地对特定的一个或多个处理器进行配置,以例如在一个时刻处构成特定硬件部件并且在不同的时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息以及从其他硬件部件接收信息。因此,所描述的硬件部件可以被认为通信地耦接。在同时存在多个硬件部件的情况下,可以通过(例如,通过适当的电路和总线)在这些硬件部件中的两个或更多个硬件部件之间或之中进行信号传输来实现通信。在多个硬件部件在不同时间被配置或实例化的示例中,可以例如通过将信息存储在多个硬件部件可以访问的存储器结构中并且在存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在与其通信地耦接的存储器装置中。然后,另外的硬件部件可以在随后的时间访问存储器装置,以检索所存储的输出并对其进行处理。硬件部件还可以发起与输入装置或输出装置的通信,并且可以对资源(例如,信息的集合)进行操作。在本文中描述的示例方法的各种操作可以至少部分地由临时地配置(例如,通过软件)或永久地配置成执行相关操作的一个或更多个处理器来执行。无论是被临时地配置还是永久地配置,这样的处理器可以构成进行操作以执行本文中描述的一个或更多个操作或功能的处理器实现的部件。如本文中使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,在本文中描述的方法可以至少部分地由处理器实现,其中,特定的一个或多个处理器是硬件的示例。例如,方法的操作中的至少一些操作可以由一个或更多个处理器或者处理器实现的部件执行。此外,一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或作为“软件即服务”(SaaS)进行操作。例如,操作中的至少一些操作可以由计算机组(作为包括处理器的机器的示例)执行,其中这些操作可以经由网络(例如,因特网)和经由一个或更多个适当的接口(例如,API)来访问。操作中的某些操作的执行可以分布在处理器之间,不仅驻留在单个机器内,而且跨多个机器部署。在一些示例中,处理器或处理器实现的部件可以位于单个地理定位中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例中,处理器或处理器实现的部件可以跨多个地理定位分布。
“计算机可读存储介质”是指机器存储介质和传输介质两者。因此,术语包括存储装置/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“装置可读介质”意指相同的事物并且可以在本公开内容中互换使用。
“短暂消息”是指可以在时间有限的持续时间内访问的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送者设置。替选地,访问时间可以是默认设置或者由接收者指定的设置。无论设置技术如何,该消息都是暂时的。
“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储装置和介质(例如,集中式或分布式数据库,以及相关联的高速缓存和服务器)。因此,该术语应被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和装置存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器装置,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存装置;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“装置存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换使用。术语“机器存储介质”、“计算机存储介质”和“装置存储介质”明确地排除了载波、调制数据信号和其他这样的介质,所述载波、调制数据信号和其他这样的介质中的至少一些被涵盖在术语“信号介质”中。
“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
“信号介质”是指能够存储、编码或携载由机器执行的指令并且包括数字或模拟通信信号的任何无形介质或者有助于软件或数据的通信的其他无形介质。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指其特性中的一个或更多个特性被以将信息编码在信号中的方式设置或改变的信号。术语“传输介质”和“信号介质”意指相同的事物并且可以在本公开内容中互换使用。
术语表
“载波信号”是指能够存储、编码或携载由机器执行的指令的任何无形介质并且包括数字或模拟通信信号或其他无形介质以有助于这样的指令的通信。可以经由网络接口装置使用传输介质通过网络来传送或接收指令。
“客户端装置”是指与通信网络对接以从一个或更多个服务器系统或其他客户端装置获得资源的任何机器。客户端装置可以是但不限于移动电话、桌上型计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、膝上型计算机、多处理器系统、基于微处理器或可编程消费电子产品、游戏控制台、机顶盒或用户可以用于访问网络的任何其他通信装置。
“通信网络”是指网络的一个或更多个部分,该网络可以是自组织网络、内联网、外联网、虚拟专用网络(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、因特网、因特网的一部分、公共交换电话网(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、另外类型的网络或者两个或更多个这样的网络的组合。例如,网络或网络的一部分可以包括无线网络或蜂窝网络,并且耦接可以是码分多址(CDMA)连接、全球移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接可以实现各种类型的数据传输技术中的任何数据传输技术,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、增强型数据速率GSM演进(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动通讯系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他数据传输技术、其他长距离协议或其他数据传输技术。
“部件”是指具有以下边界的装置、物理实体或逻辑:所述边界由功能或子例程调用、分支点、API或对特定处理或控制功能提供分区或模块化的其他技术定义。部件可以经由其接口与其他部件组合以执行机器处理。部件可以是被设计用于与其他部件一起使用的经封装的功能硬件单元并且可以是通常执行相关功能中的特定功能的程序的一部分。部件可以构成软件部件(例如,体现在机器可读介质上的代码)或硬件部件。“硬件部件”是能够执行某些操作的有形单元,并且可以以某种物理方式来配置或布置。在各种示例中,可以通过软件(例如,应用或应用部分)将一个或更多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统中的一个或更多个硬件部件(例如,处理器或处理器组)配置为进行操作以执行如本文中描述的某些操作的硬件部件。也可以机械地、电子地或以其任何合适的组合来实现硬件部件。例如,硬件部件可以包括被永久地配置成执行某些操作的专用电路系统或逻辑。硬件部件可以是专用处理器,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。硬件部件还可以包括通过软件被临时地配置成执行某些操作的可编程逻辑或电路系统。例如,硬件部件可以包括由通用处理器或其他可编程处理器执行的软件。一旦通过这样的软件被配置,则硬件部件成为被唯一地定制成执行所配置的功能的特定机器(或机器的特定部件),而不再是通用处理器。将认识到,可以出于成本和时间考虑来决定是机械地在专用且永久地配置的电路系统中实现硬件部件还是在临时地配置(例如,通过软件配置)的电路系统中实现硬件部件。因此,短语“硬件部件”(或“硬件实现的部件”)应当被理解成包含有形实体,即被物理构造、永久地配置(例如,硬连线)或临时地配置(例如,编程)成以某种方式操作或者执行本文中描述的某些操作的实体。考虑硬件部件被临时地配置(例如,被编程)的示例,无需在任一时刻对硬件部件中的每个硬件部件进行配置或实例化。例如,在硬件部件包括通过软件配置而成为专用处理器的通用处理器的情况下,该通用处理器可以在不同时间处被配置为各自不同的专用处理器(例如,包括不同的硬件部件)。软件相应地对特定的一个或多个处理器进行配置,以例如在一个时刻处构成特定硬件部件并且在不同时刻处构成不同的硬件部件。硬件部件可以向其他硬件部件提供信息以及从其他硬件部件接收信息。因此,所描述的硬件部件可以被认为通信地耦接。在同时存在多个硬件部件的情况下,可以通过(例如,通过适当的电路和总线)在这些硬件部件中的两个或更多个硬件部件之间或之中进行信号传输来实现通信。在多个硬件部件在不同时间被配置或实例化的示例中,可以例如通过将信息存储在多个硬件部件可以访问的存储器结构中并且在存储器结构中检索信息来实现这样的硬件部件之间的通信。例如,一个硬件部件可以执行操作,并且将该操作的输出存储在与其通信地耦接的存储器装置中。然后,另外的硬件部件可以在随后的时间访问存储器装置,以检索所存储的输出并对其进行处理。硬件部件还可以发起与输入装置或输出装置的通信,并且可以对资源(例如,信息的集合)进行操作。在本文中描述的示例方法的各种操作可以至少部分地由临时地配置(例如,由软件)或永久地配置成执行相关操作的一个或更多个处理器来执行。无论是被临时地配置还是永久地配置,这样的处理器可以构成进行操作以执行本文中描述的一个或更多个操作或功能的处理器实现的部件。如本文中使用的,“处理器实现的部件”是指使用一个或更多个处理器实现的硬件部件。类似地,在本文中描述的方法可以至少部分地由处理器实现,其中,特定的一个或多个处理器是硬件的示例。例如,方法的操作中的至少一些操作可以由一个或更多个处理器或者处理器实现的部件执行。此外,一个或更多个处理器还可以进行操作以支持“云计算”环境中的相关操作的执行或作为“软件即服务”(SaaS)进行操作。例如,操作中的至少一些操作可以由计算机组(作为包括处理器的机器的示例)执行,其中这些操作可以经由网络(例如,因特网)和经由一个或更多个适当的接口(例如,API)来访问。操作中的某些操作的执行可以分布在处理器之间,不仅驻留在单个机器内,而且跨多个机器部署。在一些示例中,处理器或处理器实现的部件可以位于单个地理定位中(例如,在家庭环境、办公室环境或服务器群内)。在其他示例中,处理器或处理器实现的部件可以跨多个地理定位分布。
“计算机可读存储介质”是指机器存储介质和传输介质两者。因此,术语包括存储装置/介质和载波/调制数据信号两者。术语“机器可读介质”、“计算机可读介质”和“装置可读介质”意指相同的事物并且可以在本公开内容中互换使用。
“短暂消息”是指可以在时间有限的持续时间内访问的消息。短暂消息可以是文本、图像、视频等。短暂消息的访问时间可以由消息发送者设置。替选地,访问时间可以是默认设置或者由接收者指定的设置。无论设置技术如何,该消息都是暂时的。
“机器存储介质”是指存储可执行指令、例程和数据的单个或多个存储装置和介质(例如,集中式或分布式数据库,以及相关联的高速缓存和服务器)。因此,该术语应被视为包括但不限于固态存储器以及光学和磁介质,包括处理器内部或外部的存储器。机器存储介质、计算机存储介质和装置存储介质的具体示例包括:非易失性存储器,包括例如半导体存储器装置,例如可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、FPGA和闪存装置;磁盘,例如内部硬盘和可移除盘;磁光盘;以及CD-ROM和DVD-ROM盘。术语“机器存储介质”、“装置存储介质”、“计算机存储介质”意指相同的事物并且可以在本公开内容中互换使用。术语“机器存储介质”、“计算机存储介质”和“装置存储介质”明确地排除了载波、调制数据信号和其他这样的介质,所述载波、调制数据信号和其他这样的介质中的至少一些被涵盖在术语“信号介质”中。
“非暂态计算机可读存储介质”是指能够存储、编码或携载由机器执行的指令的有形介质。
“信号介质”是指能够存储、编码或携载由机器执行的指令并且包括数字或模拟通信信号的任何无形介质或者有助于软件或数据的通信的其他无形介质。术语“信号介质”应当被视为包括任何形式的调制数据信号、载波等。术语“调制数据信号”意指其特征中的一个或更多个特性被以将信息编码在信号中的方式设置或改变的信号。术语“传输介质”和“信号介质”意指相同的事物并且可以在本公开内容中互换使用。

Claims (20)

1.一种系统,包括:
第一摄像装置镜头,其包括第一图像传感器;
第二摄像装置镜头,其包括第二图像传感器;以及
硬件编码器,其耦接至所述第一摄像装置镜头和所述第二摄像装置镜头,所述硬件编码器用于执行包括以下的操作:
接收来自所述第一摄像装置镜头的第一图像数据;
接收来自所述第二摄像装置镜头的第二图像数据;
处理所述第一图像数据和所述第二图像数据;以及
基于经处理的第一图像数据和经处理的第二图像数据来生成单个拼接的编码帧。
2.根据权利要求1所述的系统,其中,所述第一摄像装置镜头和所述第二摄像装置镜头是立体摄像装置系统的一部分。
3.根据权利要求1所述的系统,其中,所述硬件编码器接收来自存储器中的多个位置的输入。
4.根据权利要求3所述的系统,其中,所述硬件编码器同时读取所接收到的输入。
5.根据权利要求1所述的系统,其中,所述第一图像数据包括第一组图像帧。
6.根据权利要求1所述的系统,其中,所述第二图像数据包括第二组图像帧。
7.根据权利要求3所述的系统,其中,所述处理还包括:
使所述第一图像传感器的第一曝光时间与所述第二图像传感器的第二曝光时间同步。
8.根据权利要求1所述的系统,其中,所述操作还包括:
将所述单个拼接的编码帧传送至客户端装置。
9.根据权利要求8所述的系统,其中,所述客户端装置与用户的联系人中的一个联系人相关联。
10.一种设备,包括:
硬件编码器,所述硬件编码器用于执行包括以下的操作:
接收来自第一摄像装置镜头的第一图像数据;
接收来自第二摄像装置镜头的第二图像数据;
由所述硬件编码器处理所述第一图像数据和所述第二图像数据;以及
基于经处理的第一图像数据和经处理的第二图像数据来生成单个拼接的编码帧。
11.根据权利要求10所述的设备,其中,所述操作还包括:
将所述单个拼接的编码帧传送至消息收发服务器。
12.根据权利要求10所述的设备,其中,所述设备是包括以下的头部可穿戴设备:
耦接至摄像装置的框架;以及
耦接至所述框架的相对侧的第一镜腿和第二镜腿,其中,第一摄像装置镜头耦接至所述第一镜腿并且第二摄像装置镜头耦接至所述第二镜腿。
13.根据权利要求12所述的设备,其中,所述第一摄像装置镜头接收第一图像数据并且所述第二摄像装置镜头接收第二图像数据。
14.根据权利要求10所述的设备,其中,所述第一摄像装置镜头包括第一图像传感器并且所述第二摄像装置镜头包括第二图像传感器,所述处理还包括:
使所述第一图像传感器的第一曝光时间与所述第二图像传感器的第二曝光时间同步。
15.根据权利要求10所述的设备,其中,所述操作还包括:
将所述单个拼接的编码帧传送至客户端装置。
16.一种方法,包括:
由硬件编码器接收来自第一摄像装置镜头的第一图像数据;
由所述硬件编码器接收来自第二摄像装置镜头的第二图像数据;
由所述硬件编码器处理所述第一图像数据和所述第二图像数据;以及
由所述硬件编码器基于经处理的第一图像数据和经处理的第二图像数据来生成单个拼接的编码帧。
17.根据权利要求16所述的方法,其中,所述硬件编码器接收来自存储器中的多个位置的输入。
18.根据权利要求16所述的方法,其中,所述第一图像数据包括第一组立体图像帧。
19.根据权利要求16所述的方法,其中,所述第二图像数据包括第二组立体图像帧。
20.根据权利要求16所述的方法,其中,所述硬件编码器接收来自存储器中的多个位置的输入。
CN202280035665.9A 2021-05-19 2022-05-12 用于立体拼接的硬件编码器 Pending CN117337563A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202163201935P 2021-05-19 2021-05-19
US63/201,935 2021-05-19
US17/716,786 US20220377309A1 (en) 2021-05-19 2022-04-08 Hardware encoder for stereo stitching
US17/716,786 2022-04-08
PCT/US2022/072284 WO2022246373A1 (en) 2021-05-19 2022-05-12 Hardware encoder for stereo stitching

Publications (1)

Publication Number Publication Date
CN117337563A true CN117337563A (zh) 2024-01-02

Family

ID=84103296

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280035665.9A Pending CN117337563A (zh) 2021-05-19 2022-05-12 用于立体拼接的硬件编码器

Country Status (4)

Country Link
US (1) US20220377309A1 (zh)
EP (1) EP4342174A1 (zh)
KR (1) KR20240010010A (zh)
CN (1) CN117337563A (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8644389B2 (en) * 2009-05-15 2014-02-04 Texas Instruments Incorporated Real-time video image processing
US20150309316A1 (en) * 2011-04-06 2015-10-29 Microsoft Technology Licensing, Llc Ar glasses with predictive control of external device based on event input
KR102460906B1 (ko) * 2016-02-17 2022-11-01 삼성전자주식회사 이미지 처리 방법 및 이를 지원하는 전자 장치
US11610607B1 (en) * 2019-12-23 2023-03-21 Snap Inc. Video highlights with user viewing, posting, sending and exporting

Also Published As

Publication number Publication date
KR20240010010A (ko) 2024-01-23
EP4342174A1 (en) 2024-03-27
US20220377309A1 (en) 2022-11-24

Similar Documents

Publication Publication Date Title
CN116745743A (zh) 具有触觉反馈响应的通信界面
US11531400B2 (en) Electronic communication interface with haptic feedback response
US11997422B2 (en) Real-time video communication interface with haptic feedback response
CN116685941A (zh) 具有触觉反馈增强的媒体内容项
CN117157609A (zh) 具有触觉反馈响应的虚拟现实界面
CN116710885A (zh) 具有触觉反馈响应的通信界面
CN117120959A (zh) 具有触觉反馈响应和音频反馈响应的界面
CN117120960A (zh) 具有触觉反馈响应和音频反馈响应的界面
KR20230161516A (ko) 햅틱 피드백 응답을 갖는 가상 현실 인터페이스
US20220319061A1 (en) Transmitting metadata via invisible light
US20220318303A1 (en) Transmitting metadata via inaudible frequencies
US20220319125A1 (en) User-aligned spatial volumes
US11825276B2 (en) Selector input device to transmit audio signals
US11874960B2 (en) Pausing device operation based on facial movement
US12050729B2 (en) Real-time communication interface with haptic and audio feedback response
US20220210336A1 (en) Selector input device to transmit media content items
US20220373791A1 (en) Automatic media capture using biometric sensor data
US20220375103A1 (en) Automatic media capture based on motion sensor data
US20220377309A1 (en) Hardware encoder for stereo stitching
CN117157608A (zh) 用户定义的情景空间
CN117321545A (zh) 基于运动传感器数据的自动媒体捕获
WO2022245831A1 (en) Automatic media capture using biometric sensor data
KR20240008371A (ko) 모션 센서 데이터에 기초한 자동 미디어 캡처
WO2022246373A1 (en) Hardware encoder for stereo stitching

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination