CN117037212A

CN117037212A - 捕获媒体瞬间

Info

Publication number: CN117037212A
Application number: CN202311007611.4A
Authority: CN
Inventors: S·泰特; T·赖德; M·阿萨雅各
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2015-06-24
Filing date: 2016-05-24
Publication date: 2023-11-10
Also published as: EP3314531A1; CN107660287A; CN107660287B; US10719710B2; WO2016209473A1; EP3314531A4; US20160379056A1

Abstract

本文描述了用于捕获媒体瞬间的各种系统和方法。一种用于捕获媒体瞬间的自主相机系统包括：用于接收配置参数的配置模块；用于在人群上方自主地操纵所述自主相机系统的飞行控制模块；用于基于所述配置参数在所述人群中搜索主体的搜索模块；以及用于当在所述人群中找到所述主体时执行动作的控制模块。

Description

捕获媒体瞬间

本申请是PCT国际申请号为PCT/US2016/033938、中国国家申请号为201680030131.1、题为“捕获媒体瞬间”的申请的分案申请。

优先权申请

本申请要求2015年6月24日提交的美国申请S/N.14/749,237的优先权的权益，该申请通过引用整体结合于此。

技术领域

本文描述的各实施例一般涉及自主运载工具控制，且具体地涉及用于捕获媒体瞬间的系统。

背景

在电影和视频中，切出镜头是持续地捕获的镜头的中断。切出镜头可在后生产(post-production)中或在实况广播中被插入。切出镜头可被用来维持观众的注意力，向持续镜头添加风味或上下文，或者捕获远离主情节发生的感兴趣事件。切出镜头的示例包括在暂停期间球员席的场景、“接吻镜头(kisscam)”上的夫妻场景、人们响应于演讲者的评论而大笑的场景、或在比赛结果确定之后球迷的场景。

附图说明

在附图中(这些附图不一定是按比例绘制的)，相同的数字可以描述在不同视图中的类似的组件。具有不同的字母后缀的相同的数字可以表示类似组件的不同实例。在附图中的诸个图中通过示例而非限制地示出一些实施例：

图1是根据一实施例的解说无人机和遥控系统的组件的示图；

图2是根据一实施例的解说操作期间的控制和数据流的流程图；

图3是根据一实施例的解说用于捕获媒体瞬间的自主相机系统的框图；

图4是根据一实施例的捕获媒体瞬间的方法的流程图；以及

图5是根据一示例实施例的解说可在其上执行本文中所讨论的技术(例如，方法)中的任意一种或多种的示例机器的框图。

详细描述

本文描述的系统和方法提供了一种用于捕获媒体瞬间的系统。本公开讨论了对相机系统的操作的改进。代替在当今许多会场中使用的手动地操作的相机，在此呈现了自动化相机系统。自动化相机系统可被使用来捕获用于实况或记录事件的切出镜头。

过去，切出镜头是通过平摇并飞快穿过(zoom through)人群的静止相机操作者或者通过移动相机操作者走过走廊或街道以捕获情节来捕获的。大型事件可包括多个相机，每一相机具有其自己的一组责任。例如，在篮球比赛处，可存在四个或更多相机。两个相机定位得接近球场中心，且两个相机在球场的任一端。所使用的相机的数目是任意的，但通常因变于比赛的级别。例如，高中比赛可能只使用单个球场中心相机来覆盖情节。在这一实例中，单个相机可通过从球员移开并推向教练、拉拉队员、观众、或记分板上来被用于切出镜头。然而，在较高水平的比赛(诸如大学、半职业、以及职业)处，相机的数目可增加到四个、十个、或甚至更多。视频生产者的工作是从可用视频馈源中合成最终剪辑。视频生产者可具有多个屏幕，每一屏幕具有视频馈源，并且主屏幕具有输出视频内容，这可以是在实况生产中广播的内容。视频生产者作出使用哪一相机来描绘比赛、切出镜头、广告、推销等的决定。

本文描述了一种使用自主无人机来捕获切出镜头或者向视频生产者或摄影师通知切出镜头机会的系统。一个或多个半自主或全自主无人机可以在公共空间四处飞行并使用各种技术检测潜在瞬间，所述技术诸如情绪识别、目标识别、自然语言处理(NLP)、以及机载生物测定传感器。

图1是根据一实施例的解说无人机100和遥控系统102的组件的示图；无人机100也可被称为半自主运载工具或机器人，它可以是陆基的、海上运载工具、无人飞行器(UAV)、悬挂相机(例如，)，等等。出于讨论的目的，本文讨论的无人机100是无人飞行器(UAV)。遥控系统102可以向一个或多个用户呈现一个或多个用户界面(UI)并被使用来控制无人机100。例如，UI可以显示一区域的地图并允许用户选择无人机100可遵循的航路点。遥控系统102与无人机100之间的通信是双向的。如此，无人机100捕获的图像和其他信息可被传送回遥控系统102以供显示给用户，用户随后可以用附加命令或其他参数变化来作出响应。

无人机100包括飞行模块104、飞行硬件106、飞行图108、传感器阵列110、以及通信子系统112。无人机100可基于从遥控系统102接收到的命令来半自主地操作。例如，在无人机100接收到包括目的地(诸如GPS坐标和所需高度)的导航命令时，无人机100可移至该目的地而无需进一步用户输入。

飞行硬件106包括无人机100的推进或以其他方式移动无人机100的组件。例如，四旋翼直升机UAV(也称为四轴直升机)的飞行硬件106可包括四个螺旋桨。取决于无人机100的类型，飞行硬件106可以不同(例如，用于基于地面的单元的轮)。飞行硬件106还可包括GPS接收机。飞行硬件106还可包括至少一个处理单元(例如，中央处理单元、图形处理器、或专用集成电路)。处理单元可以执行存储在无人机100上的软件以执行无人机100的本文描述的功能。

飞行图108包括表示地理区域(其可包括道路、场馆座位、观众看台、舞台、场地、台面(playing surface)，等等)和这些地理区域的各特征的GPS坐标的数据。飞行图108包括该地理区域的高度数据。该数据还可包括人造物体(诸如桥梁、蜂窝塔，等等)的位置数据。此外，飞行图108可包括兴趣点(POI)位置(包括但不限于餐馆、公司、加油站、体育场、高尔夫球场，等等)的数据库。将理解，飞行图108可包括附加地理、结构或后勤细节以允许无人机100以半自主或全自主的性质来操作。在若干无人机100被用来覆盖一事件时，飞行图108可包括其中每一无人机100被指派覆盖的区域以降低冲突的可能性。

传感器阵列110包括一个或多个传感器。传感器阵列110所捕获的数据可由无人机100在导航期间在内部使用或由无人机100的操作者在外部使用。传感器可包括但不限于温度传感器、压力传感器、电光学传感器、红外传感器、深度相机、相机阵列、话筒阵列、陀螺仪、加速度计、邻近度传感器、话筒、以及磁力计。

在各示例中，无人机100的自主移动是使用飞行模块104和传感器阵列110、飞行硬件106以及飞行图108中的一者或多者来实现的。在一示例中，飞行模块104包括冲突检测逻辑。为此，来自传感器阵列110中的邻近度传感器的读数可被用来确定无人机100距物体(例如，墙或另一无人机)有多近。在一示例中，存储在飞行图108中的数据被用来避开物体。例如，无人机100可以导航绕过高大结构(例如，蜂窝塔、建筑物)的已知位置，或在进至一位置之前飞到足够高度。对于基于地面的无人机100，无人机100可以避开有水、孔洞等的已知区域。

飞行模块104还可利用使用电光学或红外传感器获得的图像数据来避免与物体冲突。例如，飞行模块104可以使用模式匹配算法来分析图像数据以在移动时对无人机100的路径中的物体分类。

通信子系统112包括用于通过一个或多个网络与遥控系统102通信的一个或多个接收机、发射机、或收发机。在一示例中，控制指令由通信子系统112通过网络连接(例如，网络114)来接收。控制指令可以指示无人机100的下一动作过程是什么。例如，控制指令可以是导航指令、一般指示、或其他配置设置。通信子系统112可以将控制指令中继到飞行模块104，此时飞行模块104实现该指令。

网络114将无人机100与遥控系统102通信地连接。网络114可包括局域网(LAN)、广域网(WAN)、无线网络(例如，802.11或蜂窝网络)、公共交换电话网(PSTN)网络、自组织网络、蜂窝、个域网或对等(例如，Wi-Fi直连)、或网络协议和网络类型的其他组合或排列。网络114可包括单个局域网(LAN)、广域网(WAN)、或者LAN或WAN的组合(诸如因特网)。网络114可以提供遥控系统102与无人机100之间的安全、加密、或专有连接。

遥控系统102可以是独立设备或另一设备的一部分。遥控系统102可以是执行遥控应用的智能电话、平板、可穿戴设备(例如，智能眼镜)、具有双棒(dual-stick)布局和显示器的发射机、膝上型设备，等等。在一示例中，遥控系统102可以是基于web的应用。在一示例中，遥控系统102是平板计算机。遥控系统102还可包括包含一个或多个核的至少一个处理单元(例如，中央处理单元、图形处理器、或专用集成电路)。该至少一个处理单元可以执行存储在遥控系统102上的软件以执行本文描述的功能。

遥控系统102包括显示设备116、控制用户界面118、控制模块120、以及通信子系统122。显示设备116是遥控系统102上的呈现控制用户界面118的显示器。控制用户界面118可包括用于允许用户配置无人机的操作的各种输入控件。各种参数或设置可由用户经由控制用户界面118来配置，所述参数或设置包括但不限于搜索参数、连续镜头(footage)属性、以及其他设置。

搜索参数由无人机100使用来过滤人群中的人并找出特定个人或群体。搜索参数可包括情绪类型、要搜索的字典项、群体中的人的所请求的社交圈或关系、或者人或人群的其他特性。情绪类型可包括各种广泛情绪类别，诸如高兴或悲伤，或者更细粒度分类，诸如无聊、疲劳、分神等等。字典项可被用来使用例如远距离话筒和自然语言处理来标识无人机100应当搜索的词语或短语。社交圈或关系可以是诸如父子、母女、家人、团队隶属等等之类的关系。其他特性可以是性别、年龄、种族、衣着方式等等。

连续镜头属性可包括镜头中的人数、镜头中的人的性别、镜头的视角(例如，从人的前方、从人的下方或上方，等等)、或所捕获的视频或图像的其他方面。无人机100可以使用各种脸部检测、目标识别、或从社交网络检索到的补充性数据来标识和合成镜头。

可由用户设置的其他设置包括通用设置，诸如无人机100应当在其中巡逻或搜索的地理边界；何时巡逻以及巡逻多久的计划表；要捕获的图像或视频的数目；图像或视频质量(例如，标清或高清)；将图像/视频数据存储在本地、流传送它、还是广播它；是否捕获图像/视频或者将可能的主体报告回用户；以及其他设置。

用户输入可包括控制用户界面118上的触摸输入、语音输入、遥控系统102上的手势、或遥控系统102的物理移动。对输入的检测可以使用遥控系统102的一个或多个传感器(未示出)来实现，诸如加速度计、话筒、陀螺仪、或相机。在检测到用户输入时，控制模块120可以检索用于无人机100的控制指令并随后使用通信子系统122通过网络连接114将该控制指令传送给无人机100。

在操作期间，无人机100可被配置成在比赛期间在足球场的某些坐席区四处飞行。无人机100可被配置成定位父子群体。虽然在这一示例中无人机100被配置成定位一种类型的群体，但将理解，无人机100可被配置成定位超过一种类型的群体或个人。无人机100可以在指定坐席区中的随机或预配置路径上出发，使用各种传感器来定位父子群体。例如，无人机100可以使用一个或多个相机来查看观众并寻找具有某一家族相似之处、彼此座位接近、彼此互动、具有适当的年龄差、衣着相似、或指示可能关系的其他特性的那些人。作为补充或替换，无人机1 00可以使用远距离有向话筒来捕获可能暗示父子关系的对话(例如，在对话中在称呼一个人时使用“爸爸”)。在找到一群人时，无人机100可以基于其当前配置来执行一个或多个动作。无人机100可以记录一个或多个视频、拍摄一个或多个图像、向用户(例如，视频生产者)通知被定位的群体的存在或位置、流传送或广播该群体的图像或视频、标记该位置以用于将来参考、向相机操作者或另一人通知该位置、或其他动作。尽管这一示例被设置在体育场中，将理解，无人机可被用在可被电视播送或广播的人群大量聚集的任何地方，诸如室外音乐节、巨型教会、音乐厅、政治集会或示威、展览厅、公司集会、赛车跑道、游行，等等。

图2是根据一实施例的解说操作期间的控制和数据流200的流程图。在操作202，部署无人机。由用户配置无人机(操作204)。该配置可以部分地或完全地在部署(操作202)之前或稍后在无人机正在操作中时执行。该配置可以向无人机提供各种参数，诸如例如操作区域、搜索参数、以及视频参数。搜索参数可包括人的各种特性(例如，性别、情绪、关系、团队隶属)。

无人机导航到指定区域并开始其巡逻(操作206)。该巡逻可以在一个或多个预定义路径上。另选地，该巡逻可以是覆盖一区域的随机或任意移动。在一些示例中，可以用指令向无人机指派相对静止的位置，以监视该位置周围的可见区域中的一些或全部。可以使用移动巡逻和静止巡逻的组合。例如，无人机可被配置成移动到一个点、从该点搜索人、并随后在某时间区间之后移至另一点。

无人机处理从机载传感器接收到的数据以基于搜索参数找出可能的匹配(操作208)。无人机可以在本地(无人机机载)或远程地(例如，使用云服务)处理该数据。例如，无人机可以捕获图像并搜索该图像以寻找可能匹配所提供的搜索过滤器的一个或多个人。另选地，无人机可以将该图像传送给用于执行图像分析的处理服务。

如果无人机基于搜索参数找到可能的匹配，则无人机执行动作(操作210)。动作可以在部署之前或期间来被配置。示例动作包括录制视频、流传送或广播视频、捕获图像、向用户通知该可能的匹配、或者将该可能的匹配的位置记入日志。在执行该动作(操作210)之后，无人机继续巡逻(操作206)。如果无人机完成其部署，则无人机返回原始位置(操作212)以用于维护、数据卸载、电池再充电，等等。

图3是根据一实施例的解说用于捕获媒体时刻的自主相机系统300的框图。自主相机系统300包括配置模块302、飞行控制模块304、搜索模块306以及控制模块308。配置模块302可被配置成接收配置参数。在一实施例中，配置参数包括表征主体的搜索参数。在又一实施例中，搜索参数包括性别、年龄、关系、或情绪。

飞行控制模块304可被配置成在人群上方自主地操纵自主相机系统。在一实施例中，为操纵自主相机系统，飞行控制模块要根据预定义路线来操纵自主相机系统。在一实施例中，为操纵自主相机系统，飞行控制模块要通过自主相机系统任意地操纵自主相机系统。

搜索模块306可被配置成基于配置参数来搜索人群中的主体。在一实施例中，为了搜索主体，搜索模块306要访问由自主相机系统300获得的图像并分析该图像以标识主体。图像分析可以在自主相机系统300处执行或卸载到不同计算设备。因而，在又一实施例中，为了分析图像，搜索模块306要将该图像的图像数据和该主体的参数化数据传送给远程服务器(远程服务器分析图像数据以标识该主体)并从远程服务器接收主体的指示。图像数据可以是图像本身或与图像有关的其他信息，诸如图像的不同表示(例如，图像的剪裁或缩放、图像的阿尔法通道，等等)。参数化数据可以是基于配置参数的与主体有关的信息。例如，参数化数据可以指示主体的母女关系状态或者特定性别或年龄。使用图像数据和参数化数据，远程服务器可以使用各种技术来分析该图像。

在一实施例中，为了分析该图像，搜索模块306要访问配置参数以获得搜索参数并搜索该图像以寻找匹配该搜索参数的对象。该对象可以是任何事物，诸如记分板、球门、人、团队、教练、赛场的一部分、车辆(例如，赛车)，等等。对该图像的搜索可以使用边缘检测、模式匹配、和其他技术来执行。

在一实施例中，搜索参数指示该主体所展现的情绪，并且为了搜索图像以寻找该对象，搜索模块306要搜索该图像以寻找展现该情绪的人并将该人标识为主体。情绪可以是大规模情绪(例如，高兴或悲伤)或更精细规模的粒度化情绪(例如，高兴、热烈、兴奋，等等)。在一实施例中，为了搜索图像以寻找展现该情绪的人，搜索模块306要分析脸部表情或身体姿态之一以确定图像中的人是否正展现该情绪。

在一实施例中，搜索参数指示人之间的关系，并且为了搜索图像以寻找该对象，搜索模块306要搜索该图像以寻找具有该关系的一群人并将该群人标识为主体。在一实施例中，为了搜索图像以寻找具有该关系的一群人，搜索模块306要分析该群人的物理特性并识别该群人的物理特性之间的相似度。例如，球迷群体可能穿着相似(例如，匹配他们最喜爱球队的相似颜色)或者家人可能看起来相似。在一实施例中，物理特性包括身高、发色、衣着、肤色、或体型。其他特性也可被单独地或与这些物理特性相组合地使用。

在一实施例中，为了搜索图像以寻找具有该关系的一群人，搜索模块306要从该群人中标识多个人，访问该多个人的社交简档，并基于社交简档来确定该多个人属于共享社交群。例如，使用脸部识别，一群中的人可被标识。对照流行社交网络站点的交叉参考搜索可以产生与这些人中的每一者都与其相关的群有关的信息(例如，工作场所、喜爱的球队、住所)。如果存在足够相似度，则搜索模块306可以确定图像中的该群人或该群人的某一子集具有关系。

在一实施例中，为了搜索主体，搜索模块306要访问由自主相机系统获得的音频数据并分析该音频数据以标识主体。音频数据可包括一群人中的一个或多个人的话语。话语可包括指示关系的关键词，诸如“爸爸”或“妈妈”。话语可被用来确定该人是否是特定球队或球员的球迷。例如，配置参数可包括用于找出作为Minnesota Vikings橄榄球队球迷的某人的搜索参数。通过识别一个人正大喊“Go Vikes！”来加油，搜索模块306可以确定该人是Vikings的球迷。

在一实施例中，为了分析音频数据，搜索模块306要使用自然语言处理以标识词语或短语并在数据字典中执行查找以寻找该词语或短语。在又一实施例中，数据字典是使用配置参数来配置的。继续以上示例，配置参数可包括词语“Vikings”和短语“Let’s GoVikings”的搜索参数。搜索参数可被存储在字典中，并且基于这些字典条目，短语“GoVikes！”被认为足够接近以造成匹配。

控制模块308可被配置成当在人群中找到主体时执行动作。在一实施例中，为了执行该动作，控制模块308要录制该主体的视频。在又一实施例中，控制模块308要将视频传送到远程位置。在又一实施例中，远程位置包括生产演播室。其他远程位置可以是站点外数据存档、云存储、广播间、在线观看者计算机，等等。

在一实施例中，为了执行该动作，控制模块308要向用户通知该主体的位置。用户可以是例如摄影师、制片人、或导演。使用该主体的位置，其他相机可在该主体上被训练以进行录制或广播。

在一实施例中，为了执行该动作，控制模块要将该主体的位置记入日志。该日志可由其他人使用，诸如摄影师，以稍后搜索主体。例如，在比赛开始时，自主相机系统300可以出发以搜索特定球队的与彼此有关系的球迷。这些家庭被标识，可任选地由用户确认，并随后被记入日志以供稍后参考。在半场时，这些家庭的位置可被参考以捕获他们来用于半场表演。

图4是根据一实施例的捕获媒体瞬间的方法400的流程图。在框402，在自主相机系统处接收配置参数。在一实施例中，配置参数包括表征主体的搜索参数。在又一实施例中，搜索参数包括性别、年龄、关系、或情绪。

在框404，自主相机系统在人群上方自主地操纵。在一实施例中，操纵自主相机系统是根据预定义路线来执行的。在一实施例中，操纵自主相机系统是由自主相机系统任意地执行的。

在框406，自主相机系统基于配置参数来在人群中搜索主体。在一实施例中，搜索主体包括访问由自主相机系统获得的图像并分析该图像以标识主体。在又一实施例中，分析该图像包括将该图像的图像数据和该主体的参数化数据传送给远程服务器(远程服务器分析图像数据以标识该主体)并从远程服务器的接收主体的指示。

在一实施例中，分析图像包括访问配置参数以获得搜索参数并搜索图像以寻找匹配该搜索参数的对象。在又一实施例中，搜索参数指示该主体所展现的情绪，并且搜索图像以寻找该对象包括搜索该图像以寻找展现该情绪的人并将该人标识为主体。在又一实施例中，搜索图像以寻找展现该情绪的人包括分析脸部表情或身体姿态之一以确定图像中的人是否正展现该情绪。

在一实施例中，搜索参数指示人之间的关系，并且搜索图像以寻找该对象包括搜索该图像以寻找具有该关系的一群人并将该群人标识为主体。在又一实施例中，搜索图像以寻找具有该关系的一群人包括分析该群人的物理特性并识别该群人的物理特性之间的相似度。在又一实施例中，物理特性包括身高、发色、衣着、肤色、或体型。

在一实施例中，搜索图像以寻找具有该关系的一群人包括：从该群人中标识多个人，访问该多个人的社交简档，并基于社交简档来确定该多个人属于共享社交群。

在一实施例中，搜索以寻找主体包括访问由自主相机系统获得的音频数据并分析该音频数据以标识主体。在又一实施例中，分析音频数据包括使用自然语言处理来标识词语或短语并在数据字典中执行查找以寻找该词语或短语。在又一实施例中，数据字典是使用配置参数来配置的。

在框408，当在人群中找到主体时，自主相机系统执行动作。在一实施例中，执行动作包括录制该主体的视频。在又一实施例中，方法400包括将视频传送到远程位置。在又一实施例中，远程位置包括生产演播室。

在一实施例中，执行动作包括向用户通知该主体的位置。

在一实施例中，执行动作包括将该主体的位置记入日志。

各实施例可在硬件、固件和软件中的一者或组合中实现。实施例也可实现成存储于机器可读存储设备上的指令，该指令可由至少一个处理器读取并执行，以执行本文所描述的操作。机器可读存储设备可包括用于以机器(如，计算机)可读形式存储信息的任何非瞬态机构。例如，机器可读存储设备可包括只读存储器(ROM)、随机存取存储器(RAM)、磁盘存储介质、光存储介质、闪存设备以及其他存储设备和介质。

如本文中所述，示例可以包括逻辑或多个组件、模块或机制，或可在逻辑或多个组件、模块或机制上操作。各模块可以是通信耦合到一个或多个处理器以实现本文描述的操作的硬件、软件或固件。各模块可以是硬件模块，并且如此，各模块可被认为是能够执行指定操作的有形实体且可以按特定方式来配置或布置。在示例中，能以指定方式将电路布置(例如，内部地布置，或者相对于诸如其他电路之类的外部实体)为模块。在示例中，一个或多个计算机系统(例如，独立的客户机或服务器计算机系统)的全部或部分或者一个或多个硬件处理器可由固件或软件(例如，指令、应用部分、或者应用)配置为操作以执行所指定操作的模块。在一个示例中，软件可以驻留在机器可读介质上。在示例中，软件在由模块的底层硬件执行时，使此硬件执行指定的操作。因此，术语硬件模块被理解为涵盖有形实体，该有形实体是物理地构建、具体地配置(例如，硬连线)、或者临时地(例如，瞬态地)配置(例如，编程)从而以所指定的方式操作或者执行本文中所描述的任何操作的部分或全部的实体。考虑到其中临时配置模块的示例，这些模块中的每一个不需要在任何一个时刻进行例示。例如，在模块包括使用软件而配置的通用硬件处理器的情况下，通用硬件处理器可以在不同时间被配置为相应的不同模块。软件可以相应地配置硬件处理器，例如以便在一个时间实例处构成特定的模块，并且在不同的时间实例处构成不同的模块。各模块也可以是软件或固件模块，它们操作来执行本文描述的方法。

图5是以计算机系统500为示例形式解说机器的框图，根据示例实施例，该机器内的指令集或序列能被执行以使该机器执行本文中讨论的方法中的任意一个方法。在替代实施例中，该机器作为独立设备进行操作，或可以被连接(如，联网)到其他机器。在被联网的部署中，该机器可在服务器-客户机网络环境中作为服务器或客户机来进行操作，或者可在对等(或分布式)网络环境中担当对等机。该机器可以是交通工具机载系统、机顶盒、可穿戴设备、个人计算机(PC)、平板PC、混合平板、个人数字助理(PDA)、移动电话、或能够执行指定要由该机器采取的动作的指令(顺序地或以其他方式)的任何机器。此外，虽然只示出单个机器，但是，术语“机器”也应当包括单独或联合地执行一组(或多组)指令以执行本文所讨论的任何一种或更多种方法的机器的任意集合。类似地，术语“基于处理器的系统”应当包括由处理器(例如，计算机)控制或操作以单独地或联合地执行指令来执行本文讨论的方法中的任何一者或多者的一个或多个机器的任何集合。

示例计算机系统500包括处理器502(例如，中央处理单元(CPU)及图形处理单元(GPU)中的至少一个或两个、处理器核、计算节点等)、主存储器504及静态存储器506，其均通过链路508(例如，总线)彼此通信。计算机系统500可进一步包括视频显示单元510、字母数字输入设备512(例如，键盘)和用户界面(UI)导航设备514(例如，鼠标)。在一个实施例中，该视频显示单元510、输入设备512及UI导航设备514被结合进触屏显示器中。计算机系统500可以附加包括存储设备516(如：驱动单元)、信号生成设备518(如：扬声器)、网络界面设备520及一个或多个传感器(未示出)，该传感器可以是例如：全球定位系统(GPS)传感器、罗盘、加速度计或其他传感器。

存储设备516包括机器可读介质522，该机器可读介质522上储存有一组或更多组数据结构和指令524(如，软件)，该一组或更多组数据结构和指令524具体化本文所描述的任何一种或多种方法或功能，或为该任何一种或多种方法或功能所用。在计算机系统500执行指令524期间，该指令524也可完全地或至少部分地驻留在主存储器504、静态存储器506和/或处理器502之内，所述主存储器504、静态存储器506和处理器502也构成机器可读介质。

虽然机器可读介质522在示例实施例中示出为单个介质，但术语“机器可读介质”可包括存储一条或多条指令524的单个或多个介质(如，集中式或分布式数据库和/或相关联的缓存及服务器)。术语“机器可读介质”也应当包括任何有形介质，该有形介质能够存储、编码或携带由机器执行的指令并且所述指令使机器执行本公开的任何一种或多种方法；或者该有形介质对为此类指令所用或与此类指令相关联的数据结构进行存储、编码和携带。术语“机器可读介质”应当相应地包括，但不限于：固态存储器以及光和磁介质。机器可读介质的具体示例包括非易失性存储器，作为示例包括但不限于半导体存储器设备(例如，电可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM))和闪存设备；诸如内部硬盘及可移动盘之类的磁盘；磁光盘；以及CD-ROM和DVD-ROM盘。

可使用传输介质，通过网络接口设备520，利用若干熟知的传输协议(如，HTTP)中的任意一种协议，进一步在通信网络526上发送或接收指令524。通信网络的示例包括：局域网(LAN)、广域网(WAN)、因特网、移动电话网络、普通老式电话(POTS)网络及无线数据网络(例如，Wi-Fi、3G及4G LTE/LTE-A或WiMAX网络)。术语“传输介质”应当包括能够存储、编码或携带由机器执行的指令的任何无形的介质，并且包括数字或模拟通信信号或者用于促进此类软件的通信的其他无形的介质。

附加注释和示例

示例1包括用于捕获媒体瞬间的主题(诸如设备、装置、或机器)，包括：用于接收配置参数的配置模块；用于在人群上方自主地操纵所述自主相机系统的飞行控制模块；用于基于所述配置参数在所述人群中搜索主体的搜索模块；以及用于当在所述人群中找到所述主体时执行动作的控制模块。

在示例2中，示例1的主题可包括，其中配置参数包括表征所述主体的搜索参数。

在示例3中，示例1到2中的任一项的主题可包括，其中搜索参数包括性别、年龄、关系、或情绪。

在示例4中，示例1到3中的任一项的主题可包括，其中为操纵自主相机系统，飞行控制模块要根据预定义路线来操纵自主相机系统。

在示例5中，示例1到4中的任一项的主题可包括，其中为操纵自主相机系统，飞行控制模块要通过自主相机系统任意地操纵自主相机系统。

在示例6中，示例1到5中的任一项的主题可包括，其中为搜索所述主体，搜索模块要：访问由自主相机系统获得的图像；以及分析该图像以标识所述主体。

在示例7中，示例1到6中的任一项的主题可包括，其中为了分析图像，搜索模块要：将该图像的图像数据和该主体的参数化数据传送给远程服务器，远程服务器用于分析图像数据以标识该主体；以及从远程服务器接收主体的指示。

在示例8中，示例1到7中的任一项的主题可包括，其中为了分析该图像，搜索模块要：访问配置参数以获得搜索参数；以及搜索该图像以寻找匹配该搜索参数的主体。

在示例9中，示例1到8中的任一项的主题可包括，其中所述搜索参数指示所述主体所展现的情绪；并且其中为了搜索所述图像以寻找所述对象，所述搜索模块要：搜索所述图像以寻找展现出所述情绪的人；以及将所述人标识为所述主体。

在示例10中，示例1到9中的任一项的主题可包括，其中为了搜索图像以寻找展现该情绪的人，搜索模块要：分析脸部表情或身体姿态之一以确定图像中的人是否正展现该情绪。

在示例11中，示例1到10中的任一项的主题可包括，其中，搜索参数指示人之间的关系，并且其中为了搜索图像以寻找该主体，搜索模块要：搜索该图像以寻找具有该关系的一群人；以及将该群人标识为主体。

在示例1 2中，示例1到11中的任一项的主题可包括，其中，为了搜索图像以寻找具有该关系的一群人，搜索模块要：分析该群人的物理特性；以及识别该群人的物理特性之间的相似度。

在示例13中，示例1到1 2中的任一项的主题可包括，其中，物理特性包括身高、发色、衣着、肤色、或体型。

在示例14中，示例1到13中的任一项的主题可包括，其中，为了搜索图像以寻找具有该关系的一群人，搜索模块要：从该群人中标识多个人；访问该多个人的社交简档；以及基于社交简档来确定该多个人属于共享社交群。

在示例15中，示例1到14中的任一项的主题可包括，其中为搜索所述主体，搜索模块要：访问由自主相机系统获得的音频数据；以及分析该音频数据以标识所述主体。

在示例1 6中，示例1到1 5中的任一项的主题可包括，其中，为了分析音频数据，搜索模块要：使用自然语言处理以标识词语或短语；以及在数据字典中执行查找以寻找该词语或短语。

在示例17中，示例1到16中的任一项的主题可包括，其中数据字典是使用配置参数来配置的。

在示例18中，示例1到17中的任一项的主题可包括，其中，为了执行该动作，控制模块要：录制该主体的视频。

在示例19中，示例1到18中的任一项的主题可包括，其中控制模块要：将视频传送到远程位置。

在示例20中，示例1到19中的任一项的主题可包括，其中远程位置包括生产演播室。

在示例21中，示例1到20中的任一项的主题可包括，其中，为了执行该动作，控制模块要：向用户通知该主体的位置。

在示例22中，示例1到21中的任一项的主题可包括，其中，为了执行该动作，控制模块要：将该主体的位置记入日志。

示例23包括一种用于捕获媒体瞬间的主题(诸如，方法、用于执行动作的手段、包括在被机器执行时使该机器执行动作的指令的机器可读介质、或者用于执行的装置)，该主题包括：在自主相机系统处接收配置参数；由所述自主相机系统在人群上方自主地操纵；由所述自主相机系统基于所述配置参数来在所述人群中搜索主体；以及当在所述人群中找到所述主体时，由所述自主相机系统执行动作。

在示例24中，示例23的主题可包括，其中配置参数包括表征所述主体的搜索参数。

在示例25中，示例23到24中的任一项的主题可包括，其中搜索参数包括性别、年龄、关系、或情绪。

在示例26中，示例23到25中的任一项的主题可包括，其中，操纵自主相机系统是根据预定义路线来执行的。

在示例27中，示例23到26中的任一项的主题可包括，其中，操纵自主相机系统是通过自主相机系统任意地执行的。

在示例28中，示例23到27中的任一项的主题可包括，其中，搜索主体包括：访问由自主相机系统获得的图像；以及分析该图像以标识主体。

在示例29中，示例23到28中的任一项的主题可包括，其中，分析该图像包括：将该图像的图像数据和该主体的参数化数据传送给远程服务器，远程服务器用于分析图像数据以标识该主体；以及从远程服务器接收主体的指示。

在示例30中，示例23到29中的任一项的主题可包括，其中，分析图像包括：访问配置参数以获得搜索参数；以及搜索图像以寻找匹配该搜索参数的对象。

在示例31中，示例23到30中的任一项的主题可包括，其中所述搜索参数指示所述主体所展现的情绪；并且其中搜索所述图像以寻找所述对象包括：搜索所述图像以寻找展现出所述情绪的人；以及将所述人标识为所述主体。

在示例32中，示例23到31中的任一项的主题可包括，其中，搜索图像以寻找展现该情绪的人包括：分析脸部表情或身体姿态之一以确定图像中的人是否正展现该情绪。

在示例33中，示例23到32中的任一项的主题可包括，其中，搜索参数指示人之间的关系，并且其中搜索图像以寻找该对象包括：搜索该图像以寻找具有该关系的一群人；以及将该群人标识为主体。

在示例34中，示例23到33中的任一项的主题可包括，其中，搜索图像以寻找具有该关系的一群人包括：分析该群人的物理特性；以及识别该群人的物理特性之间的相似度。

在示例35中，示例23到34中的任一项的主题可包括，其中，物理特性包括身高、发色、衣着、肤色、或体型。

在示例36中，示例23到35中的任一项的主题可包括，其中，搜索图像以寻找具有该关系的一群人包括：从该群人中标识多个人；访问该多个人的社交简档；并基于社交简档来确定该多个人属于共享社交群。

在示例37中，示例23到36中的任一项的主题可包括，其中，搜索以寻找主体包括：访问由自主相机系统获得的音频数据；以及分析该音频数据以标识主体。

在示例38中，示例23到37中的任一项的主题可包括，其中，分析音频数据包括：使用自然语言处理来标识词语或短语；以及在数据字典中执行查找以寻找该词语或短语。

在示例39中，示例23到38中的任一项的主题可包括，其中数据字典是使用配置参数来配置的。

在示例40中，示例23到39中的任一项的主题可包括，其中，执行动作包括：录制该主体的视频。

在示例41中，示例23到40中的任一项的主题可包括，将视频传送到远程位置。

在示例42中，示例23到41中的任一项的主题可包括，其中远程位置包括生产演播室。

在示例43中，示例23到42中的任一项的主题可包括，其中，执行动作包括：向用户通知该主体的位置。

在示例44中，示例23到43中的任一项的主题可包括，其中，执行动作包括：将该主体的位置记入日志。

示例45包括包含指令的至少一个机器可读介质，所述指令在被机器执行时致使所述机器执行如示例23-44中的任一项的操作。

示例46包括一种包括用于执行示例23-44中的任一个的装置的设备。

示例47包括用于捕获媒体瞬间的主题(诸如设备、装备、或机器)，包括：用于在自主相机系统处接收配置参数的装置；用于由所述自主相机系统在人群上方自主地操纵的装置；用于由所述自主相机系统基于所述配置参数来在所述人群中搜索主体的装置；以及用于当在所述人群中找到所述主体时，由所述自主相机系统执行动作的装置。

在示例48中，示例47的主题可包括，其中配置参数包括表征主体的搜索参数。

在示例49中，示例47到48中的任一项的主题可包括，其中搜索参数包括性别、年龄、关系、或情绪。

在示例50中，示例47到49中的任一项的主题可包括，其中，用于操纵自主相机系统的装置是根据预定义路线来执行的。

在示例51中，示例47到50中的任一项的主题可包括，其中，用于操纵自主相机系统的装置是通过自主相机系统任意地执行的。

在示例52中，示例47到51中的任一项的主题可包括，其中，用于搜索主体的装置包括：用于访问由自主相机系统获得的图像的装置；以及用于分析该图像以标识主体的装置。

在示例53中，示例47到52中的任一项的主题可包括，其中，用于分析该图像的装置包括：用于将该图像的图像数据和该主体的参数化数据传送给远程服务器的装置，远程服务器用于分析图像数据以标识该主体；以及用于从远程服务器接收主体的指示的装置。

在示例54中，示例47到53中的任一项的主题可包括，其中，用于分析图像的装置包括：用于访问配置参数以获得搜索参数的装置；以及用于搜索图像以寻找匹配该搜索参数的对象的装置。

在示例55中，示例47到54中的任一项的主题可包括，其中所述搜索参数指示所述主体所展现的情绪；并且其中搜索所述图像以寻找所述对象包括：用于搜索所述图像以寻找展现出所述情绪的人的装置；以及用于将所述人标识为所述主体的装置。

在示例56中，示例47到55中的任一项的主题可包括，其中，搜索图像以寻找展现该情绪的人包括：用于分析脸部表情或身体姿态之一以确定图像中的人是否正展现该情绪的装置。

在示例57中，示例47到56中的任一项的主题可包括，其中，搜索参数指示人之间的关系，并且其中用于搜索图像以寻找该对象的装置包括：用于搜索该图像以寻找具有该关系的一群人的装置；以及用于将该群人标识为主体的装置。

在示例58中，示例47到57中的任一项的主题可包括，其中，用于搜索图像以寻找具有该关系的一群人的装置包括：用于分析该群人的物理特性的装置；以及用于识别该群人的物理特性之间的相似度的装置。

在示例59中，示例47到58中的任一项的主题可包括，其中，物理特性包括身高、发色、衣着、肤色、或体型。

在示例60中，示例47到59中的任一项的主题可包括，其中，用于搜索图像以寻找具有该关系的一群人的装置包括：用于从该群人中标识多个人的装置；用于访问该多个人的社交简档的装置；以及用于基于社交简档来确定该多个人属于共享社交群的装置。

在示例61中，示例47到60中的任一项的主题可包括，其中，用于搜索主体的装置包括：用于访问由自主相机系统获得的音频数据的装置；以及用于分析该音频数据以标识主体的装置。

在示例62中，示例47到61中的任一项的主题可包括，其中，用于分析音频数据的装置包括：用于使用自然语言处理来标识词语或短语的装置；以及用于在数据字典中执行查找以寻找该词语或短语的装置。

在示例63中，示例47到62中的任一项的主题可包括，其中数据字典是使用配置参数来配置的。

在示例64中，示例47到63中的任一项的主题可包括，其中用于执行动作的装置包括：用于录制主体的视频的装置。

在示例65中，示例47到64中的任一项的主题可包括，用于将视频传送到远程位置的装置。

在示例66中，示例47到65中的任一项的主题可包括，其中远程位置包括生产演播室。

在示例67中，示例47到66中的任一项的主题可包括，其中，用于执行动作的装置包括：用于向用户通知该主体的位置的装置。

在示例68中，示例47到67中的任一项的主题可包括，其中用于执行动作的装置包括：用于将主体的位置记入日志的装置。

以上具体实施方式包括对附图的引用，附图形成具体实施方式的部分。附图通过说明来示出可实践的特定实施例。这些实施例在本文中也称为“示例”。此类示例可以包括除所示或所述的那些元件以外的元件。然而，还构想了包括所示或所述元件的示例。此外，还构想出的是使用所示或所述的那些元件的任何组合或排列的示例，或参照本文中示出或描述的特定示例(或其一个或多个方面)，或参照本文中示出或描述的其他示例(或其一个或多个方面)。

在此文档中引用的出版物、专利和专利文档通过引用被整体结合在本文中，就好像通过引用单独地被结合那样。在本文档与通引用结合在的那些文档之间不一致的用法的情况下，所结合的(诸)引用文档中的用法是对此文档的用法的补充；对于不可调和的不一致性，此文档中的用法占主导。

在此文档中，如在专利文档中常见的那样，使用术语“一”(“a”或“an”)以包括一个或多于一个，这独立于“至少一个”或“一个或多个”的任何其他实例或用法。在此文档中，使用术语“或”来指非排他性的“或”，使得“A或B”包括“A但非B”、“B但非A”以及“A和B”，除非另外指示。在所附权利要求书中，术语“包括(including)”和“其中(in which)”被用作相应的术语“包括(comprising)”和“其中(wherein)”的普通英语等价词。此外，在所附权利要求书中，术语“包括”和“包含”是开放式的，也就是说，在权利要求中除此类术语之后列举的那些元件之外的元件的系统、设备、制品或过程仍被视为落在那项权利要求的范围内。此外，在所附权利要求书中，术语“第一”、“第二”和“第三”等仅被用作标记，并且不旨在表明对它们的对象的数字顺序。

以上描述旨在是说明性的，而非限制性的。例如，可结合其他实施例来使用以上描述的示例(或者其一个或多个方面)。可诸如由本领域普通技术人员在审阅以上描述之后来使用其他实施例。摘要允许读者快速地确定本技术公开的性质。提交该摘要，并且理解该摘要将不用于解释或限制权利要求的范围或含义。此外，在以上具体实施方式中，各种特征可以共同成组以使本公开流畅。然而，权利要求可以不陈述本文中公开的每一特征，因为实施例可以表征所述特征的子集。此外，实施例可以包括比特定示例中公开的特征更少的特征。因此，所附权利要求书由此被结合到具体实施方式中，一项权利要求作为单独的实施例而独立存在。本文中公开的实施例的范围应当参照所附权利要求书以及此类权利要求所赋予权利的等价方案的完整范围来确定。

Claims

1.一种用于捕获媒体瞬间的自主相机系统，所述自主相机系统包括：

用于接收配置参数的配置模块；

用于在人群上方自主地操纵所述自主相机系统的飞行控制模块；

用于基于所述配置参数在所述人群中搜索主体的搜索模块；以及

用于当在所述人群中找到所述主体时执行动作的控制模块。

2.如权利要求1所述的系统，其特征在于，所述配置参数包括表征所述主体的搜索参数。

3.如权利要求2所述的系统，其特征在于，所述搜索参数包括性别、年龄、关系、或情绪。

4.如权利要求1所述的系统，其特征在于，为操纵所述自主相机系统，所述飞行控制模块要根据预定义路线来操纵所述自主相机系统。

5.如权利要求1所述的系统，其特征在于，为操纵所述自主相机系统，所述飞行控制模块要通过所述自主相机系统任意地操纵所述自主相机系统。

6.如权利要求1所述的系统，其特征在于，为了搜索所述主体，所述搜索模块要：

访问由所述自主相机系统获得的图像；以及

分析所述图像以标识所述主体。

7.如权利要求6所述的系统，其特征在于，为了分析所述图像，所述搜索模块要：

将所述图像的图像数据和所述主体的参数化数据传送给远程服务器，所述远程服务器用于分析所述图像数据以标识所述主体；以及

从所述远程服务器接收所述主体的指示。

8.如权利要求6所述的系统，其特征在于，为了分析所述图像，所述搜索模块要：

访问所述配置参数来获得搜索参数；以及

搜索所述图像以寻找匹配所述搜索参数的对象。

9.如权利要求8所述的系统，其特征在于，所述搜索参数指示所述主体所展现的情绪；并且其中为了搜索所述图像以寻找所述对象，所述搜索模块要：

搜索所述图像以寻找展现出所述情绪的人；以及

将所述人标识为所述主体。

10.如权利要求9所述的系统，其特征在于，为了搜索所述图像以寻找展现出所述情绪的人，所述搜索模块要：

分析脸部表情或身体姿态之一以确定所述图像中的人是否正展现出所述情绪。