CN110892411B - 检测实时媒体中的流行面部 - Google Patents
检测实时媒体中的流行面部 Download PDFInfo
- Publication number
- CN110892411B CN110892411B CN201880047003.7A CN201880047003A CN110892411B CN 110892411 B CN110892411 B CN 110892411B CN 201880047003 A CN201880047003 A CN 201880047003A CN 110892411 B CN110892411 B CN 110892411B
- Authority
- CN
- China
- Prior art keywords
- faces
- face
- popular
- media
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/30—Scenes; Scene-specific elements in albums, collections or shared content, e.g. social network photos or video
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/166—Detection; Localisation; Normalisation using acquisition arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/52—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/142—Constructional details of the terminal equipment, e.g. arrangements of the camera and the display
- H04N2007/145—Handheld terminals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- User Interface Of Digital Computer (AREA)
- Telephonic Communication Services (AREA)
- Information Transfer Between Computers (AREA)
Abstract
在一实施例中,用户设备UE使用面部辨识来辨识存储于所述UE上的媒体文件集内的面部集。所述UE基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集。所述UE使用面部辨识扫描实时媒体以确定来自所述流行面部集的任何流行面部是否存在于所述实时媒体中。所述UE基于所述扫描是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作。借助于实例,所述动作可包含将一或多个增强效应添加到所述实时媒体,授权继续通信操作,授权对所述UE的接入,或其任何组合。
Description
技术领域
实施例涉及扫描实时媒体流以检测存储于用户设备(UE)上的媒体文件集当中流行的一或多个面部。
背景技术
某些用户设备(UE)支持面部辨识功能性。此面部辨识功能性可用以扫描存储于相应UE上的媒体文件(例如,相片)以检测面部。接着,如果跨多个媒体文件检测到特定个人的面部,那么可用在其中检测到所述特定个人的面部的媒体文件(例如,相片、视频等)填充针对所述特定个人的特定于脸部的媒体群组。使用媒体图库应用程序,用户可根据面部来筛选媒体文件,其中将表示特定于面部的媒体群组的文件夹呈现给用户以供选择。如果已经选择,那么用户可滚动特定于面部的媒体群组中的相片(例如,各自具有定义特定于面部的媒体群组的特定用户的面部),观看展示特定于面部的媒体群组中的相片的幻灯片,或触发特定于面部的媒体群组中的相片以发送到外部实体(例如,经由文本或电子邮件发送到另一UE,发布到社交网络服务,例如Facebook,备份到文件存储服务,例如Dropbox,等等)。
发明内容
一实施例是针对一种操作用户设备(UE)的方法,其包含使用面部辨识来辨识存储于所述UE上的媒体文件集内的面部集;基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集;使用面部辨识扫描实时媒体以确定来自所述流行面部集的任何流行面部是否存在于所述实时媒体中;基于所述扫描是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作,所述动作包含将一或多个增强效应添加到所述实时媒体,授权继续通信操作,授权对所述UE的接入,或其任何组合。
另一实施例是针对一种UE,其包含用于使用面部辨识来辨识存储于所述UE上的媒体文件集内的面部集的装置;用于基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集的装置;用于使用面部辨识扫描实时媒体以确定来自所述流行面部集的任何流行面部是否存在于所述实时媒体中的装置;用于基于所述扫描是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作的装置,所述动作包含将一或多个增强效应添加到所述实时媒体,授权继续通信操作,授权对所述UE的接入,或其任何组合。
另一实施例是针对一种UE,其包含至少一个处理器,其经配置以使用面部辨识来辨识存储于所述UE上的媒体文件集内的面部集;基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集;使用面部辨识扫描实时媒体以确定来自所述流行面部集的任何流行面部是否存在于所述实时媒体中;基于所述扫描是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作,所述动作包含将一或多个增强效应添加到所述实时媒体,授权继续通信操作,授权对所述UE的接入,或其任何组合。
另一实施例是针对一种含有存储在上面的指令的非暂时性计算机可读媒体,所述指令当由UE执行时致使所述UE执行动作,所述指令包括:致使所述UE使用面部辨识来辨识存储于所述UE上的媒体文件集内的面部集的至少一个指令;致使所述UE基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集的至少一个指令;致使所述UE使用面部辨识扫描实时媒体以确定来自所述流行面部集的任何流行面部是否存在于所述实时媒体中的至少一个指令;致使所述UE基于所述扫描是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作的至少一个指令,所述动作包含将一或多个增强效应添加到所述实时媒体,授权继续通信操作,授权对所述UE的接入,或其任何组合。
附图说明
参考结合附图考虑的以下详细描述将更好理解本公开的实施例,且易于获得对本公开的实施例的更完整了解,所述附图仅出于说明目的呈现而非限制本公开,且在附图中:
图1说明根据本公开的实施例的无线通信系统的高层级系统架构。
图2说明根据本公开的实施例的用户设备(UE)。
图3说明包含根据本公开的实施例的结构组件的通信装置。
图4说明根据本公开的实施例的结合实时媒体的面部辨识扫描执行动作的过程。
图5说明根据本公开的实施例的描绘“人物”视图中的两个不同的UE的两个不同的媒体图库的截屏,其中每一相应的媒体图库呈现表示六个不同的特定于面部的媒体群组的六个缩略图。
图6说明根据本公开的实施例的图4的过程的实例实施方案。
图7A说明根据本公开的实施例的其中用户A被爱心环绕的截屏。
图7B说明根据本公开的实施例的其中用滑稽面罩描绘用户A和X的面部的截屏。
图7C说明根据本公开的实施例的其中用户A和B的面部与捕获含有用户A和B的相应面部的最新媒体文件的时间和/或方位的指示相关联的截屏。
图8说明根据本公开的另一实施例的图4的过程的实例实施方案。
图9A说明根据本公开的另一实施例的图4的过程的实例实施方案。
图9B说明根据本公开的另一实施例的图4的过程的实例实施方案。
图10A说明根据本公开的实施例的描绘圣地亚哥旅行的视频概要的播发的截屏。
图10B说明根据本公开的实施例的描绘共享含有流行面部的媒体文件的社交网络提示的截屏。
图10C说明根据本公开的实施例的描绘包含针对流行面部的特定于面部的媒体群组的朋友和家庭分类的截屏。
图10D说明根据本公开的实施例的描绘将含有流行面部的媒体文件自动标记为“收藏夹”媒体文件并且将其添加到媒体图库应用程序维持的“收藏夹”文件夹的的截屏。
图10E说明根据本公开的实施例的描绘作为日历提醒添加的含有流行面部的相片的一年期提醒的截屏。
图10F说明根据本公开的实施例的描绘UE上的提示用户在与朋友通话期间分享含有朋友的流行面部的媒体文件的信使应用程序的截屏。
图10G说明根据本公开的实施例的描绘批量照片传送提示的截屏。
图10H说明根据本公开的实施例的描绘基于与流行面部的关联的互为朋友共性的表示的截屏。
图10I说明根据本公开的实施例的描绘其中要求UE的用户指定哪些名人看起来最像特定的流行面部的游戏的截屏。
图10J说明根据本公开的实施例的描绘其中要求UE的用户猜测谁拥有特定流行面部的最多照片的游戏的截屏。
图10K说明根据本公开的实施例的描绘提示用户查看来自先前交互的含有同一流行面部的较老照片和/或视频的截屏。
具体实施方式
多个UE支持实时媒体的重放。举例来说,配备有相机的UE可进入取景器模式,其中将正在由相机捕获的视觉媒体的表示呈现给用户(例如,使得用户可按需要将相机定向以记录相片和/或视频等)。在另一实例中,UE可重放从外部装置接收的实时媒体。在一个实例中,外部装置可为将实时媒体反馈流式传输到UE的媒体服务器(例如,Facebook Live等)。在另一实例中,外部装置可为结合视频电话(例如,Facetime电话、Google Duo电话、等)将实时媒体反馈流式传输到UE的另一UE。
虽然某些UE出于筛选或分类媒体图库应用程序中的媒体文件的目的支持面部辨识,但通常不利用面部辨识促进与实时媒体重放相关联的功能性。因此,本公开的实施例涉及辨识存储于UE上的媒体文件中的面部,基于其在媒体文件当中的流行性识别流行面部集,并且接着使用所识别的组的流行面部执行动作,如下文将更详细地描述。
举例来说,如果在实时媒体中(例如,在取景器模式中,在来自尝试发起视频电话、由UE捕获的相片或视频的呼叫者的传入视频流中,等等)检测到流行面部,那么UE可将一或多个增强效应添加到实时媒体(例如,将视觉假影添加到实时媒体内的所检测到的流行面部,改变与实时媒体相关联的色彩方案,将扩增现实信息添加到实时媒体,自动跟踪,自动聚焦和/或放大实时媒体内的所检测的流行面部,等),可授权继续通信操作(例如,授权视频电话等)和/或可授权接入UE(例如,解锁UE等)。
在针对本公开的特定实施例的以下描述和相关图式中公开本公开的各方面。可在不脱离本公开的范围的情况下设计替代性实施例。另外,将不会详细描述或将省略本公开的众所周知的元件,以免混淆本公开的相关细节。
本文使用词语“示范性”和/或“实例”来意指“充当实例、例子或说明”。本文中描述为“示范性”和/或“实例”的任何实施例未必应解释为比其它实施例优选或有利。同样,术语“本公开的实施例”并不需要本公开的所有实施例包含所论述的特征、优点或操作模式。
另外,许多实施例是依据待由例如计算装置的元件执行的动作序列来描述的。将认识到,本文中描述的各种动作可由特定电路(例如,专用集成电路(ASIC)),由正由一或多个处理器执行的程序指令或由所述两个的组合来执行。另外,本文中所描述的这些动作序列可被视为全部在任何形式的计算机可读存储媒体内体现,所述计算机可读存储媒体具有存储于其中的对应计算机指令集,所述计算机指令在执行时将使相关联的处理器执行本文中所描述的功能性。因此,本公开的各个方面可以多种不同形式来实施,所述形式全都落在所主张的标的物的范围内。另外,对于本文中所描述的实施例中的每一个来说,任何此类实施例的对应形式可在本文中被描述为例如“经配置以(执行所描述的动作)的逻辑”。
客户端装置,在本文中被称作用户设备(UE),可为移动的或固定的,且可与有线接入网络和/或无线电接入网络(RAN)通信。如本文所使用,术语“UE”可互换地被称作“接入终端”或“AT”、“无线装置”、“订户装置”、“订户终端”、“订户站”、“用户终端”或UT、“移动终端”、“移动站”和其变体。在一实施例中,UE可经由RAN与核心网络通信,并且UE可通过核心网络与例如因特网等外部网络连接。当然,对于UE来说,连接到核心网络和/或因特网的其它机制也是可能的,例如经由有线接入网络、WiFi网络(例如,基于IEEE 802.11等),等等。UE可由若干类型的装置中的任一个实施,包含但不限于蜂窝电话、个人数字助理(PDA)、寻呼机、手提式计算机、台式计算机、PC卡、小型闪存装置、外部或内部调制解调器、无线或有线电话,等等。UE可向RAN发送信号所借助的通信链路被称作上行链路信道(例如,反向业务信道、反向控制信道、接入信道等)。RAN可向UE发送信号所借助的通信链路被称作下行链路或前向链路信道(例如,寻呼信道、控制信道、广播信道、前向业务信道等)。UE可向其它UE发送信号所借助的通信链路被称作对等(P2P)或装置到装置(D2D)信道。
图1说明根据本公开的实施例的无线通信系统100的高层级系统架构。无线通信系统100含有UE 1…N。举例来说,在图1中,UE 1…2被说明为蜂窝呼叫电话,UE 1…6被说明为蜂窝触摸屏电话或智能电话,且UE N被说明为台式计算机或PC。
参考图1,UE 1…N经配置以经由物理通信接口或层(图1中示出为空中接口104、106、108和/或直接有线连接)与接入网络(例如,RAN 120、接入点125等)通信。空中接口104和106可符合给定蜂窝通信协议(例如,CDMA、EVDO、eHRPD、GSM、EDGE、W-CDMA、4G LTE、5GLTE等),而空中接口108可符合无线IP协议(例如,IEEE 802.11)。RAN 120可包含经由空中接口(例如,空中接口104和106)服务UE的多个接入点。RAN120中的接入点可以被称作接入节点或AN、接入点或AP、基站或BS、Node B、eNode B等等。这些接入点可为地面接入点(或接地站),或卫星接入点。RAN 120可经配置以连接到核心网络140,所述核心网络140可执行多种功能,包含桥接由RAN 120服务的UE与由RAN 120或完全不同的RAN服务的其它UE之间的电路切换(CS)呼叫,且还可调解与例如因特网175的外部网络进行的包交换(PS)数据的交换。
在一些实例中,因特网175包含若干路由代理和处理代理(为方便起见,图1中未示出)。在图1,UE N示出为直接连接到因特网175(即,与核心网络140分开,例如经由基于WiFi或基于802.11的网络的以太网连接)。因特网175可由此用以桥接经由核心网络140在UE1…N之间的包交换数据通信。图1中还展示与RAN 120分开的接入点125。接入点125可独立于核心网络140连接到因特网175(例如,经由例如FiOS的光通信系统、电缆调制解调器等)。空中接口108可经由本地无线连接(例如,在一实例中为IEEE802.11)服务UE 5或UE 6。UE N示出为台式计算机,其有线连接到因特网175,例如直接连接到调制解调器或路由器,在一实例中,所述调制解调器或路由器可对应于接入点125自身(例如,对于具有有线连接性和无线连接性两者的WiFi路由器)。
参考图1,服务器170示出为连接到因特网175、核心网路140,或这两者。服务器170可实施为多个结构上分开的服务器,或替代地可对应于单一服务器。服务器170可对应于任何类型的服务器,例如网络服务器(例如,托管网页)、应用程序下载服务器,或支持例如因特网协议语音(VoIP)会话、即按即说(PTT)会话、群通信会话、社交网络服务等特定通信服务的应用程序服务器。
参考图1,UE 1…3描绘为D2D网络或D2D群组185的部分,其中UE 1和3经由空中接口104连接到RAN 120。在一实施例中,UE 2还可经由UE 1和/或3的介导获取对RAN 120的间接接入,其中数据‘跳’到/离UE 2和代表UE 2的RAN 120通信的UE 1和3中的一个(或多个)。
图2说明根据本公开的实施例的UE 200。UE 200包含一或多个处理器205(例如,一或多个ASIC、一或多个数字信号处理器(DSP)等)和存储器210(例如,RAM、ROM、EEPROM、快闪卡,或对计算机平台为共同的任何存储器)。存储器210可包含内容(例如,可经由媒体图库应用程序存取的媒体文件),以及可通过一或多个处理器205经由相关联操作系统执行的各种应用程序(例如,媒体图库应用程序、面部辨识模块、媒体捕获或相机应用程序、一或多个信使或呼叫应用程序、网页浏览器导航或制图应用程序等)。UE 200还包含一或多个UI输入组件215(例如,键盘和鼠标、触摸屏、麦克风、一或多个按钮例如音量或电源按钮,等)和一或多个UI输出组件220(例如,扬声器、显示屏、用于使UE 200振动的振动装置等)。
UE 200另外包含有线通信接口225和无线通信接口230。在实例实施例中,有线通信接口225可用以支持到外围装置的有线本地连接(例如,USB连接、微型USB、火线或雷电连接、头戴式耳机插孔、图形端口,例如串行、VGA、HDMI、DVI或DisplayPort、音频端口等)和/或到有线接入网络的有线本地连接(例如,经由以太网缆线或可充当到有线例如HDMI v1.4或更高的接入网络的网桥的另一类型的缆线,等)。在另一实例实施例中,无线通信接口230包含用于根据本地无线通信协议(例如,WLAN或WiFi、WiFi直连、蓝牙LTE-D、Miracast等)进行通信的一或多个无线收发器。无线通信接口230还可包含用于与蜂窝RAN(例如,经由CDMA、W-CDMA、时分多址(TDMA)、频分多址(FDMA)、正交频分多路复用(OFDM)、GSM或其它可用于无线通信网路或数据通信网络中的协议)通信的一或多个无线收发器。UE 200的各种组件205-230可经由总线235彼此通信。
参考图2,UE 200可对应于任何类型的UE,包含但不限于智能电话、手提式计算机、台式计算机、平板计算机、可穿戴装置(例如,计步器、智能手表等)等。在图2中描绘UE 200的两个特定实施实例,其示出为手提式计算机240和触摸屏装置255(例如,智能电话、平板计算机等)。手提式计算机240包含显示屏245和UI区域250(例如,键盘、触摸板、电源按钮等),且虽然未示出,但手提式计算机240可包含各种端口以及有线和/或无线收发器(例如,以太网卡、WiFi卡、宽带卡、卫星定位系统(SPS)天线,例如全球定位系统(GPS)天线等)。
触摸屏装置255配置有触摸屏显示器260、外围设备按钮265、270、275和280(例如,电源按钮、音量或振动控制按钮、飞行模式双态切换按钮等),以及至少一个前面板按钮285(例如,主页按钮等),以及如所属领域中已知的其它组件。虽然并未明确地展示为触摸屏装置255的部分,但触摸屏装置255可包含构建到触摸屏装置255的外部壳体中的一或多个外部天线和/或一或多个集成天线,其包含但不限于WiFi天线、蜂窝式天线、SPS天线(例如,GPS天线)等等。
图3说明包含根据本公开的实施例的结构组件的通信装置300。通信装置300可对应于上文所提及的通信装置(包含但不限于UE 200)中的任一个。
参考图3,通信装置300包含经配置以接收和/或发射信息的收发器电路305。在实例中,如果通信装置300对应于无线通信装置(例如,UE 200),那么经配置以接收和/或发射信息的收发器电路305可包含无线通信接口(例如,蓝牙、WiFi、WiFi直连、LTE直连等),例如无线收发器和相关联硬件(例如,RF天线、调制解调器、调制器和/或解调器等)。在另一实例中,经配置以接收和/或发射信息的收发器电路305可对应于有线通信接口(例如,串联连接、USB、火线或雷电连接、可接入因特网175所借助的以太网连接等)。在另一实例中,经配置以接收和/或发射信息的收发器电路305可包含感测或测量硬件,通信装置300可借此监测其本地环境(例如加速度计、温度传感器、光传感器、用于监测本地RF信号的天线等)。经配置以接收和/或发射信息的收发器电路305还可包含软件,所述软件当执行时准许经配置以接收和/或发射信息的收发器电路305的相关联硬件执行其接收和/或发射功能。然而,经配置以接收和/或发射信息的收发器电路305不仅是对应于软件,且经配置以接收和/或发射信息的收发器电路305至少部分地依赖于结构硬件来实现其功能性。此外,经配置以接收和/或发射信息的收发器电路305可通过除了“接收”和“发射”之外的语言表明,只要基础功能对应于接收或发射功能即可。举例来说,如作为特定类型的接收功能,例如获得、获取、检索、测量等功能在某些情况下可通过经配置以接收和/或发射信息的收发器电路305执行。在另一实例中,如作为特定类型的发射功能,例如发送、传递、传送、转发等功能在某些情况下可通过经配置以接收和/或发射信息的收发器电路305执行。对应于其它类型的接收和/或发射功能的其它功能还可通过经配置以接收和/或发射信息的收发器电路305执行。
参考图3,通信装置300另外包含经配置以处理信息的至少一个处理器310。可由经配置以处理信息的至少一个处理器310执行的处理类型的实例实施方案包含但不限于执行确定、建立连接、在不同信息选项之间作出选择、执行与数据相关的评估、与耦合到通信装置300的传感器交互以执行测量操作、将信息从一个格式转换到另一格式(例如,在不同协议之间,例如,.wmv到.avi等)等等。举例来说,经配置以处理信息的至少一个处理器310可包含通用处理器、DSP、ASIC、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件,或其经设计以执行本文所描述的功能的任何组合。通用处理器可为微处理器,但在替代方案中,经配置以处理信息的至少一个处理器310可为任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算装置的组合(例如DSP和微处理器的组合、多个微处理器、与DSP核心结合的一或多个微处理器,或任何其它此类配置)。经配置以处理信息的至少一个处理器310还可包含软件,所述软件在被执行时准许经配置以处理信息的至少一个处理器310的相关联硬件执行其处理功能。然而,经配置以处理信息的至少一个处理器310不仅是对应于软件,且经配置以处理信息的至少一个处理器310至少部分地依赖于结构硬件来实现其功能性。此外,经配置以处理信息的至少一个处理器310可通过除了“处理”之外的语言表明,只要基础功能对应于处理功能即可。举例来说,作为特定类型的处理功能,例如评估、确定、计算、识别等功能在某些情况下可通过经配置以处理信息的至少一个处理器310执行。对应于其它类型的处理功能的其它功能还可通过经配置以处理信息的至少一个处理器310执行。
参考图3,通信装置300另外包含经配置以存储信息的存储器315。在一实例中,经配置以存储信息的存储器315可包含至少一非暂时性存储器和相关联硬件(例如存储器控制器等)。举例来说,经配置以存储信息的存储器315中所包含的非暂时性存储器可对应于RAM、快闪存储器、ROM、可擦除可编程ROM(EPROM)、EEPROM、寄存器、硬盘、可装卸式磁盘、CD-ROM或所属领域中已知的任何其它形式的存储媒体。经配置以存储信息的存储器315还可包含软件,所述软件在被执行时准许经配置以存储信息的存储器315的相关联硬件执行其存储功能。然而,经配置以存储信息的存储器315并不仅是对应于软件,且经配置以存储信息的存储器315至少部分地依赖于结构硬件来实现其功能性。此外,经配置以存储信息的存储器315可通过除了“存储”之外的语言表明,只要基础功能对应于存储功能即可。举例来说,作为特定类型的存储功能,例如高速缓存、保存等功能在某些情况下可通过经配置以存储信息的存储器315执行。对应于其它类型的存储功能的其它功能还可通过经配置以存储信息的存储器315执行。
参考图3,通信装置300另外包含经配置以呈现信息的用户接口输出电路320。在实例中,经配置以呈现信息的用户接口输出电路320可至少包含输出装置和相关联硬件。举例来说,输出装置可包含视频输出装置(例如,显示屏、可运载视频信息的端口,例如USB、HDMI等)、音频输出装置(例如,扬声器、可运载音频信息的端口,例如麦克风插孔、USB、HDMI等)、振动装置和/或可借以格式化信息以用于由通信装置300的用户或操作人员输出或实际输出的任何其它装置。举例来说,如果通信装置300对应于如图2所示的UE 200,那么经配置以呈现信息的用户接口输出电路320可包含显示器,例如显示屏245或触摸屏显示器260。经配置以呈现信息的用户接口输出电路320还可包含软件,所述软件当执行时准许经配置以呈现信息的用户接口输出电路320的相关联硬件执行其呈现功能。然而,经配置以呈现信息的用户接口输出电路320不仅是对应于软件,且经配置以呈现信息的用户接口输出电路320至少部分地依赖于结构硬件来实现其功能性。此外,经配置以呈现信息的用户接口输出电路320可通过除了“呈现”之外的语言表明,只要基础功能对应于呈现功能即可。举例来说,作为特定类型的呈现功能,例如显示、输出、提示、传送等的功能在某些情况下可通过经配置以呈现信息的用户接口输出电路320执行。对应于其它类型的呈现功能的其它功能也可通过经配置以呈现信息的用户接口输出电路320执行。
参考图3,通信装置300另外包含经配置以接收本地用户输入的用户接口输入电路325。在实例中,经配置以接收本地用户输入的用户接口输入电路325可至少包含用户输入装置和相关联硬件。举例来说,用户输入装置可包含按钮、触摸屏显示器、键盘、相机、音频输入装置(例如,麦克风或可运载音频信息的端口,例如麦克风插孔等),以及/或可借以从通信装置300的用户或操作人员接收信息的任何其它装置。举例来说,如果通信装置300对应于如图2所示的UE 200,那么经配置以接收本地用户输入的用户接口输入电路325可对应于UI区域250或触摸屏显示器260等。经配置以接收本地用户输入的用户接口输入电路325还可包含软件,所述软件当执行时准许经配置以接收本地用户输入的用户接口输入电路325的相关联硬件执行其输入接收功能。然而,经配置以接收本地用户输入的用户接口输入电路325不仅是对应于软件,且经配置以接收本地用户输入的用户接口输入电路325至少部分地依赖于结构硬件来实现其功能性。此外,经配置以接收本地用户输入的用户接口输入电路325可通过除了“接收本地用户输入”之外的语言表明,只要基础功能对应于接收本地用户功能即可。举例来说,作为特定类型的接收本地用户功能,例如获得、接收、收集等功能在某些情况下可通过经配置以接收本地用户输入的用户接口输入电路325执行。对应于其它类型的接收本地用户输入功能的其它功能还可通过经配置以接收本地用户输入的用户接口输入电路325执行。
参考图3,虽然图3中将305到325的经配置结构组件示出为经由相关联通信总线(未明确示出)隐式地彼此耦合的单独或不同块,但将了解,305到325的相应经配置结构组件借此执行其相应功能性的硬件和/或软件可部分地重叠。举例来说,用于促进305到325的经配置结构组件的功能性的任何软件可存储于与经配置以存储信息的存储器315相关联的非暂时性存储器中,使得305到325的经配置结构组件部分地基于由经配置以存储信息的存储器315存储的软件的操作而各自执行其相应功能性(即,在此情况下,软件执行)。同样,与305到325的经配置结构组件中的一个直接相关联的硬件可偶尔由305到325的经配置结构组件中的其它组件借用或使用。举例来说,经配置以处理信息的至少一个处理器310可将数据格式化为适当格式,然后由经配置以接收和/或发射信息的收发器电路305发射,使得经配置以接收和/或发射信息的收发器电路305部分地基于与经配置以处理信息的至少一个处理器310相关联的结构硬件的操作而执行其功能性(即,在此情况下,数据的发射)。
图4说明根据本公开的实施例的结合实时媒体的面部辨识扫描执行动作的过程。在UE(例如在实例中为图2的的UE 200)处执行图4的过程。
参考图4,在框400处,UE使用面部辨识来辨识存储于UE上的媒体文件集内的面部集。在实例中,所述媒体文件集可对应于存储为UE上的媒体图库的部分(例如,媒体图库中的所有媒体文件、是媒体图库内的特定文件夹或相册(album)集的部分的媒体文件子集等)的媒体文件(例如,相片、视频等)。在另一实例中,所述媒体文件集可包含从UE可接入的云存储服务(例如,Dropbox、Google Drive等)和/或UE可接入的社交网络服务(例如,Facebook等)下载到UE的一或多个媒体文件。此外,所述媒体文件集可包含嵌入于(或附接到)与信使服务(例如,电子邮件、SMS/MMS、iMessage、WhatsApp、Facebook Messenger等)相关联的消息对应性内的媒体文件。因此,存储于UE上的媒体文件集可包含在UE上本地捕获的媒体文件,以及从一或多个外部源下载到UE的媒体文件。所述媒体文件集可由UE的用户针对框400处的面部辨识进行选择,或替代地可由UE进行自动选择(例如,在特定时段或间隔,当捕获到媒体文件时,当下载所提交的媒体时等,针对面部辨识扫描添加到媒体图库和/或添加到媒体图库内的特定文件夹/相册的每一媒体文件)。举例来说,可经由存储于UE上的面部辨识模块的执行来实施框400的面部辨识。在实例中,面部辨识模块可为非相依应用程序,UE的操作系统的部分,或集成到较大应用程序(例如,媒体图库应用程序等)中。
参考图4,在框405处,UE基于包含一或多个面部在媒体文件集当中的流行性的准则集来识别流行面部集。在实例中,用以在框405处识别流行面部集的所述准则集可包含至少部分地基于流行性将面部集当中的面部排名所借助的一或多个排名规则,或使面部集当中的面部有资格成为流行面部集需符合的流行性阈值,或将面部集当中的至少一个面部的流行性属性加权所借助的一或多个次要准则,或其任何组合。所述准则集可为默认的(或系统指定的)、用户指定的(或定制的),或其组合(例如,一些准则为系统指定的且其它准则为用户指定的)。在另一实例中,准则的规则集可随时间(例如,基于用户定制,经由系统更新等)改变。
在图5中描绘框400-405的实例。在图5中,截屏500和505描绘两个不同的UE在“人物”视图中的两个不同的媒体图库,其中每一相应的媒体图库呈现表示六个不同的特定于面部的媒体群组的六个缩略图。可由于框400而引起这些特定于面部的媒体群组的形成。接下来,在截屏510和515中,结合基于存储于相应UE上的媒体文件当中的每一面部的流行性的流行性得分来呈现表示六个不同的特定于面部的媒体群组的六个缩略图。在实例中,流行性得分可对应于包含定义特定的特定于面部的媒体群组的面部的媒体文件的数目(或特定于面部的媒体群组中的媒体文件的数目)的简单或“未加权”计数,或替代地对应于“经加权”流行得分(例如,基于准则集当中的一或多个次要准则进行加权,如将在下文更详细地论述)。虽然截屏510和515描绘作为实际屏幕上数字表示的流行性得分,但在其它实施例中,可在相应UE处确定流行性得分而不是视觉上呈现给用户,或以非数字方式表达流行性得分(例如,代表性缩略图的布置或次序可以经配置以表达流行性得分,例如通过将具有最高流行性得分的特定于面部的媒体群组的缩略图放置于左上方位置等)。而且,应了解,具有多个面部的照片可为多个特定于面部的媒体群组的部分且进而贡献于多个面部中的每一个的流行性得分。此外,框400-405可以周期性(例如,每天、每周等)或触发事件(例如,每当新媒体文件存储于UE上或修改或删除现有媒体文件时,每当新的面部辨识模块变得对UE可用时,每当通过系统或通过来UE的用户手动地修改在框405处使用的准则集时,或有可能改变面部流行性得分的任何其它事件)的方式重复。
在一个实例中,可将流行性得分排名以填充框405处的流行面部集(例如,将基于流行性得分排名在最高35%中的面部添加到流行面部集,将基于流行性得分的前10个面部添加到流行面部集等)。在另一实例中,可将具有高于流行性阈值(例如,10、15等)的流行性得分的任何面部添加到框405处的流行性面部集。在实例中,排名规则和/或流行性阈值可为系统指定的或用户指定的。
此外,媒体文件集当中的面部流行性可为在框405处用于确定流行面部集的准则集的因素的多个准则中的仅一个。因此,除了面部流行性之外,还可使用次要准则(例如,面部准则和/或文件元数据准则)根据一或多个流行性得分加权规则将与特定面部相关联的流行性得分加权。用于面部流行性得分的加权的面部准则的实例可包含以下中的任一个:
·时间推移(例如,自含有至少一个面部的媒体文件被捕获、添加到UE和/或在UE上被存取等起经过的时间量)。一般来说,可使用较长时间推移来减小相关联的流行性得分;
·年龄(例如,婴幼儿,青年,少年,成人,老年人等);
·情绪(例如,快乐、悲伤、生气、兴奋等);
·表情(例如,鸭子脸、微笑、扮小丑、面无表情(stoic)等);
·性别(例如,男、女等);
·面部对称性(例如,低、高、中等等);
·脸型(例如,圆形、椭圆形、心形、方形等);
·饰物/配饰(例如,眼镜、小胡子、胡须、化妆、头发、珠宝等);和/或
·大小/焦点(例如,全帧、背景、次要)。
用于面部流行性得分的加权的文件元数据准则的实例可包含以下中的任一个:
·频率(例如,低、中等、高)。举例来说,操作UE 1的用户1可每年探访用户2两次且在每次探访期间给用户2拍摄多张照片。在此情况下,频率为低(即,一年两次),且图像紧绕探访。在另一实例中,用户1与用户3是室友。在此情况下,预期用户1和3频繁互动,从而用户3的面部频率出现在用户1的照片中的可能性很大;
·相似性(例如,低、中等、高)。举例来说,操作UE 1的用户1可连续拍摄10张照片,试图获得特定面部的一张完美照片。在此情况下,这10张照片的相似性为高。高相似性可将相关联面部的流行性得分解除加权(例如,使得用户1的10张连续照片不具有10张照片的权重,这是因为用户1的目标仅为获得一张完美照片)。
·可共享性(例如,低、中等、高)。举例来说,假设面部1属于用户1的宝宝。用户1将含有面部1的大数目个照片发布到社交媒体(例如,Facebook),使得面部1的可共享性为高。在另一实例中,面部2属于用户1的同事。用户1不共享具有面部2的任何照片,使得面部2的可共享性为低。
·删除(例如,低、中等、高)。举例来说,操作UE 1的用户1可约会用户2,且进而拥有用户2的大数目的照片,为用户2给出高流行性得分。然而,用户1和2后来分手,用户1在偶然发现用户2的照片时,用户1将其删除。这可致使与用户2的面部相关联的删除率为高,这可降低用户2的面部的流行性得分。
·方位(例如,同一地方、新地方、遥远的地方等)。举例来说,在同一地方捕获的多个图片可与在不同地方捕获的照片较少相关(例如,这可暗示相应用户一起旅行且拥有亲密关系)。因此,在同一地方具有同一面部的多个照片可具有降低相关联面部流行性得分的效应,而在多个地方出现的具有同一面部的照片可具有增加相关联面部流行性得分的效应。
应了解,上文所述的因素中的一些依赖于视觉图像检查(例如,检测面部的性别、面部的预测年龄、面部是否有胡须等),其在实例中可为构建到面部辨识模块中的特征。上文所述的因素中的其它因素可依赖于特定于文件的元数据(例如,地理标记的相片方位等)、系统信息(例如,删除特定文件的时间的历史等)或通信历史信息(例如,是否与社交网络共享特定文件等)。如所述领域的一般技术人员将了解,此类型的信息无需由面部辨识模块自身收集,而是通过执行框405处的识别的应用程序经由与一或多个其它系统组件协调(例如,应用程序询问操作系统接收系统信息等)来收集。
参考图4,框400处的面部辨识和框405的识别可在不使面部集与对应的用户身份标识集相关联的情况下发生。考虑其中面部集包含碰巧对应于来自UE处维持的通讯录的联系人1的面部1的情境。图4的过程不取决于UE能够使面部1与联系人1相关(虽然在理论上,通过经由大头照片(profile picture)定义联系人的面部识别标记或基于来自UE的用户的手工输入,面部与用户身份标识的相关性是可能的)。因此,可在图4的过程期间产生和使用特定于面部的媒体群组中的一些或全部,且无需UE能够标识具有与特定的特定于面部的媒体群组相关联的面部的唯一用户的身份。这与某些面部辨识系统相反(例如,例如供社交网络服务使用的那些面部辨识系统),其中将新近获得的相片中检测到的任何面部与针对特定用户身份标识(例如,特定Facebook用户个人资料(user profile)等)定义的面部识别标记进行比较。因此,虽然图4的过程可在理论上通过存取大量的用户身份标识信息的服务器来实施,但图4的过程也可通过不存取这类信息的UE以分布方式实施。在此情况下,图4的过程仍可在这些分布式UE处使用,这是因为不明确要求与检测到的面部识别标记的明确用户身份标识相关性。
参考图4,在框405处的识别之后的某一点,在框410处,UE使用面部辨识扫描实时媒体以确定来自在框405处所识别的流行面部集的任何流行面部是否存在于实时媒体中。如上所述,流行面部可对应于基于面部流行性的高排名(例如,按流行性在前10个面部当中等)、具有高于流行性得分阈值的流行性得分,或其任何组合的任何面部。
此外,可通过UE从多种来源获得在框410处扫描的实时媒体。在实例中,这些来源可包含UE的相机,其中实时媒体可对应于正在由相机捕获的视频馈送(例如,在取景器模式中,可能在UE的用户键入输入命令以记录视频馈送的特定部分作为照片和/或视频)。在替代实例中,这些来源可包含在UE外部的一或多个来源,例如来自外部服务器(例如,服务器170等)或外部UE(例如,视频电话等)。
参考图4,在框415处,UE基于所述扫描是否检测到实时媒体中的任何流行面部来执行动作。特定来说,在框415处执行的动作包含将一或多个增强效应添加到实时媒体,授权继续通信操作,授权接入UE,或其任何组合。将在下文更详细地描述框415的实例实施方案。
仍然参考图4,框400处的面部辨识和框405的识别可在不使面部集与对应的用户身份标识集相关联的情况下发生。考虑其中面部集包含碰巧对应于来自UE处维持的通讯录的联系人1的面部1的情境。图4的过程不取决于UE能够使面部1与联系人1相关(虽然在理论上,通过经由大头照片定义联系人的面部识别标记或基于来自UE的用户的手工输入,面部与用户身份标识的相关性是可能的)。因此,可在图4的过程期间产生和使用特定于面部的媒体群组中的一些或全部,且无需UE能够标识具有与特定的特定于面部的媒体群组相关联的面部的唯一用户的身份。这与某些面部辨识系统相反(例如,例如供社交网络服务使用的那些面部辨识系统),其中将新近获得的相片中检测到的任何面部与针对特定用户身份标识(例如,特定Facebook用户个人资料等)定义的面部识别标记进行比较。因此,虽然图4的过程可在理论上通过存取大量的用户身份标识信息的服务器来实施,但图4的过程也可通过不存取这类信息的UE以分布方式实施。在此情况下,图4的过程仍可在这些分布式UE处使用,这是因为不明确要求与检测到的面部识别标记的明确用户身份标识相关性。
图6说明根据本公开的实施例的图4的过程的实例实施方案。特定来说,图6描述其中在图4的框415处执行的动作是将一或多个增强效应添加到实时媒体的实例。
参考图6,在框600处,假设部分地基于存储于UE 2上的媒体文件当中的用户A的面部的流行性将用户A的面部确立为流行面部。在实例中,框600可由于图4的框400-405的执行而发生。在框605处,UE 2任选地基于流行面部检测(例如,用户A的面部或某一其它流行面部的检测)配置(例如,基于用户输入、基于默认系统或专用设置,等)待应用于实时媒体的一或多个增强效应。在实例中,框605是任选的,这是因为框605的配置在任何实时媒体实际上在UE 2上播放之前发生,且增强效应的配置有可能较晚发生(例如,在获得实时媒体用于重放之后)。
参考图6,在某一较晚时间点,在框610处,UE 1将媒体发射到服务器,接着将媒体流式传输到UE 2。在实例中,服务器可为社交联网服务器,其中UE 1将实时媒体发布到社交联网服务器,且UE 2是UE 1的朋友,正在经由社交网络服务器调谐到来自UE 1的实时媒体流中。在另一实例中,服务器可为视频电话托管服务器,其仲裁UE 1和2(以及可能的其它UE)之间的流式视频会话(或呼叫)。在此情况下,虽然未示出,但UE 2也可将其自己的视频馈送流式传输回到UE 1。此外,虽然图6是针对实时媒体从UE 1到UE 2的服务器仲裁的交换,但在其它实施例中,实时媒体的交换无需服务器仲裁且可替代地经由D2D协议和/或本地无线视频流式传输协议(例如,Miracast等)进行。
参考图6,在框615处,UE 2接收和播放实时媒体(例如,经由集成到UE 2中和/或耦合到UE 2的显示装置)。在框620处,UE 2扫描实时媒体以检测任何流行面部(例如,如在图4的框410中)。更具体地,框620的扫描将面部辨识应用于实时媒体内的一或多个单独视频帧以用于与已经指定为流行(例如在框600处的用户A的面部的指定)的面部集进行比较。在图6的实施例中,假设正在框620处扫描的一或多个视频帧包含用户A和用户B的面部,其中用户B不是流行面部。在此假设下,在框625处,UE 2基于框620的扫描检测实时媒体的一或多个视频帧中的用户A和B的面部。在实例中,实际上忽略用户B的面部的检测(至少出于应用增强效应的目的),而在框625处的用户A的面部的检测基于框600触发用户A的面部作为流行面部的辨识。
在框630处,基于在框625处用户A的面部作为流行面部的检测,UE 2确定待应用于实时媒体的一或多个增强效应。在实例中,框630的确定可对应于加载来自任选框605的预配置的增强效应。在替代实例中,可提示UE 2的用户选择应用于实时媒体的各种增强效应选项。在框630处确定增强效应之后,UE 2在框635(例如,图4的框415)处更新实时媒体的重放以包含增强效应。
图6的实施例中的可应用于实时媒体的增强效应的实例可包含以下中的任一个:
·将视觉假影(例如,胡须、眼镜、假鼻、公主皇冠(princess tiara)、丘巴卡容貌(Chewbacca visage)、僵尸效应、极端老化效应、修改例如鼻子、眼睛、嘴巴或耳朵等面部特征的大小等))添加到用户A的面部。举例来说,如经由图7A中的截屏700A所示,用户A可被爱心环绕,而在图7B中的截屏700B中用滑稽面罩描绘用户A和X的面部。在另一实例中,可基于例如UE 1和/或UE 2的方位的次要信息选择视觉假影(例如,如果UE 1正在迪斯尼世界捕获实时媒体,那么添加到用户A的面部的视觉假影可为迪斯尼相关的,例如为用户A的面部提供米老鼠的耳朵等);
·大体或具体地相对于用户A或用户A的面部改变与实时媒体相关联的色彩方案。举例来说,如经由图7A中的截屏700A所示,可用彩色展示用户A,而实时媒体的剩余部分改变为黑白色。
·将增强现实信息添加到实时媒体。举例来说,如经由图7C中的截屏700C所示,从存储于UE 2上的媒体文件捕获含有用户A的面部的最新媒体文件所处的时间和/或方位的指示可覆叠到实时媒体上;和/或
·自动跟踪、自动聚焦或放大流行面部。举例来说,所述自动聚焦可修改UE 2的透镜操作,使得透镜焦点以流行面部为中心。自动跟踪和/或缩放功能性可经由透镜操控发生,或以数字方式发生,或两者的组合。在另一实例中,流行面部的情绪也可用作筛选(例如,使得自动跟踪、自动聚焦和/或放大功能相对于具有快乐表情且与不快乐表情相反的流行面部而发生)。
图8说明根据本公开的另一实施例的图4的过程的实例实施方案。特定来说,图6描述其中在图4的415框处执行的动作是授权视频电话(即,通信操作)的实例。
参考图8,在框800处,假设部分地基于存储于UE 2上的媒体文件当中的用户A的面部的流行性将用户A的面部确立为流行面部。在实例中,框800可由于图4的框400-405的执行而发生。在框805处,UE 2基于流行面部检测(例如,用户A的面部或某一其它流行面部的检测)配置(例如,基于用户输入、基于默认系统或专用设置,等)一或多个视频电话响应规则。
参考图8,假设用户A正在操作UE 1。在某一较晚时间点,在框810处,用户A确定起始与UE 2的视频电话,这触发启动UE 1的前置相机。UE 1接着在框815处通过将呼叫请求发送到服务器(例如,经配置以调解视频聊天(Facetime)电话、Skype视频通话等的视频电话托管服务器)起始与UE 2的视频电话以及包含正在由UE 1的前置相机捕获的视频馈送的实时媒体,接着将所述实时媒体转发到UE 2。在图8的实施例中,假设用户A使前置相机定向为使得用户A的面部含于视频馈送中。虽然图8是针对UE1和2之间的服务器仲裁的视频电话,但在其它实施例中,实时媒体的交换无需服务器仲裁且可替代地经由D2D协议和/或本地无线视频流式传输协议(例如,Miracast等)进行。
参考图8,在框820处,UE 2扫描实时媒体(例如,由UE 1的前置相机捕获的视频馈送)以检测任何流行面部(例如,在图4的框410中)。更具体地,框620的扫描将面部辨识应用于实时媒体内的一或多个单独视频帧以用于与已经指定为流行(例如在框800处的用户A的面部的指定)的面部集进行比较。在图8的实施例中,假设正在框820处扫描的一或多个视频帧包含用户A的面部。在此假设下,在框825处,UE 2基于框820的扫描检测实时媒体的一或多个视频帧中的用户A的面部。在实例中,在框825处的用户A的面部的检测基于框800触发用户A的面部作为流行面部的辨识。
在框830处,基于在框825处用户A的面部作为流行面部的检测,UE 2基于一或多个视频电话响应规则而授权继续视频电话。视频电话响应规则的实例可包含以下中的任一个:
·实例视频电话响应规则#1:如果接收到视频电话的告知以及包含流行面部的实时媒体,那么自动接受视频电话。否则,告知视频电话准许用户手动决定是否接受视频电话。在此情况下,因为在图8的实施例中,与视频电话的告知一起接收的实时媒体包含用户A的流行面部,所以框830的授权准许通过自动接受视频电话来继续视频电话。
·实例视频电话响应规则#2:如果接收到视频电话的告知以及包含流行面部的实时媒体,那么告知视频电话准许用户手动决定是否接受视频电话。否则,阻挡所有视频电话而无需通知用户。在此情况下,因为在图8的实施例中,与视频电话的告知一起接收的实时媒体包含用户A的流行面部,所以框830的授权准许通过告知用户视频电话以提示手动电话接受/拒绝决策来继续视频电话。
·实例视频电话响应规则#3:如果接收到视频电话的告知以及包含流行面部的实时媒体,那么结合大音量紧急铃声告知视频电话准许用户手动决定是否接受视频电话。否则,结合低音量非紧急铃声告知视频电话准许用户手动决定是否接受视频电话。在此情况下,因为在图8的实施例中,与视频电话的告知一起接收的实时媒体包含用户A的流行面部,所以框830的授权准许通过使用大音量紧急铃声的电话告知来继续视频电话。
如将了解,基于如关于图8所描述的一或多个视频电话响应规则执行视频电话响应动作仅为可如何实施在框415处授权继续通信操作的动作的一个实例。其它实施例无需涉及视频电话。举例来说,用户A可能想要经由UE向用户B发电子邮件,但电子邮件功能被锁定。为解锁(或授权)电子邮件功能,可要求用户A启动前置相机,使得UE可验证其面部是流行面部,之后解锁电子邮件功能。其它实例通信功能包含文本发送、上传或下载文件、登录社交网站等。因此,图8是出于实例目的提供,且并不将可在框415处授权的通信操作限制为视频电话实施方案。
图9A说明根据本公开的另一实施例的图4的过程的实例实施方案。特定来说,图9A描述其中在图4的框415处执行的动作是对UE的本地接入的选择性授权的实例。
参考图9A,在框900A处,假设部分地基于存储于给定UE上的媒体文件当中的用户A的面部的流行性将用户A的面部确立为流行面部。在实例中,框900A可由于图4的框400-405的执行而发生。在框905A处,给定UE基于流行面部检测(例如,用户A的面部或某一其它流行面部的检测)配置(例如,基于用户输入、基于默认系统或专用设置,等)一或多个本地UE接入规则。
参考图9A,在框910A处,给定UE接收本地UE接入请求。在实例中,框910A处的本地UE接入请求可呈口头命令、鼠标点击、触摸屏输入、键盘输入或其它类型的按钮推按等的形式作为用户输入被接收。响应于框910A处的本地UE接入请求,给定UE在框915A处启动相机(例如,UE上的集成式前置或后置相机、经由USB或其它电缆连接耦合到给定UE的相机、无线地连接到给定UE的相机等)并且任选地提示给定UE的用户在相机的视场内显示其面部(例如,通过进入取景器模式,因此用户可将相机和/或其位置定向成用户的面部经由取景器可见)。在实例中,框910A处的本地UE接入请求可当用户启动相机(例如,用户将给定UE置于取景器模式中,这可解读为在用户的面部可验证为流行面部的情况下的本地UE接入请求)时隐式地发生,在此情况下,框910A和915A合并成与响应于单独本地UE接入请求触发相机启动相对的单个操作。
参考图9A,在框920A处,给定UE扫描实时媒体(例如,由相机捕获的视频馈送)以检测任何流行面部(例如,在图4的框410中)。更具体地,框920A的扫描将面部辨识应用于实时媒体内的一或多个单独视频帧以用于与已经指定为流行(例如在框900A处的用户A的面部的指定)的面部集进行比较。在框925A处,给定UE基于框920A的扫描确定是否检测到任何流行面部。如果在框925A处在实时媒体中未检测到流行面部,那么在框930A处拒绝本地UE接入请求。否则,如果在框925A处在实时媒体中检测到流行面部(例如,例如基于框900A的较早执行的用户A的面部),那么在框935A处根据在框905A处配置的一或多个本地UE接入规则准予本地UE接入请求。
本地UE接入规则的实例可包含以下中的任一个:
·本地UE接入规则实例#1:如果在框925A处检测到流行面部,那么准予用户受限存取针对流行面部相关联的特定于面部的媒体群组(例如,使得用户可存取给定UE上的其相关照片和/或视频);
·本地UE接入规则实例#2:如果在框925A处检测到流行面部,那么准许解锁给定UE;
·本地UE接入规则实例#3:如果在框925A处检测到流行面部,那么准许用户受限接入以使用特定应用程序(例如,媒体图库应用程序、社交网络应用程序等)和/或特定应用程序模式(例如,客人模式、管理模式等);和/或
·本地UE接入规则实例#4:如果在框925A处检测到流行面部,那么准许用户受限存取以经由配置实用程序改变给定UE的一或多个操作参数(例如,是否启动家长控制、屏幕亮度、是否准许蜂窝漫游等)。
图9B说明根据本公开的另一实施例的图4的过程的实例实施方案。虽然图9A描述其中在图4的框415处执行的动作是本地接入UE的选择性授权的实例,图9B涉及其中在图4的框415处执行的动作是远程接入UE的选择性授权的替代性情境。
参考图9B,在框900B处,假设部分地基于存储于UE 2上的媒体文件当中的用户A的面部的流行性将用户A的面部确立为流行面部。在实例中,框900B可由于图4的框400-405的执行而发生。在框905B处,UE 2基于流行面部检测(例如,用户A的面部或某一其它流行面部的检测)配置(例如,基于用户输入、基于默认系统或专用设置,等)一或多个远程UE接入规则。
参考图9B,假设UE 1是由用户A操作,且用户A想要经由UE 1获得对UE 2的远程接入。在框910B处,UE 2启动相机(例如,UE 1上的集成式前置或后置相机、经由USB或其它电缆连接耦合到UE 1的相机、无线地连接到UE 1的相机等)表情捕获包含用户A的面部的实时媒体。在框915B处,UE 1接着将远程UE接入请求发送到包含实时媒体的UE 2(例如,经由服务器,不过在替代实施例中,可经由D2D发送远程UE接入请求)。UE 2接收对实时媒体的远程UE接入请求,并且在框920B处,起始对实时媒体的扫描以检测任何流行面部(例如,在图4的框410中)。更具体地,框920B的扫描将面部辨识应用于实时媒体内的一或多个单独视频帧以用于与已经指定为流行(例如在框900B处的用户A的面部的指定)的面部集进行比较。在框925B处,UE 2基于框920B的扫描检测实时媒体的一或多个视频帧中的用户A的面部。在实例中,在框925B处的用户A的面部的检测基于框900B触发用户A的面部作为流行面部的辨识。
基于在框925B处用户A的面部作为流行面部的检测,UE 2准予UE 1根据在框930B处配置的一或多个本地UE接入规则远程接入UE 2,且UE 1基于框935B处的准予来远程接入UE 2。一或多个远程UE接入规则可对应于上文所描述的本地UE接入规则实例中的任一个,不同之处在于接入经由UE 1和2之间的基于服务器的或D2D连接而发生。
在其它实施例中,可结合图4的框415基于流行面部检测实施其它类型的动作。这些动作可与上文关于图4的框415所描述的动作一起或替代地实施(例如,将增强效应添加到实时媒体,授权继续通信操作和/或授权接入UE)。可结合图4的框415基于流行面部检测实施的其它动作类型可包含在以下段落中描述的实例动作中的任一个。
视频概要:来自一或多个特定于面部的媒体群组的媒体文件(例如,相片和/或视频)可合并在一起形成视频幻灯片。在另一实例中,可按方位和/或时间筛选媒体文件。举例来说,用户A到圣地亚哥旅行1周并且捕获含有朋友B和朋友C的面部的大数目的媒体文件,朋友B和朋友C的面部确立为用户A操作的UE上的流行面部。可通过UE基于经由方位(圣地亚哥)和时间(1周旅行时段)的额外筛选对朋友B和朋友C的流行面部检测,产生包含含有朋友B和朋友C的流行面部的媒体文件的视频幻灯片,使得从视频幻灯片排除不是在特定周期间在圣地亚哥捕获的其中含有朋友B和朋友C的面部的媒体文件。图10A的截屏1000A描绘根据本公开的实施例的上文所述的圣地亚哥旅行的视频概要的播发的实例;
社交网络提示:相较于向用户呈现媒体文件的全部列举以供选择,UE可提示用户与社交网络分享含有一或多个流行面部的媒体文件。举例来说,与不描绘其亲密朋友和家人(例如,新生宝宝等)的照片相比,用户更可能想要分享描绘这类人物的媒体文件。图10B的截屏1000B描绘根据本公开的实施例的共享含有流行面部的媒体文件的社交网络提示的实例
媒体图库增强:在实例中,如图10C的截屏1000C中所描绘,UE可产生包含针对流行面部的特定于面部的媒体群组的朋友和家人分类。在另一实例中,如图10D的截屏1000D中所描绘,可将含有流行面部的任何媒体文件自动标记为“收藏夹”媒体文件并且将其添加到媒体图库应用程序维持的“收藏夹”文件夹;
日历增强:在实例中,可基于含有流行面部的媒体文件产生日历通知。举例来说,如图10E的截屏1000E中所描绘,可添加含有流行面部的相片的一年期提醒作为日历提醒;
文本发送增强:在实例中,如图10F的截屏1000F中所描绘,UE上的信使应用程序可提示用户在通话期间与朋友分享含有所述朋友的流行面部的媒体文件。在实例中,所述朋友可被识别为对应于基于大头照片的流行面部;
媒体文件共享增强:可批量共享特定于面部的媒体群组中所含的媒体文件,且用户不必进行手动分组以供发射。在图10G的截屏1000G中描绘了批量照片传送提示的实例;
互为朋友可视化增强:如图10H的截屏1000H中所示,互为朋友共性的表示可与流行面部相关联;
图库游戏:在实例中,UE的用户可收到与一或多个流行面部有关的问题的提示。如经由图10I的截屏1000I所描绘,在单玩家实例中,可要求UE的用户玩游戏以指定哪个名人看起来最像特定流行面部。如图10J的截屏1000J中所描绘,在多玩家实例中,具有相同流行面部的不同UE可收到社交类游戏问题的提示,以便猜测哪个UE具有共享的流行面部的最多照片;
破冰者:在实例中,UE可检测到UE靠近拥有流行面部的特定个人。举例来说,UE可捕获新相片或视频,并且接着确定流行面部含于其中,指示UE就在现在位于拥有流行面部的个人附近。如经由图10K的截屏1000K所描绘,此检测可触发某一类型的用户提示,例如提示UE的用户查看来自先前交互的含有同一流行面部的较老照片和/或视频;
流行面部的剖析:可分析与含有特定流行面部的媒体文件相关联的共同特性以剖析流行面部。举例来说,养宠物狗的个人可能拍摄包含个人的面部以及宠物狗的大数目相片。在一个实例中,如果此个人是流行面部,那么流行面部可表征为属于狗主人或为狗爱好者。在另一实例中,可在很频率地地理标记在特定方位(例如,家里、喜欢的餐厅、办公室等)处的媒体文件中捕获到流行面部,且流行面部可变成与那些特定方位相关联(例如,因此如果UE曾经在那些特定方位中的任一个处,那么UE可提供与流行面部有关的通知,等)。
所属领域的技术人员应了解,可使用多种不同技术和技艺中的任一种来表示信息和信号。举例来说,可通过电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示在整个上文描述中可能参考的数据、指令、命令、信息、信号、位、符号和码片。
另外,所属领域的技术人员将了解,结合本文中所公开的实施例描述的各种说明性逻辑块、模块、电路和算法步骤可实施为电子硬件、计算机软件或两者的组合。为清晰地说明硬件与软件的此可互换性,上文已大体就各种说明性组件、块、模块、电路和步骤的功能性加以描述。此类功能性被实施为硬件还是软件取决于特定应用和施加于整个系统上的设计约束。本领域的技术人员可针对每一具体应用以不同方式来实施所描述的功能性,但这样的实施决策不应被解释为会引起脱离本公开的范围。
结合本文中所公开的实施例描述的各种说明性逻辑块、模块和电路可利用通用处理器、DSP、ASIC、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文中所描述的功能的其任何组合来实施或执行。通用处理器可为微处理器,但在替代方案中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算装置的组合,例如DSP和微处理器的组合、多个微处理器、与DSP核心结合的一或多个微处理器,或任何其它此类配置。
结合本文中所公开的实施例描述的方法、序列和/或算法可直接以硬件、以由处理器执行的软件模块或以两者的组合来体现。软件模块可驻存在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可拆卸磁盘、CD-ROM,或所属领域中已知的任何其它形式的存储媒体中。示范性存储媒体耦合到处理器,使得处理器可从存储媒体读取信息和将信息写入到存储媒体。在替代方案中,存储媒体可与处理器成一体式。处理器和存储媒体可驻存在ASIC中。ASIC可驻存于用户终端(例如,UE)中。在替代方案中,处理器和存储媒体可作为离散组件驻存于用户终端中。
在一或多个示范性实施例中,所描述的功能可实施在硬件、软件、固件或其任何组合中。如果实施于软件中,那么可将功能作为一或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体发射。计算机可读媒体包含计算机存储媒体和通信媒体两者,通信媒体包含促进将计算机程序从一处传送到另一处的任何媒体。存储媒体可为可由计算机存取的任何可用媒体。借助于实例而非限制,此类计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用于携带或存储呈指令或数据结构的形式的所需程序代码且可由计算机存取的任何其它媒体。并且,恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源传输软件,那么所述同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电和微波的无线技术包含在媒体的定义中。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上各个的组合也应包含在计算机可读媒体的范围内。
虽然前述公开内容示出本公开的说明性实施例,但应注意,在不脱离如所附权利要求书界定的本公开的范围的情况下,可以在本文中做出各种改变和修改。无需以任何特定次序来执行根据本文中所述的本公开的实施例的方法权利要求的功能、步骤和/或动作。此外,虽然可以单数形式描述或主张本公开的元件,但除非明确陈述限于单数形式,否则也涵盖复数形式。
Claims (30)
1.一种操作用户设备UE的方法,其包括:
辨识存储于所述UE上的媒体文件集内的面部集;
基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集,并且其中所述准则集部分基于一或多个文件元数据准则,所述文件元数据准则包括含有所述面部集中的至少一个面部的所述媒体文件集之间的相似度、与一个或多个外部实体共享含有所述至少一个面部的所述媒体文件集的程度、删除含有所述至少一个面部的所述媒体文件集的比率或其任意组合;
确定来自所述流行面部集的任何流行面部是否存在于实时媒体中;
基于是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作,所述动作包含以下中的一或多个:
将一或多个增强效应添加到所述实时媒体,
授权继续通信操作,或
授权对所述UE的接入。
2.根据权利要求1所述的方法,其中所述辨识和所述识别在不使所述面部集与对应的用户身份标识集相关联的情况下实施。
3.根据权利要求1所述的方法,其中所述准则集包含:
至少部分地基于流行性将所述面部集当中的面部排名所借助的一或多个排名规则,或
使所述面部集当中的面部有资格成为所述流行面部集需符合的流行性阈值,或
将所述面部集当中的至少一个面部的流行性属性加权所借助的一或多个次要准则,或
其任何组合。
4.根据权利要求3所述的方法,其中所述一或多个次要准则包含一或多个面部准则。
5.根据权利要求4所述的方法,其中所述一或多个面部准则包含:
所述至少一个面部的年龄,
由所述至少一个面部指示的情绪,
所述至少一个面部上的面部表情,
由所述至少一个面部指示的性别,
所述至少一个面部的面部对称度,
所述至少一个面部的形状,
所述至少一个面部是否佩戴或附加饰物和/或配饰,
所述至少一个面部在相应媒体文件内的大小,
相应媒体文件的焦点是否放置到所述至少一个面部上,或
其任何组合。
6.根据权利要求3所述的方法,其中所述一或多个次要准则包含所述一或多个文件元数据准则。
7.根据权利要求6所述的方法,其中所述一或多个文件元数据准则还包含:
自含有所述至少一个面部的媒体文件被捕获、添加到所述UE和/或在所述UE上被存取起经过的时间量;
含有所述至少一个面部的所述媒体文件发生的频率,
捕获含有所述至少一个面部的所述媒体文件的方位,或
其任何组合。
8.根据权利要求1所述的方法,
其中在所述实时媒体中检测到至少一个流行面部,且
其中所述动作包含将所述一或多个增强效应添加到所述实时媒体。
9.根据权利要求8所述的方法,其中所述一或多个增强效应包含:
将视觉假影添加到所述实时媒体内的所述至少一个检测到的流行面部,
改变与所述实时媒体相关联的色彩方案,
将增强现实信息添加到所述实时媒体,
自动跟踪、自动聚焦和/或放大所述实时媒体内的所述至少一个检测到的流行面部,或
其任何组合。
10.根据权利要求8所述的方法,
其中在所述实时媒体中检测到至少一个流行面部,且其中所述动作包含授权继续所述通信操作。
11.根据权利要求10所述的方法,
其中所述通信操作是视频电话,且
其中所述实时媒体包含在正在尝试发起与所述UE的视频电话的外部UE处所捕获的视频馈送。
12.根据权利要求11所述的方法,其中所述动作包含以下中的一或多个:自动接受所述视频电话,告知用户所述视频电话以促进手动电话接受决策,阻挡所述视频电话而无需通知所述用户,用紧急铃声告知所述用户所述视频电话,不用所述紧急铃声告知所述用户所述视频电话,或其任何组合。
13.根据权利要求10所述的方法,其中所述通信操作包含文本发送、上传或下载文件、登录到社交网站上或其任何组合。
14.根据权利要求1所述的方法,
其中在所述实时媒体中检测到至少一个流行面部,且
其中所述动作包含授权对所述UE的所述接入。
15.根据权利要求14所述的方法,其中所述动作授权对所述UE的本地接入。
16.根据权利要求15所述的方法,其中所述实时媒体包含在所述UE处捕获的视频馈送。
17.根据权利要求14所述的方法,其中所述动作授权对所述UE的远程接入。
18.根据权利要求17所述的方法,其中所述实时媒体包含在外部UE处捕获的视频馈送。
19.根据权利要求14所述的方法,其中对所述UE的所述接入的所述授权包含:
准予对含有所述至少一个检测到的流行面部的所述媒体文件集当中的媒体文件的受限存取,
将所述UE解锁,
准予对特定应用程序或应用程序模式的受限接入,
准予受限存取以经由配置实用程序改变所述UE的一或多个操作参数,或
其任何组合。
20.一种用户设备UE,其包括:
用于辨识存储于所述UE上的媒体文件集内的面部集的装置;
用于基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集的装置,并且其中所述准则集部分基于一或多个文件元数据准则,所述文件元数据准则包括含有所述面部集中的至少一个面部的所述媒体文件集之间的相似度、与一个或多个外部实体共享含有所述至少一个面部的所述媒体文件集的程度、删除含有所述至少一个面部的所述媒体文件集的比率或其任意组合;
用于确定来自所述流行面部集的任何流行面部是否存在于实时媒体中的装置;
用于基于是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作的装置,所述动作包含以下中的一或多个:
将一或多个增强效应添加到所述实时媒体,
授权继续通信操作,或
授权对所述UE的接入。
21.根据权利要求20所述的UE,其中所述用于辨识的装置辨识所述面部集,且所述用于识别的装置在不使面部集与对应的用户身份标识集相关联的情况下识别所述流行面部集。
22.根据权利要求20所述的UE,其中所述准则集包含:
至少部分地基于流行性将所述面部集当中的面部排名所借助的一或多个排名规则,或
使所述面部集当中的面部有资格成为所述流行面部集需符合的流行性阈值,或
将所述面部集当中的至少一个面部的流行性属性加权所借助的一或多个次要准则,或
其任何组合。
23.根据权利要求22所述的UE,其中所述一或多个次要准则包含一或多个面部准则。
24.一种用户设备UE,其包括:
至少一个处理器,其经配置以:
辨识存储于所述UE上的媒体文件集内的面部集;
基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集,并且其中所述准则集部分基于一或多个文件元数据准则,所述文件元数据准则包括含有所述面部集中的至少一个面部的所述媒体文件集之间的相似度、与一个或多个外部实体共享含有所述至少一个面部的所述媒体文件集的程度、删除含有所述至少一个面部的所述媒体文件集的比率或其任意组合;
确定来自所述流行面部集的任何流行面部是否存在于实时媒体中;
基于是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作,所述动作包含以下中的一或多个:
将一或多个增强效应添加到所述实时媒体,
授权继续通信操作,或
授权对所述UE的接入。
25.根据权利要求24所述的UE,其中所述至少一个处理器辨识所述面部集并且在不使面部集与对应的用户身份标识集相关联的情况下识别所述流行面部集。
26.根据权利要求24所述的UE,其中所述准则集包含:
至少部分地基于流行性将所述面部集当中的面部排名所借助的一或多个排名规则,或
使所述面部集当中的面部有资格成为所述流行面部集需符合的流行性阈值,或
将所述面部集当中的至少一个面部的流行性属性加权所借助的一或多个次要准则,或
其任何组合。
27.根据权利要求26所述的UE,其中所述一或多个次要准则包含一或多个面部准则。
28.一种含有存储在上面的指令的非暂时性计算机可读媒体,所述指令当由用户设备UE执行时致使所述UE执行动作,所述指令包括:
致使所述UE辨识存储于所述UE上的媒体文件集内的面部集的至少一个指令;
致使所述UE基于包含一或多个面部在所述媒体文件集当中的流行性的准则集来识别流行面部集的至少一个指令,并且其中所述准则集部分基于一或多个文件元数据准则,所述文件元数据准则包括含有所述面部集中的至少一个面部的所述媒体文件集之间的相似度、与一个或多个外部实体共享含有所述至少一个面部的所述媒体文件集的程度、删除含有所述至少一个面部的所述媒体文件集的比率或其任意组合;
致使所述UE确定来自所述流行面部集的任何流行面部是否存在于实时媒体中的至少一个指令;
致使所述UE基于是否在所述实时媒体中检测到来自所述流行面部集的任何流行面部来执行动作的至少一个指令,所述动作包含以下中的一或多个:
将一或多个增强效应添加到所述实时媒体,
授权继续通信操作,或
授权对所述UE的接入。
29.根据权利要求28所述的非暂时性计算机可读媒体,其中所述致使所述UE辨识的至少一个指令和所述致使所述UE识别的至少一个指令致使所述UE辨识所述面部集并且在不使面部集与对应的用户身份标识集相关联的情况下识别所述流行面部集。
30.根据权利要求28所述的非暂时性计算机可读媒体,其中所述准则集包含:
至少部分地基于流行性将所述面部集当中的面部排名所借助的一或多个排名规则,或
使所述面部集当中的面部有资格成为所述流行面部集需符合的流行性阈值,或
将所述面部集当中的至少一个面部的流行性属性加权所借助的一或多个次要准则,或
其任何组合。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/663,686 US10706265B2 (en) | 2017-07-28 | 2017-07-28 | Scanning a real-time media stream to detect one or more faces that are prevalent among a set of media files stored on a user equipment |
US15/663,686 | 2017-07-28 | ||
PCT/US2018/034556 WO2019022828A1 (en) | 2017-07-28 | 2018-05-25 | DETECTION OF PREDOMINANT FACES IN MEDIA IN REAL-TIME MEDIA |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110892411A CN110892411A (zh) | 2020-03-17 |
CN110892411B true CN110892411B (zh) | 2023-08-22 |
Family
ID=62705683
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880047003.7A Active CN110892411B (zh) | 2017-07-28 | 2018-05-25 | 检测实时媒体中的流行面部 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10706265B2 (zh) |
CN (1) | CN110892411B (zh) |
WO (1) | WO2019022828A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11444943B1 (en) * | 2017-12-27 | 2022-09-13 | Meta Platforms, Inc. | Exchange content between client devices when a client device determines a user is within a field of view of an image capture device of the client device and authorized to exchange content |
US11394705B2 (en) * | 2018-07-10 | 2022-07-19 | Ademco Inc. | Systems and methods for verifying credentials to perform a secured operation in a connected system |
CN113552938A (zh) * | 2020-04-26 | 2021-10-26 | 京东方科技集团股份有限公司 | 基于物联网的动作关联方法、电子设备和存储介质 |
CN112188140A (zh) * | 2020-09-29 | 2021-01-05 | 深圳康佳电子科技有限公司 | 一种人脸跟踪视频聊天方法、系统及存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101534392A (zh) * | 2008-03-14 | 2009-09-16 | 欧姆龙株式会社 | 优先对象决定装置、电子设备、方法及程序以及记录媒体 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4577113B2 (ja) | 2005-06-22 | 2010-11-10 | オムロン株式会社 | 対象決定装置、撮像装置および監視装置 |
US8024343B2 (en) * | 2006-04-07 | 2011-09-20 | Eastman Kodak Company | Identifying unique objects in multiple image collections |
US9721167B2 (en) * | 2008-07-21 | 2017-08-01 | Facefirst, Inc. | Biometric notification system |
US20110047384A1 (en) * | 2009-08-21 | 2011-02-24 | Qualcomm Incorporated | Establishing an ad hoc network using face recognition |
US9465993B2 (en) | 2010-03-01 | 2016-10-11 | Microsoft Technology Licensing, Llc | Ranking clusters based on facial image analysis |
US8611678B2 (en) * | 2010-03-25 | 2013-12-17 | Apple Inc. | Grouping digital media items based on shared features |
FR2961990A1 (fr) * | 2010-06-28 | 2011-12-30 | Sigma Mediterranee | Procede et dispositif d'authentification d'un appelant |
US8270684B2 (en) * | 2010-07-27 | 2012-09-18 | Google Inc. | Automatic media sharing via shutter click |
US9082235B2 (en) * | 2011-07-12 | 2015-07-14 | Microsoft Technology Licensing, Llc | Using facial data for device authentication or subject identification |
US9087273B2 (en) * | 2011-11-15 | 2015-07-21 | Facebook, Inc. | Facial recognition using social networking information |
US9177130B2 (en) * | 2012-03-15 | 2015-11-03 | Google Inc. | Facial feature detection |
US9483475B2 (en) | 2012-12-26 | 2016-11-01 | Htc Corporation | Content recommendation method |
US8856541B1 (en) * | 2013-01-10 | 2014-10-07 | Google Inc. | Liveness detection |
US8938460B2 (en) | 2013-03-04 | 2015-01-20 | Tracfone Wireless, Inc. | Automated highest priority ordering of content items stored on a device |
US9405771B2 (en) * | 2013-03-14 | 2016-08-02 | Microsoft Technology Licensing, Llc | Associating metadata with images in a personal image collection |
US9489564B2 (en) | 2013-07-11 | 2016-11-08 | Google Technology Holdings LLC | Method and apparatus for prioritizing image quality of a particular subject within an image |
WO2015022689A1 (en) | 2013-08-13 | 2015-02-19 | Pic Dj Ltd. | Media object selection |
US20160224837A1 (en) | 2013-10-25 | 2016-08-04 | Hyperlayer, Inc. | Method And System For Facial And Object Recognition Using Metadata Heuristic Search |
US9147117B1 (en) * | 2014-06-11 | 2015-09-29 | Socure Inc. | Analyzing facial recognition data and social network data for user authentication |
US8923551B1 (en) * | 2014-07-16 | 2014-12-30 | Interactive Memories, Inc. | Systems and methods for automatically creating a photo-based project based on photo analysis and image metadata |
US10257151B2 (en) * | 2014-10-27 | 2019-04-09 | Phanto, Llc | Systems and methods for enabling dialog amongst different participant groups with variable and association-based privacy |
US10242034B1 (en) * | 2015-12-28 | 2019-03-26 | Amazon Technologies, Inc. | Intelligent selection of images to create image narratives |
US10394881B2 (en) * | 2017-03-31 | 2019-08-27 | Google Llc | Automatic suggestions to share images |
-
2017
- 2017-07-28 US US15/663,686 patent/US10706265B2/en active Active
-
2018
- 2018-05-25 CN CN201880047003.7A patent/CN110892411B/zh active Active
- 2018-05-25 WO PCT/US2018/034556 patent/WO2019022828A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101534392A (zh) * | 2008-03-14 | 2009-09-16 | 欧姆龙株式会社 | 优先对象决定装置、电子设备、方法及程序以及记录媒体 |
Also Published As
Publication number | Publication date |
---|---|
US20190034701A1 (en) | 2019-01-31 |
CN110892411A (zh) | 2020-03-17 |
WO2019022828A1 (en) | 2019-01-31 |
US10706265B2 (en) | 2020-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110892411B (zh) | 检测实时媒体中的流行面部 | |
CN110084153B (zh) | 用于自动共享图片的智能相机 | |
EP2842303B1 (en) | Proximity and connection based photo sharing | |
CN105095873B (zh) | 照片共享方法、装置 | |
EP3079082B1 (en) | Method and apparatus for album display | |
JP6027243B2 (ja) | ビデオ通話内での人の特定 | |
CN111386553A (zh) | 用于电子消息传递应用的图形渲染 | |
CN107077750A (zh) | 化身选择机制 | |
KR101789212B1 (ko) | 사용자 감정을 전자 미디어와 연관시키는 것 | |
KR20170091913A (ko) | 영상 서비스 제공 방법 및 장치 | |
CN106534562B (zh) | 文件删除方法及装置 | |
JP2017118282A (ja) | 画像処理システム、画像処理方法、および画像処理プログラム | |
WO2018094911A1 (zh) | 一种多媒体文件的分享方法及终端设备 | |
KR20230124083A (ko) | 햅틱 피드백 응답을 갖는 통신 인터페이스 | |
WO2017050090A1 (zh) | 生成gif文件的方法、设备及计算机可读存储介质 | |
KR20230124081A (ko) | 햅틱 피드백 응답을 갖는 통신 인터페이스 | |
KR101120737B1 (ko) | 모바일 단말기를 이용한 소셜 동영상 서비스 방법 | |
KR20230128063A (ko) | 햅틱 피드백을 갖는 실시간 비디오 통신 인터페이스 | |
CN112351133B (zh) | 媒体数据的分享方法及终端 | |
US20230328079A1 (en) | Additive friend suggestion for account security | |
WO2017193343A1 (zh) | 媒体文件分享方法、媒体文件分享设备及终端 | |
KR101472287B1 (ko) | 휴대용 디지털 장치를 이용하여 ucc를 생성 및 공유하는방법 및 시스템 | |
CN108027821A (zh) | 处理图片的方法及装置 | |
CN118451696A (zh) | 消息收发系统中的多层连接 | |
JP7417076B2 (ja) | 情報処理方法、撮影装置、および画像管理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |