CN102365645B - 通过关联面部来组织数字图像 - Google Patents

通过关联面部来组织数字图像 Download PDF

Info

Publication number
CN102365645B
CN102365645B CN201080010483.3A CN201080010483A CN102365645B CN 102365645 B CN102365645 B CN 102365645B CN 201080010483 A CN201080010483 A CN 201080010483A CN 102365645 B CN102365645 B CN 102365645B
Authority
CN
China
Prior art keywords
image
profile
storage
human
facial profile
Prior art date
Application number
CN201080010483.3A
Other languages
English (en)
Other versions
CN102365645A (zh
Inventor
格雷·吉雷
乔舒亚·大卫·费根斯
尼克希尔·巴哈特
琼-佛朗克斯·奥布滋
西米恩·莱费尔
蒂莫西·B·马丁
格雷戈里·查尔斯·兰德雷
Original Assignee
苹果公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to US14260609P priority Critical
Priority to US61/142,606 priority
Priority to US12/436,069 priority
Priority to US12/436,069 priority patent/US9495583B2/en
Application filed by 苹果公司 filed Critical 苹果公司
Priority to PCT/US2010/020040 priority patent/WO2010078553A2/en
Publication of CN102365645A publication Critical patent/CN102365645A/zh
Application granted granted Critical
Publication of CN102365645B publication Critical patent/CN102365645B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06KRECOGNITION OF DATA; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K9/00Methods or arrangements for reading or recognising printed or written characters or for recognising patterns, e.g. fingerprints
    • G06K9/00221Acquiring or recognising human faces, facial parts, facial sketches, facial expressions
    • G06K9/00288Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements

Abstract

本发明公开了用于组织图像的计算机执行的方法,包括:接收图像,所述图像包括人面部的表示;生成关联值,所述关联值指示所述人面部对应于存储的面部简档的可能性,所述存储的面部简档与包括人面部的一个或多个简档图像相关联;评估接收的图像和生成的关联值来根据该评估的结果判断所述图像是否对应于所述存储的面部简档;将所述接收的图像与所述存储的面部简档相关联;以及存储对所述关联的指示。

Description

通过关联面部来组织数字图像
[0001] 相关申请的交叉引用
[0002] 本申请要求2009年5月5日提交的美国申请N0.12/436,069和2009年I月5日提交的美国临时申请N0.61/142,606的权益。
技术领域
[0003] 本公开涉及通过关联(correlate)图像(诸如数字图像)中表现的一个或多个面部来组织图像。
背景技术
[0004] 摄影是流行的娱乐。包括在数码摄影中所产生的数字图像在内的图像是普遍的。图像也可以通过图形编辑软件(例如图像编辑或绘图软件)、视频设备、渲染系统、扫描仪、断层扫描仪和无线电望远镜而产生。
[0005] 图像通常表现人物,特别是人物的面部。面部检测涉及判断图像是否表现一个或多个面部。面部识别(或识别)涉及识别图像中所表现的人物。识别可以通过将从图形面部选择的面部特征与面部数据库相比较来实现。面部识别算法可以通过从图像提取与面部特征对应的地标来识别面部。例如,算法可以分析眼镜、鼻子、颧骨和下巴的相对位置、大小和形状。识别算法包括本征脸(eigenface)、费歇尔脸、隐马尔科夫模型、和神经元驱动的动态链路匹配。
发明内容
[0006] 本公开描述用于通过关联面部来组织诸如数字图像之类的图像的技术。
[0007] 实现这里所描述的技术的系统使得用户能够组织诸如存储在计算机可读存储设备上的媒体之类的图像。逻辑和/或物理地,基于媒体中出现的一个或多个面部的关联,图像可以被自动指派到特定存储位置。例如,对应于特定个人的相册可以用表现那个个人的数字图像被自动填充。相册中所包含的图像必须关联的程度可以例如基于用户规定而不同。
[0008] 一般地,该说明书中所描述的主题的一个方面可以体现为一种用于组织图像的计算机执行的方法,该计算机执行的方法包括:接收图像,所述图像包括人面部的表示;生成关联值,所述关联值指示所述人面部对应于存储的面部简档(facial profile)的可能性,所述存储的面部简档与包括人面部的一个或多个简档图像相关联;评估接收的图像和生成的关联值来根据该评估的结果判断所述图像是否对应于所述存储的面部简档;将所述接收的图像与所述存储的面部简档相关联;以及存储对所述关联的指示。该主题的方面也可以实现在系统、计算机程序产品和有关处理和装置中。
[0009] 这些和其它实现可以可选地包括如下特征中的一个或多个。所述关联值可以指示所述图像对应于另一存储的面部简档,并且评估可以包括评估所述图像的第一元数据和所述一个或多个简档图像的第二元数据。该方法可以包括:从地址薄应用获取所述一个或多个简档图像以及与所述一个或多个简档图像相关联的简档信息;以及基于所述一个或多个简档图像以及所述简档信息来生成所述存储的面部简档。所述方法还可以包括:基于所述评估来提示用户确认所述人面部对应于所述存储的面部简档;以及响应于所述提示接受所述人面部对应于所述存储的面部简档的确认。接受可以包括经由具有肯定响应选项和否定响应选项的用户界面进行接收。
[0010] 实现还可以可选地包括如下特征中的一个或多个。该方法可以包括:访问检测信息,所述检测信息指示所述图像表示人面部的可能性低于90% ;确立所述图像描绘肤色色彩和锐利图像细节;以及基于所述确立来确认所述图像表现人面部。该方法还可以包括:基于所述检测信息、所述图像或所述关联值中的一者或多者来选择所述图像作为键图像;以及显示所述键图像来作为用于所述存储的面部简档的图标。所述图像可以包括所述图像的锐利度指示、捕获日期或图像分辨率的一者或多者。所述检测信息可以包括所述人面部与所述图像中所描绘的另一人面部的距离或所述人面部相对于所述图像的角度中的一者或多者。所述人面部可以包括第一人面部,并且所述方法还可以包括:得到所述图像中所表示的第二人面部与所述存储的面部简档之间的潜在对应关系;以及基于对应于所存储的面部简档的第一人面部和所述关联值来忽略得到的潜在对应关系。
[0011] 该方法还可以包括:接收表示人面部的未分类的图像、未分类的图像信息以及指示所述人面部对应于所述存储的面部简档的可能性的未分类的关联值;建立初始关联值阈值;基于所述初始关联值阈值和所述未分类的关联值来对所述未分类的图像进行分组;基于被分组到一起的未分类的图像的数量和未分类的图像的群组总数来得到修正的关联阈值;基于所述修正的关联阈值和所述未分类的关联值来对所述未分类的图像重新分组;以及基于所述重新分组来将未分类图像的一个或多个群组与所述存储的面部简档相关联。所述存储的面部简档可以包括第一存储的面部简档并且所述人面部可以包括第一人面部。所述方法可以包括:在用户界面中呈现所述第一存储的面部简档和第二存储的面部简档,其中所述第二存储的面部简档包括表现第二人面部的一个或多个图像;在所述用户界面中接收将所述第一存储的面部简档与所述第二存储的面部简档相关联的指示;以及根据所述第一存储的面部简档和所述第二存储的面部简档来生成包括一个或多个简档图像的合并相
ΠΠ
/ttr O
[0012] 该说明书中所描述的技术可以被实现来实现以下潜在优势中的一者或多者。关联面部可以被实现来准许将图像自动存储到一个或多个存储结构中,诸如文件夹或相册。此夕卜,该主题可以被实现来准许识别其图形面部定义或简档还未被定义的新个人。另外,该主题可以被实现来准许基于额外图像与个人的关联来提炼用于关联面部的标准(诸如定义或简档)。
[0013]以下将结合附图和描述来说明一种或多种实现的细节。其它特征和优点将从描述和附图以及权利要求中显而易见。
附图说明
[0014] 图1示出关联图形面部的示例性概览。
[0015] 图2示出用于关联图形面部的示例性系统。
[0016] 图3A是示出示例性关联处理的流程图。[0017] 图3B是示出用于设置适应性关联阈值的示例性处理的流程图。
[0018] 图3C是示出用于测试识别的示例性处理的流程图。
[0019] 图4A是示出示例性检测消除处理的流程图。
[0020] 图4B是示出示例性关联消除处理的流程图。
[0021] 图5是用于显示关联的面部的示例性用户界面的示图。
[0022] 图6A是用于接收用户输入的示例性用户界面的示图。
[0023] 图6B是用于接收用户输入的示例性用户界面的示图。
[0024] 图6C是用于接收用户输入的示例性用户界面的示图。
[0025] 图7是用于创建相册的示例性用户界面的示图。
[0026] 图8是用于接收用户输入的示例性用户界面的示图。
[0027] 图9是示出示例性关联技术的示图。
[0028] 图10是示出相册封面的选择的示图。
[0029] 在说明书和附图中,类似的标号指示类似的元素。
具体实施方式
[0030] 通过关联面部来组织面部包括将多个图像上的同一人物的表现相关联。通过媒体中表现的人物来组织图像提供若干潜在的优势。例如,这样的组织方案对于图像系统的用户是直观的,使得用户能够迅速理解该系统的功能。此外,可以基本上消除或降低手动组织许多图像的负担。另外,图像可以基于这些图像中所表现的人物被准确地分组。图像的准确分组可以提供改善的用户对图像的可访问性、组织和可利用性。
[0031] 图1示出相关关联图形面部的示例性概览。一般,图像从相机被传送至计算机。计算机可以包括相关关联系统。该关联系统可以通过对相同个人的图像进行分组来将图像关联。
[0032] 数码相机102是用于捕获数字图像的相机。数码相机102可以通过经由电子图像感测器记录图像来捕获视频或静止图像,或两者。数码相机102可以是单独的数码相机或可以合并到若干设备的任意设备中。例如,数码相机102可以合并到个人数字助理(PDA)、移动电话或网络摄像头中。此外,数码相机102可以利用可移除存储介质来存储所捕获的图像数据。例如,数码相机102可以将图像存储在可移除闪速存储设备(例如压缩闪存和安全数字卡)中。数码相机102可以记录各种格式(例如,原始格式或根据联合图像专家组(JPEG)的标准的格式)的图像。数码相机102也可以包括用于与计算机通信的一个或多个接口。例如,数码相机102可以包括有线接口(诸如通用串行总线(USB)或火线)和/或无线接口(诸如红外或射频)。
[0033] 图像104是由数码相机(例如数码相机102)产生的数字图像。图像104表现一面部。图像104还可以包括其它项目的表现。例如,图像104可以是站在一地标前面的人物的图像,并且可以表现建筑物、树木、天空等。此外,图像104可以以各种格式(诸如压缩格式(例如JPEG)或未经压缩的格式(例如RAW))储存。图像104可以包括图形数据和元数据。元数据可以遵循可交换图像文件格式(Exif)规范。Exif数据可以包括关于图像104光圈、曝光时间、日期和时间、地点和其它信息。
[0034] 数码相机102可以捕获图像。例如,图像106、108和110可以是类似于图像104的其它图像。图像106、108和110中的每一个也可以表现图形面部。
[0035] 计算机系统112可以被配置为接收从数码相机(诸如数码相机102)传送的图像。计算机系统112可以是计算机(例如台式计算机、膝上型计算机、服务器等等)、移动电话(例如黑莓)、PDA或其它这样的设备。计算机系统112可以包括被配置为执行一个或多个软件应用的硬件。此外,计算机系统112可以包括电子存储介质,诸如随机存取存储器(RAM)、闪存和硬盘驱动器。另外,计算机系统112可以包括能够接收数字信息(诸如图像)的一个或多个通信接口。这一个或多个通信接口可以是有线的或无线的。
[0036] 关联系统114可以被配置为将图像中所表现的图形面部相关联。关联系统114可以被实现在计算机系统(例如,计算机系统112)上所执行的软件、计算机系统中所包括的硬件或它们的组合中。关联系统114可以访问图像(例如数字图像)、分析与图像相关联的数据并且将被确定为表现共同图形面部的两个或更多图像关联。例如,数字图像可以被分析并且包括同一人物的图像可以被关联来形成一个图像群组。
[0037] 关联系统114可以处理图像104、106、108和110并且生成一个或多个图像群组。图像群组116包括数字图像,其中每个数字图像表现与相同个人相对应的面部。诸如图像群组116之类的图像群组可以是很大的图像群组(例如,成百上千的图像)、很小的图像群组(例如几个或几十个图像)或甚至单个图像。此外,同一图像可以属于多个图像群组。例如,包含名叫Jack(杰克)的人物和名叫Mary(玛丽)的另一人物在内的图像可以既被包括在与Jack相关联的图像群组中又被包括在与Mary相关联的另一图像群组中。
[0038] 图像群组118只包括一个图像。图像群组118可以因为各种原因而只包括一个图像,例如因为该个人仅表现在一个图像中,面部出现在该图像中的该个人还未被定义在关联系统114中,或因为图像中的个人未被识别为关联系统114中已经定义的某人。类似地,图像群组120也可以仅包括一个图像。
[0039] 在操作中,图像104、106、108和110可以从数码相机102被传送至计算机系统112。关联系统114可以例如响应于图像的传送而自动地或响应于从用户接收的命令而运行计算机系统112并且处理图像104、106、108和110。关联系统114可以判定图像106和图像110表现与同一人物相对应的面部,因此将图像106和图像116—起分到图像群组116中。图像群组116还可以包括已经存储在计算机系统112上的表现同一人物的图像。此外,关联系统114可能没有识别出图像(诸如图像104和图像108)中的一个或多个面部,因此可以创建仅包括单个图像的图像群组,例如图像群组118和图像群组120。包含未被识别的面部的图像可以称为单体(singleton)。在一些实施例中,关联系统114可以将一些或全部单体分到一个图像群组中。
[0040] 图2示出用于关联图形面部的示例性系统200。关联可以涉及各种硬件和软件组件。诸如图像和标识信息之类的输入可以被接收到并被用来将数字图像中所表现的面部关联。此外,关联处理的结果可以通过接收另外的输入并执行另外的校正而被反复地改进。
[0041] 如图2中所示,系统200可以包括数码相机202。数码相机202可以与图1中的数码相机102类似。
[0042] 计算机系统204可以与图1中的计算机系统112类似。另外,计算机系统204可以包括用于通过网络(例如网络206)接收和发送信息的硬件和软件。计算机系统204还可以被配置为将信息发送给存储设备(例如存储装置210)或从其接收信息。[0043] 关联系统212可以被配置为将数字图像中出现的面部关联。关联系统212可以包括软件和/或硬件组件。此外,关联系统212可以是单独的软件应用或可以被实现为较大型的软件应用的一部分。关联系统212可以被配置为在后台运行。可替换地或另外地,关联系统212可以包括用户界面214,用户界面214使得用户能够主动执行一个或多个管理和/或处理功能。
[0044] 用户界面214例如可以是图形用户界面(GUI)、命令行接口、触摸接口或用于接收来自远程用户的输入的网络接口。用户界面214可以包括用于命令和数据(包括数字图像)的输入和输出的机制。例如,用户可以输入命令和其它信息来操纵关联系统212。用户界面214也可以通过一个或多个接口平面来向用户输出信息。
[0045] 用户输入模块216可以被配置为接收、存储和处理来自外部源的输入。例如,用户输入模块216可以接收来自识别数字图像中的人物的用户的输入。该识别可以随后用于识别同一人物的其它图像。另外,可以接收来自具有相关信息的其它应用的输入。例如,可以使用来自地址薄应用的的数据。该数据可以包括图像、名字、电子邮件地址等等。数据可以被用来利用名字馈送给(seed)系统。当用户正在识别人物时,该系统可以建议来自地址薄的名字。此外,数据可以用来利用已命名的面部来协助系统。数据可以包括名字与面部之间的关联。有利地,数据可以用于在用户已经肯定地识别出任何人之前开始向用户建议名字(例如,用户可以具有地址薄中的联系人的图像并且该信息可以用来建议表现该联系人的图像)。
[0046] 用户输入也可以通过网络206(例如因特网)从远程服务器208(例如网站)接收。例如,如果用户将图像上载到社交网站(例如Facebook),则用户以及用户的朋友可以识别图像中的面部。该识别可以被视为输入并且在图像的关联中使用。不同的置信度级别可被指派给通过网络接收到的输入(例如用户朋友进行的识别比用户的朋友进行的识别可以是更有心值得赖的)。
[0047] 预处理模块218可以被配置为在将图像传递给面部分析引擎220之前处理图像。预处理模块218可以执行包括应用能够提高面部分析引擎220的性能的规则和探索在内的功能。例如,预处理模块218可以应用这样的规则:一个个人只能在一个图像中出现一次。
[0048] 面部分析引擎220可以被配置为检测并识别图像中所表现的一个或多个面部。面部分析引擎220可以接收图像和设置,并且可以检测图像是否变现与人物相对应的面部。设置可以包括影响面部分析引擎220的操作的参数,诸如阈值,该阈值指示例如面部分析引擎220在(向例如后置处理模块222)提供有关检测的信息之前,其关于该检测所应该具有的置信度级别。
[0049] 此外,面部分析引擎220还可以通过将图形面部与其它图形面部相比较来判断它们是否属于同一人物来关联图像。面部分析引擎220可以被配置为使用诸如本征面部或费歇尔面部之类的算法或诸如神经网络之类的技术来执行面部识别。另外,面部分析引擎220可以被实现为面部分析工具(诸如由OKAO Vision suite中的Schaumburg, Illinois的OMRON公司提供的工具)的库。
[0050] 后置处理模块222可以被配置为接收来自面部分析引擎220的信息。此外,后置处理模块222可以基于从引擎220接收的输入来应用规则以提高引擎220的性能。例如,后置处理模块222可以分析图像来判断图像中被面部分析引擎220断言为是面部的部分是否是肤色或看起来锐利。如果一个或这两个条件得不到满足,则模块222可以忽视面部的检测。以下将参考图4来更全面地讨论肤色和锐利度。此外,模块222可以将信息再次提交给引擎220以用于基于后置处理利用新的设置来再次进行处理。
[0051] 归纳模块224可以使用归纳推理而关于面部可能属于谁进行有根据的猜测。例如,如果归纳模块224相信两个图像表现同一人物的面部(例如如从后置处理模块222接收的那样),并且用户识别一个图像中的人物(例如,如从用户输入模块216接收的那样),则归纳模块224可以归纳出:另一图像也是该同一个人的图像。
[0052] 关联模块226可以被配置为使用由关联系统212中所包括的其它模块中的一个或多个模块提供的信息来关联数字图像中出现的面部。关联处理可以包括基于图像中所表现的面部来将图像组织到群组中。具体地,可以形成群组,群组包含系统可访问的、已知或被认为是属于某一个人的所有图像。
[0053] 图3是示出示例性关联处理300的流程图。关联处理300反复地调节关联阈值来产生可接受数目的图像群组。这些群组可以称为“桶”(bucket)。每个桶可以包含被认为是表现同一人物的图像。如果关联阈值被设置得很高,则处理300将不会将两个图像关联,除非实质上确定图像表现同一人物的面部。因此,如果关联阈值被设置得很高,则由于同一个人的相同图像很有可能将不会被关联,所以将生成较多的桶而每个桶只有几个图像。如果关联阈值被设置得很低,则处理300会频繁地关联可能并不对应于同一人物的面部。因此,将关联阈值设置为低值会产生较少的桶而每个桶具有较多的图像。然而,并不表现与同一个人相对应的面部的两个图像将被关联的可能性增大。理想情况是,桶将尽可能多地包括同一人物的图像并且尽可能少地或不包括不表现这个人物的图像。
[0054] 表现面部的图像可以被接收到(302)。此外,阈值可以被设置为默认值(304)。默认值可以是中间值。一旦默认值已经被设置,图像就可以被关联,使得被认为是表现同一人物的面部的图像被与单个桶相关联(306)。随后可以判断所生成的桶的数目是否是可接受的(308)。如果桶的数目是可接受的(例如,不是基本上与图像一样多的桶也不是相对于图像的数目非常少的桶),则处理300可以判断是否剩下太多单体(310)。单体可以是包含处理300不能识别为相对应的人物的一个或多个面部的图像。具有太多单体意味着阈值被设置得太高并且因此面部没有与包含同一人物的面部的其他图像恰当地关联。
[0055] 如果判定存在太少桶,则阈值可以增大(314)。增大阈值需要处理300具有桶中的面部属于同一人物的增加的置信度。一旦阈值增大,处理300再次执行图像的关联(306)。
[0056] 如果判定存在太多桶,则阈值可以增大(316)。另外,如果处理300在310处判定存在太多单体(例如指示:将图像指派给桶所需要的置信度级别太高),则阈值也可以减小(316)。减小阈值允许处理300基于更低的置信度级别来关联图像。一旦阈值减小,则处理300再次执行图像的关联(306)。
[0057] 如果判定存在可接受数目的单体(例如,相对于图像总数),则处理300可以继续到接收用户输入(312)。例如,用户输入可以包括关于一个或多个图像中表现的是谁的面部这样的信息。
[0058] 图3B是示出用于设置适应性关联阈值的示例性处理350的流程图。用于关联置信度的阈值可以以每个桶为基础地设置。首先,阈值可以被设置为中等值(352)。桶大小可以增大(354)。例如,更多图像可以被添加到系统或者图像中的更多面部可以被识别为给定个体。随着桶大小增大,阈值可被增大(356),使得关联特定桶的面部更为困难(相对于更低的阈值)。
[0059] 图3C是示出用于测试潜在的关联的示例性处理370的流程图。一图像中的面部与桶的潜在关联可以被检查(372)。该检查可以包括判断该潜在关联的置信度值是否刚好(例如略微)低于在将该图像包括在给定桶内的阈值要求(374)。如果置信度值刚好低于阈值,则元数据测试可以被运行(376)。该测试可以包括比较例如源图像的直方图、曝光值以及捕获日期和时间。时间上接近一起拍摄的并且具有类似直方图和曝光值的图像包括相同的主题和人物。如果判定元数据是类似的(378)(例如指明:该图像与已经在桶中的其它图像是同时拍摄的),则面部被与桶关联(382)。除了比较整个图像的直方图以外,或替代此,当图像表现多个面部时,可以是仅该面部区域的直方图用于该测试。
[0060] 另一方面,如果置信度值被确定为不是刚好低于阈值(例如相对于诸如10%的预定设置),或者换而言之,是明显低于阈值,则关联被忽略。此外,如果判定元数据不相似(378),则关联也可以被忽略(380)。
[0061] 图4A是示出示例性检测消除处理400的流程图。在一些情形中,检测引擎检测按照推测是变现面部(即检测)但实际上不表现面部的图像的区域。处理400可以消除这样的错误肯定判断检测。
[0062] 检测消除处理400可以通过接收检测置信度来开始(402)。检测置信度可以是由分析引擎提供的值,该值指示引擎对该检测实际上是对面部的检测的信心。
[0063] 处理400继续到测试对锐利度和肤色的检测(404)。锐利度可以包括分析面部在图像中看起来是否锐利。模糊可能是由于缺少实际的或明显的锐利度而引起的。例如,缺少实际的锐利度可能是由于不恰当的相机聚焦或拍摄图像时相机或对象的移动引起的。明显的锐利度可以是指图像的锐度(即边缘对比度)。锐度与亮度关于空间的导数的幅度有关。具有更高的锐度的图像可以看起来更锐利并且对于用户更有吸引力,即使图像并不比具有更低锐度的图像具有更高的分辨率或实际锐利度。诸如反锐化掩模之类的图像处理技术可以增大图像中的锐度但是同时会减低实际锐利度。实际的和明显的锐利度中的任一者或这两者可以被评估来判断该检测是否是模糊的。
[0064] 处理400还可以判断该检测是否变现潜在的肤色(404)。肤色可以是图像中例如由对象的天然颜色、光照和相机曝光决定的与人类肤色的范围相对应的颜色。例如,表现鲜绿色度的检测不可能对应于面部。
[0065] 处理400继续到判断检测置信度是否相对较高(406)。该判断可以基于表现检测置信度的值与预定值的比较。例如,1000可以表示检测变现面部的最高置信度。可以判定高于800的置信度值是高的。
[0066] 如果检测置信度高,则处理400继续并且预期要评估该检测是否有效(412),将锐利度和肤色测试相对于置信度较少地加权(408)。如果检测置信度高,则处理400继续,并且再次预期要评估该检测是否有效(412),将锐利度和肤色测试相对于置信度较多地加权(410)。
[0067] 处理400继续到判断该检测是否有效(412)。该判断可以是基于置信度值和锐利度和肤色测试的结果的。当置信度值被判定为高时(406),在该判定中,锐利度和肤色测试可以被较少地加权(408)。相比而言,当置信度值被判定为低时(406),在该判定中,锐利度和肤色测试可以被较多地加权(410)。尽管示例性处理400关于高的检测置信度而使用二进制判断(406),但是一些实现可以基于检测置信度和图形测试的结果的相对值来成比例地使用它们。结果可以被按比例增减,其中,给予图像测试权重取决于检测置信度位于从低到高的比例尺上的位置(例如,在最高置信度的位置,该测试相对于置信度被加权极少)。
[0068] 除了锐利度和肤色测试以外,一些实现在判断检测是否正确时使用其他因素。例如,检测引擎可以提供有关所检测到面部看起来相对于图像的角度的信息。如果图像表现多个面部,并且这些面部中的一个相对于其它面部是倒挂的,则倒挂检测可以被认为不太可能是有效的。其它因素可能影响该判断,诸如在给定正确检测的情况下很少发生的环境。
[0069] 处理400继续进行到消除被确定为无效(412)的检测(414)。消除可以包括例如从存储器删除该检测,将该检测与抑制指示相关联或将该检测存储在错误肯定判断的列表中。
[0070] 如果该检测被判定为是无效的(412)或在有效检测被消除之后(414)处理400结束。
[0071] 图4B是示出示例性关联消除处理450的流程图。图像可以基于该图像表现与也出现在其它图像中的个人相对应的面部而被与其它图像关联。检查该关联可以揭示不可能发生的情形并且提供消除关联的基础。有利的是,消除被确定为不可能的关联可以提闻提供给用户的信息的质量。例如,出现在同一图像中的两个面部可能被与同一个人关联。由于图像很少表现与同一个人相对应的两个面部,因此消除不那么可能的关联(例如通过识别置信度得分判定)可以使得有可能无效的关联被消除。因此,该消除可以在整体上提高关联的准确度。
[0072] 关联消除处理450可以通过关联面部来开始(452)。一般而言,关联面部可以包括在图像中提取有可能标识面部的特征。这些特征随后被与其它面部的特征相比较来识别哪些面部与同一人物对应。具体地,关联可以包括给与两个或更多个面部相同的面部键(例如,唯一标识符)。潜在地,具有相同面部键的每个面部对应于同一个人。具有相同面部键的一组面部称为桶。关联也可以包括给与每个面部用来识别该面部的源发图像的图像键。在一些实现中,关联面部(402)逐图像进行。这样做可以使得在桶被更新之前消除无效的关联。
[0073] 关联面部也可以由用户完成。例如,用户可以识别图像面部。该面部可能已经被认为是不同的个人并且被分到与用户所提供的信息相一致的桶中。
[0074] 关联可以被检查(454)。检查关联可以包括比较面部键和图像键。检查可以使得发现不可能的关联。如果判定某些关联是不可能的(456),则关联可以被消除(458)。消除可以包括从存储器删除关联,将关联与抑制指示相关联,或将关联存储在错误肯定判断的列表中。如果判定关联不是不可能的(456)或不可能的关联被消除(458),则处理450结束。
[0075] 例如,关联面部可以使得来自相同图像的两个面部被指派相同面部键。因为很少有图像表现与相同个人相对应的两个面部,因此,该不太可能的关联(例如通过置信度值确定)可以被消除。此外,如果面部属于桶(例如由关联系统指派),但是随后被用户移除,则该桶中的其余面部也可能被错误地关联因此可以例如被重新评估。
[0076] 图5是用于显示关联的面部的示例性用户界面502的示图。用户可以提供有关用户界面502中示出的面部的信息。由用户提供的肯定识别可以是对一个或多个个人的图像进行分组的基础。另外,关联系统可以判定用户还未提供其信息的其它图像有可能表现已知的个人。不是将这些图像添加到被肯定地识别的图像的群组,而是被关联的图像可以在用户界面的分开的区域中被提供。有利地是,用户可以获得自动关联的益处同时不必接受关联系统的判定。
[0077] 用户界面502允许用户从关联系统接收信息。用户界面502可以包括呈现给用户的图形的、文本的和/或听觉信息,以及用于从用户接收控制序列(例如对计算机键盘的敲击、计算机鼠标的月底欧诺过和触摸屏上的选择)的机制。用户界面502可以是图形用户界面(⑶I)并且可以经由诸如计算机键盘和鼠标之类的设备接受输入,并且可以在一个或多个输出设备(诸如计算机显示器(例如液晶显示器(LCD)监视器))上提供图形输出。用户界面502也可以是基于web的用户界面或web用户界面(WUI),并且可以通过生成网页(其经由因特网被发送并且由用户使用网络浏览器(例如微软的Internet Explorer)来阅览)来接受输入和提供输出。用户界面502也可以被实现为包括利用触觉反馈来补充或替换其它形式的输出的触觉接口。用户界面502还可以或可以包括使用触摸屏显示器作为组合的输入和输出设备的触摸接口。
[0078] 用户界面502中所呈现的菜单516可以为用户提供访问关联系统的面部显示功能的方式。例如,用户可以点击菜单516上的面部选项518并且被呈现系统中已经可用的个人的列表(未示出)。此外,用户可以从该个人的列表中选择个人来查看包含该个人的面部的图像。此外,当面部选项518被选择时,用户界面可以显示该系统中所呈现的个人中的一个或多个个人。
[0079] 用户界面502的面部显示区域512可以包括与给定个人相关联的一个或多个图像。该示例性面部显示区域512被与名叫James的个人相关联并且包括与James相对应的两个图像504和506。区域512可以包括该个人的零个(例如,如果个人的简档已被创建但是没有对应的图像已被识别)、一个或许多图像。此外,图像504和506中的一者或这两者可以包括被用户肯定地识别为James的面部。除了被用户肯定的识别的面部以外,区域512还可以包括在没有来自用户的输入的情况下通过关联系统识别的面部(例如,通过系统被高度置信度地识别的面部)。
[0080] 关联显示区域514可以包括关联系统已经确定为有可能表现面部显示区域512中所包括的图像中所显示的同一个人的一个或多个图像。用户可以肯定地识别这些图像中的一个或多个是对应于James的。用户也可以将系统识别的图像留在区域514中作为在不必肯定地识别每个图像中的每个面部的情况下查看个人的更多图像的便利方式。这可以使得在用户的计算机上具有成千上万的图像时节省大量时间。例如,图像508可以是James的图像,其与James的其它图像一起被显示,即便用户从未将图像508中的面部肯定地识别为与James相对应。可替换地,图像510可能表现不是James的面部并且用户可能否定地将该面部识别为不是James的面部。这样,对于正确地做出大多数判断的关联系统,用户可以通过肯定地识别一些面部并且随后仅否定地识别不匹配的图像来节省更多时间。
[0081] 用于关联显示区域514的图像可以使用桶来选择。例如,如果桶中的图像被肯定地识别,则该桶中的其余面部可以显示在关联显示区域514中,这是因为认为它们对应于相同个人。[0082] 图6A是用于接收用户输入的示例性用户界面602的示图。一般,用户界面可以被设置为指示以下两者:该系统已经在图像中找到面部并且该系统已经潜在地识别与该面部相对应的人物。
[0083] 用户界面602可以显示包含人物606的面部的图像。诸如长方形或其它这样的轮廓线之类的标记604可以用来指示面部被认为在图像中的哪儿。用户界面602可以提示用户通过对话框608来提供输入,以确认人物(例如James)的身份或以其他方式提供识别信息。在一些实现中,对话框608可以包括“是”选项610和“否”选项612以允许用户指示该面部是否属于James。仅提供确认选项610和612的对话框608可以在关联系统对所不出的人物606的身份非常有信心时被提供。当永固选择选项610和612中的一个时,关联系统可以使用该信息(例如从其学习)来在将来执行更准确的关联。该系统也可以重新评估已经基于新的信息作出的判定。
[0084] 图6B是用于接收用户输入的示例性用户界面652的示图。一般,用户界面652可以被配置为指示该系统已经在图像中找到面部并建议该面部的一个或多个潜在的身份。
[0085] 用户界面652可以显示包含人物656的面部的图像。标记654可以用来指示该面部被认为位于图像中的哪儿。用户界面652可以通过对话框658请求用户的输入,以指示该面部是否还未被识别以及建议该系统中的一个或多个潜在匹配的名字。例如,对话框658可以包括可选择的“James”选项660,其示出与James相关联的名字、小缩略图或其它这样的图标。如果该系统还认为该面部可能属于WiIIiam,则可以提供可选择的WiIIiam选项662。如果该图像中示出的人物在该系统中还未被识别,则可以提供创建新人物选项664。在选择了创建新人物选项664时,用户可以输入与图像相对应的个人的名字和任何其它信息来创建随后可用于对图像进行分组的简档。在用户不想提供与所呈现的个人相对应的输入的情况中,对话框608也可以包括忽略选项668。
[0086] 图6C是用于接收用户输入的示例性用户界面672的示图。一般,用户界面672可以被配置为接收有关面部的身份的输入。
[0087] 用户界面672可以显示包含人物676的面部的图像。该面部可以通过关联系统或通过用户在图像中被定位。例如,如果该系统没有在图像中发现面部,则用户可以点击人物676的面部。在这样的情况中,系统将不具有因自动识别而产生的信息。然而,在通过用户的面部定位指明之后,系统可以使用位置来重新运行分析处理。该处理潜在地需要较少的有关面部存在性的置信度,这是因为用户已经指明了在该区域中存在面部。面部也可以在没有用户输入的情况下,例如响应于面部被下载到系统中而被检测面部。
[0088] 标记674可以用来指示图像中的特定面部。标记674可以将面部与其它面部相区分,当图像表现出多个面部。用户可以通过点击与标记674相关联的X680来取消标记674。当系统将某物错误地识别为面部,而其实际上并不表现面部时,用户可能希望例如取消 674。
[0089] 用户界面672可以通过对话框678来请求用户的输入。例如,该系统可以在个人不为系统所知时请求输入。当用户开始在文本框682中键入时,系统可以提供选项菜单684,其列出该系统中与用户所键入的内容相匹配的人物。例如,如果用户在文本框682中键入“ja”时,系统可以提供选项菜单684,其列出“Jack”和“James”,这是因为这两个名字都与用户的“ja”键入相匹配。用户随后可以点击这些名字中的一个(诸如名字Jack 686)来用名字标识人物676。对话框678可以通过用户点击与面部标记674相关联的X680而不必输入名字的情况下被取消。对话框678也可以包括用户被取消的机制,诸如在右上角的X(未示出)。
[0090] 图7是用于创建一个或多个相册的示例性用户界面702的示图。相册可以是基于主题(诸如特定个人或个人群组)的图像群组。例如,父母可能制作示出她的两个孩子的图像的相册(即,“与”相册)。因此,该相册中的每个图像都表现两个孩子。另外,父母也可能制作示出她的两个孩子中的任一个的图像的相册(即,“或”相册)。因此,该相册中的每个图像表现出这两个孩子中的至少一个。
[0091] 用户界面702可以包括菜单704,其被配置为允许用户利用用户界面702进行导航。用户界面702还可以包括一个或多个个人,诸如两个识别的个人708以及710。James相册708被示出,其中信息712提供其名字“james”以及其被拍摄的图像(例如照片)的数目14。用于James相册708的封面图像713也可以被显示,封面图像可以由用户选择或者基于多个标准(诸如所检测到的面部的图像质量或图像已经被观看的次数)而被自动选择。Bert相册710被类似地示出,其中信息714提供其名字以及该相册中所包含的图像(例如照片)的数目。
[0092] 在操作中,为了创建包括来自James相册708和Bert相册710 二者的图像的新的小相册,用户可以将James相册708拖拽716到菜单的小相册区域706并且放落James相册708。用户也可以将Bert相册710拖拽718到菜单的小相册区域706并且将Bert相册710也放落在那儿。通过拖拽相册708和710 二者,该系统可以创建或者一起包含两个人物的图片的相册或者包含任一人物的图片的相册。当与已命名的个人相关联的相册被放落在小相册区域706中时,一种类型的相册或其它可以被默认地创建。可替换地,用户可以被提示来选择要创建的相册的类型。
[0093] 图8是用于接收用户输入的示例性用户界面802的示图。一般,关联系统可以将被认为表现相同人物的图像一起分到单个桶中。用户界面802可以被提供用于修改桶,例如将各自包含相同人物的图像的两个桶合并。一些实现包括图8中示出的桶概念但是不包括用于修改或以其他方式与桶交互的用户界面(例如用户界面802)。
[0094] 用户界面802可以包括用于导航用户界面802的菜单818。选择菜单818中的桶选项可以促使用于修改一个或多个桶的接口 802被显示。例如,关联处理可以生成三个桶804、806和808。用户可以已经将第一桶804识别为具有特定人物(例如James)的图像。接口 802可以显示有关已命名的个人的信息810,诸如他的或她的名字以及在第一桶804中的图像(例如,照片)的数目。第一桶804也可以包括显示该个人的图标822。类似地,接口 802可以显示与第二桶806相对应的图标824和信息812以及与第三桶808相对应的图标826和信息814。
[0095] 在操作中,用户可以将第三桶808拖拽到另一桶(诸如第一桶804)来合并桶。除了合并两个图像群组,将第一桶804与第三桶808合并还可以向系统提供额外的信息。例如,该系统可以基于第三桶808中所包含的额外的图像来提炼与James相关联的识别标准。如果两个桶的名字不一致,可以采用标准合并规则(例如要求用户选择哪个名字对于所产生的合并桶是正确的)。
[0096] 图9是示出示例性关联技术的示图。通过将图像分组到桶中,关联系统可以使用归纳推理来根据关于桶的个人成员而了解的信息来关于作为整体的桶做出判定。
[0097] 图像群组902可以被关联系统处理。图像群组902可以表示个人的面部。在关联处理904期间,图像群组904可以被虎贲并被指派给桶906、908或910。图像群组902中的每个图像被指派给桶,诸如桶906、908和910中的一个。潜在地,图像群组902的一个或多个图像可能被指派给多个桶(例如,如果图像表现出两个或更多人物的话)。
[0098] 在关联904之后,桶A 906包括图像1912、图像3914、图像4916和图像5918。每个图像基于阈值置信度级别来表现相同个人的面部。此外,桶B 908包括图像2 980、图像6922和图像8 924。另外,桶C 910包括图像7 926和图像9 928。每个桶906、908和910可以是基于相同的关联标准而创建的。
[0099] 在操作中,关联系统可以向用户呈现930图像I 912。用户可以请求查看图像I 912或可以被用图像I 912提示。一旦图像I 912已经被呈现,则用户可以进行响应934。响应可以包括例如可以点击通过用户界面而呈现给用户的对话框(例如,图6B中示出的对话框658)中的选项。响应还可以包括图像I 912中的面部的肯定标识(ID)932。肯定ID932随后可以用来确定例如图像3 914是同一个人的图像。因此,基于所建立的置信度级别,桶中的一个图像的标识可以用来识别那个桶中其余图像的每一个。类似地,关联系统可以向用户呈现942图像7 926。用户可以进行响应946并且可以提供图像7 926中的面部的肯定ID 944。肯定ID 944随后可被用来确定例如图像9 928是相同个人(其身份在标识944中已经被确认了)的图像。
[0100] 此外,关联系统可以向用户呈现936图像2 920。用户可以进行响应940并且提供否定ID 938,否定ID 938指示图像2 920中的面部不是特定个人的面部。ID 938可以用来确定例如图像6 922也不是所识别的个人938的图像。
[0101] 关联系统也可以合并由用户提供的肯定和否定信息中的一者或这两者来做出进一步的判定。例如,如果肯定ID 932和944是针对相同个人的,则可以判定图像9 928和图像3 914是潜在地相同的个人。另外,如果否定ID 938与肯定ID 932是针对相同的个人的,则可以判定图像6 922有可能不是图像3 914中示出的相同个人。
[0102] 图10是示出相册封面的选择的示图。相册可以是基于主题的图像群组。例如,已命名的个人可以具有该个人的所有图像1034的相册1102。用户可以从相册中选择图像1004中的一个来作为封面(例如,用来图形地标识相册的图像)。可替换地,相册封面可以从相册1002中自动选择,诸如第一图像。然而,当用户还没有选择图像时,第一图像可能不是用作封面的该人物的最佳表现。因此,在没有用户输入的情况下,令人满意的封面图像可以是基于表征图像的数据被选择的。在一些实现中,封面图像也可以被自动修剪以突出与相册相关联的个人的面部。
[0103] 在操作中,面部可以使用关于相册1002中的图像1034而了解的信息来选择。可以存在多种类型的图像数据1006,诸如图形数据1012、元数据1020和分析数据1028。图形数据1012可以包括例如该图像的分辨率1008和图像中所表现的面部的锐利度1010。更高分辨率的图像比低分辨率图像可能看起来更好。类似地,锐利的(例如聚焦的)面部可以比模糊的面部看起来更好。
[0104] 元数据1020可以包括所拍摄的图像日期1014、评级1016和web张贴的日志1018。日期1014可以用来判断该图像在时间上相对于相册中的其他图像是否是较新近的。评级1016可以是指示图像的一个或多个用户评价的评级。Web张贴日志108可以包括有关例如将图像上载到社交网络站点(这进而可以指示用户对该图像相对比较重视)的信息。
[0105] 分析数据1028可以包括距离也在图像1004中的其它面部的距离1022,(例如识别的或检测的)置信度1024以及面部角度1026。如果面部被自动修剪以用于封面,则距离1022可能是有帮助的。如果面部与一个或多个其它面部靠得很近,则自动修剪会导致其它人的面部的一部分表现在封面中或者对象的面部被紧密地修剪。置信度1024可以指示该面部实际上对应于所关心的对象的可能性。因此,相册封面可以是由关联系统确定的用来表示对象的面部而不是被用户肯定地识别的面部的图像。另外,即使图像已被用户肯定地识别,置信度1024也可以帮助通过获知该图像与相册1002中的其它图像多紧密地关联来判断图像是否是个人的代表。另外,面部角度1026可以用于帮助例如选择直接面对观看者的面部而不是侧面。
[0106] 相册中的各种图像IO 34可以使用例如各个图像的图像数据的分量而被比较1030。基于该比较1030,在视觉上有吸引力并且是图像群组1034的代表的封面可以被选择1032。
[0107] 该说明书中所描述的主题和功能操作的实现可以实现在电子电路、计算机软件、固件或硬件,或这它们的组合或等同物中。主题可以被实现为一个或多个计算机程序产品,诸如有形地包含在设备或介质中的一个或多个计算机程序,包括机器可读存储设备或机器可读存储介质。机器可读包括光学可读,例如包括可借助光纤读取的基板上所制作的光学可读物理标记。机器可读还包括包含以磁性材料制作的物理图案的磁学可翻译存储或记录。计算机程序产品可以用于由和数据处理装置(包括一个或多个处理器或计算机)执行或控制数据处理装置的操作。数据处理装置可以包括硬件、处理器固件、协议栈、数据库管理系统和操作系统中的任一者。
[0108] 计算机程序(也称为程序、软件、软件应用或代码)可以用编程语言(包括编译的或翻译的语言)写出,并且以各种形式(包括作为独立的程序或适合于在计算环境中使用的模块、组件、子例程或其它单元)部署。计算机程序不一定对应于文件。计算机程序可以存储在保持其它程序或数据的文件的一部分中、专用于所关心的程序的单个文件中或多个协作文件(例如存储一个或多个模块、子程序或代码部分)中。计算机程序可以在一个计算机或多个计算机上被执行,这些计算机在一个站点处或者分布在多个站点并通过通信网络(诸如网络或互联网网络(例如因特网))互联。
[0109] 在此说明书中描述的处理和逻辑流程可以通过计算机程序产品被执行,对输入数据进行操作并且生成输出。适合于计算机程序产品的执行的处理器包括通用的和专用的微处理器,以及一个或多个计算机处理器。处理器可以从只读存储器、随机存取存储器或这两者接收、取回和执行指令以及数据。
[0110] 计算机可以包括用于执行指令的处理器和用于存储指令和数据的一个或多个存储器设备。计算机也可以包括用于存储数据的一个或多个海量存储设备(例如磁的、磁光的或光的盘),或者可操作地耦接到其来从其接收数据或向其传送数据。计算机可以嵌入在另一设备中,另一设备诸如是移动电话、数码相机、数码摄像机、个人数字助理(PDA)、移动音频播放器或全球定位系统(GPS)接收机。适合于包含计算机程序指令和数据的机器可读存储设备或存储介质可以包括非易失性存储器,诸如半导体存储器设备(例如EPR0M、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移除盘)、磁光盘、以及CD-ROM和DVD-ROM盘。处理器和存储器可以用专用逻辑电路进行补充或被合并到其中。
[0111] 用户交互可以在计算机或其它设备上实现,所述其它设备具有用于向用户显示信息的显示设备(例如CRT (阴极射线管)或LCD (液晶显示器)监视器)和任意形式的输入设备(例如用户可以用来提供输入的键盘和诸如鼠标和跟踪球之类的点选设备)。其它类型的设备也可以用来向用户提供交互;例如,提供给用户的反馈可以是任意形式的感知反馈,例如视觉反馈、听觉反馈或触觉反馈;并且来自用户的输入可以以任意形式(包括声学的、语音的或触觉的输入)被接收。
[0112] 在此已经公开了许多实现。然而,可以理解,在不偏离权利要求的精神和范围的情况下,可以进行各种修改。因此,其它实现也在以下权利要求书的范围以内。

Claims (41)

1.一种用于组织图像的计算机实现的方法,该计算机实现的方法包括: 接收表示人面部的第一多个未分类的图像、未分类的图像信息以及指示所述人面部对应于存储的面部简档的可能性的未分类的关联值,其中所述存储的面部简档与两个或更多个简档图像相关联,每一个所述简档图像包括与相同个人对应的人面部的表示; 建立初始关联值阈值; 基于所述初始关联值阈值和所述未分类的关联值来对所述第一多个未分类的图像进行分组; 基于被分组到一起的未分类的图像的数量和未分类的图像的群组总数来得到修正的关联阈值; 基于所述修正的关联阈值和所述未分类的关联值来对所述第一多个未分类的图像重新分组; 基于所述重新分组来将未分类的图像的一个或多个群组与所述存储的面部简档相关 联; 接收第二图像,所述第二图像包括人面部的表示; 生成关联值,所述关联值指示在接收的第二图像中表示的所述人面部对应于存储的面部简档的可能性; 评估接收的第二图像和生成的关联值来根据该评估的结果确定所述接收的第二图像是否对应于所述存储的面部简档; 响应于确定所述接收的第二图像对应于所述存储的面部简档,将所述接收的第二图像与所述存储的面部简档相关联;以及 存储对所述关联的指7]^。
2.根据权利要求1所述的计算机实现的方法,其中所述关联值指示所述接收的第二图像对应于另一存储的面部简档,并且其中评估还包括评估所述接收的第二图像的第一元数据和所述两个或更多个简档图像的第二元数据。
3.根据权利要求1所述的计算机实现的方法,还包括: 从地址薄应用获取所述两个或更多个简档图像以及与所述两个或更多个简档图像相关联的简档信息;以及 基于所述两个或更多个简档图像以及所述简档信息来生成所述存储的面部简档。
4.根据权利要求1所述的计算机实现的方法,还包括: 基于所述评估来提示用户确认在接收的第二图像中表示的所述人面部对应于所述存储的面部简档;以及 响应于所述提示接受在接收的第二图像中表示的所述人面部对应于所述存储的面部简档的确认。
5.根据权利要求4所述的计算机实现的方法,其中,接受还包括经由具有肯定响应选项和否定响应选项的用户界面来进行接受。
6.根据权利要求1所述的计算机实现的方法,还包括: 访问检测信息,所述检测信息指示所述接收的第二图像表示人面部的可能性低于90% ; 确立所述接收的第二图像描绘肤色色彩和锐利图像细节;以及基于所述确立来确认所述接收的第二图像表示人面部。
7.根据权利要求6所述的计算机实现的方法,还包括: 基于所述检测信息、所述接收的第二图像或所述关联值中的一者或多者来选择所述接收的第二图像作为键图像;以及 显示所述键图像来作为用于所述存储的面部简档的图标。
8.根据权利要求7所述的计算机实现的方法,其中所述接收的第二图像包括所述接收的第二图像的锐利度指示、捕获日期或图像分辨率的一者或多者。
9.根据权利要求7所述的计算机实现的方法,其中所述检测信息包括在接收的第二图像中表示的所述人面部与所述接收的第二图像中所描绘的另一人面部的距离或所述人面部相对于所述接收的第二图像的角度中的一者或多者。
10.根据权利要求1所述的计算机实现的方法,其中所述人面部包括第一人面部,所述计算机实现的方法还包括: 得到在所述接收的第二图像中所表示的第二人面部与所述存储的面部简档之间的潜在对应关系;以及 基于对应于所述存储的面部简档的第一人面部和所述关联值来忽略所得到的潜在对应关系。
11.根据权利要求 1所述的计算机实现的方法,其中,所述存储的面部简档包含第一存储的面部简档并且在接收的第二图像中表示的所述人面部包含第一人面部,所述计算机实现的方法还包括: 在用户界面中呈现所述第一存储的面部简档和第二存储的面部简档,其中所述第二存储的面部简档包括表示第二人面部的一个或多个图像; 在所述用户界面中接收将所述第一存储的面部简档与所述第二存储的面部简档相关联的指示;以及 根据所述第一存储的面部简档和所述第二存储的面部简档来生成包括一个或多个简档图像的合并相册。
12.一种用于组织图像的计算机实现的系统,该计算机实现的系统包括: 用于接收表示人面部的第一多个未分类的图像以及相关联的关联值的装置,所述相关联的关联值指示所述人面部对应于存储的面部简档的可能性,其中所述存储的面部简档与两个或更多个简档图像相关联,每一个所述简档图像包括与相同个人对应的人面部的表示; 用于建立初始关联值阈值的装置; 用于基于所述初始关联值阈值和所述相关联的关联值来对所述第一多个未分类的图像进行分组的装置; 用于基于被分组到一起的未分类的图像的数量和未分类的图像的群组总数来得到修正的关联阈值的装置; 用于基于所述修正的关联阈值和所述未分类的关联值来对所述第一多个未分类的图像重新分组的装置; 用于基于所述重新分组来将所述第一多个未分类的图像的一个或多个群组与所述存储的面部简档相关联的装置;用于接收第二图像的装置,所述图像包括人面部的表示; 用于生成关联值的装置,所述关联值指示在接收的第二图像中表示的所述人面部对应于存储的面部简档的可能性; 用于评估接收的第二图像和生成的关联值来根据该评估的结果确定所述接收的第二图像是否对应于所述存储的面部简档的装置;以及 用于响应于确定所述接收的第二图像对应于所述存储的面部简档,显示与所述存储的面部简档相关联的所述接收的第二图像的装置。
13.根据权利要求12所述的计算机实现的系统,还包括 外部输入,可操作用于接收数据以及执行输入操作,所述输入操作包括: 通过所述外部输入来获取所述两个或更多个简档图像以及与所述两个或更多个简档图像相关联的简档信息。
14.根据权利要求13所述的计算机实现的系统,还包括: 用于基于所述获取的两个或更多个简档图像以及所述简档信息来生成所述存储的面部简档的装置。
15.根据权利要求13所述的计算机实现的系统,其中所述外部输入包括地址薄应用适配器,所述地址薄应用适配器用于从地址薄应用获取所述两个或更多个简档图像以及所述简档信息。
16.根据权利要求12所述的计算机实现的系统,还包括: 用于基于所述确定,经由用户界面设备来提示用户确认在接收的第二图像中表示的所述人面部对应于所述存储的面部简档的装置;以及 用于响应于所述提示,经由所述用户界面设备来接受在接收的第二图像中表示的所述人面部对应于所述存储的面部简档的确认的装置。
17.根据权利要求12所述的计算机实现的系统,还包括: 用于基于所述接收的第二图像或所述关联值中的一者或多者来选择所述接收的第二图像作为键图像的装置;以及 用于显示所述键图像来作为与所述存储的面部简档相关联的图标的装置。
18.根据权利要求17所述的计算机实现的系统,其中所述接收的第二图像包括所述接收的第二图像的锐利度指示、捕获日期或图像分辨率中的一者或多者。
19.根据权利要求12所述的计算机实现的系统,其中在接收的第二图像中表示的所述人面部包括第一人面部,所述系统还包括: 用于得到所述接收的第二图像中所表示的第二人面部与所述存储的面部简档之间的潜在对应关系的装置;以及 用于基于对应于所述存储的面部简档的第一人面部和所述关联值来忽略所述得到的潜在对应关系的装置。
20.根据权利要求12所述的计算机实现的系统,其中所述存储的面部简档包括第一存储的面部简档并且在接收的第二图像中表示的所述人面部包括第一人面部,所述系统还包括: 用于通过用户界面设备来呈现所述第一存储的面部简档和第二存储的面部简档,其中所述第二存储的面部简档包括表示第二人面部的一个或多个图像的装置;用于通过所述用户界面设备来接收将所述第一存储的面部简档与所述第二存储的面部简档相关联的指示的装置;以及 用于根据所述第一存储的面部简档和所述第二存储的面部简档来生成包括一个或多个简档图像的合并相册的装置。
21.一种用于组织图像的计算机实现的系统,该计算机实现的系统包括: 用于接收表示人面部的第一多个未分类的图像、未分类的图像信息以及指示所述人面部对应于存储的面部简档的可能性的未分类的关联值的装置,其中所述存储的面部简档与两个或更多个简档图像相关联,每一个所述简档图像包括与相同个人对应的人面部的表示; 用于建立初始关联值阈值的装置; 用于基于所述初始关联值阈值和所述未分类的关联值来对所述第一多个未分类的图像进行分组的装置; 用于基于被分组到一起的未分类的图像的数量和未分类的图像的群组总数来得到修正的关联阈值的装置; 用于基于所述修正的关联阈值和所述未分类的关联值来对所述第一多个未分类的图像重新分组的装置; 用于基于所述重新分组来将未分类的图像的一个或多个群组与所述面部简档相关联的装置; 用于接收第二图像的装置,所述第二图像包括人面部的表示; 用于生成关联值的装置,所述关联值指示在接收的第二图像中表示的所述人面部对应于存储的面部简档的可能性; 用于评估接收的第二图像和生成的关联值来根据该评估的结果来确定所述接收的第二图像是否对应于所述存储的面部简档的装置;以及 用于响应于确定所述接收的第二图像对应于所述存储的面部简档,将所述接收的第二图像与所述存储的面部简档相关联地存储的装置。
22.根据权利要求21所述的计算机实现的系统,另外还包括: 用于提示用户确认在接收的第二图像中表示的所述人面部对应于所述面部简档的装置;以及 用于响应于所述提示,接受在接收的第二图像中表示的所述人面部对应于所述面部简档的确认的装置。
23.根据权利要求21所述的计算机实现的系统,其中在接收的第二图像中表示的所述人面部包括第一人面部,所述计算机实现的系统另外还包括: 用于得到在所述接收的第二图像中所表现的第二人面部与所述面部简档之间的潜在对应关系的装置;以及 用于基于对应于所述面部简档的第一人面部和所述关联值来忽略所述得到的潜在对应关系的装置。
24.根据权利要求21所述的计算机实现的系统,其中所述面部简档包含第一面部简档并且在接收的第二图像中表示的所述人面部包含第一人面部,所述计算机实现的系统另外还包括:用于在用户界面中呈现所述第一面部简档和第二面部简档的装置,其中所述第二面部简档包括表示第二人面部的一个或多个图像; 用于在所述用户界面中接收将所述第一面部简档与所述第二面部简档相关联的指示的装置;以及 用于根据所述第一面部简档和所述第二面部简档来生成包括一个或多个简档图像的合并相册的装置。
25.根据权利要求21所述的计算机实现的系统,其中所述确定装置确定所述关联值指示所述接收的第二图像对应于不同于所述面部简档的另一面部简档,并且包括第一元数据的所述图像信息对应于与所述两个或更多个简档图像相关联的第二元数据。
26.根据权利要求21所述的计算机实现的系统,另外还包括: 用于从外部源获取所述两个或更多个简档图像和与所述两个或更多个简档图像相关联的简档信息的装置;以及 用于基于所述两个或更多个简档图像和所述简档信息来生成所述面部简档的装置。
27.根据权利要求26所述的计算机实现的系统,其中所述外部源包括用户界面。
28.根据权利要求26所述的计算机实现的系统,其中所述外部源包括地址薄应用。
29.根据权利要求21所述的计算机实现的系统,还包括: 用于访问检测信息的装置,所述检测信息指示所述接收的第二图像表示人面部的可能性低于90% ; 用于确立所述接收的第二图像描绘肤色色彩和锐利图像细节的装置;以及 用于基于所述确立来确认所述接收的第二图像表示人面部的装置。
30.根据权利要求29所述的计算机实现的系统,另外还包括: 用于基于所述图像信息、所述检测信息或所述关联值中的一者或多者来选择所述接收的第二图像作为键图像的装置;以及 用于显示所述键图像来作为与所述面部简档相关联的图标的装置。
31.根据权利要求29所述的计算机实现的系统,其中所述图像信息包括捕获日期。
32.根据权利要求29所述的计算机实现的系统,其中所述检测信息包括所述人面部相对于所述接收的第二图像的角度。
33.一种用于组织图像的计算机实现的方法,该计算机实现的方法包括: 接收表示人面部的第一多个未分类的图像以及相关联的关联值,所述相关联的关联值指示所述人面部对应于存储的面部简档的可能性,其中所述存储的面部简档与两个或更多个简档图像相关联,每一个所述简档图像包括与相同个人对应的人面部的表示; 建立初始关联值阈值; 基于所述初始关联值阈值和所述相关联的关联值来对所述第一多个未分类的图像进行分组; 基于被分组到一起的未分类的图像的数量和未分类的图像的群组总数来得到修正的关联阈值; 基于所述修正的关联阈值和所述未分类的关联值来对所述第一多个未分类的图像重新分组; 基于所述重新分组来将所述第一多个未分类的图像的一个或多个群组与所述存储的面部简档相关联; 接收第二图像,所述第二图像包括人面部的表示; 生成关联值,所述关联值指示在接收的第二图像中表示的所述人面部对应于存储的面部简档的可能性; 评估接收的第二图像和生成的关联值来根据该评估的结果确定所述接收的第二图像是否对应于所述存储的面部简档;以及 响应于确定所述接收的第二图像对应于所述存储的面部简档,显示与所述存储的面部简档相关联的所述接收的第二图像。
34.根据权利要求33所述的计算机实现的方法,还包括: 接收数据以及执行输入操作,所述输入操作包括: 通过外部输入来获取所述两个或更多个简档图像以及与所述两个或更多个简档图像相关联的简档信息。
35.根据权利要求34所述的计算机实现的方法,还包括: 基于所述获取 的两个或更多个简档图像以及所述简档信息来生成所述存储的面部简档。
36.根据权利要求34所述的计算机实现的方法,其中所述外部输入包括地址薄应用适配器,所述地址薄应用适配器用于从地址薄应用获取所述两个或更多个简档图像以及所述简档信息。
37.根据权利要求33所述的计算机实现的方法,还包括: 基于所述确定,经由用户界面设备来提示用户确认在接收的第二图像中表示的所述人面部对应于所述存储的面部简档;以及 响应于所述提示,经由所述用户界面设备来接受在接收的第二图像中表示的所述人面部对应于所述存储的面部简档的确认。
38.根据权利要求33所述的计算机实现的方法,还包括: 基于所述接收的第二图像或所述关联值中的一者或多者来选择所述接收的第二图像作为键图像;以及 显示所述键图像来作为与所述存储的面部简档相关联的图标。
39.根据权利要求38所述的计算机实现的方法,其中所述接收的第二图像包括所述接收的第二图像的锐利度指示、捕获日期或图像分辨率中的一者或多者。
40.根据权利要求33所述的计算机实现的方法,其中在接收的第二图像中表示的所述人面部包括第一人面部,所述方法还包括: 得到所述接收的第二图像中所表示的第二人面部与所述存储的面部简档之间的潜在对应关系;以及 基于对应于所述存储的面部简档的第一人面部和所述关联值来忽略所述得到的潜在对应关系。
41.根据权利要求33所述的计算机实现的方法,其中所述存储的面部简档包括第一存储的面部简档并且在接收的第二图像中表示的所述人面部包括第一人面部,所述方法还包括: 通过用户界面设备来呈现所述第一存储的面部简档和第二存储的面部简档,其中所述第二存储的面部简档包括表示第二人面部的一个或多个图像; 通过所述用户界面设备来接收将所述第一存储的面部简档与所述第二存储的面部简档相关联的指示;以及 根据所述第一存储的面部简档和所述第二存储的面部简档来生成包括一个或多个简档图像的 合并相册。
CN201080010483.3A 2009-01-05 2010-01-04 通过关联面部来组织数字图像 CN102365645B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
US14260609P true 2009-01-05 2009-01-05
US61/142,606 2009-01-05
US12/436,069 2009-05-05
US12/436,069 US9495583B2 (en) 2009-01-05 2009-05-05 Organizing images by correlating faces
PCT/US2010/020040 WO2010078553A2 (en) 2009-01-05 2010-01-04 Organizing digital images by correlating faces

Publications (2)

Publication Number Publication Date
CN102365645A CN102365645A (zh) 2012-02-29
CN102365645B true CN102365645B (zh) 2014-08-20

Family

ID=42232602

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080010483.3A CN102365645B (zh) 2009-01-05 2010-01-04 通过关联面部来组织数字图像

Country Status (8)

Country Link
US (1) US9495583B2 (zh)
EP (1) EP2384484A2 (zh)
JP (1) JP5403838B2 (zh)
KR (1) KR101346539B1 (zh)
CN (1) CN102365645B (zh)
AU (1) AU2010203220B2 (zh)
GB (1) GB2480177B (zh)
WO (1) WO2010078553A2 (zh)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600174B2 (en) 2005-09-28 2013-12-03 Facedouble, Inc. Method and system for attaching a metatag to a digital image
US8639028B2 (en) * 2006-03-30 2014-01-28 Adobe Systems Incorporated Automatic stacking based on time proximity and visual similarity
US7831141B2 (en) 2007-03-29 2010-11-09 Sony Ericsson Mobile Communications Ab Mobile device with integrated photograph management system
US8316096B2 (en) 2008-04-29 2012-11-20 Kota Enterprises, Llc Facemail
US9514355B2 (en) * 2009-01-05 2016-12-06 Apple Inc. Organizing images by correlating faces
US9727312B1 (en) 2009-02-17 2017-08-08 Ikorongo Technology, LLC Providing subject information regarding upcoming images on a display
US10706601B2 (en) 2009-02-17 2020-07-07 Ikorongo Technology, LLC Interface for receiving subject affinity information
US9210313B1 (en) 2009-02-17 2015-12-08 Ikorongo Technology, LLC Display device content selection through viewer identification and affinity prediction
US20100216441A1 (en) * 2009-02-25 2010-08-26 Bo Larsson Method for photo tagging based on broadcast assisted face identification
US8301996B2 (en) * 2009-03-19 2012-10-30 Microsoft Corporation Annotating images with instructions
US8460215B2 (en) * 2009-06-08 2013-06-11 The Brigham And Women's Hospital, Inc. Systems and methods for predicting potentially difficult intubation of a subject
US9003290B2 (en) * 2009-12-02 2015-04-07 T-Mobile Usa, Inc. Image-derived user interface enhancements
US9465993B2 (en) * 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
WO2011154031A1 (en) * 2010-06-07 2011-12-15 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for organizing images
US8774561B2 (en) 2010-09-01 2014-07-08 Apple Inc. Consolidating information relating to duplicate images
US8630494B1 (en) 2010-09-01 2014-01-14 Ikorongo Technology, LLC Method and system for sharing image content based on collection proximity
KR101429962B1 (ko) * 2010-11-22 2014-08-14 한국전자통신연구원 기억 회상용 데이터 처리 시스템 및 그 방법
KR101029160B1 (ko) * 2011-02-07 2011-04-13 (주)올라웍스 이미지 데이터베이스에 신규 이미지 및 이에 대한 정보를 추가하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
US9251854B2 (en) 2011-02-18 2016-02-02 Google Inc. Facial detection, recognition and bookmarking in videos
US9317530B2 (en) 2011-03-29 2016-04-19 Facebook, Inc. Face recognition based on spatial and temporal proximity
US9256620B2 (en) 2011-12-20 2016-02-09 Amazon Technologies, Inc. Techniques for grouping images
KR101339900B1 (ko) * 2012-03-09 2014-01-08 한국과학기술연구원 2차원 단일 영상 기반 3차원 몽타주 생성 시스템 및 방법
US8422747B1 (en) 2012-04-16 2013-04-16 Google Inc. Finding untagged images of a social network member
US8666123B2 (en) 2012-04-26 2014-03-04 Google Inc. Creating social network groups
CN103513890B (zh) * 2012-06-28 2016-04-13 腾讯科技(深圳)有限公司 一种基于图片的交互方法、装置和服务器
US8873813B2 (en) * 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US9218813B2 (en) * 2013-03-14 2015-12-22 Intel Corporation Voice and/or facial recognition based service provision
JP5859471B2 (ja) * 2013-03-19 2016-02-10 富士フイルム株式会社 電子アルバム作成装置および電子アルバムの製造方法
US9378768B2 (en) * 2013-06-10 2016-06-28 Htc Corporation Methods and systems for media file management
US9910865B2 (en) 2013-08-05 2018-03-06 Nvidia Corporation Method for capturing the moment of the photo capture
US20150085146A1 (en) * 2013-09-23 2015-03-26 Nvidia Corporation Method and system for storing contact information in an image using a mobile device
US9811245B2 (en) * 2013-12-24 2017-11-07 Dropbox, Inc. Systems and methods for displaying an image capturing mode and a content viewing mode
KR102230267B1 (ko) * 2014-09-04 2021-03-19 삼성전자주식회사 영상 표시 장치 및 방법
CN104573642B (zh) * 2014-12-26 2018-09-04 小米科技有限责任公司 人脸识别方法及装置
CN105426485A (zh) * 2015-11-20 2016-03-23 小米科技有限责任公司 图像合并方法和装置、智能终端和服务器
CN105678266A (zh) * 2016-01-08 2016-06-15 北京小米移动软件有限公司 一种合并人脸相册的方法及装置
JP6779683B2 (ja) * 2016-07-06 2020-11-04 オリンパス株式会社 画像検索装置、画像検索方法及びプログラム
US10936856B2 (en) 2018-08-31 2021-03-02 15 Seconds of Fame, Inc. Methods and apparatus for reducing false positives in facial recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450504A (en) * 1992-05-19 1995-09-12 Calia; James Method for finding a most likely matching of a target facial image in a data base of facial images
CN1871622A (zh) * 2003-10-21 2006-11-29 日本电气株式会社 图像比较系统和图像比较方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPP400998A0 (en) 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
WO2001015086A1 (fr) 1999-08-19 2001-03-01 Sony Corporation Processeur d'images, procede de traitement d'images et support enregistre
US6940545B1 (en) 2000-02-28 2005-09-06 Eastman Kodak Company Face detecting camera and method
KR100438841B1 (ko) 2002-04-23 2004-07-05 삼성전자주식회사 이용자 검증 및 데이터 베이스 자동 갱신 방법, 및 이를이용한 얼굴 인식 시스템
US20050031173A1 (en) 2003-06-20 2005-02-10 Kyungtae Hwang Systems and methods for detecting skin, eye region, and pupils
US8948468B2 (en) 2003-06-26 2015-02-03 Fotonation Limited Modification of viewing parameters for digital images using face detection information
US7844076B2 (en) 2003-06-26 2010-11-30 Fotonation Vision Limited Digital image processing using face detection and skin tone information
US7286723B2 (en) * 2003-06-27 2007-10-23 Hewlett-Packard Development Company, L.P. System and method for organizing images
US7190829B2 (en) 2003-06-30 2007-03-13 Microsoft Corporation Speedup of face detection in digital images
US7274822B2 (en) * 2003-06-30 2007-09-25 Microsoft Corporation Face annotation for photo management
JP2006011935A (ja) * 2004-06-28 2006-01-12 Sony Corp 個人情報管理装置,個人情報ファイル作成方法,および個人情報ファイル検索方法
KR100668303B1 (ko) 2004-08-04 2007-01-12 삼성전자주식회사 피부색 및 패턴 매칭을 이용한 얼굴 검출 방법
JP2006072614A (ja) 2004-09-01 2006-03-16 Matsushita Electric Ind Co Ltd 画像ファイルの保存方法およびその関連技術
US20060222217A1 (en) 2005-03-31 2006-10-05 Fuji Photo Film Co., Ltd. Method, apparatus, and program for discriminating faces
KR100724932B1 (ko) 2005-08-02 2007-06-04 삼성전자주식회사 얼굴 검출 장치 및 방법
JP4218711B2 (ja) 2006-08-04 2009-02-04 ソニー株式会社 顔検出装置、撮像装置および顔検出方法
JP2008117271A (ja) 2006-11-07 2008-05-22 Olympus Corp デジタル画像の被写体認識装置、プログラム、および記録媒体
JP2008141740A (ja) 2006-11-07 2008-06-19 Fujifilm Corp 撮影装置および方法並びにプログラム
JP4845715B2 (ja) * 2006-12-22 2011-12-28 キヤノン株式会社 画像処理方法、画像処理装置、プログラム、及び記憶媒体
US8189927B2 (en) * 2007-03-05 2012-05-29 DigitalOptics Corporation Europe Limited Face categorization and annotation of a mobile phone contact list
US8189880B2 (en) * 2007-05-29 2012-05-29 Microsoft Corporation Interactive photo annotation based on face clustering
JP4434236B2 (ja) 2007-06-11 2010-03-17 ソニー株式会社 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム
CN102016882B (zh) * 2007-12-31 2015-05-27 应用识别公司 利用脸部签名来标识和共享数字图像的方法、系统和计算机程序
US9639740B2 (en) * 2007-12-31 2017-05-02 Applied Recognition Inc. Face detection and recognition
WO2010006367A1 (en) * 2008-07-16 2010-01-21 Imprezzeo Pty Ltd Facial image recognition and retrieval
US7916905B2 (en) 2009-02-02 2011-03-29 Kabushiki Kaisha Toshiba System and method for image facial area detection employing skin tones
JP6089577B2 (ja) * 2012-10-19 2017-03-08 富士通株式会社 画像処理装置、画像処理方法および画像処理プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5450504A (en) * 1992-05-19 1995-09-12 Calia; James Method for finding a most likely matching of a target facial image in a data base of facial images
CN1871622A (zh) * 2003-10-21 2006-11-29 日本电气株式会社 图像比较系统和图像比较方法

Also Published As

Publication number Publication date
GB201113493D0 (en) 2011-09-21
CN102365645A (zh) 2012-02-29
WO2010078553A3 (en) 2010-08-26
WO2010078553A2 (en) 2010-07-08
GB2480177A (en) 2011-11-09
US20100172550A1 (en) 2010-07-08
KR20110124223A (ko) 2011-11-16
JP2012514795A (ja) 2012-06-28
KR101346539B1 (ko) 2013-12-31
US9495583B2 (en) 2016-11-15
JP5403838B2 (ja) 2014-01-29
AU2010203220B2 (en) 2014-06-12
GB2480177B (en) 2015-07-22
AU2010203220A1 (en) 2011-08-25
EP2384484A2 (en) 2011-11-09

Similar Documents

Publication Publication Date Title
JP2018152094A (ja) 画像ベース検索
US20210049708A1 (en) Tax document imaging and processing
JP5869054B2 (ja) デジタル画像集合内に自動顔認識を組み込む方法および装置
US20180189695A1 (en) Touchless mobile applications and context-sensitive workflows
US9058375B2 (en) Systems and methods for adding descriptive metadata to digital content
US20180157900A1 (en) Method, system and computer program for identification and sharing of digital images with face signatures
CN106255968B (zh) 自然语言图像搜索
CN105320428B (zh) 用于提供图像的方法和设备
CN104715023B (zh) 基于视频内容的商品推荐方法和系统
US9916626B2 (en) Presentation of image of source of tax data through tax preparation application
CN105721853B (zh) 生成图像捕获指令的方法、系统和计算机可读存储设备
KR101329882B1 (ko) Ar 정보창 표시를 위한 사용자 장치 및 그 방법
EP2118722B1 (en) Controlling a document based on user behavioral signals detected from a 3d captured image stream
US9721183B2 (en) Intelligent determination of aesthetic preferences based on user history and properties
KR100947990B1 (ko) 차영상 엔트로피를 이용한 시선 추적 장치 및 그 방법
AU2012219277B2 (en) Facial recognition
JP5879544B2 (ja) コンテンツ出力装置、コンテンツ出力方法、プログラム、プログラム記録媒体及びコンテンツ出力集積回路
US8416997B2 (en) Method of person identification using social connections
RU2421775C2 (ru) Устройство и способ обработки информации, и компьютерная программа
CN101878487B (zh) 用户接口装置、用户接口方法、以及记录媒体
US7869658B2 (en) Representative image selection based on hierarchical clustering
US9342930B1 (en) Information aggregation for recognized locations
US8285006B2 (en) Human face recognition and user interface system for digital camera and video camera
KR102114564B1 (ko) 학습 시스템, 학습 장치, 학습 방법, 학습 프로그램, 교사 데이터 작성 장치, 교사 데이터 작성 방법, 교사 데이터 작성 프로그램, 단말 장치 및 임계치 변경 장치
JP4037869B2 (ja) 画像解析支援方法、画像解析支援プログラムおよび画像解析支援装置

Legal Events

Date Code Title Description
PB01 Publication
C06 Publication
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
GR01 Patent grant
C14 Grant of patent or utility model