CN101523412A - 基于人脸的图像聚类 - Google Patents

基于人脸的图像聚类 Download PDF

Info

Publication number
CN101523412A
CN101523412A CNA2007800381020A CN200780038102A CN101523412A CN 101523412 A CN101523412 A CN 101523412A CN A2007800381020 A CNA2007800381020 A CN A2007800381020A CN 200780038102 A CN200780038102 A CN 200780038102A CN 101523412 A CN101523412 A CN 101523412A
Authority
CN
China
Prior art keywords
cluster
human face
face region
face
seed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800381020A
Other languages
English (en)
Other versions
CN101523412B (zh
Inventor
T·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN101523412A publication Critical patent/CN101523412A/zh
Application granted granted Critical
Publication of CN101523412B publication Critical patent/CN101523412B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/771Feature selection, e.g. selecting representative features from a multi-dimensional feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/993Evaluation of the quality of the acquired pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Library & Information Science (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

描述了基于人脸的图像聚类系统和方法。一方面,在图像(20)中检测人脸区域(58)。至少一个相应的参数值(53)从每个人脸区域(58)中提取。人脸区域(58)中与满足聚类种子判定的参数值(53)关联的那些被归类为聚类种子人脸区域(38)。聚类种子人脸区域(38)被聚类为一个或更多个聚类(44,48)。为每个聚类(44,48)建立各自的人脸模型(24)。人脸模型(24)被存储。另一方面,在图像(20)中检测人脸区域(58)。至少一个相应的参数值(53)从每个人脸区域(58)提取。基于提取的参数值(53)来对人脸区域(58)分级。按分级顺序将各人脸区域(58)聚类为一个或更多个聚类(44,48)。聚类(44,48)的表示在显示器(116)上呈现。

Description

基于人脸的图像聚类
背景技术
随着个人和组织持续快速积累图像内容的大的收藏,他们将日益要求用于组织和浏览其收藏中的图像内容的系统和方法。许多系统允许用户通过图像和其它数字内容与特定事件或主题的联系来对其进行手动分类,并基于这些分类来划分数字内容。但是,手动分类系统通常耗时且难用,尤其是随着数字内容收藏规模的变大。一些系统被配置为基于颜色、形状或纹理特征来自动划分数字内容,如图像。但是,由于与基于颜色、形状或纹理的分类关联的固有不准确性,这些自动划分系统通常易于对数字内容进行错误分类。
在一些基于内容的图像检索方法中,低级的视觉特征被用来将图像分组为有意义的分类,该分类反过来被用来产生用于包含图像的数据库的索引。根据这些方法,用诸如颜色、纹理、形状和布局等低级特征来表现图像。查询图像的特征可用来检索数据库中具有类似特征的图像。总的来说,当被用来分类和索引图像的特征更精确地捕捉到图像内容的目标方面时,图像自动分类和索引的结果会改善。
最近,在检测和归类人类主题的方面(例如,脸部和眼睛)做出了努力。例如,在一种方法中,数字图像中的人脸被组织为聚类。根据该方法,一人脸图像被用来形成第一个聚类。基于对未分配的人脸图像和任何现有聚类中的每个脸部图像的比较,人脸识别器产生相似性评分。如果未分配的人脸图像的相似性评分高于阈值,该未分配的人脸图像被添加到对应于最高相似性评分的聚类中。如果未分配的人脸图像的相似性评分低于阈值,该未分配的人脸图像被用于形成一个新的聚类。对于每个未分配的人脸图像重复该处理。对于每个聚类,包含在聚类中的所有人脸图像被显示在聚类查看屏幕中。如果人脸图像不属于一个特定的聚类,用户可以将其从该聚类中删除或重新分配给另外一个聚类。如果两个聚类的人脸所属相同,用户可以合并这两个聚类。
在半自动人脸聚类方法中,人脸检测器用于从相片中自动提取人脸。人脸识别器被用来通过人脸与选定模型的相似性来排序人脸。在该过程中,当一个或多个人脸与某个人相关时,建立表示这些人脸的模型,并显示以与该模型的相似性的顺序排序的未标识的人脸。用户可以用拖放交互技术来选择一些人脸并将其分配给正确的人。模型被更新以合并新识别的人脸,且未标识的人脸根据其与新模型的相似性来排序。被排序的人脸在用户界面中呈现为候选者,该用户界面允许用户标识脸部。
使用现有的基于人脸的图像聚类方法构建的人脸模型典型地不准确地表现它们代表的人的脸部。结果,分级为与特定的人脸模型最接近的人脸通常不对应于模型所表示的人。特别地,如果一个图像被错误地包含到一个聚类中,则与该图像相似的其它图像也会被包括到该聚类中。这样,每个误报可能会扩散而产生更多的误报。需要基于人脸的图像聚类系统和方法,其能够建立更准确和更鲁棒的人脸模型。
发明内容
在本发明的一个方面中,在图像中检测人脸区域。从每个人脸区域提取至少一个相应的参数值。人脸区域中与满足聚类种子判定的参数值关联的那些被归类为聚类种子人脸区域。聚类种子人脸区域被聚类为一个或更多个聚类。为每个聚类建立各自的人脸模型。人脸模型被存储。
在本发明的另一个方面中,在图像中检测人脸区域。从每个人脸区域提取至少一个相应的参数值。基于提取的参数值来对人脸区域分级。以分级顺序将人脸区域聚类为一个或更多个聚类。在显示器上呈现聚类的表示。
本发明的其它特征和优势将从包括附图和权利要求书在内的下列描述而变得明显。
附图说明
图1是图像处理系统的实施例的框图。
图2是图像处理方法的实施例的流程图。
图3是示出在执行图2的图像处理方法期间生成的信息的示意图。
图4是示例性输入图像的图解视图,在该图像上叠加了划分人脸区域的实施例的边界。
图5是聚类方法的实施例的流程图。
图6是人脸区域特征空间的实施例的示意图,该特征空间被分为由沿接近度度量维度的距离所定义的各区域。
图7是从人脸区域提取特征的过程的实施例的图解视图。
图8是图像处理系统的实施例的框图。
图9是图像处理方法的实施例的流程图。
图10是呈现图形用户界面的实施例的显示器的图解视图,该用户界面用于用户对人脸聚类的查看和修改。
图11是呈现图形用户界面的实施例的显示器的图解视图,该用户界面用于用户对人脸聚类的查看和修改。
具体实施方式
在下面的描述中,类似的附图标记被用来表示类似的元件。此外,附图旨在以图解的方式来说明示例性实施例的主要特征。附图并不旨在描述实际实施例的每个特征或描述的元件的相对尺寸,并且不是按比率绘制的。
I.引言
这里具体描述的实施例基于在图像中检测到的人脸区域来聚类图像。这些实施例影响建立聚类的人脸模型的方法,这些方法被期望提供更准确和更鲁棒的聚类结果。在这些实施例的一些中,聚类以聚类种子人脸区域来开始,聚类种子人脸区域被选择来为建立人脸聚类提供更准确和鲁棒的基础。此外,一些实施例根据一个或更多个参数来对人脸区域分级,这些参数被期望强调可能包含人脸部的更多准确表示的人脸区域。在这些实施例中,人脸区域以从最高级别到最低级别的顺序来聚类,以获得改善的聚类结果。在一些实施例中,用户反馈被用来进一步改善聚类结果的聚类准确性。
II.第一图像处理系统及其组件的示例性实施例
A.图像处理系统的总览
图1示出了图像处理系统10的实施例,包括人脸检测处理组件12、参数提取处理组件14、聚类处理组件16以及模型处理组件18。
在操作中,图像处理系统10处理输入图像20集合以生成聚类规范22和聚类人脸模型24,在数据库26中与输入图像20关联地存储。每个输入图像20可以对应于任何类型的图像,包括图像传感器(例如数字摄像机、数字静态图像照相机或光学扫描仪)捕获的原始图像(例如视频的关键帧、静态图像或扫描的图像),或这样的原始图像经过处理(例如,子抽样、裁剪、旋转、滤光、格式重定、增强或其它修改)后的版本。每个聚类规范22对应于在关联的输入图像20中检测到的不同的相应人脸。在一些实施例中,每个聚类规范22包括对输入图像20中包含作为构成部分的人脸的相关联的那些的位置的描述(例如,统一资源定位符(URL)),以及作为构成部分的人脸在这些输入图像的每个内的位置(例如,包含人脸区域的限定框的坐标)。在一些实施例中,图像处理系统10在链接到输入图像20中关联的那些的相应的数据结构(例如表格或列表)中存储聚类规范。在一些实施例中,每个输入图像20对于在该输入图像20中检测到的每个人脸,关联相应的聚类规范22。这样,在这些实施例中,包括多个检测到的人脸的输入图像20与多个聚类规范22关联。
图2示出了由图像处理系统10的实施例实现的方法的实施例,并且图3示出了在执行该方法的说明性实施期间生成的信息。
根据该方法,人脸检测处理组件12在输入图像20中检测人脸区域(图2,块28)。每个人脸区域包含人脸部的至少一部分。这样,如图3所示,图像20被分为包含至少一个人脸的图像的集合30,和不包含任何检测到的人脸的图像的集合32。参数提取处理组件14从每个人脸区域中提取至少一个相应的参数值34(图2,块36)。聚类处理组件16将人脸区域中与满足聚类种子判定的参数值关联的那些归类为聚类种子人脸区域38(图2,块40)。与不满足聚类种子判定的参数值关联的人脸区域被归类为非聚类种子人脸区域42。聚类处理组件16还将聚类种子人脸区域聚类为一个或更多个聚类44(图2,块46)。在一些实施例中,聚类过程涉及将聚类种子人脸区域划分为一组初始聚类48,以及将非聚类种子人脸区域42中的那些分配给各初始聚类48以生成聚类44的最终集合。模型处理组件18为每个聚类44建立各自的人脸模型24(图2,块50)。模型处理组件18在数据库26中存储人脸模型24(图2,块52)。在一些实施例中,模型处理组件18还在数据库24中与相应的输入图像20关联地存储聚类规范22。
在图2中示出的自动聚类过程的最后,各图像20被划分到“无人脸”类别、“其它人脸”类别、以及一组图像聚类,该组图像聚类每个包含的图像具有对应于一个特定人的相应脸部的区域。包含多于一个人脸的图像可以在多于一个图像聚类和类别中出现。
通常,图像处理系统10可以由一个或多个分离的处理组件(或模块)实现,不限于任何特定的硬件、固件或软件配置。在示出的实施例中,处理组件12-18可以在任何计算和数据处理环境中实现,包括在数字电子电路(例如,特定应用集成电路例如数字信号处理器(DSP))或在计算机硬件、固件、设备驱动器或软件中。在本示例性实施例中,模型处理组件18通过人脸识别引擎实现。在一些实施例中,处理组件12-18中多个的功能性被合并到单个处理组件中。在其它实施例中,一个或更多个处理组件12-18中每个各自的功能性由相应的一组多个处理组件执行。
在一些实现中,用于实现该方法的被图像处理系统10执行的计算机处理指令和它生成的数据在一个或更多个机器可读媒介中存储。适于确实地包含这些指令和数据的存储设备包括非易失性存储器的所有形式,包括,例如,半导体存储设备例如EPROM、EEPROM和闪存存储设备,磁盘例如内部硬盘和可移动硬盘、磁光盘、DVD-ROM/RAM和CD-ROM/RAM。
B.人脸检测处理组件的示例性实施例
如上所释,人脸检测处理组件12在输入图像20中检测人脸。通常,人脸检测处理单元12可以使用任何类型的人脸检测过程,其确定在输入图像20中每个人脸的存在和位置。示例性人脸检测方法包括但不限于基于特征的人脸检测方法、模板匹配人脸检测方法、基于神经网络的人脸检测方法以及基于图像的人脸检测方法,这些方法通过被标记的人脸样本的集合来训练机器系统。示例性的基于特征的人脸检测方法在Viola and Jones,“Robust Real-Time Object Detection,”SecondInternational Workshop of Statistical and Computation theoriesof Vision-Modeling,Learning,Computing,and Sampling,Vancouver,Canada(July 13,2001)中描述,其通过引用结合于此。示例性的基于神经网络的人脸检测方法在Rowley et al.,“NeuralNetwork-Based Face Detection,”IEEE Transactions on PatternAnalysis and Machine Intelligence,Vol.20,No.1(January 1998)中描述,其通过引用结合于此。
在典型的人脸检测过程中,人脸检测处理组件12初始地确定每个输入图像20中每个人脸的存在和大致位置。在检测到人脸的大致位置后,脸部检测处理组件12对准(或配准)检测到的人脸从而它可以被识别。在该过程中,在检测的人脸中的一个或更多个特征点(例如,眼睛、鼻尖和嘴或嘴唇)被提取。通常,任意类型的特征提取过程可以被使用,包括但不限于基于边缘、线和曲线的特征提取方法、基于被设计为检测特定特征点(例如眼睛和嘴)的模板的提取方法、以及结构匹配方法。对于每个检测到的人脸,人脸检测处理组件12关于环绕检测到的人脸的一些或所有部分的相应的脸部限定框对准提取的特征。在一些实现中,脸部限定框对应于一个矩形,其包括检测到的人脸的眼睛、鼻子、嘴但不包括整个前额或下巴或头的顶部。
脸部检测处理组件12输出一个或更多个人脸检测参数值34。人脸检测参数值34的示例性类型包括人脸的数量和脸部限定框的位置(例如坐标)。脸部检测处理组件12将人脸检测参数值34传递给参数提取处理组件14、聚类处理组件16和模型处理组件18。
C.参数提取处理组件的示例性实施例
在示出的实施例中,参数提取处理组件14为每个脸部区域确定一个或更多下列参数53的相应值:由人脸检测处理组件12报告的脸部限定框的尺寸(例如,垂直和水平尺寸或面积);脸部区域的清晰度的度量;人脸区域的曝光的度量;人脸区域的对比度的度量;人脸区域的饱和度的度量;以及人脸区域的亮度的度量。参数提取处理组件14将提取的参数值53传递给聚类处理组件16。
1.计算尺寸参数值
参数提取处理组件14从人脸检测处理组件12在人脸检测参数值34中报告的脸部限定框的坐标,确定检测到的人脸区域的线性和面积尺寸。
图4示出了示例性输入图像54,在其上叠加了划分人脸区域58的实施例的边界56,该人脸区域58对应于人60的脸部的区域。在该例子中,人脸区域58具有水平尺寸wface和垂直尺寸hface。人脸区域58的面积尺寸Aface由Aface=wface×hface给出。
2.计算清晰度参数值
参数提取处理组件14可以以多种不同方式确定清晰度度量。在一示例性实施例中,清晰度因子可以从对局部清晰度的估算导出,该局部清晰度对应于在检测到的人脸区域中一维亮度梯度的高通和低通能量之间的平均比率。根据本实施例,在每个脸部区域中为每个水平像素行和垂直像素列计算亮度梯度。对于其中梯度超过梯度阈值的每个水平和垂直像素方向,参数提取处理组件14从梯度的高通能量和低通能量的比率计算相应的局部清晰度度量。通过平均人脸区域中的所有行和列的清晰度值,为每个人脸区域计算清晰度值。
3.计算曝光参数值
参数提取处理组件14可以以多种不同方式来为每个人脸区域确定各自的曝光度量。在一个实施例中,参数提取处理组件14基于人脸区域内过度曝光和欠曝光像素的数量的计数来确定每个人脸区域的曝光度量。在该过程中,如果(i)在以像素为中心的窗口内超过一半像素的亮度值超过249,或者(ii)在该窗口内亮度梯度的能量和亮度方差的比率超过900并且在该窗口内的平均亮度超过239,参数提取处理组件14将人脸区域内的像素标记为过度曝光。如果(i)在该窗口内超过一半像素的亮度值低于6,或者(ii)在该窗口内亮度梯度的能量和亮度方差的比率超过900并且在该窗口内的平均亮度低于30,参数提取处理组件14将人脸区域内的像素标记为欠曝光。参数提取处理组件14通过从1减去区域中过度曝光像素的平均数量来为每个人脸区域计算各自的过度曝光度量。类似地,参数提取处理组件14通过从1减去区域中欠曝光像素的平均数量来为每个区域计算各自的欠曝光度量。结果生成的过度曝光度量和欠曝光度量相乘在一起,来为每个人脸区域产生各自的曝光度量。
4.计算对比度参数值
参数提取处理组件14可以使用多种不同方法中的任一种来为每个人脸区域计算各自的对比度度量。在一些实施例中,参数提取处理组件14根据美国专利号5642433中描述的图像对比度确定方法来计算对比度度量。在一些实施例中,局部对比度度量Ωcontrast由等式(1)给出:
Ωcontrast=1           如果Lσ>100
           1+Lσ/100    如果Lσ≤100      (1)
其中,Lσ是给定区域的相应的亮度方差。
5.计算亮度参数值
参数提取处理组件14可以使用多种不同方法中的任一种来为每个人脸区域计算各自的亮度度量。在一些实施例中,亮度度量对应于人脸区域的平均亮度。
D.聚类处理组件的示例性实施例
聚类处理组件16将人脸区域中与满足聚类种子判定的参数值53关联的那些归类为聚类种子人脸区域38(图3,块40;见图1和3)。与不满足聚类种子判定的参数值关联的人脸区域被归类为非聚类种子人脸区域42。
聚类种子判定定义了至少一个关于由参数提取处理组件14从检测到的人脸区域中提取的参数值53的条件。
在一些实施例中,聚类种子判定对应于关于每个聚类种子人脸区域的最小尺寸的阈值。在一个示例性实施例中,最小尺寸阈值关于包含该人脸区域的对应的输入图像20规定了每个人脸区域的最小尺寸。在本实施例中,聚类种子判定Pseed由等式(2)给出:
P seed = { Ω face Ω image ≥ τ seed } - - - ( 2 )
其中Ωface是人脸区域的尺寸,Ωimage是包含人脸区域的输入图像的尺寸,且τseed是最小尺寸阈值。在一些实施例中,Ωface和Ωimage分别对应于人脸区域和输入图像的线性尺寸。在另外的实施例中,Ωface和Ωimage分别对应于人脸区域和输入图像的面积尺寸。
在一些实施例中,聚类种子判定指定了多个关于聚类种子人脸区域的参数值53的条件。例如,在一些实施例中,聚类种子判定指定关于两个或更多个参数的值的条件,所述两个或更多个参数从以下选择:人脸区域的尺寸;人脸区域的清晰度;人脸区域的曝光等级;人脸区域的对比度等级;人脸区域的饱和度等级;以及人脸区域的亮度等级。在这些实施例的一些中,聚类处理组件16将不同的相应阈值应用到每个选择的参数,并且具有满足每个阈值的参数值的人脸区域被归类为聚类种子人脸区域,而具有不满足阈值中任意一个的参数值的人脸区域被归类为非聚类种子人脸区域。在这些实施例的其它一些中,聚类处理组件16从对于选择的参数的相关联的值为每个人脸区域计算各自的质量评分,且具有满足质量阈值的质量评分的人脸区域被归类为聚类种子人脸区域,而具有不满足质量阈值的质量评分的人脸区域被归类为非聚类种子人脸区域。在这些实施例的一些中,质量评分对应于选择的参数的值的加权平均,其中权重和质量阈值是根据经验确定的。在其它实施例中,聚类处理组件16从清晰度度量、曝光度量、对比度度量和饱和度度量计算相应的质量评分。在该过程中,聚类处理组件16通过为每个人脸区域计算这些度量的乘积,并将乘积结果按比率改变到指定的动态范围内(例如,0到255),确定相应的质量评分。结果生成的按比率改变的值对应于对应的人脸区域的相应的图像质量评分。
聚类处理组件16将聚类种子人脸区域36聚类为一个或更多个聚类44(图2,块46;见图3)。通常,聚类处理组件16可以以多种不同的方式来对聚类种子人脸区域聚类,包括但不限于k最近邻(k-NN)聚类、凝聚型层次聚类、k-均值聚类和自适应样本集构建聚类。
图5示出了由聚类处理组件16执行以对聚类种子人脸区域36聚类的自适应样本集构建聚类方法的实施例。该方法对多个阈值和聚类的迭代改进的使用被期望来克服与误报传播关联的问题,并由此获得良好的结果。
根据该方法,聚类处理组件16用聚类种子人脸区域中的一个来开始聚类(图5,块70)。在一些实施例中,聚类处理组件16基于为至少一个参数提取的值来对聚类种子人脸区域分级,并选择最高等级的聚类种子人脸区域来开始该聚类。在这些实施例的一些中,聚类种子人脸区域以从最大尺寸比率(即人脸区域尺寸与对应的输入图像尺寸的比率)到最低尺寸比率的顺序来分级。在这些实施例的另一些中,聚类种子人脸区域以从最高质量评分到最低质量评分的顺序来分级。在一些实施例中,聚类处理组件16随机选择开始的聚类种子区域。
聚类处理组件16确定每个开始的聚类和下一个聚类种子人脸区域之间的相应的接近度度量(σNEARNESS))(图5,块72)。通常,接近度度量可以对应于比较每个开始的聚类和下一个聚类种子人脸区域之间的相对接近性或类似性的任何类型的度量。在一些实施例中,模型处理组件18为每个聚类建立各自的从脸部特征导出的人脸模型,脸部特征从作为构成部分的人脸区域提取(见下面的§II.E)。在这些实施例中,聚类处理组件16将信息74(见图1)传递到模型处理组件18,其中该信息74包括聚类和下一聚类种子人脸区域。模型处理器组件建立代表该聚类的人脸模型、从下一聚类种子人脸区域中提取脸部特征、并基于人脸模型和提取的脸部特征来计算接近度度量76(见图1)。模型处理组件18将接近度度量76传递到聚类处理组件16。在一些实现中,接近度度量对应于代表该聚类的特征向量和代表下一个聚类种子人脸区域的特征向量之间的相似性评分。在其它实现中,接近度度量从对这些特征向量之间的距离的度量(例如向量范数,如L2范数)导出。
图6示出了被分为区域80、82、84、86的示例性脸部区域特征空间78,这些区域由划分沿着径向维度的不同距离的边界所定义,径向维度对应于接近度度量σNEARNESS并在零接近度度量值处开始。
响应于确定相应的接近度度量满足第一接近度判定,聚类处理组件16将下一个聚类种子人脸区域分配给开始的聚类中最接近的一个(图5,块78)。在一些实施中,第一接近度判定对应于最小接近度阈值(τ1,见图6)。这样,在这些实现中,如果下一个聚类种子人脸区域和最接近的存在的聚类之间的接近度度量满足最小接近度阈值,聚类处理组件16将该下一聚类种子人脸区域分配给最接近的存在的聚类。
响应于确定相应的接近度度量满足不同于第一接近度判定的第二接近度判定,聚类处理组件16用该下一个聚类种子人脸区域来开始新的聚类(图5,块80)。在一些实现中,第二接近度判定对应于最大接近度阈值(τ2,见图6)。这样,在这些实现中,如果下一个聚类种子人脸区域和最接近的存在的聚类之间的接近度度量低于第二接近度阈值(τ2,见图6),聚类处理组件16用该下一个聚类种子人脸区域来开始新的聚类。
聚类处理组件16对所有相继的聚类种子人脸区域重复块72、78和80的过程(图5,块82)。在一些实施例中,相继的聚类种子人脸区域以从最高级别到最低级别的级别顺序来处理。
在所有的聚类种子人脸区域已经被根据图5的块70-82处理之后,如果存在任何没有被分配的聚类种子人脸区域并且聚类分布不同于前一迭代(图5,块83),每个聚类的人脸模型被更新(图5,块85)。在该过程中,聚类处理组件16选择聚类中的一个或更多个人脸来更新人脸模型。例如,在一些实施例中,聚类处理组件使用一个或更多个下列类型的人脸区域来更新每个人脸模型:(i)与已有的人脸模型最不相同的人脸区域(例如,具有最低的人脸识别评分,或者对应于面向侧面像最多或旋转最多的人脸的人脸区域);(ii)显示的面角与用来建立已有人脸模型的人脸区域的面角不同的人脸区域;(iii)具有最高质量评分的人脸区域;以及(iv)具有最高接近度评分的人脸区域。聚类处理组件16使用选择的人脸区域的特征来更新人脸模型(图5,块85)。接着,聚类处理组件16将所有未分配的人脸区域分级(图5,块85),并使用更新的人脸模型来对分级的未分配的人脸区域重复块72-85的过程。
块72-85的迭代在没有更多的未分配聚类种子人脸区域或如果当前聚类分布与前一迭代的聚类分布相同时停止(图5,块83)。于是,如果还有没分配的聚类种子人脸区域,聚类处理组件16将与满足不同于第一和第二接近度判定的第三接近度判定的接近度度量关联的未分配的聚类种子人脸区域分配给最接近的开始的聚类(图5,块84)。在一些实现中,第三接近度判定对应于在接近度度量轴上位于第一和第二接近度阈值τ1,τ2之间的最小接近度阈值(T3,见图6)。这样,在这些实施中,如果未分配的聚类种子人脸区域和最接近的存在的聚类之间的接近度度量等于或高于第三接近度阈值(τ3,见图6),聚类处理组件16将未分配的聚类种子人脸区域分配给最接近的开始的聚类。第一、第二和第三接近度阈值的值典型地根据经验确定。
聚类处理组件16然后对任何剩余的聚类种子人脸区域重复块70-86的过程(图5,块86)。在一些实施例中,剩余的聚类种子人脸区域被分级(例如,以尺寸比率的顺序或以质量评分的顺序),并以从最高分级到最低分级的分级顺序来聚类。
在所有聚类种子人脸区域已经被分配到各自的聚类之后(图5,块86),基于非聚类种子人脸区域和代表聚类的相应人脸模型之间的接近度的度量,聚类处理组件16将各非聚类种子人脸区域42分配给相应的聚类(图5,块88)。在一些实施例中,如果对应的接近度度量满足第三接近度判定,聚类处理组件16将各非聚类种子人脸区域42分配给最接近的聚类;否则聚类处理组件16将非聚类种子人脸区域分配给单独的分类,其可以被标记为,例如,“其它人脸”。
在一些实施例中,聚类处理组件16自动将只包含少量相片的小聚类(例如,包含少于N张相片的聚类,其中N可以是2或3)合并到较大的聚类。在一个示例性实施例中,小聚类中的所有人脸与较大聚类的每个人脸模型匹配,并且当人脸与至少一个人脸模型成功匹配时,它被分配给匹配最好的聚类;否则,不匹配的小聚类被分配到“其它人脸”分类。在另一实施例中,对于一个小聚类,如果它中的一个或更多个人脸与一个较大的聚类成功匹配(例如,该小聚类和该最接近的大聚类之间的接近度度量满足第三接近度判定),将该小聚类和该较大的聚类合并;否则,该小聚类被合并到“其它人脸”类别。
在一些实施例中,聚类处理组件16在执行一个或更多个图5的块所表示的过程中加入知识和规则。例如,在一些实施例中,如果从一张相片中检测到两个或更多个人脸,这些人脸被分配给不同的聚类。在这些实施例中,聚类处理组件16防止聚类包含来自每个图像多于一个的作为构成部分的人脸区域。聚类处理组件16的该特征降低了计算开销(例如,如果人脸区域X1和X2来自同一相片,且X1被分配给聚类Z1,那么没有必要比较人脸区域X2和聚类Z1),并降低了由于误归类引起的错误。
E.模型处理组件的示例性实施例
模型处理组件18为每个聚类44建立各自的人脸模型24(图2,块50)。通常,任何类型的脸部特征提取过程可以被用来从检测到的人脸区域提取特征,检测到的人脸区域在人脸检测处理组件12输出的脸部参数值42中报告。示例性脸部特征提取过程包括但不限于:基于边缘、线和曲线的特征提取方法;基于设计来检测特定的特征点(例如,眼睛和嘴)的模板的提取方法;以及结构匹配方法。在一些实施例中,主成分分析(PCA)被用来将特征空间分解为由前几个特征向量张成的低维度的子空间,以及与该特征向量空间正交的子空间。
图7示出了由模型处理组件18的实施例实现的过程的实施例,该过程从检测到的人脸区域90提取特征。根据该过程,脸部特征值(f0,f1,...,fN)根据一组脸部特征定义92从人脸区域90中提取。每个脸部特征定义对应于描述如何计算或度量相应脸部特征值(f0,f1,...,fN)的规则。每个特征值反映了相应脸部特征对在脸部特征集合92张成的特征空间中的脸部区域90的表示的贡献。为脸部区域90计算的脸部特征值的集合构成脸部曲线向量94。
模型处理组件18在数据库26中存储人脸模型24(图2,块52)。在一些实施例中,模型处理组件18还在数据库24中与相应输入图像关联的存储聚类规范22。
III.第二图像处理系统及其组件的示例性实施例
图8示出了图像处理系统100的实施例,对应于图1中示出的图像处理系统10,除了图像处理系统100还包括用户接口处理组件102,通过该组件用户与图像处理系统10进行交互。在操作中,用户接口处理组件102在显示器上呈现聚类22的表示104、106。显示器26可以是,例如,平板显示器,例如LCD(液晶显示器)、等离子显示器、EL显示器(电激发光显示器)和FED(场发射显示器)。在一些实现中,用户接口处理组件102允许用户在显示器上交互地浏览自动生成的人脸聚类104,106。用户接口处理组件102还允许用户指定对人脸聚类规范22的编辑。对给定人脸聚类的任何指定的编辑被用户接口处理组件102解释。用户接口处理组件102将解释的用户命令指令传送到聚类处理组件16。聚类处理组件16根据从用户接口处理组件102接收的编辑为给定的人脸聚类生成修改的规范,并且模型处理组件基于修改的聚类规范22生成修正的人脸模型24。用户接口处理组件102将修正的人脸聚类呈现给用户,用户可以浏览修正的人脸聚类,指定对修正的人脸聚类的编辑,或命令图像处理系统100呈现某些或全部其它人脸聚类。
图9示出了由图像处理系统100的实施例实现的方法的实施例。
根据该方法,人脸检测处理组件12在图像20中检测人脸区域(图9,块108)。人脸检测处理组件12可以根据上述任一种人脸检测方法来检测人脸。典型地,生成各自的限定框以表示每个检测到的人脸的位置和尺寸。
参数提取处理组件14从每个人脸区域提取至少一个相应的参数值34(图9,块110)。参数提取处理组件14可以根据上述任一种参数提取方法来从人脸区域中提取参数值。
聚类处理组件16基于提取的参数值来对人脸区域分级(图9,块112)。在一些实施例中,聚类处理组件16用上述任一种方法来为每个检测到的人脸计算各自的质量评分。质量评分可以基于人脸特征例如人脸的尺寸、亮度和清晰度来确定。人脸的尺寸可以是绝对尺寸或相对于相应输入图像的尺寸的尺寸,其可以表示为脸部限定框的尺寸和输入图像的尺寸之间的比率。例如,相对尺寸可以被定义为限定框的较长边的长度与相应输入图像的较长边的长度的比率。在一些实施例中,当满足下列条件时质量评分相对较高:脸部区域的尺寸相对于输入图像的尺寸大;脸部区域没有被过度曝光(太亮)或欠曝光(太暗);脸部区域清晰(不模糊)。在这些实施例中,脸部区域根据计算的质量评分以从最高质量评分到最低质量评分的降序来分级。
在脸部区域被分级后(图9,块112),聚类处理组件16以分级顺序将脸部区域聚类为一个或更多个聚类(图9,块114)。
在聚类过程期间,聚类处理组件16与模型处理组件18协同工作。在一些实施例中,模型处理组件18由人脸识别引擎实现。在这些实施例中,人脸识别引擎用给定聚类中的一个或更多个人脸来训练人脸模型。人脸识别引擎从查询人脸区域(例如,下一个被聚类的人脸区域)提取脸部特征。人脸识别引擎匹配提取的特征与聚类的人脸模型,并生成0和1之间的接近度评分,该评分指示查询人脸区域和人脸模型之间的近似程度。典型地,接近度评分越高,查询人脸区域与人脸聚类越有可能表示同一个人的图像。人脸识别引擎将经验确定的阈值(T)应用到接近度评分。如果接近度评分高于T,则人脸识别引擎报告查询人脸区域与人脸聚类匹配;否则,人脸识别引擎报告查询人脸区域与人脸聚类不匹配。
通常,聚类处理组件16可以以多种不同的方式来对人脸区域聚类,包括但不限于最近邻(k-NN)聚类、凝聚型层次聚类、k-均值聚类和自适应样本集构建聚类。在一些实施例中,聚类处理组件16如下来聚类人脸区域:
(1)分级列表中的第一个人脸,X1,被选择作为第一个聚类的代表。使用X1的脸部特征来为该聚类训练人脸模型M1;
(2)选择分级列表中的下一个人脸X,并与所有现有的人脸模型匹配。假设Sj(X,Mj)是X与第j个人脸模型匹配的评分,且i=arg max(Sj(X,Mj))。如果Si>T,则将X分配给第i个聚类;否则,用X作为代表形成新的聚类,并且使用X的脸部特征来训练用于该聚类的人脸模型。
(3)继续步骤(2),直到分级列表中的所有人脸被处理。
参考图10,在人脸区域已被聚类之后(图9,块114),用户接口处理组件102在显示器116上呈现各聚类的表示(图9,块118)。用户接口处理组件102允许用户指定对人脸聚类的一个或更多个修改。响应于用户输入,聚类处理组件16和模型处理组件18协同修改一个或更多个聚类(图9,块119)。用户可以通过对输入设备(例如,计算机鼠标)的操纵来向用户接口处理组件102指定命令,输入设备向驱动显示器116的显示控制器输出显示控制信号。显示控制信号典型地为运动度量的形式,该度量典型地对应于位移参数值、速度参数值和加速度参数值中的一个或更多个。显示控制器处理显示控制信号以控制,例如,指示符121在显示器116上的移动。
在一些实施例中,用户接口处理组件102在多层次图形用户接口中呈现聚类表示。如图10所示,在图形用户接口的第一层次120中,显示包含每个聚类的代表人脸的各输入图像20的缩略图122。在一些实施例中,聚类根据聚类中包含的输入图像的数量来分级,并且缩略图122以分级顺序示出。因此,最大的聚类在图10中示出的图形用户接口层次120的顶行中呈现。
在操作中,响应于用户在图形用户接口层次120中选择缩略图122中的一个,用户接口处理组件102呈现对应于选中的缩略图所表示的人脸聚类中的所有图像的缩略图。如图11所示,在图形用户接口的第二层次124中,选择的聚类中的输入图像根据相关联的人脸识别相似性评分(即,通过匹配输入图像的人脸区域和聚类的人脸模型而得到的评分)来分级,并且图片缩略图根据相似性评分,从最高相似性评分到最低相似性评分来示出。因此,在图11中,缩略图的顶行包含被确定为与聚类的人脸模型最相似的人脸区域。
这样,图形用户接口允许用户查看初始的聚类结果。在该查看的过程中,用户会发现一些聚类是有趣的而其它的不是。例如,在图形用户接口的第一层次120中呈现的前几个聚类(即最大聚类)可包含家庭成员的图片,并且对用户可能是最重要的,而一些小聚类(例如,仅包含一个或少数图片的聚类)可能包含用户不感兴趣的图片。可选地,用户可以选择不重要的小聚类并将它们合并为单独的分类,其可以被标记为“其它”。在一些实施例中,在“其它”分类中的聚类在随后的迭代中不在图形用户接口中示出。
图形用户接口允许用户选择一个特定的聚类和修改该聚类内作为构成部分的图像。例如,通过对聚类中成员的查看,用户可以发现聚类中的一些图片是误报或者一些其它聚类应该与选择的聚类合并,因为它们表示同一个人。图形用户接口允许用户找出选择的聚类中的误报,以及将选择的聚类与其它聚类合并。
对选择的聚类的任何修改作为对图像处理系统100的反馈。基于该反馈,聚类处理组件16修改被修改的聚类的规范,且模型处理组件重建(或重新训练)对应于该修改的聚类的人脸模型。在图10示出的说明性例子中,聚类#7和#8表示与聚类#1表示的人相同的人。因此,响应于用户选择聚类#7和#8的缩略图,图像处理系统100将选择的聚类与聚类#1合并,并且模型处理组件18通过加上来自聚类#7和#8的人脸模型的脸部特征来重新训练聚类#1的模型。在该例子中,与聚类#1的原始人脸模型相比,聚类#7提供了关于当从较低角度看时这个人的脸的更多信息,并且聚类#8提供了关于该人脸侧面像的更多信息。该附加的信息帮助建立该人脸的更全面的模型。
在同时,被用户找出并校正的误报的脸部特征(用户不需要选取所有的误报,而只是一个子集)在重新训练的过程中被不强调。在一些实施例中,当一个聚类中多于指定数量(例如1或2)的误报实际上包含同一个人的脸时,聚类处理组件16可以为这个人创建新的聚类,模型处理组件18可以通过使用一个或更多个这些误报人脸来训练新的人脸模型,来为这个聚类创建新的人脸模型。
通常,图形用户接口允许用户(1)如果聚类包含多个人中每个的多个图像,将它分为两个或更多个聚类;(2)如果两个或更多个聚类是同一个人的,则将它们合并;(3)将来自一些聚类的一个或更多个图像加入另一个聚类;以及(4)从聚类中去除一个或更多个图像。用户通过使用输入设备例如计算机鼠标点击和/拖动聚类的缩略图来做出上述选择。响应于这些聚类修改中的每一个,聚类处理组件16更新聚类规范22,且模型处理组件18训练新的人脸模型或通过强调或不强调某些脸部特征来重新训练现有的人脸模型。
在对用户选择的聚类的人脸模型的首轮重新训练之后,根据上述任一聚类方法,基于调整的人脸模型和人脸识别引擎,图像被重新分配给各聚类。新的聚类结果在如图10和11中示出的显示器116上呈现。于是,用户可以查看该结果并提供更多反馈以改善聚类准确性。这些迭代可以继续,直到用户满意结果。
大部分计算,包括人脸检测、脸部特征提取和初始匹配和聚类,被图像处理系统100自动执行。用户可以在执行这些处理步骤期间不管系统的工作。在涉及用户的交互部分期间,聚类方法所引起的计算开销很有限(例如,对人脸模型的重新训练及将图片重新分配给聚类)。因此,聚类方法中的用户-机器交互部分相对有效且需要相对较少的计算资源来实现。
IV.结论
这里详细描述的实施例基于在图像中检测到的人脸区域来聚类图像。这些实施例影响建立聚类的人脸模型的方法,该方法被期望提供更准确和更鲁棒的聚类结果。在这些实施例中的一些中,聚类用聚类种子人脸区域来开始,这些人脸区域被选择来为建立人脸聚类提供更准确和鲁棒的基础。此外,一些实施例根据一个或更多个参数来对人脸区域分级,所述参数被期望强调可能包含人脸的更多准确表示的人脸区域。在这些实施例中,人脸区域以从最高级别到最低级别的顺序来聚类,以获得改善的聚类结果。在一些实施例中,用户反馈被用来进一步改善聚类结果的聚类准确性。
其它实施例在权利要求的范围内。

Claims (10)

1.一种方法,包括:
在图像(20)中检测人脸区域(58);
从每个人脸区域(58)提取至少一个相应的参数值(53);
将人脸区域(58)中与满足聚类种子判定的参数值(53)关联的那些归类为聚类种子人脸区域(38);
将各聚类种子人脸区域(38)聚类为一个或更多个聚类(44,48);
为每个聚类(44,48)建立各自的人脸模型(24);以及
存储人脸模型(24)。
2.如权利要求1所述的方法,其中,所述提取包括:
为每个人脸区域(58)确定一个或更多个下列参数(53)的各自的值:人脸区域(58)的清晰度度量;人脸区域(58)的对比度度量;人脸区域(58)的饱和度度量;以及人脸区域(58)的曝光度量;以及
确定表明人脸区域(58)的尺寸的相应尺寸参数值。
3.如权利要求1所述的方法,其中:
所述归类包括将与下列至少之一关联的每个人脸区域(58)归类为非聚类种子人脸区域(42):不满足尺寸判定的一个或更多个尺寸参数值(53);不满足亮度判定的亮度参数值(53);以及不满足清晰度判定的清晰度参数值(53);并且
所述聚类包括基于非聚类种子人脸区域(42)和相应的人脸模型(24)之间的接近度度量来将非聚类种子人脸区域(42)分配给各个聚类(48)。
4.如权利要求1所述的方法,其中,所述聚类包括:
(a)用聚类种子人脸区域(38)中的一个开始一聚类(48);
(b)确定每个开始的聚类(48)和聚类种子人脸区域(38)中的下一个之间的相应的接近度度量;
(c)响应于确定相应的接近度度量满足第一接近度判定,将该下一个聚类种子人脸区域(38)分配给最接近的开始的聚类(48);
(d)响应于确定相应的接近度度量满足不同于第一接近度判定的第二接近度判定,用该下一个聚类种子人脸区域(38)开始新的聚类(48);
(e)对所有相继的聚类种子人脸区域(38)重复(b)-(d)。
5.如权利要求4所述的方法,其中,在(a)之前,聚类包括基于为至少一个参数(53)提取的值来对聚类种子人脸区域(38)分级,并且(b)包括以从最高分级到最低分级的分级顺序来选择下一个聚类种子人脸区域(38)。
6.如权利要求4所述的方法,其中(b)包括基于从聚类的作为构成部分的聚类种子人脸区域(38)提取的特征,为每个开始的聚类(48)建立各自的人脸模型(24),以及确定从下一个聚类种子人脸区域(38)提取的特征和每个人脸模型(24)之间的相应的接近度度量。
7.如权利要求4所述的方法,其中:
在(e)之后,聚类包括(f)将与满足不同于第一和第二接近度判定的第三接近度判定的接近度度量关联的未分配的聚类种子人脸区域(38),分配给最接近的开始的聚类(48);并且
在(f)之后,对未分配给任一开始的聚类(48)的各聚类种子人脸区域(38)重复(a)-(e)。
8.如权利要求1所述的方法,其中,所述聚类包括自动合并包含不满足计数阈值的相应数量的作为构成部分的人脸区域(58)的聚类(44)。
9.一种设备,包括:
人脸检测处理组件(12),可操作以在图像(20)中检测人脸区域(58);
参数提取处理组件(14),可操作以从每个人脸区域(58)提取至少一个相应的参数值(53);
聚类处理组件(16),可操作以将人脸区域(58)中与满足聚类种子判定的参数值(53)关联的那些归类为聚类种子人脸区域(38),该聚类处理组件(16)还可操作以将各聚类种子人脸区域(38)聚类为一个或更多个聚类(44,48);以及
模型处理组件(18),可操作以为每个聚类(44,48)建立各自的人脸模型(24),并存储人脸模型(24)。
10.一种方法,包括:
在图像(20)中检测人脸区域(58);
从每个人脸区域(58)提取至少一个相应的参数值(53);
基于提取的参数值(53)对各人脸区域(58)分级;
按分级顺序将各人脸区域(58)聚类为一个或更多个聚类(44,48);以及
在显示器(116)上呈现聚类(44,48)的表示。
CN2007800381020A 2006-10-11 2007-10-11 基于人脸的图像聚类 Expired - Fee Related CN101523412B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/545,898 2006-10-11
US11/545,898 US8031914B2 (en) 2006-10-11 2006-10-11 Face-based image clustering
PCT/US2007/021768 WO2008045521A2 (en) 2006-10-11 2007-10-11 Face-based image clustering

Publications (2)

Publication Number Publication Date
CN101523412A true CN101523412A (zh) 2009-09-02
CN101523412B CN101523412B (zh) 2013-01-02

Family

ID=39212351

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800381020A Expired - Fee Related CN101523412B (zh) 2006-10-11 2007-10-11 基于人脸的图像聚类

Country Status (5)

Country Link
US (1) US8031914B2 (zh)
EP (1) EP2087456B1 (zh)
JP (1) JP2010507139A (zh)
CN (1) CN101523412B (zh)
WO (1) WO2008045521A2 (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8064656B2 (en) 2007-04-23 2011-11-22 Sony Corporation Image processing apparatus, imaging apparatus, image processing method, and computer program
CN102439630A (zh) * 2010-02-10 2012-05-02 松下电器产业株式会社 图像评价装置、图像评价方法、程序、集成电路
CN102511054A (zh) * 2010-07-21 2012-06-20 松下电器产业株式会社 图像管理装置、图像管理方法、程序、记录介质及图像管理用集成电路
CN102782704A (zh) * 2010-03-01 2012-11-14 微软公司 基于脸部图像分析的排名
CN102792332A (zh) * 2010-01-22 2012-11-21 松下电器产业株式会社 图像管理装置、图像管理方法、程序、记录媒体及集成电路
WO2015161757A1 (zh) * 2014-04-23 2015-10-29 北京锤子数码科技有限公司 图片缩略图的获取方法及装置
CN105144139A (zh) * 2013-03-28 2015-12-09 惠普发展公司,有限责任合伙企业 生成特征集
CN105138962A (zh) * 2015-07-28 2015-12-09 小米科技有限责任公司 图像显示方法及装置
CN105654039A (zh) * 2015-12-24 2016-06-08 小米科技有限责任公司 图像处理的方法和装置
WO2016180224A1 (zh) * 2015-05-11 2016-11-17 北京锤子数码科技有限公司 一种人物图像处理方法及装置
CN107944414A (zh) * 2017-12-05 2018-04-20 广东欧珀移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN108021669A (zh) * 2017-12-05 2018-05-11 广东欧珀移动通信有限公司 图像分类方法和装置、电子设备、计算机可读存储介质
CN108062576A (zh) * 2018-01-05 2018-05-22 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN108280477A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于聚类图像的方法和装置
CN109101542A (zh) * 2018-07-02 2018-12-28 深圳市商汤科技有限公司 图像识别结果输出方法及装置、电子设备和存储介质
CN109376764A (zh) * 2018-09-13 2019-02-22 北京字节跳动网络技术有限公司 基于聚类的数据收集方法、装置和计算机可读存储介质
CN109376596A (zh) * 2018-09-14 2019-02-22 广州杰赛科技股份有限公司 人脸匹配方法、装置、设备及存储介质
CN110728293A (zh) * 2019-08-30 2020-01-24 浙江工业大学 一种面向变尺度数据密度空间基于区域生长及竞争的游客去向数据分级聚类方法
CN111414949A (zh) * 2020-03-13 2020-07-14 杭州海康威视系统技术有限公司 图片聚类方法、装置、电子设备及存储介质
CN112749668A (zh) * 2021-01-18 2021-05-04 上海明略人工智能(集团)有限公司 目标图像的聚类方法、装置、电子设备和计算机可读介质
CN114492678A (zh) * 2022-04-13 2022-05-13 深圳前海中电慧安科技有限公司 一种人像聚类建档方法、装置、设备及存储介质
CN118015312A (zh) * 2024-02-06 2024-05-10 广州思涵信息科技有限公司 图像处理方法、装置和设备

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8363951B2 (en) * 2007-03-05 2013-01-29 DigitalOptics Corporation Europe Limited Face recognition training method and apparatus
US8553949B2 (en) 2004-01-22 2013-10-08 DigitalOptics Corporation Europe Limited Classification and organization of consumer digital images using workflow, and face detection and recognition
US7564994B1 (en) * 2004-01-22 2009-07-21 Fotonation Vision Limited Classification system for consumer digital images using automatic workflow and face detection and recognition
US7715597B2 (en) * 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
US8116573B2 (en) * 2006-03-01 2012-02-14 Fujifilm Corporation Category weight setting apparatus and method, image weight setting apparatus and method, category abnormality setting apparatus and method, and programs therefor
US8467570B2 (en) * 2006-06-14 2013-06-18 Honeywell International Inc. Tracking system with fused motion and object detection
WO2008015586A2 (en) 2006-08-02 2008-02-07 Fotonation Vision Limited Face recognition with combined pca-based datasets
JP4594945B2 (ja) * 2007-02-13 2010-12-08 株式会社東芝 人物検索装置および人物検索方法
KR100795160B1 (ko) * 2007-03-22 2008-01-16 주식회사 아트닉스 얼굴영역검출장치 및 검출방법
US7844106B2 (en) * 2007-04-23 2010-11-30 Mitsubishi Electric Research Laboratories, Inc Method and system for determining poses of objects from range images using adaptive sampling of pose spaces
US8139817B2 (en) * 2007-04-27 2012-03-20 Telewatch Inc. Face image log creation
US8300924B2 (en) * 2007-09-27 2012-10-30 Behavioral Recognition Systems, Inc. Tracker component for behavioral recognition system
US8437514B2 (en) * 2007-10-02 2013-05-07 Microsoft Corporation Cartoon face generation
KR100840021B1 (ko) * 2007-11-05 2008-06-20 (주)올라웍스 특성 데이터를 이용하여 디지털 데이터에 포함된 인물의얼굴에 대해 인식하는 방법 및 시스템
JP2009199232A (ja) * 2008-02-20 2009-09-03 Seiko Epson Corp 画像処理装置
JP5043736B2 (ja) * 2008-03-28 2012-10-10 キヤノン株式会社 撮像装置及びその制御方法
US8831379B2 (en) * 2008-04-04 2014-09-09 Microsoft Corporation Cartoon personalization
JP5164692B2 (ja) * 2008-06-27 2013-03-21 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
CN101635763A (zh) * 2008-07-23 2010-01-27 深圳富泰宏精密工业有限公司 图片分类系统及方法
WO2010014067A1 (en) 2008-07-31 2010-02-04 Hewlett-Packard Development Company, L.P. Perceptual segmentation of images
US20100131499A1 (en) * 2008-11-24 2010-05-27 Van Leuken Reinier H Clustering Image Search Results Through Folding
US9727312B1 (en) * 2009-02-17 2017-08-08 Ikorongo Technology, LLC Providing subject information regarding upcoming images on a display
US8121358B2 (en) * 2009-03-06 2012-02-21 Cyberlink Corp. Method of grouping images by face
US8531478B2 (en) * 2009-03-19 2013-09-10 Cyberlink Corp. Method of browsing photos based on people
WO2010110181A1 (ja) * 2009-03-27 2010-09-30 日本電気株式会社 パターン照合装置、パターン照合方法及びパターン照合プログラム
JP5647602B2 (ja) * 2009-04-27 2015-01-07 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America データ処理装置、データ処理方法、プログラム、及び集積回路
US9092673B2 (en) * 2009-05-07 2015-07-28 Microsoft Technology Licensing, Llc Computing visual and textual summaries for tagged image collections
TWI384406B (zh) * 2009-05-26 2013-02-01 Univ Nat Chiao Tung 人臉辨識與合成方法
US8542950B2 (en) * 2009-06-02 2013-09-24 Yahoo! Inc. Finding iconic images
JP2011081763A (ja) * 2009-09-09 2011-04-21 Sony Corp 情報処理装置、情報処理方法及び情報処理プログラム
US9134816B2 (en) * 2009-11-11 2015-09-15 Erik Dahlkvist Method for using virtual facial and bodily expressions
US9449521B2 (en) * 2009-11-11 2016-09-20 Erik Dahlkvist Method for using virtual facial and bodily expressions
US8351661B2 (en) * 2009-12-02 2013-01-08 At&T Intellectual Property I, L.P. System and method to assign a digital image to a face cluster
US8723965B2 (en) * 2009-12-22 2014-05-13 Panasonic Corporation Image processing device, imaging device, and image processing method for performing blur correction on an input picture
KR20110085728A (ko) * 2010-01-21 2011-07-27 삼성전자주식회사 휴대용 단말기에서 건물 영역을 인식하기 위한 장치 및 방법
US20110211737A1 (en) * 2010-03-01 2011-09-01 Microsoft Corporation Event Matching in Social Networks
US8983210B2 (en) * 2010-03-01 2015-03-17 Microsoft Corporation Social network system and method for identifying cluster image matches
WO2011152821A1 (en) * 2010-06-01 2011-12-08 Hewlett-Packard Development Company, L.P. Clustering images
US8724910B1 (en) 2010-08-31 2014-05-13 Google Inc. Selection of representative images
EP2490151A1 (en) * 2011-02-17 2012-08-22 Nagravision S.A. Method and device to speed up face recognition
US20120155717A1 (en) * 2010-12-16 2012-06-21 Microsoft Corporation Image search including facial image
US8774471B1 (en) * 2010-12-16 2014-07-08 Intuit Inc. Technique for recognizing personal objects and accessing associated information
US8463026B2 (en) * 2010-12-22 2013-06-11 Microsoft Corporation Automated identification of image outliers
EP2659400A4 (en) 2010-12-30 2017-01-11 Nokia Technologies Oy Method, apparatus, and computer program product for image clustering
US8612441B2 (en) * 2011-02-04 2013-12-17 Kodak Alaris Inc. Identifying particular images from a collection
CN103503000B (zh) * 2011-02-18 2017-09-12 谷歌公司 面部识别
JP5924977B2 (ja) * 2011-03-18 2016-05-25 キヤノン株式会社 画像処理装置および画像処理方法
US20120257072A1 (en) 2011-04-06 2012-10-11 Apple Inc. Systems, methods, and computer-readable media for manipulating images using metadata
US9036925B2 (en) 2011-04-14 2015-05-19 Qualcomm Incorporated Robust feature matching for visual search
US20120272171A1 (en) * 2011-04-21 2012-10-25 Panasonic Corporation Apparatus, Method and Computer-Implemented Program for Editable Categorization
US8588534B2 (en) 2011-05-06 2013-11-19 Microsoft Corporation Staged element classification
US8706711B2 (en) 2011-06-22 2014-04-22 Qualcomm Incorporated Descriptor storage and searches of k-dimensional trees
US8977061B2 (en) 2011-06-23 2015-03-10 Hewlett-Packard Development Company, L.P. Merging face clusters
US8769556B2 (en) 2011-10-28 2014-07-01 Motorola Solutions, Inc. Targeted advertisement based on face clustering for time-varying video
FR2983607B1 (fr) * 2011-12-02 2014-01-17 Morpho Procede et dispositif de suivi d'un objet dans une sequence d'au moins deux images
KR101844291B1 (ko) * 2012-01-16 2018-04-03 삼성전자주식회사 신체 자세군 생성 장치 및 방법
US9122912B1 (en) * 2012-03-15 2015-09-01 Google Inc. Sharing photos in a social network system
US8891883B2 (en) * 2012-05-15 2014-11-18 Google Inc. Summarizing a photo album in a social network system
US8923626B1 (en) 2012-06-25 2014-12-30 Google Inc. Image retrieval
US9020212B2 (en) * 2012-07-31 2015-04-28 Hewlett-Packard Development Company, L.P. Automatically determining a name of a person appearing in an image
JP6575845B2 (ja) * 2012-07-31 2019-09-18 日本電気株式会社 画像処理システム、画像処理方法及びプログラム
US9098552B2 (en) * 2013-02-05 2015-08-04 Google Inc. Scoring images related to entities
US9721175B2 (en) 2013-05-08 2017-08-01 Jpmorgan Chase Bank, N.A. Systems and methods for high fidelity multi-modal out-of-band biometric authentication through vector-based multi-profile storage
CN106537417B (zh) * 2013-05-14 2020-10-02 谷歌有限责任公司 总结相册
US9325985B2 (en) 2013-05-28 2016-04-26 Apple Inc. Reference and non-reference video quality evaluation
US10248875B2 (en) * 2013-06-14 2019-04-02 Aware Inc. Method for automatically detecting and repairing biometric crosslinks
WO2014205090A1 (en) * 2013-06-19 2014-12-24 Set Media, Inc. Automatic face discovery and recognition for video content analysis
US9614724B2 (en) 2014-04-21 2017-04-04 Microsoft Technology Licensing, Llc Session-based device configuration
US9639742B2 (en) 2014-04-28 2017-05-02 Microsoft Technology Licensing, Llc Creation of representative content based on facial analysis
US9773156B2 (en) * 2014-04-29 2017-09-26 Microsoft Technology Licensing, Llc Grouping and ranking images based on facial recognition data
US9430667B2 (en) 2014-05-12 2016-08-30 Microsoft Technology Licensing, Llc Managed wireless distribution network
US9384334B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content discovery in managed wireless distribution networks
US10111099B2 (en) 2014-05-12 2018-10-23 Microsoft Technology Licensing, Llc Distributing content in managed wireless distribution networks
US9384335B2 (en) 2014-05-12 2016-07-05 Microsoft Technology Licensing, Llc Content delivery prioritization in managed wireless distribution networks
US10026010B2 (en) * 2014-05-14 2018-07-17 At&T Intellectual Property I, L.P. Image quality estimation using a reference image portion
US9874914B2 (en) 2014-05-19 2018-01-23 Microsoft Technology Licensing, Llc Power management contracts for accessory devices
US10037202B2 (en) 2014-06-03 2018-07-31 Microsoft Technology Licensing, Llc Techniques to isolating a portion of an online computing service
US9367490B2 (en) 2014-06-13 2016-06-14 Microsoft Technology Licensing, Llc Reversible connector for accessory devices
US9717006B2 (en) 2014-06-23 2017-07-25 Microsoft Technology Licensing, Llc Device quarantine in a wireless network
US9373179B2 (en) 2014-06-23 2016-06-21 Microsoft Technology Licensing, Llc Saliency-preserving distinctive low-footprint photograph aging effect
US9858295B2 (en) 2014-06-24 2018-01-02 Google Llc Ranking and selecting images for display from a set of images
US9858679B2 (en) * 2014-11-04 2018-01-02 Hewlett-Packard Development Company, L.P. Dynamic face identification
KR20160119932A (ko) * 2015-04-06 2016-10-17 한국과학기술원 품질 측정 기반의 얼굴 인식 방법 및 장치
US9448704B1 (en) 2015-04-29 2016-09-20 Dropbox, Inc. Navigating digital content using visual characteristics of the digital content
TWI557653B (zh) * 2015-06-30 2016-11-11 Formal photo management method and system
US10068129B2 (en) * 2015-11-18 2018-09-04 Adobe Systems Incorporated Recognizing unknown person instances in an image gallery
CN105260732A (zh) * 2015-11-26 2016-01-20 小米科技有限责任公司 图片处理方法及装置
US9912861B1 (en) 2016-03-02 2018-03-06 Amazon Technologies, Inc. Systems and methods for determining a depth or reflectance of objects
US9986151B1 (en) * 2016-03-02 2018-05-29 Amazon Technologies, Inc. Systems and methods for determining a depth or reflectance of objects
US11055762B2 (en) 2016-03-21 2021-07-06 The Procter & Gamble Company Systems and methods for providing customized product recommendations
JP6723937B2 (ja) * 2017-01-31 2020-07-15 キヤノン株式会社 プログラム、画像処理装置、および画像処理方法
US10311554B2 (en) 2017-03-01 2019-06-04 Fotonation Limited Method of providing a sharpness measure for an image
US10621417B2 (en) * 2017-04-16 2020-04-14 Facebook, Inc. Systems and methods for generating content
US11080316B1 (en) * 2017-05-26 2021-08-03 Amazon Technologies, Inc. Context-inclusive face clustering
US11169661B2 (en) 2017-05-31 2021-11-09 International Business Machines Corporation Thumbnail generation for digital images
CN110678875B (zh) * 2017-05-31 2023-07-11 宝洁公司 用于引导用户拍摄自拍照的系统和方法
US10818007B2 (en) 2017-05-31 2020-10-27 The Procter & Gamble Company Systems and methods for determining apparent skin age
US10403016B2 (en) * 2017-06-02 2019-09-03 Apple Inc. Face syncing in distributed computing environment
US10438095B2 (en) * 2017-08-04 2019-10-08 Medallia, Inc. System and method for cascading image clustering using distribution over auto-generated labels
US10504805B2 (en) * 2017-08-24 2019-12-10 Applied Materials Israel Ltd. Method of examining defects in a semiconductor specimen and system thereof
US20210201072A1 (en) * 2017-10-31 2021-07-01 Hewlett-Packard Development Company, L.P. Photoset clustering
US11023494B2 (en) * 2017-12-12 2021-06-01 International Business Machines Corporation Computer-implemented method and computer system for clustering data
EP3502955A1 (en) 2017-12-20 2019-06-26 Chanel Parfums Beauté Method and system for facial features analysis and delivery of personalized advice
CN111091031A (zh) * 2018-10-24 2020-05-01 北京旷视科技有限公司 目标对象选取方法和人脸解锁方法
US20200151453A1 (en) * 2018-11-08 2020-05-14 International Business Machines Corporation Reducing overlap among a collection of photographs
US11458929B1 (en) * 2019-05-10 2022-10-04 Gm Cruise Holdings Llc Unlocking vehicle doors with facial recognition
US11244169B2 (en) * 2020-06-15 2022-02-08 Bank Of America Corporation System for executing multiple events based on video data extraction and evaluation
CN112270290B (zh) * 2020-11-10 2022-08-02 佳都科技集团股份有限公司 人脸图像动态聚类方法、装置、电子设备和存储介质
US11810398B2 (en) * 2020-11-16 2023-11-07 Nec Corporation Face clustering with image uncertainty
JP2022160331A (ja) * 2021-04-06 2022-10-19 キヤノン株式会社 画像処理装置およびその制御方法
WO2022249277A1 (ja) * 2021-05-25 2022-12-01 日本電気株式会社 画像処理装置、画像処理方法、及びプログラム

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5164992A (en) * 1990-11-01 1992-11-17 Massachusetts Institute Of Technology Face recognition system
US5418895A (en) 1992-11-25 1995-05-23 Eastman Kodak Company Method for displaying a high quality digital color image on a limited color display
US5550928A (en) * 1992-12-15 1996-08-27 A.C. Nielsen Company Audience measurement system and method
AUPP400998A0 (en) * 1998-06-10 1998-07-02 Canon Kabushiki Kaisha Face detection in digital images
US6606398B2 (en) * 1998-09-30 2003-08-12 Intel Corporation Automatic cataloging of people in digital photographs
US6282317B1 (en) 1998-12-31 2001-08-28 Eastman Kodak Company Method for automatic determination of main subjects in photographic images
US6535636B1 (en) 1999-03-23 2003-03-18 Eastman Kodak Company Method for automatically detecting digital images that are undesirable for placing in albums
JP3608106B2 (ja) * 2000-09-19 2005-01-05 日本電炉株式会社 画像処理を用いた鋼材表面の劣化度評価システム
US7155036B2 (en) * 2000-12-04 2006-12-26 Sony Corporation Face detection under varying rotation
US6847733B2 (en) 2001-05-23 2005-01-25 Eastman Kodak Company Retrieval and browsing of database images based on image emphasis and appeal
US7327891B2 (en) * 2001-07-17 2008-02-05 Yesvideo, Inc. Automatic selection of a visual image or images from a collection of visual images, based on an evaluation of the quality of the visual images
JP3903783B2 (ja) * 2001-12-14 2007-04-11 日本電気株式会社 顔メタデータ生成方法および装置、並びに顔類似度算出方法および装置
US20030210808A1 (en) 2002-05-10 2003-11-13 Eastman Kodak Company Method and apparatus for organizing and retrieving images containing human faces
KR100442834B1 (ko) * 2002-07-19 2004-08-02 삼성전자주식회사 얼굴/유사얼굴 영상으로 학습된 패턴 분류기를 이용한얼굴 검출 방법 및 시스템
EP1579378B1 (en) 2002-11-07 2009-02-25 HONDA MOTOR CO., Ltd. Clustering appearances of objects under varying illumination conditions
US6961886B2 (en) * 2003-04-16 2005-11-01 International Business Machines Corporation Diagnostic method for structural scan chain designs
JP4444633B2 (ja) * 2003-11-12 2010-03-31 日本電信電話株式会社 画像分類装置、画像分類方法、および、プログラム
US7822233B2 (en) * 2003-11-14 2010-10-26 Fujifilm Corporation Method and apparatus for organizing digital media based on face recognition
US7596247B2 (en) * 2003-11-14 2009-09-29 Fujifilm Corporation Method and apparatus for object recognition using probability models
GB2414615A (en) * 2004-05-28 2005-11-30 Sony Uk Ltd Object detection, scanning and labelling
JP2006113740A (ja) * 2004-10-13 2006-04-27 Fuji Photo Film Co Ltd 画像検索方法、装置及びプログラム
US7734067B2 (en) * 2004-12-07 2010-06-08 Electronics And Telecommunications Research Institute User recognition system and method thereof
JP4328286B2 (ja) * 2004-12-14 2009-09-09 本田技研工業株式会社 顔領域推定装置、顔領域推定方法及び顔領域推定プログラム
US7715597B2 (en) 2004-12-29 2010-05-11 Fotonation Ireland Limited Method and component for image recognition
CN1828630A (zh) * 2006-04-06 2006-09-06 上海交通大学 基于流形学习的人脸姿势识别方法

Cited By (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101295354B (zh) * 2007-04-23 2013-03-27 索尼株式会社 图像处理装置、成像装置和图像处理方法
US8064656B2 (en) 2007-04-23 2011-11-22 Sony Corporation Image processing apparatus, imaging apparatus, image processing method, and computer program
CN103258185A (zh) * 2007-04-23 2013-08-21 索尼株式会社 图像处理装置、成像装置和图像处理方法
CN102792332B (zh) * 2010-01-22 2016-01-06 松下电器(美国)知识产权公司 图像管理装置、图像管理方法及集成电路
CN102792332A (zh) * 2010-01-22 2012-11-21 松下电器产业株式会社 图像管理装置、图像管理方法、程序、记录媒体及集成电路
CN102439630A (zh) * 2010-02-10 2012-05-02 松下电器产业株式会社 图像评价装置、图像评价方法、程序、集成电路
CN102439630B (zh) * 2010-02-10 2015-05-20 松下电器(美国)知识产权公司 图像评价装置、图像评价方法、程序、集成电路
CN102782704A (zh) * 2010-03-01 2012-11-14 微软公司 基于脸部图像分析的排名
US9465993B2 (en) 2010-03-01 2016-10-11 Microsoft Technology Licensing, Llc Ranking clusters based on facial image analysis
CN102782704B (zh) * 2010-03-01 2015-09-23 微软技术许可有限责任公司 基于脸部图像分析的排名
US10296811B2 (en) 2010-03-01 2019-05-21 Microsoft Technology Licensing, Llc Ranking based on facial image analysis
CN102511054B (zh) * 2010-07-21 2016-02-10 松下电器(美国)知识产权公司 图像管理装置、图像管理方法
CN102511054A (zh) * 2010-07-21 2012-06-20 松下电器产业株式会社 图像管理装置、图像管理方法、程序、记录介质及图像管理用集成电路
US10331799B2 (en) 2013-03-28 2019-06-25 Entit Software Llc Generating a feature set
CN105144139A (zh) * 2013-03-28 2015-12-09 惠普发展公司,有限责任合伙企业 生成特征集
WO2015161757A1 (zh) * 2014-04-23 2015-10-29 北京锤子数码科技有限公司 图片缩略图的获取方法及装置
WO2016180224A1 (zh) * 2015-05-11 2016-11-17 北京锤子数码科技有限公司 一种人物图像处理方法及装置
RU2636668C2 (ru) * 2015-07-28 2017-11-27 Сяоми Инк. Способ и устройство для отображения изображений
US10032076B2 (en) 2015-07-28 2018-07-24 Xiaomi Inc. Method and device for displaying image
CN105138962A (zh) * 2015-07-28 2015-12-09 小米科技有限责任公司 图像显示方法及装置
WO2017016146A1 (zh) * 2015-07-28 2017-02-02 小米科技有限责任公司 图像显示方法及装置
CN105654039A (zh) * 2015-12-24 2016-06-08 小米科技有限责任公司 图像处理的方法和装置
CN105654039B (zh) * 2015-12-24 2019-09-17 小米科技有限责任公司 图像处理的方法和装置
CN107944414A (zh) * 2017-12-05 2018-04-20 广东欧珀移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN108021669A (zh) * 2017-12-05 2018-05-11 广东欧珀移动通信有限公司 图像分类方法和装置、电子设备、计算机可读存储介质
CN108062576B (zh) * 2018-01-05 2019-05-03 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN108062576A (zh) * 2018-01-05 2018-05-22 百度在线网络技术(北京)有限公司 用于输出数据的方法和装置
CN108280477B (zh) * 2018-01-22 2021-12-10 百度在线网络技术(北京)有限公司 用于聚类图像的方法和装置
CN108280477A (zh) * 2018-01-22 2018-07-13 百度在线网络技术(北京)有限公司 用于聚类图像的方法和装置
CN109101542A (zh) * 2018-07-02 2018-12-28 深圳市商汤科技有限公司 图像识别结果输出方法及装置、电子设备和存储介质
CN109376764A (zh) * 2018-09-13 2019-02-22 北京字节跳动网络技术有限公司 基于聚类的数据收集方法、装置和计算机可读存储介质
CN109376596A (zh) * 2018-09-14 2019-02-22 广州杰赛科技股份有限公司 人脸匹配方法、装置、设备及存储介质
CN110728293A (zh) * 2019-08-30 2020-01-24 浙江工业大学 一种面向变尺度数据密度空间基于区域生长及竞争的游客去向数据分级聚类方法
CN111414949A (zh) * 2020-03-13 2020-07-14 杭州海康威视系统技术有限公司 图片聚类方法、装置、电子设备及存储介质
CN111414949B (zh) * 2020-03-13 2023-06-27 杭州海康威视系统技术有限公司 图片聚类方法、装置、电子设备及存储介质
CN112749668A (zh) * 2021-01-18 2021-05-04 上海明略人工智能(集团)有限公司 目标图像的聚类方法、装置、电子设备和计算机可读介质
CN114492678A (zh) * 2022-04-13 2022-05-13 深圳前海中电慧安科技有限公司 一种人像聚类建档方法、装置、设备及存储介质
CN118015312A (zh) * 2024-02-06 2024-05-10 广州思涵信息科技有限公司 图像处理方法、装置和设备

Also Published As

Publication number Publication date
CN101523412B (zh) 2013-01-02
WO2008045521A3 (en) 2008-06-19
US8031914B2 (en) 2011-10-04
JP2010507139A (ja) 2010-03-04
EP2087456B1 (en) 2017-03-08
US20080089561A1 (en) 2008-04-17
WO2008045521A2 (en) 2008-04-17
EP2087456A2 (en) 2009-08-12

Similar Documents

Publication Publication Date Title
CN101523412B (zh) 基于人脸的图像聚类
US10789504B2 (en) Method and device for extracting information in histogram
Pandey et al. Towards understanding human similarity perception in the analysis of large sets of scatter plots
CN109643399B (zh) 多类别分类器的交互式性能可视化
Liu et al. Crowdsourcing construction activity analysis from jobsite video streams
US8781175B2 (en) On-site composition and aesthetics feedback through exemplars for photographers
Yao et al. Oscar: On-site composition and aesthetics feedback through exemplars for photographers
US7580551B1 (en) Method and apparatus for analyzing and/or comparing handwritten and/or biometric samples
CN106529499A (zh) 基于傅里叶描述子和步态能量图融合特征的步态识别方法
CN106778687A (zh) 基于局部评估和全局优化的注视点检测方法
CN110929746A (zh) 一种基于深度神经网络的电子卷宗标题定位提取与分类方法
CN111368682A (zh) 一种基于faster RCNN台标检测与识别的方法及系统
CN116258937A (zh) 基于注意力机制的小样本分割方法、装置、终端及介质
Batra et al. DMCNet: Diversified model combination network for understanding engagement from video screengrabs
Han et al. An interactive grading and learning system for chinese calligraphy
CN109710940A (zh) 一种文章立意的分析及文章评分方法、装置
WO2024021321A1 (zh) 模型生成的方法、装置、电子设备和存储介质
Liang et al. Performance evaluation of document structure extraction algorithms
CN116612478A (zh) 一种脱机手写汉字的评分方法、装置及存储介质
CN113128556B (zh) 基于变异分析的深度学习测试用例排序方法
CN111046883B (zh) 一种基于古钱币图像的智能评估方法及系统
JP4303490B2 (ja) 画像と文書のマッチング方法及び装置並びにマッチングプログラム
WO2023249034A1 (ja) 画像処理方法、コンピュータプログラム及び画像処理装置
CN116259384B (zh) 一种基于医疗健康网状信息处理系统
Inagaki et al. Visualization Method of Important Regions by Combination of Webpage Structures and Saliency Maps.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130102

Termination date: 20211011