CN115700839A - 用于评估对模糊属性进行分类的效果的方法和设备 - Google Patents

用于评估对模糊属性进行分类的效果的方法和设备 Download PDF

Info

Publication number
CN115700839A
CN115700839A CN202110869963.5A CN202110869963A CN115700839A CN 115700839 A CN115700839 A CN 115700839A CN 202110869963 A CN202110869963 A CN 202110869963A CN 115700839 A CN115700839 A CN 115700839A
Authority
CN
China
Prior art keywords
fuzzy
attribute
values
classes
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110869963.5A
Other languages
English (en)
Inventor
孙敬娜
陈培滨
曾伟宏
王旭
刘晶
黎振邦
桑燊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lemon Inc Cayman Island
Original Assignee
Lemon Inc Cayman Island
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lemon Inc Cayman Island filed Critical Lemon Inc Cayman Island
Priority to CN202110869963.5A priority Critical patent/CN115700839A/zh
Priority to US17/529,192 priority patent/US11978280B2/en
Priority to PCT/SG2022/050376 priority patent/WO2023009061A1/zh
Publication of CN115700839A publication Critical patent/CN115700839A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • G06V40/171Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及用于评估对模糊属性进行分类的效果的方法和设备。提供了一种用于评估对于对象的模糊属性进行分类的效果的方法,模糊属性指如下属性,该属性的至少两个类别之间的边界模糊,该方法包括:生成相似排序混淆矩阵,包括:基于对象的模糊属性的K个类别的相似度,对于对象的模糊属性的K个类别进行排序,K是大于等于2的整数,生成K×K的全零初始化矩阵,其中初始化矩阵的横坐标和纵坐标分别代表基于相似度排序的模糊属性的类别的预测值和真实值,和基于多个对象样本的模糊属性的类别的真实值以及预测值,更新初始化矩阵内的对应元素的值;以及显示相似排序混淆矩阵,其中,相似排序混淆矩阵中的非零元素的分布指示出分类的准确度。

Description

用于评估对模糊属性进行分类的效果的方法和设备
技术领域
本公开涉及用于评估对于对象的模糊属性进行分类的效果的方法、设备、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
人脸属性识别是一种通过分析输入的人脸图像来识别人物拥有的各种属性的技术。正确识别人脸属性对安防监控、个性化推荐、虚拟形象生成等场景具有十分重要的参考意义。
属性识别通常被定义为一个分类任务,并根据诸如单标签准确率之类的传统分类指标来判断分类效果的优劣。
发明内容
本公开提供一种新的评估对模糊属性进行分类的效果的方法和设备。
根据本公开的一些实施例,提供了一种用于评估对于对象的模糊属性进行分类的效果的方法,模糊属性指如下属性,该属性的至少两个类别之间的边界模糊,该方法包括:生成相似排序混淆矩阵,包括:基于对象的模糊属性的K个类别的相似度,对于对象的模糊属性的K个类别进行排序,K是大于等于2的整数,生成K×K的全零初始化矩阵,该初始化矩阵包括K×K个元素aij,i和j是整数并且分别取从1到K的值,其中初始化矩阵的横坐标和纵坐标分别代表基于相似度排序的模糊属性的类别的预测值和基于相似度排序的模糊属性的类别的真实值,和基于多个对象样本的模糊属性的类别的真实值以及所述多个对象样本的模糊属性的类别的预测值,更新初始化矩阵内的对应元素的值,以使得更新后的初始化矩阵内的元素的值代表具有相对应的真实值和预测值的对象样本的数量;以及显示相似排序混淆矩阵,其中,相似排序混淆矩阵中的非零元素的分布指示出分类的准确度。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征、方面及其优点将会变得清楚。
附图说明
下面参照附图说明本公开的优选实施例。此处所说明的附图用来提供对本公开的进一步理解,各附图连同下面的具体描述一起包含在本说明书中并形成说明书的一部分,用于解释本公开。应当理解的是,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开构成限制。在附图中:
图1是根据本公开一些实施例的示例性模糊属性分类效果评估设备的框图。
图2是图示根据本公开一些实施例的示例性模糊属性分类效果评估方法的流程图。
图3是图示根据本公开一些实施例的示例性的生成相似排序混淆矩阵的处理的流程图。
图4图示出根据本公开一些实施例的根据对于人脸的脸型属性的分类预测结果而生成的示例性相似排序混淆矩阵。
图5是图示根据本公开一些实施例的模糊属性标注方法的流程图。
图6是根据本公开一些实施例的其中可应用本公开的示例性电子设备的框图。
图7图示出根据本公开一些实施例的其中可应用本公开的一般硬件环境。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,但是显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对实施例的描述实际上也仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值应被解释为仅仅是示例性的,不限制本公开的范围。
在以下描述中,以人脸作为对象,描述对于人脸的模糊属性进行分类的效果的评估。
在本公开中,“模糊属性”指如下属性,该属性的至少两个类别之间的边界模糊。以人脸的头发属性为例,头发属性例如可以包括以下类别:光头、寸头、平头、短发、中长发、和长发。容易理解,例如在“寸头”和“平头”之间的边界、又例如在“中长发”和“长发”之间的边界是模糊的。换言之,“模糊属性”指如下属性,该属性具有两个或更多个类别且至少两个类别的分布是连续的。换言之,“模糊属性”指可以划分到两个或更多个类别的属性。在本公开中,人脸的模糊属性包括人脸的以下属性:脸型、头发、眉毛、眼睛、耳朵、鼻子、嘴巴。
应理解,人脸的属性包括模糊属性和非模糊属性。与模糊属性相对的,非模糊属性可以具有两个或更多个类别且类别的分布是不连续的。
在本公开中,“相似排序混淆矩阵”指如下矩阵,该矩阵对照地示出人脸的模糊属性的真实类别和预测类别,并且该矩阵体现出人脸的模糊属性的类别之间的相似度。
图1是根据本公开一些实施例的示例性模糊属性分类效果评估设备100的框图。
如图1所示,设备100可以包括:相似排序混淆矩阵生成部件110,被配置为接收人脸图像的模糊属性的真实类别和预测类别,并生成相似排序混淆矩阵;和相似排序混淆矩阵显示部件120,被配置成经由显示器等对相似排序混淆矩阵进行显示。进一步地,相似排序混淆矩阵生成部件110可以包括:类别排序部件112,初始化矩阵生成部件114,和矩阵元素更新部件116。这里,类别排序部件112被配置成基于人脸的模糊属性的多个类别的相似度对这多个类别进行排序。初始化矩阵生成部件114被配置成生成全零初始化矩阵,该矩阵的横坐标和纵坐标分别代表人脸的模糊属性的预测类别和人脸的模糊属性的真实类别。矩阵元素更新部件116被配置成基于多个人脸样本(即人脸图像)的模糊属性的真实类别和预测类别,更新初始化矩阵内的对应元素的值,以使得更新后的矩阵内的元素的值代表具有相对应的真实类别和预测类别的对象样本的数量。
设备100还可以包括:模糊属性标注部件130,被配置成在标注人脸样本的模糊属性的类别的阶段,将模糊属性的可接受的多个类别标注为模糊属性的类别。
下文将进一步详细描述如图1所示的各部件的操作。
图2是图示根据本公开一些实施例的模糊属性分类效果评估方法200的流程图。
方法200从步骤S210开始,在步骤S210处,相似排序混淆矩阵生成部件110接收人脸的模糊属性的真实类别和预测类别,并生成相似排序混淆矩阵。以下将参考图3来描述相似排序混淆矩阵生成部件110的具体操作。
接下来,方法200前进到步骤S220,在步骤S220处,相似排序混淆矩阵显示部件120经由显示器等对所生成的相似排序混淆矩阵进行显示。
图3是图示根据本公开一些实施例的示例性的生成相似排序混淆矩阵的处理300的流程图。
处理300从步骤S212开始,在步骤S212处,部件110基于人脸的模糊属性的K个类别的相似度,对于对象的模糊属性的K个类别进行排序,K是大于等于2的整数。
人脸的模糊属性的K个类别可以是预先定义的,例如可以是根据专家经验预先定义的。K个类别的相似度可以指这K个类别的标签之间的相似度或者相关性。K个类别的相似度可以是预先定义的。可替代地,K个类别的相似度可以是根据机器学习算法计算得到的。可以根据任意已知的方法来确定多个类别之间的相似度。
以人脸的脸型属性为例,脸型的六个类别─更具体而言按照相似度排序后的脸型的六个类别─可以是:三角形脸、梨形脸、矩形脸、椭圆形脸、正方形脸、和圆形脸。依此顺序,梨形脸、矩形脸、椭圆形脸、正方形脸和圆形脸与三角形脸的相似度逐渐下降。
接下来,处理300前进到步骤S214,在步骤S214处,部件110生成K×K的全零初始化矩阵,该初始化矩阵包括K×K个元素aij,i和j是整数并且分别取从1到K的值,其中初始化矩阵的横坐标和纵坐标分别代表基于相似度排序的模糊属性的类别的预测值和基于相似度排序的模糊属性的类别的真实值。在一些实施例中,横坐标代表预测值,而纵坐标代表真实值。在另一些实施例中,横坐标代表真实值,而纵坐标代表预测值。
仍以人脸的脸型属性为例,在人脸的脸型属性包括如前所述的六个类别的情况下,在步骤S214处会生成一个6×6的矩阵。沿着横坐标和纵坐标,可以使用值1-6分别代表按照相似度排序的脸型的六个类别,比如使用值1-6分别代表三角形脸、梨形脸、矩形脸、椭圆形脸、正方形脸、和圆形脸。
接下来,处理300前进到步骤S216,在步骤S216处,部件110基于多个人脸样本(即人脸图像)的模糊属性的类别的真实值以及所述多个对象样本的模糊属性的类别的预测值,更新初始化矩阵内的对应元素的值,以使得更新后的初始化矩阵内的元素的值代表具有相对应的真实值和预测值的人脸样本的数量。部件110将更新后的初始化矩阵作为相似排序混淆矩阵输出给部件120。
人脸图像的模糊属性的类别的真实值可以是预先标注的。例如,在对目标人脸图像进行标注时,可以对其添加如下标签:脸型-矩形脸;头发-长发;等等。据此,能够确定该目标人脸图像的脸型属性的类别的真实值例如是“3”。
人脸图像的模糊属性的类别的预测值可以来自如下的预测模型,该预测模型接收如前所述的目标人脸图像,并且输出对于该目标人脸图像的一个或多个属性的类别的预测值。例如,在预测精准的情况下,预测模型可以将目标人脸图像的脸型属性的类别预测为矩形脸,即预测值为“3”。而在预测略有偏差的情况下,预测模型可能将目标人脸图像的脸型属性的类别预测为椭圆形脸,即预测值为“4”。在预测偏差较大的情况下,预测模型可能将目标人脸图像的脸型属性的类别预测为三角形脸,即预测值为“1”。这里的预测模型可以采用任何已知的基于机器学习技术的模型,本公开对此不做限制。
部件110例如可以从人脸图像的标签确定人脸图像的模糊属性的类别的真实值。并且部件110可以从预测模型接收人脸图像的模糊属性的类别的预测值。然后,部件基于多个人脸图像的模糊属性的类别的真实值和预测值,更新初始化矩阵内的对应元素的值。
在一些实施例中,在进行矩阵元素更新时,对于多个人脸图像中的每个人脸图像,在第一真实值(比如矩形脸“3”)被预测为第一预测值(比如矩形脸“3”)的情况下,使初始化矩阵内的与第一真实值和第一预测值对应的元素(比如a33)的值增大预设量。类似地,在第一真实值(比如矩形脸“3”)被预测为第一预测值(比如椭圆形脸“4”)的情况下,使初始化矩阵内的与第一真实值和第一预测值对应的元素(比如a34)的值增大预设量。这里,预设量可以是1。
应理解,可以以各种方式对矩阵内的元素的值进行更新,只要被更新元素的位置与人脸图像的模糊属性的类别的真实值和预测值对应、并且被更新元素的值代表具有相对应的真实值和预测值的人脸图像的数量即可。
图4图示出根据本公开一些实施例的根据对于人脸的脸型属性的分类预测结果而生成的示例性相似排序混淆矩阵。
如图4所示,相似排序混淆矩阵的横坐标代表基于相似度排序的脸型的类别的预测值,比如横坐标的值1-6(由左至右)分别代表如下脸型:三角形脸、梨形脸、矩形脸、椭圆形脸、正方形脸、和圆形脸。相似排序混淆矩阵的纵坐标代表基于相似度排序的脸型的类别的真实值,比如纵坐标的值1-6(由上至下)分别代表如下脸型:三角形脸、梨形脸、矩形脸、椭圆形脸、正方形脸、和圆形脸。
如图4所示的相似排序混淆矩阵是基于大约200张人脸图像的分类预测结果而生成的。该矩阵内的元素的数字值代表具有其纵坐标表示的真实值和其横坐标表示的预测值的人脸图像的数量。以矩阵的第3行“2,0,25,26,0,0”为例,元素a31处的数字2表示真实值为3(矩形脸)而预测值为1(三角形脸)的人脸图像的数量,元素a33处的数字25表示真实值为3(矩形脸)而预测值为3(矩形脸)的人脸图像的数量,并且元素a34处的数字26表示真实值为3(矩形脸)而预测值为4(椭圆形脸)的人脸图像的数量。也就是说,对于脸型的真实类别为矩形脸的53张人脸图像而言,其中2张图像被分类为三角形脸,25张图像被分类为矩形脸,而26张图像被分类为椭圆形脸。
能够理解,在矩阵的对角线上的元素(a11,a12,a13,a14,a15,a16)的非零值指示出对于类别的精准预测。在对角线附近的元素─比如与对角线上的元素相邻的元素─的非零值指示比较准确的预测。而在远离对角线的元素─比如与对角线上的元素不相邻的元素─的非零值指示不太准确的预测。这里,能够理解,预测的准确度即为对于模糊属性进行分类的准确度。
在现有技术中,在评估对于属性的分类效果时,仅仅认为属性的预测类别与真实类别相同的情况(比如将矩形脸预测为矩形脸)是正确的分类,而将其他情况(比如将矩形脸预测为椭圆形脸)均视为错误的分类。在这种情况下,以图4中的第三行数据为例,那么按照现有技术的评估指标,对于人脸的脸型属性的分类准确度会是25/53≈47%。
本公开的发明人认识到,现有技术中的这种评估指标并不能很好地反映出对于人脸属性(尤其是模糊属性)的分类的准确度。举例而言,将矩形脸分类为椭圆形脸通常是可以接受的,这是因为这两种脸型很近似。另外,将矩形脸分类为三角形脸通常是不可接受的,这是因为这两种脸型差别较大。仍以图4中的第三行数据为例,实际上,对于人脸的脸型属性的分类准确度应为51/53≈96%。也就是说,现有的评估指标不能与实际的分类效果对齐。
在一些实施例中,当现有技术的评估指标不能准确地反映实际的分类效果时,可以采用本公开的方案来对分类准确度进行评估。更具体而言,当作为现有技术的评估指标的、预测值与真实值相同的样本的数量与对象样本的总数量的比值低于预定阈值(比如50%、60%、或者根据实际情况设置的其他任意合适的值)时,可以采用本公开的方案来对分类准确度进行评估。
根据本公开的方案,通过生成并显示如前所述的相似排序混淆矩阵,能够直观地展示对于模糊属性的实际分类效果。应理解,在本公开中,相似排序混淆矩阵即为评估分类准确度的评估结果。能够理解,相似排序混淆矩阵中的非零元素分布得越靠近相似排序混淆矩阵的主对角线,分类的准确度越高。
此外,相似排序混淆矩阵能够反映出对于模糊属性的不同真实类别的分类情况。如图4的相似排序混淆矩阵第一行数据示出的,对于三角形脸的分类准确度是低的。因此,这可以提示技术人员采取相应措施以提高对于三角形脸的分类准确度,比如调试预测模型、使用更多的具有三角形脸的人脸图像来对预测模型进行训练等等。
顺便提及,对于模糊属性的真实类别而言,哪些预测类别是可接受的,哪些预测类别是不可接受的,这可以是根据专家经验预先定义的。本公开的发明人还认识到,在现有技术中,在对模糊属性进行标注时,如果模糊属性可能属于多个类别,那么将该模糊属性的类别标注为这多个类别中的任意一个类别。比如,以人脸的头发属性为例,长度到胸部的头发样本即可以分类到“中长发”类别中也可以分类到“长发”类别中。长度到胸部的头发样本属于处在“中长发”类别和“长发”类别之间的边界处的样本。针对这种情况,在现有技术中,随机地将这种样本标注为“中长发”类别或者“长发”类别。进而,在将这种头发样本标注为“中长发”类别的情况下,根据现有技术的评估指标,会将分类结果为“长发”情况均判为错误的分类。再一次地,现有的评估指标不能与实际的分类效果对齐。
为了解决此问题,本公开的发明人提出一种新的对于模糊属性进行标注的方法。以下参照图5介绍此方法。图5是图示根据本公开一些实施例的模糊属性标注方法500的流程图。
方法500从步骤S510开始,在步骤S510处,模糊属性标注部件130接收人脸图像。
接下来,方法500前进到步骤S520,在步骤S520处,部件130判断人脸图像中的目标模糊属性是否可以划分到多个类别中。此判断可以是人工的判断。在这种情况下,部件130可以接收“是”或者“否”的人工输入。可替代地,此判断也可以是机器完成的。例如,如果确定代表目标模糊属性的数值处在相邻的类别之间的边界处或边界附近,那么可以判断该目标模糊属性可以划分到多个类别中。在判断为“是”的情况下,方法前进到步骤S530;在判断为“否”的情况下,方法前进到步骤S540。
例如,考虑前述长度到胸部的头发样本的情况,在此情况下,在步骤S520处判断该样本的头发属性可以被划分到两个类别中,即“中长发”类别和“长发”类别。
在步骤S530处,部件130将人脸图像中的目标模糊属性标注为多类别。更具体而言,部件130将人脸图像中的目标模糊属性的可接受的多个类别标注为目标模糊属性的类别。例如,部件130可以对长度到胸部的头发样本添加如下标签:头发-中长发,长发。
在步骤S540处,部件130将人脸图像中的目标模糊属性标注为单类别。
然后,方法500前进到步骤S550,在步骤S550处,部件130将标注后的人脸图像合并到同一个数据集中。
与现有技术中对于人脸的模糊属性添加指示出其类别的单个标签不同,根据本公开,对于人脸的模糊属性添加指示出其可接受的多个类别的多个标签。这从源头上解决了评估指标不能与实际的分类效果对齐的问题。具体而言,通过将模糊属性的可接受的多个类别均标注为该模糊属性的真实类别,那么在后续进行分类效果评估时,可以将作为可接受的多个类别的分类结果均判别为正确的分类结果,这使得评估结果能够与实际的分类效果对齐。
在以上参照图2和图3介绍的模糊属性分类效果评估方法中,人脸图像的模糊属性的类别的真实值既可以是指示该模糊属性的类别的单个值,也可以是指示该模糊属性的可接受的多个类别的多个值。举例而言,仍以脸型属性为例,目标人脸图像的脸型的真实类别可以是矩形脸,即真实值为“3”,或者,目标人脸图像的脸型的真实类别可以是矩形脸和椭圆形脸,即真实值为“3”和“4”。应理解,这里提到的作为模糊属性的类别的真实值的“指示该模糊属性的可接受的多个类别的多个值”是通过如图5所示的方法─即通过为单个模糊属性添加多个类别标签─而实现的。
在进行矩阵元素更新时,在真实值为单个值的情况下,可以更新与此单个值以及预测值对应的单个元素的值。在真实值为多个值的情况下,可以更新与这多个值中的每个值以及预测值对应的多个元素的值。应理解,不论真实值为单个值还是多个值,预测值均为单个值。举例而言,仍以脸型属性为例,在真实值为“3”而预测值为“4”的情况下,可以更新元素a34;而在真实值为“3”和“4”而预测值为“4”的情况下,可以更新元素a34和a44
以上以人脸作为对象给出了描述。然而应理解,本公开不限于此。例如,本公开同样可以评估对于除人脸之外的对象─比如动物、建筑物等等─的模糊属性的分类效果。
硬件实现
本公开的一些实施例还提供一种电子设备。图6示出本公开的电子设备的一些实施例的框图。例如,在一些实施例中,电子设备600可以为各种类型的设备,例如可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。例如,电子设备600可以包括显示面板,以用于显示根据本公开的方案中所利用的数据和/或执行结果。例如,显示面板可以为各种形状,例如矩形面板、椭圆形面板或多边形面板等。另外,显示面板不仅可以为平面面板,也可以为曲面面板,甚至球面面板。
如图6所示,该实施例的电子设备600包括:存储器610以及耦接至该存储器610的处理器620。应当注意,图6所示的电子设备600的组件只是示例性的,而非限制性的,根据实际应用需要,该电子设备600还可以具有其他组件。处理器620可以控制电子设备600中的其它组件以执行期望的功能。
在一些实施例中,存储器610用于存储一个或多个计算机可读指令。处理器620用于运行计算机可读指令时,计算机可读指令被处理器620运行时实现根据上述任一实施例所述的方法。关于该方法的各个步骤的具体实现以及相关解释内容可以参见上述的实施例,重复之处在此不作赘述。
例如,处理器620和存储器610之间可以直接或间接地互相通信。例如,处理器620和存储器610可以通过网络进行通信。网络可以包括无线网络、有线网络、和/或无线网络和有线网络的任意组合。处理器620和存储器610之间也可以通过系统总线实现相互通信,本公开对此不做限制。
例如,处理器620可以体现为各种适当的处理器、处理装置等,诸如中央处理器(CPU)、图形处理器(Graphics Processing Unit,GPU)、网络处理器(NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。中央处理元(CPU)可以为X86或ARM架构等。例如,存储器610可以包括各种形式的计算机可读存储介质的任意组合,例如易失性存储器和/或非易失性存储器。存储器610例如可以包括系统存储器,系统存储器例如存储有操作系统、应用程序、引导装载程序(Boot Loader)、数据库以及其他程序等。在存储介质中还可以存储各种应用程序和各种数据等。
图7示出了根据本公开的示例性实施例的其中可应用本公开的一般硬件环境700。
参考图7,现在将描述作为可应用于本公开的各方面的硬件设备的示例的计算设备700。计算设备700可以是被配置成执行处理和/或计算的任何机器,可以是但不限于工作站、服务器、台式计算机、膝上型计算机、平板计算机、个人数字助理、智能电话、便携式相机或其任意组合。上述装置100可以整体或至少部分地由计算设备700或类似的设备或系统来实现。
计算设备700可以包括能够经由一个或多个接口与总线702连接或者与总线702通信的元件。例如,计算设备700可以包括总线702、一个或多个处理器704、一个或多个输入设备706以及一个或多个输出设备708。一个或多个处理器704可以是任何类型的处理器,并且可以包括但不限于一个或多个通用处理器和/或一个或多个专用处理器(诸如专用处理芯片)。输入设备706可以是能够向计算设备输入信息的任何类型的设备,并且可以包括但不限于鼠标、键盘、触摸屏、麦克风和/或遥控器。输出设备708可以是能够呈现信息的任何类型的设备,并且可以包括但不限于显示器、扬声器、视频/音频输出终端和/或打印机。计算设备700还可以包括非瞬态存储设备710或与非瞬态存储设备710连接,非瞬态存储设备710可以是非瞬态的并且可以实现数据存储库的任何存储设备,并且可以包括但不限于盘驱动器、光学存储设备、固态存储装置、软盘、柔性盘、硬盘、磁带或任何其它磁性介质、紧凑型盘或任何其它光学介质、ROM(只读存储器)、RAM(随机存取存储器)、高速缓存存储器和/或任何其它存储器芯片或盒带、和/或计算机可以从其读取数据、指令和/或代码的任何其它介质。非瞬态存储设备710可以是可从接口拆卸的。非暂态存储设备710可以具有用于实现上述方法和步骤的数据/指令/代码。计算设备700还可以包括通信设备712。通信设备712可以是能够与外部装置和/或与网络通信的任何类型的设备或系统,并且可以包括但不限于调制解调器、网络卡、红外通信设备、无线通信装备和/或诸如蓝牙TM设备、802.11设备、WiFi设备、WiMax设备、蜂窝通信设施等的芯片组。
总线702可以包括但不限于工业标准体系架构(ISA)总线、微通道体系架构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)本地总线和外围组件互连(PCI)总线。
计算设备700还可以包括工作存储器714,工作存储器714可以是可以存储对处理器704的工作有用的指令和/或数据的任何类型的工作存储器,并且可以包括但不限于随机存取存储器和/或只读存储器设备。
软件要素可以位于工作存储器714中,包括但不限于操作系统716、一个或多个应用程序718、驱动程序和/或其它数据和代码。用于执行上述方法和步骤的指令可以被包括在一个或多个应用程序718中,并且上述装置100的部件可以通过处理器704读取并执行一个或多个应用程序718的指令来实现。更具体地,相似排序混淆矩阵生成部件110可以例如由处理器704在执行具有执行步骤S210(或者步骤S212、S214和S216)的指令的应用程序718时实现。相似排序混淆矩阵显示部件120可以例如由处理器704在执行具有执行步骤S220的指令的应用程序718时实现。模糊属性标注部件130可以例如由处理器704在执行具有执行步骤S510-S550的指令的应用程序718时实现。进一步地,类别排序部件112可以例如由处理器704在执行具有执行步骤S212的指令的应用程序718时实现。初始化矩阵生成部件114可以例如由处理器704在执行具有执行步骤S214的指令的应用程序718时实现。矩阵元素更新部件116可以例如由处理器704在执行具有执行步骤S212的指令的应用程序718时实现。软件要素的指令的可执行代码或源代码可以存储在非瞬态计算机可读存储介质(诸如上述(一个或多个)存储设备710)中,并且可以在可能编译和/或安装的情况下被读入到工作存储器714中。软件要素的指令的可执行代码或源代码也可以从远程位置下载。
从上述实施例中,本领域技术人员可以清楚地知晓,可以通过软件及必要的硬件来实现本公开,或者可以通过硬件、固件等来实现本公开。基于这种理解,可以部分地以软件形式来实现本公开的实施例。计算机软件可以存储在计算机的可读存储介质中,比如软盘、硬盘、光盘或闪存中。计算机软件包括使得计算机(例如个人计算机、服务站或网络终端)运行根据本公开的各个实施例的方法或其一部分的一系列指令。
已经这样描述了本公开,清楚的是,本公开可以以许多种方式变化。这些变化不被视为背离了本公开的精神和范围,而是对于本领域技术人员而言显而易见的所有这种修改意欲被包括在以下权利要求的范围中。

Claims (17)

1.一种用于评估对于对象的模糊属性进行分类的效果的方法,模糊属性指如下属性,该属性的至少两个类别之间的边界模糊,其特征在于,该方法包括:
生成相似排序混淆矩阵,包括:
基于对象的模糊属性的K个类别的相似度,对于对象的模糊属性的K个类别进行排序,K是大于等于2的整数,
生成K×K的全零初始化矩阵,该初始化矩阵包括K×K个元素aij,i和j是整数并且分别取从1到K的值,其中初始化矩阵的横坐标和纵坐标分别代表基于相似度排序的模糊属性的类别的预测值和基于相似度排序的模糊属性的类别的真实值,和
基于多个对象样本的模糊属性的类别的真实值以及所述多个对象样本的模糊属性的类别的预测值,更新初始化矩阵内的对应元素的值,以使得更新后的初始化矩阵内的元素的值代表具有相对应的真实值和预测值的对象样本的数量;以及
显示相似排序混淆矩阵,其中,相似排序混淆矩阵中的非零元素的分布指示出分类的准确度。
2.根据权利要求1所述的方法,其中,基于多个对象样本的模糊属性的类别的真实值以及所述多个对象样本的模糊属性的类别的预测值更新初始化矩阵内的对应元素的值包括:
对于所述多个对象样本中的每个对象样本,在第一真实值被预测为第一预测值的情况下,使初始化矩阵内的与第一真实值和第一预测值对应的元素的值增大预设量。
3.根据权利要求1所述的方法,其中,相似排序混淆矩阵中的非零元素分布得越靠近相似排序混淆矩阵的主对角线,分类的准确度越高。
4.根据权利要求1所述的方法,其中,对象样本的模糊属性的类别的真实值包括:指示该模糊属性的类别的单个值。
5.根据权利要求1所述的方法,其中,对象样本的模糊属性的类别的真实值包括:指示该模糊属性的可接受的多个类别的多个值。
6.根据权利要求5所述的方法,还包括:在标注对象样本的模糊属性的类别的阶段,将模糊属性的可接受的多个类别标注为模糊属性的类别。
7.根据权利要求1所述的方法,其中,沿着矩阵的横坐标或纵坐标,按照类别的相似度的升序或降序来排列对象的模糊属性的K个类别。
8.根据权利要求1所述的方法,其中,对象包括人脸,并且对象样本包括人脸图像。
9.根据权利要求8所述的方法,其中,对象的模糊属性包括人脸的以下属性:脸型、头发、眉毛、眼睛、耳朵、鼻子、嘴巴。
10.根据权利要求9所述的方法,其中,在对象的模糊属性指人脸的脸型的情况下,对象的模糊属性的K个类别包括:三角形脸、梨形脸、矩形脸、椭圆形脸、正方形脸、和圆形脸。
11.根据权利要求9所述的方法,其中,在对象的模糊属性指人脸的头发的情况下,对象的模糊属性的K个类别包括:光头、寸头、平头、短发、中长发、和长发。
12.根据权利要求1所述的方法,其中,所述多个对象样本的模糊属性的类别的预测值来自如下预测模型,该预测模型接收所述多个对象样本,并且输出所述多个对象样本的模糊属性的类别的预测值。
13.一种用于评估对于对象的属性进行分类的效果的方法,其特征在于,该方法包括:
比较多个对象样本的属性的类别的真实值以及所述多个对象样本的属性的类别的预测值,其中,真实值是单个值,并且预测值是单个值,并且确定预测值与真实值相同的样本的数量与所述多个对象样本的总数量的比值,以及
在所述比值低于预定阈值的情况下,采用如权利要求1-4中任一项所述的方法来对分类准确度进行评估。
14.一种电子设备,其特征在于,包括:
存储器;和
耦接至所述存储器的处理器,所述存储器中存储有指令,所述指令当由所述处理器执行时,使得所述电子设备执行根据权利要求1-13中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1-13中任一项所述的方法。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1-13中任一项所述的方法。
17.一种用于评估对于对象的模糊属性进行分类的效果的设备,其特征在于,包括:用于执行如权利要求1-13中的任一项所述的方法的部件。
CN202110869963.5A 2021-07-30 2021-07-30 用于评估对模糊属性进行分类的效果的方法和设备 Pending CN115700839A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110869963.5A CN115700839A (zh) 2021-07-30 2021-07-30 用于评估对模糊属性进行分类的效果的方法和设备
US17/529,192 US11978280B2 (en) 2021-07-30 2021-11-17 Method and device for evaluating effect of classifying fuzzy attribute
PCT/SG2022/050376 WO2023009061A1 (zh) 2021-07-30 2022-06-02 用于评估对模糊属性进行分类的效果的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110869963.5A CN115700839A (zh) 2021-07-30 2021-07-30 用于评估对模糊属性进行分类的效果的方法和设备

Publications (1)

Publication Number Publication Date
CN115700839A true CN115700839A (zh) 2023-02-07

Family

ID=85038396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110869963.5A Pending CN115700839A (zh) 2021-07-30 2021-07-30 用于评估对模糊属性进行分类的效果的方法和设备

Country Status (3)

Country Link
US (1) US11978280B2 (zh)
CN (1) CN115700839A (zh)
WO (1) WO2023009061A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3210160A4 (en) 2014-10-23 2018-06-27 Intel Corporation Method and system of facial expression recognition using linear relationships within landmark subsets
TWI625680B (zh) * 2017-12-15 2018-06-01 財團法人工業技術研究院 臉部表情辨識的方法及裝置
CN108205661A (zh) 2017-12-27 2018-06-26 浩云科技股份有限公司 一种基于深度学习的atm机异常人脸检测方法
CN108664924B (zh) 2018-05-10 2022-07-08 东南大学 一种基于卷积神经网络的多标签物体识别方法
CN109492529A (zh) 2018-10-08 2019-03-19 中国矿业大学 一种多尺度特征提取及全局特征融合的人脸表情识别方法
US10719301B1 (en) * 2018-10-26 2020-07-21 Amazon Technologies, Inc. Development environment for machine learning media models

Also Published As

Publication number Publication date
WO2023009061A1 (zh) 2023-02-02
US20230033303A1 (en) 2023-02-02
US11978280B2 (en) 2024-05-07

Similar Documents

Publication Publication Date Title
US11928567B2 (en) System and method for improving machine learning models by detecting and removing inaccurate training data
WO2021169111A1 (zh) 简历筛选方法、装置、计算机设备和存储介质
CN112632385A (zh) 课程推荐方法、装置、计算机设备及介质
US11416772B2 (en) Integrated bottom-up segmentation for semi-supervised image segmentation
Flynt et al. A survey of popular R packages for cluster analysis
US20180068221A1 (en) System and Method of Advising Human Verification of Machine-Annotated Ground Truth - High Entropy Focus
EP3848855A1 (en) Learning method and apparatus for intention recognition model, and device
CN112990318B (zh) 持续学习方法、装置、终端及存储介质
CN113361593B (zh) 生成图像分类模型的方法、路侧设备及云控平台
CN111737479B (zh) 数据获取方法、装置、电子设备及存储介质
CN110705489B (zh) 目标识别网络的训练方法、装置、计算机设备和存储介质
CN111566646A (zh) 用于对数据进行混淆和解码的电子装置以及用于控制该电子装置的方法
CN113268665A (zh) 基于随机森林的信息推荐方法、装置、设备及存储介质
CN111191677A (zh) 用户特征数据生成方法、装置及电子设备
WO2024055864A1 (zh) 结合rpa和ai实现ia的分类模型的训练方法及装置
US11551817B2 (en) Assessing unreliability of clinical risk prediction
CN116109907B (zh) 目标检测方法、装置、电子设备及存储介质
CN111709475A (zh) 一种基于N-grams的多标签分类方法及装置
CN115700839A (zh) 用于评估对模糊属性进行分类的效果的方法和设备
CN113407719B (zh) 文本数据的检测方法、装置、电子设备及存储介质
WO2022222228A1 (zh) 文本不良信息识别方法、装置、电子设备及存储介质
US10380615B2 (en) Product design based on user reviews
CN114332529A (zh) 图像分类模型的训练方法、装置、电子设备及存储介质
US11514311B2 (en) Automated data slicing based on an artificial neural network
CN113569986B (zh) 计算机视觉数据分类方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination