CN109165673B - 基于度量学习和多示例支持向量机的图像分类方法 - Google Patents

基于度量学习和多示例支持向量机的图像分类方法 Download PDF

Info

Publication number
CN109165673B
CN109165673B CN201810792175.9A CN201810792175A CN109165673B CN 109165673 B CN109165673 B CN 109165673B CN 201810792175 A CN201810792175 A CN 201810792175A CN 109165673 B CN109165673 B CN 109165673B
Authority
CN
China
Prior art keywords
image
metric learning
support vector
vector machine
packet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810792175.9A
Other languages
English (en)
Other versions
CN109165673A (zh
Inventor
阮奕邦
肖燕珊
郝志峰
刘波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong University of Technology
Original Assignee
Guangdong University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong University of Technology filed Critical Guangdong University of Technology
Priority to CN201810792175.9A priority Critical patent/CN109165673B/zh
Publication of CN109165673A publication Critical patent/CN109165673A/zh
Application granted granted Critical
Publication of CN109165673B publication Critical patent/CN109165673B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及图像分类技术领域,涉及一种基于度量学习和多示例支持向量机的图像分类方法。该方法包括:对图像进行标记以及多示例化;构建一个基于示例与类别相似性的度量学习问题;构建一个基于度量学习的多示例支持向量机问题;对多示例包的示例进行重新标记;迭代优化出基于度量学习和多示例支持向量机的图像分类器。本发明采用度量学习框架,根据类别的信息,使相同类别图像之间的距离缩短,不同类别图像之间的距离拉大,从而把图像特征的相关信息保存下来,并且将图像多示例化,保留了图像中的场景相关性,从而构建了一个基于度量学习的多示例支持向量机模型,极大的提高了分类器在进行图像分类时的精度。

Description

基于度量学习和多示例支持向量机的图像分类方法
技术领域
本发明涉及图像分类技术领域,更具体地,涉及一种基于度量学习和多示例支持向量机的图像分类方法。
背景技术
随着计算机技术的快速发展以及移动设备的普及,导致互联网上面存在着海量图像,并且每天新上传至互联网上的图像的数量呈指数上升;同时,移动设备的更新换代,使得图像所包含的场景也越来越丰富。由于互联网上面的图像大部分是无标记的,导致这些图片至今还没有得到互联网公司的充分利用。在图像的数量还很少的情况下,让专家进行对这些图像进行人工标注的方式还是可行的,但是互联网上面的图像数量是海量的,并且每天还以指数增加,此时使用人工标注的形式对图像进行分类是不可取的。因此,如何让计算机识别出未被标记的图像,并且准确分类到对应的类别中以更好地服务互联网用户,是大部分互联网公司都在研究的一个问题。
一方面,由于移动设备的普及与发展,上传到互联网的图像的场景已经是非常丰富的,即图像在拍摄过程中会包含各式的背景。例如,在拍摄人物照时,拍摄地点的不同,会使得图像包含的背景不一样。当在大街上拍摄人物照时,将会把街上的人群也拍进这个图像里面;而在动物园拍摄人物照时,将会把许多的动物和植物拍进去。现有的大部分图像分类方法属于单示例分类方法,即是将整个图像当成单一向量(示例)。然而由于互联网图像含有多个场景,将整个图像转换成单一示例,将会无法描述出图像场景之间的关系。此时,采用单示例分类方法进行图像分类,可能会导致误分类。相对于单示例学习,多示例学习能够根据图像场景,把图像转换为多示例的形式,并且保存了图像场景的相关性。
另一方面,用于训练分类器的图像可能是相同的,即同一组图像集,可能用作不同的图像分类任务。举个例子,分类任务可以是根据目标身份进行一组人脸图像的分类,也可以是按照人脸姿势对这组人脸图像的进行分类。当根据目标身份进行一组人脸图像的分类时,人物发色、脸型等关键特征应比图像其他的特征更加重要;而当分类任务是基于人脸姿势时,此时图像之间的人脸姿势相似性应要比图像其他的特征含有更高权重。在进行图像之间的距离和相似性处理时,大部分传统的图像分类方法都是基于欧式距离公式。然而,欧式距离公式无法突出图像集的特征信息,在计算图像之间的相似性和距离时,图像特征的权重都是相同的。所以,采用欧式距离公式进行图像处理时,同一组图像集无法同时用于多个不同分类任务的训练。而度量学习则能够根据类别的信息,使相同类别图像之间的距离缩短,不同类别图像之间的距离拉大,从而把图像特征的相关信息保存下来。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种基于度量学习和多示例支持向量机的图像分类方法,根据分类信息,设计一个合适的度量距离公式,基于这个优化的度量距离公式,将图像数据转换为多示例形式,设计一个多示例支持向量机模型,构建了一个基于度量学习的多示例支持向量机模型,极大的提高了分类器在进行图像分类时的精度。
为解决上述技术问题,本发明采用的技术方案是:一种基于度量学习和多示例支持向量机的图像分类方法,包括以下步骤:
S1.获取图像,以人工的形式,对图像进行人工标记,并且将标记好的图像转换为多示例数据。
S2.对用于图像分类的多示例包的示例标签进行初始化,赋予每个类别的包中示例一个标签。
S3.构建一个基于示例与类别的相似性的度量学习问题,求解该度量学习问题,得到优化后的度量学习矩阵,所述的度量学习问题为:
Figure GDA0003178204040000021
Figure GDA0003178204040000022
Yij k[(Bij-Ck)TM(Bij-Ck)-b]≥1-ξij,
ξij≥0,Mφ=0,b≥1
式中,||·||F表示为矩阵的F范式;正则项||M||2 F用来保证学习出来的度量学习矩阵的元素不会过大;|Bi|为包Bi的示例个数;ξij是一个非负误差项,C为可调参数,用来控制误差项的大小;Bij代表了第i个包Bi的第j个示例,Ck为第k个类别中所有示例的中心点;如果包中示例Bij属于第k类,则Yij k=-1,否则,Yij k=1;Mφ=0用来强制约束度量学习矩阵是正半定矩阵,保证计算出来的图像之间的距离不会为负数;
在本发明中,很明显,该度量学习问题是凸优化问题,可以得到全局最优的度量学习矩阵M。通过求解该优化问题,保证了包中示例离所属类别的中心的距离小于等于b-1,离其他类别的中心的距离大于等于b+1,从而确保了相同标签的图像之间更近,不同标签的图像之间更远。
S4.基于S3步骤中优化出的度量学习矩阵M’,构建一个多示例支持向量机问题,所述的多示例支持向量机问题为:
Figure GDA0003178204040000031
Figure GDA0003178204040000032
hij(w·M'·Bij-b)≥1-ηij,
ηij≥0
式中,hij为包中示例Bij所属的标签,如果为正示例,则hij为+1,如果为负示例,则hij为-1;ηij为松弛变量,可调参数D用来控制松弛变量的大小;该优化问题保证了在多示例学习环境下,求得一组间距最大的超平面,能够很好的把不同类别的图像分割开来。
S5.求解S4步骤的基于度量学习的多示例支持向量机问题,得到训练好的图像分类器,并对训练包的示例进行重新标记。
S6.判断训练出来的图像分类模型的精度是否达到预期精度或者是否已经达到最大训练迭代次数,不满足则跳到S3步骤,重新进行分类器的训练;如果满足,则输出优化后的基于度量学习的多示例图像分类器f(Bs)。
进一步地,所述的S1步骤具体包括:
S11.采用经典的图像处理方法,如Blobworld系统,将图像按照场景进行区域切割;
S12.对切割好的图像区域进行特征提取,将其转换为计算机可以处理的示例向量;
S13.由于图像含有多个场景,则切割为多个图像区域,产生多个示例;此时每张图像称为一个包,进行特征提取的图像区域称为包中示例。
进一步地,所述的S2步骤,在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。在多示例学习环境中,包的标签是已知的,而包中示例的标签是未知的。因此,在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。
进一步地,所述的S4步骤中,在度量学习的训练环境下,包Bp中的示例Bpi与包Bn中的示例Bnj的相似性公式为Bpi·M'·Bnj;所述的多示例支持向量机问题是基于该相似性公式构建的。求解S3步骤中的最优化问题,可以得到训练出来的度量学习矩阵M,此时图像之间的距离和相似性会与图像类别挂钩;在度量学习的训练环境下,包Bp中的示例Bpi与包Bn中的示例Bnj的相似性公式为Bpi·M'·Bnj,基于该相似性公式,本专利构建了一个多示例支持向量机问题。
进一步地,所述的S5步骤包括:
S51.通过引入非负拉格朗日因子
Figure GDA0003178204040000043
将多示例支持向量机问题转换为对偶形式的优化问题,该对偶形式的优化问题如下:
Figure GDA0003178204040000041
S52.采用经典的二次规划算法对所述的对偶形式的优化问题进行求解,通过求解该对偶形式的优化问题,可以计算出非负拉格朗日因子
Figure GDA0003178204040000044
此时最优化的变量为:
Figure GDA0003178204040000042
则用于图像分类的多示例分类模型为:
Figure GDA0003178204040000051
其中,Bs为未知标签的图像多示例包。
在本发明中,利用该分类模型,可以重新标记所有训练包的所有示例。
与现有技术相比,有益效果是:本发明提供的一种基于度量学习和多示例支持向量机的图像分类方法,采用度量学习框架,根据类别的信息,设计一个合适的度量距离公式,基于这个优化的度量距离公式,将图像数据转换为多示例形式,设计了一个多示例支持向量机模型,使相同类别图像之间的距离缩短,不同类别图像之间的距离拉大,从而把图像特征的相关信息保存下来,并且将图像多示例化,保留了图像中的场景相关性,从而构建了一个基于度量学习的多示例支持向量机模型,极大的提高了分类器在进行图像分类时的精度。
附图说明
图1是本发明方法流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本发明的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。
如图1所示,一种基于度量学习和多示例支持向量机的图像分类方法,包括以下步骤:
步骤1.获取图像,以人工的形式,对图像进行人工标记,并且将标记好的图像转换为多示例数据。具体包括:
S11.采用经典的图像处理方法,如Blobworld系统,将图像按照场景进行区域切割;
S12.对切割好的图像区域进行特征提取,将其转换为计算机可以处理的示例向量;
S13.由于图像含有多个场景,则切割为多个图像区域,产生多个示例;此时每张图像称为一个包,进行特征提取的图像区域称为包中示例。
步骤2.对用于图像分类的多示例包的示例标签进行初始化,赋予每个类别的包中示例一个标签。在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。
步骤3.构建一个基于示例与类别的相似性的度量学习问题,求解该度量学习问题,得到优化后的度量学习矩阵,所述的度量学习问题为:
Figure GDA0003178204040000061
Figure GDA0003178204040000062
Yij k[(Bij-Ck)TM(Bij-Ck)-b]≥1-ξij,
ξij≥0,Mφ=0,b≥1
式中,||·||F表示为矩阵的F范式;正则项||M||2 F用来保证学习出来的度量学习矩阵的元素不会过大;|Bi|为包Bi的示例个数;ξij是一个非负误差项,C为可调参数,用来控制误差项的大小;Bij代表了第i个包Bi的第j个示例,Ck为第k个类别中所有示例的中心点;如果包中示例Bij属于第k类,则Yij k=-1,否则,Yij k=1;Mφ=0用来强制约束度量学习矩阵是正半定矩阵,保证计算出来的图像之间的距离不会为负数;
在本发明中,很明显,该度量学习问题是凸优化问题,可以得到全局最优的度量学习矩阵M。通过求解该优化问题,保证了包中示例离所属类别的中心的距离小于等于b-1,离其他类别的中心的距离大于等于b+1,从而确保了相同标签的图像之间更近,不同标签的图像之间更远。
步骤4.基于步骤3中优化出的度量学习矩阵M,求解步骤3中的最优化问题,可以得到训练出来的度量学习矩阵M,此时图像之间的距离和相似性会与图像类别挂钩;在度量学习的训练环境下,包Bp中的示例Bpi与包Bn中的示例Bnj的相似性公式为Bpi·M'·Bnj,基于该相似性公式,本专利构建了一个多示例支持向量机问题,构建一个多示例支持向量机问题,所述的多示例支持向量机问题为:
Figure GDA0003178204040000071
Figure GDA0003178204040000072
hij(w·M'·Bij-b)≥1-ηij,
ηij≥0
式中,hij为包中示例Bij所属的标签,如果为正示例,则hij为+1,如果为负示例,则hij为-1;ηij为松弛变量,可调参数D用来控制松弛变量的大小;该优化问题保证了在多示例学习环境下,求得一组间距最大的超平面,能够很好的把不同类别的图像分割开来。
步骤5.求解步骤4的基于度量学习的多示例支持向量机问题,得到训练好的图像分类器,并对训练包的示例进行重新标记。具体包括:
S51.通过引入非负拉格朗日因子
Figure GDA0003178204040000073
将多示例支持向量机问题转换为对偶形式的优化问题,该对偶形式的优化问题如下:
Figure GDA0003178204040000074
S52.采用经典的二次规划算法对所述的对偶形式的优化问题进行求解,通过求解该对偶形式的优化问题,可以计算出非负拉格朗日因子
Figure GDA0003178204040000077
此时最优化的变量为:
Figure GDA0003178204040000075
则用于图像分类的多示例分类模型为:
Figure GDA0003178204040000076
其中,Bs为未知标签的图像多示例包。
在本发明中,利用该分类模型,可以重新标记所有训练包的所有示例。
步骤6.判断训练出来的图像分类模型的精度是否达到预期精度或者是否已经达到最大训练迭代次数,不满足则跳到S3步骤,重新进行分类器的训练;如果满足,则输出优化后的基于度量学习的多示例图像分类器f(Bs)。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (5)

1.一种基于度量学习和多示例支持向量机的图像分类方法,其特征在于,包括以下步骤:
S1.获取图像,以人工的形式,对图像进行人工标记,并且将标记好的图像转换为多示例数据;
S2.对用于图像分类的多示例包的示例标签进行初始化,赋予每个类别的包中示例一个标签;
S3.构建一个基于示例与类别的相似性的度量学习问题,求解该度量学习问题,得到优化后的度量学习矩阵,所述的度量学习问题为:
Figure FDA0003178204030000011
Figure FDA0003178204030000012
Yij k[(Bij-Ck)TM(Bij-Ck)-b]≥1-ξij,
ξij≥0,Mφ=0,b≥1
式中,||·||F表示为矩阵的F范式;正则项||M||2 F用来保证学习出来的度量学习矩阵的元素不会过大;|Bi|为包Bi的示例个数;ξij是一个非负误差项,C为可调参数,用来控制误差项的大小;Bij代表了第i个包Bi的第j个示例,Ck为第k个类别中所有示例的中心点;如果包中示例Bij属于第k类,则Yij k=-1,否则,Yij k=1;Mφ=0用来强制约束度量学习矩阵是正半定矩阵,保证计算出来的图像之间的距离不会为负数;(Bij-Ck)T表示为(Bij-Ck)的转置;b表示为度量学习问题的距离基准;
S4.基于S3步骤中优化出的度量学习矩阵M’,构建一个多示例支持向量机问题,所述的多示例支持向量机问题为:
Figure FDA0003178204030000021
Figure FDA0003178204030000022
hij(w·M'·Bij-b)≥1-ηij,
ηij≥0
式中,hij为包中示例Bij所属的标签,如果为正示例,则hij为+1,如果为负示例,则hij为-1;ηij为松弛变量,可调参数D用来控制松弛变量的大小;w和b为支持向量机决策边界的参数,wT为该参数的转置;
S5.求解S4步骤的基于度量学习的多示例支持向量机问题,得到训练好的图像分类器,并对训练包的示例进行重新标记;
S6.判断训练出来的图像分类模型的精度是否达到预期精度或者是否已经达到最大训练迭代次数,不满足则跳到S3步骤,重新进行分类器的训练;如果满足,则输出优化后的基于度量学习的多示例图像分类器f(Bs)。
2.根据权利要求1所述的基于度量学习和多示例支持向量机的图像分类方法,其特征在于,所述的S1步骤具体包括:
S11.采用经典的图像处理方法,将图像按照场景进行区域切割;
S12.对切割好的图像区域进行特征提取,将其转换为计算机可以处理的示例向量;
S13.由于图像含有多个场景,则切割为多个图像区域,产生多个示例;此时每张图像称为一个包,进行特征提取的图像区域称为包中示例。
3.根据权利要求1所述的基于度量学习和多示例支持向量机的图像分类方法,其特征在于,所述的S2步骤,在初始化过程中,对于正包,将正包的所有示例当成正示例进行处理,即将包中所有示例的标签设为+1;对于负包,将负包的所有示例当成负示例进行处理,即将包中所有示例的标签设为-1。
4.根据权利要求2或3所述的基于度量学习和多示例支持向量机的图像分类方法,其特征在于,所述的S4步骤中,在度量学习的训练环境下,包Bp中的示例Bpi与包Bn中的示例Bnj的相似性公式为Bpi·M'·Bnj;所述的多示例支持向量机问题是基于该相似性公式构建的。
5.根据权利要求4所述的基于度量学习和多示例支持向量机的图像分类方法,其特征在于,所述的S5步骤包括:
S51.通过引入非负拉格朗日因子
Figure FDA0003178204030000031
将多示例支持向量机问题转换为对偶形式的优化问题,该对偶形式的优化问题如下:
Figure FDA0003178204030000032
式中,Bpz和Bnt为包中示例;hpz与hnt为包中示例Bpz和Bnt对应的标签;M’为优化后的度量学习矩阵;
S52.采用经典的二次规划算法对所述的对偶形式的优化问题进行求解,通过求解该对偶形式的优化问题,可以计算出非负拉格朗日因子
Figure FDA0003178204030000035
此时最优化的变量为:
Figure FDA0003178204030000033
则用于图像分类的多示例分类模型为:
Figure FDA0003178204030000034
其中,Bs为未知标签的图像多示例包,Bsz为未知标签包Bs中的示例,b为优化后的支持向量机决策边界的参数;sign(·)为符号函数,当函数输入值大于等于0时,输出+1,当函数输入值小于0时,输出-1;函数max(·)能够返回输入向量中的最大值。
CN201810792175.9A 2018-07-18 2018-07-18 基于度量学习和多示例支持向量机的图像分类方法 Active CN109165673B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810792175.9A CN109165673B (zh) 2018-07-18 2018-07-18 基于度量学习和多示例支持向量机的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810792175.9A CN109165673B (zh) 2018-07-18 2018-07-18 基于度量学习和多示例支持向量机的图像分类方法

Publications (2)

Publication Number Publication Date
CN109165673A CN109165673A (zh) 2019-01-08
CN109165673B true CN109165673B (zh) 2021-08-31

Family

ID=64897761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810792175.9A Active CN109165673B (zh) 2018-07-18 2018-07-18 基于度量学习和多示例支持向量机的图像分类方法

Country Status (1)

Country Link
CN (1) CN109165673B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109919165B (zh) * 2019-03-18 2021-07-06 广东工业大学 一种基于相似度的多示例字典学习分类方法及装置
CN110008365B (zh) * 2019-04-09 2023-02-07 广东工业大学 一种图像处理方法、装置、设备及可读存储介质
CN110378384B (zh) * 2019-06-19 2023-10-10 广东工业大学 一种结合特权信息和排序支持向量机的图像分类方法
CN111222551A (zh) * 2019-12-30 2020-06-02 成都云尚物联环境科技有限公司 污水管道缺陷图像识别方法、装置、存储介质及电子设备
CN112598622B (zh) * 2020-12-03 2022-08-09 天津理工大学 一种融合深度多示例学习和包间相似性的乳腺癌检测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942568A (zh) * 2014-04-22 2014-07-23 浙江大学 一种基于无监督特征选择的分类方法
JP2014153837A (ja) * 2013-02-07 2014-08-25 Osaka Univ 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法
CN106250870A (zh) * 2016-08-16 2016-12-21 电子科技大学 一种联合局部和全局相似性度量学习的行人再识别方法
CN106845397A (zh) * 2017-01-18 2017-06-13 湘潭大学 一种基于相似度度量的人脸确认方法
US9846841B1 (en) * 2009-07-22 2017-12-19 Google Inc. Predicting object identity using an ensemble of predictors
US20180075370A1 (en) * 2016-09-09 2018-03-15 Nec Laboratories America, Inc. Mining non-linear dependencies via a neighborhood mixture model
WO2018100668A1 (en) * 2016-11-30 2018-06-07 Nec Corporation Image processing device, image processing method, and image processing program
US20180189581A1 (en) * 2010-06-07 2018-07-05 Affectiva, Inc. Vehicle manipulation using convolutional image processing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9846841B1 (en) * 2009-07-22 2017-12-19 Google Inc. Predicting object identity using an ensemble of predictors
US20180189581A1 (en) * 2010-06-07 2018-07-05 Affectiva, Inc. Vehicle manipulation using convolutional image processing
JP2014153837A (ja) * 2013-02-07 2014-08-25 Osaka Univ 識別装置、データ判別装置、ソフトカスケード識別器を構成する方法、データの識別方法、および、プログラム
CN103942568A (zh) * 2014-04-22 2014-07-23 浙江大学 一种基于无监督特征选择的分类方法
CN106127247A (zh) * 2016-06-21 2016-11-16 广东工业大学 基于多任务多示例支持向量机的图像分类方法
CN106250870A (zh) * 2016-08-16 2016-12-21 电子科技大学 一种联合局部和全局相似性度量学习的行人再识别方法
US20180075370A1 (en) * 2016-09-09 2018-03-15 Nec Laboratories America, Inc. Mining non-linear dependencies via a neighborhood mixture model
WO2018100668A1 (en) * 2016-11-30 2018-06-07 Nec Corporation Image processing device, image processing method, and image processing program
CN106845397A (zh) * 2017-01-18 2017-06-13 湘潭大学 一种基于相似度度量的人脸确认方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
《A Metric Learning perapective of SVM: on the relation of LMNN and SVM》;Huyen Do等;《proceedings of the Fifteenth International Conference on Artificial Intelligence and Statistics》;20120423;第308-317页 *
《Learning Similarity Metric with SVM》;Xiaoqiang Zhu等;《WCCI 2012 IEEE World Congress on Computational Intelligence》;20120615;第1-8页 *
《基于SVM 的多示例多标签主动学习》;李杰龙等;《计算机工程与设计》;20160116;第37卷(第1期);第254-258页 *
《融合距离度量学习和SVM的图像匹配算法》;陈开志等;《小型微型计算机系统》;20150615;第36卷(第6期);第1353-1357页 *

Also Published As

Publication number Publication date
CN109165673A (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
CN109165673B (zh) 基于度量学习和多示例支持向量机的图像分类方法
CN110909820B (zh) 基于自监督学习的图像分类方法及系统
Wang et al. Beyond frame-level CNN: saliency-aware 3-D CNN with LSTM for video action recognition
Cui et al. Fine-grained categorization and dataset bootstrapping using deep metric learning with humans in the loop
Chong et al. Simultaneous image classification and annotation
CN107943856A (zh) 一种基于扩充标记样本的文本分类方法及系统
Shetty et al. Segmentation and labeling of documents using conditional random fields
Davari et al. GMM-based synthetic samples for classification of hyperspectral images with limited training data
CN108345866B (zh) 一种基于深度特征学习的行人再识别方法
CN108154156B (zh) 基于神经主题模型的图像集成分类方法及装置
CN112364791B (zh) 一种基于生成对抗网络的行人重识别方法和系统
CN107358172B (zh) 一种基于人脸朝向分类的人脸特征点初始化方法
CN113657267A (zh) 一种半监督行人重识别模型、方法和装置
WO2021243947A1 (zh) 对象再识别方法及装置、终端和存储介质
CN111832573A (zh) 一种基于类激活映射和视觉显著性的图像情感分类方法
CN111241933A (zh) 一种基于通用对抗扰动的养猪场目标识别方法
CN110765285A (zh) 基于视觉特征的多媒体信息内容管控方法及系统
CN110717401A (zh) 年龄估计方法及装置、设备、存储介质
CN115439715A (zh) 基于反标签学习的半监督少样本图像分类学习方法及系统
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
CN114048314A (zh) 一种自然语言隐写分析方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN115797642A (zh) 基于一致性正则化与半监督领域自适应图像语义分割算法
CN109145749B (zh) 一种跨数据集的面部表情识别模型构建及识别方法
CN110929013A (zh) 一种基于bottom-up attention和定位信息融合的图片问答实现方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant