CN110210515A - 一种图像数据多标签分类方法 - Google Patents

一种图像数据多标签分类方法 Download PDF

Info

Publication number
CN110210515A
CN110210515A CN201910339785.8A CN201910339785A CN110210515A CN 110210515 A CN110210515 A CN 110210515A CN 201910339785 A CN201910339785 A CN 201910339785A CN 110210515 A CN110210515 A CN 110210515A
Authority
CN
China
Prior art keywords
label
vector
indicate
image
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910339785.8A
Other languages
English (en)
Other versions
CN110210515B (zh
Inventor
陈刚
谌晨
王皓波
胡天磊
陈珂
寿黎但
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201910339785.8A priority Critical patent/CN110210515B/zh
Publication of CN110210515A publication Critical patent/CN110210515A/zh
Application granted granted Critical
Publication of CN110210515B publication Critical patent/CN110210515B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种图像数据多标签分类方法。对输入图像进行分解,利用神经网络提取特征的高次相关性,对标签数据进行分解,利用神经网络提取标签的高次相关性,采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。本发明解决了图像数据前人工作不能同时提取标签的二次相关性和多次相关性的问题,降低了由于图像数据太过稀疏带来的预测困难,提高了多标签分类的准确性。

Description

一种图像数据多标签分类方法
技术领域
本发明涉及机器学习领域中的神经网络,因子分解机,多标签分类方法。
背景技术
随着人工智能的快速发展,单标签分类是最著名的机器学习问题之一,其中每个实例与单个标签相关联。然而,在许多真实世界的应用中,一个实例可能与多个标签相关联。例如,一条新闻可能是关于财务和政治,一个视频可能是关于政府和政策的,一张图片可能包含海滩和树木。因此,多标签分类是个很重要的研究领域。
目前,人们已经对多标签分类有了一定研究,提出了许多方法。多标签分类最关键的挑战在于如何学习标签之间的关联性。为此,人们提出了提取一次相关性,二次相关性和多次相关性。但是目前的方法并不能同时提取标签的二次相关性和多次相关性。
发明内容
为了解决背景技术中存在的问题,本发明提出了一种图像数据多标签分类方法。
本发明所采用的技术方案如下:
步骤一是对输入图像进行分解:对输入图像处理获得图像特征集合,建立输入空间,再将图像特征集合中每个图像特征向量进行两两乘积并求和得到图像分解向量;
步骤一对输入图像进行分解提取到特征的二次相关性,从而提升分类准确性。
步骤二是利用神经网络提取特征的高次相关性:将步骤一得到的图像分解向量输入到包含多层全连接层的神经网络中得到输入图像的特征码;
通过步骤一和步骤二,把输入图像映射到了一个网络隐空间,并得到了输入图像的特征码。这个特征码既包含了输入图像的二次相关性,也包含了输入图像的高次相关性。
步骤三是对标签数据进行分解:对已知的标签数据(每幅图像均已经设置了标签)处理得到标签特征集合,建立标签空间,再将标签特征集合中每个标签特征向量进行两两乘积并求和得到标签分解向量;
通过步骤三对标签数据进行分解提取到标签的二次相关性,从而提升分类准确性。
步骤四是利用神经网络提取标签的高次相关性:将步骤三得到的标签分解向量输入到包含多层全连接层的神经网络中得到标签数据的特征码;
通过步骤三和步骤四,把标签数据映射到了一个网络隐空间,并得到了标签数据的特征码。这个特征码既包含了标签数据的二次相关性,也包含了标签数据的高次相关性。
步骤五是解码:采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;
本发明的包含多层全连接层的神经网络能很好地将隐空间特征映射到标签空间上,从而很好地进行预测。
本发明的损失函数包含三部分:输入图像和标签数据在隐空间的特征码之间的平方损失,预测标签和真实标签的平方损失和正则项。通过平方损失进行训练,输入图像和标签数据可以很好地映射到同一隐空间,并且在隐空间的特征码会非常接近,预测标签和真实标签也会非常接近。最后加入一项正则项,可降低过拟合带来的负面影响,提高分类准确率。
步骤六是检测:构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。
本发明实施对象为图像数据的处理,例如图像中目标对象的分类。
步骤一:由输入图像获得图像向量x=[x1,x2,...,xp]T得到图像特征集合Vemb={v1x1,v2x2,...,vpxp},其中x1,x2,...,xp分别表示输入图像中各个像素点的灰度值,x∈Rp,Rp表示p维的实数空间作为输入空间,p表示输入图像中的像素点总数;vi表示第i个图像特征,vi∈Rt,Rt表示t维的实数空间;t表示特征维度;vixi表示第i个图像特征对于输入图像的图像特征向量;然后将图像特征集合Vemb中每个图像特征向量进行两两乘积并求和得到图像分解向量gx
其中,表示向量的对应项相乘,j和k分别表示输入图像中的像素点的序数;
步骤二:将步骤一得到的图像分解向量gx输入到包含L+1层全连接层的第一神经网络中,第一神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层以外的其他每个全连接层之后均设置有一个激活函数:
sx1=σx1(Wx1gx+bx1)
sx2=σx2(Wx2sx1+bx2)
......
sxL=σxL(WxLsxL-1+bxL)
cx=WxosxL+bxo
其中,sxi,Wxi,bxi,σxi分别是第一神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cx表示输入图像x的特征码,cx∈Rt,Rt为维度k的实数空间作为隐空间;Wxo表示第一神经网络中输出层的权重矩阵,bxo表示第一神经网络中输出层的偏差向量;
步骤三:由已知的标签数据获得标签向量y=[y1,y2,...,yq]T得到标签特征集合Uemb={u1y1,u2y2,...,uqyq},其中y1,y2,...,yq分别表示标签数据中每个图像标签的分类值,y∈Rq,Rq表示q维的实数空间作为标签空间,q表示标签数据中的标签分类总数;ui表示第i个标签特征,ui∈Rt,Rt表示t维的实数空间;t表示特征维度;uiyi表示第i个标签特征对于标签数据的标签特征向量;然后将标签特征集合Uemb中每个标签特征向量进行两两乘积并求和得到标签分解向量gy
其中,表示向量的对应项相乘,e和r分别表示标签数据中的标签分类的序数;
步骤四:
将步骤一得到的标签分解向量gy输入到包含L+1层全连接层的第二神经网络中,第二神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层以外的其他每个全连接层之后均设置有一个激活函数:
sy1=σy1(Wy1gy+by1)
sy2=σy2(Wy2sy1+by2)
......
syL=σyL(WyLsyL-1+byL)
cy=WyosyL+byo
其中,syi,Wyi,byi,σyi分别是第二神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cy表示标签数据y的特征码,cy∈Rt,Rt为维度k的实数空间作为隐空间;Wyo表示第二神经网络中输出层的权重矩阵,byo表示第二神经网络中输出层的偏差向量;
步骤五:用包含Ld+1层全连接层的第三神经网络对输入图像x的特征码cx处理,解码到标签空间,第三神经网络是仅由Ld层全连接层结合一个输出层连接构成,其中除了最后一层全连接层(输出层)以外的其他每个全连接层之后均设置有一个激活函数:
h1=η1Wd1gx+bd1)
h2=η2(Wd2h1+bd2)
......
其中,hi,Wdi,bdi,ηi分别是第三神经网络中的第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数,Ld表示神经网络的层数;表示预测的标签输出向量;Wxo表示三神经网络中输出层的权重矩阵,bxo表示三神经网络中输出层的偏差向量;
步骤六:建立以下损失函数甲:
其中,θ表示训练参数,由上述所有图像特征和所有标签特征以及三个神经网络中的权重矩阵、偏差向量构成了训练参数,Θ是所有训练参数的集合,||·||表示向量的二阶范数或矩阵的Frobenius范数,λ是可调权重参数;ΨD表示图像向量x和标签向量y的特征码之间的平方损失函数,ΨE表示标签输出向量和标签向量y之间的平方损失函数,N是训练数据的数量;
本发明图像处理中的特征数据和标签数据同时映射到一个相同的数据隐空间,提取了特征和标签的相关性,特征之间的两两相关性和高次相关性,标签之间的两两相关性和高次相关性,降低了由于数据太过稀疏带来的预测困难,提高了多标签分类的准确性。
本发明具有的有益效果是:
本发明解决了图像数据前人工作不能同时提取标签的二次相关性和多次相关性的问题,采用计算机处理方式将图像处理中的特征数据和标签数据同时映射到一个相同的数据隐空间,提取了特征和标签的相关性,特征之间的两两相关性和高次相关性,标签之间的两两相关性和高次相关性,降低了由于图像数据太过稀疏带来的预测困难,提高了多标签分类的准确性。
附图说明
图1是一个多标签分类的例子。
图2是本发明方法的模型结构。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
本发明实施例如下:
具体实施的数据集的标签集合为{植物,鸟,人物,天空,云,草地,山脉},图1是该数据集的一个样本。该样本的输入图像x则为图像的像素点。能够看出该样本的标签是{鸟,天空,云},则该图的标签为y=[0,1,0,1,1,0,0]。
图2展示了本发明的模型结构。
步骤一:
由输入图像获得图像向量x=[x1,x2,...,xp]T得到图像特征集合Vemb={v1x1,v2x2,...,vpxp},其中x1,x2,...,xp分别表示输入图像中各个像素点的灰度值,x∈Rp,Rp表示p维的实数空间作为输入空间,p表示输入图像中的像素点总数;vi表示第i个图像特征,vi∈Rt,Rt表示t维的实数空间;t表示特征维度,为一个超参数;vixi表示第i个图像特征对于输入图像的图像特征向量;第i个图像特征是由参数为(0,1)的正态分布随机初始化,并通过训练获得。
再将图像特征集合Vemb中每个图像特征向量进行两两乘积并求和得到图像分解向量gx
其中,表示向量的对应项相乘,j和k分别表示输入图像中的像素点的序数。
本发明是将向量的对应项相乘,而不是常规的向量点积处理,这样分解能提取特征的二次相关性,从而提升分类准确性。
步骤二:
将步骤一得到的图像分解向量gx输入到包含L+1层全连接层的第一神经网络中,第一神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层(输出层)以外的其他每个全连接层之后均设置有一个激活函数,即第一层~第L层全连接层均设置有激活函数,仅L+1层全连接层未设置有激活函数:
sx1=σx1(Wx1gx+bx1)
sx2=σx2(Wx2sx1+bx2)
......
sxL=σxL(WxLsxL-1+bxL)
cx=WxosxL+bxo
其中,sxi,Wxi,bxi,σxi分别是第一神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cx表示输入图像x的特征码,是输入图像在隐空间的表达向量,cx∈Rt,Rt为维度k的实数空间作为隐空间;Wxo表示第一神经网络中输出层的权重矩阵,bxo表示第一神经网络中输出层的偏差向量;
通过步骤一和步骤二,把输入图像的图像特征向量x映射到了一个隐空间,并得到了x的特征码cx,这个特征码cx既包含了x的二次相关性,也包含了x的高次相关性。
步骤三:
由已知的标签数据获得标签向量y=[y1,y2,...,yq]T得到标签特征集合Uemb={u1y1,u2y2,...,uqyq},其中y1,y2,...,yq分别表示标签数据中每个图像标签的分类值,y∈Rq,Rq表示q维的实数空间作为标签空间,q表示标签数据中的标签分类总数;ui表示第i个标签特征,ui∈Rt,Rt表示t维的实数空间;t表示特征维度,为一个超参数;uiyi表示第i个标签特征对于标签数据的标签特征向量;第i个标签特征是由参数为(0,1)的正态分布随机初始化,并通过训练获得。
再将标签特征集合Uemb中每个标签特征向量进行两两乘积并求和得到标签分解向量gy
其中,表示向量的对应项相乘,e和r分别表示标签数据中的标签分类的序数;
本发明是将向量的对应项相乘,而不是常规的向量点积处理,这样分解能提取标签特征的二次相关性,从而提升分类准确性。
步骤四:将步骤一得到的标签分解向量gy输入到包含L+1层全连接层的第二神经网络中,第二神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层(输出层)以外的其他每个全连接层之后均设置有一个激活函数,即第一层~第L层全连接层均设置有激活函数,仅L+1层全连接层未设置有激活函数:
sy1=σy1(Wy1gy+by1)
sy2=σy2(Wy2sy1+by2)
......
syL=σyL(WyLsyL-1+byL)
cy=WyosyL+byo
其中,syi,Wyi,byi,σyi分别是第二神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cy表示标签数据y的特征码,是标签数据在隐空间的表达向量,cy∈Rt,Rt为维度k的实数空间作为隐空间;Wyo表示第二神经网络中输出层的权重矩阵,byo表示第二神经网络中输出层的偏差向量;
通过步骤一和步骤二,把标签数据的标签向量y映射到了一个隐空间,并得到了y的特征码cy,这个特征码cy既包含了y的二次相关性,也包含了y的高次相关性。
步骤五:用包含Ld+1层全连接层的第三神经网络对输入图像x的特征码cx处理,解码到标签空间,第三神经网络是仅由Ld层全连接层结合一个输出层连接构成,其中除了最后一层全连接层(输出层)以外的其他每个全连接层之后均设置有一个激活函数,即第一层~第Ld层全连接层均设置有激活函数,仅Ld+1层全连接层未设置有激活函数:
h1=η1Wd1gx+bd1)
h2=η2(Wd2h1+bd2)
......
其中,hi,Wdi,bdi,ηi分别是第三神经网络中的第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数,Ld表示神经网络的层数;表示预测的标签输出向量;Wxo表示三神经网络中输出层的权重矩阵,bxo表示三神经网络中输出层的偏差向量;
通过步骤一和步骤二,把输入图像的图像向量x映射到了一个隐空间,并得到了x的特征码cx,这个特征码cx既包含了x的二次相关性,也包含了x的高次相关性。
步骤六:建立以下损失函数Ψ:
其中,θ表示训练参数,由上述所有图像特征和所有标签特征以及三个神经网络中的权重矩阵、偏差向量构成了训练参数,即图像特征v1,v2,...,vp和图像特征u1,u2,...,up以及第一神经网络中所有全连接层的权重矩阵和偏差向量Wxi,bxi、第二神经网络中所有全连接层的权重矩阵和偏差向量Wyi,byi、第三神经网络中所有全连接层的权重矩阵和偏差向量Wdi,bdi,Θ是所有训练参数的集合,||·||表示向量的二阶范数或矩阵的Frobenius范数,λ是可调权重参数;ΨD表示图像向量x和标签向量y的特征码之间的平方损失函数,ΨE表示标签输出向量和标签向量y之间的平方损失函数,N是训练数据的数量;
损失函数最后一项为正则项,而且本发明不仅仅是正则项,而是高次正则项,在最后加入一项高次正则项能更好地降低过拟合带来的负面影响,提高分类准确率。
构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。
通过平方损失进行训练,x和y可以很好地映射到同一隐空间,并且x和y在隐空间中的特征码会非常接近。通过平方损失进行训练,通过x预测的标签输出向量与真实的标签向量y会非常接近。
通过参数为(0,1)的正态分布对各个训练参数进行随机初始化,然后采用随机梯度下降方法最小化最终损失函数Ψ,训练求解获得最优的训练参数,然后将待测试的图像数据输入到训练后的模型中进行预测,输出获得预测的标签输出向量作为标签结果,实现多标签分类。
步骤七:用测试样本测试该模型的。
把测试数据的像素值作为输入图像x,输入到模型中,最后得到预测标签再将预测标签四舍五入到0或1,并与真实标签进行比较,以此来评估的算法。
图1是测试样本,将图1的像素值作为输入图像x,输入到模型中。假设得到预测标签再对预测标签四舍五入得到最后的预测标签为已知图1的真实标签为y=[0,1,0,1,1,0,0]。再拿预测标签和真实标签进行对比,发现预测标签与真实标签完全一致,说明的预测是准确的。
由此可见,本发明解决了图像数据前人工作不能同时提取标签的二次相关性和多次相关性的问题,提高了图像多标签数据的分类准确性。

Claims (2)

1.一种图像数据多标签分类方法,其特征在于:本方法的步骤如下:
步骤一是对输入图像进行分解:对输入图像处理获得图像特征集合,建立输入空间,再将图像特征集合中每个图像特征向量进行两两乘积并求和得到图像分解向量;
步骤二是利用神经网络提取特征的高次相关性:将步骤一得到的图像分解向量输入到包含多层全连接层的神经网络中得到输入图像的特征码;
步骤三是对标签数据进行分解:对已知的标签数据处理得到标签特征集合,建立标签空间,再将标签特征集合中每个标签特征向量进行两两乘积并求和得到标签分解向量;
步骤四是利用神经网络提取标签的高次相关性:将步骤三得到的标签分解向量输入到包含多层全连接层的神经网络中得到标签数据的特征码;
步骤五是解码:采用包含多层全连接层的神经网络将输入图像的特征码从输入空间解码到标签空间;
步骤六是检测:构建损失函数,初始化训练参数,采用随机梯度下降方法最小化最终损失函数为目标,训练求解获得最优的训练参数;然后针对待测试的图像数据输入到训练后的模型中进行预测,输出获得标签结果,实现多标签分类。
2.根据权利要求1所述的一种图像数据多标签分类方法,其特征在于:方法具体如下:
步骤一:由输入图像获得图像向量x=[x1,x2,...,xp]T得到图像特征集合Vemb={v1x1,v2x2,...,vpxp},其中x1,x2,...,xp分别表示输入图像中各个像素点的灰度值,x∈Rp,Rp表示p维的实数空间作为输入空间,p表示输入图像中的像素点总数;vi表示第i个图像特征,vi∈Rt,Rt表示t维的实数空间;t表示特征维度;vixi表示第i个图像特征对于输入图像的图像特征向量;然后将图像特征集合Vemb中每个图像特征向量进行两两乘积并求和得到图像分解向量gx
其中,表示向量的对应项相乘,j和k分别表示输入图像中的像素点的序数;
步骤二:将步骤一得到的图像分解向量gx输入到包含L+1层全连接层的第一神经网络中,第一神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层以外的其他每个全连接层之后均设置有一个激活函数:
sx1=σx1(Wx1gx+bx1)
sx2=σx2(Wx2sx1+bx2)
……
SxL=σxL(WxLSxL-1+bxL)
cx=WxoSxL+bxo
其中,sxi,Wxi,bxi,σxi分别是第一神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cx表示输入图像x的特征码,cx∈Rt,Rt为维度k的实数空间作为隐空间;Wxo表示第一神经网络中输出层的权重矩阵,bxo表示第一神经网络中输出层的偏差向量;
步骤三:由已知的标签数据获得标签向量y=[y1,y2,...,yq]T得到标签特征集合Uemb={u1y1,u2y2,...,uqyq},其中y1,y2,...,yq分别表示标签数据中每个图像标签的分类值,y∈Rq,Rq表示q维的实数空间作为标签空间,q表示标签数据中的标签分类总数;ui表示第i个标签特征,ui∈Rt,Rt表示t维的实数空间;t表示特征维度;uiyi表示第i个标签特征对于标签数据的标签特征向量;然后将标签特征集合Uemb中每个标签特征向量进行两两乘积并求和得到标签分解向量gy
其中,表示向量的对应项相乘,e和r分别表示标签数据中的标签分类的序数;
步骤四:将步骤一得到的标签分解向量gy输入到包含L+1层全连接层的第二神经网络中,第二神经网络是仅由L层全连接层结合一个输出层连接构成,其中除了最后一层全连接层以外的其他每个全连接层之后均设置有一个激活函数:
sy1=σy1(Wy1gy+by1)
sy2=σy2(Wy2sy1+by2)
……
syL=σyL(WyLsyL-1+byL)
cy=WyosyL+byo
其中,syi,Wyi,byi,σyi分别是第二神经网络中第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数;cy表示标签数据y的特征码,cy∈Rt,Rt为维度k的实数空间作为隐空间;Wyo表示第二神经网络中输出层的权重矩阵,byo表示第二神经网络中输出层的偏差向量;
步骤五:用包含Ld+1层全连接层的第三神经网络对输入图像x的特征码cx处理,解码到标签空间,第三神经网络是仅由Ld层全连接层结合一个输出层连接构成,其中除了最后一层全连接层以外的其他每个全连接层之后均设置有一个激活函数:
h1=η1Wd1gx+bd1)
h2=η2(Wd2h1+bd2)
……
其中,hi,Wdi,bdi,ηi分别是第三神经网络中的第i个全连接层的输出向量、权重矩阵、偏差向量和Relu激活函数,Ld表示神经网络的层数;表示预测的标签输出向量;Wxo表示三神经网络中输出层的权重矩阵,bxo表示三神经网络中输出层的偏差向量;
步骤六:建立以下损失函数甲:
其中,θ表示训练参数,由上述所有图像特征和所有标签特征以及三个神经网络中的权重矩阵、偏差向量构成了训练参数,Θ是所有训练参数的集合,||·||表示向量的二阶范数或矩阵的Frobenius范数,λ是可调权重参数;ΨD表示图像向量x和标签向量y的特征码之间的平方损失函数,ΨE表示标签输出向量和标签向量y之间的平方损失函数,N是训练数据的数量。
CN201910339785.8A 2019-04-25 2019-04-25 一种图像数据多标签分类方法 Active CN110210515B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910339785.8A CN110210515B (zh) 2019-04-25 2019-04-25 一种图像数据多标签分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910339785.8A CN110210515B (zh) 2019-04-25 2019-04-25 一种图像数据多标签分类方法

Publications (2)

Publication Number Publication Date
CN110210515A true CN110210515A (zh) 2019-09-06
CN110210515B CN110210515B (zh) 2021-04-20

Family

ID=67786477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910339785.8A Active CN110210515B (zh) 2019-04-25 2019-04-25 一种图像数据多标签分类方法

Country Status (1)

Country Link
CN (1) CN110210515B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046949A (zh) * 2019-12-10 2020-04-21 东软集团股份有限公司 一种图像分类方法、装置及设备
CN111259938A (zh) * 2020-01-09 2020-06-09 浙江大学 基于流形学习和梯度提升模型的图片偏多标签分类方法
CN111382800A (zh) * 2020-03-11 2020-07-07 上海爱数信息技术股份有限公司 一种适用于样本分布不均衡的多标签多分类方法
CN111523578A (zh) * 2020-04-13 2020-08-11 北京推想科技有限公司 图像分类方法及装置、神经网络模型的训练方法及装置
CN111797910A (zh) * 2020-06-22 2020-10-20 浙江大学 一种基于平均偏汉明损失的多维标签预测方法
CN111797911A (zh) * 2020-06-22 2020-10-20 浙江大学 一种图像数据多标签分类方法
CN112151192A (zh) * 2020-10-22 2020-12-29 浙江大学 一种基于隐空间重投影的遗传代谢病筛查方法
CN112507958A (zh) * 2020-12-22 2021-03-16 成都东方天呈智能科技有限公司 不同人脸识别模型特征码的转换系统、方法及可读存储介质
CN113204659A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 多媒体资源的标签分类方法、装置、电子设备及存储介质
CN114139656A (zh) * 2022-01-27 2022-03-04 成都橙视传媒科技股份公司 一种基于深度卷积分析的图片归类方法及播控平台
WO2022052601A1 (zh) * 2020-09-10 2022-03-17 华为技术有限公司 神经网络模型的训练方法、图像处理方法及装置
CN115049814A (zh) * 2022-08-15 2022-09-13 聊城市飓风工业设计有限公司 采用神经网络模型的护眼灯智能调节方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982344A (zh) * 2012-11-12 2013-03-20 浙江大学 基于同时融合多视角特征及多标签信息的支持向量机分类方法
CN105608468A (zh) * 2015-12-18 2016-05-25 电子科技大学 一种基于流型矩阵补全的多标签分类方法
CN106650653A (zh) * 2016-12-14 2017-05-10 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于深度学习的人脸识别和年龄合成联合模型的构建方法
CN106895824A (zh) * 2017-01-24 2017-06-27 国网四川省电力公司检修公司 基于计算机视觉的无人机定位方法
CN108073677A (zh) * 2017-11-02 2018-05-25 中国科学院信息工程研究所 一种基于人工智能的多级文本多标签分类方法及系统
CN108319980A (zh) * 2018-02-05 2018-07-24 哈工大机器人(合肥)国际创新研究院 一种基于gru的递归神经网络多标签学习方法
US20180336683A1 (en) * 2017-05-18 2018-11-22 Mitsubishi Electric Research Laboratories, Inc. Multi-Label Semantic Boundary Detection System
CN109190482A (zh) * 2018-08-06 2019-01-11 北京奇艺世纪科技有限公司 多标签视频分类方法及系统、系统训练方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102982344A (zh) * 2012-11-12 2013-03-20 浙江大学 基于同时融合多视角特征及多标签信息的支持向量机分类方法
CN105608468A (zh) * 2015-12-18 2016-05-25 电子科技大学 一种基于流型矩阵补全的多标签分类方法
CN106650653A (zh) * 2016-12-14 2017-05-10 广东顺德中山大学卡内基梅隆大学国际联合研究院 基于深度学习的人脸识别和年龄合成联合模型的构建方法
CN106895824A (zh) * 2017-01-24 2017-06-27 国网四川省电力公司检修公司 基于计算机视觉的无人机定位方法
US20180336683A1 (en) * 2017-05-18 2018-11-22 Mitsubishi Electric Research Laboratories, Inc. Multi-Label Semantic Boundary Detection System
CN108073677A (zh) * 2017-11-02 2018-05-25 中国科学院信息工程研究所 一种基于人工智能的多级文本多标签分类方法及系统
CN108319980A (zh) * 2018-02-05 2018-07-24 哈工大机器人(合肥)国际创新研究院 一种基于gru的递归神经网络多标签学习方法
CN109190482A (zh) * 2018-08-06 2019-01-11 北京奇艺世纪科技有限公司 多标签视频分类方法及系统、系统训练方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CHIH-KUAN YEH 等: "Learning Deep Latent Spaces for Multi-Label Classification", 《ARXIV:1707.00418V1》 *
MIN-LING ZHANG 等: "Multilabel Neural Networks with Applications to", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING》 *
XIANGNAN HE 等: "Neural Factorization Machines for Sparse Predictive Analytics", 《ARXIV:1708.05027V1》 *
严良达 等: "基于联合子空间与多源适应学习的多标签视觉分类", 《西北师范大学学报》 *
李一松: "基于卷积神经网络的多光谱图像多标签场景分类", 《电子设计工程》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046949A (zh) * 2019-12-10 2020-04-21 东软集团股份有限公司 一种图像分类方法、装置及设备
CN111259938A (zh) * 2020-01-09 2020-06-09 浙江大学 基于流形学习和梯度提升模型的图片偏多标签分类方法
CN111259938B (zh) * 2020-01-09 2022-04-12 浙江大学 基于流形学习和梯度提升模型的图片偏多标签分类方法
CN111382800A (zh) * 2020-03-11 2020-07-07 上海爱数信息技术股份有限公司 一种适用于样本分布不均衡的多标签多分类方法
CN111382800B (zh) * 2020-03-11 2022-11-25 上海爱数信息技术股份有限公司 一种适用于样本分布不均衡的多标签多分类方法
CN111523578B (zh) * 2020-04-13 2021-07-23 推想医疗科技股份有限公司 图像分类方法及装置、神经网络模型的训练方法及装置
CN111523578A (zh) * 2020-04-13 2020-08-11 北京推想科技有限公司 图像分类方法及装置、神经网络模型的训练方法及装置
CN111797911A (zh) * 2020-06-22 2020-10-20 浙江大学 一种图像数据多标签分类方法
CN111797910B (zh) * 2020-06-22 2023-04-07 浙江大学 一种基于平均偏汉明损失的多维标签预测方法
CN111797911B (zh) * 2020-06-22 2024-02-09 浙江大学 一种图像数据多标签分类方法
CN111797910A (zh) * 2020-06-22 2020-10-20 浙江大学 一种基于平均偏汉明损失的多维标签预测方法
WO2022052601A1 (zh) * 2020-09-10 2022-03-17 华为技术有限公司 神经网络模型的训练方法、图像处理方法及装置
CN112151192B (zh) * 2020-10-22 2024-03-26 浙江大学 一种基于隐空间重投影的遗传代谢病筛查方法
CN112151192A (zh) * 2020-10-22 2020-12-29 浙江大学 一种基于隐空间重投影的遗传代谢病筛查方法
CN112507958B (zh) * 2020-12-22 2024-04-02 成都东方天呈智能科技有限公司 不同人脸识别模型特征码的转换系统及可读存储介质
CN112507958A (zh) * 2020-12-22 2021-03-16 成都东方天呈智能科技有限公司 不同人脸识别模型特征码的转换系统、方法及可读存储介质
CN113204659B (zh) * 2021-03-26 2024-01-19 北京达佳互联信息技术有限公司 多媒体资源的标签分类方法、装置、电子设备及存储介质
CN113204659A (zh) * 2021-03-26 2021-08-03 北京达佳互联信息技术有限公司 多媒体资源的标签分类方法、装置、电子设备及存储介质
CN114139656A (zh) * 2022-01-27 2022-03-04 成都橙视传媒科技股份公司 一种基于深度卷积分析的图片归类方法及播控平台
CN115049814B (zh) * 2022-08-15 2022-11-08 聊城市飓风工业设计有限公司 采用神经网络模型的护眼灯智能调节方法
CN115049814A (zh) * 2022-08-15 2022-09-13 聊城市飓风工业设计有限公司 采用神经网络模型的护眼灯智能调节方法

Also Published As

Publication number Publication date
CN110210515B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
CN110210515A (zh) 一种图像数据多标签分类方法
Murphy Probabilistic machine learning: an introduction
CN110472090B (zh) 基于语义标签的图像检索方法以及相关装置、存储介质
US8874432B2 (en) Systems and methods for semi-supervised relationship extraction
CN110222140A (zh) 一种基于对抗学习和非对称哈希的跨模态检索方法
CN110309331A (zh) 一种基于自监督的跨模态深度哈希检索方法
CN110532859A (zh) 基于深度进化剪枝卷积网的遥感图像目标检测方法
CN111554268A (zh) 基于语言模型的语言识别方法、文本分类方法和装置
CN111507378A (zh) 训练图像处理模型的方法和装置
CN108664632A (zh) 一种基于卷积神经网络和注意力机制的文本情感分类算法
Cheng et al. Sign: Spatial-information incorporated generative network for generalized zero-shot semantic segmentation
CN106227851A (zh) 基于深度卷积神经网络端对端的通过分层深度搜索的图像检索方法
CN109766469A (zh) 一种基于深度哈希学习优化的图像检索方法
CN108062421A (zh) 一种大规模图片多尺度语义检索方法
Yang et al. Meta captioning: A meta learning based remote sensing image captioning framework
CN113821668A (zh) 数据分类识别方法、装置、设备及可读存储介质
KR20200010672A (ko) 딥러닝을 이용한 스마트 상품 검색 방법 및 시스템
CN113822776A (zh) 课程推荐方法、装置、设备及存储介质
CN111191461B (zh) 一种基于课程学习的远程监督关系抽取方法
CN113641797A (zh) 数据处理方法、装置、设备、存储介质及计算机程序产品
Krasilenko et al. Modeling of biologically motivated self-learning equivalent-convolutional recurrent-multilayer neural structures (BLM_SL_EC_RMNS) for image fragments clustering and recognition
CN112182275A (zh) 一种基于多维度特征融合的商标近似检索系统和方法
CN115827954A (zh) 动态加权的跨模态融合网络检索方法、系统、电子设备
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
CN114170659A (zh) 一种基于注意力机制的面部情感识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant