CN112990377A - 视觉类别的发现方法及装置、电子设备、存储介质 - Google Patents

视觉类别的发现方法及装置、电子设备、存储介质 Download PDF

Info

Publication number
CN112990377A
CN112990377A CN202110497720.3A CN202110497720A CN112990377A CN 112990377 A CN112990377 A CN 112990377A CN 202110497720 A CN202110497720 A CN 202110497720A CN 112990377 A CN112990377 A CN 112990377A
Authority
CN
China
Prior art keywords
data
clustering
label
classification model
trained
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110497720.3A
Other languages
English (en)
Other versions
CN112990377B (zh
Inventor
秦永强
李素莹
敖川
纪双西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alnnovation Beijing Technology Co ltd
Original Assignee
Alnnovation Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alnnovation Beijing Technology Co ltd filed Critical Alnnovation Beijing Technology Co ltd
Priority to CN202110497720.3A priority Critical patent/CN112990377B/zh
Publication of CN112990377A publication Critical patent/CN112990377A/zh
Application granted granted Critical
Publication of CN112990377B publication Critical patent/CN112990377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请提供一种视觉类别的发现方法及装置、电子设备、计算机可读存储介质,方法包括:基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;对目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,指定条件为聚类结果以第一有标签数据的类别标签确定;以指定聚类算法对多个无标签数据进行聚类,确定聚类簇数;以聚类簇数对已训练的第一分类模型进行调整;其中,第一分类模型包括特征提取器;以调整后的第一分类模型对无标签数据进行预测,获得无标签数据的伪标签编号。本申请方案,消除了不合理的聚类,实现了新品视觉类别的发现。

Description

视觉类别的发现方法及装置、电子设备、存储介质
技术领域
本申请涉及图像处理技术领域,特别涉及一种视觉类别的发现方法及装置、电子设备、计算机可读存储介质。
背景技术
机器学习在图像分类任务上已经取得较为成功的应用和实践,但通常需要大量标注数据作为机器学习模型的训练集。在实际应用场景中,图像中要识别的类别会处于动态变化,短时间内要依靠人工对新类别进行标注几乎无法实现。比如,在零售产品识别场景中,超市或零售店每周甚至每天都会有大量新品、新包装引入,对于图像分类任务而言,新品或新包装均属于新的类别。
发明内容
本申请实施例的目的在于提供一种视觉类别的发现方法及装置、电子设备、计算机可读存储介质,用于发现图像中的目标类别,并可确定新类别。
一方面,本申请提供了一种视觉类别的发现方法,包括:
基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;
对所述目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,所述指定条件为聚类结果以第一有标签数据的类别标签确定;
以所述指定聚类算法对所述多个无标签数据进行聚类,确定聚类簇数;
以所述聚类簇数对已训练的第一分类模型进行调整;其中,所述第一分类模型包括所述特征提取器;
以调整后的第一分类模型对所述无标签数据进行预测,获得所述无标签数据的伪标签编号。
在一实施例中,在所述提取多个无标签数据和多个有标签数据的数据特征之前,所述方法还包括:
利用所述多个有标签数据对未训练的第二分类模型进行训练,获得已训练的第二分类模型;其中,所述未训练的第二分类模型包括经过初步训练的特征提取器和未训练的第二分类器头,所述已训练的第二分类模型包括已训练的第二分类器头和已训练的特征提取器。
在一实施例中,所述指定聚类算法包括多个子聚类算法;
所述以所述指定聚类算法对所述多个无标签数据进行聚类,包括:
针对每一子聚类算法对所述目标数据集中无标签数据和第二有标签数据对应数据特征的聚类结果,依据评估算法对所述聚类结果进行评估;
选择评估效果最好的子聚类算法对所述多个无标签数据的数据特征进行聚类。
在一实施例中,在所述以所述聚类簇数对已训练的第一分类模型进行调整之前,所述方法还包括:
根据多个无标签数据构建多个无标签数据对;其中,所述无标签数据对包括两个无标签数据;
通过经过初步训练的特征提取器提取所述无标签数据对中无标签数据的数据特征;
判断所述无标签数据对中两个无标签数据的数据特征是否匹配;
根据匹配结果为所述无标签数据对生成匹配标签;
依据携带所述匹配标签的无标签数据对,对未训练的第一分类模型进行训练,获得已训练的第一分类模型。
在一实施例中,所述数据特征为多维向量;
所述判断所述无标签数据对中两个无标签数据的数据特征是否匹配,包括:
针对所述无标签数据对中两个无标签数据的数据特征,分别选择所述数据特征最大的指定数量维度的元素,构成所述数据特征的比较参数;
判断两个无标签数据对应的比较参数之间的相似度是否达到预设相似度阈值;
如果是,确定所述无标签数据对中两个无标签数据的数据特征匹配。
在一实施例中,所述特征提取器通过如下方式训练得到:
以有标签数据集的有标签数据和所述无标签数据集的无标签数据作为训练数据;
提取所述训练数据的基础特征,作为所述训练数据的基础特征标签;
根据添加所述基础特征标签的多个训练数据,对所述特征提取器进行训练,获得经过初步训练的特征提取器。
在一实施例中,所述提取所述训练数据的基础特征,作为所述训练数据的基础特征标签,包括:
通过数据增强对所述训练数据进行随机旋转,获得所述训练数据的旋转方向信息,作为基础特征;
将所述旋转方向信息作为所述训练数据的基础特征标签。
另一方面,本申请还提供了一种视觉类别的发现装置,包括:
提取模块,用于基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;
第一聚类模块,用于对所述目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,所述指定条件为聚类结果以第一有标签数据的类别标签确定;
第二聚类模块,用于以所述指定聚类算法对所述多个无标签数据进行聚类,确定聚类簇数;
调整模块,用于以所述聚类簇数对已训练的第一分类模型进行调整;其中,所述第一分类模型包括所述特征提取器;
预测模块,用于以调整后的第一分类模型对所述无标签数据进行预测,获得所述无标签数据的伪标签编号。
进一步的,本申请还提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述视觉类别的发现方法。
另外,本申请还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述视觉类别的发现方法。
本申请方案中,经过已训练的特征提取器对有标签数据和无标签数据提取数据特征之后,以有标签数据的数据特征和无标签数据的数据特征构建目标数据集,并针对目标数据集进行半监督聚类,从而可以获得指定聚类算法;通过指定聚类算法对无标签数据的数据特征进行聚类后,可以以聚类簇数确定无标签数据中目标物体的类别总数,并可以此调整已训练的第一分类模型,从而可以根据调整后的第一分类模型对无标签数据进行分类;在有标签数据的基础上,可以得到关于视觉类别的先验知识作为聚类参考,从而消除了不合理的聚类,实现了新品视觉类别的发现。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。
图1为本申请一实施例提供的视觉类别的发现方法的应用场景示意图;
图2为本申请一实施例提供的电子设备的结构示意图;
图3为本申请一实施例提供的视觉类别的发现方法的流程示意图;
图4为本申请一实施例提供的第二分类模型训练方法的流程示意图;
图5为本申请一实施例提供的判断数据特征是否匹配的流程示意图;
图6为本申请一实施例提供的特征提取器训练方法的流程示意图;
图7为本申请一实施例提供的视觉类别的发现装置的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
图1为本申请实施例提供的视觉类别的发现方法的应用场景示意图。如图1所示,该应用场景包括客户端20和服务端30;客户端20可以是网络摄像机、手机、平板电脑等用户终端,用于向服务端30发送图像分类请求;服务端30可以是服务器、服务器集群或云计算中心,可以响应于对图像分类请求中的图像执行分类任务。
如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11和存储器12通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30,用于执行视觉类别的发现方法。
存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器11执行以完成本申请提供的视觉类别的发现方法。
参见图3,为本申请一实施例提供的视觉类别的发现方法的流程示意图,如图3所示,该方法可以包括以下步骤310-步骤350。
步骤310:基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集。
服务端可以通过特征提取器对无标签数据集中无标签数据进行特征提取,以及,对有标签数据集中有标签数据进行特征提取,获得每个无标签数据局的数据特征和每个有标签数据的数据特征。在一实施例中,数据特征可以是多维向量。
其中,无标签数据集是无标签数据的集合。无标签数据集可表示为U={xi,i=1,2,……,M},这里,xi表示一个无标签数据,M表示无标签数据集中无标签数据的总量。无标签数据可以是包含目标物体的图像数据,目标物体是需要被分类的物体;无标签数据未添加目标物体的类别标签。
有标签数据集是有标签数据的集合。有标签数据集可表示为L={(xi,yi),i=1,2,……,N,y∈{1,……,C}},这里,xi表示一个有标签数据,yi表示有标签数据的类别标签,N表示有标签数据集中有标签数据的总量,C表示有标签数据集中目标物体的类别总量。
无标签数据和有标签数据可以是相关场景的图像数据,示例性的,两者可以都是超市货架上商品的图像数据,或者,两者可以都是动物园中动物的图像数据。无标签数据中目标物体的类别可以与有标签数据中目标物体的类别不同。
服务端在提取出无标签数据的数据特征和有标签数据的数据特征之后,以基于多个数据特征构成目标数据集。
步骤320:对目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,指定条件为聚类结果以所述第一有标签数据的类别标签确定。
服务端可以将有标签数据划分为第一有标签数据和第二有标签数据。这里,第一有标签数据用于提供作为半监督聚类的聚类参考依据的类别标签,第二有标签数据是除第一有标签数据之外的有标签数据。
服务端可以以第一有标签数据的类别标签为依据,执行半监督K均值聚类处理。在聚类时,第一有标签数据的类别标签的类别数与聚类簇数相同,且携带相同类别标签的第一有标签数据被聚类至同一簇中。示例性的,有标签数据为超市货架图像,目标物体为商品,第一有标签数据的类别标签包括商品A、商品B和商品C的类别标签,则以上述类别标签为聚类参考依据执行半监督K均值聚类时,可以得到3个簇,且携带商品A的类别标签的第一有标签数据的数据特征被聚类至同一簇,携带商品B的类别标签的第一有标签数据的数据特征被聚类至同一簇,携带商品C的类别标签的第一有标签数据的数据特征被聚类至同一簇。
服务端在执行半监督聚类,并使得聚类结果满足上述指定条件时,可以保留聚类算法的算法参数,从而获得指定聚类算法。
步骤330:以指定聚类算法对多个无标签数据进行聚类,确定聚类簇数。
在获得指定聚类算法之后,针对无标签数据集中无标签数据的数据特征,服务端可以以指定聚类算法进行聚类处理,从而可以获得多个簇,并确定聚类簇数。该聚类簇数与无标签数据中目标物体的类别数相同。示例性的,服务端通过指定聚类算法对无标签数据的数据特征进行聚类后,可以得到7个簇,说明无标签数据中存在7类目标物体。
步骤340:以聚类簇数对已训练的第一分类模型进行调整;其中,第一分类模型包括特征提取器。
第一分类模型包括特征提取器和第一分类器头(分类器的head)。第一分类模型通过无标签数据训练,在调整前无法实现对无标签数据准确的分类。
第一分类模型的第一分类器头的全连接层指示的目标物体类别数可能错误,服务端可以依据聚类簇数为第一分类模型生成新的全连接层,并替换第一分类器头中原有的全连接层。
步骤350:以调整后的第一分类模型对无标签数据进行预测,获得无标签数据的伪标签编号。
服务端可以将无标签数据集中的无标签数据输入经过调整的第一分类模型,从而得到第一分类模型输出的伪标签编号。
其中,伪标签编号用于表示无标签数据中目标物体的类别。在一实施例中,伪标签编号可以是多维向量,多维向量的维度是无标签数据中目标物体的类别总数,每一维度的元素与一种类别对应,表示目标物体属于该类别的置信度,以最大置信度对应的类别作为预测类别信息指示的类别。伪标签编号不具有语义信息,换而言之,伪标签编号并不指示实际的类别,而只用于相互区分。
示例性的,无标签数据为超市场景的图像数据。无标签数据包含目标物体E品牌泡面、F品牌饼干、G品牌薯片,经过调整的第一分类模型可以对图像数据进行预测,获得伪标签编号。第一分类模型可以输出3种伪标签编号,但伪标签编号并不表示上述E品牌泡面、F品牌饼干或G品牌薯片任意一种类别的具体含义。
通过上述措施,对于无标签数据中同属一类的目标物体,第一分类模型可以输出同一类伪标签编号,消除了很多歧义和不合理的聚类,实现新品类视觉类别的发现。
在一实施例中,服务端在执行上述视觉类别的发现方法之前,可以先训练出用于执行步骤310的特征提取器。这里,特征提取器可以在第二分类模型中经过微调。第二分类模型包括特征提取器和第二分类器头。第二分类器头可以包括全连接层和softmax层。
服务端可以获取经过初步训练的特征提取器,该特征提取器可以用于提取图像数据的低层特征。服务端可以在该特征提取器的基础上增加未训练的第二分类器头,构成未训练的第二分类模型。
服务端可以利用多个有标签数据对未训练的第二分类模型进行训练,获得已训练的第二分类模型。服务端可以将有标签数据输入未训练的第二分类模型,获得第二分类模型输出的预测类别信息。服务端可以依据交叉熵损失评估预测类别信息和类别标签之间的差距,进而调整第二分类模型的网络参数。经过多次迭代,当损失函数的函数值趋于稳定时,可认定第二分类模型收敛,获得已训练的第二分类模型。
训练第二分类模型的损失函数可通过如下公式(1)来表示:
Figure P_210506142320001
(1)
其中,Lce表示损失函数的函数值;N表示用于训练的有标签数据的总量;yi表示第i个有标签数据的类别标签;ηl表示第一分类器头;zi l表示通过特征提取器从第i个有标签数据中提取的数据特征。
在训练第二分类模型的过程中,特征提取器的参数经过微调,从而得到已训练的特征提取器。
在一实施例中,服务端在执行步骤320时,可以获得多组满足指定条件的算法参数,换而言之,可以得到多个聚类算法。这里,将多个聚类算法称为指定聚类算法的子聚类算法。
服务端在执行步骤320时,已经通过每一子聚类算法对目标数据集中的无标签数据的数据特征和有标签数据的数据特征进行聚类。针对每一子聚类算法对目标数据集中的无标签数据和第二有标签数据对应数据特征的聚类结果,依据评估算法对聚类结果进行评估。
其中,评估算法可以包括平均聚类准确率(Average Clustering Accuracy,ACC)算法、聚类有效性指标(Cluster Validity Index,CVI)算法。
对于第二有标签数据的数据特征的聚类结果,服务端可以通过聚类准确率算法来评估,该算法可通过如下公式(2)来表示:
Figure P_210506142320002
(2)
其中,N表示第二有标签数据的总量;yi表示第i个第二有标签数据的类别标签;
Figure M_210506142320001
表示第i个有标签数据所在簇的簇中心的类别标签。
在聚类结果中,对于任一第二有标签数据的数据特征,如果该第二有标签数据的类别标签与数据特征所在簇的簇中心数据特征的类别标签相同,该第二有标签数据对应的数值为1,否则为0;累加所有第二有标签数据对应的数值,并除以第二有标签数据的总量,可以获得聚类准确度算法的结果。
对于无标签数据的聚类结果,服务端可以通过聚类有效性指标算法来评估,该算法可通过如下公式(3)来表示:
Figure P_210506142320003
(3)
其中,x表示一个数据点(无标签数据的数据特征);a(x)是x与所在簇内其它数据点欧式距离的平均值;b(x)是x与其它簇内各数据点最近的距离。
服务端可以比较子聚类算法对应的两种评估算法的评估效果,确定评估效果最好的子聚类算法。服务端可以选择评估效果最好的子聚类算法执行步骤330,对无标签数据的数据特征进行聚类。
在一实施例中,服务端在执行步骤340之前,可以先通过无标签数据训练得到第一分类模型。服务端可以根据无标签数据之间的相似性作为监督信号进行训练。
参见图4,为本申请一实施例提供的第二分类模型训练方法的流程示意图,如图4所示,该方法可以包括以下步骤410-步骤450。
步骤410:根据多个无标签数据构建多个无标签数据对;其中,无标签数据对包括两个无标签数据。
服务端可以从多个无标签数据中随机选择两个无标签数据,构建无标签数据对,从而获得多个无标签数据对。无标签数据对可表示为(xi u,xj u),xi u和xj u分别表示一个无标签数据。
步骤420:通过经过初步训练的特征提取器提取无标签数据对中无标签数据的数据特征。
服务端通过经过初步训练的特征提取器,提取无标签数据对中无标签数据的数据特征。无标签数据对对应的数据特征可表示为(zi u,zj u),zi u表示xi u的数据特征,zj u表示xj u的数据特征。
步骤430:判断无标签数据对中两个无标签数据的数据特征是否匹配。
步骤440:根据匹配结果为无标签数据对生成匹配标签。
这里,数据特征匹配指两个数据特征的相似度高。匹配标签包括真标签和伪标签,真标签表示两个数据特征匹配,伪标签表示两个数据特征不匹配。
针对任一无标签数据对,服务端可以判断两个无标签数据的数据特征是否匹配。如果两者匹配,可认为两个无标签数据中包含同一类目标物体;否则,认为两个无标签数据中包含的目标物体不同。
服务端可以根据匹配结果为无标签数据对生成匹配标签。示例性的,真标签可以表示为sij=1,伪标签可以表示为sij=0。
步骤450:依据携带匹配标签的无标签数据对,对未训练的第一分类模型进行训练,获得已训练的第一分类模型。
服务端可以利用多个携带匹配标签的无标签数据对,对未训练的第一分类模型进行训练。经过多次迭代,当损失函数的函数值趋于稳定时,可认定第一分类模型收敛,获得已训练的第一分类模型。
Figure P_210506142320004
其中,Lbce表示损失函数的函数值;M表示无标签数据对的总量;sij表示第i个无标签数据与第j个无标签数据之间的匹配标签;ηu表示第一分类器头;zi u表示通过特征提取器从第i个无标签数据中提取的数据特征;zj u表示通过特征提取器从第j个无标签数据中提取的数据特征。
在一实施例中,图5为本申请一实施例提供的判断数据特征是否匹配的流程示意图,如图5所示,服务端在判断两个数据特征是否匹配时,可以执行如下步骤431-步骤433。
步骤431:针对无标签数据对中两个无标签数据的数据特征,分别选择数据特征最大的指定数量维度的元素,构成数据特征的比较参数。
其中,比较参数用于判断两个数据特征是否匹配。
无标签数据的数据特征可以是多维向量,针对任一数据特征,服务端可以从中选择最大的指定数量维度的元素,并以从大到小顺序排列,构成比较参数。这里,指定数量可以是经验值,示例性的,指定数量为10,多维向量是20维向量,则可从20维向量中选择最大的10个元素,构成比较参数。
步骤432:判断两个无标签数据对应的比较参数之间的相似度是否达到预设相似度阈值。
步骤433:如果是,确定无标签数据对中两个无标签数据的数据特征匹配。
这里,相似度阈值可以是经验值,用于筛选近似的比较参数。
针对两个比较参数,服务端可以逐个元素比对两者是否一致,从而确定出两者的相似度。示例性的,比较参数有10个元素,两个比较参数之间有8个元素相同,则相似度为80%。
一方面,两个比较参数之间的相似度未达到相似度阈值,则可以确定无标签数据对中两个无标签数据不匹配。另一方面,两个比较参数之间的相似度达到相似度阈值,则可以确定无标签数据对中两个无标签数据匹配。
在一实施例中,服务端在训练第一分类模型和第二分类模型之前,首先可以对特征提取器进行初步训练。参见图6,为本申请一实施例提供的特征提取器训练方法的流程示意图,如图6所示,该方法可以包括如下步骤610-步骤630。
步骤610:以有标签数据集的有标签数据和无标签数据集的无标签数据作为训练数据。
服务端在训练特征提取器时,可以将有标签数据和无标签数据均作为训练数据,构成训练数据集。
步骤620:提取训练数据的基础特征,作为训练数据的基础特征标签。
步骤630:根据添加基础特征标签的多个训练数据,对特征提取器进行训练,获得经过初步训练的特征提取器。
服务端可以从每一训练数据中提取基础特征,用以作为训练特征提取器的监督信号。这里,基础特征可以是训练数据中各像素的像素值、经过旋转的训练数据的旋转角度等。服务端可以将提取到的基础特征作为训练数据的基础特征标签。
服务端可以利用携带基础特征标签的训练数据,对特征提取器进行自监督训练((Self-Supervised Learning)),获得经过初步训练的特征提取器。
在一实施例中,服务端在执行步骤620时,可以通过数据增强对训练数据进行随机旋转,获得训练数据的旋转方向信息,作为基础特征,并将旋转方向信息作为训练数据的基础特征标签。
针对任一训练数据(图像数据),服务端可将训练数据随机旋转90度、180度或270度,并将该训练数据的旋转方向信息作为该训练数据的基础特征标签。
图7是本发明一实施例的一种视觉类别的发现装置,如图7所示,该装置可以包括:
提取模块710,用于基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;
第一聚类模块720,用于对所述目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,所述指定条件为聚类结果以第一有标签数据的类别标签确定;
第二聚类模块730,用于以所述指定聚类算法对所述多个无标签数据进行聚类,确定聚类簇数;
调整模块740,用于以所述聚类簇数对已训练的第一分类模型进行调整;其中,所述第一分类模型包括所述特征提取器;
预测模块750,用于以调整后的第一分类模型对所述无标签数据进行预测,获得所述无标签数据的伪标签编号。
上述装置中各个模块的功能和作用的实现过程具体详见上述视觉类别的发现方法中对应步骤的实现过程,在此不再赘述。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (10)

1.一种视觉类别的发现方法,其特征在于,包括:
基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;
对所述目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,所述指定条件为聚类结果以第一有标签数据的类别标签确定;
以所述指定聚类算法对所述多个无标签数据进行聚类,确定聚类簇数;
以所述聚类簇数对已训练的第一分类模型进行调整;其中,所述第一分类模型包括所述特征提取器;
以调整后的第一分类模型对所述无标签数据进行预测,获得所述无标签数据的伪标签编号。
2.根据权利要求1所述的方法,其特征在于,在所述提取多个无标签数据和多个有标签数据的数据特征之前,所述方法还包括:
利用所述多个有标签数据对未训练的第二分类模型进行训练,获得已训练的第二分类模型;其中,所述未训练的第二分类模型包括经过初步训练的特征提取器和未训练的第二分类器头,所述已训练的第二分类模型包括已训练的第二分类器头和已训练的特征提取器。
3.根据权利要求1所述的方法,其特征在于,所述指定聚类算法包括多个子聚类算法;
所述以所述指定聚类算法对所述多个无标签数据进行聚类,包括:
针对每一子聚类算法对所述目标数据集中无标签数据和第二有标签数据对应数据特征的聚类结果,依据评估算法对所述聚类结果进行评估;
选择评估效果最好的子聚类算法对所述多个无标签数据的数据特征进行聚类。
4.根据权利要求1所述的方法,其特征在于,在所述以所述聚类簇数对已训练的第一分类模型进行调整之前,所述方法还包括:
根据多个无标签数据构建多个无标签数据对;其中,所述无标签数据对包括两个无标签数据;
通过经过初步训练的特征提取器提取所述无标签数据对中无标签数据的数据特征;
判断所述无标签数据对中两个无标签数据的数据特征是否匹配;
根据匹配结果为所述无标签数据对生成匹配标签;
依据携带所述匹配标签的无标签数据对,对未训练的第一分类模型进行训练,获得已训练的第一分类模型。
5.根据权利要求4所述的方法,其特征在于,所述数据特征为多维向量;
所述判断所述无标签数据对中两个无标签数据的数据特征是否匹配,包括:
针对所述无标签数据对中两个无标签数据的数据特征,分别选择所述数据特征最大的指定数量维度的元素,构成所述数据特征的比较参数;
判断两个无标签数据对应的比较参数之间的相似度是否达到预设相似度阈值;
如果是,确定所述无标签数据对中两个无标签数据的数据特征匹配。
6.根据权利要求2或4所述的方法,其特征在于,所述特征提取器通过如下方式训练得到:
以有标签数据集的有标签数据和无标签数据集的无标签数据作为训练数据;
提取所述训练数据的基础特征,作为所述训练数据的基础特征标签;
根据添加所述基础特征标签的多个训练数据,对所述特征提取器进行训练,获得经过初步训练的特征提取器。
7.根据权利要求6所述的方法,其特征在于,所述提取所述训练数据的基础特征,作为所述训练数据的基础特征标签,包括:
通过数据增强对所述训练数据进行随机旋转,获得所述训练数据的旋转方向信息,作为基础特征;
将所述旋转方向信息作为所述训练数据的基础特征标签。
8.一种视觉类别的发现装置,其特征在于,包括:
提取模块,用于基于已训练的特征提取器,提取多个无标签数据和多个有标签数据的数据特征,构成目标数据集;
第一聚类模块,用于对所述目标数据集中的数据特征进行半监督聚类,获得满足指定条件的指定聚类算法;其中,所述指定条件为聚类结果以第一有标签数据的类别标签确定;
第二聚类模块,用于以所述指定聚类算法对所述多个无标签数据进行聚类,确定聚类簇数;
调整模块,用于以所述聚类簇数对已训练的第一分类模型进行调整;其中,所述第一分类模型包括所述特征提取器;
预测模块,用于以调整后的第一分类模型对所述无标签数据进行预测,获得所述无标签数据的伪标签编号。
9.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-7任意一项所述的视觉类别的发现方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成权利要求1-7任意一项所述的视觉类别的发现方法。
CN202110497720.3A 2021-05-08 2021-05-08 视觉类别的发现方法及装置、电子设备、存储介质 Active CN112990377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110497720.3A CN112990377B (zh) 2021-05-08 2021-05-08 视觉类别的发现方法及装置、电子设备、存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110497720.3A CN112990377B (zh) 2021-05-08 2021-05-08 视觉类别的发现方法及装置、电子设备、存储介质

Publications (2)

Publication Number Publication Date
CN112990377A true CN112990377A (zh) 2021-06-18
CN112990377B CN112990377B (zh) 2021-08-13

Family

ID=76337264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110497720.3A Active CN112990377B (zh) 2021-05-08 2021-05-08 视觉类别的发现方法及装置、电子设备、存储介质

Country Status (1)

Country Link
CN (1) CN112990377B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9639598B2 (en) * 2014-07-31 2017-05-02 International Business Machines Corporation Large-scale data clustering with dynamic social context
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN111126470A (zh) * 2019-12-18 2020-05-08 创新奇智(青岛)科技有限公司 基于深度度量学习的图片数据迭代聚类分析方法
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111753874A (zh) * 2020-05-15 2020-10-09 江苏大学 一种结合半监督聚类的图像场景分类方法及系统
CN112016633A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN112465020A (zh) * 2020-11-25 2021-03-09 创新奇智(合肥)科技有限公司 训练数据集的生成方法及装置、电子设备、存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9639598B2 (en) * 2014-07-31 2017-05-02 International Business Machines Corporation Large-scale data clustering with dynamic social context
CN108764281A (zh) * 2018-04-18 2018-11-06 华南理工大学 一种基于半监督自步学习跨任务深度网络的图像分类方法
CN111126470A (zh) * 2019-12-18 2020-05-08 创新奇智(青岛)科技有限公司 基于深度度量学习的图片数据迭代聚类分析方法
CN111259979A (zh) * 2020-02-10 2020-06-09 大连理工大学 一种基于标签自适应策略的深度半监督图像聚类方法
CN111753874A (zh) * 2020-05-15 2020-10-09 江苏大学 一种结合半监督聚类的图像场景分类方法及系统
CN112016633A (zh) * 2020-09-25 2020-12-01 北京百度网讯科技有限公司 一种模型训练方法、装置、电子设备及存储介质
CN112465020A (zh) * 2020-11-25 2021-03-09 创新奇智(合肥)科技有限公司 训练数据集的生成方法及装置、电子设备、存储介质

Also Published As

Publication number Publication date
CN112990377B (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
US10891465B2 (en) Methods and apparatuses for searching for target person, devices, and media
CN110362677B (zh) 文本数据类别的识别方法及装置、存储介质、计算机设备
CN110472090B (zh) 基于语义标签的图像检索方法以及相关装置、存储介质
AU2021218110A1 (en) Learning from distributed data
JP5214760B2 (ja) 学習装置、方法及びプログラム
CN108629358B (zh) 对象类别的预测方法及装置
US20210073890A1 (en) Catalog-based image recommendations
CN112465020B (zh) 训练数据集的生成方法及装置、电子设备、存储介质
CN111310706B (zh) 一种商品价签识别方法及装置、电子设备、存储介质
CN107203558B (zh) 对象推荐方法和装置、推荐信息处理方法和装置
CN111461164B (zh) 样本数据集的扩容方法及模型的训练方法
US11861669B2 (en) System and method for textual analysis of images
WO2022048572A1 (zh) 目标识别方法、装置和电子设备
WO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および記録媒体
CN115982463A (zh) 资源推荐方法、装置、设备及存储介质
CN105678333B (zh) 一种拥挤区域的确定方法和装置
US11941792B2 (en) Machine learning-based analysis of computing device images included in requests to service computing devices
CN112990377B (zh) 视觉类别的发现方法及装置、电子设备、存储介质
CN112150471A (zh) 基于少样本的语义分割方法及装置、电子设备、存储介质
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
CN111027326A (zh) 商品归类方法、存储介质及电子设备
CN115937530A (zh) 一种信息确定方法、装置、设备及计算机可读存储介质
CN112052867A (zh) 一种对象分类方法、装置、以及电子设备
CN117274679A (zh) 基于多视图聚类的消费用户分类方法及相关装置
CN114926688A (zh) 物体识别模型的训练方法、装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant