CN115909335A - 一种商品标注方法及装置 - Google Patents
一种商品标注方法及装置 Download PDFInfo
- Publication number
- CN115909335A CN115909335A CN202310009827.8A CN202310009827A CN115909335A CN 115909335 A CN115909335 A CN 115909335A CN 202310009827 A CN202310009827 A CN 202310009827A CN 115909335 A CN115909335 A CN 115909335A
- Authority
- CN
- China
- Prior art keywords
- commodity
- category
- sample
- similarity
- image feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供了一种商品标注方法及装置。在执行该方法时,先获取待标注商品的图像信息,接着利用预先训练的图像特征提取模型,对图像信息进行特征提取,然后计算图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择符合预设规则的类别集合,以使得标注人员对待标注商品进行标注。这样一来,在标注过程中,通过图像提取模型提取待标注图片的特征,并与预设商品类别样本集中每个商品样本进行相似度匹配计算,以便于标注人员根据预测类别集合中每个类别集合的商品样本与待标注商品的相似度,对待标注商品进行标注,降低人工标注的复杂度,进而提升商品标注效率。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种商品标注方法及装置。
背景技术
得益于算力、数据的爆炸式增长,基于深度学习的AI技术得以迅速发展,并在诸多行业领域落地。比如,目标检测、识别以及分类等AI视觉技术在许多场景的应用表现优越。
在深度神经网络的模型训练中需要大量的高质量标注数据,数据的质量和规模是影响算法模型性能的关键因素。实践经验表明,标注数据的数据量越大、质量越高、对模型训练的效果越有帮助。
目前,在常规的人工标注流程中,标注人员需要将待标注图片与所有类别的样例图进行逐一的视觉比对。当标注类别数到达万级别,待标注图片百万级别时,人工比对工作量繁重,且耗时巨大,使得标注效率低下。
发明内容
有鉴于此,本申请实施例提供了一种商品标注方法及装置,旨在降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
第一方面,本申请提供了一种商品标注方法,所述方法包括:
获取待标注商品的图像信息;
利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
可选地,所述图像特征提取模型的训练过程如下:
获取训练集,所述训练集包括已标注的商品样本集;
利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
可选地,所述计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,所述根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,在所述对所述待标注商品进行标注之后,所述方法还包括:
将标注后的商品加入所述预设商品类别样本集中。
第二方面,本申请提供了一种商品标注方法装置,所述装置包括:
获取模块,用于获取待标注商品的图像信息;
特征提取模块,用于利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
计算模块,用于计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
标注模块,用于基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
可选地,所述图像特征提取模型的训练过程如下:
获取训练集,所述训练集包括已标注的商品样本集;
利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
可选地,所述计算模块包括:
第一计算子模块,用于利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
第二计算子模块,用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,所述第二计算子模块,具体用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,在所述对所述待标注商品进行标注之后,所述装置还包括:
加入模块,用于将标注后的商品加入所述预设商品类别样本集中。
上述技术方案具有如下有益效果:
本申请提供了一种商品标注方法及装置。在执行所述方法时,先获取待标注商品的图像信息,接着利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;然后计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;其中,所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图,最后基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。这样一来,本申请在标注过程中,引入预先训练的图像提取模型提取待标注图片的特征,并与预设商品类别样本集中每个商品样本进行相似度匹配计算,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以便于标注人员根据预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,确定出待标注图的真实类别后,对待标注商品进行标注,降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
附图说明
为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的商品标注方法的一种方法流程图;
图2为本申请实施例提供的商品标注方法的一种场景流程图;
图3为本申请实施例提供的商品标注装置的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为便于理解本申请提供的技术方案,下面将先对本申请涉及的背景技术进行说明。
深度神经网络的模型训练需要大量的高质量标注数据,数据的质量和规模是影响算法模型性能的关键因素。实践经验表明,标注数据的数据量越大、质量越高、对模型训练的效果越有帮助。
数据标注的生产需要耗费大量的时间和人力物力,抬高了人工智能技术的落地难度和成本。比如智能零售行业,被广泛应用自动化巡检、盘点、结算的AI商品检测识别技术需要对上万个类别的商品精准识别。单个商品需要提供几十到几百张覆盖不同角度、陈列姿态、光照条件的图片,以便模型训练过程能够充分学习到商品的视觉特征和上下文环境相关的场景特征,获得商品的辨识能力。
发明人经研究发现,常规的人工标注流程中,标注人员需要将待标注图片与所有类别的样例图进行逐一的视觉比对。当标注类别数到达万级别,待标注图片百万级别时,人工比对工作量繁重,且耗时巨大,对标注人员的视觉辨识能力和认真程度要求苛刻。因此,如何快速、高效地获取到足够量的模型训练所需要的高质量标注数据,一定程度上决定了技术落地的成败。
为了克服上述技术问题,本申请实施例提供了一种商品标注方法,该方法可以由一种商品标注装置来执行,该装置可以由软件和/或硬件的方式实现,并一般可集成于服务器或终端设备中。
请参见图1,图1为本申请实施例提供的商品标注方法的一种方法流程图,该方法可以包括:
步骤S101:获取待标注商品的图像信息。
本申请实施例中,首先获取待标注商品的图像信息,便于后续利用预先训练的图像特征提取模型,对图像信息进行特征提取。
步骤S102:利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量。
具体地,本申请实施例在通过步骤S101获取待标注商品的图像信息之后,进一步利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量。
需要说明的是,特征提取模型可以选择目前广泛应用的神经网络模型,例如,densenet(密集连接的卷积网络)神经网络模型、vgg卷积神经网络等,也可以选择自主设计的神经网络模型,对此,本申请不做限定。
在一种可能的实现方式中,所述图像特征提取模型的训练过程如下:获取训练集,所述训练集包括已标注的商品样本集;利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
具体地,训练集包括已标注的商品样本集,训练集可以使用互联网共享标注数据,比如:imagenet图像识别数据库。也可以选择领域相近的数据集,例如,,斯坦福在线商品SOP标注数据集,数据集包含120,053张商品图片,有22,634个类别;京东商城发布的商品标注数据集Products-10K,数据集合包含了1万常见商品类别,共计19万图片;京东商城提供的零售产品标注集合RP2K,数据集共包含500000张零售产品图像,总计2000类商品。也可以选择自有的已标注数据集,对此,本申请实施例不做限定。
在获取训练集后,利用该训练集,对图像特征提取模型进行训练。
需要说明的是,图像特征提取模型采用有监督的度量学习方法,训练目标是建立能够精准抽取商品特征的提取模型,提取的商品特征能够表征商品类内和类间的细颗粒度差异。
步骤S103:计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图。
本申请实施例中,在通过步骤S102得到所述图像信息对应的图像特征向量后,进一步计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,从而得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
需要说明的是,所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图,样例图可以是商品特写照,或者是摆放在真实货架上的商品小图。每个类别至少包含一张样例图。
在一种可能的实现方式中,所述计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;;根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
其中,相似度距离公式可以采用欧式距离,EMD距离等等,在此不做限定。
在一种可能的实现方式中,所述根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
需要说明的是,类别的相似度可以用预设商品类别样本集中每个类别内包含的所有样例图与待标注图的特征相似度平均值来确定,也可以用预设商品类别样本集中每个类别内包含的所有样例图与待标注图的特征相似度最大值来确定。
步骤S104:基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
具体地,在通过步骤S103得到图像特征向量与预设商品类别样本集中每个类别的相似度结果之后,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合。例如可以根据预设阈值K,选择前K个高相似度的类别作为预测类别集合。需要说明的是,预设筛选条件可以根据实际情况来确定,在此不做限定。
可以理解的是,在确定待标注商品的预测类别集合后,选择数量为N的类别样例图作为标注人员对比的类别样例图。其中,N大于等于1,需要说明的是,N的取值可以根据实际情况进行确定,在此不做限定。
需要说明的是,类别样例图是指一个类别中商品样本的样例图。
在确定待标注商品的预测类别集合后,以便于后续标注人员对比待标注图与预测类别样例图之间的相似度,进而判断待标注图的真实类别。
需要说明的是,如果预测类别集合中包含了真实类别时只需由标注人员进行简单选择即可。相应地,当真实类别未包含在推荐类别集合时,则采用常规人工标注方式,将待标注图与所有类别样例图进行视觉比对,标注出正确的类别。
在实际应用中,选择前5个最相似的类别进行推荐时,,预测准确率可以能够达到85%以上,即,85%以上的待标注数据仅需要人工简单比对推荐类别的样例图即可完成标注,节省了近85%的人工标注工作量。
在一种可能实现的方式中,在所述对所述待标注商品进行标注之后,所述方法还包括:将标注后的商品加入所述预设商品类别样本集中。
具体地,将标注完成的图片,加入到对应类别的样例图支持集中,用于后续图的标注。
可以理解的是,随着类别支持集的增加,类别预测的准确率也会得到持续提升,进一步降低人工标记的工作量。
接下来,以一个具体的场景例进行详细说明。
如图2所示,为本申请实施例提供的商品标注方法的一种场景流程图。
获取待标注商品的图像信息后,利用预先训练的图像特征提取模型,接着对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;然后计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,并基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足前K个高相似度的商品类别作为所述待标注商品的预测类别集合,便于后续标注人员根据预测类别集合中每个类别的商品样本的样例图与待标注商品的相似度,从而确定出待标注商品是否在预测集合中。
如果预测类别集合中包含了真实类别时只需由标注人员进行简单选择即可。相应地,当真实类别未包含在推荐类别集合时,则采用常规人工标注方式,将待标注图与所有实例图(前文所述的商品样例图)进行视觉比对,标注出正确的类别。并进一步将标注完成的图片,加入到对应类别的类别支持集(商品类别样本集)中,用于下一轮的预测计算。接着判断标注任务是否全部完成,若是,则结束;若不是,则继续标注直到所有任务完成。
随着类别支持集(商品类别样本集)的增加,类别预测的准确率将持续增加,需要人工标注的图片量占比进一步降低。当初始的时候,由于类别支持集(商品类别样本集)比较小,预测的准确率不高(比如85%),随着标注工作的继续,类别支持集(商品类别样本集)越来越多,预测结果准确率越来越高(比如95%)。
从上述技术方案可以看出,先获取待标注商品的图像信息,接着利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;然后计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;其中,所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图,最后基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。这样一来,本申请在标注过程中,引入预先训练的图像提取模型提取待标注图片的特征,并与预设商品类别样本集中每个商品样本进行相似度匹配计算,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以便于标注人员根据预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,确定出待标注图的真实类别后,对待标注商品进行标注,降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
以上为本申请实施例提供一种商品标注方法的一些具体实现方式,基于此,本申请还提供了对应的装置。下面将从功能模块化的角度对本申请实施例提供的装置进行介绍。
参见图3所示的一种商品标注方法装置的结构示意图,该装置可以包括获取模块100、特征提取模块200、计算模块300、标注模块400。
获取模块100,用于获取待标注商品的图像信息;
特征提取模块200,用于利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
计算模块300,用于计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
标注模块400,用于基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
可选地,所述图像特征提取模型的训练过程如下:
获取训练集,所述训练集包括已标注的商品样本集;
利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
可选地,所述计算模块包括:
第一计算子模块,用于利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
第二计算子模块,用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,所述第二计算子模块,具体用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
可选地,在所述对所述待标注商品进行标注之后,所述装置还包括:
加入模块,用于将标注后的商品加入所述预设商品类别样本集中。
从上述技术方案可以看出,本申请先获取待标注商品的图像信息,接着利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;然后计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;其中,所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图,最后基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。这样一来,本申请在标注过程中,引入预先训练的图像提取模型提取待标注图片的特征,并与预设商品类别样本集中每个商品样本进行相似度匹配计算,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以便于标注人员根据预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,确定出待标注图的真实类别后,对待标注商品进行标注,降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本领域技术人员可以理解,图所示的流程图仅是本申请的实施方式可以在其中得以实现的一个示例,本申请实施方式的适用范围不受到该流程图任何方面的限制。
在本申请所提供的几个实施例中,应该理解到,所揭露的方法、装置和设备,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种商品标注方法,其特征在于,所述方法包括:
获取待标注商品的图像信息;
利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
2.根据权利要求1所述的方法,其特征在于,所述图像特征提取模型的训练过程如下:
获取训练集,所述训练集包括已标注的商品样本集;
利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
3.根据权利要求1所述的方法,其特征在于,所述计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
5.根据权利要求1所述的方法,其特征在于,在所述对所述待标注商品进行标注之后,所述方法还包括:
将标注后的商品加入所述预设商品类别样本集中。
6.一种商品标注方法装置,其特征在于,所述装置包括:
获取模块,用于获取待标注商品的图像信息;
特征提取模块,用于利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
计算模块,用于计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
标注模块,用于基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
7.根据权利要求6所述的装置,其特征在于,所述图像特征提取模型的训练过程如下:
获取训练集,所述训练集包括已标注的商品样本集;
利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
8.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
第一计算子模块,用于利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
第二计算子模块,用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
9.根据权利要求8所述的装置,其特征在于,所述第二计算子模块,具体用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
10.根据权利要求6所述的装置,其特征在于,在所述对所述待标注商品进行标注之后,所述装置还包括:
加入模块,用于将标注后的商品加入所述预设商品类别样本集中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310009827.8A CN115909335A (zh) | 2023-01-03 | 2023-01-03 | 一种商品标注方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310009827.8A CN115909335A (zh) | 2023-01-03 | 2023-01-03 | 一种商品标注方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115909335A true CN115909335A (zh) | 2023-04-04 |
Family
ID=86471234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310009827.8A Pending CN115909335A (zh) | 2023-01-03 | 2023-01-03 | 一种商品标注方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115909335A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188802A (zh) * | 2023-04-21 | 2023-05-30 | 青岛创新奇智科技集团股份有限公司 | 数据标注方法、装置、设备及存储介质 |
-
2023
- 2023-01-03 CN CN202310009827.8A patent/CN115909335A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116188802A (zh) * | 2023-04-21 | 2023-05-30 | 青岛创新奇智科技集团股份有限公司 | 数据标注方法、装置、设备及存储介质 |
CN116188802B (zh) * | 2023-04-21 | 2023-07-21 | 青岛创新奇智科技集团股份有限公司 | 数据标注方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110472090B (zh) | 基于语义标签的图像检索方法以及相关装置、存储介质 | |
CN108416403B (zh) | 商品与标签的自动关联方法、系统、设备及存储介质 | |
CN108734162B (zh) | 商品图像中目标识别方法、系统、设备及存储介质 | |
CN106127197B (zh) | 基于显著标签排序的图像显著性目标检测方法和装置 | |
CN109767150B (zh) | 信息推送方法和装置 | |
US11354549B2 (en) | Method and system for region proposal based object recognition for estimating planogram compliance | |
Marder et al. | Using image analytics to monitor retail store shelves | |
CN108009560B (zh) | 商品图像相似类别判定方法及装置 | |
CN111461164B (zh) | 样本数据集的扩容方法及模型的训练方法 | |
CN108564102A (zh) | 图像聚类结果评价方法和装置 | |
CN112100425B (zh) | 基于人工智能的标签标注方法、装置、电子设备及介质 | |
EP3723000A1 (en) | Object recognition system and object regognition method | |
CN109214374A (zh) | 视频分类方法、装置、服务器及计算机可读存储介质 | |
CN113569070B (zh) | 图像检测方法和装置、电子设备、存储介质 | |
CN111881901A (zh) | 截图内容检测方法、设备及计算机可读存储介质 | |
CN112785441A (zh) | 数据处理方法、装置、终端设备及存储介质 | |
CN110009045A (zh) | 物联网终端的识别方法和装置 | |
CN115909335A (zh) | 一种商品标注方法及装置 | |
CN111612000A (zh) | 一种商品分类方法、装置、电子设备及存储介质 | |
US11941792B2 (en) | Machine learning-based analysis of computing device images included in requests to service computing devices | |
CN111460888B (zh) | 基于机器学习的物品识别方法及装置 | |
CN110413869B (zh) | 用于推送信息的方法和装置 | |
CN116578925A (zh) | 基于特征画像的行为预测方法、装置及存储介质 | |
Anggoro et al. | Classification of Solo Batik patterns using deep learning convolutional neural networks algorithm | |
CN115858695A (zh) | 一种信息处理方法及装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |