CN115984653A - 一种动态智能货柜商品识别模型的构建方法 - Google Patents

一种动态智能货柜商品识别模型的构建方法 Download PDF

Info

Publication number
CN115984653A
CN115984653A CN202310109795.9A CN202310109795A CN115984653A CN 115984653 A CN115984653 A CN 115984653A CN 202310109795 A CN202310109795 A CN 202310109795A CN 115984653 A CN115984653 A CN 115984653A
Authority
CN
China
Prior art keywords
meta
commodity
training
model
task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310109795.9A
Other languages
English (en)
Other versions
CN115984653B (zh
Inventor
张健
任子欣
贺建飚
陶泽
熊友曹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN202310109795.9A priority Critical patent/CN115984653B/zh
Publication of CN115984653A publication Critical patent/CN115984653A/zh
Application granted granted Critical
Publication of CN115984653B publication Critical patent/CN115984653B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供了一种动态智能货柜商品识别模型的构建方法,包括步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集,将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集,并分别用于特征提取网络gσ的训练和特征提取有效性的验证;步骤S2、随机初始化基于半监督对比学习的深度模型的参数;步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度;步骤S4、构建动态智能货柜商品识别模型。本发明能够提高对未标注的无标签训练集数据的利用率,提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。

Description

一种动态智能货柜商品识别模型的构建方法
技术领域
本发明涉及动态智能货柜和计算机视觉技术领域,具体涉及一种动态智能货柜商品识别模型的构建方法。
背景技术
深度学习是学习样本数据的内在规律和表示层次,通过学习获得对诸如文字,图像和声音等数据的解释能力,最终让机器能够具有像人一样的分析、处理信息的能力。深度学习的基础即神经网络,伴随着超大规模计算技术的发展,神经网络的结构逐渐趋于复杂化、成熟化,衍生出了深度神经网络(Deep Neural Networks,DNN)、卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)等多种不同的形式和结构。
神经网络的发展拓宽了人工智能的应用范围,在语音识别、图像处理、视频理解和自然语言处理等领域取得了巨大的成果,也提升了深度学习的应用效果及应用性能。但传统深度学习模型的训练面临如下许多问题:
1)需要大量带标记的训练数据,标注人工成本高昂、费时费力;
2)传统深度学习模型训练需要的计算和内存资源与传统深度学习模型规模成正比,往往需要大量带标签数据进行训练以获得具有可用性的模型,存在训练过程耗时,计算成本高等问题;
3)传统深度学习模型训练过程中可能出现过拟合、欠拟合等问题,需要对网络的框架结构或学习参数反复调整、修改;
4)传统深度学习模型面对任务类型和任务内容更新时,需要依赖大规模相关样本且具有较高训练时间成本;而基于优化的元学习方法利用二阶导数更新元模型,训练时计算资源需求高,往往只能通过降低模型复杂度在有限资源情况下获得收敛模型。
为解决上述问题,一些新的深度学习方法,如元学习和小样本学习等被提出,能够有效克服传统深度学习模型对数据需求量大、更新费时费力等问题。
然而,现有智能货柜大多使用海量货品数据直接拟合数据分布,针对智能货柜内货品类型的更新,传统深度学习模型无法轻量级响应智能货柜内商品组合多样性及场景变化,缺乏主动适配多场景应用的能力。同时,传统深度学习模型只能使用已有的标注数据,而在智能货柜运营中会产生大量新的未标注数据,传统深度学习模型缺乏对未标注数据的利用和挖掘。
发明内容
本发明目的在于提供一种动态智能货柜商品识别模型的构建方法,采用半监督对比学习和元学习组合使用,能够提升所述动态智能货柜商品识别模型适配多场景应用的能力,并在减少对已标注的带标签训练集数据需求的情况下,进一步提高对未标注的无标签训练集数据的利用率,提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。其具体技术方案如下:
一种动态智能货柜商品识别模型的构建方法,包括以下步骤:
步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集,将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集,并分别用于特征提取网络gσ的训练和特征提取有效性的验证;
步骤S2、随机初始化基于半监督对比学习的深度模型的参数,所述深度模型的参数包括所述特征提取网络gσ的参数σ和用于评估特征提取网络gσ性能的分类器的参数,其中,参数σ表示特征提取网络各卷积层权重、学习率、权重衰减系数;
利用所述带标签训练集的数据进行热启动训练,直至商品分类的准确率达到设定的阈值;
步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度;
选取置信度不低于0.8的样本作为伪标签数据集;将所述带标签训练集和伪标签数据集混合并从中采样训练任务构成集合数据,使用批训练策略将所述集合数据分为等大的批,对所述深度模型进行训练和参数更新,直至损失不高于0.5,使得所述深度模型收敛,并在所述测试集上的分类任务表现出可用性能,获得可用的所述特征提取网络gσ
步骤S4、构建动态智能货柜商品识别模型
具体构建过程如下,为动态智能货柜中的待测商品识别准备元学习阶段数据集,将元学习阶段数据集的数据信息输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图,将所述数据特征图和商品识别任务输入到元模型fθ,由所述元模型fθ输出待测商品识别结果,从而构建得到适应于不同应用场景下动态智能货柜中商品识别任务的动态智能货柜商品识别模型。
可选的,在步骤S4中,将所述元学习阶段数据集划分为元训练集和元测试集;
所述元训练集是在通用数据集上随机抽取的多组训练任务构成的任务集合Ttrain={Ttrain 1,Ttrain 2,......,Ttrain i,......,Ttrain m},每个任务Ttrain i均由N个类别的样本组成,每个任务Ttrain i均分为元训练支持集和元训练查询集,用于训练元模型fθ
所述元测试集由特定应用场景及商品组成下的识别任务的商品数据集构成,随机从所述商品数据集中抽取多组训练任务构成的任务集合Ttest={Ttest 1,Ttest 2,......,Ttest i,......,Ttest m},每个任务Ttest i均由N个类别的样本组成,每个任务Ttest i均分为元测试支持集和元测试查询集,用于微调元训练阶段获得的元模型fθ
在所述元训练集和元测试集中的m均为不小于100的自然数。
可选的,在步骤S4中还包括以下数据处理步骤:
步骤S4a、随机初始化元模型fθ中的参数θ,其中,参数θ表示元模型各卷积层权重、学习率、权重衰减系数;
步骤S4b、从所述元训练集中随机抽取多个任务Ttrain i,构成一个训练批,其中,Ttrain i服从任务分布p(Ttrain);在每个任务Ttrain i中的每个类别中均抽取K个数据样本,其中,1≤K≤M,M表示N类别中的某一类别m在元训练集中带标签样本总数;将N类别中的各K个数据样本输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图;
步骤S4c、根据步骤S4b所输入的数据样本的类别,将所述数据特征图映射到对应商品类别的高维特征空间上,获得映射结果;将所述映射结果输入到步骤S4a初始化的元模型fθ中,用于对所述元训练支持集上的数据样本提取得到特征向量;采用损失函数对所述特征向量计算所述元模型fθ中商品分类的损失值,使参数θ被更新优化,从而获得训练后的元模型fθ
步骤S4d、利用在ImageNet上预训练的ResNet网络构建特征匹配模块,通过所述特征匹配模块对待测商品建立所述商品识别任务;
步骤S4e、利用动态智能货柜中的元测试集微调训练后的所述元模型fθ,当所述元模型fθ在元测试支持集上的损失收敛不高于0.5时,将步骤S4d中建立的所述商品识别任务输入到所述元模型fθ中,由所述元模型fθ输出待测商品识别结果。
可选的,在步骤S4c中,参数θ被更新优化的过程如下:
步骤S4c-1、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练支持集上的商品分类的损失值
Figure BDA0004076343370000041
通过学习率为α的一阶梯度对所述参数θ进行更新,获得参数θ'i
Figure BDA0004076343370000042
在式(1)中,参数θ'i表示元模型在根据任务Ttrain i训练并更新后的参数;
Figure BDA0004076343370000043
表示损失函数的梯度;
步骤S4c-2、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练查询集上的商品分类的损失值
Figure BDA0004076343370000044
所述参数θ的更新是在所有任务Ttrain i基础上,元模型参数θ优化的目标是:
Figure BDA0004076343370000045
在式(2)中,
Figure BDA0004076343370000046
表示任务Ttrain i服从任务集合Ttrain分布;
Figure BDA0004076343370000047
表示在每个任务Ttrain i上元模型对元训练支持集的预测损失值;
Figure BDA0004076343370000048
表示根据任务Ttrain i更新后的元模型对元训练测试集的预测损失值;
步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为:
Figure BDA0004076343370000049
可选的,在步骤S4c中,重复步骤S4c-1至步骤S4c-3优化参数θ后,使得元模型fθ在所述元训练查询集上的损失收敛低于0.5时,获得训练后的元模型fθ
可选的,在步骤S4c-1和步骤S4c-2中的所述损失函数为
Figure BDA00040763433700000410
Figure BDA00040763433700000411
在式(4)中,x(j)为所述元训练集中的每一个任务Ttrain i的数据集中的观测值;y(j)为所述元训练集中的每一个任务Ttrain i的数据集中的目标值;fφ表示待优化模型的网络参数;
Figure BDA0004076343370000051
表示(x(j),y(j))属于任务集合Ttrain i;fφ(x(j))表示x(j)样本经过待优化模型处理后的特征图;logfφ(x(j))表示对特征图的值取对数。
可选的,在步骤S4d中,所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征,将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配,选择最相似的k个支持集样本建立所述商品识别任务,其中,k的取值范围为5-15。
可选的,在步骤S2中,所述阈值的范围为90%-95%。
可选的,所述商品数据集由智能货柜上的摄像头获取;所述商品数据集包括商品图片和商品类别信息。
可选的,所述元学习阶段数据集中的元训练集使用公共开源数据集;所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取;所述元学习阶段数据集包括商品图片和商品类别信息。
应用本发明的技术方案,至少具有以下有益效果:
(1)在动态智能货柜应用场景下,商品类别更新速度快、动态智能货柜部署环境差异大,本发明中所述动态智能货柜商品识别模型的构建方法采用半监督对比学习和元学习组合使用,对带标签商品数据(即步骤S1中的带标签训练集和步骤S4中的元测试支持集)需求量低、所述动态智能货柜商品识别模型可以实现在线更新,能够快速适应不同商品类别构成、不同任务及场景;同时,利用少量步骤S4中的元测试支持集中的带标签商品数据完成所述动态智能货柜商品识别模型的构建,能够快速迭代适应商品识别任务的变化和更新,高效完成鲁棒模型的训练及部署;另外,本发明基于半监督对比学习,在减少对已标注的带标签训练集数据需求的情况下,进一步提高对未标注的无标签训练集数据的利用率,提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。
(2)本发明在步骤S4d中引入特征匹配模块,用于建立商品识别任务,在不增加训练成本的情况下,利用元学习方法对元测试支持集具有强依赖这一特性,提升元模型fθ对所述商品识别任务的识别精度。
除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明实施例1中的一种动态智能货柜商品识别模型的构建方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
参见图1,一种动态智能货柜商品识别模型的构建方法,包括以下步骤:
步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集,将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集,并分别用于特征提取网络gσ的训练和特征提取有效性的验证,具体地,首先,利用带标签训练集作为所述深度模型的输入,训练模型使其能够在该训练集上正确分类输入样本,分类正确率反映了特征提取的有效性,当在带标签训练集上的分类任务达到正确率阈值即可利用所述深度模型对无标签训练集进行伪标签预测,获得伪标签数据集;其次,利用带标签训练集和伪标签数据集训练动态智能货柜商品识别模型,进而获得有效的特征提取网络gσ;所述测试集用于验证所述特征提取网络gσ的有效性;
所述商品数据集由智能货柜上的摄像头获取,具体操作为:多次模拟购物行为,打开智能货柜的柜门拿取柜内商品,通过智能货柜上的摄像头上传该模拟流程视频到文件服务器,利用标注软件对所有视频逐帧处理获取商品数据集;若该帧存在商品,则将其画面中的位置框出,生成位置坐标并标注该商品类别;根据上述操作获得的位置坐标对视频帧进行截图,获得商品图片及其标签,构建出带标签训练集的商品数据集,其包括商品图片和商品类别信息;
步骤S2、随机初始化基于半监督对比学习的深度模型的参数,所述深度模型的参数包括所述特征提取网络gσ的参数σ和用于评估特征提取网络gσ性能的分类器的参数,其中,参数σ表示特征提取网络各卷积层权重、学习率、权重衰减系数;所述分类器用于对特征提取网络gσ提取到的高维特征进行线性分类,根据分类结果与样本实际标签的比较确定特征提取网络gσ是否能够有效提取样本的深度特征,即分类结果是否正确;
利用所述带标签训练集的数据进行热启动训练,直至商品分类的准确率达到设定的阈值;
步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度;
选取置信度为0.8的样本作为伪标签数据集;将所述带标签训练集和伪标签数据集混合并从中采样训练任务构成集合数据,使用批训练策略将所述集合数据分为等大的批,对所述深度模型进行训练和参数更新,直至损失为0.5,使得所述深度模型收敛,并在所述测试集上的分类任务表现出可用性能,获得可用的所述特征提取网络gσ
步骤S4、构建动态智能货柜商品识别模型
具体构建过程如下,为动态智能货柜中的待测商品识别准备元学习阶段数据集,将元学习阶段数据集的数据信息输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图,将所述数据特征图和商品识别任务输入到元模型fθ,由所述元模型fθ输出待测商品识别结果,从而构建得到适应于不同应用场景下动态智能货柜中商品识别任务的动态智能货柜商品识别模型;所述元学习阶段数据集中的元训练集使用公共开源数据集,从官网上下载即可;所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取,具体操作为:多次模拟购物行为,打开智能货柜的柜门拿取柜内商品,通过智能货柜上的摄像头上传该模拟流程视频到文件服务器,利用标注软件对所有视频逐帧处理获取元测试集;若该帧存在商品,则将其画面中的位置框出,生成位置坐标并标注该商品类别;根据上述操作获得的位置坐标对视频帧进行截图,获得商品图片及其标签,构建出带标签元测试支持集,其包括商品图片和商品类别信息;
在步骤S4中,将所述元学习阶段数据集划分为元训练集和元测试集;
所述元训练集是在通用数据集上随机抽取的多组训练任务构成的任务集合Ttrain={Ttrain 1,Ttrain 2,......,Ttrain i,......,Ttrain m},每个任务Ttrain i均由N个类别的样本组成,每个任务Ttrain i均分为元训练支持集和元训练查询集,用于训练元模型fθ
所述元测试集由特定应用场景及商品组成下的识别任务的商品数据集构成,随机从所述商品数据集中抽取多组训练任务构成的任务集合Ttest={Ttest 1,Ttest 2,......,Ttest i,......,Ttest m},每个任务Ttest i均由N个类别的样本组成,每个任务Ttest i均分为元测试支持集和元测试查询集,用于微调元训练阶段获得的元模型fθ,为元模型fθ提供先验知识,指导元模型fθ对商品进行正确识别,提高商品识别模型的精度;
在所述元训练集和元测试集中的m均为不小于100的自然数。
在步骤S4中还包括以下数据处理步骤:
步骤S4a、随机初始化元模型fθ中的参数θ,其中,参数θ表示元模型各卷积层权重、学习率、权重衰减系数;
步骤S4b、从所述元训练集中随机抽取多个任务Ttrain i,构成一个训练批,其中,Ttrain i服从任务分布p(Ttrain);在每个任务Ttrain i中的每个类别中均抽取K个数据样本,其中,1≤K≤M,M表示N类别中的某一类别m在元训练集中带标签样本总数;将N类别中的各K个数据样本输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图;
步骤S4c、根据步骤S4b所输入的数据样本的类别,将所述数据特征图映射到对应商品类别的高维特征空间上,获得映射结果;将所述映射结果输入到步骤S4a初始化的元模型fθ中,用于对所述元训练支持集上的数据样本提取得到特征向量;采用损失函数对所述特征向量计算所述元模型fθ中商品分类的损失值,具体地,所述损失值是通过交叉熵损失函数计算商品分类预测值(即元模型fθ输出特征向量)与商品类别真实值的差异值,使参数θ被更新优化,从而获得训练后的元模型fθ
步骤S4d、利用在ImageNet上预训练的ResNet网络构建特征匹配模块,通过所述特征匹配模块对待测商品建立所述商品识别任务;
步骤S4e、利用动态智能货柜中的元测试集微调训练后的所述元模型fθ,当所述元模型fθ在元测试支持集上的损失收敛为0.5时,将步骤S4d中建立的所述商品识别任务输入到所述元模型fθ中,由所述元模型fθ输出待测商品识别结果。
在步骤S4c中,参数θ被更新优化的过程如下:
步骤S4c-1、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练支持集上的商品分类的损失值
Figure BDA0004076343370000091
通过学习率为α的一阶梯度对所述参数θ进行更新,获得参数θ'i
Figure BDA0004076343370000092
在式(1)中,参数θ'i表示元模型在根据任务Ttrain i训练并更新后的参数;
Figure BDA0004076343370000093
表示损失函数的梯度;
步骤S4c-2、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练查询集上的商品分类的损失值
Figure BDA0004076343370000094
所述参数θ的更新是在所有任务Ttrain i基础上,元模型参数θ优化的目标是:
Figure BDA0004076343370000095
在式(2)中,
Figure BDA0004076343370000096
表示任务Ttrain i服从任务集合Ttrain分布;
Figure BDA0004076343370000097
表示在每个任务Ttrain i上元模型对元训练支持集的预测损失值;
Figure BDA0004076343370000098
表示根据任务Ttrain i更新后的元模型对元训练测试集的预测损失值;
步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为:
Figure BDA0004076343370000099
在步骤S4c中,重复步骤S4c-1至步骤S4c-3优化参数θ后,使得元模型fθ在所述元训练查询集上的损失收敛低于0.5时,获得训练后的元模型fθ
在步骤S4c-1和步骤S4c-2中的所述损失函数为
Figure BDA00040763433700000910
其采用交叉熵损失表示:
Figure BDA00040763433700000911
在式(4)中,x(j)为所述元训练集中的每一个任务Ttrain i的数据集中的观测值;y(j)为所述元训练集中的每一个任务Ttrain i的数据集中的目标值;fφ表示待优化模型的网络参数;
Figure BDA0004076343370000101
表示(x(j),y(j))属于任务集合Ttrain i;fφ(x(j))表示x(j)样本经过待优化模型处理后的特征图;logfφ(x(j))表示对特征图的值取对数。
在步骤S4d中,所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征,将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配,选择最相似的k个支持集样本建立所述商品识别任务,其中,k的取值范围为5-15。
在步骤S2中,所述阈值的范围为95%。
相比于传统端到端深度识别模型,采用其训练单个商品SKU所需带标签数据量在600张及以上,本发明将带标签商品数据每个商品类别压缩到100-200张,可以取得和海量数据相同的识别精度。同时传统深度学习方案在商品类别发生变化时,需要耗费大量时间和计算成本重新训练模型,而本发明只需将智能货柜在售商品的带标签数据集作为元测试支持集更新即可,无需更改模型。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种动态智能货柜商品识别模型的构建方法,其特征在于,包括以下步骤:
步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集,将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集,并分别用于特征提取网络gσ的训练和特征提取有效性的验证;
步骤S2、随机初始化基于半监督对比学习的深度模型的参数,所述深度模型的参数包括所述特征提取网络gσ的参数σ和用于评估特征提取网络gσ性能的分类器的参数,其中,参数σ表示特征提取网络各卷积层权重、学习率、权重衰减系数;
利用所述带标签训练集的数据进行热启动训练,直至商品分类的准确率达到设定的阈值;
步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度;
选取置信度不低于0.8的样本作为伪标签数据集;将所述带标签训练集和伪标签数据集混合并从中采样训练任务构成集合数据,使用批训练策略将所述集合数据分为等大的批,对所述深度模型进行训练和参数更新,直至损失不高于0.5,使得所述深度模型收敛,并在所述测试集上的分类任务表现出可用性能,获得可用的所述特征提取网络gσ
步骤S4、构建动态智能货柜商品识别模型
具体构建过程如下,为动态智能货柜中的待测商品识别准备元学习阶段数据集,将元学习阶段数据集的数据信息输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图,将所述数据特征图和商品识别任务输入到元模型fθ,由所述元模型fθ输出待测商品识别结果,从而构建得到适应于不同应用场景下动态智能货柜中商品识别任务的动态智能货柜商品识别模型。
2.根据权利要求1所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4中,将所述元学习阶段数据集划分为元训练集和元测试集;
所述元训练集是在通用数据集上随机抽取的多组训练任务构成的任务集合Ttrain={Ttrain 1,Ttrain 2,......,Ttrain i,......,Ttrain m},每个任务Ttrain i均由N个类别的样本组成,每个任务Ttrain i均分为元训练支持集和元训练查询集,用于训练元模型fθ
所述元测试集由特定应用场景及商品组成下的识别任务的商品数据集构成,随机从所述商品数据集中抽取多组训练任务构成的任务集合Ttest={Ttest 1,Ttest 2,......,Ttest i,......,Ttest m},每个任务Ttest i均由N个类别的样本组成,每个任务Ttest i均分为元测试支持集和元测试查询集,用于微调元训练阶段获得的元模型fθ
在所述元训练集和元测试集中的m均为不小于100的自然数。
3.根据权利要求2所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4中还包括以下数据处理步骤:
步骤S4a、随机初始化元模型fθ中的参数θ,其中,参数θ表示元模型各卷积层权重、学习率、权重衰减系数;
步骤S4b、从所述元训练集中随机抽取多个任务Ttrain i,构成一个训练批,其中,Ttrain i服从任务分布p(Ttrain);在每个任务Ttrain i中的每个类别中均抽取K个数据样本,其中,1≤K≤M,M表示N类别中的某一类别m在元训练集中带标签样本总数;将N类别中的各K个数据样本输入到步骤S3获得的所述特征提取网络gσ中,由所述特征提取网络gσ提取得到数据特征图;
步骤S4c、根据步骤S4b所输入的数据样本的类别,将所述数据特征图映射到对应商品类别的高维特征空间上,获得映射结果;将所述映射结果输入到步骤S4a初始化的元模型fθ中,用于对所述元训练支持集上的数据样本提取得到特征向量;采用损失函数对所述特征向量计算所述元模型fθ中商品分类的损失值,使参数θ被更新优化,从而获得训练后的元模型fθ
步骤S4d、利用在ImageNet上预训练的ResNet网络构建特征匹配模块,通过所述特征匹配模块对待测商品建立所述商品识别任务;
步骤S4e、利用动态智能货柜中的元测试集微调训练后的所述元模型fθ,当所述元模型fθ在元测试支持集上的损失收敛不高于0.5时,将步骤S4d中建立的所述商品识别任务输入到所述元模型fθ中,由所述元模型fθ输出待测商品识别结果。
4.根据权利要求3所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4c中,参数θ被更新优化的过程如下:
步骤S4c-1、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练支持集上的商品分类的损失值
Figure FDA0004076343360000021
通过学习率为α的一阶梯度对所述参数θ进行更新,获得参数θ'i
Figure FDA0004076343360000031
在式(1)中,参数θ'i表示元模型在根据任务Ttrain i训练并更新后的参数;
Figure FDA0004076343360000032
表示损失函数的梯度;
步骤S4c-2、对于所述元训练集中的每一个任务Ttrain i,采用所述损失函数计算所述任务Ttrain i在所述元训练查询集上的商品分类的损失值
Figure FDA0004076343360000033
所述参数θ的更新是在所有任务Ttrain i基础上,元模型参数θ优化的目标是:
Figure FDA0004076343360000034
在式(2)中,
Figure FDA0004076343360000035
表示任务Ttrain i服从任务集合Ttrain分布;
Figure FDA0004076343360000036
表示在每个任务Ttrain i上元模型对元训练支持集的预测损失值;
Figure FDA0004076343360000037
表示根据任务Ttrain i更新后的元模型对元训练测试集的预测损失值;
步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为:
Figure FDA0004076343360000038
5.根据权利要求4所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4c中,重复步骤S4c-1至步骤S4c-3优化参数θ后,使得元模型fθ在所述元训练查询集上的损失收敛低于0.5时,获得训练后的元模型fθ
6.根据权利要求5所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4c-1和步骤S4c-2中的所述损失函数为
Figure FDA0004076343360000039
Figure FDA00040763433600000310
在式(4)中,x(j)为所述元训练集中的每一个任务Ttrain i的数据集中的观测值;y(j)为所述元训练集中的每一个任务Ttrain i的数据集中的目标值;fφ表示待优化模型的网络参数;
Figure FDA00040763433600000311
表示(x(j),y(j))属于任务集合Ttrain i;fφ(x(j))表示x(j)样本经过待优化模型处理后的特征图;log fφ(x(j))表示对特征图的值取对数。
7.根据权利要求3-6任一项所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S4d中,所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征,将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配,选择最相似的k个支持集样本建立所述商品识别任务,其中,k的取值范围为5-15。
8.根据权利要求7所述的动态智能货柜商品识别模型的构建方法,其特征在于,在步骤S2中,所述阈值的范围为90%-95%。
9.根据权利要求8所述的动态智能货柜商品识别模型的构建方法,其特征在于,所述商品数据集由智能货柜上的摄像头获取;所述商品数据集包括商品图片和商品类别信息。
10.根据权利要求9所述的动态智能货柜商品识别模型的构建方法,其特征在于,所述元学习阶段数据集中的元训练集使用公共开源数据集;所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取;所述元学习阶段数据集包括商品图片和商品类别信息。
CN202310109795.9A 2023-02-14 2023-02-14 一种动态智能货柜商品识别模型的构建方法 Active CN115984653B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310109795.9A CN115984653B (zh) 2023-02-14 2023-02-14 一种动态智能货柜商品识别模型的构建方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310109795.9A CN115984653B (zh) 2023-02-14 2023-02-14 一种动态智能货柜商品识别模型的构建方法

Publications (2)

Publication Number Publication Date
CN115984653A true CN115984653A (zh) 2023-04-18
CN115984653B CN115984653B (zh) 2023-08-01

Family

ID=85962582

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310109795.9A Active CN115984653B (zh) 2023-02-14 2023-02-14 一种动态智能货柜商品识别模型的构建方法

Country Status (1)

Country Link
CN (1) CN115984653B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117828317A (zh) * 2023-12-12 2024-04-05 浙江工业大学 基于主动对比学习的人机不同步识别模型构建方法及系统
CN118094105A (zh) * 2024-03-25 2024-05-28 广州探域科技有限公司 基于动态信息的模型增量微调方法、系统、设备及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201908574D0 (en) * 2019-06-14 2019-07-31 Vision Semantics Ltd Optimised machine learning
CN110674844A (zh) * 2019-08-27 2020-01-10 广州伊思高科技有限公司 一种智能货柜增量学习训练方法
CN112232416A (zh) * 2020-10-16 2021-01-15 浙江大学 一种基于伪标签加权的半监督学习方法
CN112766323A (zh) * 2020-12-30 2021-05-07 清华大学 一种影像识别方法和装置
CN112861995A (zh) * 2021-03-15 2021-05-28 中山大学 基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质
CN114817307A (zh) * 2022-02-17 2022-07-29 东南大学 一种基于半监督学习和元学习的少样本nl2sql方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201908574D0 (en) * 2019-06-14 2019-07-31 Vision Semantics Ltd Optimised machine learning
CN110674844A (zh) * 2019-08-27 2020-01-10 广州伊思高科技有限公司 一种智能货柜增量学习训练方法
CN112232416A (zh) * 2020-10-16 2021-01-15 浙江大学 一种基于伪标签加权的半监督学习方法
CN112766323A (zh) * 2020-12-30 2021-05-07 清华大学 一种影像识别方法和装置
CN112861995A (zh) * 2021-03-15 2021-05-28 中山大学 基于模型无关元学习的无监督少样本图像分类方法、系统及存储介质
CN114817307A (zh) * 2022-02-17 2022-07-29 东南大学 一种基于半监督学习和元学习的少样本nl2sql方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YAN LIU: "MetaStore: A Task-adaptative Meta-learning Model for Optimal Store Placement with Multi-city Knowledge Transfer", ACM TRANSACTIONS ON INTELLIGENT SYSTEMS AND TECHNOLOGY, vol. 12, no. 3, pages 1 - 23 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117828317A (zh) * 2023-12-12 2024-04-05 浙江工业大学 基于主动对比学习的人机不同步识别模型构建方法及系统
CN118094105A (zh) * 2024-03-25 2024-05-28 广州探域科技有限公司 基于动态信息的模型增量微调方法、系统、设备及介质
CN118094105B (zh) * 2024-03-25 2024-10-15 广州探域科技有限公司 基于动态信息的模型增量微调方法、系统、设备及介质

Also Published As

Publication number Publication date
CN115984653B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
CN110580500B (zh) 一种面向人物交互的网络权重生成少样本图像分类方法
CN114241282B (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN111724083B (zh) 金融风险识别模型的训练方法、装置、计算机设备及介质
Hao et al. An end-to-end architecture for class-incremental object detection with knowledge distillation
CN111191791B (zh) 基于机器学习模型的图片分类方法、装置及设备
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN112446423B (zh) 一种基于迁移学习的快速混合高阶注意力域对抗网络的方法
CN115984653B (zh) 一种动态智能货柜商品识别模型的构建方法
US20220215259A1 (en) Neural network training method, data processing method, and related apparatus
CN112819023A (zh) 样本集的获取方法、装置、计算机设备和存储介质
CN110175657B (zh) 一种图像多标签标记方法、装置、设备及可读存储介质
Yang et al. Active matting
CN113011487B (zh) 一种基于联合学习与知识迁移的开放集图像分类方法
CN114298122A (zh) 数据分类方法、装置、设备、存储介质及计算机程序产品
CN110163252A (zh) 数据分类方法及装置、电子设备、存储介质
CN115063664A (zh) 用于工业视觉检测的模型学习方法、训练方法及系统
CN114782752A (zh) 基于自训练的小样本图像集成分类方法及装置
CN111062406B (zh) 一种面向异构领域适应的半监督最优传输方法
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN116975686A (zh) 训练学生模型的方法、行为预测方法和装置
CN117252204A (zh) 一种联邦对比对抗知识蒸馏的机器账号检测方法及装置
CN114067155B (zh) 基于元学习的图像分类方法、装置、产品及存储介质
CN109726690B (zh) 基于DenseCap网络的学习者行为图像多区域描述方法
CN112784927A (zh) 一种基于在线学习的半自动图像标注方法
CN112686277A (zh) 模型训练的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant