CN115984653A

CN115984653A - 一种动态智能货柜商品识别模型的构建方法

Info

Publication number: CN115984653A
Application number: CN202310109795.9A
Authority: CN
Inventors: 张健; 任子欣; 贺建飚; 陶泽; 熊友曹
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2023-02-14
Filing date: 2023-02-14
Publication date: 2023-04-18
Anticipated expiration: 2043-02-14
Also published as: CN115984653B

Abstract

本发明提供了一种动态智能货柜商品识别模型的构建方法，包括步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集，将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集，并分别用于特征提取网络g_σ的训练和特征提取有效性的验证；步骤S2、随机初始化基于半监督对比学习的深度模型的参数；步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度；步骤S4、构建动态智能货柜商品识别模型。本发明能够提高对未标注的无标签训练集数据的利用率，提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。

Description

一种动态智能货柜商品识别模型的构建方法

技术领域

本发明涉及动态智能货柜和计算机视觉技术领域，具体涉及一种动态智能货柜商品识别模型的构建方法。

背景技术

深度学习是学习样本数据的内在规律和表示层次，通过学习获得对诸如文字，图像和声音等数据的解释能力，最终让机器能够具有像人一样的分析、处理信息的能力。深度学习的基础即神经网络，伴随着超大规模计算技术的发展，神经网络的结构逐渐趋于复杂化、成熟化，衍生出了深度神经网络(Deep Neural Networks，DNN)、卷积神经网络(Convolutional Neural Network，CNN)和循环神经网络(Recurrent Neural Network，RNN)等多种不同的形式和结构。

神经网络的发展拓宽了人工智能的应用范围，在语音识别、图像处理、视频理解和自然语言处理等领域取得了巨大的成果，也提升了深度学习的应用效果及应用性能。但传统深度学习模型的训练面临如下许多问题：

1)需要大量带标记的训练数据，标注人工成本高昂、费时费力；

2)传统深度学习模型训练需要的计算和内存资源与传统深度学习模型规模成正比，往往需要大量带标签数据进行训练以获得具有可用性的模型，存在训练过程耗时，计算成本高等问题；

3)传统深度学习模型训练过程中可能出现过拟合、欠拟合等问题，需要对网络的框架结构或学习参数反复调整、修改；

4)传统深度学习模型面对任务类型和任务内容更新时，需要依赖大规模相关样本且具有较高训练时间成本；而基于优化的元学习方法利用二阶导数更新元模型，训练时计算资源需求高，往往只能通过降低模型复杂度在有限资源情况下获得收敛模型。

为解决上述问题，一些新的深度学习方法，如元学习和小样本学习等被提出，能够有效克服传统深度学习模型对数据需求量大、更新费时费力等问题。

然而，现有智能货柜大多使用海量货品数据直接拟合数据分布，针对智能货柜内货品类型的更新，传统深度学习模型无法轻量级响应智能货柜内商品组合多样性及场景变化，缺乏主动适配多场景应用的能力。同时，传统深度学习模型只能使用已有的标注数据，而在智能货柜运营中会产生大量新的未标注数据，传统深度学习模型缺乏对未标注数据的利用和挖掘。

发明内容

本发明目的在于提供一种动态智能货柜商品识别模型的构建方法，采用半监督对比学习和元学习组合使用，能够提升所述动态智能货柜商品识别模型适配多场景应用的能力，并在减少对已标注的带标签训练集数据需求的情况下，进一步提高对未标注的无标签训练集数据的利用率，提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。其具体技术方案如下：

一种动态智能货柜商品识别模型的构建方法，包括以下步骤：

步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集，将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集，并分别用于特征提取网络g_σ的训练和特征提取有效性的验证；

步骤S2、随机初始化基于半监督对比学习的深度模型的参数，所述深度模型的参数包括所述特征提取网络g_σ的参数σ和用于评估特征提取网络g_σ性能的分类器的参数，其中，参数σ表示特征提取网络各卷积层权重、学习率、权重衰减系数；

利用所述带标签训练集的数据进行热启动训练，直至商品分类的准确率达到设定的阈值；

步骤S3、使用所述深度模型为所述无标签训练集预测伪标签数据集以及置信度；

选取置信度不低于0.8的样本作为伪标签数据集；将所述带标签训练集和伪标签数据集混合并从中采样训练任务构成集合数据，使用批训练策略将所述集合数据分为等大的批，对所述深度模型进行训练和参数更新，直至损失不高于0.5，使得所述深度模型收敛，并在所述测试集上的分类任务表现出可用性能，获得可用的所述特征提取网络g_σ；

步骤S4、构建动态智能货柜商品识别模型

具体构建过程如下，为动态智能货柜中的待测商品识别准备元学习阶段数据集，将元学习阶段数据集的数据信息输入到步骤S3获得的所述特征提取网络g_σ中，由所述特征提取网络g_σ提取得到数据特征图，将所述数据特征图和商品识别任务输入到元模型f_θ，由所述元模型f_θ输出待测商品识别结果，从而构建得到适应于不同应用场景下动态智能货柜中商品识别任务的动态智能货柜商品识别模型。

可选的，在步骤S4中，将所述元学习阶段数据集划分为元训练集和元测试集；

所述元训练集是在通用数据集上随机抽取的多组训练任务构成的任务集合T^train＝{T^train ₁，T^train ₂，......，T^train _i，......，T^train _m}，每个任务T^train _i均由N个类别的样本组成，每个任务T^train _i均分为元训练支持集和元训练查询集，用于训练元模型f_θ；

所述元测试集由特定应用场景及商品组成下的识别任务的商品数据集构成，随机从所述商品数据集中抽取多组训练任务构成的任务集合T^test＝{T^test ₁，T^test ₂，......，T^test _i，......，T^test _m}，每个任务T^test _i均由N个类别的样本组成，每个任务T^test _i均分为元测试支持集和元测试查询集，用于微调元训练阶段获得的元模型f_θ；

在所述元训练集和元测试集中的m均为不小于100的自然数。

可选的，在步骤S4中还包括以下数据处理步骤：

步骤S4a、随机初始化元模型f_θ中的参数θ，其中，参数θ表示元模型各卷积层权重、学习率、权重衰减系数；

步骤S4b、从所述元训练集中随机抽取多个任务T^train _i，构成一个训练批，其中，T^train _i服从任务分布p(T^train)；在每个任务T^train _i中的每个类别中均抽取K个数据样本，其中，1≤K≤M，M表示N类别中的某一类别m在元训练集中带标签样本总数；将N类别中的各K个数据样本输入到步骤S3获得的所述特征提取网络g_σ中，由所述特征提取网络g_σ提取得到数据特征图；

步骤S4c、根据步骤S4b所输入的数据样本的类别，将所述数据特征图映射到对应商品类别的高维特征空间上，获得映射结果；将所述映射结果输入到步骤S4a初始化的元模型f_θ中，用于对所述元训练支持集上的数据样本提取得到特征向量；采用损失函数对所述特征向量计算所述元模型f_θ中商品分类的损失值，使参数θ被更新优化，从而获得训练后的元模型f_θ；

步骤S4d、利用在ImageNet上预训练的ResNet网络构建特征匹配模块，通过所述特征匹配模块对待测商品建立所述商品识别任务；

步骤S4e、利用动态智能货柜中的元测试集微调训练后的所述元模型f_θ，当所述元模型f_θ在元测试支持集上的损失收敛不高于0.5时，将步骤S4d中建立的所述商品识别任务输入到所述元模型f_θ中，由所述元模型f_θ输出待测商品识别结果。

可选的，在步骤S4c中，参数θ被更新优化的过程如下：

步骤S4c-1、对于所述元训练集中的每一个任务T^train _i，采用所述损失函数计算所述任务T^train _i在所述元训练支持集上的商品分类的损失值

通过学习率为α的一阶梯度对所述参数θ进行更新，获得参数θ'_i：

在式(1)中，参数θ'_i表示元模型在根据任务T^train _i训练并更新后的参数；

表示损失函数的梯度；

步骤S4c-2、对于所述元训练集中的每一个任务T^train _i，采用所述损失函数计算所述任务T^train _i在所述元训练查询集上的商品分类的损失值

所述参数θ的更新是在所有任务T^train _i基础上，元模型参数θ优化的目标是：

在式(2)中，

表示任务T^train _i服从任务集合T^train分布；

表示在每个任务T^train _i上元模型对元训练支持集的预测损失值；

表示根据任务T^train _i更新后的元模型对元训练测试集的预测损失值；

步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为：

可选的，在步骤S4c中，重复步骤S4c-1至步骤S4c-3优化参数θ后，使得元模型f_θ在所述元训练查询集上的损失收敛低于0.5时，获得训练后的元模型f_θ。

可选的，在步骤S4c-1和步骤S4c-2中的所述损失函数为

在式(4)中，x^(j)为所述元训练集中的每一个任务T^train _i的数据集中的观测值；y^(j)为所述元训练集中的每一个任务T^train _i的数据集中的目标值；f_φ表示待优化模型的网络参数；

表示(x^(j),y^(j))属于任务集合T^train _i；f_φ(x^(j))表示x^(j)样本经过待优化模型处理后的特征图；logf_φ(x^(j))表示对特征图的值取对数。

可选的，在步骤S4d中，所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征，将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配，选择最相似的k个支持集样本建立所述商品识别任务，其中，k的取值范围为5-15。

可选的，在步骤S2中，所述阈值的范围为90％-95％。

可选的，所述商品数据集由智能货柜上的摄像头获取；所述商品数据集包括商品图片和商品类别信息。

可选的，所述元学习阶段数据集中的元训练集使用公共开源数据集；所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取；所述元学习阶段数据集包括商品图片和商品类别信息。

应用本发明的技术方案，至少具有以下有益效果：

(1)在动态智能货柜应用场景下，商品类别更新速度快、动态智能货柜部署环境差异大，本发明中所述动态智能货柜商品识别模型的构建方法采用半监督对比学习和元学习组合使用，对带标签商品数据(即步骤S1中的带标签训练集和步骤S4中的元测试支持集)需求量低、所述动态智能货柜商品识别模型可以实现在线更新，能够快速适应不同商品类别构成、不同任务及场景；同时，利用少量步骤S4中的元测试支持集中的带标签商品数据完成所述动态智能货柜商品识别模型的构建，能够快速迭代适应商品识别任务的变化和更新，高效完成鲁棒模型的训练及部署；另外，本发明基于半监督对比学习，在减少对已标注的带标签训练集数据需求的情况下，进一步提高对未标注的无标签训练集数据的利用率，提高所述动态智能货柜商品识别模型的泛化性和鲁棒性。

(2)本发明在步骤S4d中引入特征匹配模块，用于建立商品识别任务，在不增加训练成本的情况下，利用元学习方法对元测试支持集具有强依赖这一特性，提升元模型f_θ对所述商品识别任务的识别精度。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例1中的一种动态智能货柜商品识别模型的构建方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

参见图1，一种动态智能货柜商品识别模型的构建方法，包括以下步骤：

步骤S1、为动态智能货柜中的待测商品的特征提取准备用于半监督对比学习的商品数据集，将所述商品数据集随机划分为带标签训练集、无标签训练集和测试集，并分别用于特征提取网络g_σ的训练和特征提取有效性的验证，具体地，首先，利用带标签训练集作为所述深度模型的输入，训练模型使其能够在该训练集上正确分类输入样本，分类正确率反映了特征提取的有效性，当在带标签训练集上的分类任务达到正确率阈值即可利用所述深度模型对无标签训练集进行伪标签预测，获得伪标签数据集；其次，利用带标签训练集和伪标签数据集训练动态智能货柜商品识别模型，进而获得有效的特征提取网络g_σ；所述测试集用于验证所述特征提取网络g_σ的有效性；

所述商品数据集由智能货柜上的摄像头获取，具体操作为：多次模拟购物行为，打开智能货柜的柜门拿取柜内商品，通过智能货柜上的摄像头上传该模拟流程视频到文件服务器，利用标注软件对所有视频逐帧处理获取商品数据集；若该帧存在商品，则将其画面中的位置框出，生成位置坐标并标注该商品类别；根据上述操作获得的位置坐标对视频帧进行截图，获得商品图片及其标签，构建出带标签训练集的商品数据集，其包括商品图片和商品类别信息；

步骤S2、随机初始化基于半监督对比学习的深度模型的参数，所述深度模型的参数包括所述特征提取网络g_σ的参数σ和用于评估特征提取网络g_σ性能的分类器的参数，其中，参数σ表示特征提取网络各卷积层权重、学习率、权重衰减系数；所述分类器用于对特征提取网络g_σ提取到的高维特征进行线性分类，根据分类结果与样本实际标签的比较确定特征提取网络g_σ是否能够有效提取样本的深度特征，即分类结果是否正确；

选取置信度为0.8的样本作为伪标签数据集；将所述带标签训练集和伪标签数据集混合并从中采样训练任务构成集合数据，使用批训练策略将所述集合数据分为等大的批，对所述深度模型进行训练和参数更新，直至损失为0.5，使得所述深度模型收敛，并在所述测试集上的分类任务表现出可用性能，获得可用的所述特征提取网络g_σ；

步骤S4、构建动态智能货柜商品识别模型

具体构建过程如下，为动态智能货柜中的待测商品识别准备元学习阶段数据集，将元学习阶段数据集的数据信息输入到步骤S3获得的所述特征提取网络g_σ中，由所述特征提取网络g_σ提取得到数据特征图，将所述数据特征图和商品识别任务输入到元模型f_θ，由所述元模型f_θ输出待测商品识别结果，从而构建得到适应于不同应用场景下动态智能货柜中商品识别任务的动态智能货柜商品识别模型；所述元学习阶段数据集中的元训练集使用公共开源数据集，从官网上下载即可；所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取，具体操作为：多次模拟购物行为，打开智能货柜的柜门拿取柜内商品，通过智能货柜上的摄像头上传该模拟流程视频到文件服务器，利用标注软件对所有视频逐帧处理获取元测试集；若该帧存在商品，则将其画面中的位置框出，生成位置坐标并标注该商品类别；根据上述操作获得的位置坐标对视频帧进行截图，获得商品图片及其标签，构建出带标签元测试支持集，其包括商品图片和商品类别信息；

在步骤S4中，将所述元学习阶段数据集划分为元训练集和元测试集；

所述元测试集由特定应用场景及商品组成下的识别任务的商品数据集构成，随机从所述商品数据集中抽取多组训练任务构成的任务集合T^test＝{T^test ₁，T^test ₂，......，T^test _i，......，T^test _m}，每个任务T^test _i均由N个类别的样本组成，每个任务T^test _i均分为元测试支持集和元测试查询集，用于微调元训练阶段获得的元模型f_θ，为元模型f_θ提供先验知识，指导元模型f_θ对商品进行正确识别，提高商品识别模型的精度；

在所述元训练集和元测试集中的m均为不小于100的自然数。

在步骤S4中还包括以下数据处理步骤：

步骤S4c、根据步骤S4b所输入的数据样本的类别，将所述数据特征图映射到对应商品类别的高维特征空间上，获得映射结果；将所述映射结果输入到步骤S4a初始化的元模型f_θ中，用于对所述元训练支持集上的数据样本提取得到特征向量；采用损失函数对所述特征向量计算所述元模型f_θ中商品分类的损失值，具体地，所述损失值是通过交叉熵损失函数计算商品分类预测值(即元模型f_θ输出特征向量)与商品类别真实值的差异值，使参数θ被更新优化，从而获得训练后的元模型f_θ；

步骤S4e、利用动态智能货柜中的元测试集微调训练后的所述元模型f_θ，当所述元模型f_θ在元测试支持集上的损失收敛为0.5时，将步骤S4d中建立的所述商品识别任务输入到所述元模型f_θ中，由所述元模型f_θ输出待测商品识别结果。

在步骤S4c中，参数θ被更新优化的过程如下：

表示损失函数的梯度；

在式(2)中，

表示任务T^train _i服从任务集合T^train分布；

步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为：

在步骤S4c中，重复步骤S4c-1至步骤S4c-3优化参数θ后，使得元模型f_θ在所述元训练查询集上的损失收敛低于0.5时，获得训练后的元模型f_θ。

在步骤S4c-1和步骤S4c-2中的所述损失函数为

其采用交叉熵损失表示：

在步骤S4d中，所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征，将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配，选择最相似的k个支持集样本建立所述商品识别任务，其中，k的取值范围为5-15。

在步骤S2中，所述阈值的范围为95％。

相比于传统端到端深度识别模型，采用其训练单个商品SKU所需带标签数据量在600张及以上，本发明将带标签商品数据每个商品类别压缩到100-200张，可以取得和海量数据相同的识别精度。同时传统深度学习方案在商品类别发生变化时，需要耗费大量时间和计算成本重新训练模型，而本发明只需将智能货柜在售商品的带标签数据集作为元测试支持集更新即可，无需更改模型。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种动态智能货柜商品识别模型的构建方法，其特征在于，包括以下步骤：

步骤S4、构建动态智能货柜商品识别模型

2.根据权利要求1所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4中，将所述元学习阶段数据集划分为元训练集和元测试集；

在所述元训练集和元测试集中的m均为不小于100的自然数。

3.根据权利要求2所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4中还包括以下数据处理步骤：

4.根据权利要求3所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4c中，参数θ被更新优化的过程如下：

表示损失函数的梯度；

在式(2)中，

表示任务T^train _i服从任务集合T^train分布；

步骤S4c-3、采用学习率β的随机梯度下降优化参数θ为：

5.根据权利要求4所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4c中，重复步骤S4c-1至步骤S4c-3优化参数θ后，使得元模型f_θ在所述元训练查询集上的损失收敛低于0.5时，获得训练后的元模型f_θ。

6.根据权利要求5所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4c-1和步骤S4c-2中的所述损失函数为

表示(x^(j),y^(j))属于任务集合T^train _i；f_φ(x^(j))表示x^(j)样本经过待优化模型处理后的特征图；log f_φ(x^(j))表示对特征图的值取对数。

7.根据权利要求3-6任一项所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S4d中，所述商品识别任务的建立过程是采用所述特征匹配模块提取待测商品图像的深度特征，将所述深度特征与元测试支持集中所有的数据样本进行相似度匹配，选择最相似的k个支持集样本建立所述商品识别任务，其中，k的取值范围为5-15。

8.根据权利要求7所述的动态智能货柜商品识别模型的构建方法，其特征在于，在步骤S2中，所述阈值的范围为90％-95％。

9.根据权利要求8所述的动态智能货柜商品识别模型的构建方法，其特征在于，所述商品数据集由智能货柜上的摄像头获取；所述商品数据集包括商品图片和商品类别信息。

10.根据权利要求9所述的动态智能货柜商品识别模型的构建方法，其特征在于，所述元学习阶段数据集中的元训练集使用公共开源数据集；所述元学习阶段数据集中的元测试集由智能货柜上的摄像头获取；所述元学习阶段数据集包括商品图片和商品类别信息。