CN113095383A

CN113095383A - 一种辅助销售物料识别方法及装置

Info

Publication number: CN113095383A
Application number: CN202110341560.3A
Authority: CN
Inventors: 周海玲; 严蕤; 黄志艺; 梁柱锦; 郭怡适
Original assignee: Imagedt Co ltd
Current assignee: Imagedt Co ltd
Priority date: 2021-03-30
Filing date: 2021-03-30
Publication date: 2021-07-09

Abstract

本发明公开了一种辅助销售物料识别方法及装置，该方法包括：对辅助销售物料的图像数据进行通用类别的数据标注得到标注数据；对标注数据进行预处理后输入至检测模型中进行训练，并通过优化调参直至检测模型收敛，得到最优检测模型；将待识别辅助销售物料的图像数据输入至最优检测模型中，输出待识别辅助销售物料的位置信息；根据位置信息，将待识别辅助销售物料的图像数据裁剪得到若干待匹配图像，将若干待匹配述图像输入至特征提取模型中进行特征提取与匹配，得到待识别辅助销售物料的识别结果。本发明实施例对图像数据进行通用类别的数据标注，能够有效提高标注的速度以及标注质量，从而能够有效缩短建模周期，提高建模的效率。

Description

一种辅助销售物料识别方法及装置

技术领域

本发明涉及图像识别技术领域，尤其是涉及一种辅助销售物料识别方法及装置。

背景技术

辅助销售物料(POSM)识别在零售领域中占据着相当重要的一环，如吊旗，冰箱贴，地贴店招，横幅，海报，宣传单张，价格牌，跳跳卡，瓶颈标签，吊牌，促销纪念品，堆头，端架，促销台等物料的智能识别，不仅能够给业务员带来了极大的便利，而且能够充分展现了卖场和商家丰富的促销活动信息。但是在实际识别的过程中，由于POSM的种类繁多，形状多变不规则，不同卖场不同的文案信息等因素，导致识别准确率并不高，因此，在AI零售领域，如何更加高效快速的实现POSM的识别，是一个亟待解决的问题。

现有的辅助销售物料识别方法通常是基于纯检测分类来实现的，具体为：采集数据，进行数据类别和位置的标注，再利用深度学习中的检测模型进行训练，以得到一个可分类的检测模型。但是现有的辅助销售物料识别方法需要投入较大的数据标注成本，导致建模效率较低，难以满足商家需求。

发明内容

本发明提供一种辅助销售物料识别方法及装置，以解决现有的辅助销售物料识别方法需要投入较大的数据标注成本，导致建模效率较低，难以满足商家需求的技术问题。

本发明的第一实施例提供了一种辅助销售物料识别方法，包括：

采集辅助销售物料的图像数据，对所述图像数据进行通用类别的数据标注得到标注数据；

对所述标注数据进行预处理后得到预处理数据，将所述预处理数据输入至检测模型中进行训练，并通过优化调参直至所述检测模型收敛，得到最优检测模型；

将待识别辅助销售物料的图像数据输入至所述最优检测模型中，输出所述待识别辅助销售物料的位置信息；

根据所述位置信息，将所述待识别辅助销售物料的图像数据裁剪得到若干待匹配图像，将若干所述待匹配述图像输入至特征提取模型中进行特征提取与匹配，得到所述待识别辅助销售物料的识别结果。

进一步的，所述对所述标注数据进行预处理后得到预处理数据，将所述预处理数据输入至检测模型中进行训练，并通过优化调参直至所述检测模型收敛，得到最优检测模型，具体为：

采用数据增强方法和归一化对所述标注数据进行预处理得到预处理数据；所述检测模型为包括三个stage的CascadeRCNN网络，骨干网络为ResNet50，损失函数包括交叉熵损失CrossEntropyLoss和平滑之后的L1损失SmoothL1Loss。

进一步的，将若干所述待匹配图像输入至特征提取模型中进行特征提取与匹配，得到所述待识别辅助销售物料的识别结果，具体为：

将所述若干待匹配图像按照预设比例分为训练集、验证集和测试集，将所述训练数据进行数据预处理后，输入至预训练模型的卷积模块中；

对所述预训练模型进行调优直至所述预训练模型收敛，得到最优的特征提取与匹配模型；

将若干所述待匹配图像输入至所述特征提取与匹配模型中进行特征提取，得到特征向量；将预先筛选的模板库输入所述特征提取与匹配模型中进行特征提取，得到特征库；

将所述特征向量与所述特征库进行匹配得到匹配结果，在所述匹配结果中选择置信度最高的特征类别作为所述待识别辅助销售物料的识别结果。

进一步的，将若干所述待匹配图像输入至所述特征提取与匹配模型中进行特征提取，得到特征向量，包括：

将若干所述待匹配图像输入至所述特征提取与匹配模型中进行特征提取，以所述特征提取与匹配模型的第二个全连接层的输出作为最终特征输出得到特征向量。

进一步的，所述将所述特征向量与所述特征库进行匹配得到匹配结果，具体为：

采用欧式距离计算特征相似度，根据所述特征相似度得到匹配结果。

本发明的第二实施例提供了一种辅助销售物料识别装置，包括：

标注模块，用于采集辅助销售物料的图像数据，对所述图像数据进行通用类别的数据标注得到标注数据；

优化模块，用于对所述标注数据进行预处理后得到预处理数据，将所述预处理数据输入至检测模型中进行训练，并通过优化调参直至所述检测模型收敛，得到最优检测模型；

输出模块，用于将待识别辅助销售物料的图像数据输入至所述最优检测模型中，输出所述待识别辅助销售物料的位置信息；

特征提取与匹配模块，用于根据所述位置信息，将所述待识别辅助销售物料的图像数据裁剪得到若干待匹配图像，将若干所述待匹配述图像输入至特征提取模型中进行特征提取与匹配，得到所述待识别辅助销售物料的识别结果。

进一步的，所述优化模块，具体包括：

进一步的，所述特征提取与匹配模块，包括：

本发明实施例对图像数据进行通用类别的数据标注，不仅能够有效提高标注的速度以及标注质量，而且已标注好的数据无需重新标注即可实现新增建模，从而能够有效缩短建模周期，提高建模的效率。

附图说明

图1是本发明实施例提供的一种辅助销售物料识别方法的流程示意图；

图2是本发明实施例提供的一种辅助销售物料识别方法的另一流程示意图；

图3是本发明实施例提供的一种辅助销售物料识别方法的又一流程示意图；

图4是本发明实施例提供的一种辅助销售物料识别装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在本申请的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本申请的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。

请参阅图1-3，在本发明的第一实施例中，本发明的第一实施例提供了图1所示的一种辅助销售物料识别方法，包括：

S1、采集辅助销售物料的图像数据，对图像数据进行通用类别的数据标注得到标注数据；

S2、对标注数据进行预处理后得到预处理数据，将预处理数据输入至检测模型中进行训练，并通过优化调参直至检测模型收敛，得到最优检测模型；

S3、将待识别辅助销售物料的图像数据输入至最优检测模型中，输出待识别辅助销售物料的位置信息；

S4、根据位置信息，将待识别辅助销售物料的图像数据裁剪得到若干待匹配图像，将若干待匹配述图像输入至特征提取模型中进行特征提取与匹配，得到待识别辅助销售物料的识别结果。

作为本发明实施例的一种具体实施方式，对标注数据进行预处理后得到预处理数据，将预处理数据输入至检测模型中进行训练，并通过优化调参直至检测模型收敛，得到最优检测模型，具体为：

采用数据增强方法和归一化对标注数据进行预处理得到预处理数据；检测模型为包括三个stage的CascadeRCNN网络，骨干网络为ResNet50，损失函数包括交叉熵损失CrossEntropyLoss和平滑之后的L1损失SmoothL1Loss。

示例性的，数据增强方法包括图像随机裁剪，图像旋转，加PCA噪声和随机shear等。将预处理数据输入至检测模型中进行训练的公式表达如下：

其中，M为类别数，作为本发明实施例的一种具体实施方式，M＝2；

作为本发明实施例的一种具体实施方式，将若干待匹配图像输入至特征提取模型中进行特征提取与匹配，得到待识别辅助销售物料的识别结果，具体为：

将若干待匹配图像按照预设比例分为训练集、验证集和测试集，将训练数据进行数据预处理后，输入至预训练模型的卷积模块中；

示例性的，根据8:1:1的比例将若干待匹配图像分为训练集、验证集和测试集，将训练集随机裁剪、图像旋转、加高斯噪声等数据增强操作后，输入至预先设计好的卷积模块中。需要说明的是，本发明实施例采用密集连接网络作为预训练模型，本发明中的待匹配图像的总量量级在10⁷，且类别数量达到预设标准，每一待匹配图像的尺寸为224x224像素。

本发明实施例采用密集连接网络作为预训练模型，并对第五个池化层pool5进行fine-tune，损失函数为CrossEntropyLoss，公式如下：

其中，M为类别数，M的值为10⁵量级以上，能够有效提高训练得到的最优的特征提取与匹配模型的特征表达能力。

对预训练模型进行调优直至预训练模型收敛，得到最优的特征提取与匹配模型；

将若干待匹配图像输入至特征提取与匹配模型中进行特征提取，得到特征向量；将预先筛选的模板库输入特征提取与匹配模型中进行特征提取，得到特征库；

将特征向量与特征库进行匹配得到匹配结果，在匹配结果中选择置信度最高的特征类别作为待识别辅助销售物料的识别结果。

本发明实施例采用密集连接网络作为主干网络的卷积网络，能够有效提高特征的复用率，而且采用数据增强以及归一化对数据进行预处理，能够获取丰富的训练样本数据，从而能够进一步提高对辅助销售物料识别的准确率。

作为本发明实施例的一种具体实施方式，将若干待匹配图像输入至特征提取与匹配模型中进行特征提取，得到特征向量，包括：

将若干待匹配图像输入至特征提取与匹配模型中进行特征提取，以特征提取与匹配模型的第二个全连接层的输出作为最终特征输出得到特征向量。

基于上述通过检测模型得到的若干待匹配图像，将其输入至特征提取与匹配模型中进行特征提取，并采用特征提取与匹配模型中第二个全连接层fc2_output的输出作为最终特征输出，得到比较高层的特征向量V_q；同时，在特征提取与匹配模型中输入经过预先筛选的具备代表性的模板库，对该模板库进行特征提取，以生产特征库G。

作为本发明实施例的一种具体实施方式，将特征向量与特征库进行匹配得到匹配结果，具体为：

采用欧式距离计算特征相似度，根据特征相似度得到匹配结果。

本发明实施例将特征向量V_q与特征库G进行匹配，并采用欧式距离计算特征相似度，公式为：

其中，X和Y均是n维的特征，本发明中特征维度是1024维，在得到匹配结果后，输出匹配结果中置信度最高的feature对应的类别label作为最终的识别结果。

请参阅图2，,是本发明实施例提供的一种辅助销售物料识别方法的另一流程示意图。

请参阅图3，是本发明实施例提供的一种辅助销售物料识别方法的又一流程示意图。

实施本发明实施例，具有以下有益效果：

本发明实施例无需对不同类别的辅助销售物料的图像数据进行类别区分标注，将所有的辅助销售物料类别视为通用的类别，对图像数据进行通用类别的数据标注，能够有效提高标注的速度以及标注质量，能够有效缩短建模周期，提高建模的效率；本发明实施例的标注模式能够很好支撑新产品的快速建模，无需更新标注和检测模型，仅需将待识别的辅助销售物料模板图调价至模板库中，即可实现对新的辅助销售物料的识别，从而能够实现快速迭代，够有效缩短建模周期，提高建模的效率。

进一步地，本发明实施例采用密集连接网络作为主干网络的卷积网络，且采用数据增强以及归一化对数据进行预处理，不仅能够有效提高特征的复用率，同时，采用数据增强以及归一化处理能够获取丰富的训练样本数据，从而能够进一步提高对辅助销售物料识别的准确率。

请参阅图4，本发明的第二实施例提供了一种辅助销售物料识别装置，包括：

标注模块10，用于采集辅助销售物料的图像数据，对图像数据进行通用类别的数据标注得到标注数据；

优化模块20，用于对标注数据进行预处理后得到预处理数据，将预处理数据输入至检测模型中进行训练，并通过优化调参直至检测模型收敛，得到最优检测模型；

输出模块30，用于将待识别辅助销售物料的图像数据输入至最优检测模型中，输出待识别辅助销售物料的位置信息；

特征提取与匹配模块40，用于根据位置信息，将待识别辅助销售物料的图像数据裁剪得到若干待匹配图像，将若干待匹配述图像输入至特征提取模型中进行特征提取与匹配，得到待识别辅助销售物料的识别结果。

作为本发明实施例的一种具体实施方式，优化模块20，具体包括：

作为本发明实施例的一种具体实施方式，特征提取与匹配模块40，包括：

作为本发明实施例的一种具体实施方式将若干待匹配图像输入至特征提取与匹配模型中进行特征提取，得到特征向量，包括：

实施本发明实施例，具有以下有益效果：

进一步地，本发明实施例采用密集连接网络作为主干网络的卷积网络，且采用数据增强以及归一化对数据进行预处理，不仅能够有效提高特征的复用率，同时，采用数据增强以及归一化处理能够获取丰富的训练样本数据，从而能够进一步提高对辅助销售物料识别的准确率。以上是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种辅助销售物料识别方法，其特征在于，包括：

2.如权利要求1所述的辅助销售物料识别方法，其特征在于，所述对所述标注数据进行预处理后得到预处理数据，将所述预处理数据输入至检测模型中进行训练，并通过优化调参直至所述检测模型收敛，得到最优检测模型，具体为：

3.如权利要求1所述的辅助销售物料识别方法，其特征在于，将若干所述待匹配图像输入至特征提取模型中进行特征提取与匹配，得到所述待识别辅助销售物料的识别结果，具体为：

4.如权利要求3所述的辅助销售物料识别方法，其特征在于，将若干所述待匹配图像输入至所述特征提取与匹配模型中进行特征提取，得到特征向量，包括：

5.如权利要求3所述的辅助销售物料识别方法，其特征在于，所述将所述特征向量与所述特征库进行匹配得到匹配结果，具体为：

6.一种辅助销售物料识别装置，其特征在于，包括：

7.如权利要求6所述的辅助销售物料识别装置，其特征在于，所述优化模块，具体包括：

8.如权利要求6所述的辅助销售物料识别装置，其特征在于，所述特征提取与匹配模块，包括用于：

9.如权利要求8所述的辅助销售物料识别装置，其特征在于，将若干所述待匹配图像输入至所述特征提取与匹配模型中进行特征提取，得到特征向量，包括：

10.如权利要求8所述的辅助销售物料识别装置，其特征在于，所述将所述特征向量与所述特征库进行匹配得到匹配结果，具体为：