WO2023241102A1

WO2023241102A1 - 一种标签识别方法、装置、电子设备及存储介质

Info

Publication number: WO2023241102A1
Application number: PCT/CN2023/079023
Authority: WO
Inventors: 周靖超; 贾淇超; 刘浩; 周邦国; 滕辉; 李志远
Original assignee: 卡奥斯工业智能研究院(青岛)有限公司; 卡奥斯物联科技股份有限公司; 海尔数字科技(青岛)有限公司
Priority date: 2022-06-15
Filing date: 2023-03-01
Publication date: 2023-12-21
Also published as: CN114972880A

Abstract

本申请公开了一种标签识别方法、装置、电子设备及存储介质。该方法包括：获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像；利用标签预测网络预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度；利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。

Description

一种标签识别方法、装置、电子设备及存储介质

本申请要求在2022年6月15日提交中国专利局、申请号为202210676549.7的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及计算机技术，例如涉及一种标签识别方法、装置、电子设备及存储介质。

背景技术

工厂的产线中的质检环节，一般由质检员完成，以防止不良产品流入市场，质检环节涉及到附件贴标型号确认、产品部件装配质量确认、产品表面划痕缺陷检测等流程，需要多名质检人员配合完成。工厂产线上大多采用混产的方式，一些产品仅是内部零部件型号不同，外观尺寸区别不是很大，导致产品型号、贴标种类繁多，且诸如能耗帖、产品铭牌、警示贴、耗电量等，字体小、编号长，质检人员核对耗时，不同产品的不同贴标极易混淆，漏检、误检的情况也时有发生，追溯也比较困难。针对上述问题相关技术大多采用光学字符识别(Optical Character Recognition，OCR)方法来替代人工进行自动识别贴标图像中的文字内容，可以有效提高检测效率和准确率，由于传统OCR识别方法获取到的图像预处理步骤较多，易产生误差从而降低识别率，同时多个环节需要人工参与，难以实现自动化，而且识别灵活性较差，对复杂样本识别率较低。

发明内容

本申请提供一种标签识别方法、装置、电子设备及存储介质，以实现在无人员参与的情况下，自动识别标签中的内容。

第一方面，本申请实施例提供了一种标签识别方法，包括：

获取物品的贴标图像，并对所述贴标图像进行预处理，得到待识别图像；

利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度；

利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签。

第二方面，本申请实施例还提供了一种标签识别装置，该装置包括：

图像获取模块，设置为获取物品的贴标图像，并对所述贴标图像进行预处理，得到待识别图像；

网络预测模块，设置为利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度；

标签确定模块，设置为利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签。

第三方面，本申请实施例还提供了一种电子设备，该电子设备包括：

至少一个处理器；

存储装置，设置为存储至少一个程序，

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述的标签识别方法。

第四方面，本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述的标签识别方法。

附图说明

图1是本申请实施例提供的标签识别方法的一个流程示意图；

图2是本申请实施例提供的标签识别方法的另一流程示意图；

图3是本申请实施例提供的标签识别装置的一个结构示意图；

图4是本申请实施例提供的电子设备的一个结构示意图。

具体实施方式

下面结合附图和实施例对本申请作详细说明。

图1为本申请实施例提供的标签识别方法的一个流程示意图，该方法可以由本申请实施例提供的标签识别装置来执行，该装置可采用软件和/或硬件的方式实现。在一个具体的实施例中，该装置可以集成在电子设备中，电子设备比如可以是服务器。以下实施例将以该装置集成在电子设备中为例进行说明，参考图1，该方法可以包括如下步骤：

S110、获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像。

示例地，贴标图像可以来自图像采集设备，图像采集设备可以是摄像头、录像机等具有图像采集功能的设备，贴标图像可以是实时采集的图像，也可以是预先采集的图像；当贴标图像为实时采集的图像时，可以是图像采集设备在物品的工厂产线上或预设区域上实时采集的图像，这种情况下，即利用实时图像实时对当前场景中物品的标签进行识别；当贴标图像为预先采集的图像时，贴标图像可以是贴标图像库中任意一张图像，这种情况下，即对预先采集的贴标图像识别当时场景中的物品标签，可以是预先采集的贴标图像中的物品标签内容无法查找或丢失的情况下。待识别图像可以是利用预处理技术对贴标图像进行预处理后的图像，具有较贴标图像更高的清晰度。

具体实现中，在获取物品的贴标图像之后，可以对贴标图像进行预处理，以改善贴标图像质量，得到待识别图像；比如：可以对获取的贴标图像进行灰度化、图像增强、倾斜监测与校正、高斯滤波等图像处理方法，消除图像噪点、节约计算资源、提高图像质量和图像处理速度，以保证物品的标签检测和识别准确度和精度。其中，先对物品条码进行扫描获取物品的序列号，该序列号可以是物品摆放或存放位置的编号，也可以是生产物品对应的编号，同时利用图像采集设备获取物品的贴标图像，该贴标图像中包含物品待识别标签的图像内容，并将物品的序列号与物品的贴标图像关联存储，以确定识别出标签对应的物品。

S120、利用标签预测网络预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度。

示例地，标签预测网络可以是用于对待识别图像中物品的标签进行识别的神经网络，其中，标签预测网络包括卷积网络和长短记忆网络，其中，卷积网络用于提取待识别图像中的图像特征，并根据待识别图像中图像特征进行像素级别的图像分割，确定出待识别图像中的检测区域，进而得到检测区域内的特征向量。其中，检测区域可以是待识别图像中标签所对应的图像区域，检测区域内的特征向量可以是检测区域内通过图像特征提取文字特征序列形成的向量。其中，长短记忆网络可以是用于捕获卷积网络输出的检测区域内的特征向量的前向信息和后向信息，并在卷积层的基础上融合检测区域的特征向量以提取文字特征序列的上下文特征，预测文字特征序列中的每一个特征向量标签分布及每列特征的概率分布。待识别图像中的多个预测标签可以是长短记忆网络输出待识别图像中标签所对应的图像区域中标签的多个预测结果，多个预测标签中每个预测标签的置信度可以是长短记忆网络输出待识别图像中标签所对应的图像区域中标签的多个预测结果对应的概率值。

具体实现中，将待识别图像输入标签预测网络中的卷积网络中，通过卷积网络提取待识别图像中的图像特征信息，并通过对卷积网络中卷积层进行上采样，得到与待识别图像尺寸一致的图像，利用待识别图像与上采样后的图像进行一一对应，将上采样后的图像进行像素级别的分类，从抽象的特征中恢复每个像素所属的类型，得到像素级别分类后的二维热力图。基于二维热力图进行目标检测和边缘检测，根据热力图中标签特征对图像进行像素级别的图像分割，实现对待识别图像中检测区域的精准定位和精准分割，获取检测区域内的图像特征，并根据检测区域内的图像特征进行文本检测提取文字特征序列，进而得到待识别图像的特征向量。利用长短记忆网络从待识别图像的特征向量中捕获文字特征序列的前向信息和后向信息，并基于待识别图像的特征向量提取文字特征序列的上下文特征，利用文字特征序列的上下文特征对检测区内的标签文本进行预测，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度。

本申请实施例中，卷积网络中可以是由多个卷积层进行待识别图像中图像特征的提取，卷积网络可以采用全卷积网络(Fully Convolutional Network，FCN)，以实现对任意尺寸图像进行卷积，并可以得到标好每个像素类别概率值的图像，针对卷积网络中最后一个卷积层的特征图进行上采样，以使得通过卷积层后的图像可以恢复与待识别图像相同的尺寸大小，并对相同尺寸大小的两张图像保留像素间的关联关系，其中，每一个像素都可以产生一个预测。

S130、利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。

具体实现中，将多个预测标签及每个预测标签的置信度输入标签确定模型，标签确定模型输出可以是目标标签中内容，标签确定模型可以根据每个预测标签的置信度，得到物品的目标标签，目标标签可以是待识别图像中检测区域内的文本信息，该文本信息可以是物品的关键信息，比如：物品的属性信息、物品的功能信息、物品的参数。标签确定模型可以是根据训练样本训练得到的。其中，还可以将确定出的物品的目标标签中的标签内容，经过去除空格和去重操作，以便于提高识别出物品的目标标签的质量。

本申请实施例中，通过获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像；利用标签预测网络预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度；利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。本申请实施例，通过对贴标图像进行预处理改善贴标图像质量，进而提高标签识别的准确度，并通过标签预测网络对待识别图像进行标签识别，得到多个预测标签，再结合标签确定模型对多个预测标签进行筛选或确定得到目标标签，提升识别的效率和准确率，可以在无人员参与的情况下，自动识别标签中的内容，避免环境对识别效果的影响。

下面进一步描述本申请实施例提供的标签识别方法，如图2所示，该方法可以包括如下步骤：

S210、获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像。

S220、利用卷积网络提取待识别图像中检测区域的特征向量。

具体实现中，待识别图像中检测区域可以是卷积网络特征提取后根据不同像素级别图像分割确定出的待识别图像中标签所对应的图像区域。待识别图像中检测区域的特征向量可以是根据待识别图像中检测区域的图像特征进行文本检测后提取检测区域内文本特征序列形成的向量。将待识别图像输入卷积网络，得到待识别图像的图像特征，基于待识别图像的图像特征，并对特征提取后图像进行上采样，使得特征提取后的图像和待识别图像的尺寸大小一致，并保留特征提取后的图像和待识别图像像素间的关联关系。对特征提取后的图像进行像素级别的分类，得到待识别图像的二维热力图。根据二维热力图对待识别图像进行像素级别的图像分割，并根据标签特征确定出待识别图像中检测区域，并根据对检测区域内的图像特征进行文本检测，提取检测区域的特征向量。

可选的，卷积网络包括卷积层和反卷积层，利用卷积网络提取待识别图像中检测区域的特征向量，包括：

将待识别图像输入卷积层提取待识别图像中图像特征，并使用反卷积层对卷积层进行上采样，得到卷积图像，卷积图像与待识别图像的像素间存在关联；

对卷积图像进行像素分类，得到待识别图像的二维热力图，并根据二维热力图对待识别图像进行图像分割，确定出待识别图像中的检测区域，对检测区域内的图像特征进行文本检测，得到检测区域的特征向量。

示例地，待识别图像中图像特征可以是利用卷积层从待识别提取到的图像特征信息，可以是待识别图像中物体的边界信息、灰度信息和文字信息等信息。其中，卷积网络包括卷积层和反卷积层，其中，卷积层用于提取待识别图像中图像特征，反卷积层用于对卷积层进行上采样。卷积图像可以是通过反卷积层进行上采样之后的输出的与待识别图像保持同样尺寸大小的图像，卷积图像保存了与待识别图像像素之间的关系。二维热力图可以是用于区分待识别图像中不同像素类别的图像，可以直观的看出不同像素所在的区域位置，可以利用二维热力图精准定位和分割出检测区域。

具体实现中，将待识别图像输入卷积网络，得到待识别图像的图像特征，基于待识别图像的图像特征，并对特征提取后图像进行上采样，使得特征提取后的图像和待识别图像的尺寸大小一致，并保留特征提取后的图像和待识别图像像素间的关系。对特征提取后的图像进行像素的分类，得到待识别图像的二维热力图。根据二维热力图对待识别图像进行像素级别的图像分割，并根据标签特征确定出待识别图像中检测区域，并根据对检测区域内的图像特征进行文本检测，提取检测区域内的图像特征中的文字特征，得到检测区域的特征向量。

S230、利用长短记忆网络根据特征向量的语义关系提取特征向量的文字特征，并根据文字特征预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度。

示例地，特征向量的语义关系可以是检测区域内的特征向量的前向信息和后向信息，其中，前向信息可以是检测区域内待预测标签内容对应的向前进行语义传递的信息，即检测区域内待预测标签内容相关联的前面语义信息，后向信息可以是检测区域内待预测标签内容对应的向后进行语义传递的信息，即检测区域内待预测标签内容相关联的后面语义信息，比如：图像中的标签信息为123456X890，其中“X”是待预测标签内容，“12345”为前向信息，“890”为后向信息，其中，前向信息也可以是待预测标签内容前向内容对应的特征信息，后向信息也可以是待预测标签内容后向内容对应的特征信息。特征向量的文字特征可以是特征向量文字序列排列规律。

具体实现中，将检测区域的特征向量输入长短记忆网络，长短记忆网络捕获卷积网络输出的检测区域的特征向量中文字特征序列的前向信息和后向信息，得到特征向量的语义关系，并根据特征向量的语义关系和检测区域的特征向量进行特征融合后提取检测区域待预测标签内容的文字特征。根据文字特征预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度。其中，长短记忆网络是通过训练样本进行训练后的神经网络，其中，可以通过文字特征预测检测区域中待预测标签的内容。其中，待预测标签内容可以是通过卷积网络未识别出的待识别图像中检测区域内的标签内容，需要根据长短记忆网络进行内容预测，其中，待预测标签内容可以是一个字符，也可以是多个字符，当待预测标签内容是一个字符时，可以通过对该字符位置进行预测，即多个预测标签及多个预测标签中每个预测标签的置信度可以是对该位置字符预测和置信度；当待预测标签内容是多个字符时，可以是分别对多个字符位置进行预测后，分别得到多个字符位置的预测字符和置信度，根据多个字符位置的预测字符和置信度进行计算，得到多个预测标签及多个预测标签中每个预测标签的置信度。

可选的，利用长短记忆网络根据特征向量的语义关系提取特征向量的文字特征，并根据文字特征预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度，包括：

将检测区域的特征向量输入长短记忆网络，得到特征向量的语义关系，并根据特征向量的语义关系提取特征向量的文字特征；

根据文字特征预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度。

可选的，利用标签预测网络预测待识别图像中的标签，还包括：

将待识别图像输入至标签预测网络，得到待识别图像的识别错误信息，并根据识别错误信息进行故障预警。

示例地，识别错误信息可以是在标签预测网络未预测出待识别图像中的标签内容时对应发出的信息，识别错误信息用于提示待识别图像中标签无法识别或待识别图像标签不能满足标签预测网络的预测条件，并根据识别错误信息触发报警功能进行故障预警，需要标签预测网络进行重新训练或者对待识别图像进行重新拍摄或者预处理。

S240、利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。

可选的，标签确定模型按照如下方式获取：

获取训练样本，其中，训练样本包含多张识别图像，每张识别图像中包含多个预测标签及多个预测标签中每个预测标签的置信度；

利用时序类分类模型对训练样本中的每张识别图像中多个预测标签及多个预测标签中每个预测标签的置信度进行筛选，得到每张识别图像对应的目标标签；

根据每张识别图像对应的目标标签和每张识别图像对应的实际标签计算损失函数；

根据损失函数进行反向传播以优化时序类分类模型，得到标签确定模型。

示例地，训练样本可以是根据标签识别内容搜集的包含标签识别内容的图像集，并预先对训练样本中多张识别图像通过标签预测网络预测出的每张识别图像中包含多个预测标签及多个预测标签中每个预测标签的置信度进行标记，并在每张识别图像中标记每张识别图像对应的实际标签。时序类分类模型可以是根据时序类类别的神经网络，设置为对多个预测标签及多个预测标签中每个预测标签的置信度进行筛选或识别，得到每张识别图像对应的目标标签。每张识别图像对应的实际标签可以是训练样本中每张识别图像对应的实际标签内容，用于对标签确定模型进行模型训练。

具体实现中，获取训练样本中多张识别图像，预先对多张识别图像进行预处理，并将预处理后的多张识别图像输入标签预测网络，得到每张识别图像的多个预测标签及多个预测标签中每个预测标签的置信度。将每张识别图像的多个预测标签及多个预测标签中每个预测标签的置信度输入时序类分类模型进行标签确定，得到每张识别图像对应的目标标签。根据每张识别图像对应的目标标签和每张识别图像对应的实际标签计算损失函数，得到损失函数的熵值。根据损失函数的熵值确定时序类分类模型是否收敛，并根据损失函数的熵值进行反向传播以优化时序类分类模型的参数，直至损失函数的熵值小于预设熵值阈值，确定时序类分类模型收敛，得到标签确定模型。

S250、从物品的目标标签中提取属性信息，并将属性信息和贴标图像关联存储至信息数据库中，以使得根据贴标图像查询物品的属性信息。

具体实现中，属性信息可以是物品的目标标签内容中具有物品属性的信息，比如：能耗帖型号、铭牌编号、综合耗电量等。信息数据库可以是存储物品相关信息的数据库，可以用于工厂的制造执行系统中，通过关联存储的形式将物品的条码、贴标图像和属性信息存储值信息数据库中，以便于后续对物品进行追溯和查询。其中，完成对物品的目标标签进行标签识别后，可以采用正则化过滤、搜索算法等处理识别的目标标签，提取物品的目标标签中物品的属性信息。

本申请实施例中，通过获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像；利用标签预测网络预测待识别图像中的标签，得到待识别图像的多个预测标签及多个预测标签中每个预测标签的置信度；利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。即，本申请实施例，通过对贴标图像进行预处理改善贴标图像质量，进而提高标签识别的准确度，并通过标签预测网络对待识别图像进行标签识别，得到多个预测标签，再结合标签确定模型对多个预测标签进行筛选或确定得到目标标签，提升识别的效率和准确率，可以在无人员参与的情况下，自动识别标签中的内容，避免环境对识别效果的影响。

图3是本申请实施例提供的标签识别装置的结构示意图，如图3所示，该标签识别装置包括：

图像获取模块310，设置为获取物品的贴标图像，并对所述贴标图像进行预处理，得到待识别图像；

网络预测模块320，设置为利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度；

标签确定模块330，设置为利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签。

一实施例中，所述网络预测模块320所述标签预测网络包括卷积网络和长短记忆网络，所述利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度，包括：

利用所述卷积网络提取所述待识别图像中检测区域的特征向量；

利用所述长短记忆网络根据所述特征向量的语义关系提取所述特征向量的文字特征，并根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度。

一实施例中，所述网络预测模块320所述卷积网络包括卷积层和反卷积层，所述利用所述卷积网络提取所述待识别图像中检测区域的特征向量，包括：

将所述待识别图像输入卷积层提取所述待识别图像中图像特征，并使用所述反卷积层对所述卷积层进行上采样，得到卷积图像，所述卷积图像与所述待识别图像的像素间存在关联；

对所述卷积图像进行像素分类，得到所述待识别图像的二维热力图，并根据所述二维热力图对所述待识别图像进行图像分割，确定出所述待识别图像中的检测区域，对所述检测区域内的图像特征进行文本检测，得到所述检测区域的特征向量。

一实施例中，所述网络预测模块320所述利用所述长短记忆网络根据所述特征向量的语义关系提取所述特征向量的文字特征，并根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度，包括：

将所述检测区域的特征向量输入所述长短记忆网络，得到所述特征向量的语义关系，并根据所述特征向量的语义关系提取所述特征向量的文字特征；

根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度。

一实施例中，所述标签确定模块330利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签之后，还包括：

从所述物品的目标标签中提取属性信息，并将所述属性信息和所述贴标图像关联存储至信息数据库中，以使得根据所述贴标图像查询所述物品的属性信息。

一实施例中，所述标签确定模块330中所述标签确定模型按照如下方式获取：

获取训练样本，其中，所述训练样本包含多张识别图像，所述每张识别图像中包含多个预测标签及所述多个预测标签中每个预测标签的置信度；

利用时序类分类模型对所述训练样本中的每张识别图像中多个预测标签及所述多个预测标签中每个预测标签的置信度进行筛选，得到所述每张识别图像对应的目标标签；

根据所述每张识别图像对应的目标标签和所述每张识别图像对应的实际标签计算损失函数；

根据所述损失函数进行反向传播以优化所述时序类分类模型，得到所述标签确定模型。

一实施例中，所述网络预测模块320利用标签预测网络预测所述待识别图像中的标签，还包括：

将所述待识别图像输入至所述标签预测网络，得到所述待识别图像的识别错误信息，并根据所述识别错误信息进行故障预警。

本申请实施例装置，通过获取物品的贴标图像，并对贴标图像进行预处理，得到待识别图像；利用标签预测网络预测待识别图像中的标签，得到待识别图像中的多个预测标签及多个预测标签中每个预测标签的置信度；利用标签确定模型基于多个预测标签及每个预测标签的置信度确定物品的目标标签。即，本申请实施例，通过对贴标图像进行预处理改善贴标图像质量，进而提高标签识别的准确度，并通过标签预测网络对待识别图像进行标签识别，得到多个预测标签，再结合标签确定模型对多个预测标签进行筛选或确定得到目标标签，提升识别的效率和准确率，可以在无人员参与的情况下，自动识别标签中的内容，避免环境对识别效果的影响。

图4为本申请实施例提供的一种电子设备的结构示意图。图4示出了适于用来实现本申请实施方式的示例性电子设备12的框图。图4显示的电子设备12仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：至少一个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry Standard Architecture，ISA)总线，微通道体系结构(Micro Channel Architecture，MCA)总线，增强型ISA总线、视频电子标准协会(Video Electronics Standards Association，VESA)局域总线以及外围组件互连(Peripheral Component Interconnect，PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory，RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如只读光盘(Compact Disc-Read Only Memory，CD-ROM),数字视盘(Digital Video Disc-Read Only Memory，DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过至少一个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如系统存储器28中，这样的程序模块42包括但不限于操作系统、至少一个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

电子设备12也可以与至少一个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与至少一个使得用户能与该电子设备12交互的设备通信，和/或与使得电子设备12能与至少一个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(Input/Output，I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与至少一个网络(例如局域网(Local Area Network，LAN)，广域网(Wide Area Network，WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、磁盘阵列(Redundant Arrays of Independent Disks，RAID)系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本申请实施例所提供的标签识别方法，该方法包括：

本申请实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如所述的标签识别方法，该方法包括：

本申请实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器((Erasable Programmable Read-Only Memory，EPROM)或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、射频(Radio Frequency，RF)等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络包括局域网(LAN)或广域网(WAN)连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

Claims

一种标签识别方法，包括：

获取物品的贴标图像，并对所述贴标图像进行预处理，得到待识别图像；

利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度；

利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签。
根据权利要求1所述的方法，其中，所述标签预测网络包括卷积网络和长短记忆网络，所述利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度，包括：

利用所述卷积网络提取所述待识别图像中检测区域的特征向量；

利用所述长短记忆网络根据所述特征向量的语义关系提取所述特征向量的文字特征，并根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度。
根据权利要求2所述的方法，其中，所述卷积网络包括卷积层和反卷积层，所述利用所述卷积网络提取所述待识别图像中检测区域的特征向量，包括：

将所述待识别图像输入卷积层提取所述待识别图像中图像特征，并使用所述反卷积层对所述卷积层进行上采样，得到卷积图像，所述卷积图像与所述待识别图像的像素间存在关联；

对所述卷积图像进行像素分类，得到所述待识别图像的二维热力图，并根据所述二维热力图对所述待识别图像进行图像分割，确定出所述待识别图像中的检测区域，对所述检测区域内的图像特征进行文本检测，得到所述检测区域的特征向量。
根据权利要求2所述的方法，其中，所述利用所述长短记忆网络根据所述特征向量的语义关系提取所述特征向量的文字特征，并根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度，包括：

将所述检测区域的特征向量输入所述长短记忆网络，得到所述特征向量的语义关系，并根据所述特征向量的语义关系提取所述特征向量的文字特征；

根据所述文字特征预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度。
根据权利要求1所述的方法，利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签之后，还包括：

从所述物品的目标标签中提取属性信息，并将所述属性信息和所述贴标图像关联存储至信息数据库中，以使得根据所述贴标图像查询所述物品的属性信息。
根据权利要求1所述的方法，其中，所述标签确定模型按照如下方式获取：

获取训练样本，其中，所述训练样本包含多张识别图像，每张识别图像中包含多个预测标签及所述多个预测标签中每个预测标签的置信度；

利用时序类分类模型对所述训练样本中的每张识别图像中多个预测标签及所述多个预测标签中每个预测标签的置信度进行筛选，得到所述每张识别图像对应的目标标签；

根据所述每张识别图像对应的目标标签和所述每张识别图像对应的实际标签计算损失函数；

根据所述损失函数进行反向传播以优化所述时序类分类模型，得到所述标签确定模型。
根据权利要求1所述的方法，其中，利用标签预测网络预测所述待识别图像中的标签，还包括：

将所述待识别图像输入至所述标签预测网络，得到所述待识别图像的识别错误信息，并根据所述识别错误信息进行故障预警。
一种标签识别装置，包括：

图像获取模块，设置为获取物品的贴标图像，并对所述贴标图像进行预处理，得到待识别图像；

网络预测模块，设置为利用标签预测网络预测所述待识别图像中的标签，得到所述待识别图像中的多个预测标签及所述多个预测标签中每个预测标签的置信度；

标签确定模块，设置为利用标签确定模型基于所述多个预测标签及所述每个预测标签的置信度确定所述物品的目标标签。
一种电子设备，包括：

至少一个处理器；

存储装置，设置为存储至少一个程序，

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-7中任一所述的标签识别方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7中任一所述的标签识别方法。