CN111814736B

CN111814736B - 快递面单信息的识别方法、装置、设备及存储介质

Info

Publication number: CN111814736B
Application number: CN202010727825.9A
Authority: CN
Inventors: 衡鹤瑞; 李斯
Original assignee: Dongpu Software Co Ltd
Current assignee: Dongpu Software Co Ltd
Priority date: 2020-07-23
Filing date: 2020-07-23
Publication date: 2023-12-29
Anticipated expiration: 2040-07-23
Also published as: CN111814736A

Abstract

本发明涉及物流技术领域，公开了一种快递面单信息的识别方法、装置、设备及存储介质，用于改进快递面单识别模型，并提高了快递面单信息识别效率。快递面单信息的识别方法包括：基于轻量化网络结构mobilenet‑v2构建初始训练模型的初始骨干网络；对初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；获取预设训练样本数据和真实面单标注信息，并按照预设训练样本数据和真实面单标注信息对待训练模型进行模型训练，得到已训练模型；获取预设测试样本数据，并使用已训练模型对预设测试样本数据中的快递面单图像进行信息识别检测。

Description

快递面单信息的识别方法、装置、设备及存储介质

技术领域

本发明涉及物流技术领域，尤其涉及一种快递面单信息的识别方法、装置、设备及存储介质。

背景技术

随着物流行业的快速发展，以及快递包裹数量的增多，一般快递包裹被配送时，快递员通过专用识别器，采用自然场景文本检测算法识别快递单号以及收件人的电话号码。但是由于快递包裹的面单图像存在前景文本和背景对象之间的差异，以及各形状、颜色、字体、方向和尺度的文本变化，自然场景中对快递面单的文本检测仍然面临着相当大的挑战。

随着卷积神经网络的飞速发展，现有的基于回归的文本检测算法可以用于识别具有矩形或四边形的快递面单中的文本信息，而很难检测到任意形状的文本。采用像素分割算法可以提取任意形状文本实例的区域，但当两个文本实例相对接近时，也很难将彼此非常接近的文本实例分开。因此，由于存在场景影响，对于模糊、弯曲或者变形的文本识别准确性低，以及快递面单识别处理效率低。

发明内容

本发明的主要目的在于解决由于存在场景影响，对于模糊、弯曲或者变形的文本识别准确性低，以及快递面单识别处理效率低的问题。

本发明第一方面提供了一种快递面单信息的识别方法，包括：基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型；获取预设测试样本数据，并使用所述已训练模型对所述预设测试样本数据中的快递面单图像进行信息识别检测。

可选的，在本发明第一方面的第一种实现方式中，所述对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型，包括：获取所述mobilenet-v2对应的初始网络结构配置数据；按照所述对应的初始网络结构配置数据设置特征图的采样率，得到目标网络结构配置数据，并按照所述目标网络结构配置数据更新所述初始训练模型的初始骨干网络，得到待训练模型，所述待训练模型中的目标骨干网络包括4个模块block，所述4个block分别对应的输出通道数为16、32、96和320。

可选的，在本发明第一方面的第二种实现方式中，所述获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型，包括：获取预设训练样本数据，通过所述待训练模型对所述预设训练样本数据进行特征提取，得到多个尺寸的文字特征图像信息，并将所述多个尺寸的文字特征图像信息标记为n个核kernel，所述n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核；从所述预设训练样本数据中提取真实面单标注信息，并采用预设裁剪算法对所述真实面单标注信息进行随机分割，得到n个切片信息，所述真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息；根据所述n个切片信息和所述n个kernel对所述待训练模型进行模型训练，得到已训练模型。

可选的，在本发明第一方面的第三种实现方式中，所述根据所述n个切片信息和所述n个kernel对所述待训练模型进行模型训练，得到已训练模型，包括：设置所述n个切片信息为G_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；设置所述n个kernel为S_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；按照所述G_i、所述S_i和预设系数公式计算骰子dice相似性系数D，所述预设系数公式为：其中，S_x,y为所述kernel中像素点x,y的值，G_x,y为所述切片信息中像素点x,y的值；采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L；按照预设迭代次数、所述损失函数L和预设阈值对所述待训练模型进行模型训练，得到已训练模型。

可选的，在本发明第一方面的第四种实现方式中，所述采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L，包括：采用所述dice相似性系数D、所述G_i和所述S_i计算文本区域分类损失L_c，其中，所述L_c为：L_c＝1-D(S_i*M,G_i*M)，所述i为n，所述M为预设训练掩码；采用所述dice相似性系数D、所述G_i和所述S_i计算收缩文本实例损失L_s，其中，所述L_s为：所述W为：/>按照预设的损失函数公式、所述L_c和所述L_s计算损失函数L，所述预设的损失函数公式为L＝λL_c+(1-λ)L_s，其中，参数λ用于平衡所述L_c和所述L_s，所述参数λ的取值范围为大于0，并且小于1的正数。

可选的，在本发明第一方面的第五种实现方式中，所述按照预设迭代次数、所述损失函数L和预设阈值对所述待训练模型进行模型训练，得到已训练模型，包括：获取预设迭代次数和预设阈值；判断所述损失函数L是否小于或者等于预设阈值；若所述损失函数L小于或者等于预设阈值，则将所述损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络，得到已训练模型；若所述损失函数L大于预设阈值，则采用梯度下降法对所述待训练模型中的卷积层参数进行更新与迭代训练，直到迭代计算后的损失函数小于或者等于预设阈值，或者实际迭代次数达到所述预设迭代次数时，得到已训练模型，实际迭代次数的初始值为0。

可选的，在本发明第一方面的第六种实现方式中，在所述基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络之前，所述快递面单信息的识别方法还包括：获取初始样本图像数据，并对所述初始样本图像数据进行图像预处理，得到目标样本图像数据；对所述目标样本图像数据按照预设比例进行划分，得到所述预设训练样本数据和所述预设测试样本数据；对所述预设训练样本数据进行文字方框标注处理，得到所述真实面单标注信息，并存储所述真实面单标注信息。

本发明第二方面提供了一种快递面单信息的识别装置，包括：构建模块，用于基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；改进模块，用于对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；训练模块，用于获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型；识别模块，用于获取预设测试样本数据，并使用所述已训练模型对所述预设测试样本数据中的快递面单图像进行信息识别检测。

可选的，在本发明第二方面的第一种实现方式中，所述改进模块具体用于：获取所述mobilenet-v2对应的初始网络结构配置数据；按照所述对应的初始网络结构配置数据设置特征图的采样率，得到目标网络结构配置数据，并按照所述目标网络结构配置数据更新所述初始训练模型的初始骨干网络，得到待训练模型，所述待训练模型中的目标骨干网络包括4个模块block，所述4个block分别对应的输出通道数为16、32、96和320。

可选的，在本发明第二方面的第二种实现方式中，所述训练模块还包括：提取子模块，用于获取预设训练样本数据，通过所述待训练模型对所述预设训练样本数据进行特征提取，得到多个尺寸的文字特征图像信息，并将所述多个尺寸的文字特征图像信息标记为n个核kernel，所述n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核；分割子模块，用于从所述预设训练样本数据中提取真实面单标注信息，并采用预设裁剪算法对所述真实面单标注信息进行随机分割，得到n个切片信息，所述真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息；训练子模块，用于根据所述n个切片信息和所述n个kernel对所述待训练模型进行模型训练，得到已训练模型。

可选的，在本发明第二方面的第三种实现方式中，所述训练子模块包括：第一设置单元，用于设置所述n个切片信息为G_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；第二设置单元，用于设置所述n个kernel为S_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；第一计算单元，用于按照所述G_i、所述S_i和预设系数公式计算骰子dice相似性系数D，所述预设系数公式为：其中，S_x,y为所述kernel中像素点x,y的值，G_x,y为所述切片信息中像素点x,y的值；第二计算单元，用于采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L；训练单元，用于按照预设迭代次数、所述损失函数L和预设阈值对所述待训练模型进行模型训练，得到已训练模型。

可选的，在本发明第二方面的第四种实现方式中，所述第二计算单元具体用于：采用所述dice相似性系数D、所述G_i和所述S_i计算文本区域分类损失L_c，其中，所述L_c为：L_c＝1-D(S_i*M,G_i*M)，所述i为n，所述M为预设训练掩码；采用所述dice相似性系数D、所述G_i和所述S_i计算收缩文本实例损失L_s，其中，所述L_s为：所述W为：按照预设的损失函数公式、所述L_c和所述L_s计算损失函数L，所述预设的损失函数公式为L＝λL_c+(1-λ)L_s，其中，参数λ用于平衡所述L_c和所述L_s，所述参数λ的取值范围为大于0，并且小于1的正数。

可选的，在本发明第二方面的第五种实现方式中，所述训练单元具体用于：获取预设迭代次数和预设阈值；判断所述损失函数L是否小于或者等于预设阈值；若所述损失函数L小于或者等于预设阈值，则将所述损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络，得到已训练模型；若所述损失函数L大于预设阈值，则采用梯度下降法对所述待训练模型中的卷积层参数进行更新与迭代训练，直到迭代计算后的损失函数小于或者等于预设阈值，或者实际迭代次数达到所述预设迭代次数时，得到已训练模型，实际迭代次数的初始值为0。

可选的，在本发明第二方面的第六种实现方式中，所述快递面单信息的识别装置还包括：预处理模块，用于获取初始样本图像数据，并对所述初始样本图像数据进行图像预处理，得到目标样本图像数据；划分模块，用于对所述目标样本图像数据按照预设比例进行划分，得到预设训练样本数据和预设测试样本数据；标注模块，用于对所述预设训练样本数据进行文字方框标注处理，得到所述真实面单标注信息，并存储所述真实面单标注信息。

本发明第三方面提供了一种快递面单信息的识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述快递面单信息的识别设备执行上述的快递面单信息的识别方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的快递面单信息的识别方法。

本发明提供的技术方案中，基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型；获取预设测试样本数据，并使用所述已训练模型对所述预设测试样本数据中的快递面单图像进行信息识别检测。本发明实施例中，采用改进的轻量化网络结构mobilenet-v2构建待训练模型的骨干网络，并采用采用预设训练样本数据和真实面单标注信息训练模型，提高了快递面单的识别模型的性能，提高了对模糊、弯曲或者变形的文本识别准确性，提高了快递面单识别处理效率。

附图说明

图1为本发明实施例中快递面单信息的识别方法的一个实施例示意图；

图2为本发明实施例中快递面单信息的识别方法的另一个实施例示意图；

图3为本发明实施例中快递面单信息的识别装置的一个实施例示意图；

图4为本发明实施例中快递面单信息的识别装置的另一个实施例示意图；

图5为本发明实施例中快递面单信息的识别设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种快递面单信息的识别方法、装置、设备及存储介质，用于采用改进的轻量化网络结构mobilenet-v2构建待训练模型的骨干网络，提高快递面单的识别模型的性能，提高快递面单识别处理效率。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中快递面单信息的识别方法的一个实施例包括：

101、基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络。

其中，轻量化网络mobilenet-v2是基于一个流线型的架构，使用深度可分离的卷积来构建轻量级的深层神经网络，可用于分类、目标检测和语义分割，具有反向残差结构，并且使用轻量级深度卷积过滤中间扩展层的特征。

进一步地，服务器可在神经网络框架tensorflow或者pytorch上搭建初始训练模型的初始骨干网络，并将初始骨干网络替换为轻量化网络结构mobilenet-v2，mobilenet-v2的网络模块为中间大两头小的结构。

可选的，在基于轻量化网络结构mobilenet-v2构建待训练模型的初始骨干网络之前，服务器获取初始样本图像数据，并对初始样本图像数据进行图像预处理，得到目标样本图像数据，例如，图像尺度变换、图像色彩或者饱和度调整，具体此处不做限定；服务器对目标样本图像数据按照预设比例进行划分，得到预设训练样本数据和预设测试样本数据，例如，服务器获取目标样本图像数据的数量为3000张，预设比例为3：1，则服务器获取预设训练样本数据的数量为2250张，预设测试样本数据的数量为750张；服务器对预设训练样本数据进行文字方框标注处理，得到真实面单标注信息，并存储真实面单标注信息。

可以理解的是，本发明的执行主体可以为快递面单信息的识别装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

102、对初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型。

服务器对初始训练模型的初始骨干网络进行剪枝改进，也就是减少用于提取特征的卷积网络中的模块数量，进一步地，服务器确定多个输出通道数，并按照多个输出通道数设置多个模块，得到目标骨干网络，进一步地，服务器获取待训练模型。其中，该目标骨干网络可以包括多个模块，多个模块分别为block1、block2、block3和block4，并且这4个模块依次连接，与原图(例如，预设训练样本数据)的分辨率相比，block1、block2、block3和block4分别对应的输出特征图的分辨率依次减少。一般block4的输出特征图语义级别最高，服务器通常将block4的输出特征图用于检测快递面单信息。

需要说明的是，一般采用输出通道数为24、32、96和320的block组合方式，在此，服务器对其进行改进，采用了输出通道数为16、32、96和320的block组方式，减少了输出通道数，因此减小了特征提取的模型深度，提高了待训练模型的识别检测速度。

103、获取预设训练样本数据和真实面单标注信息，并按照预设训练样本数据和真实面单标注信息对待训练模型进行模型训练，得到已训练模型。

具体的，首先，服务器获取预设训练样本数据，通过目标骨干网络对预设训练样本数据进行特征提取，得到不同尺寸的文字特征图像信息。其中，服务器通过目标骨干网络对预设训练样本数据进行特征提取，也就是采用改进的mobilenet-v2中的线性瓶颈层网络结构进行特征提取，得到不同尺寸的文字特征图像信息。因此，服务器获取预设训练样本数据，将预设训练样本数据输入到待训练模型中，服务器通过目标骨干网络对预设训练样本数据进行特征提取，得到不同尺寸的文字特征图像信息。进一步地，在目标骨干网络的各block中，服务器使用1*1卷积层与多尺度relu算子对预设训练样本数据进行升维处理(例如，将特征维度扩大了6倍)，得到初始特征，然后服务器再用3*3卷积与多尺度relu算子对初始特征进行滤波后降维处理，并采用1*1卷积层输出本层特征，并输入到线性瓶颈层网络结构下一层的block中，直到获取不同尺寸的文字特征图像信息时，停止提取特征。例如，不同尺寸的文字特征图像信息包括A1、A2、A3、A4和A5。可以理解的是，目标骨干网络中线性瓶颈层网络结构的第一层卷积层不添加relu算子，防止预设训练样本数据中的信息丢失。升维处理后，信息更加丰富，此时加上relu算子之后再降维处理，可以保持预设训练样本数据中的信息不丢失。

然后，服务器对真实面单标注信息进行随机分割，得到不同尺寸的标注数据，采用不同尺寸的文字特征图像信息和不同尺寸的标注数据进行损失函数计算，直到损失函数下降到预设阈值时，服务器停止模型训练，确定模型训练的各网络参数，得到已训练模型。其中，文字特征图像信息的数量和标注数据的数量相等。

104、获取预设测试样本数据，并使用已训练模型对预设测试样本数据中的快递面单图像进行信息识别检测。

需要说明的是，已训练模型用于对快递面单图像信息进行识别检测，包括识别电话号码以及快递条形码信息，电话号码可包括移动手机号码和座机号码，快递条形码信息用于指示将宽度不等的多个黑条和空白，按照预设的编码规则排列，用以表达一组信息的图形标识符。

具体的，服务器获取预设测试样本数据；服务器将已训练模型的模型参数进行加载，并向已训练模型的深度学习网络传输预设测试样本数据，服务器获取已训练模型的输出结果，输出结果用于指示对预设测试样本数据中的快递面单图像进行信息识别检测的文本预测结果。进一步地，服务器根据文本预测结果确定已训练模型的文本识别的准确性，当准确性大于或者等于目标值时，服务器确定已训练模型为最终应用的模型；当准确性小于目标值时，服务器将预设测试样本数据进行标注处理后，添加至预设训练样本数据中，得到已更新的训练样本数据，并采用已更新的训练样本数据对已训练模型进行迭代更新处理。其中，目标值为预先设置的准确率阈值，可以为0.96(96％)，也可以为0.985(98.5％)，具体此处不做限定。

本发明实施例中，采用改进的轻量化网络结构mobilenet-v2构建待训练模型的骨干网络，并采用采用预设训练样本数据和真实面单标注信息训练模型，提高了快递面单的识别模型的性能，提高了对模糊、弯曲或者变形的文本识别准确性，提高了快递面单识别处理效率。

请参阅图2，本发明实施例中快递面单信息的识别方法的另一个实施例包括：

201、基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络。

该步骤201与步骤101的描述相似，具体此处不再赘述。

202、对初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型。

其中，初始训练模型的初始骨干网络包括7层的线性瓶颈层网络结构，服务器对线性瓶颈层网络结构中进行结构筛选，得到待训练模型的目标骨干网络。可选的，服务器获取mobilenet-v2对应的初始网络结构配置数据；服务器按照对应的初始网络结构配置数据设置特征图的采样率(从线性瓶颈层网络结构中筛选并设置)，得到目标网络结构配置数据，并按照目标网络结构配置数据更新初始训练模型的初始骨干网络，得到待训练模型。其中，线性瓶颈层网络结构如下表1所示：

表1：线性瓶颈层网络结构

扩张倍数t	输出通道数c	重复次数n	步长s
				1	16	1	1
6	24	2	2
				6	32	3	2
6	64	4	2
				6	96	3	1
6	160	3	2
				6	320	1	1

服务器采用输出通道数为16、32、96和320的block组合方式，也就是，待训练模型中的目标骨干网络包括4个模块block，4个block分别对应的输出通道数为16、32、96和320。以使得服务器采用输出通道数16取代输出通道数24，减少了输出通道数，则减小特征提取的模型深度，提高了模型训练效率和快递面单信息识别效率。

203、获取预设训练样本数据，通过待训练模型对预设训练样本数据进行特征提取，得到多个尺寸的文字特征图像信息，并将多个尺寸的文字特征图像信息标记为n个核kernel，n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核。

其中，每个kernel用于指示同一文字特征图像中不同文本区域的分割文本行。进一步地，服务器采用待训练模型中的目标骨干网络对预设训练样本数据进行特征提取，得到初始特征图，然后，服务器采用待训练模型中的特征金字塔网络FPN对初始特征图进行特征分割，得到多个尺寸的文字特征图像信息，并将每个文字特征图像信息设置为n个核kernel，n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核。

需要说明的是，服务器在进行语义分割操作时，服务器通常对多个block的特征图进行融合，或者对block4进行空间池化金字塔的操作，以获取具有有丰富上下文信息和丰富语义信息的初始特征图，服务器对初始特征图进行激励函数softmax与上采样操作，得到多个尺寸的文字特征图像信息。其中，预设训练样本数据对应多个不同尺度的核kernel，每个kernel均与原始的整个文本实例共享相似的形状，并且它们都位于相同的中心点上，但是尺度比例不相同。

204、从预设训练样本数据中提取真实面单标注信息，并采用预设裁剪算法对真实面单标注信息进行随机分割，得到n个切片信息，真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息。

需要说明的是，在进行监督学习训练中，预设训练样本数据均是有标注的，可以以(x,t)的形式出现，其中，x是输入数据，t是标注信息，其中正确的标注信息t是真实值groundtruth。因为待训练模型输出有多个尺寸的文字特征图像信息，所以对于同一预设训练样本数据，groundtruth也要有相同的数量。例如，将预设训练样本数据中标定的文本框进行不同尺度的缩小得到n个切片信息。

进一步地，服务器可从预设训练样本数据中提取真实面单标注信息，并将真实面单标注信息设置为groundtruth；服务器采用预设裁剪算法对groundtruth进行随机分割，得到n个切片信息，其中，真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息。n个切片信息与n个kernel相对应，并且数量相等。其中，预设裁剪算法可以采用瓦蒂vatti裁剪算法，该裁剪算法采用可裁剪任意数量任意形状的剪辑多边形。预设裁剪算法还可以采用其他算法，具体此处不做限定。例如，服务器采用vatti裁剪算法将原始多边形的一个分割结果缩小预设数量的像素，最终得到的n个切片信息，该n个切片信息具有不同尺度，每个切片信息均可转换成一个0或1的二进制掩码。

205、根据n个切片信息和n个kernel对待训练模型进行模型训练，得到已训练模型。

可以理解的是，由于待训练模型中的参数数据是由(x,y)的形式出现的。其中x为待训练模型的输入数据，y为待训练模型预测的值(n个kernel)。服务器会将标注信息(n个切片信息)和待训练模型预测的值(n个kernel)进行比较，也就是，服务器在损失函数中将y和t进行比较，从而计算损失(损失函数)，直到损失降低到预置阈值时，得到已训练模型。需要说明的是，当预测的值与实际值相等时，损失为0，当预测的值与实际值不相等时，损失为1。

可选的，服务器设置n个切片信息为G_i，其中，i的取值范围为大于或者等于1，并且小于或者等于n的整数；服务器设置n个kernel为S_i，其中，i的取值范围为大于或者等于1，并且小于或者等于n的整数；服务器按照G_i、S_i和预设系数公式计算骰子dice相似性系数D，预设系数公式为：其中，S_x,y为kernel中像素点x,y的值，G_x,y为切片信息中像素点x,y的值；服务器采用dice相似性系数D、G_i和S_i计算损失函数L；按照预设迭代次数、损失函数L和预设阈值对待训练模型进行模型训练，得到已训练模型；服务器采用dice相似性系数D、G_i和S_i计算文本区域分类损失L_c，其中，L_c为：L_c＝1-D(S_i*M,G_i*M)，i为n，M为预设训练掩码；服务器采用dice相似性系数D、G_i和S_i计算收缩文本实例损失L_s，其中，L_s为：/>W为：/>其中，W是一个掩码，忽略非文本区域的像素；服务器按照预设的损失函数公式、L_c和L_s计算损失函数L，预设的损失函数公式为L＝λL_c+(1-λ)L_s，其中，参数λ用于平衡L_c和L_s，参数λ的取值范围为大于0，并且小于1的正数。

可选的，服务器获取预设迭代次数和预设阈值；服务器判断损失函数L是否小于或者等于预设阈值；若损失函数L小于或者等于预设阈值，则服务器将损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络，得到已训练模型；若损失函数L大于预设阈值，则服务器采用梯度下降法对待训练模型中的卷积层参数进行更新与迭代训练，直到损失函数L小于或者等于预设阈值，或者实际迭代次数达到预设迭代次数时，得到已训练模型。其中，预设迭代次数为正整数，实际迭代次数的初始值为0，模型迭代训练一次，实际迭代次数增加1，直到实际迭代数据小于或者等于预设迭代次数时，停止迭代训练。预设阈值可以为0.01，也可以为0.005，具体此处不做限定。

206、获取预设测试样本数据，并使用已训练模型对预设测试样本数据中的快递面单图像进行信息识别检测。

具体的，服务器获取预设测试样本数据，服务器使用已训练模型对预设测试样本数据中的快递面单图像提取多个尺寸的文本实例，并设置多个文本实例为n个kernel，kernel按照从1到n的标号顺序尺度从小到大增加，然后服务器通过渐进尺度扩展算法(pesnet)提取对n个kernel进行特征融合处理，进一步地，服务器从n个kernel中获取第一个kernel(具有最小尺度)与第二个kernel，并将第一个kernel与第二个kernel进行比较，得到多余的像素点，并将多余的像素点融合到第一个kernel上，得到待融合特征图(迭代合并相邻的文本像素)，依次类推，直到将第n个kernel中多余的像素点融合至待融合特征图中，得到最终特征图(完全形状的文本实例)，然后将最终特征图对应的掩码信息作为已训练模型最终预测的文字区域。例如，服务器通过已训练模型识别到快递面单图像中收件人的电话号码为13012345678。

需要说明的是，渐进尺度扩展算法能够对任意形状的文本信息进行定位，并能够识别相邻文本实例，并确保文本实例的精确位置(尺度相差大的核很容易被分离)，因为各kernel之间的边界是以谨慎和渐进的方式展开的。并且在相邻kernel之间存在冲突像素时，按照队列规则将发生冲突的像素点融合进产生冲突位置的kernel，增加对任意快递面单形状的鲁棒性。

上面对本发明实施例中快递面单信息的识别方法进行了描述，下面对本发明实施例中快递面单信息的识别装置进行描述，请参阅图3，本发明实施例中快递面单信息的识别装置一个实施例包括：

构建模块301，用于基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；

改进模块302，用于对初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；

训练模块303，用于获取预设训练样本数据和真实面单标注信息，并按照预设训练样本数据和真实面单标注信息对待训练模型进行模型训练，得到已训练模型；

识别模块304，用于获取预设测试样本数据，并使用已训练模型对预设测试样本数据中的快递面单图像进行信息识别检测。

请参阅图4，本发明实施例中快递面单信息的识别装置的另一个实施例包括：

可选的，改进模块302还可以具体用于：

获取mobilenet-v2对应的初始网络结构配置数据；

按照对应的初始网络结构配置数据设置特征图的采样率，得到目标网络结构配置数据，并按照目标网络结构配置数据更新初始训练模型的初始骨干网络，得到待训练模型，待训练模型中的目标骨干网络包括4个模块block，4个block分别对应的输出通道数为16、32、96和320。

可选的，训练模块303还包括：

提取子模块3031，用于获取预设训练样本数据，通过待训练模型对预设训练样本数据进行特征提取，得到多个尺寸的文字特征图像信息，并将多个尺寸的文字特征图像信息标记为n个核kernel，n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核；

分割子模块3032，用于从预设训练样本数据中提取真实面单标注信息，并采用预设裁剪算法对真实面单标注信息进行随机分割，得到n个切片信息，真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息；

训练子模块3033，用于根据n个切片信息和n个kernel对待训练模型进行模型训练，得到已训练模型。

可选的，训练子模块3033还包括：

第一设置单元30331，用于设置n个切片信息为G_i，其中，i的取值范围为大于或者等于1，并且小于或者等于n的整数；

第二设置单元30332，用于设置n个kernel为S_i，其中，i的取值范围为大于或者等于1，并且小于或者等于n的整数；

第一计算单元30333，用于按照G_i、S_i和预设系数公式计算骰子dice相似性系数D，预设系数公式为：其中，S_x,y为kernel中像素点x,y的值，G_x,y为切片信息中像素点x,y的值；

第二计算单元30334，用于采用dice相似性系数D、G_i和S_i计算损失函数L；

训练单元30335，用于按照预设迭代次数、损失函数L和预设阈值对待训练模型进行模型训练，得到已训练模型。

可选的，第二计算单元30334还可以具体用于：

采用dice相似性系数D、G_i和S_i计算文本区域分类损失L_c，其中，L_c为：L_c＝1-D(S_i*M,G_i*M)，i为n，M为预设训练掩码；

采用dice相似性系数D、G_i和S_i计算收缩文本实例损失L_s，其中，L_s为：

W为：/>/>

按照预设的损失函数公式、L_c和L_s计算损失函数L，预设的损失函数公式为L＝λL_c+(1-λ)L_s，其中，参数λ用于平衡L_c和L_s，参数λ的取值范围为大于0，并且小于1的正数。

可选的，训练单元30335还可以具体用于：

获取预设迭代次数和预设阈值；

判断损失函数L是否小于或者等于预设阈值；

若损失函数L小于或者等于预设阈值，则将损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络，得到已训练模型；

若损失函数L大于预设阈值，则采用梯度下降法对待训练模型中的卷积层参数进行更新与迭代训练，直到迭代计算后的损失函数小于或者等于预设阈值，或者实际迭代次数达到预设迭代次数时，得到已训练模型，实际迭代次数的初始值为0。

可选的，快递面单信息的识别装置还包括：

预处理模块305，用于获取初始样本图像数据，并对初始样本图像数据进行图像预处理，得到目标样本图像数据；

划分模块306，用于对目标样本图像数据按照预设比例进行划分，得到预设训练样本数据和预设测试样本数据；

标注模块307，用于对预设训练样本数据进行文字方框标注处理，得到真实面单标注信息，并存储真实面单标注信息。

上面图3和图4从模块化的角度对本发明实施例中的快递面单信息的识别装置进行详细描述，下面从硬件处理的角度对本发明实施例中快递面单信息的识别设备进行详细描述。

图5是本发明实施例提供的一种快递面单信息的识别设备的结构示意图，该快递面单信息的识别设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器(central processing units，CPU)510(例如，一个或一个以上处理器)和存储器520，一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对快递面单信息的识别设备500中的一系列指令操作。更进一步地，处理器510可以设置为与存储介质530通信，在快递面单信息的识别设备500上执行存储介质530中的一系列指令操作。

快递面单信息的识别设备500还可以包括一个或一个以上电源540，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口560，和/或，一个或一个以上操作系统531，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图5示出的快递面单信息的识别设备结构并不构成对快递面单信息的识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种快递面单信息的识别设备，所述快递面单信息的识别设备包括存储器和处理器，存储器中存储有指令，所述指令被处理器执行时，使得处理器执行上述各实施例中的所述快递面单信息的识别方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述快递面单信息的识别方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种快递面单信息的识别方法，其特征在于，所述快递面单信息的识别方法包括：

基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；

对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；

获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型；

所述获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型包括：

获取预设训练样本数据，通过所述待训练模型对所述预设训练样本数据进行特征提取，得到多个尺寸的文字特征图像信息，并将所述多个尺寸的文字特征图像信息标记为n个核kernel，所述n个kernel为已按照不同尺度从小到大的顺序进行排列的卷积核；

从所述预设训练样本数据中提取真实面单标注信息，并采用预设裁剪算法对所述真实面单标注信息进行随机分割，得到n个切片信息，所述真实面单标注信息用于指示按照二维坐标形式正确标注的快递面单文本框信息；

根据所述n个切片信息和所述n个kernel对所述待训练模型进行模型训练，得到已训练模型；

所述根据所述n个切片信息和所述n个kernel对所述待训练模型进行模型训练，得到已训练模型，包括：

设置所述n个切片信息为G_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；

设置所述n个kernel为S_i，其中，所述i的取值范围为大于或者等于1，并且小于或者等于n的整数；

按照所述G_i、所述S_i和预设系数公式计算骰子dice相似性系数D，所述预设系数公式为：

其中，S_x,y为所述kernel中像素点x,y的值，G_x,y为所述切片信息中像素点x,y的值；

采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L；

按照预设迭代次数、所述损失函数L和预设阈值对所述待训练模型进行模型训练，得到已训练模型；

获取预设测试样本数据，并使用所述已训练模型对所述预设测试样本数据中的快递面单图像进行信息识别检测。

2.根据权利要求1所述的快递面单信息的识别方法，其特征在于，所述对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型，包括：

获取所述mobilenet-v2对应的初始网络结构配置数据；

按照所述对应的初始网络结构配置数据设置特征图的采样率，得到目标网络结构配置数据，并按照所述目标网络结构配置数据更新所述初始训练模型的初始骨干网络，得到待训练模型，所述待训练模型中的目标骨干网络包括4个模块block，所述4个block分别对应的输出通道数为16、32、96和320。

3.根据权利要求1所述的快递面单信息的识别方法，其特征在于，所述采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L，包括：

采用所述dice相似性系数D、所述G_i和所述S_i计算文本区域分类损失L_c，其中，所述L_c为：L_c＝1-D(S_i*M,G_i*M)，所述i为n，所述M为预设训练掩码；

采用所述dice相似性系数D、所述G_i和所述S_i计算收缩文本实例损失L_s，其中，所述L_s为：所述W为：/>

按照预设的损失函数公式、所述L_c和所述L_s计算损失函数L，所述预设的损失函数公式为L＝λL_c+(1-λ)L_s，其中，参数λ用于平衡所述L_c和所述L_s，所述参数λ的取值范围为大于0，并且小于1的正数。

4.根据权利要求1所述的快递面单信息的识别方法，其特征在于，所述按照预设迭代次数、所述损失函数L和预设阈值对所述待训练模型进行模型训练，得到已训练模型，包括：

获取预设迭代次数和预设阈值；

判断所述损失函数L是否小于或者等于预设阈值；

若所述损失函数L小于或者等于预设阈值，则将所述损失函数L对应的待训练模型中的卷积网络设置为训练后的卷积网络，得到已训练模型；

若所述损失函数L大于预设阈值，则采用梯度下降法对所述待训练模型中的卷积层参数进行更新与迭代训练，直到迭代计算后的损失函数小于或者等于预设阈值，或者实际迭代次数达到所述预设迭代次数时，得到已训练模型，实际迭代次数的初始值为0。

5.根据权利要求1-4中任意一项所述的快递面单信息的识别方法，其特征在于，在所述基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络之前，所述快递面单信息的识别方法还包括：

获取初始样本图像数据，并对所述初始样本图像数据进行图像预处理，得到目标样本图像数据；

对所述目标样本图像数据按照预设比例进行划分，得到所述预设训练样本数据和所述预设测试样本数据；

对所述预设训练样本数据进行文字方框标注处理，得到所述真实面单标注信息，并存储所述真实面单标注信息。

6.一种快递面单信息的识别装置，其特征在于，所述快递面单信息的识别装置包括：

构建模块，用于基于轻量化网络结构mobilenet-v2构建初始训练模型的初始骨干网络；

改进模块，用于对所述初始训练模型的初始骨干网络进行剪枝改进，得到待训练模型；

训练模块，用于获取预设训练样本数据和真实面单标注信息，并按照所述预设训练样本数据和所述真实面单标注信息对所述待训练模型进行模型训练，得到已训练模型；

采用所述dice相似性系数D、所述G_i和所述S_i计算损失函数L；

识别模块，用于获取预设测试样本数据，并使用所述已训练模型对所述预设测试样本数据中的快递面单图像进行信息识别检测。

7.一种快递面单信息的识别设备，其特征在于，所述快递面单信息的识别设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述快递面单信息的识别设备执行如权利要求1-5中任意一项所述的快递面单信息的识别方法。

8.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-5中任一项所述快递面单信息的识别方法。