CN112651340A

CN112651340A - 一种购物小票的文字识别方法、系统、终端设备和存储介质

Info

Publication number: CN112651340A
Application number: CN202011578544.8A
Authority: CN
Inventors: 于兴兴; 林喆; 朱亮; 王德
Original assignee: Shanghai Sunmi Technology Group Co Ltd; Citaq Co Ltd
Current assignee: Shanghai Sunmi Technology Group Co Ltd; Citaq Co Ltd
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-13

Abstract

本发明提供了一种购物小票的文字识别方法、系统、终端设备和存储介质，其方法包括：向预设小票模板中随机添加票据填充内容生成小票文本图像，对所述小票文本图像进行图像扩充和打标处理获得小票样本集；根据所述小票样本集训练得到网络模型，并通过网络剪枝对所述网络模型进行压缩处理得到小票识别模型；将待识别小票图片输入至所述小票识别模型得到文字识别结果。本发明快速生成大量不同风格的票据样本图像，避免客户购物隐私被侵犯，而且剪枝压缩网络模型，大大提高小票识别效率。

Description

一种购物小票的文字识别方法、系统、终端设备和存储介质

技术领域

本发明涉及人工智能以及图像识别领域，尤指一种购物小票的文字识别方法、系统、终端设备和存储介质。

背景技术

近年来，人工智能逐渐成为全球科技和产业变革的重要驱动力，推动了基于深度学习的计算机视觉领域在商业场景的发展。

小票文字识别作为计算机视觉中的重要技术，在电商、商场、超市、菜馆、以及其他中小型店铺都有应用。现在的小票文字识别技术存在模型参数量大、算力要求高的问题，对模型的运行速度产生较大的影响。同时，现有技术依赖真实的小票数据，采集标注成本高，本文形式单一，且涉及商家和用户隐私问题，限制了文字识别的精度。

发明内容

本发明的目的是提供一种购物小票的文字识别方法、系统、终端设备和存储介质，实现快速生成大量不同风格的票据样本图像，避免客户购物隐私被侵犯，而且剪枝压缩网络模型，大大提高小票识别效率。

本发明提供的技术方案如下：

本发明提供一种购物小票的文字识别方法，包括步骤：

向预设小票模板中随机添加票据填充内容生成小票文本图像，对所述小票文本图像进行图像扩充和打标处理获得小票样本集；

根据所述小票样本集训练得到网络模型，并通过网络剪枝对所述网络模型进行压缩处理得到小票识别模型；

将待识别小票图片输入至所述小票识别模型得到文字识别结果。

进一步的，所述向预设小票模板中随机添加票据填充内容生成小票文本图像包括步骤：

预先设定小票填充内容，并设定不同小票类型的预设小票模板；所述小票填充内容包括票据填充要素、票据填充字体、票据填充字号；

按照所述预设小票模板规定的填充种类，从所有小票填充内容中随机选择不同语义特征的必要填充信息和非必要填充信息；

将所述必要填充信息、非必要填充信息填充至所述预设小票模板的对应位置生成预设数量个小票文本图像；

其中，必要填充信息包括商品信息栏、结算信息栏、商家信息栏、订单信息栏，非必要填充信息包括开票信息栏和其他信息栏。

进一步的，所述对所述小票文本图像进行图像扩充和打标处理获得小票样本集包括步骤：

根据预设图像变换策略组合，对所述小票文本图像分别进行变换处理完成图像扩充；

从填充至所述预设小票模板的必要填充信息中提取关键词，以生成所述小票文本图像对应的文本标签；

根据所述文本标签命名对应的小票文本图像得到票据样本图像，汇总所有票据样本图像得到所述小票样本集。

进一步的，所述根据所述小票样本集训练得到网络模型，并通过网络剪枝对所述网络模型进行压缩处理得到小票识别模型包括步骤：

将所述小票样本集分类为小票图像训练集和小票图像验证集；

根据所述小票图像训练集进行模型训练得到所述网络模型；

将所述网络模型的中不同分支的初始权重值进行大小排序，从最小初始权重值开始按照排列顺序依次选取预设数量个分支进行剪枝，以稀疏化所述网络模型；

将剪枝后的网络模型进行重训练，将所述小票图像验证集输入至所述剪枝后的网络模型获得识别误差值；

若所述识别误差值低于误差阈值进行下一轮剪枝及重训练，直至所述识别误差值高于误差阈值停止剪枝，并确定所述识别误差值最后一次低于误差阈值时剪枝后的网络模型为所述小票识别模型。

本发明还提供一种购物小票的文字识别系统，包括：

样本获取模块，用于向预设小票模板中随机添加票据填充内容生成小票文本图像，对所述小票文本图像进行图像扩充和打标处理获得小票样本集；

模型获取模块，用于根据所述小票样本集训练得到网络模型，并通过网络剪枝对所述网络模型进行压缩处理得到小票识别模型；

处理模块，用于将待识别小票图片输入至所述小票识别模型得到文字识别结果。

进一步的，所述样本获取模块包括：

设置单元，用于预先设定小票填充内容，并设定不同小票类型的预设小票模板；所述小票填充内容包括票据填充要素、票据填充字体、票据填充字号；

选择单元，用于按照所述预设小票模板规定的填充种类，从所有小票填充内容中随机选择不同语义特征的必要填充信息和非必要填充信息；

生成单元，用于将所述必要填充信息、非必要填充信息填充至所述预设小票模板的对应位置生成预设数量个小票文本图像；

进一步的，所述模型获取模块包括：

图像处理单元，用于根据预设图像变换策略组合，对所述小票文本图像分别进行变换处理完成图像扩充；

信息提取单元，用于从填充至所述预设小票模板的必要填充信息中提取关键词，以生成所述小票文本图像对应的文本标签；

图像打标单元，用于根据所述文本标签命名对应的小票文本图像得到票据样本图像，汇总所有票据样本图像得到所述小票样本集。

进一步的，所述处理模块包括：

分类单元，用于将所述小票样本集分类为小票图像训练集和小票图像验证集；

训练单元，用于根据所述小票图像训练集进行模型训练得到所述网络模型；

剪枝单元，用于将所述网络模型的中不同分支的初始权重值进行大小排序，从最小初始权重值开始按照排列顺序依次选取预设数量个分支进行剪枝，以稀疏化所述网络模型；

处理单元，用于将剪枝后的网络模型进行重训练，将所述小票图像验证集输入至所述剪枝后的网络模型获得识别误差值；

获取单元，用于若所述识别误差值低于误差阈值进行下一轮剪枝及重训练，直至所述识别误差值高于误差阈值停止剪枝，并确定所述识别误差值最后一次低于误差阈值时剪枝后的网络模型为所述小票识别模型。

本发明还提供一种终端设备，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器，用于执行所述存储器上所存放的计算机程序，实现所述的购物小票的文字识别方法所执行的操作。

本发明还提供一种存储介质，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现所述的购物小票的文字识别方法所执行的操作。

通过本发明提供的一种购物小票的文字识别方法、系统、终端设备和存储介质，能够快速生成大量不同风格的票据样本图像，避免客户购物隐私被侵犯，而且剪枝压缩网络模型，大大提高小票识别效率。

附图说明

下面将以明确易懂的方式，结合附图说明优选实施方式，对一种购物小票的文字识别方法、系统、终端设备和存储介质的上述特性、技术特征、优点及其实现方式予以进一步说明。

图1是本发明一种购物小票的文字识别方法的一个实施例的流程图；

图2是本发明一种购物小票的文字识别方法的另一个实施例的流程图；

图3是本发明一种购物小票的文字识别方法的另一个实施例的流程图；

图4是本发明的实体零售小票的示意图；

图5是本发明的电商零售小票的示意图；

图6是本发明的测试小票的示意图；

图7是本发明一种购物小票的文字识别方法的一个实例的整体流程图；

图8是本发明一种购物小票的文字识别方法的一个实例的票据样本图像的生成流程图；

图9是本发明一种购物小票的文字识别方法的一个实例的票据识别整体流程图；

图10是本发明一种终端设备的一个实施例的结构示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。

为使图面简洁，各图中只示意性地表示出了与本发明相关的部分，它们并不代表其作为产品的实际结构。另外，以使图面简洁便于理解，在有些图中具有相同结构或功能的部件，仅示意性地绘示了其中的一个，或仅标出了其中的一个。在本文中，“一个”不仅表示“仅此一个”，也可以表示“多于一个”的情形。

还应当进一步理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

另外，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对照附图说明本发明的具体实施方式。显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，并获得其他的实施方式。

本发明的一个实施例，如图1所示，一种购物小票的文字识别方法，包括：

S100向预设小票模板中随机添加票据填充内容生成小票文本图像，对小票文本图像进行图像扩充和打标处理获得小票样本集；

具体的，购物小票又称为购物收据，本文将购物小票简称为小票，小票是指在消费者购物时由电商、商场、超市、菜馆、以及其他中小型店铺等商业机构给用户留存的销售凭据。终端设备向预设小票模板中随机添加票据填充内容生成小票文本图像，随机生成和小票风格相同的文本图像也就是小票文本图像。然后，对小票文本图像进行图像扩充，增加生成的小票文本图像的多样性。

S200根据小票样本集训练得到网络模型，并通过网络剪枝对网络模型进行压缩处理得到小票识别模型；

S300将待识别小票图片输入至小票识别模型得到文字识别结果。

具体的，使用小票样本集进行训练得到网络模型，并通过网络剪枝对网络模型进行压缩处理，这样可以将得到小票识别模型中的重要性低的分支进行剪枝。然后，终端设备将实时拍摄获取的待识别小票图片输入至小票识别模型，通过小票识别模型对待识别小票图片进行识别输出对应的文字识别结果。

本发明有效扩大了数据集覆盖范围，为后续的机器学习增加了更多的训练样本，显著缩短了构建数据集的周期，降低了构建数据集的成本，辅助提高了移动机器人的训练效果，提高了机器人在多种特殊情况下对可行区域的识别率。另外，通过对使用小票样本集训练得到的网络模型进行剪枝，可以降低模型的模型参数和浮点运算数量，提升模型运行速度，使得终端设备运行使用剪枝训练后得到的小票识别模型识别待识别小票图片的时候，减少小票识别模型在终端设备中的运行资源占用，且可以大大提升待识别小票图片中的票据填充要素的识别效率。

本发明的一个实施例，如图2和图3所示，一种购物小票的文字识别方法，包括：

S110预先设定小票填充内容，并设定不同小票类型的预设小票模板；小票填充内容包括票据填充要素、票据填充字体、票据填充字号；

具体的，由于购物小票上一般包含有如下文字信息：商家名称、商家地址、商家联系方式、收银机号、账单流水号、收银员编号、销售日期、商品名称、商品购买数量、商品购买单价、商品金额、折扣金额、配送费金额、合计金额、付款方式、实收金额、找零额、票据打印时间、开票二维码、开票期限提醒、客户名称、客户联系电话、客户地址、订单号等。因此，可以根据购物小票中一般包括的上述文字信息进行设置票据填充要素以描述购物小票。

其中，票据填充要素包括但是不限于商品信息栏、结算信息栏、商家信息栏、订单信息栏、开票信息栏和其他信息栏，商品信息栏包括商品名称、商品购买数量、商品购买单价、商品金额等商品相关信息。结算信息栏包括折扣金额、合计金额、付款方式、实收金额、找零额、配送费金额、销售日期、票据打印时间等交易相关信息。商家信息栏包括商家名称、商家地址、商家联系方式、收银机号、账单流水号、收银员编号等商家销售信息。开票信息栏包括开票二维码、开票期限提醒。其他信息栏包括“谢谢惠顾”、“会员信息(会员ID和会员积分等)”。订单信息栏包括客户名称、客户联系电话、客户地址、订单号。

此外，因为不同商业机构个性化的需求，文字信息的字体和字号大小也可能不同，因此，可基于现有存在的字体和常规开票采用的字号分别设置票据填充字体、票据填充字号。这样，就完成上述小票填充内容的设计。

小票类型包括电商销售小票、实体销售小票，不论是电商销售小票还实体销售小票均包括零售小票和批发小票。根据现实中票据的使用规范、使用习惯以及业务需求，设定不同小票类型对应的预设小票模板，预设小票模板限定有各个票据填充要素在标准票据范本的具体位置、大小、字体，这样就完成了不同小票类型的预设小票模板的设计。

示例性的，如图4所示为实体销售小票中的零售小票示例，如图5所示为电商销售小票的零售小票示例，如图6所示为AI测试小票示例。

S120按照预设小票模板规定的填充种类，从所有小票填充内容中随机选择不同语义特征的必要填充信息和非必要填充信息；

S130将必要填充信息、非必要填充信息填充至预设小票模板的对应位置生成预设数量个小票文本图像；

具体的，必要填充信息包括商品信息栏、结算信息栏、商家信息栏、订单信息栏，非必要填充信息包括开票信息栏和其他信息栏。不同语义特征的必要填充信息是包括上述商品信息栏、结算信息栏、商家信息栏，只是所选择的商品信息栏、结算信息栏、商家信息栏的文字内容语义部分可相同，部分不相同，当然也可以完全不同。同理，不同语义特征的非必要填充信息是包括上述开票信息栏和其他信息栏，只是所选择的开票信息栏和其他信息栏的文字内容语义部分可相同，部分不相同。

电商销售小票的填充种类包括商品信息栏、结算信息栏、商家信息栏，实体销售小票的填充种类包括商品信息栏、结算信息栏、商家信息栏和订单信息栏。因此，依照预设小票模板的类型，按照预设小票模板规定的填充种类，对应随机选择若干个不同语义特征的必要填充信息和非必要填充信息。

示例性的，如图4所示，当预设小票模板为实体零售小票模板(实体销售中的零售类型模板)时，参照上述方式选择对应的必要填充信息(如图4所示包括商品信息栏、结算信息栏、商家信息栏)、非必要填充信息(如图4所示包括开票信息栏和其他信息栏)并填充至实体零售小票模板中，且票据填充字体、票据填充字号如图4所示，在对应位置处的字体和字号大小不同。示例性的，如图5所示，当预设小票模板为电商零售小票模板(网络销售中的零售类型模板)时，参照上述方式选择对应的必要填充信息(如图4所示包括商品信息栏、结算信息栏、商家信息栏和订单信息栏)并填充至电商零售小票模板中，且票据填充字体、票据填充字号如图5所示，在对应位置处的字体和字号大小不同。

S140根据预设图像变换策略组合，对小票文本图像分别进行变换处理完成图像扩充；

具体的，预设图像变换策略组合包括物理变换和叠加变换，物理变换包括但是不限于平移变换、旋转变换、翻转变换、缩放变换、对比度变换、亮度变换、模糊变换、噪声绕道变换和场景效果叠加变换中的任意一种或者多种组合。根据上述预设图像变换策略组合中的任意一种图像变换方式对上述生成的所有小票文本图像进行对应的变换处理生成新的小票文本图像完成图像扩充。

其中，平移变换为：将小票文本图像进行左右、上下平移指定或者随机的距离。旋转变换为：以指定或随机的角度，将小票文本图像以中点为基准进行旋转。翻转变换为：以指定或随机的角度，将小票文本图像绕水平轴或垂直轴翻转。缩放变换为：以指定或随机的比例，对小票文本图像进行放大或缩小。对比度变换为：色调不变，改变小票文本图像的饱和度以及亮度。亮度变换为：亮度不变，改变小票文本图像的饱和度以及色调。模糊变换为：对小票文本图像中的所有像素点赋值为像素平均值进行模糊处理。噪声扰动变换为：利用噪声(例如高斯噪声和椒盐噪声)对小票文本图像添加噪声。场景效果叠加变换为：在小票文本图像上添加票据裂纹、票据遮挡、票据脏污点(包括血渍点、泥渍点、油渍点、水渍点等等)、票据磨损、等效果的水印图标。

示例性的，通过上述物理变换方式将小票文本图像进行变换处理后，从变换图像随机选取少量的候选变换图像，将候选变换图像中添加票据水渍效果的水印图标生成新的小票文本图像。其他的预设图像变换策略组合均在本发明保护范围内，在此不再一一赘述。

S150从填充至预设小票模板的必要填充信息中提取关键词，以生成小票文本图像对应的文本标签；

具体的，由于所有的小票文本图像均是根据必要填充信息填充至对应的预设小票模板中生成的，也就是说，填充生成的小票文本图像和其中的必要填充信息是具有关联关系的。因此，根据预设小票模板+必要填充信息→小票文本图像可知，可以从填充至预设小票模板的必要填充信息中提取关键词，将提取的关键词作为所生成的小票文本图像的文本标签。因此，可以通过上述方式提取生成所有小票文本图像分别对应的文本标签。

S160根据文本标签命名对应的小票文本图像得到票据样本图像，汇总所有票据样本图像得到小票样本集；

具体的，通过上述方式获取到文本标签后，根据各自对应的文本标签将小票文本图像进行标记处理，也就是说小票文本图像的命名方式为以文本标签进行命名，这样汇总所有命名后图像得到包括大量小票文本图像的小票样本集。

S210将小票样本集分类为小票图像训练集和小票图像验证集；

S220根据小票图像训练集进行模型训练得到网络模型；

具体的，以7:3的数量比例将小票样本集中的小票文本图像分类为小票图像训练集和小票图像验证集，然后使用小票图像训练集进行模型训练得到网络模型。此时，其实训练得到的网络模型已经可以进行识别待识别小票图片，但为了提高识别效率和降低内存资源占用率，还需要将网络模型进行剪枝。

S230将网络模型的中不同分支的初始权重值进行大小排序，从最小初始权重值开始按照排列顺序依次选取预设数量个分支进行剪枝；

S240将剪枝后的网络模型进行重训练，将小票图像验证集输入至剪枝后的网络模型获得识别误差值；

S250若识别误差值低于误差阈值进行下一轮剪枝及重训练，直至识别误差值高于误差阈值停止剪枝，并确定识别误差值最后一次低于误差阈值时剪枝后的网络模型为小票识别模型；

具体的，修剪(pruning)是指删除网络模型的某些意义上冗余的特征或参数。分支包括神经元、卷积衡量神经元的重要程度，移除一部分不重要的神经元。具体也就是将网络模型中不同分支的初始权重值进行大小排序，可以从大到小排序不同分支的初始权重值，也可以从小到大排序不同分支的初始权重值，总之，排序后先选取初始权重值的预设数量个(示例性的，初始权重值最小的一个，或者初始权重值最小的两个或三个)的分支进行剪枝，然后将第一次剪枝后的网络模型使用小票图像训练集进行重训练，并对剪枝重训练后的网络模型的参数进行微调。然后，将小票图像验证集输入至剪枝后的网络模型获得识别误差值。如果识别误差值低于误差阈值停止剪枝，反之，如果识别误差值高于误差阈值，参照上述方式进行下一轮剪枝和重训练。

剪枝操作后得到的网络模型并不一定是最优模型，需要对其进行重训练，根据重训练得到的网络模型和小票图像验证集进行计算获取识别误差值，通过识别误差值反映剪枝操作对模型的影响，进而明确接下来是否可以继续对模型进行剪枝操作，以及是否需要调整网络模型本身。

其中，识别误差值低于误差阈值时，则说明本次的剪枝操作成功了，在缩减模型规模的同时，没有损耗模型的精确度，但此时不是直接作为最终的小票识别模型，而是进一步地在已经剪枝的网络模型的基础上再进行剪枝操作。具体的方法就是将本次剪枝得到的网络模型重训练后代替上一轮网络模型(第一次剪枝训练得到的网络模型对应的上一轮网络模型为根据小票图像训练集进行模型训练得到的初始的网络模型)，将剪枝后剩下的权重值在更新后进行顺序排列并参照上述方式进行剪枝操作，获取识别误差值，再进行判断操作。如果一次又一次的剪枝后得到的网络模型的识别误差值均能小于误差阈值，就会重复上述过程进行反复的剪枝和重训练，直至识别误差值高于误差阈值停止剪枝。

具体的，通过上述方式进行训练、剪枝、训练得到小票识别模型后，将拍摄获取的待识别小票图片输入至小票识别模型中，可以提升小票文字内容的识别效率，通过机器学习的方式进行小票文字内容识别，无需工作人员肉眼识别录入购物明细，大大减轻工作人员的工作量。

本实施例通过预设小票模板和小票填充内容随机生成小票文本图像后，根据预设图像变换策略组合进行图像变换处理来扩充不同场景和拍摄条件下得到的票据样本图像，变换出许多特殊情况下才可能采集到的票据样本图像。本发明有效扩大了票据样本图像的覆盖范围，为后续的机器学习增加了更多的训练样本，显著缩短了构建小票样本集的周期，降低了构建小票样本集的成本，辅助提高了训练效果，提高了在多种特殊情况下对待识别小票图片的识别率，能够支持多类票据识别。通过上述合理有效的图像样本增强方法，满足卷积神经网络对训练数据量的要求，从而提升网络模型的鲁棒性和泛化能力。

此外，本发明中模型重训练是为了恢复那些被错误剪枝的重要的参数，以便恢复一定的准确率。本发明通过通过循环剪枝的方式构建一个优化的小票识别模型，不仅仅能够缓解存储和计算压力，还在保证模型准确率高于误差阈值的情况下，极大压缩模型大小。通过上述网络剪枝方式去除网络模型中冗余的参数，不仅仅可以大大减小计算量，从而使计算时间更少，功耗更小。而且因为整体的网络模型进行剪枝使得网络内存占用变小，提高通用性以便广泛普及，还可以达到有效地裁剪模型且最小化精度的损失。

本发明的一个实施例，一种购物小票的文字识别系统包括：

样本获取模块，用于向预设小票模板中随机添加票据填充内容生成小票文本图像，对小票文本图像进行图像扩充和打标处理获得小票样本集；

模型获取模块，用于根据小票样本集训练得到网络模型，并通过网络剪枝对网络模型进行压缩处理得到小票识别模型；

处理模块，用于将待识别小票图片输入至小票识别模型得到文字识别结果。

具体的，本实施例是上述方法实施例对应的装置实施例，具体效果参见上述方法实施例，在此不再一一赘述。

基于前述实施例，样本获取模块包括：

设置单元，用于预先设定小票填充内容，并设定不同小票类型的预设小票模板；小票填充内容包括票据填充要素、票据填充字体、票据填充字号；

选择单元，用于按照预设小票模板规定的填充种类，从所有小票填充内容中随机选择不同语义特征的必要填充信息和非必要填充信息；

生成单元，用于将必要填充信息、非必要填充信息填充至预设小票模板的对应位置生成预设数量个小票文本图像；

基于前述实施例，模型获取模块包括：

图像处理单元，用于根据预设图像变换策略组合，对小票文本图像分别进行变换处理完成图像扩充；

信息提取单元，用于从填充至预设小票模板的必要填充信息中提取关键词，以生成小票文本图像对应的文本标签；

图像打标单元，用于根据文本标签命名对应的小票文本图像得到票据样本图像，汇总所有票据样本图像得到小票样本集。

基于前述实施例，处理模块包括：

分类单元，用于将小票样本集分类为小票图像训练集和小票图像验证集；

训练单元，用于根据小票图像训练集进行模型训练得到网络模型；

剪枝单元，用于将网络模型的中不同分支的初始权重值进行大小排序，从最小初始权重值开始按照排列顺序依次选取预设数量个分支进行剪枝；

处理单元，用于将剪枝后的网络模型进行重训练，将小票图像验证集输入至剪枝后的网络模型获得识别误差值；

获取单元，用于若识别误差值低于误差阈值进行下一轮剪枝及重训练，直至识别误差值高于误差阈值停止剪枝，并确定识别误差值最后一次低于误差阈值时剪枝后的网络模型为小票识别模型。

由于在计算机视觉领域，识别结果的准确性和运行的高效性是衡量工程可用的重要标准，只有准确率和运行效率高，该应用才有价值。深度学习用于小票OCR识别时，为了提高准确率和运行效率，主要可以考虑两个方面，一个是使用海量高质量的训练数据，另一个是对算法进行压缩和优化。本发明的重点是提供一个简洁易用的方法自动生成小票文本图像和文本标签进而生成票据样本图像，并对训练后的模型进行压缩。本发明改进主要体现在文本图像生成、模型压缩方法上：

根据指定的文本，字体、字号等，随机生成和小票风格相同的文本图像。根据小票应用场景，对生成的文本图像进行如：映射畸变、添加自然噪声、锐化、模糊、文改变文本亮度等操作，增加生成图像的多样性，提高泛化能力。通过上述方式可以生成任意多的小票文本图像，且生成时自带文本标签信息，大大节省了时间成本和经济成本。通过上述方式获取票据样本图像的样本采集成本低，方便易用，功能齐全，不会涉及侵犯隐私权等法律问题。

另外，通过网络剪枝对网络模型进行压缩，更大程度地降低网络参数量，减少资源占用，提升模型计算速度。通过计算模型参数对于准确率的敏感程度即计算权重值，确定剪枝原则和参数微调等，能够在有效地保证模型的准确性的前提下，简单快速进行网络模型的压缩，进而有效地减少后续小票识别模型的计算量。

示例性的，通过本发明研发生产出票据打印机，可应用于工业、商超、农贸、执法等场景。利用生成的文本图像训练的文本检测和识别模型，使用PyTorch将模型处理为推理模型，并部署于云中，58票据打印机通过网络调用模型，实现快速实时的小票识别。整体的实施过程包括如图7所示的四个流程：文本图像生成、模型训练、模型压缩、实时检测。

步骤1：根据指定的文本、字体和字号，生成和小票风格相似的文本图像，并通过映射畸变等技术，增加文本的多样性。如图8所示，实现建立文本库和字体库，文本库储存有大量不同的票据填充要素，字体库储存有大量不同的票据填充字体、票据填充字号。从文本库和字体库中任意随机选择票据填充要素、票据填充字体、票据填充字号生成对应的小票文本图像，然后对小票文本图像进行图像处理(扭曲、加噪、模糊等)进而生成多结构文本图像(即本发明变换处理后生成的新的小票文本图像)，此外，根据从文本库随机选择票据填充要素中的必要填充信息，进行关键词提取生成对应小票文本图像的文本标签。

步骤2：使用生成的数据(即多结构文本图像和文本标签)训练小票文本检测和识别模型即票据识别模型。

步骤3：计算模型参数的敏感性，使用网络剪枝技术进行压缩，并利用训练样本对参数进行微调。

步骤4：将模型部署到云中，58票据打印机通过网络调用模型，实时检测出小票文本，提供给其他需求应用。如图9所示，为了完成识别，需要打印机生成小票图片。以58小票打印机为例，58拥有GB18030和英文字库，并支持U.S.A.和France等十余种字符集，满足识别要求。

通过本发明本发明可以快速生成大量不同风格的小票文本图像，且解决了侵权的问题，而且生成的小票文本图像自带数据标签，更加方便快捷，节省了大量时间和人力。此外通过对网络模型进行压缩，减少了资源占用量，并提升运行速度。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的程序模块完成，即将所述装置的内部结构划分成不同的程序单元或模块，以完成以上描述的全部或者部分功能。实施例中的各程序模块可以集成在一个处理单元中，也可是各个单元单独物理存在，也可以两个或两个以上单元集成在一个处理单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序单元的形式实现。另外，各程序模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。

本发明的一个实施例，如图10所示，一种终端设备100，包括处理器110、存储器120，其中，存储器120，用于存放计算机程序121；处理器110，用于执行存储器120上所存放的计算机程序121，实现上述所对应方法实施例中的购物小票的文字识别方法。

所述终端设备100可以为桌上型计算机、笔记本、掌上电脑、平板型计算机、手机、人机交互屏和票据打印机等设备。所述终端设备100可包括，但不仅限于处理器110、存储器120。本领域技术人员可以理解，图10仅仅是终端设备100的示例，并不构成对终端设备100的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如：终端设备100还可以包括输入/输出接口、显示设备、网络接入设备、通信总线、通信接口等。通信接口和通信总线，还可以包括输入/输出接口，其中，处理器110、存储器120、输入/输出接口和通信接口通过通信总线完成相互间的通信。该存储器120存储有计算机程序121，该处理器110用于执行存储器120上所存放的计算机程序121，实现上述所对应方法实施例中的购物小票的文字识别方法。

所述处理器110可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器120可以是所述终端设备100的内部存储单元，例如：终端设备的硬盘或内存。所述存储器也可以是所述终端设备的外部存储设备，例如：所述终端设备上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器120还可以既包括所述终端设备100的内部存储单元也包括外部存储设备。所述存储器120用于存储所述计算机程序121以及所述终端设备100所需要的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。

通信总线是连接所描述的元素的电路并且在这些元素之间实现传输。例如，处理器110通过通信总线从其它元素接收到命令，解密接收到的命令，根据解密的命令执行计算或数据处理。存储器120可以包括程序模块，例如内核(kernel)，中间件(middleware)，应用程序编程接口(Application Programming Interface，API)和应用。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。输入/输出接口转发用户通过输入/输出接口(例如感应器、键盘、触摸屏)输入的命令或数据。通信接口将该终端设备100与其它网络设备、用户设备、网络进行连接。例如，通信接口可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种：无线保真(WiFi)，蓝牙(BT)，近距离无线通信技术(NFC)，全球卫星定位系统(GPS)和蜂窝通信等等。有线通信可以包括以下至少一种：通用串行总线(USB)，高清晰度多媒体接口(HDMI)，异步传输标准接口(RS-232)等等。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。终端设备100可以通过通信接口连接网络，终端设备100和其它网络设备通信所用的协议可以被应用、应用程序编程接口(API)、中间件、内核和通信接口至少一个支持。

本发明的一个实施例，一种存储介质，存储介质中存储有至少一条指令，指令由处理器加载并执行以实现上述购物小票的文字识别方法对应实施例所执行的操作。例如，存储介质可以是只读内存(ROM)、随机存取存储器(RAM)、只读光盘(CD-ROM)、磁带、软盘和光数据存储设备等。

它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详细描述或记载的部分，可以参见其他实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/终端设备和方法，可以通过其他的方式实现。例如，以上所描述的装置/终端设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性、机械或其他的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可能集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明实现上述实施例方法中的全部或部分流程，也可以通过计算机程序121发送指令给相关的硬件完成，所述的计算机程序121可存储于一存储介质中，该计算机程序121在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序121可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述存储介质可以包括：能够携带所述计算机程序121的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如：在某些司法管辖区，根据立法和专利实践，计算机可读的存储介质不包括电载波信号和电信信号。

应当说明的是，上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种购物小票的文字识别方法，其特征在于，包括步骤：

2.根据权利要求1所述的购物小票的文字识别方法，其特征在于，所述向预设小票模板中随机添加票据填充内容生成小票文本图像包括步骤：

3.根据权利要求1所述的购物小票的文字识别方法，其特征在于，所述对所述小票文本图像进行图像扩充和打标处理获得小票样本集包括步骤：

4.根据权利要求1所述的购物小票的文字识别方法，其特征在于，所述根据所述小票样本集训练得到网络模型，并通过网络剪枝对所述网络模型进行压缩处理得到小票识别模型包括步骤：

根据所述小票图像训练集进行模型训练得到所述网络模型；

5.一种购物小票的文字识别系统，其特征在于，包括：

6.根据权利要求5所述的购物小票的文字识别系统，其特征在于，所述样本获取模块包括：

7.根据权利要求5所述的购物小票的文字识别系统，其特征在于，所述模型获取模块包括：

8.根据权利要求5所述的购物小票的文字识别系统，其特征在于，所述处理模块包括：

9.一种终端设备，其特征在于，包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器，用于执行所述存储器上所存放的计算机程序，实现如权利要求1至权利要求4任一项所述的购物小票的文字识别方法所执行的操作。

10.一种存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求4任一项所述的购物小票的文字识别方法所执行的操作。