CN114359931A - 一种快递面单识别方法、装置、计算机设备及存储介质 - Google Patents

一种快递面单识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114359931A
CN114359931A CN202111647562.1A CN202111647562A CN114359931A CN 114359931 A CN114359931 A CN 114359931A CN 202111647562 A CN202111647562 A CN 202111647562A CN 114359931 A CN114359931 A CN 114359931A
Authority
CN
China
Prior art keywords
picture
express
information
text
waybill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111647562.1A
Other languages
English (en)
Inventor
闵武国
江杰
方丹丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Fengchao Network Technology Co ltd
Original Assignee
Shenzhen Fengchao Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Fengchao Network Technology Co ltd filed Critical Shenzhen Fengchao Network Technology Co ltd
Priority to CN202111647562.1A priority Critical patent/CN114359931A/zh
Publication of CN114359931A publication Critical patent/CN114359931A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

本发明实施例公开了一种快递面单识别方法、装置、计算机设备及存储介质。该方法包括:获取待识别的快递面单图片;将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态;将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;根据检测框在快递面单图片中对目标文本信息所在区域进行裁剪,以获得目标文本信息图片;将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息。本方法可基于移动终端实施完成,应用成本低范围广,识别准确率高速度快,无需占用过多的终端资源,不依赖于网络和平台,极大提高了快递的配送效率。

Description

一种快递面单识别方法、装置、计算机设备及存储介质
技术领域
本发明实施例涉及单据识别技术领域,尤其涉及一种快递面单识别方法、装置、计算机设备及存储介质。
背景技术
随着互联网电子商务的发展,越来越多的人通过智能手机进行网上购物,并促使了快递物流行业的迅猛发展。越来越快的节奏使人们对物流配送速度提出了更高的要求,如何快速高效准确的完成末端配送成为主要的难题。
为了改善传统人工查验运单信息所导致的效率及准确率低下的问题,目前主要通过使用专用扫描设备来识别快递面单上的运单号,然后通过后台数据库来获取运单号对应的收件人信息。但是专用扫描设备是基于光电的方式识别运单号,成本较高也难以大量普及,而且通过后台数据库获取运单号对应的收件人信息需要接入商城订单系统,从而使得该方式不仅受限于网络环境,也受限于接入权限,同时也会限制应用的范围,导致面单识别错误率高且效率低下。在实现本发明过程中,发明人发现现有技术中至少存在如下问题,目前也有使用基于移动端的快递面单识别软件来进行识别,但是由于现有的拍照设备、拍摄环境及快递面单质量等因素,导致其识别效率低且错误率高,从而影响了配送效率及用户体验。
发明内容
本发明实施例提供一种快递面单识别方法、装置、计算机设备及存储介质,以避免受到网络及电商平台的限制,从而极大的提高识别准确率及配送效率。
第一方面,本发明实施例提供了一种快递面单识别装置,该装置包括:
图片获取模块,用于获取待识别的快递面单图片;
方向检测模块,用于将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态;
文本检测模块,用于将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
区域裁剪模块,用于根据所述检测框在所述快递面单图片中对所述目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
文本识别模块,用于将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息。
第二方面,本发明实施例还提供了一种快递面单识别方法,该方法包括:
获取待识别的快递面单图片;
将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态;
将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
根据所述检测框在所述快递面单图片中对所述目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息。
可选的,所述目标文本信息中包括运单号信息;
在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态之后,还包括:
对矫正后的所述快递面单图片中的条形码信息进行识别;
相应的,在将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息之后,还包括:
对所述运单号信息和所述条形码信息进行整合,以得到最终的快递单号。
可选的,在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息之前,还包括:
构建所述方向检测模型;
采集不同角度、不同类型的第一快递面单图片;
对所述第一快递面单图片进行方向标注获得标注结果,并将所述标注结果按照第一预设比例划分为第一训练集和第一测试集;
根据所述第一训练集对所述方向检测模型进行训练,并在完成训练后根据所述第一测试集对所述方向检测模型进行测试,直至得到训练好的所述方向检测模型。
可选的,在将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框之前,还包括:
构建所述文本检测模型;
采集不同类型的第二快递面单图片,所述第二快递面单图片中至少包括所述目标文本信息;
对所述第二快递面单图片进行文本框标注,并将标注结果按照第二预设比例划分为第二训练集和第二测试集;
根据所述第二训练集对所述文本检测模型进行训练,并在完成训练后根据所述第二测试集对所述文本检测模型进行测试,直至得到训练好的所述文本检测模型。
可选的,在将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息之前,还包括:
构建所述文本识别模型;
采集或生成文本图片,所述文本图片中至少包括快递面单的常用文本;
对所述文本图片进行文本标注,并将标注结果按照第三预设比例划分为第三训练集和第三测试集;
根据所述第三训练集对所述文本识别模型进行训练,并在完成训练后根据所述第三测试集对所述文本识别模型进行测试,直至得到训练好的所述文本识别模型。
可选的,在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息之前,还包括:
对所述快递面单图片进行预处理,所述预处理包括图片质量增强、图片大小缩放及图片归一化中的至少一种。
可选的,所述目标文本信息包括运单号信息、收件方信息、寄件方信息、快递公司信息、商品信息、留言备注信息及目的地信息中的一种或多种。
第三方面,本发明实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所提供的快递面单识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明任意实施例所提供的快递面单识别方法。
本发明实施例提供了一种快递面单识别方法,首先获取待识别的快递面单图片,然后通过方向检测模型检测快递面单图片的方向信息,并根据该方向信息将快递面单图片矫正至水平状态,再通过文本检测模型对矫正后的快递面单图片进行识别,以得到其中所需的目标文本信息的检测框,从而根据该检测框对目标文本信息所在区域进行裁剪,以得到目标文本信息图片,最后通过文本识别模型对目标文本信息图片进行识别,即可得到所需的目标文本信息。本发明实施例所提供的快递面单识别方法,通过使用基于深度学习的文字检测模块和文字识别模块,使得识别准确率更高,并且可识别的面单类型更加多样化,而且本方法可以简单基于移动终端来实施完成,对移动终端没有特别的限制要求,应用成本低,应用范围广,同时识别速度较快,也不用占用过多的移动终端资源,不用依赖于网络和平台,极大的提高了快递的配送效率。
附图说明
图1为本发明实施例一提供的快递面单识别方法的流程图;
图2为本发明实施例二提供的快递面单识别装置的结构示意图;
图3为本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1为本发明实施例一提供的快递面单识别方法的流程图。本实施例可适用于快递物流行业在末端配送时提取快递面单中信息的情况,该方法可以由本发明实施例所提供的快递面单识别装置来执行,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中,该计算机设备可以是移动终端,但不限于是移动终端。如图1所示,具体包括如下步骤:
S11、获取待识别的快递面单图片。
具体的,以使用移动终端实现为例进行说明,可以通过移动终端上自带有的摄像头(如手机上的摄像头)拍摄得到所需的快递面单图片,其中,所获取到的快递面单图片中至少包括所需的目标文本信息相应的图片信息。其中,可选的,目标文本信息包括运单号信息、收件方信息、寄件方信息、快递公司信息、商品信息(如产品重量及价格等)、留言备注信息及目的地信息中的一种或多种,具体可以根据具体的需求来设定,如应用于快递末端派送时,目标文本信息可以包括收件方信息和运单号信息等等。
S12、将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态。
具体的,在获取到快递面单图片之后,可以将该快递面单图片输入到训练好的方向检测模型中,从而该方向检测模型可以预测得到快递面单图片的方向信息,具体可以是沿某一方向与水平状态之间的角度,其中的水平状态即为快递面单图片中的文本沿水平方向进行展示时的状态。其中,该方向检测模型为一种深度学习模型,同时为了适应移动终端,由于移动终端本身对大小及重量等便捷性的需求,在资源及计算能力方面不及家用计算机,因此考虑到移动终端的资源和计算能力的限制,具体可以采用轻量型的深度学习模型,从而在保证准确率的同时又能实现较快的推理速度,满足移动端应用的要求。在获得快递面单图片的方向信息之后,即可根据该方向信息将快递面单图片旋转至水平状态,以便于后续的处理,具体可以利用开源工具根据检测到的方向信息对快递面单图片进行旋转。
可选的,在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息之前,还包括:构建方向检测模型;采集不同角度、不同类型的第一快递面单图片;对第一快递面单图片进行方向标注获得标注结果,并将标注结果按照第一预设比例划分为第一训练集和第一测试集;根据第一训练集对方向检测模型进行训练,并在完成训练后根据第一测试集对方向检测模型进行测试,直至得到训练好的方向检测模型。具体的,可以采集不同角度、不同类型的第一快递面单图片来训练方向检测模型,其中,不同类型的第一快递面单图片可以是不同快递公司的快递面单图片,也可以是同一快递公司针对不同业务的快递面单图片等等。在采集到第一快递面单图片之后,可以对其进行方向标注,以便方向检测模型进行学习,具体可以将方向标注分为预设数量个标注类别,并按照预设方向对图像拍摄角度进行划分,然后可以将采集到的不同角度的第一快递面单图片划分至其中最邻近的角度类别。示例性的,方向标注可以分为8个标注类别,并按照顺时针方向将图像拍摄角度划分为0度、45度、90度、135度、180度、225度、275度、315度及360度等8个角度,当采集到的第一快递面单图片的拍摄角度为30度时,可将该第一快递面单图片划分至45度的角度类别。在完成方向标注之后,可以将标注结果,即带有标注的第一快递面单图片按照第一预设比例划分为第一训练集和第一测试集,从而首先根据第一训练集对方向检测模型进行训练,训练完毕后在第一测试集上验证方向检测模型的效果,当效果不佳时可以继续训练,直至得到训练好的方向检测模型,以对快递面单图片的方向信息实现快速准确的识别。
S13、将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框。
具体的,在完成快递面单图片的矫正之后,可以将矫正后的快递面单图片输入到训练好的文本检测模型中,从而该文本检测模型可以预测得到快递面单图片中目标文本信息的所在区域,并可以通过检测框进行标识。其中,该文本检测模型为一种深度学习模型,同时为了适应移动终端,考虑到移动终端的资源和计算能力的限制,具体可以采用轻量型的深度学习模型,从而在保证准确率的同时又能实现较快的推理速度,满足移动端应用的要求。
可选的,在将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框之前,还包括:构建文本检测模型;采集不同类型的第二快递面单图片,第二快递面单图片中至少包括目标文本信息;对第二快递面单图片进行文本框标注,并将标注结果按照第二预设比例划分为第二训练集和第二测试集;根据第二训练集对文本检测模型进行训练,并在完成训练后根据第二测试集对文本检测模型进行测试,直至得到训练好的文本检测模型。具体的,可以采集市面上各种类型的第二快递面单图片,可以至少包括常用快递公司的大部分快递面单图片,同时第二快递面单图片中至少包括所需的目标文本信息,以用于快递末端派送为例,第二快递面单图片中可以至少包括收件方信息(如收件人姓名、手机号及配送地点等)和运单号信息。在采集到第二快递面单图片之后,可以根据需要识别的信息对其进行选择性的文本框标注,以便文本检测模型进行学习,具体可以采用两点标注或四点标注等方式,其中两点标注即记录单行文本块右上角像素值和左下角像素值,或者左上角像素值和右下角像素值,四点标注即记录单行文本块左上角、右上角、左下角和右下角的像素值,对此本实施例不作具体的限制。在完成文本框标注之后,可以将标注结果,即带有标注的第二快递面单图片按照第二预设比例划分为第二训练集和第二测试集,从而首先根据第二训练集对文本检测模型进行训练,训练完毕后在第二测试集上验证文本检测模型的效果,当效果不佳时可以继续训练,直至得到训练好的文本检测模型,以对矫正后的快递面单图片中的目标文本信息所在区域实现快速准确的识别。
S14、根据检测框在快递面单图片中对目标文本信息所在区域进行裁剪,以获得目标文本信息图片。
具体的,在获得目标文本信息的检测框的位置之后,可以利用开源工具对快递面单图片进行裁剪,以提取出其中只包含目标文本信息所在区域的图片,即目标文本信息图片。
S15、将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息。
具体的,在完成目标文本信息图片的裁剪之后,可以将目标文本信息图片输入到训练好的文本识别模型中,从而该文本识别模型可以预测得到目标文本信息图片中所包含的目标文本信息。其中,该文本识别模型为一种深度学习模型,同时为了适应移动终端,考虑到移动终端的资源和计算能力的限制,具体可以采用轻量型的深度学习模型,从而在保证准确率的同时又能实现较快的推理速度,满足移动端应用的要求。在识别得到目标文本信息之后,可以在移动终端上对其进行显示。
可选的,在将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息之前,还包括:构建文本识别模型;采集或生成文本图片,文本图片中至少包括快递面单的常用文本;对文本图片进行文本标注,并将标注结果按照第三预设比例划分为第三训练集和第三测试集;根据第三训练集对文本识别模型进行训练,并在完成训练后根据第三测试集对文本识别模型进行测试,直至得到训练好的文本识别模型。具体的,可以采集各类带有文本的文本图片,也可以通过文本生成软件来模拟生成快递面单的文本图片,其中的文本图片中至少包括快递面单的常用文本(文字、字母及数字等),并可以尽量包含多场景、多字体的文本图片,文本图片中涵盖的场景越多、字体种类越多,则文本识别模型的准确性越高,同时,采集或生成的文本图片中文字、字母及数字的占比可以尽量保持平衡。在采集到文本图片之后,可以对其进行文本标注,以便文本识别模型进行学习,具体可以进行字符级的文本标注,或者也可以进行非字符级的文本标注,再根据文本识别模型的需求进行字符转换等等。在完成文本标注之后,可以将标注结果,即带有标注的文本图片按照第三预设比例划分为第三训练集和第三测试集,从而首先根据第三训练集对文本识别模型进行训练,训练完毕后在第三测试集上验证文本识别模型的效果,当效果不佳时可以继续训练,直至得到训练好的文本识别模型,以对目标文本信息图片中的目标文本信息实现快速准确的识别。
在上述技术方案的基础上,为了获得准确率更高的快递单信息,在本实施例中,可选的,目标文本信息中包括运单号信息;在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态之后,还包括:对矫正后的快递面单图片中的条形码信息进行识别;相应的,在将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息之后,还包括:对运单号信息和条形码信息进行整合,以得到最终的快递单号。具体的,当有识别快递单号的需求时,可以运用两种不同的方法分别进行提取,一种是条形码识别,一种是深度学习文本识别。在完成快递面单图片的矫正之后,可以将矫正后的快递面单图片输入到条形码识别模块中,以获得其中蕴含的条形码信息,即相当于快递单号信息,其中的条形码识别模块可以采用现有的任意条形码识别模块。同时上述的目标文本信息可以包括运单号信息,也相当于快递单号信息,即可通过上述方法识别得到运单号信息,再将获得的条形码信息和运单号信息进行整合,即可得到最终确定的快递单号,通过两种方法的结合可以使得所确定的快递单号的准确率更高,从而为用户提供更好的体验。
在上述技术方案的基础上,可选的,在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息之前,还包括:对快递面单图片进行预处理,预处理包括图片质量增强、图片大小缩放及图片归一化中的至少一种。具体的,对于移动终端而言,快递面单图片可以通过手机自带的摄像头来采集,由于图像采集环境的差异,如光照、设备性能及面单质量等存在不同,采集的快递面单图片可能存在偏暗、曝光、失焦及字迹不清晰等问题,从而对后续的检测和识别过程带来不利影响,因此可以采用基于对抗生成网络的图片质量增强算法对采集的快递面单图片进行质量增强,以获得清晰的图片。其次,不同设备采集到的快递面单图片尺寸会有差异,由于后续的检测和识别过程均是基于卷积神经网络实现的,对图片尺寸会有一定的要求(如宽/高是32的整数倍等),且图片尺寸对算法处理的速度也有显著的影响,因此可以通过图片大小缩放将快递面单图片的尺寸调整为合适的大小。再次,为了方便后续数据处理,加快模型学习速度,深度学习模型在训练阶段可以对输入的图片进行归一化处理,则相应的,在移动终端上推理时,也可以通过图片归一化对采集的快递面单图片进行归一化处理,将像素值变换为均值为0,方差为1的正态分布。因此,通过对快递面单图片进行图片质量增强、图片大小缩放及图片归一化等预处理的过程,可以得到清晰统一的高质量图片,避免了因拍照设备、拍摄环境及快递面单质量等造成的不利影响,进一步提高了信息识别的准确率。
本发明实施例所提供的技术方案,首先获取待识别的快递面单图片,然后通过方向检测模型检测快递面单图片的方向信息,并根据该方向信息将快递面单图片矫正至水平状态,再通过文本检测模型对矫正后的快递面单图片进行识别,以得到其中所需的目标文本信息的检测框,从而根据该检测框对目标文本信息所在区域进行裁剪,以得到目标文本信息图片,最后通过文本识别模型对目标文本信息图片进行识别,即可得到所需的目标文本信息。通过使用方向检测模型,可以将任意拍摄方向的图片旋转至水平方向并完成信息识别,使得拍摄图片时不用局限于水平方向正拍,从而使得应用场景更加广泛,同时通过使用基于深度学习的文字检测模块和文字识别模块,使得识别准确率更高,并且可识别的面单类型更加多样化,而且本方法可以简单基于移动终端来实施完成,对移动终端没有特别的限制要求,应用成本低,应用范围广,同时识别速度较快,也不用占用过多的移动终端资源,不用依赖于网络和平台,极大的提高了快递的配送效率。
实施例二
图2为本发明实施例二提供的快递面单识别装置的结构示意图,该装置可以由硬件和/或软件的方式来实现,一般可集成于计算机设备中,该计算机设备可以是移动终端,但不限于是移动终端,用于执行本发明任意实施例所提供的快递面单识别方法。如图2所示,该装置包括:
图片获取模块21,用于获取待识别的快递面单图片;
方向检测模块22,用于将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态;
文本检测模块23,用于将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
区域裁剪模块24,用于根据检测框在快递面单图片中对目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
文本识别模块25,用于将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息。
本发明实施例所提供的技术方案,首先获取待识别的快递面单图片,然后通过方向检测模型检测快递面单图片的方向信息,并根据该方向信息将快递面单图片矫正至水平状态,再通过文本检测模型对矫正后的快递面单图片进行识别,以得到其中所需的目标文本信息的检测框,从而根据该检测框对目标文本信息所在区域进行裁剪,以得到目标文本信息图片,最后通过文本识别模型对目标文本信息图片进行识别,即可得到所需的目标文本信息。通过使用方向检测模型,可以将任意拍摄方向的图片旋转至水平方向并完成信息识别,使得拍摄图片时不用局限于水平方向正拍,从而使得应用场景更加广泛,同时通过使用基于深度学习的文字检测模块和文字识别模块,使得识别准确率更高,并且可识别的面单类型更加多样化,而且本方法可以简单基于移动终端来实施完成,对移动终端没有特别的限制要求,应用成本低,应用范围广,同时识别速度较快,也不用占用过多的移动终端资源,不用依赖于网络和平台,极大的提高了快递的配送效率。
在上述技术方案的基础上,可选的,目标文本信息中包括运单号信息;
该快递面单识别装置,还包括:
条形码信息获取模块,用于在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态之后,对矫正后的快递面单图片中的条形码信息进行识别;
相应的,该快递面单识别装置,还包括:
快递单号整合模块,用于在将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息之后,对运单号信息和条形码信息进行整合,以得到最终的快递单号。
在上述技术方案的基础上,可选的,该快递面单识别装置,还包括:
方向检测模型构建模块,用于在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息之前,构建方向检测模型;
第一快递面单图片采集模块,用于采集不同角度、不同类型的第一快递面单图片;
方向标注模块,用于对第一快递面单图片进行方向标注获得标注结果,并将标注结果按照第一预设比例划分为第一训练集和第一测试集;
方向检测模型训练模块,用于根据第一训练集对方向检测模型进行训练,并在完成训练后根据第一测试集对方向检测模型进行测试,直至得到训练好的方向检测模型。
在上述技术方案的基础上,可选的,该快递面单识别装置,还包括:
文本检测模型构建模块,用于在将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框之前,构建文本检测模型;
第二快递面单图片采集模块,用于采集不同类型的第二快递面单图片,第二快递面单图片中至少包括目标文本信息;
文本框标注模块,用于对第二快递面单图片进行文本框标注,并将标注结果按照第二预设比例划分为第二训练集和第二测试集;
文本检测模型训练模块,用于根据第二训练集对文本检测模型进行训练,并在完成训练后根据第二测试集对文本检测模型进行测试,直至得到训练好的文本检测模型。
在上述技术方案的基础上,可选的,该快递面单识别装置,还包括:
文本识别模型构建模块,用于在将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息之前,构建文本识别模型;
文本图片采集模块,用于采集或生成文本图片,文本图片中至少包括快递面单的常用文本;
文本标注模块,用于对文本图片进行文本标注,并将标注结果按照第三预设比例划分为第三训练集和第三测试集;
文本识别模型训练模块,用于根据第三训练集对文本识别模型进行训练,并在完成训练后根据第三测试集对文本识别模型进行测试,直至得到训练好的文本识别模型。
在上述技术方案的基础上,可选的,该快递面单识别装置,还包括:
图片预处理模块,用于在将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息之前,对快递面单图片进行预处理,预处理包括图片质量增强、图片大小缩放及图片归一化中的至少一种。
在上述技术方案的基础上,可选的,目标文本信息包括运单号信息、收件方信息、寄件方信息、快递公司信息、商品信息、留言备注信息及目的地信息中的一种或多种。
本发明实施例所提供的快递面单识别装置可执行本发明任意实施例所提供的快递面单识别方法,具备执行方法相应的功能模块和有益效果。
值得注意的是,在上述快递面单识别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
实施例三
图3为本发明实施例三提供的计算机设备的结构示意图,示出了适于用来实现本发明实施方式的示例性计算机设备的框图。图3显示的计算机设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图3所示,该计算机设备包括处理器31、存储器32、输入装置33及输出装置34;计算机设备中处理器31的数量可以是一个或多个,图3中以一个处理器31为例,计算机设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图3中以通过总线连接为例。
存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的快递面单识别方法对应的程序指令/模块(例如,快递面单识别装置中的图片获取模块21、方向检测模块22、文本检测模块23、区域裁剪模块24及文本识别模块25)。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述的快递面单识别方法。
存储器32可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器32可进一步包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置33可用于获取待识别的快递面单图片,以及产生与计算机设备的用户设置和功能控制有关的键信号输入等。输出装置34可包括显示屏等设备,可用于向用户展示所获得的目标文本信息等等。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,该计算机可执行指令在由计算机处理器执行时用于执行一种快递面单识别方法,该方法包括:
获取待识别的快递面单图片;
将快递面单图片输入到训练好的方向检测模型中,以获得快递面单图片的方向信息,并根据方向信息将快递面单图片矫正至水平状态;
将矫正后的快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
根据检测框在快递面单图片中对目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
将目标文本信息图片输入到训练好的文本识别模型中,以获得目标文本信息。
存储介质可以是任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如CD-ROM、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如DRAM、DDR RAM、SRAM、EDO RAM、兰巴斯(Rambus)RAM等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的快递面单识别方法中的相关操作。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种快递面单识别装置,其特征在于,包括:
图片获取模块,用于获取待识别的快递面单图片;
方向检测模块,用于将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态;
文本检测模块,用于将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
区域裁剪模块,用于根据所述检测框在所述快递面单图片中对所述目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
文本识别模块,用于将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息。
2.一种快递面单识别方法,其特征在于,包括:
获取待识别的快递面单图片;
将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态;
将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框;
根据所述检测框在所述快递面单图片中对所述目标文本信息所在区域进行裁剪,以获得目标文本信息图片;
将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息。
3.根据权利要求2所述的快递面单识别方法,其特征在于,所述目标文本信息中包括运单号信息;
在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息,并根据所述方向信息将所述快递面单图片矫正至水平状态之后,还包括:
对矫正后的所述快递面单图片中的条形码信息进行识别;
相应的,在将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息之后,还包括:
对所述运单号信息和所述条形码信息进行整合,以得到最终的快递单号。
4.根据权利要求2所述的快递面单识别方法,其特征在于,在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息之前,还包括:
构建所述方向检测模型;
采集不同角度、不同类型的第一快递面单图片;
对所述第一快递面单图片进行方向标注获得标注结果,并将所述标注结果按照第一预设比例划分为第一训练集和第一测试集;
根据所述第一训练集对所述方向检测模型进行训练,并在完成训练后根据所述第一测试集对所述方向检测模型进行测试,直至得到训练好的所述方向检测模型。
5.根据权利要求2所述的快递面单识别方法,其特征在于,在将矫正后的所述快递面单图片输入到训练好的文本检测模型中,以获得所需的目标文本信息的检测框之前,还包括:
构建所述文本检测模型;
采集不同类型的第二快递面单图片,所述第二快递面单图片中至少包括所述目标文本信息;
对所述第二快递面单图片进行文本框标注,并将标注结果按照第二预设比例划分为第二训练集和第二测试集;
根据所述第二训练集对所述文本检测模型进行训练,并在完成训练后根据所述第二测试集对所述文本检测模型进行测试,直至得到训练好的所述文本检测模型。
6.根据权利要求2所述的快递面单识别方法,其特征在于,在将所述目标文本信息图片输入到训练好的文本识别模型中,以获得所述目标文本信息之前,还包括:
构建所述文本识别模型;
采集或生成文本图片,所述文本图片中至少包括快递面单的常用文本;
对所述文本图片进行文本标注,并将标注结果按照第三预设比例划分为第三训练集和第三测试集;
根据所述第三训练集对所述文本识别模型进行训练,并在完成训练后根据所述第三测试集对所述文本识别模型进行测试,直至得到训练好的所述文本识别模型。
7.根据权利要求2所述的快递面单识别方法,其特征在于,在将所述快递面单图片输入到训练好的方向检测模型中,以获得所述快递面单图片的方向信息之前,还包括:
对所述快递面单图片进行预处理,所述预处理包括图片质量增强、图片大小缩放及图片归一化中的至少一种。
8.根据权利要求2所述的快递面单识别方法,其特征在于,所述目标文本信息包括运单号信息、收件方信息、寄件方信息、快递公司信息、商品信息、留言备注信息及目的地信息中的一种或多种。
9.一种计算机设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求2-8中任一所述的快递面单识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求2-8中任一所述的快递面单识别方法。
CN202111647562.1A 2021-12-30 2021-12-30 一种快递面单识别方法、装置、计算机设备及存储介质 Pending CN114359931A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111647562.1A CN114359931A (zh) 2021-12-30 2021-12-30 一种快递面单识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111647562.1A CN114359931A (zh) 2021-12-30 2021-12-30 一种快递面单识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114359931A true CN114359931A (zh) 2022-04-15

Family

ID=81102852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111647562.1A Pending CN114359931A (zh) 2021-12-30 2021-12-30 一种快递面单识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114359931A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117372510A (zh) * 2023-12-05 2024-01-09 中交天津港湾工程研究院有限公司 基于计算机视觉模型的地图注记识别方法、终端及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117372510A (zh) * 2023-12-05 2024-01-09 中交天津港湾工程研究院有限公司 基于计算机视觉模型的地图注记识别方法、终端及介质
CN117372510B (zh) * 2023-12-05 2024-03-01 中交天津港湾工程研究院有限公司 基于计算机视觉模型的地图注记识别方法、终端及介质

Similar Documents

Publication Publication Date Title
CN107798299B (zh) 票据信息识别方法、电子装置及可读存储介质
CN110569878B (zh) 一种基于卷积神经网络的照片背景相似度聚类方法及计算机
CN110659646A (zh) 一种多任务证件图像自动处理方法、装置、设备及可读存储介质
CN110874618B (zh) 基于小样本的ocr模板学习方法、装置、电子设备及介质
US11042978B2 (en) Method and apparatus for performing damage segmentation on vehicle damage image
CN112232352B (zh) 一种智能识别pcb图纸自动计价系统和方法
CN112580707A (zh) 图像识别方法、装置、设备及存储介质
TW202009681A (zh) 樣本標註方法及裝置、損傷類別的識別方法及裝置
CN113313113B (zh) 证件信息获取方法、装置、设备以及存储介质
CN112686243A (zh) 智能识别图片文字的方法、装置、计算机设备及存储介质
CN112686257A (zh) 一种基于ocr的店头文字识别方法及系统
CN113221897B (zh) 图像矫正方法、图像文本识别方法、身份验证方法及装置
CN114494751A (zh) 证照信息识别方法、装置、设备及介质
CN114359931A (zh) 一种快递面单识别方法、装置、计算机设备及存储介质
CN114386013A (zh) 学籍自动认证方法、装置、计算机设备及存储介质
CN113066223A (zh) 发票自动验证方法及装置
CN112418206A (zh) 基于位置检测模型的图片分类方法及其相关设备
CN112396060A (zh) 基于身份证分割模型的身份证识别方法及其相关设备
CN111291758B (zh) 用于识别印章文字的方法和装置
CN113011249B (zh) 票据审核方法、装置、设备及存储介质
CN113971810A (zh) 文档生成方法、装置、平台、电子设备以及存储介质
CN111414889B (zh) 基于文字识别的财务报表识别方法及装置
CN112052849A (zh) Ocr中判断文件图像方向的方法、装置、设备及存储介质
CN112395450A (zh) 图片文字检测方法、装置、计算机设备及存储介质
CN110751140A (zh) 字符批量识别方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination