WO2019071476A1

WO2019071476A1 - 一种基于智能终端的快递信息录入方法及录入系统

Info

Publication number: WO2019071476A1
Application number: PCT/CN2017/105743
Authority: WO
Inventors: 梁少勃
Original assignee: 深圳传音通讯有限公司
Priority date: 2017-10-11
Filing date: 2017-10-11
Publication date: 2019-04-18
Also published as: CN111213157A

Abstract

本发明提供了一种基于智能终端的快递信息录入方法及录入系统，其中，录入方法包括以下步骤：进入所述智能终端的寄件页面；获取一包含快递信息的信息图像；对所述信息图像进行预处理；对预处理后的所述信息图像进行版面分析及区域分割；对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；将所述快递信息录入所述寄件页面的相应位置。本发明实现了快递信息的自动录入，无需手写或人工输入，提高了工作效率，降低了单个快递的处理时间；同时，自动化的信息录入，降低了由手动输入导致的错误发生率。

Description

一种基于智能终端的快递信息录入方法及录入系统

技术领域

本发明涉及智能终端领域，尤其涉及一种基于智能终端的快递信息录入方法及录入系统。

背景技术

自首款智能手机问世以来，智能手机制造商就在不断的改进产品设计，越来越多无法想象到的功能来到我们身边，随着智能手机功能的丰富以及移动互联网的快速发展，智能手机已然取代了我们身边很多常用的电子设备，改变着我们的生活方式以及周边的行业。

随着电子商务交易平台的不断完善，以及传统通信、移动通信等技术的快速发展，越来越多的人们通过网上购物的方式来获取自己所需的商品，商品的种类可以涉及到人们日常生活的方方面面。买家只需要通过电商平台的客户端产品(网站或者移动终端中的应App)进行下单，之后就可以进入卖家发货、物流公司配送等一系列流程，最终使得买家足不出户就可以接收到自己订购的货品。其中，收/寄件人地址的填写、货品的配送是非常关键的一环，一旦发生送错等现象，可能会给买家或者卖家造成损失。当前，较为传统的寄件方式为采用纸质的快递货单，需要手动填写收件人、寄件人地址等个人信息，一方面，手写效率低下、严重降低工作效率，且经常需要重复毫无意义的工作，另一方面，快递信息的反馈需要记录快递单号。随后兴起的电子寄件，通过扫描二维码等方式，相比原始寄件更加快速，但是，收件人、寄件人地址等个人信息仍然需要手动输入，信息的录入仍然相当繁琐。

当前，基于扫描图像的信息录入方法已经被广泛应用。在书报刊行业和其它对纸质阅读材料依赖较大的行业，采用扫描仪扫描书本，并将扫描得到的图片内容组合成保存完整的书本，之后将该书本文件转化为PDF文件，这种方式可以在较短的时间内将大量的纸质内容转化为电子文件保存在物理存储介质中。基于扫描图像的信息录入拥有录入时间短、录入信息量大、录入信息损失小等特点。

鉴于当前电商的快速发展和快递行业的业务量持续增大，依靠快递从业人员手工录入快递信息的方式将会越来越难以适应这个行业大数量、短时间的需求。因此，我们迫切需要一种使用方便快捷、信息采集录入准确度较高、性能稳定、适用性较强的快递信息录入方法及录入系统，以解决现有快递行业需要人工录入快递信息的缺点，提高工作效率。

因此，本发明提供了一种基于智能终端的快递信息录入方法及录入系统，实现快递信息进行自动录入，无需手写或人工输入，提高了工作效率，降低了单个快递的处理时间；同时，自动化的信息录入，降低了由手动输入导致的错误发生率。

发明内容

为了克服上述技术缺陷，本发明的目的在于提供一种基于智能终端的快递信息录入方法及录入系统。

本发明的一方面，公开了一种基于智能终端的快递信息录入方法，包括以下步骤：

进入所述智能终端的寄件页面；

获取一包含快递信息的信息图像；

对所述信息图像进行预处理；

对预处理后的所述信息图像进行版面分析及区域分割；

对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

将所述快递信息录入所述寄件页面的相应位置。

优选地，获取一包含快递信息的信息图像的步骤包括：

开启所述智能终端的摄像头，拍摄并获取一包含快递信息的信息图像；

和/或

调用所述智能终端的相册应用，获取一包含快递信息的信息图像。

优选地，对所述信息图像进行预处理的步骤包括：

将所述信息图像进行二值化处理或灰度级别处理；

以所述信息图像的边沿或文字的行向为基准进行倾斜度校正。

优选地，对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息的步骤包括：

将所述信息图像切割为图像行，从所述图像行中分离出单个字符；

从所述单个字符上提取统计特征或结构特征，包括细化和归一化；

从学习得到的特征库中找到与所述单个字符相似度最高的字符类。

优选地，所述快递信息录入方法还包括：

存储所述快递信息。

本发明另一方面，公开了一种基于智能终端的快递信息录入系统，所述快递信息录入系统包括：页面进入模块、图像获取模块、图像预处理模块、图像分割模块、信息识别模块、信息录入模块；

所述页面进入模块，进入所述智能终端的寄件页面；

所述图像获取模块，与所述页面进入模块通信连接，获取一包含快递信息的信息图像；

所述图像预处理模块，与所述图像获取模块通信连接，对所述信息图像进行预处理；

所述图像分割模块，与所述图像预处理模块通信连接，对预处理后的所述信息图像进行版面分析及区域分割；

所述信息识别模块，与所述图像分割模块通信连接，对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

所述信息录入模块，与所述页面进入模块、信息识别模块通信连接，将所述快递信息录入所述寄件页面的相应位置。

优选地，所述图像获取模块，开启所述智能终端的摄像头，拍摄并获取一包含快递信息的信息图像；

和/或

所述图像获取模块，调用所述智能终端的相册应用，获取一包含快递信息的信息图像。

优选地，所述图像预处理模块包括：图像预处理单元、倾斜度校正单元；

所述图像预处理单元，将所述信息图像进行二值化处理或灰度级别处理；

所述倾斜度校正单元，以所述信息图像的边沿或文字的行向为基准进行倾斜度校正。

优选地，所述信息识别模块包括：字符分离单元、特征提取单元、字符匹配单元；

所述字符分离单元，将所述信息图像切割为图像行，从所述图像行中分离出单个字符；

所述特征提取单元，与所述字符分离单元通信连接，从所述单个字符上提取统计特征或结构特征，包括细化和归一化；

所述字符匹配单元，与所述特征提取单元通信连接，从学习得到的特征库中找到与所述单个字符相似度最高的字符类。

优选地，所述快递信息录入系统还包括信息存储模块，与所述信息识别模块通信连接，存储所述快递信息。

采用了上述技术方案后，与现有技术相比，具有以下有益效果：

1.本发明提供的快递信息录入方法及录入系统，实现快递信息进行自动录入，无需手写或人工输入，提高了工作效率，降低了单个快递的处理时间；同时，自动化的信息录入，降低了由手动输入导致的错误发生率。

附图说明

图1为符合本发明一优选实施例的快递信息录入方法的流程示意图；

图2为图1的快递信息录入方法的图像预处理步骤的流程示意图；

图3为图1的快递信息录入方法的快递信息识别步骤的流程示意图；

图4为符合本发明一优选实施例的快递信息录入系统的结构示意图。

附图标记：

100-快递信息录入系统；11-页面进入模块；12-图像获取模块；13-图像预处理模块；14-图像分割模块；15-信息识别模块；16-信息录入模块；17-信息存储模块。

具体实施方式

以下结合附图与具体实施例进一步阐述本发明的优点。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

在本发明使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本发明和所附权利要求书中所使用的单数形式的“一”、“所述”、“该”等也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

在后续的描述中，使用用于表示元件的诸如“模块”或“单元”的后缀仅为了有利于本发明的说明，其本身并没有特定的意义。因此，“模块”与“单元”可以混合地使用。

本发明的信息录入方法及信息录入系统，可以应用于智能终端，智能终端可以以各种形式，例如，本发明中描述的智能终端可以包括诸如移动电话、智能电话、笔记本电脑、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置、智能手表等的移动终端，以及诸如数字TV、台式计算机等的固定终端。下面，假设终端是移动终端，并假设该移动终端为智能手机，对本发明进行说明。然而，本领域技术人员将理解的是，除了特别用于移动目的的元件之外，根据本发明的实施方式的构造也能够应用于固定类型的终端。为便于描述，本发明实施例均以智能手机为例进行说明，其它应用场景相互参照即可。

参考图1，为本发明一优选实施例的基于智能终端的快递信息录入方法，包括以下步骤：

S100：进入所述智能终端的寄件页面；

S200：获取一包含快递信息的信息图像；

S300：对所述信息图像进行预处理；

S400：对预处理后的所述信息图像进行版面分析及区域分割；

S500：对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

S600：将所述快递信息录入所述寄件页面的相应位置。

具体地：

-S100：进入所述智能终端的寄件页面；

在使用智能终端进行电子寄件时，进入快递寄件页面，添加新增地址，需要输入收/寄件人信息时，显示“拍摄或上传图像，自动识别”的文字或其他提示，提示用户拍摄包含快递信息的信息图像。

-S200：获取一包含快递信息的信息图像；在一优选实施例中，S200：获取一包含快递信息的信息图像的步骤包括：

和/或

获取信息图像的方法可以是多种，可以通过截图方式，或者调用智能终端摄像头当场拍摄图像，或者从智能终端的本地或云端相册中任意选取一张图像。

此处，快递信息包括但不限于：收/寄件人名称、电话、所在地区、详细地址等信息。

-S300：对所述信息图像进行预处理；

参考图2，在一优选实施例中，S300：对所述信息图像进行预处理的步骤包括：

S310：将所述信息图像进行二值化处理或灰度级别处理；

S320：以所述信息图像的边沿或文字的行向为基准进行倾斜度校正。

-S400：对预处理后的所述信息图像进行版面分析及区域分割。

对图像的预处理、版面分析及区域分割：

-非均匀光照校正

光照不均匀问题是信息图像中快递信息识别提取的一个重要环节。高光和阴影是影响图像均匀性的两个主要因素。信息图像的高光区域可以通过图像在R，G，B空间中各分量颜色偏移率自动校正图像中的高光区域。Retinex方法可用于光学图像的阴影进行校正，对图像进行增强操作。

现实中图像采集受到不均匀光照的影响，图像可能存在部分高亮度区域。高光区域校正可使用信息图像的像素与空间分布特征，检测正常光照区域，然后利用各个分量的颜色偏移率，自动校正图像中的非均匀光照。

-灰度化

图像灰度化主要有三种方法：

(1)最大值法：即从R，G，B三个通道的灰度值中选取最大的一个作为当前像素点的灰度值。其数学表达式如下：

G＝max(R，G，B)

(2)平均值法：将R，G，B三个通道的灰度值直接相加求得一个平均值作为当前像素点的灰度值。其数学表达式如下：

G＝(R+G+B)/3

(3)加权平均值法：在平均值法的基础上，依据人眼的感光原理，将原来每一个通道的系数变换为不同的值，从而得到更加接近于人眼观测的结果。其数学表达式如下：

G＝k₀R+k₁G+k₂B

其中k₀、k₁、k₂满足如下的关系：

k₀+k₁+k₂＝1

最大值法通常会得到高亮度的灰度图像，而平均法往往会模糊图像的边沿细节，得到边沿柔和的图像，而加权平均法通过调整k₀、k₁、k₂的值可以得到保留较多图像高频信息(即边沿信息)的图像。因此本发明采用加权平均法对经过非均匀校正后的信息图像进行灰度化。

-二值化

经过非均匀校正和图像灰度化的信息图像减小了非均匀光照和图像色彩对文字识别的影响。信息图像中的快递信息主要为文字，文字的主要特征为结构特征。结构特征是独立于图像灰度的一种特征量，因此信息图像还需要经过二值化处理，即将灰度图像简化为(0，1)图像。二值化通常表示为下式：

灰度图像的二值化要求有效从图像中区分字符像素。传统印刷字体图像的二值化要求一方面要求尽量保持原始字符的结构特征，另一方面要求二值化后的字符之间不能有空白。传统印刷字符的背景比较单一且平滑，背景与字符之间可以利用简单的全局阈值的方法区分。

-版面分析

图像的版面分析包括了图像的倾斜校正和图像行列的分割。图像倾斜校正方法主要有投影图方法、直线拟合方法以及Hough变化方法等。本发明可以通过采集图像时注意摆放的角度等来调整，为简化处理可不考虑图像倾斜的情况。因此本发明信息图像版面分析的主要内容为信息图像的行列分割。版面分析是基于光学图像的识别系统的关键技术之一。通过对信息图像的版面分析，确定收件人/寄件人的姓名、性别、地址、电话号码等快递信息在信息图像中的位置，对准确分析快递信息具有重要意义。虽然，一般快递信息的信息图像的版面比较固定，但是却比较复杂。首先信息图像的排版必然有一些差别，必须选择适应度较好的方法。其次信息图像中同一行字体大小可能有差别，例如第一行姓名信息中，名字字体比“姓名”的字体小，给版面分析中的行提取带来很大的麻烦。再次图像中存在数字和汉字字体共存的现象，给字符块的划分带来了较大的困难。

图像的版面分析方法包括自顶向上的方法和自底向上的方法。自顶向下方法的方法首先从图像的宏观方向着手，通过分析图像的全局特征，逐渐将图像区分为不同的模块。通过一次又一次迭代划分，最后将图像区分为一个个结构元素为止。本发明中，在文字区域的划分过程中，首先确定文字行的起始位置和结束位置，其次在每一个行中确定单个字符的位置。自顶向下的方法对于版面相对固定的字符识别比较有效，但对于版面比较复杂的情况，由于忽略了大量的图像细节，很难对图像中的字符、表格、图像等结构元素进行准确的分割。

自底向上的方法是从图像基本结构元素出发，通过局部元素的结构分析，逐渐合并成一个个字符、图像或者表格；再通过分析字符、表格或者图像之间的位置关系，得到图像版面中的行、列信息。逐行逐列地分析图像中的结构，从而完成对整个版面信息的提取工作。自底向下的方法设计到大量的迭代运算，计算过程复杂，计算速度慢，在实际中应用较少。目前大量的基于光学字符的文字识别方法主要是将自顶向下的方法和自底向上的方法相结合，从而在识别速度和性能两者之间取得平衡.

-S500：对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信恩：

参考图3，在一优选实施例中，S500：对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息的步骤包括：

S510：将所述信息图像切割为图像行，从所述图像行中分离出单个字符；

S520：从所述单个字符上提取统计特征或结构特征，包括细化和归一化；

S530：从学习得到的特征库中找到与所述单个字符相似度最高的字符类。

对信息图像中字符特征的提取：

要从光学图像中自动识别出快递信息，需要将光学图像中的快递信息有效进行分类处理，并且精确到每一个字符。然而直接使用图像预处理后得到的图像进行匹配是不现实的。首先待识别的图像本身会包含大量的信息，以64×64大小的图像为例，如果直接以待识别的图像进行匹配会构成4096维的特征向量，大大增加了识别器的搜索空间。其次直接以字符图像进行匹配所需要的字符模板的存储空间会非常大。目前在记录的中国汉字大约为9万字左右，虽然常用的汉字只有3500字左右，但是随着人民文化水平的提高，快递信息中尤其是收/寄件人姓名一项中，出现生僻字的概率越来越大，因此如果取字符的原始图像进行存储，即使单一字体的字符存储量也非常大，更不用说不同省份之间字体稍有差别。最后直接使用的图像会受图像传感器采样噪声、图像采集角度等影响，带来较大的匹配误差。因此，在图像预处理后需要对光学图像中的字符特征进行提取，以减小字符识别器的搜索空间。

字符特征提取主要是完成从原始的光学图像数据中提取出字符之间具有本质不同的特征。字符特征的提取需要遵循以下的一些规则：

(1)区别性：即不同的字符之间有较大的区别。例如汉字字符和数字之间需要有较大的区别，汉字字符之间也需要有不同的区别。不同的汉字在特征空间内应该具有较大的距离。这样的特征才能在图像有采样噪声或者其他干扰的情况下对不同的字符进行区分处理。

(2)可靠性：即同一个字符即使在噪声或者旋转、缩放等情况下具有相同或者非常近似的特征向量。

(3)独立性：即要求同一字符的不同特征之间不相关。特征分量之间的独立性保证了单一特征量不变化不影响其他特征量的判断。

在字符特征提取的过程中，在满足以上特征要求和同时，要求特征数量尽量少。尽量少的特征分量能一方面保证识别器有效的信息输入空间，另一方面可以减小匹配模板所需要的存储空间，同时还能减小识别器的搜索空间，加快识别进程。

-字符归一化处理

经过图像整体预处理后分割得到的字符块图像的大小存在较大的差别。图像块大小不同不会影响字符的结构特征，然而汉字笔画的长度也是汉字的一个非常重要的特征。汉字笔划的长度特征与图像的大小成正比关系，因此经过字符切分后获得的字符图像在特征提取之前尚需要进行字符的归一化。字符归一化处理包括位置归一化和大小归一化。

字符位置归一化有重心归一化和边框归一化两种方法。重心归一化首先计算印刷体字符图像的重心的位置，计算得到图像的重心位置后，将字符重心移到图像中心位置，完成切分后字符图像的位置归一化。边框归一化首先计算出字符图像的上、下、左、右边框，计算得到图像的中心位置后，将字符的中心位置移到图像中心，完成字符图像的归一化。

图像大小归一化有两种方式，一种是按照字符图像外框大小进行归一化：即按照图像外框大小将图像放大或者缩小到规定某一个特定的大小。按照图像外框的大小进行归一化操作的方法操作简单、运算量较小。另一种图像大小归一化的方法需要考虑图像的分布特征。图像的分布特征中比较简单的一种方法是图像的分布方差。

-字符的结构特征

汉字字符的结构特征包括笔划特征和部件特征。

汉字的笔划特征包括笔划的类型以及笔画的长度。笔划的类型主要包括：横、竖、撇、捺、折、钩六类。关统计资料显示6种笔划在汉字字符中所占的比例，汉字中横、撇、竖、捺四种基本笔划占了绝大部分，而折、钩可以近似认为是由以上四种基本笔划构成。因此汉字的笔划可以作为识别的一个重要特征。也可以利用横、竖、撇、捺四个方向对字符的结构特征进行统计分析。

笔划上的点可以作为汉字字符的特征点，同时为了对结构进行进一步区分，字符背景上的重要点也可以作为字符的特征点。笔划上的点和字符背景中的点可以共同构成汉字识别的重要特征向量。笔划中的特征点包括端点、折点、歧点等。

汉字的笔划关系结构比较简单，而部件之间关系则非常复杂。部件的数量和位置不同还可以出现不同的组合。从部件的数量上来看有独体字、双体字、三体字、四体字等。按照部件的空间位置关系有独立字体、左右字体、上下字体、包围字体。

汉字的四方向分解即根据汉字的结构特征，从横、竖、撇、捺四个方向对汉字笔划进行分解。最简单的四方向分解通过判断像素点的八领域内的点来判断汉字笔划的方向。八领域的汉字笔划方向的判别方法有“且”方法和“或”方法。

上述方法假设汉字字符的笔划为单像素点。因此要求输入的汉字字符图像为经过笔划细化或者笔划骨架提取的图像。然而在实际使用中，汉字笔划的细化或者骨架提取对于笔划本身较细的字符图像容易出现笔划丢失的情况，从而降低字符的识别概率。

-字符的统计特征

基于光学图像的印刷体字符的统计特征包括全局特征和局部特征两种。与字符的结构特征不同，字符的统计特征从二值化图像，有部分甚至直接从灰度图像中通过相应的变换获取字符的特征。

字符图像的全局特征本质上只是把字符图像当作一种普通的图像进行处理，字符只是其中具有某一特征的物体。因此字符图像的全局特征提取方法与一般图像的特征提取方法类似。字符图像的全局特征提取方法主要有以下几种：

(1)变化域特征分量：将二值化后的字符图像变换到其他特征空间，将特征空间中对应向量的系数作为特征。常用的变换有二维傅立叶变换(2-D Fourior Transformation)、哈达码变换(Hadam Transformation)、霍夫变换(Hough Transformation)等。二维傅立叶变换即将空间域的图像信息变换到二维的频率域，将具有较大相关性的空间位置变化变换到由具有归一化正交性的频率分量构成的频率域中，从而获得目标(即)字符之间不同的特征。哈达码变换是遥感图像中一种常用的特征变换，它利用对称正交的哈达码矩阵实现图像空间关系到多光谱域的变换，达到提取目标特征、对遥感图像进行分类识别的目的。霍夫变换是从光学图像中识别特定形状的目标的基本方法之一，而扩展后用于目标特征提取的霍夫变换主要是将图像从空间域变换到由不同的基本形状组成的特征空间中，利用不同几何形状的系数构成目标的特征。

(2)不变矩特征(Moment Feature)：不变矩是光学图像处理中目标检测、识别的一种重要方法。图像的中心矩和原点矩可以区分目标在成像平面投影的几何形状信息，但投影面的几何形状不具有尺度、旋转或者仿射不变性。

(3)全局投影特征：将图像分别投影到几个参考方向，并且只取与参考方向垂直的笔划向参考方向投影。该方法与基于结构特征的笔划提取方法相比，运算简单，能够实现快速提取。全局投影特征能够在一定程度在上反映整个汉字复杂程度，笔划的主要方向以及笔划之间可能存在的连接关系等。为简化计算，通常取四个方向的投影，即横方向、竖方向、正45度方向以及负45度方向。

(4)背景特征：背景部分和汉字的笔划也可以作为汉字字符图像的一种全局特征。通常选取位于图像两对角线上的空白点(非笔划点)统计这些点在字符的各个方向的笔划密度作为图像的全局背景特征。

汉字字符的局部特征需要先将图像划分为不同的局部区域，在不同区域范围内统计图像的特征。图像的特征可以是前述的全局特征中的一种或者几种的组合。局部特征提取的关键点在与局部区域的划分方法。局部区域的划分方法主要有网格法(包括固定网格法和弹性网格法)、细胞划分方法、方向线素划分方法、四角特征划分方法以及Gabor划分方法等。

-字符分类器

经过图像预处理得到的单个字符图像经过归一化处理、字符特征提取后的字符特征向量需要送入到汉字分类器中才能完成快递信息的提取工作。分类器即将输入的未知样本区分为不同的种类，完成待识别样本与样本所属类别的一一对应的任务。图像分类器主要包括欧氏距离分类器、神经网络分类器、支持向量机分类器以及遗传算法分类器几类。

欧氏距离分类器，距离分类器是最简单和直观的分类方法，以高维空间中点的距离作为样本相似度量的主要依据。距离值越小，表示待测样本之间的相似程度越高。

支持向量机分类器，神经网络具有较好的曲线拟合能力和目标的分类能力，在目标的识别检测中具有大量的应用。神经网络的缺点也非常明显。神经网络目前的结构没有可靠的规则，因此算法的收敛速度非常慢，网络的初值选择对算法的性能影响较大，算法容易收敛到极小值等缺点。支持向量机使用了一种特殊类型的操平面。这种超平面被称为最优分类超平面。

-S600：将所述快递信息录入所述寄件页面的相应位置；

-S700：存储所述快递信息。

参考图4，本发明还公开了一种基于智能终端的快递信息录入系统100，所述快递信息录入系统100包括：页面进入模块11、图像获取模块12、图像预处理模块13、图像分割模块14、信息识别模块15、信息录入模块16；

所述页面进入模块11，进入所述智能终端的寄件页面；

所述图像获取模块12，与所述页面进入模块11通信连接，获取一包含快递信息的信息图像；

所述图像预处理模块13，与所述图像获取模块12通信连接，对所述信息图像进行预处理；

所述图像分割模块14，与所述图像预处理模块13通信连接，对预处理后的所述信息图像进行版面分析及区域分割；

所述信息识别模块15，与所述图像分割模块14通信连接，对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

所述信息录入模块16，与所述页面进入模块11、信息识别模块15通信连接，将所述快递信息录入所述寄件页面的相应位置。

在一优选实施例中，所述图像获取模块12，开启所述智能终端的摄像头，拍摄并获取一包含快递信息的信息图像；

和/或

所述图像获取模块12，调用所述智能终端的相册应用，获取一包含快递信息的信息图像。

在一优选实施例中，所述图像预处理模块13包括：图像预处理单元、倾斜度校正单元；

在一优选实施例中，所述信息识别模块15包括：字符分离单元、特征提取单元、字符匹配单元；

在一优选实施例中，所述快递信息录入系统100还包括信息存储模块17，与所述信息识别模块16通信连接，存储所述快递信息。

应当注意的是，本发明的实施例有较佳的实施性，且并非对本发明作任何形式的限制，任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例，但凡未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰，均仍属于本发明技术方案的范围内。

Claims

一种基于智能终端的快递信息录入方法，其特征在于，包括以下步骤：

进入所述智能终端的寄件页面；

获取一包含快递信息的信息图像；

对所述信息图像进行预处理；

对预处理后的所述信息图像进行版面分析及区域分割；

对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

将所述快递信息录入所述寄件页面的相应位置。
如权利要求1所述的快递信息录入方法，其特征在于，

获取一包含快递信息的信息图像的步骤包括：

开启所述智能终端的摄像头，拍摄并获取一包含快递信息的信息图像；

和/或

调用所述智能终端的相册应用，获取一包含快递信息的信息图像。
如权利要求1所述的快递信息录入方法，其特征在于，

对所述信息图像进行预处理的步骤包括：

将所述信息图像进行二值化处理或灰度级别处理；

以所述信息图像的边沿或文字的行向为基准进行倾斜度校正。
如权利要求1所述的快递信息录入方法，其特征在于，

对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息的步骤包括：

将所述信息图像切割为图像行，从所述图像行中分离出单个字符；

从所述单个字符上提取统计特征或结构特征，包括细化和归一化；

从学习得到的特征库中找到与所述单个字符相似度最高的字符类。
如权利要求1所述的快递信息录入方法，其特征在于，

所述快递信息录入方法还包括：

存储所述快递信息。
一种基于智能终端的快递信息录入系统，其特征在于，

所述快递信息录入系统包括：页面进入模块、图像获取模块、图像预处理模块、图像分割模块、信息识别模块、信息录入模块；

所述页面进入模块，进入所述智能终端的寄件页面；

所述图像获取模块，与所述页面进入模块通信连接，获取一包含快递信息的信息图像；

所述图像预处理模块，与所述图像获取模块通信连接，对所述信息图像进行预处理；

所述图像分割模块，与所述图像预处理模块通信连接，对预处理后的所述信息图像进行版面分析及区域分割；

所述信息识别模块，与所述图像分割模块通信连接，对区域分割后的所述信息图像的各个区域进行文字识别，提取所述快递信息；

所述信息录入模块，与所述页面进入模块、信息识别模块通信连接，将所述快递信息录入所述寄件页面的相应位置。
如权利要求6所述的快递信息录入系统，其特征在于，

所述图像获取模块，开启所述智能终端的摄像头，拍摄并获取一包含快递信息的信息图像；

和/或

所述图像获取模块，调用所述智能终端的相册应用，获取一包含快递信息的信息图像。
如权利要求6所述的快递信息录入系统，其特征在于，

所述图像预处理模块包括：图像预处理单元、倾斜度校正单元；

所述图像预处理单元，将所述信息图像进行二值化处理或灰度级别处理；

所述倾斜度校正单元，以所述信息图像的边沿或文字的行向为基准进行倾斜度校正。
如权利要求6所述的快递信息录入系统，其特征在于，

所述信息识别模块包括：字符分离单元、特征提取单元、字符匹配单元；

所述字符分离单元，将所述信息图像切割为图像行，从所述图像行中分离出单个字符；

所述特征提取单元，与所述字符分离单元通信连接，从所述单个字符上提取统计特征或结构特征，包括细化和归一化；

所述字符匹配单元，与所述特征提取单元通信连接，从学习得到的特征库中找到与所述单个字符相似度最高的字符类。
如权利要求6所述的快递信息录入系统，其特征在于，

所述快递信息录入系统还包括信息存储模块，与所述信息识别模块通信连接，存储所述快递信息。