CN111144336A - 面向快递面单的收件人手机号码、运单号的自动识别方法 - Google Patents
面向快递面单的收件人手机号码、运单号的自动识别方法 Download PDFInfo
- Publication number
- CN111144336A CN111144336A CN201911390819.2A CN201911390819A CN111144336A CN 111144336 A CN111144336 A CN 111144336A CN 201911390819 A CN201911390819 A CN 201911390819A CN 111144336 A CN111144336 A CN 111144336A
- Authority
- CN
- China
- Prior art keywords
- image
- mobile phone
- phone number
- express
- waybill
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000012216 screening Methods 0.000 claims abstract description 26
- 238000012545 processing Methods 0.000 claims abstract description 19
- 238000012937 correction Methods 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 238000003708 edge detection Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 241000375392 Tana Species 0.000 claims 1
- 230000006870 function Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/90335—Query processing
- G06F16/90344—Query processing by using string matching techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/243—Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/158—Segmentation of character regions using character size, text spacings or pitch estimation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Geometry (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computer Graphics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
Abstract
本发明属于快递面单识别技术领域,具体涉及一种面向快递面单的收件人手机号码、运单号的自动识别方法、系统、装置,旨在解决现有识别方法识别收件人手机号码和/或运单号准确率低的问题。本系统方法包括获取快递面单图像,作为第一图像;对第一图像进行灰度处理,并提取该图像前景区域中的各直线;获取第一图像的倾斜角度并进行旋转,得到第二图像;获取第二图像中的文字信息,并提取所有手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为初步筛选结果;通过数据库对初步筛选结果进行匹配并修正,输出收件人手机号码。或通过一维码识别方法获取第二图像中的运单号。本发明提高了识别快递面单中收件人手机号码和/或运单号的准确率。
Description
技术领域
本发明属于快递面单识别技术领域,具体涉及一种面向快递面单的收件人手机号码、运单号的自动识别方法、系统、装置。
背景技术
近年来,随着电商和物流领域的发展,快递量快速增长,对快递物流行业提出极大的挑战。在整个快递物流行业,末端配送一直是成本最高、耗时最长、效率最低的环节。刚开始,快递员和其它快递末端工作人员每天面对大量的快递,需要手动录入快递面单的运单号和/或收件人手机号码,无疑是低效而繁重的工作方式。随着技术的发展,后来出现了手持终端(例如扫码枪),提高了快递员及快递末端工作人员的工作效率。但手持终端采用光电方式识别快递面单的运单号,成本昂贵;且快递员多采用手工录入的方式录入收件人手机号码,效率低、易出错误。
由于绝大多数的快递面单上都有保存运单号的一维码和收件人手机号等信息,为图像识别提供了数据基础。同时,把快递面单图片保存下来,如日后有任何问题,也为追查问题提供了数据依据。随之出现了一些基于移动端的软件通过采集快递面单图像来识别运单号和/或收件人手机号码,能快速的获取识别结果,极大的提高了快递员和快递末端工作人员的效率。但由于快递面单包含的信息较多,提取条件复杂,导致提取到的数据正确率较低。因此,本发明提出了一种面向快递面单的收件人手机号码、运单号的自动识别方法。
发明内容
为了解决现有技术中的上述问题,即为了解决现有面向快递面单的信息识别方法识别收件人手机号码和/或运单号准确率低的问题,本发明第一方面,提出了一种面向快递面单的收件人手机号码的自动识别方法,该方法包括:
步骤S100,获取待识别的快递面单图像,作为第一图像;
步骤S200,对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
步骤S300,基于预设条件选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
步骤S400,获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
步骤S500,通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
在一些优选的实施方式中,步骤S200中“提取该输入图像的前景区域中的各直线”,其计算方法为:将灰度处理后的输入图像进行边缘检测,检测完成后通过霍夫变换提取该图像的前景区域中的各直线。
在一些优选的实施方式中,步骤S300中“基于预设条件选取各直线中的一条作为待处理直线”,其方法为:获取所述第一图像的前景区域的矩形轮廓线,将所述矩形轮廓线的长作为待处理直线或获取各直线的长度并进行排序,随机选取前N条中的一条直线作为待处理直线或随机选取各直线中的一条直线作为待处理直线;其中,N为各直线长度大于预设长度阈值的直线数量。
在一些优选的实施方式中,步骤S300中“基于该斜率获取所述输入图像的倾斜角度”,其方法为:
θ=DEGREES(A)
A=a tan(S)
其中,θ为倾斜角度,A为弧度值,S为斜率,atan(·)为反正切函数,DEGREES(·)为家算计函数。
在一些优选的实施方式中,步骤S400中“提取该文字信息中的各手机号码”,其方法为:通过预设的第一策略对该文字信息中设定种类的字符进行筛选,筛选后通过正则表达式提取所述文字信息中的各手机号码。
在一些优选的实施方式中,“通过预设的第一策略对该文字信息中设定种类的字符进行筛选”,其方法为:
去除所述文字信息中的空格和标点符号,得到初步筛选的文字信息;
通过正则表达式对所述初步筛选的文字信息中的电话号码和非手机号码的数字进行去除,得到最终筛选的文字信息。
本发明的第二方面,提出了一种面向快递面单的运单号的自动识别方法,该方法包括:
步骤A100,基于上述的面向快递面单的收件人手机号的自动识别方法中步骤S100-步骤S300的方法,获取旋转后的快递面单图像,作为第二图像;
步骤A200,通过一维码识别方法获取所述第二图像中的运单号。
在一些优选的实施方式中,步骤A200之后还包括匹配修正步骤:
将步骤A200中得到的运单号与预构建的运单号数据库中保存的未完结订单进行匹配并修正,输出运单号。
本发明的第三方面,提出了一种面向快递面单的信息识别方法,分别基于上述的面向快递面单的收件人手机号码的自动识别方法获取收件人手机号码、基于上述的面向快递面单的运单号的自动识别方法获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
本发明的第四方面,提出了一种面向快递面单的收件人手机号码的自动识别系统,该系统包括获取模块、提取模块,旋转模块、识别模块、匹配输出模块;
所述获取模块,配置为获取待识别的快递面单图像,作为第一图像;
所述提取模块,配置为对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
所述旋转模块,配置为随机选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
所述识别模块,配置为获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
所述匹配输出模块,配置为通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
本发明的第五方面,提出了一种面向快递面单的运单号的自动识别系统,该系统包括获取模块、识别模块;
所述获取模块,配置为基于所述的面向快递面单的收件人手机号的自动识别系统获取模块-旋转模块,获取旋转后的快递面单图像,作为第二图像;
所述识别模块,配置为通过一维码识别方法获取所述第二图像中的运单号。
本发明的第六方面,提出了面向快递面单的信息识别系统,该系统包括输出模块;
所述输出模块,配置为分别基于所述的面向快递面单的收件人手机号码的自动识别系统获取收件人手机号码、基于所述的面向快递面单的运单号的自动识别系统获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
本发明的第七方面,提出了一种存储装置,其中存储有多条程序,所述程序应用由处理器加载并执行上述的面向快递面单的收件人手机号码的自动识别方法和/或上述的面向快递面单的运单号的自动识别方法和/或上述的面向快递面单的信息识别方法。
本发明的第八方面,提出了一种处理装置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;所述程序适用于由处理器加载并执行上述的面向快递面单的收件人手机号码的自动识别方法和/或上述的面向快递面单的运单号的自动识别方法和/或上述的面向快递面单的信息识别方法。
本发明的有益效果:
本发明提高了识别快递面单中收件人手机号码和/或运单号的准确率。本发明将采集的快递面单图像进行灰度处理,并通过霍夫变换提取快递面单图像中的所有直线,基于预设的条件选取一条直线作为参考直线,根据该直线的斜率,对待识别的快递面单图像进行旋转校正,确定快递面单的横向或纵向,经过多次测试,旋转校正后的运单号的一维码识别速度最快正确率最高,能极大的快递末端工作人员的效率。
同时,提取旋转校正后的快递面单图像中包含的全文信息,为保证提取收件人手机号的正确率,先对提取的全文信息中不包含必要信息的字符进行剔除,剔除后通过正则表达式提取快递面单中的所有手机号码。并结合快递面单中收件人在提取的全文信息中的位置,对各手机号进行筛选,获取收件人手机号的初步筛选结果。将预构建的手机号码数据库对初步筛选结果进行匹配并修正,输出收件人手机号码,能进一步保证识别的收件人手机号码的正确率。
附图说明
通过阅读参照以下附图所做的对非限制性实施例所做的详细描述,本申请的其他特征、目的和优点将会变得更明显。
图1是本发明一种实施例的面向快递面单的收件人手机号码的自动识别方法的流程示意图;
图2是本发明一种实施例的面向快递面单的运单号的自动识别方法的流程示意图;
图3是本发明一种实施例的面向快递面单的信息识别方法的流程示意图;
图4是本发明一种实施例的面向快递面单的收件人手机号码的自动识别系统的框架示意图;
图5是本发明一种实施例的面向快递面单的运单号的自动识别系统的框架示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明的第一实施例的一种面向快递面单的收件人手机号码的自动识别方法,如图1所示,包括:
步骤S100,获取待识别的快递面单图像,作为第一图像;
步骤S200,对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
步骤S300,基于预设条件选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
步骤S400,获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
步骤S500,通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
为了更清晰地对本发明面向快递面单的收件人手机号码的自动识别方法进行说明,下面结合附图对本发明方法一种实施例中各步骤进行展开详述。
步骤S100,获取待识别的快递面单图像,作为第一图像。
在本实施例中,优选采用微信小程序或自行开发的手机APP等作为自动识别的操作入口,调用移动终端的摄像头对快递面单进行拍照,采集快递面单图像。也可通过其他方式获取快递面单图像。
由于本发明中是通过移动端-服务器-数据库的形式实现收件人手机号码的自动识别。因此,将采集的快递面单图像发送至服务器进行自动识别,服务器端会对采集的图像进行一系列的处理和识别,最终将识别的信息保存至数据库。
步骤S200,对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线。
在本实施例中,根据获取的快递面单图像,先提取出图像中前景区域部分的直线,对快递面单图像进行旋转校正,以保证识别的正确率。具体处理如下:
将获取的快递面单图像进行灰度处理,处理后对图像进行边缘检测,根据检测结果,通过获取变换获取图像中的所有直线。
步骤S300,基于预设条件选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像。
在本实施例中,根据上述得到的各直线,选取其中的一条直线作为参考,对快递面单图像进旋校正。
关于选取参考的直线,本发明给出了三种策略:获取所述第一图像的前景区域的矩形轮廓线(即快递面单的轮廓),将矩形轮廓线的长作为参考的直线(待处理直线)或获取各直线的长度并进行排序,随机选取前N条中的一条直线作为待处理直线或随机选取各直线中的一条直线作为待处理直线;其中,N为各直线长度大于预设长度阈值的直线数量。
根据选取的待处理的直线,选择线条上的两个点,坐标记为(x1,y1)、(x2,y2),根据坐标计算直线的斜率,记为S,计算如公式(1)所示:
S=(y2-y1)/(x2-x1) (1)
以斜率算出弧度值记为A,计算过程如公式(2)所示:
A=a tan(S) (2)
之后将弧度值转换为倾斜角度记为θ,计算过程如公式(3)所示
θ=DEGREES(A) (3)
此角度即为图片需要旋转的角度。若θ为正角度如45°则顺时针旋转,若为负角度如-45°则逆时针旋转。此处理过程为拍摄图像时为正面拍摄,若拍摄的快递面单为反着拍摄,根据倾斜进行旋转的方法为现有,此处不再给出具体描述。
步骤S400,获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果。
在本实施例中,根据校正旋转后的快递面单图像,进行收件人手机号的初步筛选,具体过程如下:
步骤S410,通过调用现有的第三方图文识别方法,识别出快递面单图像中的文字信息,即全文文字信息。先对文字信息中的空格、点、冒号、加号等特殊符号进行去除;
步骤S420,将去除后的文字信息,通过正则表达式排除电话号码和非手机号码的干扰组合。将排除后的文字信息作为最终筛选的文字信息;
步骤S430,基于最终筛选的文字信息,通过正则表达式提取快递面单图像中的所有手机号码;
步骤S440,通常面单信息会包含“收”“寄”等文字,根据这些文字和手机号的位置关系可以初步筛选出收件人手机号码。即将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果。
由于现有的图文识别方法,识别的时候是按行来提取文字的,因此,收件人信息和收件人手机号码距离的字符间距不会过大。根据实际应用中收件人信息和收件人手机号码的最大字间距作为设定的距离。
若小于则说明获取的可能为收件人的手机号码。但本发明为了确保正确率,需对初步筛选的手机号码进行再次匹配。
步骤S500,通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
在本实施例中,通过积累大量收件人手机号码的数据库中,对初步筛选的收件人手机号码进行再次匹配,若不正确,则进行修正。
若手机号码数据库无法对初步筛选的手机号码进行匹配,则将初步筛选结果返回操作人员,由操作人员核对、修改。
最后将识别出的收件人手机号码保存至数据库,也可以根据实际需要进行下一步操作,如快递员可以根据获取的收件人手机号给收件人发信息,以说明快递运输信息。
本发明第二实施例的一种面向快递面单的运单号的自动识别方法,如图2所示,包括:
步骤A100,基于上述的面向快递面单的收件人手机号的自动识别方法中步骤S100-步骤S300的方法,获取旋转后的快递面单图像,作为第二图像;
步骤A200,通过一维码识别方法获取所述第二图像中的运单号。
为了更清晰地对本发明面向快递面单的运单号的自动识别方法进行说明,下面结合附图对本发明方法一种实施例中各步骤进行展开详述。
步骤A100,基于上述的面向快递面单的收件人手机号的自动识别方法中步骤S100-步骤S300的方法,获取旋转后的快递面单图像,作为第二图像。
一维码区域可以抽象为长方形的块状区域,因此一维码不存在“正反”方向,只存在横向、纵向或其他倾斜方向。应用一维码识别程序,经过多次测试,能确定面单图像横向或纵向,一维码识别速度最快正确率最高,但实际拍摄出的面单图像可能是倾斜的,这时就需要对图片进行旋转,校正图片方向,以提高识别率和正确率。
在本实施例中,根据上述面向快递面单的收件人手机号的自动识别方法中步骤S100-步骤S300的方法,获取旋转后的快递面单图像。
步骤A200,通过一维码识别方法获取所述第二图像中的运单号。
在本实施例中,运用一维码识别方法直接获取快递面单的运单号。
步骤A200之后还包括匹配修正步骤:将步骤A200中得到的运单号与预构建的运单号数据库中保存的未完结订单进行匹配并修正,输出运单号。此步骤是为了提高运单号的识别正确率,在实际的运用过程中可以根据实际情况进行选取。同时,也可以进行人工的核对和修正。
本发明第三实施例的一种面向快递面单的信息识别方法,如图3所示,分别基于上述的面向快递面单的收件人手机号码的自动识别方法获取收件人手机号码、基于上述的面向快递面单的运单号的自动识别方法获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
在本实施例中,在实际的快递运输过程中,可能既需要收件人手机号码,也需要快递面单的运单号。例如:在快递员给收件人发送快递签收信息时。
本发明第四实施例的一种面向快递面单的收件人手机号码的自动识别系统,如图4所示,该系统包括获取模块10、提取模块20,旋转模块30、识别模块40、匹配输出模块50;
所述获取模块10,配置为获取待识别的快递面单图像,作为第一图像;
所述提取模块20,配置为对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
所述旋转模块30,配置为随机选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
所述识别模块40,配置为获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
所述匹配输出模块50,配置为通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码.
本发明第五实施例的一种面向快递面单的运单号的自动识别系统,如图5所示,该系统包括获取模块100、识别模块200;
所述获取模块100,配置为基于所述的面向快递面单的收件人手机号的自动识别系统获取模块-旋转模块,获取旋转后的快递面单图像,作为第二图像;
所述识别模块200,配置为通过一维码识别方法获取所述第二图像中的运单号。
本发明第六实施例的一种面向快递面单的信息识别系统,该系统包括输出模块1000;
所述输出模块1000,配置为分别基于所述的面向快递面单的收件人手机号码的自动识别系统获取收件人手机号码、基于所述的面向快递面单的运单号的自动识别系统获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
所述技术领域的技术人员可以清楚的了解到,为描述的方便和简洁,上述描述的系统的具体的工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的面向快递面单的收件人手机号码的自动识别系统和/或上述的面向快递面单的运单号的自动识别系统和/或上述的面向快递面单的信息识别系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第七实施例的一种存储装置,其中存储有多条程序,所述程序适用于由处理器加载并实现上述的面向快递面单的收件人手机号码的自动识别方法和/或上述的面向快递面单的运单号的自动识别方法和/或上述的面向快递面单的信息识别方法。
本发明第八实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的面向快递面单的收件人手机号码的自动识别方法和/或上述的面向快递面单的运单号的自动识别方法和/或上述的面向快递面单的信息识别方法。
所述技术领域的技术人员可以清楚的了解到,未描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考签署方法实例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (14)
1.一种面向快递面单的收件人手机号码的自动识别方法,其特征在于,该方法包括:
步骤S100,获取待识别的快递面单图像,作为第一图像;
步骤S200,对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
步骤S300,基于预设条件选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
步骤S400,获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
步骤S500,通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
2.根据权利要求1所述的面向快递面单的收件人手机号的自动识别方法,其特征在于,步骤S200中“提取该输入图像的前景区域中的各直线”,其计算方法为:将灰度处理后的输入图像进行边缘检测,检测完成后通过霍夫变换提取该图像的前景区域中的各直线。
3.根据权利要求1所述的面向快递面单的收件人手机号的自动识别方法,其特征在于,步骤S300中“基于预设条件选取各直线中的一条作为待处理直线”,其方法为:获取所述第一图像的前景区域的矩形轮廓线,将所述矩形轮廓线的长作为待处理直线或获取各直线的长度并进行排序,随机选取前N条中的一条直线作为待处理直线或随机选取各直线中的一条直线作为待处理直线;其中,N为各直线长度大于预设长度阈值的直线数量。
4.根据权利要求1所述的面向快递面单的收件人手机号的自动识别方法,其特征在于,步骤S300中“基于该斜率获取所述输入图像的倾斜角度”,其方法为:
θ=DEGREES(A)
A=atan(S)
其中,θ为倾斜角度,A为弧度值,S为斜率,a tan(·)为反正切函数,DEGREES(·)为家算计函数。
5.根据权利要求1所述的面向快递面单的收件人手机号的自动识别方法,其特征在于,步骤S400中“提取该文字信息中的各手机号码”,其方法为:通过预设的第一策略对该文字信息中设定种类的字符进行筛选,筛选后通过正则表达式提取所述文字信息中的各手机号码。
6.根据权利要求5所述的面向快递面单的收件人手机号的自动识别方法,其特征在于,“通过预设的第一策略对该文字信息中设定种类的字符进行筛选”,其方法为:
去除所述文字信息中的空格和标点符号,得到初步筛选的文字信息;
通过正则表达式对所述初步筛选的文字信息中的电话号码和非手机号码的数字进行去除,得到最终筛选的文字信息。
7.一种面向快递面单的运单号的自动识别方法,其特征在于,该方法包括:
步骤A100,基于权利要求1-6任一项所述的面向快递面单的收件人手机号的自动识别方法中步骤S100-步骤S300的方法,获取旋转后的快递面单图像,作为第二图像;
步骤A200,通过一维码识别方法获取所述第二图像中的运单号。
8.根据权利要求7所述的面向快递面单的运单号的自动识别方法,其特征在于,步骤A200之后还包括匹配修正步骤:
将步骤A200中得到的运单号与预构建的运单号数据库中保存的未完结订单进行匹配并修正,输出运单号。
9.一种面向快递面单的信息识别方法,其特征在于,分别基于权利要求1-6任一项所述的面向快递面单的收件人手机号码的自动识别方法获取收件人手机号码、基于权利要求7-8任一项所述的面向快递面单的运单号的自动识别方法获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
10.一种面向快递面单的收件人手机号码的自动识别系统,其特征在于,该系统包括获取模块、提取模块,旋转模块、识别模块、匹配输出模块;
所述获取模块,配置为获取待识别的快递面单图像,作为第一图像;
所述提取模块,配置为对所述第一图像进行灰度处理,并提取该第一图像的前景区域中的各直线;
所述旋转模块,配置为随机选取各直线中的一条作为待处理直线,计算所述待处理直线的斜率,并基于该斜率获取所述第一图像的倾斜角度;根据所述倾斜角度对所述第一图像进行旋转,将旋转后的图像作为第二图像;
所述识别模块,配置为获取所述第二图像中的文字信息,并提取该文字信息中的各手机号码;将与收件人信息的字间距小于设定距离的手机号码,作为收件人手机号码的初步筛选结果;
所述匹配输出模块,配置为通过预构建的手机号码数据库对所述初步筛选结果进行匹配并修正,输出收件人手机号码。
11.一种面向快递面单的运单号的自动识别系统,其特征在于,该系统包括获取模块、识别模块;
所述获取模块,配置为基于所述的面向快递面单的收件人手机号的自动识别系统获取模块-旋转模块,获取旋转后的快递面单图像,作为第二图像;
所述识别模块,配置为通过一维码识别方法获取所述第二图像中的运单号。
12.一种面向快递面单的信息识别系统,其特征在于,该系统包括输出模块;
所述输出模块,配置为分别基于所述的面向快递面单的收件人手机号码的自动识别系统获取收件人手机号码、基于所述的面向快递面单的运单号的自动识别系统获取运单号,将所述收件人手机号码和所述运单号作为识别信息进行输出。
13.一种存储装置,其中存储有多条程序,其特征在于,所述程序应用由处理器加载并执行以实现权利要求1-6任一项所述的面向快递面单的收件人手机号码的自动识别方法和/或权利要求7-8任一项所述的面向快递面单的运单号的自动识别方法和/或权利要求9所述的面向快递面单的信息识别方法。
14.一种处理装置,包括处理器、存储装置;处理器,适用于执行各条程序;存储装置,适用于存储多条程序;其特征在于,所述程序适用于由处理器加载并执行以实现权利要求1-6任一项所述的面向快递面单的收件人手机号码的自动识别方法和/或权利要求7-8任一项所述的面向快递面单的运单号的自动识别方法和/或权利要求9所述的面向快递面单的信息识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911390819.2A CN111144336A (zh) | 2019-12-30 | 2019-12-30 | 面向快递面单的收件人手机号码、运单号的自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911390819.2A CN111144336A (zh) | 2019-12-30 | 2019-12-30 | 面向快递面单的收件人手机号码、运单号的自动识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111144336A true CN111144336A (zh) | 2020-05-12 |
Family
ID=70521627
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911390819.2A Pending CN111144336A (zh) | 2019-12-30 | 2019-12-30 | 面向快递面单的收件人手机号码、运单号的自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144336A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610078A (zh) * | 2021-07-27 | 2021-11-05 | 递易(上海)智能科技有限公司 | 一种手机号识别结果的校准的方法及设备 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3902047A (en) * | 1973-08-31 | 1975-08-26 | Ferranti Packard Ltd | Label reader with rotatable television scan |
CN102509383A (zh) * | 2011-11-28 | 2012-06-20 | 哈尔滨工业大学深圳研究生院 | 一种基于特征检测及模板匹配的混合号码识别方法 |
JP2014137713A (ja) * | 2013-01-17 | 2014-07-28 | Hidetoshi Konishi | データ識別方式 |
CN105279512A (zh) * | 2015-10-22 | 2016-01-27 | 东方网力科技股份有限公司 | 一种倾斜车牌识别方法和装置 |
CN105512835A (zh) * | 2014-09-26 | 2016-04-20 | 深圳前海百递网络有限公司 | 一种提取物流单号的方法及装置 |
CN105589846A (zh) * | 2015-12-22 | 2016-05-18 | 北京奇虎科技有限公司 | 一种识别数字语义的方法、检测短信类别的方法及装置 |
JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
CN106446881A (zh) * | 2016-07-29 | 2017-02-22 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
CN109344826A (zh) * | 2018-09-28 | 2019-02-15 | 李阳 | 一种字符识别方法及系统 |
CN109509362A (zh) * | 2017-09-15 | 2019-03-22 | 株式会社东芝 | 信号识别装置、信号识别方法以及驾驶辅助系统 |
CN109633620A (zh) * | 2018-12-13 | 2019-04-16 | 广州极飞科技有限公司 | 目标物体的识别方法和装置、作业设备 |
CN110210488A (zh) * | 2019-06-14 | 2019-09-06 | 上海中通吉网络技术有限公司 | 一种快递运单上条形码和手机号的识别方法和装置 |
CN110363457A (zh) * | 2018-04-11 | 2019-10-22 | 苏宁易购集团股份有限公司 | 基于快递单号匹配快递公司名称的方法及系统 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
-
2019
- 2019-12-30 CN CN201911390819.2A patent/CN111144336A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3902047A (en) * | 1973-08-31 | 1975-08-26 | Ferranti Packard Ltd | Label reader with rotatable television scan |
CN102509383A (zh) * | 2011-11-28 | 2012-06-20 | 哈尔滨工业大学深圳研究生院 | 一种基于特征检测及模板匹配的混合号码识别方法 |
JP2014137713A (ja) * | 2013-01-17 | 2014-07-28 | Hidetoshi Konishi | データ識別方式 |
CN105512835A (zh) * | 2014-09-26 | 2016-04-20 | 深圳前海百递网络有限公司 | 一种提取物流单号的方法及装置 |
CN105279512A (zh) * | 2015-10-22 | 2016-01-27 | 东方网力科技股份有限公司 | 一种倾斜车牌识别方法和装置 |
CN105589846A (zh) * | 2015-12-22 | 2016-05-18 | 北京奇虎科技有限公司 | 一种识别数字语义的方法、检测短信类别的方法及装置 |
JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
CN106446881A (zh) * | 2016-07-29 | 2017-02-22 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
CN109509362A (zh) * | 2017-09-15 | 2019-03-22 | 株式会社东芝 | 信号识别装置、信号识别方法以及驾驶辅助系统 |
CN110363457A (zh) * | 2018-04-11 | 2019-10-22 | 苏宁易购集团股份有限公司 | 基于快递单号匹配快递公司名称的方法及系统 |
CN110401779A (zh) * | 2018-04-24 | 2019-11-01 | 中国移动通信集团有限公司 | 一种识别电话号码的方法、装置和计算机可读存储介质 |
CN109344826A (zh) * | 2018-09-28 | 2019-02-15 | 李阳 | 一种字符识别方法及系统 |
CN109633620A (zh) * | 2018-12-13 | 2019-04-16 | 广州极飞科技有限公司 | 目标物体的识别方法和装置、作业设备 |
CN110210488A (zh) * | 2019-06-14 | 2019-09-06 | 上海中通吉网络技术有限公司 | 一种快递运单上条形码和手机号的识别方法和装置 |
Non-Patent Citations (2)
Title |
---|
李毅荣等: "基于Tesseract-OCR的快递单中手机号码识别应用的实现", 《电子测试》 * |
李毅荣等: "基于Tesseract-OCR的快递单中手机号码识别应用的实现", 《电子测试》, 15 November 2018 (2018-11-15) * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113610078A (zh) * | 2021-07-27 | 2021-11-05 | 递易(上海)智能科技有限公司 | 一种手机号识别结果的校准的方法及设备 |
CN113610078B (zh) * | 2021-07-27 | 2024-03-12 | 递易(上海)智能科技有限公司 | 一种手机号识别结果的校准的方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110619333B (zh) | 一种文本行分割方法、文本行分割装置及电子设备 | |
CN109658584B (zh) | 一种票据信息识别方法及装置 | |
CN103258201A (zh) | 一种融合全局和局部信息的表格线提取方法 | |
CN109214229B (zh) | 一种条码扫描方法、装置及电子设备 | |
CN111582000B (zh) | 一种条形码定位方法、装置及相关设备 | |
CN107784321A (zh) | 数字绘本快速识别方法、系统及计算机可读存储介质 | |
CN111340023A (zh) | 文本识别方法及装置、电子设备、存储介质 | |
CN106569946B (zh) | 一种移动终端性能测试方法及系统 | |
CN102193819B (zh) | 一种抗单点噪声的光斑中心定位方法及装置 | |
CN111462388A (zh) | 一种票据检验方法、装置、终端设备及存储介质 | |
CN109948521A (zh) | 图像纠偏方法和装置、设备及存储介质 | |
CN118428382B (zh) | 条形码识别方法、终端及系统 | |
CN115273108B (zh) | 一种人工智能识别自动归集方法及系统 | |
CN111353978A (zh) | 一种识别心脏解剖学结构的方法及装置 | |
CN111144336A (zh) | 面向快递面单的收件人手机号码、运单号的自动识别方法 | |
CN115471858A (zh) | 一种用于票据管理的数据处理方法及装置 | |
CN110263239B (zh) | 一种发票识别的方法、装置、存储介质及计算机设备 | |
CN109359497A (zh) | 一种增值税发票图像二维码区域的定位与识别方法 | |
CN109635729B (zh) | 一种表格识别方法及终端 | |
CN114549861A (zh) | 一种基于特征点及卷积优化计算的目标匹配的方法、存储介质 | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
CN113689378B (zh) | 试纸带精准定位的判定方法、装置、存储介质及终端 | |
CN113837129B (zh) | 手写签名错别字识别方法、装置、设备及存储介质 | |
CN110895849A (zh) | 冠字号切割定位方法、装置、计算机设备及存储介质 | |
CN112633275A (zh) | 一种基于深度学习的多票据混拍图像校正方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200512 |
|
RJ01 | Rejection of invention patent application after publication |