CN114758340A - 物流地址智能识别方法、装置、设备及存储介质 - Google Patents
物流地址智能识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114758340A CN114758340A CN202111574437.2A CN202111574437A CN114758340A CN 114758340 A CN114758340 A CN 114758340A CN 202111574437 A CN202111574437 A CN 202111574437A CN 114758340 A CN114758340 A CN 114758340A
- Authority
- CN
- China
- Prior art keywords
- image
- text
- logistics
- logistics address
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 230000010354 integration Effects 0.000 claims abstract description 30
- 238000003062 neural network model Methods 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 22
- 238000005520 cutting process Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims 2
- 230000007613 environmental effect Effects 0.000 abstract description 6
- 238000007639 printing Methods 0.000 abstract description 6
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000009826 distribution Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000007726 management method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004042 decolorization Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G06T5/70—
Abstract
本发明涉及智能识别领域,公开一种物流地址智能识别方法、装置、设备及存储介质,所述方法包括:通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中;本发明实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
Description
技术领域
本发明涉及智能识别技术领域,尤其涉及一种物流地址智能识别方法、装置、设备及存储介。
背景技术
现如今快递物流企业的寄件信息都为电子面单,电子面单的填写有如下三种方式:一、用户通过编辑地址信息进行“下单”;二、用户通过复制粘贴地址的方式进行“下单”;三、快递员通过客户口述内容进行“下单”。以上三种方式都必须人为手动操作,导致根据所填写的运单信息生成的电子面单准确性较低,不仅降低了物流寄件效率,而且造成了电子面单一定的报废率,电子面单的个数每天可达上亿件,由此造成的电子面单的报废成本颇高。
发明内容
有鉴于此,有必要针对物流寄件效率和电子面单报废率颇高的问题,提供一种物流地址智能识别方法、装置、设备及存储介。
一种物流地址智能识别方法、装置、设备及存储介方法,包括以下步骤:一种物流地址智能识别方法,应用于客户端,所述物流地址智能识别方法包括:获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;对所述文本区域图像依次进行文本预处理,得到所述文本区域图像中的单字文本图像;将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
在其中一个实施例中,在所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像之前,还包括:对所述客户端图像进行整体扫描,将邻域像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像;对所述线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255 表示;对所述线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示;将所述前景像素和背景像素进行结合,得到二值化图像。
在其中一个实施例中,所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像包括:获取二值化图像,对所述二值化图像进行轮廓检测,利用Hough变换法计算所述二值化图像倾斜方向和倾斜角度,并对所述二值化图像进行旋转矫正,得到正投影图像;对所述正投影图像进行灰度值统计,利用高斯核密度估计方法计算出所述灰度值的聚类趋势,分离文字图层,得到文本区域图像。
在其中一个实施例中,所述对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本数据包括:获取所述文本区域图像中的文本连通区域,并提取所述文本连通区域的水平外切矩形,将所述水平外切矩形进行扩展,得到单行文本图像;对所述单行文本图像进行统计求和,得到候选切割线,利用所述候选切割线对所述单行文本图像进行切割,得到单字文本图像。
在其中一个实施例中,所述将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息包括:将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,输出单字文本的文字特征数据;将所述文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
在其中一个实施例中,所述将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中包括:将所述确定文字信息输入所述预置的动态规划模型进行训练,得到物流字词集合;将所述确定文字信息输入所述物流字词集合中进行数据整合,获得初步物流地址信息;将所述初步物流地址信息进行智能矫正,得到目标物流地址;将所述目标物流地址填入电子面单中。
在其中一个实施例中,所述将所述初步物流地址信息进行智能矫正进一步包括:获取所述初步物流地址信息中字词组合与城镇区域的地址相似度;判断所述地址相似度是否匹配目标物流地址;若是,则取所述初步物流地址信息作为目标物流地址;若否,则对所述初步物流地址信息进行重新匹配和查找,获取所述目标物流地址。
本发明第二实施例提供了一种物流地址智能识别装置包括:第一获取模块,用于获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;第二处理模块,用于对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本图像;识别模块,用于将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;整合模块,用于将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
在第二实施例中,所述获取模块,还包括扫描子模块,用对所述客户端图像进行整体扫描,将邻域内像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像;对所述线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255表示;对所述线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示;将所述前景像素和背景像素进行结合,得到二值化图像。
在第二实施例中,所述获取模块,还包括获取子模块,用于对所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像包括:
获取二值化图像,对所述二值化图像进行轮廓检测,利用Hough变换法计算所述二值化图像倾斜方向和倾斜角度,并对所述二值化图像进行旋转矫正,得到正投影图像;对所述正投影图像进行灰度值统计,利用高斯核密度估计方法计算出所述灰度值的聚类趋势,分离文字图层,得到文本区域图像。
在第二实施例中中,所述处理模块,用于对所述对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本数据包括:获取所述文本区域图像中的文本连通区域,并提取所述文本连通区域的水平外切矩形,将所述水平外切矩形进行扩展,得到单行文本图像;对所述单行文本图像进行统计求和,得到候选切割线,利用所述候选切割线对所述单行文本图像进行切割,得到单字文本图像。
在第二实施例中,所述识别模块,用于对所述将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息包括:将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,输出单字文本的文字特征数据;将所述文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
在第二实施例中,所述整合模块,用于对所述将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中包括:将所述确定文字信息输入所述预置的动态规划模型进行训练,得到物流字词集合;将所述确定文字信息输入所述物流字词集合中进行数据整合,获得初步目标物流地址;将所述初步目标物流地址进行智能矫正,得到目标物流地址;将所述目标物流地址填入电子面单中。
本发明第三实施例提供了一种物流地址智能识别设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连。
所述至少一个处理器调用所述存储器中的所述指令,以使得所述订单分配设备执行上述的订单分配方法的步骤。
本发明第四实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的订单分配方法的步骤。
上述物流地址智能识别方法、装置、设备及存储介质,通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
附图说明
图1为本发明物流地址智能识别方法的第一个实施例示意图;
图2为本发明物流地址智能识别方法的第二个实施例示意图;
图3为本发明物流地址智能识别装置的第一个实施例示意图;
图4为本发明物流地址智能识别装置的第二个实施例示意图;
图5为本发明物流地址智能识别设备的一个实施例示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和 /或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
作为一个较好的实施例,如图1所示,一种物流地址智能识别方法,用于客户端,该物流地址智能识别方法包括以下步骤:
步骤101、获取客户端中的待处理图像,并提取待处理图像中的文本区域图像。
本实施例中,具体地,其中本发明所述客户端为基于Android、iOS程序语言开发的一款物流地址输入系统。所述客户端为移动端、微信端、android端及 ios端中的至少一种;可选地,客户端或称为手机用户端,是指与服务器相对应,为客户提供本地服务的程序。除了一些只在本地运行的应用程序之外,一般安装在普通的手机上,需要与服务端互相配合运行。较常用的手机用户端包括了如万维网使用的网页浏览器,收寄电子邮件时的电子邮件客户端,以及即时通讯的客户端软件等。对于这一类应用程序,需要网络中有相应的服务器和服务程序来提供相应的服务,如数据库服务,电子邮件服务等等,这样在客户机和服务器端,需要建立特定的通信连接,来保证应用程序的正常运行。
具体的,所述获取客户端中的待处理图像是手机中的图片,是指各种格式的图像,包括但不限于JPEG、PNG、GIF、BPM等格式的图片;可选地,所述获取客户端中的待处理图像为客户端运行时获取用户截屏的图片。例如:用户在聊天界面中截屏,当客户端检查到该截屏动作时,客户端自动获取该截屏图片,并进行后续图像处理步骤。可选的,所述待处理图像为用户相册中的图片。
所述文本区域图像是图像中包含有文字的区域,该区域是指利用计算机系统识别时智能识别的区域;可选的,所述文本区域图像中的文本包含:中文、英文、日文、韩文等多国语言;所述文本包含手写体、书法体、黑体、艺术字等多种字体。
步骤102、对文本区域图像进行文本预处理,得到文本区域图像中的单字文本图像。
本实施例中,具体的,其中本发明所述的文本预处理是指1、对客户端图像进行整体扫描,2、用函数模型等算法等对图像中的文本进行扫描、处理、提取的过程。文本预处理的方法有多种,本实施例中所述处理方法包括但不限于: Hough变换法、高斯核密度估计方法等。利用所述算法模型提取的文本图像清晰、准确,使后续整体文字信息识别快速、高效。
具体的,所述文本区域图像中的单字文本图像是指:在文本区域图像中提取的含有单个文字的图像,对文本行图像进行单字文本切割,最后对切割出的单字文本进行识别。文本行图像中的单字文本切割是字符识别中相当重要的环节,直接影响到最后的识别准确率。
步骤103、将单字文本图像输入预置的卷积多层神经网络模型中进行字符识别,得到确定文字信息。
本发明将所述单字文本图像输入卷积神经网络中,是将单字文本图像分割成多个相同大小的图像矩阵,再次利用卷积神经网络中的卷积层(卷积层是由多个卷积单元组成,每个卷积单元的参数都是通过反向传播优化得到)提取所述图像矩阵的特征。提取之后的图像矩阵特征的维度依然很多,因此将特征矩阵分割成几个单个区块,取其最大值或平均值,起到了降维作用。把所有局部特征及各通道的特征矩阵结合变为向量代表,计算最后每一类的得分。输出矩阵与一个1*1 的卷积核进行卷积运算,最后展开为一个1*n的向量。在卷积神经网络中,一般使用Softmax函数对其进行分类,用于保证每个分类概率总和为1。经过上述步骤卷积多层神经网络可以将单字文本图像进行准确识别输出确定文字信息。
具体的,文本区域图像只是一个大概的文本区域,计算机算法难以直接识别其内容,为了获得有利于计算机算法能直接认识的信息,本发明运用了卷积多层神经网络模型对文本图像区域进行数据加工及文字信息提取,从而获得了计算机可直接识别的确定文字信息。
本实施例中所述卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一。
本实施例中确定文字信息是指:可以在数据库中查找到的代码文字信息,所述文字信息包括但不限于:英文、中文、日文、韩文等多个国家的语言文字信息。
步骤104、将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。
本实施例中从卷积神经网络中提取的确定文字信息是单个的文本信息,而填入电子面单中的目标物流地址是人名、电话、城市、地区、街道等诸多信息为一体的地址信息。所以需要对所述确定文字信息进一步的数据整合才能获得目标物流地址,本发明利用动态规划模型统计从卷积神经网络中提取的多个确定文字信息,求解目标物流地址。再将目标物流地址填入到物流电子面单中。利用动态规划模型获得地址精确,高效,降低了人为操作带来的错误率。提升了寄件效率。
具体的,在本实施例中动态规划模型是指:动态规划算法,通常用于求解具有某种最优性质的问题。在这类问题中,可能会有许多可行解。每一个解都对应于一个值,找到具有最优值的解的动态规划算法。
本发明实施例中,通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
请参阅图2,本发明实施例中订单分配方法的第二个实施例包括:
步骤201、获取客户端中的待处理图像,并提取待处理图像中的文本区域图像。
步骤202、对客户端图像进行整体扫描,将邻域像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像。
从客户端中获得的图像是多种格式和样式的图像,计算机无法直接识别所述客户端图像的文字信息,因此需要对客户端图像进行预处理。将客户端图像整体进行整体扫描,扫描后由计算机读取客户端图像中的色彩和像素信息。将客户端图像进行去色处理,进一步截取客户端图像中包含若干个像素的图像,每个像素在该截取图像中包含对应的像素值,像素值均采用非负整数进行表示,其取值范围为[0-255],若某一像素值为0则表示改像素的颜色为黑色,若某一像素的像素值为255则表示该像素的颜色为白色。平均灰度值为介于白色和黑色像素之间的一个具体灰度值,可以通过图像处理规则对截取图像中的每一个像素进行筛选,以获取截取图像中对应的平均灰度值。进一步将邻域像素的平均灰度值替代中心点像素的灰度值,之后利用平滑滤波方法将图像中一个像素的灰度值和它周围临近8个像素的灰度值相加,然后求得的平均值为新图中该像素的平均值。获得计算机易于识别的线性平滑图像
具体的,本实施例中,邻域像素是指:像素之间的关系,首先要讨论每个像素由近邻像素组成的邻域像素,包含其上下左右之间的像素也简称邻域像素。邻域中的像素具有很紧密的联系,互相之间有较大的影响。
步骤203、对线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255表示;对线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示。
本实施例中,选取线性平滑图像中的灰度值的阈值时,假设阈值设置为T,就可以以T为边界,把数值分为两个部分。如果给定的图像灰度分布是比较有规律,背景在图像的直方图各自形成一个波峰,他们之间存在波谷。在波峰和波谷之间寻找灰度值的阈值T。那么可以将线性平滑图像中灰度值大于或等于阈值T 的像素判定为前景像素,其灰度值用255表示;灰度值小于阈值T的像素判定为背景像素,其灰度值用0表示。以确定某像素是前景像素还是背景像素,
步骤204、将前景像素和背景像素相结合,得到二值化图像。
步骤205、获取二值化图像,将二值化图像进行轮廓检测,利用Hough变化法计算二值化图像倾斜方向和倾斜角度,并对二值化图像进行旋转矫正,得到正投影图像。
本实施例中,由上述步骤获得的二值化图像有可能是倾斜的图像,对倾斜的二值化图像直接进行识别,会加大文字错误识别率。因此在进行进一步的文字识别之前应当对二值化图像进行轮廓检测,如果检测得出所述二值化图像为正投影图像则直接进行下一步计算机识别步骤,如果检测得出所述二值化图像为倾斜图像,则利用Hough变化法计算出倾斜二值化图像的倾斜角度和倾斜方向,进一步将倾斜的二值化图像进旋转矫正,得到正投影图像,既视觉方向上为正的图像。
具体的,本实施例中的轮廓检测是指:在包含目标和背景的数字图像中,忽略背景和目标内部的纹理以及噪声干扰的影响,采用一定的技术和方法来实现目标轮廓提取的过程。它是目标检测、形状分析、目标识别和目标跟踪等技术的重要基础。
具体的,本实施例中的Hough变换法:是一种使用表决方式的参数估计技术,其原理是利用图像空间和Hough参数空间的线-点对偶性,把图像空间中的检测问题转换到参数空间中进行。
步骤206、对正投影图像进行灰度值统计,利用高斯核密度估计方法计算出灰度值的聚类趋势,分离文字图层,得到文本区域图像。
本发明实施例中,由上述步骤获得的正投影图像含有文字及其他图像信息、计算机直接怼所述正投影图像进行识别会造成一定错误率,因此单纯的提取正投影图像中的文本区域图像显得尤为重要。本发明中,先对正投影图像进行灰度值的统计,进一步利用高斯核密度估计方法计算出灰度值的概率密度分布。当计算机获得灰度值的概率密度分布后,计算机利用概率密度分布对灰度值进行分类,使相似的灰度值归为一类,不相似的灰度值归为不同类。当聚类对象是文字图像的时候,即为文字图像的聚类趋势。由此分离出正投影图像的文字图层,获得利于计算机识别的文本区域图像。
具体的,本发明实施例中高斯核密度估计方法是指:在核密度估计基础上利用高斯函数进行求解的预测模型,其中核密度估计方法在概率论中用来估计未知的密度函数,属于非参数检验方法之一。
步骤207、对文本区域图像进行文本预处理,得到文本区域图像中的单字文本图像。
步骤208、将单字文本图像输入预置的卷积多层神经网络模型中进行字符识别,得到确定文字信息。
步骤209:将确定文字信息输入预置的动态规划模型中进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。
本实施例中步骤207-209与第一实施例中的步骤102-104类似,此处不再赘述。
本实施例中,通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
请参阅图3,本发明实施例中订单分配方法的第三个实施例包括:
步骤301、获取客户端中的待处理图像,提取待处理图像中的文本区域图像。
步骤302、获取文本区域图像中的文本连通区域,并提取文本连通区域的水平外切矩形,将水平外切矩形进行扩展,得到单行文本图像。
本实施例中,所述文本区域图像是包含一整块文字信息的区域图像,首先将文本区域图像中含有密集文字部分用曲线将其圈起来,获得了文本连通区域。进一步获取文本连通区域中的水平外切矩形,获得文本区域图像中的单行文本图像,该步骤为了使计算机识别更高效,利于进行后续的单字文本切割操作。
步骤303、将单行文本图像进行统计求和,得到候选切割线,利用候选切割线对单行文本图像进行切割,得到单字文本。
本实施例中,所述候选切割线是指对单行的文字图片进行垂直方向的求和,和为0的所在的列就是被切割的的列。所述列即为候选切割线,利用候选切割线将单行文本图像进行切割后即可获得单字文本;用这种统计方法可以很好地解决中英文混排的单行文字图片分割的问题。
步骤304、将单字文本图像输入预置的卷积多层神经网络模型中进行字符识别,输出单字文本的文字特征数据。
本实施例中,为了使文字图像的识别更加高效准确,将上述单字文本图像输入预置的卷积多层神经网络模型中对单字文本图像进行字符识别,从而获得含有文字特征数据的单字文本。
步骤305、将文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
本实施例中,具体的数据库是指:数据库管理系统是为管理数据库而设计的电脑软件系统,一般具有存储、截取、安全保障、备份等基础功能。数据库管理系统可以依据它所支持的数据库模型来作分类,例如关系式、XML;或依据所支持的计算机类型来作分类,例如服务器群集、移动电话;或依据所用查询语言来作分类,例如SQL、XQuery;或依据性能冲量重点来作分类,例如最大规模、最高运行速度;亦或其他的分类方式。不论使用哪种分类方式,一些DBMS能够跨类别,同时支持多种查询语言。
步骤306、将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。
本实施例中步骤306与第一实施例中的步骤104类似,此处不再赘述。
本发明实施例中,通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
上面对本发明实施例中物流地址智能识别方法进行了描述,下面对本发明实施例中物流地址智能识别装置进行描述,请参阅图4,本发明实施例中物流地址智能识别装置的第一个实施例包括:
第一获取模块401,用于获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像。
第二处理模块402,用于对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本图像。
识别模块403,用于将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息。
整合模块404,用于将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
本发明实施例中,通过获取客户端中的待处理图像,并提取待处理图像中的文本区域图像;对文本区域图像依次进行文本预处理,得到文本区域图像中的单字文本图像;将单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将目标物流地址填入物流电子面单中。实现智能识别图像中的物流地址,减少人工操作带来的填写的运单信息错误率,不仅提高了物流寄件效率,而且节约了由填写错误带来的电子面单的打印数量,为环保做出贡献。
上面图4从模块化功能实体的角度对本发明实施例中的物流地址智能识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中物流地址智能识别设备进行详细描述。
图5是本发明实施例提供的一种物流地址智能识别设备的结构示意图,该物流地址智能识别设备800可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)810(例如,一个或一个以上处理器)和存储器820,一个或一个以上存储应用程序833或数据832的存储介质830(例如一个或一个以上海量存储设备)。其中,存储器820和存储介质 830可以是短暂存储或持久存储。存储在存储介质830的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对物流地址智能识别设备800中的一系列指令操作。更进一步地,处理器810可以设置为与存储介质830通信,在物流地址智能识别设备800上执行存储介质830中的一系列指令操作。
物流地址智能识别设备800还可以包括一个或一个以上电源840,一个或一个以上有线或无线网络接口850,一个或一个以上输入输出接口860,和/或,一个或一个以上操作系统831,例如Windows Serve,Mac OS X,Unix,Linux, FreeBSD等等。本领域技术人员可以理解,图5示出的物流地址智能识别设备结构并不构成对本申请提供的物流地址智能识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
一种物流地址智能识别设备以实现以下物流地址智能识别方法,具体包括:
应用于客户端,所述物流地址智能识别方法包括:获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;对所述文本区域图像依次进行文本预处理,得到所述文本区域图像中的单字文本图像;将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
在一个实施例中,在本发明第一方面的第一种实现方式中,在所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像之前,还包括:对所述客户端图像进行整体扫描,将邻域像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像;对所述线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255表示;对所述线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示;将所述前景像素和背景像素进行结合,得到二值化图像。
在一个实施例中,在本发明第一方面的第三种实现方式中,所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像包括:获取二值化图像,对所述二值化图像进行轮廓检测,利用Hough变换法计算所述二值化图像倾斜方向和倾斜角度,并对所述二值化图像进行旋转矫正,得到正投影图像;对所述正投影图像进行灰度值统计,利用高斯核密度估计方法计算出所述灰度值的聚类趋势,分离文字图层,得到文本区域图像。
在一个实施例中,在本发明第一方面的第三种实现方式中,所述对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本数据包括:获取所述文本区域图像中的文本连通区域,并提取所述文本连通区域的水平外切矩形,将所述水平外切矩形进行扩展,得到单行文本图像;对所述单行文本图像进行统计求和,得到候选切割线,利用所述候选切割线对所述单行文本图像进行切割,得到单字文本图像。
在一个实施例中,在本发明的第一方面的第三种实现方式中,所述将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息包括:将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,输出单字文本的文字特征数据;将所述文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
在一个实施例中,在本发明第一方面的第四种实现方式中,所述将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中包括:将所述确定文字信息输入所述预置的动态规划模型进行训练,得到物流字词集合。将所述确定文字信息输入所述物流字词集合中进行数据整合,获得初步物流地址信息。将所述初步物流地址信息进行智能矫正,得到目标物流地址;将所述目标物流地址填入电子面单中。
在一个实施例中,在本发明第一方面的第五种实现方式中,所述将所述初步物流地址信息进行智能矫正进一步包括:获取所述初步物流地址信息中字词组合与城镇区域的地址相似度;判断所述地址相似度是否匹配目标物流地址;若是,则取所述初步物流地址信息作为目标物流地址;若否,则对所述初步物流地址信息进行重新匹配和查找,获取所述目标物流地址。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行以下物流地址智能识别方法的步骤。
应用于客户端,所述物流地址智能识别方法包括:获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;对所述文本区域图像依次进行文本预处理,得到所述文本区域图像中的单字文本图像;将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
在一个实施例中,在本发明第一方面的第一种实现方式中,在所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像之前,还包括:对所述客户端图像进行整体扫描,将邻域像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像;对所述线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255表示;对所述线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示;将所述前景像素和背景像素进行结合,得到二值化图像。
在一个实施例中,在本发明第一方面的第三种实现方式中,所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像包括:获取二值化图像,对所述二值化图像进行轮廓检测,利用Hough变换法计算所述二值化图像倾斜方向和倾斜角度,并对所述二值化图像进行旋转矫正,得到正投影图像;对所述正投影图像进行灰度值统计,利用高斯核密度估计方法计算出所述灰度值的聚类趋势,分离文字图层,得到文本区域图像。
在一个实施例中,在本发明第一方面的第三种实现方式中,所述对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本数据包括:获取所述文本区域图像中的文本连通区域,并提取所述文本连通区域的水平外切矩形,将所述水平外切矩形进行扩展,得到单行文本图像;对所述单行文本图像进行统计求和,得到候选切割线,利用所述候选切割线对所述单行文本图像进行切割,得到单字文本图像。
在一个实施例中,在本发明的第一方面的第三种实现方式中,所述将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息包括:将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,输出单字文本的文字特征数据;将所述文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
在一个实施例中,在本发明第一方面的第四种实现方式中,所述将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中包括:将所述确定文字信息输入所述预置的动态规划模型进行训练,得到物流字词集合。将所述确定文字信息输入所述物流字词集合中进行数据整合,获得初步物流地址信息。将所述初步物流地址信息进行智能矫正,得到目标物流地址;将所述目标物流地址填入电子面单中。
在一个实施例中,在本发明第一方面的第五种实现方式中,所述将所述初步物流地址信息进行智能矫正进一步包括:获取所述初步物流地址信息中字词组合与城镇区域的地址相似度;判断所述地址相似度是否匹配目标物流地址;若是,则取所述初步物流地址信息作为目标物流地址;若否,则对所述初步物流地址信息进行重新匹配和查找,获取所述目标物流地址。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种物流地址智能识别方法,其特征在于,所述物流地址智能识别方法包括:
获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;
对所述文本区域图像依次进行文本预处理,得到所述文本区域图像中的单字文本图像;
将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;
将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
2.根据权利要求1所述的物流地址智能识别方法,其特征在于,所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像之前,还包括:
对所述客户端图像进行整体扫描,将邻域像素的平均灰度值替代中心像素点的灰度值,获得线性平滑图像;
对所述线性平滑图像中灰度值大于或等于阈值的像素判定为前景像素,其灰度值用255表示;
对所述线性平滑图像中灰度值小于阈值的像素判定为背景像素,其灰度值用0表示;
将所述前景像素和背景像素进行结合,得到二值化图像。
3.根据权利要求1所述的物流地址智能识别方法,其特征在于,所述获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像包括:
获取二值化图像,对所述二值化图像进行轮廓检测,利用Hough变换法计算所述二值化图像倾斜方向和倾斜角度,并对所述二值化图像进行旋转矫正,得到正投影图像;
对所述正投影图像进行灰度值统计,利用高斯核密度估计方法计算出所述灰度值的聚类趋势,分离文字图层,得到文本区域图像。
4.根据权利要求1所述的物流地址智能识别方法,其特征在于,所述对所述文本区域图像依次进行文本预处理,得到所述文本区域图像中的单字文本图像包括:
获取所述文本区域图像中的文本连通区域,并提取所述文本连通区域的水平外切矩形,将所述水平外切矩形进行扩展,得到单行文本图像;
对所述单行文本图像进行统计求和,得到候选切割线,利用所述候选切割线对所述单行文本图像进行切割,得到单字文本图像。
5.根据权利要求1所述的物流地址智能识别方法,其特征在于,所述将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息包括:
将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,输出单字文本的文字特征数据;
将所述文字特征数据输入数据库中进行数据对比,查找临近文字特征数据,输出确定文字信息。
6.根据权利要求1所述的物流地址智能识别方法,其特征在于,所述将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中,包括:
将所述确定文字信息输入所述预置的动态规划模型进行训练,得到物流字词集合;
将所述确定文字信息输入所述物流字词集合中进行数据整合,获得初步目标物流地址;
将所述初步目标物流地址进行智能矫正,得到目标物流地址;
将所述目标物流地址填入电子面单中。
7.根据权利要求6所述的物流地址智能识别方法,其特征在于,所述将所述初步物流地址信息进行智能矫正,包括:
获取所述初步物流地址信息中字词组合与城镇区域的地址相似度;
判断所述地址相似度是否匹配目标物流地址;
若是,则取所述初步物流地址信息作为目标物流地址;
若否,则对所述初步物流地址信息进行重新匹配和查找,获取所述目标物流地址。
8.一种物流地址智能识别装置,其特征在于,所述物流地址智能识别装置包括:
第一获取模块,用于获取所述客户端中的待处理图像,并提取所述待处理图像中的文本区域图像;
第二处理模块,用于对所述文本区域图像依次进行文本预处理,得到所述文本区域数据中的单字文本图像;
识别模块,用于将所述单字文本图像输入预置的卷积多层神经网络模型进行字符识别,得到确定文字信息;
整合模块,用于将所述确定文字信息输入预置的动态规划模型进行数据整合,得到目标物流地址,并将所述目标物流地址填入物流电子面单中。
9.一种物流地址智能识别设备,其特征在于,所述物流地址智能识别设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述物流地址智能识别设备执行如权利要求1-7中任一项所述的物流地址智能识别方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的物流地址智能识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111574437.2A CN114758340A (zh) | 2021-12-21 | 2021-12-21 | 物流地址智能识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111574437.2A CN114758340A (zh) | 2021-12-21 | 2021-12-21 | 物流地址智能识别方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114758340A true CN114758340A (zh) | 2022-07-15 |
Family
ID=82324932
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111574437.2A Pending CN114758340A (zh) | 2021-12-21 | 2021-12-21 | 物流地址智能识别方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114758340A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116071778A (zh) * | 2023-03-31 | 2023-05-05 | 成都运荔枝科技有限公司 | 一种冷链食品仓储管理方法 |
-
2021
- 2021-12-21 CN CN202111574437.2A patent/CN114758340A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116071778A (zh) * | 2023-03-31 | 2023-05-05 | 成都运荔枝科技有限公司 | 一种冷链食品仓储管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110008809B (zh) | 表格数据的获取方法、装置和服务器 | |
Bhowmik et al. | Text and non-text separation in offline document images: a survey | |
CN111027297A (zh) | 一种对图像型pdf财务数据关键表格信息的处理方法 | |
CN111353491B (zh) | 一种文字方向确定方法、装置、设备及存储介质 | |
CN112613502A (zh) | 文字识别方法及装置、存储介质、计算机设备 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
US6532302B2 (en) | Multiple size reductions for image segmentation | |
CN109284756A (zh) | 一种基于ocr技术的计算机终端保密检查方法 | |
CN113963147B (zh) | 一种基于语义分割的关键信息提取方法及系统 | |
CN111680690A (zh) | 一种文字识别方法及装置 | |
JPH05225378A (ja) | 文書画像の領域分割システム | |
CN113033269B (zh) | 一种数据处理方法及装置 | |
CN114092938B (zh) | 图像的识别处理方法、装置、电子设备及存储介质 | |
US10963725B2 (en) | Systems and methods for digitized document image data spillage recovery | |
CN114581928A (zh) | 一种表格识别方法及系统 | |
CN108090728B (zh) | 一种基于智能终端的快递信息录入方法及录入系统 | |
CN114758340A (zh) | 物流地址智能识别方法、装置、设备及存储介质 | |
CN111414917B (zh) | 一种低像素密度文本的识别方法 | |
CN112200789A (zh) | 一种图像识别的方法及装置、电子设备和存储介质 | |
CN116543391A (zh) | 一种结合图像校正的文本数据采集系统及方法 | |
CN114387592B (zh) | 一种复杂背景下字符定位和识别方法 | |
CN114842478A (zh) | 文本区域的识别方法、装置、设备及存储介质 | |
CN114511862A (zh) | 表格识别方法、装置及电子设备 | |
CN114463767A (zh) | 信用证识别方法、装置、计算机设备和存储介质 | |
Bozkurt et al. | Classifying fonts and calligraphy styles using complex wavelet transform |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |