CN111008559B - 一种面单识别结果的排版方法、系统及计算机设备 - Google Patents
一种面单识别结果的排版方法、系统及计算机设备 Download PDFInfo
- Publication number
- CN111008559B CN111008559B CN201911050134.3A CN201911050134A CN111008559B CN 111008559 B CN111008559 B CN 111008559B CN 201911050134 A CN201911050134 A CN 201911050134A CN 111008559 B CN111008559 B CN 111008559B
- Authority
- CN
- China
- Prior art keywords
- character strings
- information
- face sheet
- character
- ocr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Abstract
本发明公开了一种面单识别结果的排版方法、系统及计算机设备,接收面单图像信息,通过调用OCR功能接口获取对该面单图像信息的OCR识别结果;依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序;在该排序后的字符串在预设高度范围内的情况下,确定该字符串中属于同一行的字符串,并依据该位置信息,顺序连接该同一行的字符串,生成文本行,有效还原文字原来的相对位置,提高了文字排版算法的准确度,从而解决了OCR系统在物流面单识别过程中的识别功能单一的问题,提高了用户录单效率。
Description
技术领域
本申请涉及物流领域,特别是涉及一种面单识别结果的排版方法、系统及计算机设备。
背景技术
随着物流行业的蓬勃发展,物流的各个环节中货物交接、流转等信息需要及时录入系统,以便能够快速掌握货物动向。在信息录入环节中,有大量的纸质物流面单需要手动录入系统,因为通过人工读取物流面单并手动输入系统的方式效率低下,技术含量很低,需要耗费大量人力成本,亟待一种人工智能的方法帮助用户从这种繁琐的工作中解脱出来。在相关技术中,光学字符识别(Optical Character Recognition,简称为OCR)技术能够将大部分物流面单中图像中的文字识别出来,但是该OCR技术大多局限于将图像识别为文字,且不能有效还原文字原来的相对位置,导致识别之后的文字信息查找费力,没有将OCR技术与真实的使用场景相结合。对于物流面单应用场景来说,没有考虑物流中移动端上传图片,电脑端使用OCR结果的场景,导致物流面单的录入还不是太方便,因此在物流面单识别过程中的用户录单效率较低。
针对相关技术中,OCR系统在物流面单识别过程中的识别功能单一的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中,OCR系统在物流面单识别过程中的识别功能单一的问题,本发明提供了一种面单识别结果的排版方法、系统及计算机设备,以至少解决上述问题。
根据本发明的一个方面,提供了一种面单识别结果的排版的方法,所述方法包括:
接收面单图像信息,通过调用OCR功能接口获取对所述面单图像信息的OCR识别结果;
依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序;
在所述排序后的字符串在预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行;其中,所述预设高度范围为垂直方向平移范围。
在其中一个实施例中,所述生成文本行之后,所述方法包括:
对所述面单图像信息进行直线检测,依据所述直线检测的结果选择水平直线,依据所述水平直线与所述字符串的位置信息将所述水平直线插入所述文本行中。
在其中一个实施例中,依据所述直线检测的结果选择水平直线包括:选择所述直线检测的结果中直线的长度大于所述面单图像信息的宽度的第一预设百分比,且水平倾斜角度小于或者等于第一预设角度的直线为水平直线。
在其中一个实施例中,所述在所述排序后的字符串位于预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行包括:
获取所述OCR识别结果中的字符串的平均宽度信息,依据所述平均宽度信息确定一个空格字符的第一宽度信息;
根据所述第一宽度信息,将第二宽度信息以及第三宽度信息用所述空格字符填补,其中,所述第二宽度信息为所述字符串之间相差的像素数信息,所述第三宽度信息为所述同一行的首位置,与所述同一行的字符串的首个字符靠近所述首位置的一侧位置之间相差的像素数信息;
依据所述位置信息顺序连接所述同一行的字符串与所述空格字符,生成所述文本行。
在其中一个实施例中,所述在所述字符串在所述预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行包括:
在所述同一行的多个字符串在同一位置上出现重叠的情况下,根据所述字符串的位置信息将所述重叠的字符串分为两行,并依据所述位置信息顺序分别连接位于同一行的字符串,生成所述文本行。
在其中一个实施例中,所述生成文本行之后,所述方法包括:将所述文本行和所述面单图像信息发送给显示终端,其中,所述显示终端在同一界面中显示所述文本行和所述面单图像信息。
根据本发明的另一个方面,提供了一种面单识别结果的排版方法,所述方法包括:
移动终端接收用户上传的面单图像信息,并将所述面单图像信息发送给服务器,其中,所述服务器通过调用OCR功能接口,获取对所述面单图像信息的OCR识别结果,并依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序,确定所述字符串中属于同一行的字符串,顺序连接所述同一行的字符串,生成文本行;
所述移动终端生成一个网络连接字符串URL,其中,所述URL指示显示终端的访问页面,所述访问页面显示所述面单图像信息和所述文本行。
根据本发明的另一个方面,提供了一种面单识别结果的排版系统,所述系统包括:
面单图像上传模块,用于接收面单图像信息,通过调用OCR功能接口获取对所述面单图像信息的OCR识别结果;
OCR结果排版模块,用于依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序;
所述OCR结果排版模块在所述排序后的字符串在预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行;其中,所述预设高度范围为垂直方向平移范围。
在其中一个实施例中,所述系统还包括OCR结果展示模块;
所述OCR结果展示模块,用于将所述文本行和所述面单图像信息发送给终端,其中,所述终端在同一界面中显示所述文本行和所述面单图像信息。
根据本发明的另一个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一所述方法的步骤。
通过本发明,采用一种面单识别的方法,接收面单图像信息,通过调用OCR功能接口获取对该面单图像信息的OCR识别结果;依据所述OCR识别结果中的字符串的位置信息,对该字符串进行排序;在该排序后的字符串在预设高度范围内的情况下,确定该字符串中属于同一行的字符串,并依据该位置信息,顺序连接该同一行的字符串,生成文本行,有效还原文字原来的相对位置,提高了文字排版算法的准确度,从而解决了OCR系统在物流面单识别过程中的识别功能单一的问题,同时提供了在显示终端对面单信息进行集中录入时,面单OCR排版结果在网络页面中集中显示的功能,方便用户直接从页面上获取数据并录入到用户系统中,提高了用户录单效率。
附图说明
图1为根据本发明实施例中一种面单识别结果的应用场景的示意图;
图2为根据本发明实施例的一种面单识别结果的排版方法的流程图一;
图3为根据本发明实施例的一种面单识别结果的排版方法的流程图二;
图4为根据本发明实施例的一种面单识别结果的排版方法的流程图三;
图5为根据本发明实施例的一种面单识别结果的排版方法的流程图四;
图6为根据本发明实施例的一种面单识别结果的排版方法的流程图五;
图7为根据本发明实施例的面单识别结果的显示界面的示意图;
图8为根据本发明实施例的一种面单识别结果的排版方法的流程图六;
图9为根据本发明实施例的面单图像信息上传页面的示意图;
图10为根据本发明实施例的一种面单识别结果的排版系统的结构图一;
图11为根据本发明实施例的一种面单识别结果的排版系统的结构图二;
图12为根据本发明实施例的一种OCR结果排版模块的结构图一;
图13为根据本发明实施例的一种OCR结果排版模块的结构图二;
图14为根据本发明实施例的一种面单识别结果的排版系统的结构图三;
图15为根据本发明实施例的一种面单识别结果的排版系统的结构图四。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本实施例中,提供了一种面单识别结果的应用场景,图1为根据本发明实施例中一种面单识别的应用场景的示意图,如图1所示,在该应用环境中,包括移动终端12,显示终端14和服务器16。该移动终端12和显示终端14通过网络与该服务器16进行通信;服务器16接收用户通过该移动终端12上传的面单图像信息,通过调用OCR功能接口,获取对该面单图像信息的OCR识别结果,并依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序,确定该字符串中属于同一行的字符串,顺序连接该同一行的字符串,最后生成文本行;该移动终端12生成一个网络连接字符串URL,其中,该URL指示显示终端14的访问页面,该访问页面显示该面单图像信息和该文本行。该移动终端12可以但不限于是各种智能手机,该显示终端14可以但不限于是个人计算机、笔记本电脑和平板电脑,显示终端14和移动终端12可以为一台设备,或者为多台设备,该服务器16可以用独立的服务器或者是多个服务器组成的服务器集群来实现,该服务器16和移动终端12可以集成在一台设备上实现上述功能。
在本实施例中,提供了一种面单识别的方法,图2为根据本发明实施例的一种面单识别结果的排版方法的流程图一,如图2所示,该方法包括如下步骤:
步骤S202,接收面单图像信息,通过调用OCR功能接口获取对所述面单图像信息的OCR识别结果;其中,该OCR功能接口可以是百度OCR接口,或者其他商家或自研的OCR功能接口;根据该OCR识别结果,统计该字符串的平均高度并记为H。
步骤S204,依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序;其中,该位置信息根据该面单图像信息获取,即该字符串中的字符在该面单图像信息的位置信息的顺序是从上到下或者从左到右,该位置信息对应的字符的像素索引序号从小到大,依据该像素索引序号,对该字符串进行从上到下或者从左到右的排序。
步骤S206,在该排序后的字符串在预设高度范围内的情况下,确定该字符串中属于同一行的字符串,并依据该位置信息,顺序连接该同一行的字符串,生成文本行;其中,该预设高度范围为垂直方向平移范围;其中,从该字符串所在的文本框的顶端开始,设置预设高度范围为0~1.2×H,查找该预设高度范围内的字符串,该字符串所在的高度位置的80%以上都在该预设高度范围则确定该字符串为同一行的字符串;将预设高度范围向下平移0.5×H个高度(高度范围的起止点都加0.5×H),再次按照上述方式查找构成文字行的字符串,在该字符串构成文字行的情况下,查找该行文字中与上一行文字中的字符串重复的字符串,在该重复的字符串存在的情况下,与将该重复的字符串与上一行文字合并;在该重复的字符串不存在的情况下,新生成一行文字;最后依据该位置信息,顺序连接每一行的字符串,生成文本行。
通过上述步骤S202至S206,接收面单图像信息,通过调用OCR功能接口获取对该面单图像信息的OCR识别结果;依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序;在该排序后的字符串在预设高度范围内的情况下,确定该字符串中属于同一行的字符串,并依据该位置信息,顺序连接该同一行的字符串,生成文本行,在相关技术中,OCR系统在物流面单识别过程中局限于将图像识别为文字,而上述面单识别方法的步骤可以有效还原文字原来的相对位置,提高了文字排版算法的准确度,从而解决了OCR系统在物流面单识别过程中的识别功能单一的问题,提高了用户录单效率。
在一个实施例中,提供了一种面单识别结果的排版方法,图3为根据本发明实施例的一种面单识别的方法的流程图二,如图3所示,该方法包括如下步骤:
步骤S302,对该面单图像信息进行直线检测,依据该直线检测的结果选择水平直线,依据该水平直线与该字符串的位置信息将该水平直线插入该文本行中;其中,该直线检测可以通过Hough算法,或其他优化算法实现,并依据该直线检测的结果选择水平直线;在该水平直线位置与面单图像信息中的文字位置没有重叠的情况下,则将该水平直线插入到与该水平直线距离最近的一行字符串处,即,在该水平直线在该行字符串上方的情况下,将该水平直线插入到该行字符串上方,否则插入该行字符串下方;在该水平直线位置与面单图像信息中的字符位置有重叠的情况下,则计算该重叠的长度,将该重叠的长度与预设重叠值进行比较,例如,该预设重叠值可以为30%,在该重叠的长度大于30%的情况下,则舍弃该水平直线;否则,在该水平直线在字符串上方的长度占比大的情况下,将该水平直线插入到该行字符串的上方,反之插到该行字符串的下方。
通过上述步骤S302,通过直线检测,选择合适的水平直线插入到排版后的文本行中,使得排版后部分区分度明显的文本行会通过分割线划分开,从而更加明显地区分出不同的文字内容,方便用户在该文本行中查找信息。
在一个实施例中,依据该直线检测的结果选择水平直线包括:选择该直线检测的结果中直线的长度大于该面单图像信息的宽度的第一预设百分比,且水平倾斜角度小于或者等于第一预设角度的直线为水平直线;其中,该第一预设百分比为40%,该第一预设角度为15°。
在一个实施例中,提供了一种面单识别结果的排版方法,图4为根据本发明实施例的一种面单识别的方法的流程图三,如图4所示,该方法包括如下步骤:
步骤S402,在该排序后的字符串位于预设高度范围内的情况下,确定该字符串中属于同一行的字符串。
步骤S404,获取该OCR识别结果中的字符串的平均宽度信息,依据该平均宽度信息确定一个空格字符的第一宽度信息;其中,该第一宽度信息为一个空格字符的像素数;遍历并判断该OCR识别结果中的字符串的各字符的类型,统计该字符串的总长度并记为stringLen,并统计中文字符的个数并记为charNum,统计数字及英文字符的个数并记为otherNum;一个空格字符的高度记为blankHeight,该高度等于该字符串的平均高度,则有blankHeight=H;一个空格字符的宽度记为blankWidth,则有blankWidth=stringLen/(2×charNum-otherNum)。
步骤S406,根据该第一宽度信息,将第二宽度信息以及第三宽度信息用该空格字符填补,其中,该第二宽度信息为该字符串之间相差的像素数信息,该第三宽度信息为该同一行的首位置,与该同一行的字符串的首个字符靠近该首位置的一侧位置之间相差的像素数信息;其中,该填补的空格字符的个数记为Number,则有Number=(第二宽度信息+第三宽度信息)/第一宽度信息。
步骤S408,依据该位置信息顺序连接该同一行的字符串与该空格字符,生成该文本行。
通过上述步骤S402至S408,根据OCR识别结果获取空格字符的高度信息和宽度信息,并将空格字符自适应地在文本行中进行填充,从而实现了对OCR识别结果的排版算法的进一步优化。
在一个实施例中,提供了一种面单识别的方法,图5为根据本发明实施例的一种面单识别结果的排版方法的流程图四,如图5所示,该方法包括如下步骤:
步骤S502,在该同一行的多个字符串在同一位置上出现重叠的情况下,根据该字符串的位置信息将该重叠的字符串分为两行,其中,该位置信息高的字符串置于上行文字中,该位置信息低的字符串置于下行文字中。
步骤S504,依据该位置信息顺序分别连接位于同一行的字符串,生成该文本行。
通过上述步骤S502至S504,将发生重叠的字符串依据该字符串的高、低位置,将该重叠的字符串分为上、下两行,从而使得排版后的文本行文字清晰可辨,有效还原文字原来的相对位置,便于用户查找识别后的文字信息。
在一个实施例中,提供了一种面单识别的方法,图6为根据本发明实施例的一种面单识别结果的排版方法的流程图五,如图6所示,该方法包括如下步骤:
步骤S602,将该文本行和该面单图像信息发送给显示终端14,其中,该显示终端14在同一界面中显示该文本行和该面单图像信息;图7为根据本发明实施例的面单识别结果的显示界面的示意图,如图7所示,显示界面中包含了上传的图像信息及识别后的排版文字,方便用户进行图文排版对比校验并修改该识别结果;最后在用户的系统中进行录单,该录单可以由用户复制该排版文字,并将该复制的排版文字粘贴到用户的系统中进行录单,或者在接收到用户的确认信息后,由服务器16自动提取有效信息进行录单,从而实现了用户在户外不定时间上传面单,然后集中录入系统的工作方式,提高了录单效率。
在一个实施例中,提供了一种面单识别的方法,图8为根据本发明实施例的一种面单识别结果的排版方法的流程图六,如图8所示,该方法包括如下步骤:
步骤S802,移动终端12接收用户上传的面单图像信息,并将该面单图像信息发送给服务器16,其中,该服务器16通过调用OCR功能接口,获取对该面单图像信息的OCR识别结果,并依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序,确定该字符串中属于同一行的字符串,顺序连接该同一行的字符串,生成文本行;其中,图9为根据本发明实施例的面单图像信息上传页面的示意图,如图9所示,允许用户在移动终端12一次上传多张面单图像,例如,可以一次上传9张面单图像,这种上传多张面单图像的方式满足用户在户外多次开单时通过移动终端12上传多张面单的需要,同时节省了需要多次上传的步骤。
步骤S804,该移动终端12生成一个网络连接字符串URL,其中,该URL指示显示终端14的访问页面,该访问页面显示该面单图像信息和该文本行。
通过上述步骤S802至S804,通过在移动终端12拍摄面单图像并上传给服务器16,直接由服务器16来实现OCR识别以及文本排版,使排版结果保持原有的相对位置,并在显示终端14显示识别结果,避免了用户通过移动终端12将OCR识别结果上传到显示终端14的环节,实现了物流场景中面单图像分散上传,面单信息集中录入的功能,使面单集中录入系统时在显示终端可以方便地获取OCR文本信息,从而提高了面单的录入效率。
应该理解的是,虽然图2至图6以及图8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至图6以及图8中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在本实施例中,提供了一种面单识别的系统,图10为根据本发明实施例的一种面单识别结果的排版系统的结构图一,如图10所示,该系统包括:
面单图像上传模块102,用于接收面单图像信息,通过调用OCR功能接口获取对该面单图像信息的OCR识别结果;
OCR结果排版模块104,用于依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序;
该OCR结果排版模块104在该排序后的字符串在预设高度范围内的情况下,确定该字符串中属于同一行的字符串,并依据该位置信息,顺序连接该同一行的字符串,生成文本行;其中,该预设高度范围为垂直方向平移范围。
通过上述面单识别的系统,面单图像上传模块102接收面单图像信息,获取对该面单图像信息的OCR识别结果,然后由OCR结果排版模块104依据该OCR识别结果对该字符串排序,并由OCR结果排版模块104依据该该字符串的位置信息,对该字符串进行排版,生成文本行,从而有效还原文字原来的相对位置,提高了文字排版算法的准确度,解决了OCR系统在物流面单识别过程中的识别功能单一的问题,提高了用户录单效率。
在一个实施例中,提供了一种面单识别的系统,图11为根据本发明实施例的一种面单识别结果的排版系统的结构图二,如图11所示,该系统包括:
直线检测模块112,用于对该面单图像信息进行直线检测,依据该直线检测的结果选择水平直线,依据该水平直线与该字符串的位置信息将该水平直线插入该文本行中。
在一个实施例中,该直线检测模块112还包括:选择该直线检测的结果中直线的长度大于该面单图像信息的宽度的第一预设百分比,且水平倾斜角度小于或者等于第一预设角度的直线为水平直线。
在一个实施例中,图12为根据本发明实施例的一种OCR结果排版模块的结构图一,如图12所示,该OCR结果排版模块包括:
宽度信息单元122,用于获取该OCR识别结果中的字符串的平均宽度信息,依据该平均宽度信息确定一个空格字符的第一宽度信息;
空格填补单元124,用于根据该第一宽度信息,将第二宽度信息以及第三宽度信息用该空格字符填补,其中,该第二宽度信息为该字符串之间相差的像素数信息,该第三宽度信息为该同一行的首位置,与该同一行的字符串的首个字符靠近该首位置的一侧位置之间相差的像素数信息。
在一个实施例中,图13为根据本发明实施例的一种OCR结果排版模块的结构图二,如图13所示,该OCR结果排版模块还包括:
分行单元132,用于在该同一行的多个字符串在同一位置上出现重叠的情况下,根据该字符串的位置信息将该重叠的字符串分为两行。
在一个实施例中,提供了一种面单识别的系统,图14为根据本发明实施例的一种面单识别结果的排版系统的结构图三,如图14所示,该系统还包括:
OCR结果展示模块142,用于将该文本行和该面单图像信息发送给终端,其中,该终端在同一界面中显示该文本行和该面单图像信息。
在一个实施例中,提供了一种面单识别的系统,图15为根据本发明实施例的一种面单识别的系统的结构图四,如图15所示,该系统包括:
传送模块152,用于接收用户上传的面单图像信息,并将该面单图像信息发送给服务器16,其中,该服务器16通过调用OCR功能接口,获取对该面单图像信息的OCR识别结果,并依据该OCR识别结果中的字符串的位置信息,对该字符串进行排序,确定该字符串中属于同一行的字符串,顺序连接该同一行的字符串,生成文本行;
生成模块154,用于生成一个网络连接字符串URL,其中,该URL指示显示终端14的访问页面,该访问页面显示该面单图像信息和该文本行。
关于面单识别的系统的具体限定可以参见上文中对于面单识别的方法的限定,在此不再赘述。上述面单识别的系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储面单图像信息和文本行数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种面单识别方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入系统。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种面单识别的方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入系统可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述各实施例提供的面单识别方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各实施例提供的面单识别方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种面单识别结果的排版方法,其特征在于,所述方法包括:
接收面单图像信息,通过调用OCR功能接口获取对所述面单图像信息的OCR识别结果;
依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序;
在所述排序后的字符串位于预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行,具体地,获取所述OCR识别结果中的字符串的平均宽度信息,依据所述平均宽度信息确定一个空格字符的第一宽度信息;根据所述第一宽度信息,将第二宽度信息以及第三宽度信息用所述空格字符填补,其中,所述第二宽度信息为所述字符串之间相差的像素数信息,所述第三宽度信息为所述同一行的首位置,与所述同一行的字符串的首个字符靠近所述首位置的一侧位置之间相差的像素数信息;依据所述位置信息顺序连接所述同一行的字符串与所述空格字符,生成所述文本行;其中,所述预设高度范围为垂直方向平移范围。
2.根据权利要求1所述的方法,其特征在于,所述生成文本行之后,所述方法包括:
对所述面单图像信息进行直线检测,依据所述直线检测的结果选择水平直线,依据所述水平直线与所述字符串的位置信息将所述水平直线插入所述文本行中。
3.根据权利要求2所述的方法,其特征在于,依据所述直线检测的结果选择水平直线包括:选择所述直线检测的结果中直线的长度大于所述面单图像信息的宽度的第一预设百分比,且水平倾斜角度小于或者等于第一预设角度的直线为水平直线。
4.根据权利要求1所述的方法,其特征在于,所述在所述排序后的字符串位于预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行之后,所述方法还包括:
将所述预设高度范围向下平移所述预设高度范围的一半,得到平移后的所述预设高度范围,在所述平移后的预设高度范围中确定所述字符串中属于同一行的当前字符串,生成当前文本行;
查找所述当前字符串中与所述文本行的字符串重复的目标字符串,将所述目标字符串与所述文本行合并,生成目标文本行。
5.根据权利要求1所述的方法,其特征在于,所述在所述字符串在所述预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行包括:
在所述同一行的多个字符串在同一位置上出现重叠的情况下,根据所述字符串的位置信息将所述重叠的字符串分为两行;
依据所述位置信息顺序分别连接位于同一行的字符串,生成所述文本行。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述生成文本行之后,所述方法包括:将所述文本行和所述面单图像信息发送给显示终端,其中,所述显示终端在同一界面中显示所述文本行和所述面单图像信息。
7.一种面单识别结果的排版方法,其特征在于,所述方法包括:
移动终端接收用户上传的面单图像信息,并将所述面单图像信息发送给服务器,其中,所述服务器通过调用OCR功能接口,获取对所述面单图像信息的OCR识别结果,并依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序,确定所述字符串中属于同一行的字符串,顺序连接所述同一行的字符串,生成文本行,具体地,所述服务器获取所述OCR识别结果中的字符串的平均宽度信息,依据所述平均宽度信息确定一个空格字符的第一宽度信息;根据所述第一宽度信息,将第二宽度信息以及第三宽度信息用所述空格字符填补,其中,所述第二宽度信息为所述字符串之间相差的像素数信息,所述第三宽度信息为所述同一行的首位置,与所述同一行的字符串的首个字符靠近所述首位置的一侧位置之间相差的像素数信息;依据所述位置信息顺序连接所述同一行的字符串与所述空格字符,生成所述文本行;
所述移动终端生成一个网络连接字符串URL,其中,所述URL指示显示终端的访问页面,所述访问页面显示所述面单图像信息和所述文本行。
8.一种面单识别结果的排版系统,其特征在于,所述系统包括:
面单图像上传模块,用于接收面单图像信息,通过调用OCR功能接口获取对所述面单图像信息的OCR识别结果;
OCR结果排版模块,用于依据所述OCR识别结果中的字符串的位置信息,对所述字符串进行排序;
所述OCR结果排版模块在所述排序后的字符串在预设高度范围内的情况下,确定所述字符串中属于同一行的字符串,并依据所述位置信息,顺序连接所述同一行的字符串,生成文本行,具体地,获取所述OCR识别结果中的字符串的平均宽度信息,依据所述平均宽度信息确定一个空格字符的第一宽度信息;根据所述第一宽度信息,将第二宽度信息以及第三宽度信息用所述空格字符填补,其中,所述第二宽度信息为所述字符串之间相差的像素数信息,所述第三宽度信息为所述同一行的首位置,与所述同一行的字符串的首个字符靠近所述首位置的一侧位置之间相差的像素数信息;依据所述位置信息顺序连接所述同一行的字符串与所述空格字符,生成所述文本行;其中,所述预设高度范围为垂直方向平移范围。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括OCR结果展示模块;
所述OCR结果展示模块,用于将所述文本行和所述面单图像信息发送给显示终端,其中,所述显示终端在同一界面中显示所述文本行和所述面单图像信息。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911050134.3A CN111008559B (zh) | 2019-10-31 | 2019-10-31 | 一种面单识别结果的排版方法、系统及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911050134.3A CN111008559B (zh) | 2019-10-31 | 2019-10-31 | 一种面单识别结果的排版方法、系统及计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111008559A CN111008559A (zh) | 2020-04-14 |
CN111008559B true CN111008559B (zh) | 2023-08-11 |
Family
ID=70111294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911050134.3A Active CN111008559B (zh) | 2019-10-31 | 2019-10-31 | 一种面单识别结果的排版方法、系统及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111008559B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111626037A (zh) * | 2020-05-25 | 2020-09-04 | 北京达佳互联信息技术有限公司 | 字形排版方法、装置、电子设备和存储介质 |
CN111626250B (zh) * | 2020-06-02 | 2023-08-11 | 泰康保险集团股份有限公司 | 文本图像的分行方法、装置、计算机设备及可读存储介质 |
CN111680688B (zh) * | 2020-06-10 | 2023-08-08 | 创新奇智(成都)科技有限公司 | 字符识别方法及装置、电子设备、存储介质 |
CN113822280B (zh) * | 2020-06-18 | 2024-07-09 | 阿里巴巴集团控股有限公司 | 文本识别方法、装置、系统和非易失性存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009251872A (ja) * | 2008-04-04 | 2009-10-29 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014235694A (ja) * | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
CN104699663A (zh) * | 2013-12-05 | 2015-06-10 | 中兴通讯股份有限公司 | 一种信息输入方法及装置 |
CN109190629A (zh) * | 2018-08-28 | 2019-01-11 | 传化智联股份有限公司 | 一种电子运单生成方法及装置 |
CN109766778A (zh) * | 2018-12-19 | 2019-05-17 | 平安科技(深圳)有限公司 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160140145A1 (en) * | 2014-11-13 | 2016-05-19 | International Business Machines Corporation | Extracting information from PDF Documents using Black-Box Image Processing |
-
2019
- 2019-10-31 CN CN201911050134.3A patent/CN111008559B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009251872A (ja) * | 2008-04-04 | 2009-10-29 | Fuji Xerox Co Ltd | 情報処理装置及び情報処理プログラム |
JP2014235694A (ja) * | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
CN104699663A (zh) * | 2013-12-05 | 2015-06-10 | 中兴通讯股份有限公司 | 一种信息输入方法及装置 |
CN109190629A (zh) * | 2018-08-28 | 2019-01-11 | 传化智联股份有限公司 | 一种电子运单生成方法及装置 |
CN109766778A (zh) * | 2018-12-19 | 2019-05-17 | 平安科技(深圳)有限公司 | 基于ocr技术的发票信息录入方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111008559A (zh) | 2020-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111008559B (zh) | 一种面单识别结果的排版方法、系统及计算机设备 | |
CN110334585B (zh) | 表格识别方法、装置、计算机设备和存储介质 | |
CN109947967B (zh) | 图像识别方法、装置、存储介质和计算机设备 | |
CN110728687B (zh) | 文件图像分割方法、装置、计算机设备和存储介质 | |
WO2021012382A1 (zh) | 配置聊天机器人的方法、装置、计算机设备和存储介质 | |
CN109886330B (zh) | 文本检测方法、装置、计算机可读存储介质和计算机设备 | |
CN107886082B (zh) | 图像中数学公式检测方法、装置、计算机设备及存储介质 | |
WO2020186779A1 (zh) | 图片信息识别方法、装置、计算机设备和存储介质 | |
US20210117667A1 (en) | Document structure identification using post-processing error correction | |
CN110059688B (zh) | 图片信息识别方法、装置、计算机设备和存储介质 | |
CN112712014A (zh) | 表格图片结构解析方法、系统、设备和可读存储介质 | |
CN110245570B (zh) | 扫描文本分段方法、装置、计算机设备和存储介质 | |
CN113436222A (zh) | 图像处理方法、图像处理装置、电子设备及存储介质 | |
CN111080697B (zh) | 检测目标对象方向的方法、装置、计算机设备和存储介质 | |
CN113538291B (zh) | 卡证图像倾斜校正方法、装置、计算机设备和存储介质 | |
CN111709422A (zh) | 基于神经网络的图像识别方法、装置和计算机设备 | |
CN113011132B (zh) | 竖排文字识别方法、装置、计算机设备和存储介质 | |
CN112861503B (zh) | 产生电子合同的方法、计算设备和计算机存储介质 | |
CN112836632B (zh) | 自定义模板文字识别的实现方法及系统 | |
CN114881182A (zh) | 电子面单处理方法、装置、计算机设备以及存储介质 | |
CN114049633A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN114882517A (zh) | 文本处理方法、装置和系统 | |
CN112036365B (zh) | 信息导入方法和装置,以及图像处理方法和装置 | |
CN111177430A (zh) | 综合图像的存储方法、装置、计算机设备和存储介质 | |
CN117314546B (zh) | 基于人工智能的电商产品分析方法、系统、介质及计算机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |