CN111368822B - 图像中剪切快递面单区域的方法、装置、设备及存储介质 - Google Patents

图像中剪切快递面单区域的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111368822B
CN111368822B CN202010202544.1A CN202010202544A CN111368822B CN 111368822 B CN111368822 B CN 111368822B CN 202010202544 A CN202010202544 A CN 202010202544A CN 111368822 B CN111368822 B CN 111368822B
Authority
CN
China
Prior art keywords
text
target
area
text boxes
box
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010202544.1A
Other languages
English (en)
Other versions
CN111368822A (zh
Inventor
张伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongtongji Network Technology Co Ltd
Original Assignee
Shanghai Zhongtongji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongtongji Network Technology Co Ltd filed Critical Shanghai Zhongtongji Network Technology Co Ltd
Priority to CN202010202544.1A priority Critical patent/CN111368822B/zh
Publication of CN111368822A publication Critical patent/CN111368822A/zh
Application granted granted Critical
Publication of CN111368822B publication Critical patent/CN111368822B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明涉及一种图像中剪切快递面单区域的方法、装置、设备及存储介质,该方法包括:确定图像中所有的文本框;确定框住所有文本框的最小的方框,得到由方框框选的文本区域;判断文本区域是否为目标区域;如果是,将文本区域剪切出;否则,基于预设算法,在所有文本框中确定多个属于目标区域的基准文本框;基于基准文本框确认并剪切出与目标区域相关的基准区域。实现了当快递面单的粘贴背景上布满文字等内容时,可以准确的在图像中剪切出快递面单对应的区域,以及当快递面单相对于粘贴背景上的文字是倾斜的时,也可以准确的在图像中剪切出快递面单对应的区域。

Description

图像中剪切快递面单区域的方法、装置、设备及存储介质
技术领域
本发明涉及图片剪切技术领域,具体涉及一种图像中剪切快递面单区域的方法、装置、设备及存储介质。
背景技术
快递面单一般贴在快递包裹上,快递在入库或派送等过程中,是通过智能设备扫描快递面单来提取快递面单的面单信息的,详细的,智能设备首先识别出图像中的文本区域,并将所述文本区域从所述图像中剪切出来,当快递面单贴在无其他文字或图画的包裹上时,剪切出的文本区域便为快递面单在图像中对应的区域,然后对剪切出的文本区域进行进一步的文字识别处理,最终获取快递面单的面单信息。
然而,当快递面单的粘贴背景很复杂时,例如粘贴快递面单的包裹表面布满文字或者图画,以及快递面单相对于粘贴背景上的文字是倾斜的,使得常规的深度学习算法不能直接将快递面单从图像中剪切出来,使得快递面单不能被智能设备自动识别,给快递员的工作带来不便。
发明内容
有鉴于此,为解决上述问题,本申请提供了一种图像中剪切快递面单区域的方法、装置、设备及存储介质。
本发明采用如下技术方案:
参看本申请的第一方面,本发明提供了一种图像中剪切快递面单区域的方法,包括:确定图像中所有的文本框;确定框住所有所述文本框的最小的方框,得到由所述方框框选的文本区域;判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域;如果是,将所述文本区域剪切出;否则,基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框;基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域。
参看本申请的第二方面,本发明提供了一种图像中剪切快递面单区域的装置,用于实现本申请的图像中剪切快递面单区域的方法,该装置包括:确定所有文本框模块,用于确定图像中所有的文本框;框选模块,用于确定框住所有所述文本框的方框,得到由所述方框框选的文本区域;初步判断模块,用于判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域;确定基准文本框模块,用于基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框;剪切模块,用于当所述文本区域为目标区域时剪切所述目标区域,或当所述文本区域不为所述目标区域时,基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域。
参看本申请的第三方面,本发明提供了一种设备,该设备包括:处理器,以及与所述处理器相连接的存储器;所述存储器用于存储计算机程序,所述计算机程序至少用于执行上述的图像中剪切快递面单区域的方法;所述处理器用于调用并执行所述存储器中的计算机程序。
参看本申请的第四方面,本发明提供了一种存储介质,该存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现上述的图像中剪切快递面单区域的方法中各个步骤。
本发明采用以上技术方案,首先判断图像中所有的文本框构成的文本区域是否为图像中快递面单对应的区域,如果是,说明快递面单贴在无其他文字或图画的包裹上,也即快递面单的粘贴背景是空白背景,此时,在图像中剪切出快递面单对应的区域只需剪切出所有文本框构成的目标区域即可;如果不是,说明快递面单的粘贴背景上包含文字或图画等其他内容,针对该情况,本申请首先在图像的所有文本框中确定出多个属于所述快递面单对应区域的基准文本框,然后基于每个所述基准文本框剪切出与目标区域相关的基准区域。实现了当快递面单的粘贴背景上布满文字等内容时,可以准确的在图像中剪切出快递面单对应的区域,以及当快递面单相对于粘贴背景上的文字是倾斜的时,也可以准确的在图像中剪切出快递面单对应的区域。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像中剪切快递面单区域的方法的流程示意图。
图2是本发明实施例提供的另一种图像中剪切快递面单区域的方法的流程示意图。
图3是本发明实施例提供的一种图像中剪切快递面单区域的装置的结构示意图。
图4是本发明实施例提供的一种设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明实施例提供的一种图像中剪切快递面单区域的方法的流程示意图。如图1所示,图像中剪切快递面单区域的方法,包括:
S101、确定图像中所有的文本框。
详细的,智能设备可以是首先确定出图像中所有的文本,然后确定出与每个文本对应的文本框,其中,将独立的一个文本段或独立的一句话定为一个文本。智能设备也可以通过其他方法确定出图像中所有的文本框。
S102、确定框住所有所述文本框的最小的方框,得到由所述方框框选的文本区域。
具体的,可以是先确定所有所述文本框的四个方向的边界线,其中,所述边界线的一侧包含所有所述文本框,所述边界线的另一侧为空白区域,且所述边界线与距离其最近的文本框的一边重合;所述四个方向可以是图像的上下左右四个方向,也可以是其他四个方向;所述边界线与所述方向的个数一一对应,均为四个;每个边界线分别与两个其他边界线垂直且相交,使得四个边界线围城一个矩形方框,然后将所述方框确定为框住所有所述文本框的最小的方框。
S103、判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域。
详细的,可以是通过判断所述文本框的个数是否属于预设文本框个数范围内,如果是,则确定所述文本区域为目标区域,如果不是,则所述文本区域不为所述目标区域,其中,所述预设文本框个数范围为一般快递面单的文本框个数的范围。
S104、如果是,将所述文本区域剪切出。
详细的,如果是,说明快递面单贴在无其他文字或图画的快递包裹上,也即快递面单的粘贴背景是空白背景,此时,在图像中剪切出快递面单对应的区域只需剪切出所有文本框构成的目标区域即可。
S105、否则,基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框。
具体的,当判断初所述文本区域不是目标区域时,说明快递面单贴在布有其他文字或图画的快递包裹上,因此图像中除了包括快递面单上的文本外,还包括除快递面单的文字之外的其他文本。在这种情况下,为了在图像中准确地将快递面单对应的区域剪切出来,可以先在所有的文本框中确定出多个属于所述目标区域,也即属于图像中快递面单对应的区域,的文本框,并将确定出的文本框命名为基准文本框,以使智能设备可以基于所述基准文本框最终确定出与所述目标区域相关的基准区域。
S106、基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域。
详细的,所述基准文本框是智能设备确定出的属于所述目标区域的文本框,因此,可以是确定出与所述基准文本框相似的其他文本框,然后将包括所述基准文本框和该基准文本框的相似文本框的区域剪切出,得到该基准文本框对应的基准区域,所述基准区域的个数与所述基准文本框的个数一一对应。可以是所有所述基准区域组成所述目标区域,也可以是任意个数的所述基准区域组成所述目标区域,还可以是所述目标区域为其中一个所述基准区域。使得智能设备可以通过只识别所述基准区域便可以获取到快递面单上的信息。
本发明采用以上技术方案,首先判断图像中所有的文本框构成的文本区域是否为图像中快递面单对应的区域,如果是,说明快递面单贴在无其他文字或图画的包裹上,也即快递面单的粘贴背景是空白背景,此时,在图像中剪切出快递面单对应的区域只需剪切出所有文本框构成的目标区域即可;如果不是,说明快递面单的粘贴背景上包含文字或图画等其他内容,针对该情况,本申请首先在图像的所有文本框中确定出多个属于所述快递面单对应区域的基准文本框,然后基于每个所述基准文本框剪切出与目标区域相关的基准区域。实现了当快递面单的粘贴背景上布满文字等内容时,可以准确的在图像中剪切出快递面单对应的区域,以及当快递面单相对于粘贴背景上的文字是倾斜的时,也可以准确的在图像中剪切出快递面单对应的区域。
进一步的,所述判断所述文本区域是否为目标区域,具体包括:基于框住所有所述文本框的方框的长度值、宽度值和长宽比判断所述文本区域是否为所述目标区域。
详细的,一般快递面单的长宽比是相同的,可以在智能设备中预先设置长宽比参数,然后智能设备确定出所述方框的长度值和宽度值后,计算出所述方框的长宽比,接下来智能设备将计算出的所述长宽比与智能设备中预先设置的长宽比参数进行比较,如果两者完全相同,或者两者的差值在预设差值范围之内,则说明所述方框框选的文本区域为快递面单对应的区域,如果两者相差比较多,也即两者的差值超出所述预设差值范围,则说明所述方框框选的文本区域不为快递面单对应的区域。此外,对于长宽比与一般快递面单不同的其他快递面单,可以通过修改智能设备中预先设置的长宽比参数来实现判断所述文本区域是否为目标区域。
图2是本发明又一实施例提供的另一种图像中剪切快递面单区域的方法的流程示意图。如图2所示,图像中剪切快递面单区域的方法,包括:
S201、确定图像中所有的文本框。
S202、确定框住所有所述文本框的最小的方框,得到由所述方框框选的文本区域。
S203、判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域。
S204、如果是,将所述文本区域剪切出。
S205、否则,确定出每个所述文本框的长度值、宽度值和倾斜角度。
详细的,可以现在图像中确定一个基准线,所述基准线的方向是任意的。所述倾斜角度为所述文本框相对于所述基准线的倾斜角度。框住快递面单的文本的各个文本框的长度值和宽度值一般比较相似,甚至相同,且框住快递面单的文本的各个文本框的倾斜角度一般相同,因此,通过寻找长度值、宽度值和倾斜角度比较相近的文本框,有利于确定出图像中快递面单对应的区域。
S206、在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框。
具体的,一般情况下,快递面单对应的文本在图像中所有文本中占比较大,因此,框住快递面单对应的文本的文本框一般比较长,因此,在所有文本框中选取出长度较长的文本框有利于确定出快递面单对应的区域。
S207、基于所述文本框的长度值、宽度值和倾斜角度,确定出每个所述目标文本框的所有相似文本框。
详细的,两个文本框为相似文本框的条件为:该两个文本框的长度值的差值属于预设长度值差值范围之内,且该两个文本框的宽度值的差值属于预设宽度值差值范围之内,且该两个文本框的倾斜角度的差值属于预设倾斜角度差值范围之内,只有满足上述所有的两个文本框为相似文本框的条件时,两个文本框才为相似文本框。
在具体的应用过程中,确定一个目标文本框的所有相似文本框的过程为:将图像中的所有文本框依次与该目标文本框进行比较,当所述文本框与所述目标文本框满足上述所有的两个文本框为相似文本框的条件时,确定该文本框为所述目标文本框的相似文本框,当所述文本框与所述目标文本框不满足上述所有的两个文本框为相似文本框的条件时,则确定该文本框不是所述目标文本框的相似文本框,由此,确定出该目标文本框的所有相似文本框。同理,依次确定出其他目标文本框的所有相似文本框。
S208、基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框。
具体的,一般情况下,相似文本框个数较多的目标文本框属于快递面单对应的文本框,因此,选取相似文本框个数较多的目标文本框作为基准文本框有利于在图像中确定出快递面单对应的区域。
S209、基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域。
本实施例首先根据所述文本框的长度值确定出目标文本框,利用了一般情况下,快递面单对应的文本框是所有文本框中长度值比较大的文本框,然后根据所述目标文本框的相似文本框个数确定出基准文本框,利用了一般情况下,快递面单对应的文本框的相似文本框个数是所有文本框中相似文本框个数较多的文本框,最终使得确定出的基准文本框一般为快递面单对应的文本框,有利于准确剪切出快递面单对应的区域。
进一步的,步骤S205中,所述确定出每个所述文本框的长度值、宽度值和倾斜角度,具体包括:首先使用主成分分析法确定出每个所述文本框的四个顶点的坐标值,然后根据所述坐标值确定出每个所述文本框的长度值、宽度值和倾斜角度。
具体的,通过主成分分析法确定出每个文本框的四个顶点的坐标值之前,本申请先根据现有技术确定图像中的文本区域,具体过程为:首先对图像进行一次VGG16网络处理,然后将第五次池化层后的矩阵进行一次2倍率上采样,上采样后的矩阵长、宽都比原先大1倍,并与第四次池化层处理后的矩阵进行融合,然后针对该融合后的矩阵使用卷积核大小为1*1,通道为128的卷积,随后再进行一次卷积核大小为3*3,通道数为64的卷积。这一步完成后的矩阵再次进行一次2倍率上采样,然后以此类推。当进行了三次上采样以及随后的卷积操作后,再进行一次卷积核大小为3*3,通道数为32的卷积,然后进行一次卷积核大小为1*1,通道数为1的卷积,以得出最终的矩阵。
在确定了文本区域之后,再通过现有技术的主成分分析法确定出每个文本框的四个顶点的坐标值,具体过程为:针对上述最终得到的矩阵,先设定一个阈值,比如说0.9,矩阵中所有大于该阈值的元素值设为1,否则为0。然后,进行一次连通域算法,即将所有值为1,且聚集在一块的做一个区域,这样便会有多个区域。接着使用一个字典数据结构dict,字典的key为区域编码id,value为该区域中所有元素的坐标值,即矩阵的行列值。最后,通过现有技术的主成分分析法确定出每个文本框的四个顶点的坐标值。
进一步的,步骤S206中,所述在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框,具体包括:首先将所有所述文本框按照长度值由大到小的规则进行排序,然后在所有所述文本框中选取出排名属于前1/2的所述文本框,并将其定义为目标文本框,本实施中,所述预设长度阈值即为排名属于后1/2的文本框中,排在最前面的文本框对应的长度值。
进一步的,步骤S208中,所述基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框,具体包括:首先在所有所述目标文本框中确定出所述相似文本区域的个数大于预设个数阈值的所述目标文本框,并将其定义为候选基准文本框,然后基于所述相似文本区域的个数在所有所述候选基准文本框中选取出多个属于所述目标区域的基准文本框,其中,所述基准文本框的个数范围为1-3个。
具体的,当所述候选基准文本框的个数大于3时,在所有所述候选基准文本框中选取相似文本框个数最多的3个候选基准文本框作为基准文本框,当所述候选基准文本框的个数小于3时,选取所有的候选基准文本框作为基准文本框。
进一步的,步骤S105中,所述基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域,具体包括:首先分别在每个所述基准文本框的所有所述相似文本框中确定出所述宽度值属于预设宽度范围阈值的所述相似文本框,并将其定义为目标相似文本框。然后分别通过一个方框将每个所述基准文本框和所述基准文本框的目标相似文本框框住;所述方框为能框住所述基准文本框和所述基准文本区域的目标相似文本框的最小方框;所述方框的倾斜角度与所述基准文本框的倾斜角度相同。最后将每个所述方框对应的区域分别剪切出来,得到与所述目标区域相关的基准区域。
详细的,所述预设宽度范围阈值根据对应的基准文本框的宽度值确定,使得宽度值落入所述预设宽度范围阈值的文本框与所述基准文本框的宽度近似甚至相同。在一个具体的例子中,某个基准文本框的宽度值为1cm,为了确定出该基准文本框的目标相似文本框,规定所述预设宽度范围阈值0.9cm-1.1cm,并在该基准文本框的所有相似文本框中确定出宽度值在0.9cm-1.1cm范围内的相似文本框,并将确定出的相似文本框定为该基准文本框的目标相似文本框。
将一个基准文本框和该基准文本框的所有目标相似文本框对应的区域剪切出来,得到该基准文本框对应的基准区域,同理,进一步得到其他基准文本框对应的基准区域,所述基准文本框的个数与所述基准区域的个数一一对应。
图3是本发明实施例提供的一种图像中剪切快递面单区域的装置的结构示意图,该装置用于实现本申请的图像中剪切快递面单区域的方法。如图3所示,该装置具体包括:确定所有文本框模块31、框选模块32、初步判断模块33、剪切目标区域模块34、确定基准文本框模块35和确认并剪切基准区域模块36。
其中,确定所有文本框模块31,用于确定图像中所有的文本框;框选模块32,用于确定框住所有所述文本框的方框,得到由所述方框框选的文本区域;初步判断模块33,用于判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域;剪切目标区域模块34,用于当所述文本区域为目标区域时剪切所述目标区域;确定基准文本框模块35,用于基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框;确认并剪切基准区域模块36,用于当所述文本区域不为所述目标区域时,基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域。
进一步的,初步判断模块33具体用于基于框住所有所述文本框的方框的长度值、宽度值和长宽比判断所述文本区域是否为所述目标区域。
进一步的,确定基准文本框模块35包括:确定子模块,用于确定出每个所述文本框的长度值、宽度值和倾斜角度。确定目标文本框子模块,用于在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框。确定所有相似文本框子模块,用于基于所述文本框的长度值、宽度值和倾斜角度,确定出每个所述目标文本框的所有相似文本框。确定基准文本框子模块,用于基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框。
进一步的,确定子模块具体用于,首先使用主成分分析法确定出每个所述文本框的四个顶点的坐标值。然后根据所述坐标值确定出每个所述文本框的长度值、宽度值和倾斜角度。
进一步的,确定目标文本框子模块具体用于,首先将所有所述文本框按照长度值由大到小的规则进行排序。然后在所有所述文本框中选取出排名属于前1/2的所述文本框,并将其定义为目标文本框。
进一步的,确定基准文本框子模块具体用于,首先在所有所述目标文本框中确定出所述相似文本区域的个数大于预设个数阈值的所述目标文本框,并将其定义为候选基准文本框。然后基于所述相似文本区域的个数在所有所述候选基准文本框中选取出多个属于所述目标区域的基准文本框,其中,所述基准文本框的个数范围为1-3个。
进一步的,确认并剪切基准区域模块36具体用于,首先分别在每个所述基准文本框的所有所述相似文本框中确定出所述宽度值属于预设宽度范围阈值的所述相似文本框,并将其定义为目标相似文本框。然后分别通过一个方框将每个所述基准文本框和所述基准文本框的目标相似文本框框住;所述方框为能框住所述基准文本框和所述基准文本区域的目标相似文本框的最小方框;所述方框的倾斜角度与所述基准文本框的倾斜角度相同。最后将每个所述方框对应的区域分别剪切出来,得到与所述目标区域相关的基准区域。
本发明实施例提供的图像中剪切快递面单区域的装置可执行本发明任意实施例提供的图像中剪切快递面单区域的方法,具备执行方法相应的功能模块和有益效果。
图4是本发明实施例提供的一种设备的结构示意图。如图4所示,该设备可以包括:
处理器410,以及与处理器410相连接的存储器420;其中,存储器420用于存储计算机程序,计算机程序用于执行本实施例中的图像中剪切快递面单区域的方法;处理器410用于调用并执行存储器420中的计算机程序。
具体的,在实际应用过程中,设备可以是电脑,还可以是现有技术中任意一种能够识别、处理和存储数据信息的智能设备,在此,对设备的种类和型号不做任何限定。
在本发明实施例中还可以包括一种存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时,能够实现本发明实施例中图像中剪切快递面单区域的方法中的各个步骤。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程示意图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (8)

1.一种图像中剪切快递面单区域的方法,其特征在于,包括:
确定图像中所有的文本框;
确定框住所有所述文本框的最小的方框,得到由所述方框框选的文本区域;
判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域;
如果是,将所述文本区域剪切出;
否则,基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框;所述基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框,具体包括:
确定出每个所述文本框的长度值、宽度值和倾斜角度;
在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框;
基于所述文本框的长度值、宽度值和倾斜角度,确定出每个所述目标文本框的所有相似文本框;
基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框;
基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域;
所述基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域,具体包括:
分别在每个所述基准文本框的所有所述相似文本框中确定出所述宽度值属于预设宽度范围阈值的所述相似文本框,并将其定义为目标相似文本框;
分别通过一个方框将每个所述基准文本框和所述基准文本框的目标相似文本框框住;所述方框为能框住所述基准文本框和所述基准文本框的目标相似文本框的最小方框;所述方框的倾斜角度与所述基准文本框的倾斜角度相同;
将每个所述方框对应的区域分别剪切出来,得到与所述目标区域相关的基准区域。
2.根据权利要求1所述的图像中剪切快递面单区域的方法,其特征在于,所述判断所述文本区域是否为目标区域,具体包括:
基于框住所有所述文本框的方框的长度值、宽度值和长宽比判断所述文本区域是否为所述目标区域。
3.根据权利要求2所述的图像中剪切快递面单区域的方法,其特征在于,所述确定出每个所述文本框的长度值、宽度值和倾斜角度,具体包括:
使用主成分分析法确定出每个所述文本框的四个顶点的坐标值;
根据所述坐标值确定出每个所述文本框的长度值、宽度值和倾斜角度。
4.根据权利要求1所述的图像中剪切快递面单区域的方法,其特征在于,所述在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框,具体包括:
将所有所述文本框按照长度值由大到小的规则进行排序;
在所有所述文本框中选取出排名属于前1/2的所述文本框,并将其定义为目标文本框。
5.根据权利要求1所述的图像中剪切快递面单区域的方法,其特征在于,所述基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框,具体包括:
在所有所述目标文本框中确定出所述相似文本区域的个数大于预设个数阈值的所述目标文本框,并将其定义为候选基准文本框;
基于所述相似文本区域的个数在所有所述候选基准文本框中选取出多个属于所述目标区域的基准文本框,其中,所述基准文本框的个数范围为1-3个。
6.一种图像中剪切快递面单区域的装置,用于实现如权利要求1所述的图像中剪切快递面单区域的方法,其特征在于,包括:
确定所有文本框模块,用于确定图像中所有的文本框;
框选模块,用于确定框住所有所述文本框的最小的方框,得到由所述方框框选的文本区域;
初步判断模块,用于判断所述文本区域是否为目标区域;其中,所述目标区域为所述图像中快递面单对应的区域;
剪切目标区域模块,用于当所述文本区域为目标区域时剪切所述目标区域;
确定基准文本框模块,用于基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框;所述基于预设算法,在所有所述文本框中确定多个属于所述目标区域的基准文本框,具体包括:
确定出每个所述文本框的长度值、宽度值和倾斜角度;
在所有所述文本框中选取出所述长度值大于预设长度阈值的所述文本框,并将其定义为目标文本框;
基于所述文本框的长度值、宽度值和倾斜角度,确定出每个所述目标文本框的所有相似文本框;
基于所述目标文本框的相似文本框个数在所有所述目标文本框中确定出多个属于所述目标区域的基准文本框;
确认并剪切基准区域模块,用于当所述文本区域不为所述目标区域时,基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域;所述基于所述基准文本框确认并剪切出与所述目标区域相关的基准区域,具体包括:
分别在每个所述基准文本框的所有所述相似文本框中确定出所述宽度值属于预设宽度范围阈值的所述相似文本框,并将其定义为目标相似文本框;
分别通过一个方框将每个所述基准文本框和所述基准文本框的目标相似文本框框住;所述方框为能框住所述基准文本框和所述基准文本框的目标相似文本框的最小方框;所述方框的倾斜角度与所述基准文本框的倾斜角度相同;
将每个所述方框对应的区域分别剪切出来,得到与所述目标区域相关的基准区域。
7.一种设备,其特征在于,包括:
处理器,以及与所述处理器相连接的存储器;
所述存储器用于存储计算机程序,所述计算机程序至少用于执行权利要求1-5任一项所述的图像中剪切快递面单区域的方法;
所述处理器用于调用并执行所述存储器中的所述计算机程序。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的图像中剪切快递面单区域的方法中各个步骤。
CN202010202544.1A 2020-03-20 2020-03-20 图像中剪切快递面单区域的方法、装置、设备及存储介质 Active CN111368822B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010202544.1A CN111368822B (zh) 2020-03-20 2020-03-20 图像中剪切快递面单区域的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010202544.1A CN111368822B (zh) 2020-03-20 2020-03-20 图像中剪切快递面单区域的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN111368822A CN111368822A (zh) 2020-07-03
CN111368822B true CN111368822B (zh) 2023-09-19

Family

ID=71206901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010202544.1A Active CN111368822B (zh) 2020-03-20 2020-03-20 图像中剪切快递面单区域的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN111368822B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017162069A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060164682A1 (en) * 2005-01-25 2006-07-27 Dspv, Ltd. System and method of improving the legibility and applicability of document pictures using form based image enhancement

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017162069A1 (zh) * 2016-03-25 2017-09-28 阿里巴巴集团控股有限公司 一种图像文本的识别方法和装置
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
易尧华 ; 何婧婧 ; 卢利琼 ; 汤梓伟 ; .顾及目标关联的自然场景文本检测.中国图象图形学报.2020,(01),全文. *

Also Published As

Publication number Publication date
CN111368822A (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
CN109146892B (zh) 一种基于美学的图像裁剪方法及装置
CN112016614B (zh) 光学图像目标检测模型的构建方法、目标检测方法及装置
US20200151444A1 (en) Table Layout Determination Using A Machine Learning System
US5987171A (en) Page analysis system
CN108121997A (zh) 使用机器学习模型的图像数据中的对象分类
JP6951905B2 (ja) 手書きテキスト画像に対する行及び単語切り出し方法
US8184928B2 (en) Combining seam carving an image resizing
CN108122239A (zh) 使用深度分割的图像数据中的对象检测
WO2022227770A1 (zh) 目标对象检测模型的训练方法、目标对象检测方法和设备
CN111738133A (zh) 模型训练方法、目标检测方法、装置、电子设备及可读存储介质
CN111047630A (zh) 神经网络和基于神经网络的目标检测及深度预测方法
CN111612004A (zh) 一种基于语义内容的图像裁剪方法及装置
CN115223172A (zh) 文本提取方法、装置及设备
CN109919156B (zh) 图像裁剪预测模型的训练方法、介质、装置及计算设备
CN111178154A (zh) 表格边框预测模型生成方法、装置及表格定位方法、装置
CN111368822B (zh) 图像中剪切快递面单区域的方法、装置、设备及存储介质
JP2007164513A (ja) 画像処理装置
CN114511862B (zh) 表格识别方法、装置及电子设备
EP1074953A2 (en) Image retrieval apparatus and method
KR20120075626A (ko) 웹 기반 서비스에서의 전자해도 처리 장치 및 방법
CN116259064A (zh) 表格结构识别方法、表格结构识别模型的训练方法及装置
CN114399497A (zh) 文本图像质量检测方法、装置、计算机设备及存储介质
US20220245820A1 (en) Heuristics-based detection of image space suitable for overlaying media content
US11995144B2 (en) Webpage illustration processing method, system, device and storage medium
CN117094994B (zh) 滑窗参数确定方法、图像识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant