CN113470053B - 一种合成图分割方法、装置和电子设备 - Google Patents

一种合成图分割方法、装置和电子设备 Download PDF

Info

Publication number
CN113470053B
CN113470053B CN202010238572.9A CN202010238572A CN113470053B CN 113470053 B CN113470053 B CN 113470053B CN 202010238572 A CN202010238572 A CN 202010238572A CN 113470053 B CN113470053 B CN 113470053B
Authority
CN
China
Prior art keywords
boundary
axis direction
pixels
target
target axis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010238572.9A
Other languages
English (en)
Other versions
CN113470053A (zh
Inventor
方吉庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN202010238572.9A priority Critical patent/CN113470053B/zh
Publication of CN113470053A publication Critical patent/CN113470053A/zh
Application granted granted Critical
Publication of CN113470053B publication Critical patent/CN113470053B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种合成图分割方法、装置以及电子设备。方法包括:针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,目标轴方向包括X轴方向和/或Y轴方向;根据目标轴梯度计算结果确认目标轴梯度计算结果大于等于目标轴方向的梯度阈值的目标像素,基于目标像素识别目标轴方向的边界,其中:识别Y轴方向的纵向贯通边界,和/或,识别X轴方向的横向贯通边界;根据目标轴方向的边界对合成图进行分割。相较于现有技术,根据本申请一实施例的方法简化了合成图分割的操作流程,提高了合成图分割的效率。

Description

一种合成图分割方法、装置和电子设备
技术领域
本申请涉及图像处理领域,特别涉及一种合成图分割方法、装置和电子设备。
背景技术
随着图像处理技术的不断发展,在对采集到的图像进行展示前,通常会对图像进行处理。
一方面,在实际应用场景中,图像合成是一种非常常见的图像处理方案。图像合成是将多张图像按照预设排列规则进行排列,组合构成一张全新的图像,从而使得在一张图像中展示多张图像的内容。例如,在交通领域,通常会将同一车辆不同角度、不同时间/地点的监控图像合成为一张图像以便于展示;又例如,在监控领域,通常会将不同监控探头的监控图像合成为一张图像一边在同一屏幕上同时展示更多的内容。
另一方面,与图像合成相对应的图像处理方案则是对合成图像进行分割,将合成图像分割为多个子图像,将其恢复为图像合成前的状态。例如,将车辆的合成图进行分割,从而针对车辆的单张图像进行分析识别,获取车辆细节。
在现有技术中,由于在进行图像合成时,可以采用的图像排列规则多种多样,因此,在对合成图像进行分割时,需要确定合成图的排列组合模式、子图像的分辨率等参数,以避免图像分割错误。如果合成图并未标记其排列组合模式、子图像的分辨率等参数,则需要人工对合成图进行识别分析,手动输入参数。这大大增加了工作人员的工作量,降低了工作效率。
发明内容
本申请提供了一种合成图分割方法、装置和电子设备,本申请还提供一种计算机可读存储介质,以提供一种分割合成图的方式,简化合成图分割流程,降低工作量,提高工作效率。
本申请实施例采用下述技术方案:
第一方面,本申请提供了一种合成图分割方法,包括:
针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,所述目标轴方向包括X轴方向和/或Y轴方向;
根据所述目标轴梯度计算结果确认所述目标轴梯度计算结果大于等于所述目标轴方向的梯度阈值的目标像素,基于所述目标像素识别所述目标轴方向的边界,其中:
识别Y轴方向的纵向贯通边界,其中,当所述合成图的目标像素列中所有的像素均为第一像素时,将所述目标像素列识别为一条纵向贯通边界,所述第一像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;
和/或,
识别X轴方向的横向贯通边界,其中,当所述合成图的目标像素行中所有的像素均为第二像素时,将所述目标像素行识别为一条横向贯通边界,所述第二像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;
根据所述目标轴方向的边界对所述合成图进行分割。
在上述第一方面的方法流程的一种可行的实现方式中:
识别Y轴方向的纵向贯通边界,其中,统计所述合成图每列像素中所述第一像素的个数,将所述第一像素的个数最高的一列或多列像素识别为所述纵向贯通边界;
基于所述目标像素识别所述目标轴方向的边界,还包括:
基于所述纵向贯通边界将所述合成图划分为多个纵向区域;
针对每个所述纵向区域,统计所述纵向区域每行像素中所述第二像素的个数,将所述第二像素的个数最高的一行或多行像素识别为横向边界。
在上述第一方面的方法流程的一种可行的实现方式中:
识别X轴方向的横向贯通边界,其中,统计所述合成图每行像素中所述第二像素的个数,将所述第二像素的个数最高的一行或多行像素识别为所述横向贯通边界;
基于所述目标像素识别所述目标轴方向的边界,还包括:
基于所述横向贯通边界将所述合成图划分为多个横向区域;
针对每个所述横向区域,统计所述横向区域每列像素中所述第一像素的个数,将所述第一像素的个数最高的一列或多列像素识别为纵向边界。
在上述第一方面的方法流程的一种可行的实现方式中,基于所述目标像素识别所述目标轴方向的边界,还包括:
基于识别出的纵向贯通边界和/或横向贯通边界将所述合成图划分为多个子区域,针对每个子区域进行边界识别,其中:
将所述子区域中所有像素均为所述第一像素的像素列识别为一条纵向边界;
将所述子区域中所有像素均为所述第二像素的像素行识别为一条横向边界;
基于识别出的纵向边界和/或横向边界进行进一步的子区域划分以及边界识别,迭代执行子区域划分以及边界识别,直到无法识别出新的纵向边界以及横向边界。
在上述第一方面的方法流程的一种可行的实现方式中,基于所述目标像素识别所述目标轴方向的边界,还包括:
当所述合成图中所述目标轴方向的像素集合满足边界判定条件时,将所述像素集合识别为所述目标轴方向的边界,所述像素集合为所述目标轴方向的一列像素或一行像素,所述边界判定条件包括以下至少之一:
所述像素集合中的所述目标像素的个数大于等于所述目标轴方向的像素数阈值;
所述像素集合在所述合成图中的位置与所述合成图的等分线位置匹配;
所述像素集合与所述像素集合两侧第一预设范围内相同目标轴方向的其他像素集合中所述目标像素的个数差值大于等于预设的像素个数差值阈值。
在上述第一方面的方法流程的一种可行的实现方式中,根据所述目标轴方向的边界对所述合成图进行分割,包括:
根据相邻的所述目标轴方向的边界之间、所述目标轴方向的边界与所述合成图边缘之间的位置关系识别所述合成图中的字符区域;
基于预设的字符区域处理策略,在根据所述目标轴方向的边界对所述合成图进行分割的过程中,删除所述字符区域,或者,保留所述字符区域。
在上述第一方面的方法流程的一种可行的实现方式中,所述根据所述目标轴方向的边界对所述合成图进行分割之前,还包括:
当所述字符区域处理策略为保留所述字符区域时,确认所述字符区域的附加方式;
根据所述字符区域的附加方式以及所述字符区域的识别结果,确定所述字符区域与其对应的子图像间的分界线;
从所述目标轴方向的边界中删除所述字符区域与其对应的子图像间的分界线。
在上述第一方面的方法流程的一种可行的实现方式中,根据相邻的所述目标轴方向的边界之间、所述目标轴方向的边界与所述合成图边缘之间的位置关系识别所述合成图中的字符区域,包括:
判断相邻的两条所述目标轴方向的边界的间距是否小于等于所述目标轴方向的字符区域阈值,当所述相邻的两条所述目标轴方向的边界的间距小于等于所述目标轴方向的字符区域阈值时,所述相邻的两条所述目标轴方向的边界之间的区域为字符区域;
判断单条所述目标轴方向的边界与所述合成图边缘的间距是否小于等于所述目标轴方向的字符区域阈值,当所述单条所述目标轴方向的边界与所述合成图边缘的间距小于等于所述目标轴方向的字符区域阈值时,所述单条所述目标轴方向的边界与所述合成图边缘之间的区域为字符区域。
第二方面,本申请实施例提供了一种合成图分割装置,包括:
梯度计算模块,其用于针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,所述目标轴方向包括X轴方向和/或Y轴方向;
边界识别模块,其用于根据所述目标轴梯度计算结果确认所述目标轴梯度计算结果大于等于所述目标轴方向的梯度阈值的目标像素,基于所述目标像素识别所述目标轴方向的边界,其中:
识别Y轴方向的纵向贯通边界,其中,当所述合成图的目标像素列中所有的像素均为第一像素时,将所述目标像素列识别为一条纵向贯通边界,所述第一像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;
和/或,
识别X轴方向的横向贯通边界,其中,当所述合成图的目标像素行中所有的像素均为第二像素时,将所述目标像素行识别为一条横向贯通边界,所述第二像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;
图像分割模块,其用于根据所述目标轴方向的边界对所述合成图进行分割。
第三方面,本申请实施例提供了一种电子设备,所述电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述电子设备执行本申请实施例所述的方法步骤。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行本申请实施例所述的方法。
本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:根据本申请一实施例的方法,可以根据合成图自身的图像信息对合成图进行分割;相较于现有技术,根据本申请一实施例的方法,不需要获取合成图的排列方式以及合成图中子图的分辨率信息就可以实现对合成图分割的分割操作,从而大大简化了合成图分割的操作流程,降低了合成图分割的工作量,提高了合成图分割的效率。
附图说明
图1所示为根据本申请合成图分割方法一实施例的流程图;
图2所示为根据本申请合成图分割方法一实施例的流程图;
图3所示为根据本申请合成图分割方法一实施例的合成图布局示意图;
图4所示为根据本申请合成图分割方法一实施例的合成图布局示意图;
图5所示为根据本申请合成图分割方法一实施例的流程图;
图6所示为根据本申请合成图分割方法一实施例的合成图布局示意图;
图7所示为根据本申请合成图分割方法一实施例的合成图布局示意图;
图8所示为根据本申请合成图分割方法一实施例的流程图;
图9为根据本申请一实施例的应用场景的合成图示例;
图10为根据本申请一实施例的应用场景的梯度图示例;
图11为根据本申请一实施例的应用场景的垂直方向梯度投影直方图示例;
图12为根据本申请一实施例的应用场景的梯度图示例;
图13为根据本申请一实施例的应用场景的水平方向梯度投影直方图示例;
图14为根据本申请一实施例的应用场景的合成图示例;
图15为根据本申请一实施例的应用场景的合成图布局示例;
图16为根据本申请一实施例的应用场景的合成图示例;
图17为根据本申请一实施例的应用场景的合成图布局示例;
图18为根据本申请一实施例的应用场景的合成图分割结果示例;
图19为根据本申请一实施例的应用场景的合成图分割结果示例;
图20所示为根据本申请合成图分割装置一实施例的结构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释,而非旨在限定本申请。
针对合成图分割过程中存在的操作繁琐、工作量大的问题,本申请一实施例提供了一种合成图分割方法。为了提出本申请实施例的方法,发明人首先分析合成图分割的操作过程。
合成图分割操作的难点在于获取合成图的排列组合模式、子图像的分辨率等参数,因为很多情况下,合成图数据只包含图像数据,并未携带上述参数,此时就需要进行人工识别,这就大大增加了操作流程的繁琐程度,增加了工作人员的工作量。那么,如果不依靠合成图的排列组合模式、子图像的分辨率等参数,仅依靠合成图自身的图像数据就可以实现分割操作,那就会大大降低人工操作的工作量,从而降低合成图分割操作流程的繁琐程度。
由于合成图是由多个子图拼合而成,因此,在合成图中,相接的子图之间存在图像的边界,在子图像边缘,像素值会发生显著的变化。进一步的,由于子图为矩形,那么,子图之间的边界为水平或竖直的一段线段。并且,纵向边界的长度大于等于最小的子图的高度,横向边界的长度大于等于最小的子图的宽度。
基于上述分析,如果从像素值变化程度、是否构成水平/竖直线段、线段长度三方面对合成图上的像素进行筛选,就可以筛选出构成子图之间边界的像素。因此,在本申请一实施例中,针对某一合成图,在一列像素中,相较于相邻列的像素,当连续n个像素的像素值发生显著变化时,这连续的n个像素就构成一条子图间的纵向边界,n大于等于图像高度阈值(最小的子图的高度);在一行像素中,相较于相邻行的像素,当连续m个像素的像素值发生显著变化时,这连续的m个像素就构成一条子图间的横向边界,m大于等于图像宽度阈值(最小的子图的宽度)。
进一步的,梯度是用于描述图像信息的一个参数。将图像看成二维离散函数,图像的梯度其实就是这个二维离散函数的求导。具体的,图像函数f(x,y)在点(x,y)的梯度是一个具有大小和方向的矢量,设Gx和Gy分别表示X轴方向和Y轴方向的梯度,梯度的矢量可以表示为:
由于像素值的变化可以用像素值的导数来体现,因此,图像的梯度值就可以体现像素值的变化大小。因此,在本申请一实施例中,当某个像素的X轴梯度计算结果大于等于横向梯度阈值时,其就可能从属于一条纵向边界;当某个像素的Y轴梯度计算结果大于等于纵向梯度阈值时,其就可能从属于一条横向边界。
进一步的,在一像素列中,当存在连续n个像素的X轴梯度计算结果均大于等于横向梯度阈值时,这连续的n个像素就构成一条纵向边界;在一行像素中,当存在连续m个像素的Y轴梯度计算结果均大于等于纵向梯度阈值时,这连续的m个像素就构成一条横向边界。
进一步的,虽然梯度值可以描述像素值的变化,但是其无法用于判断像素间的连续性。在实际应用场景中,考虑到一条贯穿合成图的纵向边界或横向边界必然包含一像素列或一像素行上的所有像素,此时不需要考虑像素是否连续。因此,在本申请一实施例中,确认X轴梯度计算结果大于等于横向梯度阈值的第一像素,当合成图的第一像素列中所有的像素均为第一像素时,将第一像素列识别为一条纵向贯穿边界;确认Y轴梯度计算结果大于等于纵向梯度阈值的第二像素,当合成图的第一像素行中所有的像素均为第二像素时,将第一像素行识别为一条横向贯穿边界。
进一步的,在本申请一实施例中,根据具体的应用需求和/或合成图图像参数设定横向/纵向梯度阈值的具体大小。在本申请一实施例中,横向/纵向梯度阈值的具体大小不做明确限定。在一应用场景中,针对X轴梯度计算结果的横向梯度阈值设置为X轴平均梯度值的2倍,和/或,针对Y轴梯度计算结果的纵向梯度阈值设置为Y轴平均梯度值的2倍。
以下结合附图,详细说明本申请各实施例提供的技术方案。
图1所示为根据本申请合成图分割方法一实施例的流程图。在本申请一实施例中,如图1所示,合成图分割方法包括:
步骤110,针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,目标轴方向包括X轴方向和/或Y轴方向;即,目标轴方向的梯度计算包括X轴方向梯度计算和/或Y轴方向梯度计算,目标轴梯度计算结果包括X轴梯度计算结果和/或Y轴梯度计算结果;
步骤120,根据目标轴梯度计算结果确认目标轴梯度计算结果大于等于目标轴方向的梯度阈值的目标像素,基于目标像素识别目标轴方向的边界;具体的,目标轴方向的梯度阈值包括横向梯度阈值和/或纵向梯度阈值,目标像素包括X轴梯度计算结果大于等于横向梯度阈值的第一像素和/或Y轴梯度计算结果大于等于纵向梯度阈值的第二像素,目标轴方向的边界包括纵向边界和/或横向边界;
步骤130,根据目标轴方向的边界对合成图进行分割,即,根据纵向边界和/或所述横向边界对合成图进行分割。
具体的,步骤120包括:
识别Y轴方向的纵向贯通边界,其中,当合成图的目标像素列中所有的像素均为第一像素时,将目标像素列识别为一条纵向贯通边界,第一像素为目标像素中的一种,用于表示目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;即,当合成图的第一像素列中所有的像素均为第一像素时,将第一像素列识别为一条纵向贯通边界;
和/或,
识别X轴方向的横向贯通边界,其中,当合成图的目标像素行中所有的像素均为第二像素时,将目标像素行识别为一条横向贯通边界,第二像素为所述目标像素中的一种,用于表示目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;即,当合成图的第一像素行中所有的像素均为第二像素时,将第一像素行识别为一条横向贯通边界;
具体的,在本申请一实施例中,根据具体的应用场景需求选择上述步骤中所包含的具体内容。例如,在一应用场景中,可以确认合成图不包含横向边界,那么,合成图分割方法步骤中,就不需要执行Y轴方向梯度计算、确认第二像素以及识别横向边界。在一应用场景中,可以确认合成图不包含纵向边界,那么,合成图分割方法步骤中,就不需要执行X轴方向梯度计算、确认第一像素以及识别纵向边界。
根据本申请一实施例的方法,可以根据合成图自身的图像信息对合成图进行分割;相较于现有技术,根据本申请一实施例的方法,不需要获取合成图的排列方式以及合成图中子图的分辨率信息就可以实现对合成图分割的分割操作,从而大大简化了合成图分割的操作流程,降低了合成图分割的工作量,提高了合成图分割的效率。
进一步的,针对纵向贯通边界以及横向贯通边界,由于纵向贯通边界/横向贯通边界所包含的第一像素/第二像素的数量为该列/行的像素总数。因此,在本申请一实施例中,识别纵向贯通边界,其中,统计合成图每列像素中第一像素的个数,将第一像素的个数最高的一列或多列像素识别为纵向贯通边界。在本申请一实施例中,识别横向贯通边界,其中,统计合成图每行像素中第二像素的个数,将第二像素的个数最高的一行或多行像素识别为横向贯通边界。
具体的,在本申请一实施例中,基于索贝尔(Sobel)算子进行梯度计算。Sobel算子是一个离散微分算子(discrete differentiation operator)。它结合了高斯平滑和微分求导,用来计算图像灰度函数的近似梯度。
具体的,在本申请一实施例中,进行X轴方向梯度计算包括水平变化求导:将图像I与一个奇数大小的内核进行卷积,得到梯度图像Gx,如下所示:
进行Y轴方向梯度计算包括垂直变化求导:将图像I与一个奇数大小的内核进行卷积,得到梯度图像Gy,如下所示:
通过卷积核和/>分别得到图像I在X方向的梯度计算结果和Y方向的梯度计算结果Gx以及Gy
以及/>为Sobel算子。
进一步的,在本申请一实施例中,对X轴方向梯度计算、Y轴方向梯度计算、识别纵向边界、识别横向边界以及对合成图进行分割的执行先后顺序不做明确限制。技术人员可以采用任何可以实现本申请实施例所述技术效果的执行流程。
例如,在本申请一实施例中,分别进行X轴方向梯度计算、Y轴方向梯度计算(可以同步执行、先后执行或交叉执行),计算完毕后分别识别纵向边界、识别横向边界(可以同步执行、先后执行或交叉执行),当纵向边界以及横向边界均已识别后再进行图像分割。
又例如,在本申请一实施例中,首先进行X轴方向梯度计算并识别纵向边界,然后进行Y轴方向梯度计算,根据纵向边界以及Y轴梯度计算结果识别横向边界,根据纵向边界以及横向边界进行图像分割;或者,首先进行Y轴方向梯度计算并识别横向边界,然后进行X轴方向梯度计算,根据横向边界以及X轴梯度计算结果识别纵向边界,根据纵向边界以及横向边界进行图像分割。
具体的,图2所示为根据本申请合成图分割方法一实施例的流程图。在本申请一实施例中,如图2所示,合成图分割方法包括:
步骤210,对合成图进行X轴方向梯度计算,获取X轴梯度计算结果;
步骤211,根据X轴梯度计算结果识别纵向边界;
步骤220,对合成图进行Y轴方向梯度计算,获取Y轴梯度计算结果;
步骤221,根据Y轴梯度计算结果识别横向边界;
步骤230,根据纵向边界以及横向边界对合成图进行分割。
进一步的,在实际应用场景中,合成图的边界可能并不完全都是贯通边界。因此,仅仅识别贯通边界无法实现合成图的完全分割。因此,在本申请一实施例中,在识别贯通边界的基础上,还识别其他类型的边界。
具体的,在实际应用场景中,合成图布局模式包括横向排列模式,该模式下合成图被分为多行,子图在每行中排列。例如,图3、图4所示为根据本申请合成图分割方法一实施例的合成图布局示意图。如图3所示,合成图300由子图301、302、303、304构成,其中,子图301、302、303排列成一行,子图304独占一行。又例如,如图4所示,合成图400由子图401、402、403、404、405、406构成,其中,子图401、402、403排列成一行,子图404独占一行,子图405、406排列成一行。
在横向排列模式中,合成图必然存在横向贯通边界。并且,当基于横向贯通边界分割合成图生成多个横向区域后,横向区域上不存在横向边界,并且,横向区域被纵向边界贯穿。因此,针对横向排列模式,在本申请一实施例中,首先识别横向贯通边界,根据横向贯通边界划分合成图,然后针对横向边界的划分结果识别纵向边界。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
识别横向贯通边界,其中,统计合成图每行像素中第二像素的个数,将第二像素的个数最高的一行或多行像素识别为横向贯通边界;
基于横向贯通边界将所述合成图划分为多个横向区域;
针对每个横向区域,统计横向区域每列像素中第一像素的个数,将第一像素的个数最高的一列或多列像素识别为纵向边界。
进一步的,在本申请一实施例中,将图像分割以及边界识别的过程交叉执行。具体的,首先进行Y轴方向梯度计算并确定横向贯通边界,根据横向贯通边界划分合成图,然后针对横向边界的划分结果进行X轴方向梯度计算并确定纵向边界,根据纵向边界进行进一步的图像分割。
具体的,图5所示为根据本申请合成图分割方法一实施例的流程图。在本申请一实施例中,如图5所示,合成图分割方法包括:
步骤510,对合成图进行Y轴方向梯度计算,获取合成图的Y轴梯度计算结果;
步骤511,根据合成图的Y轴梯度计算结果识别合成图的横向贯通边界;
步骤512,根据合成图的横向贯通边界将合成图分割为多个横向子图;
步骤520,对横向子图进行X轴方向梯度计算,获取横向子图的X轴梯度计算结果;
步骤521,根据横向子图的X轴梯度计算结果识别横向子图的纵向边界;
步骤522,根据横向子图的纵向边界分割横向子图。
进一步的,在实际应用场景中,合成图布局模式还包括纵向排列模式,该模式下合成图被分为多列,子图在每列中排列。例如,图6、图7所示为根据本申请合成图分割方法一实施例的合成图布局示意图。如图6所示,合成图600由子图601、602、603、604构成,其中,子图601、602、603排列成一列,子图604独占一列。又例如,如图7所示,合成图700由子图701、702、703、704、705、706构成,其中,子图701、702、703排列成一列,子图704独占一列,子图705、706排列成一列。
在纵向排列模式中,合成图必然存在纵向贯通边界。并且,当基于纵向贯通边界分割合成图生成多个纵向区域后,纵向区域上不存在纵向边界,并且,纵向区域被横向边界贯穿。因此,针对纵向排列模式,在本申请一实施例中,首先识别纵向贯通边界,根据纵向贯通边界划分合成图,然后针对纵向边界的划分结果识别横向边界。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
识别纵向贯通边界,其中,统计合成图每列像素中第一像素的个数,将第一像素的个数最高的一列或多列像素识别为纵向贯通边界;
基于纵向贯通边界将合成图划分为多个纵向区域;
针对每个纵向区域,统计纵向区域每行像素中第二像素的个数,将第二像素的个数最高的一行或多行像素识别为横向边界。
进一步的,在本申请一实施例中,将图像分割以及边界识别的过程交叉执行。具体的,,首先进行X轴方向梯度计算并识别纵向贯通边界,根据纵向贯通边界分割合成图,然后针对纵向贯通边界的分割结果进行Y轴方向梯度计算,并确定横向边界,根据横向边界进行进一步的图像分割。
具体的,图8所示为根据本申请合成图分割方法一实施例的流程图。在本申请一实施例中,如图8所示,合成图分割方法包括:
步骤810,对合成图进行X轴方向梯度计算,获取合成图的X轴梯度计算结果;
步骤811,根据合成图的X轴梯度计算结果识别合成图的纵向贯通边界;
步骤812,根据合成图的纵向贯通边界将合成图分割为多个纵向子图;
步骤820,对纵向子图进行Y轴方向梯度计算,获取纵向子图的Y轴梯度计算结果;
步骤821,根据纵向子图的Y轴梯度计算结果结果确定纵向子图的横向边界;
步骤822,根据纵向子图的横向边界分割纵向子图。
进一步的,假设在一应用场景中,x和y分别为针对合成图中像素点的横坐标(列编号)以及纵坐标(行编号),x的取值范围为[0,w),y的取值范围为[0,h);坐标(x,y)表示合成图上的一个像素点。设定横向梯度阈值以及纵向梯度阈值均为threshold。
在本申请一实施例中,设定以下函数关系:
式3中,Gy(x,y)表示在合成图的(x,y)坐标处Y轴方向的梯度值。
根据式3的函数关系,的值即为该列中大于等于横向梯度阈值的梯度值个数。
进一步的,投影直方图是将一个变量的不同等级的相对频数用矩形块标绘的图表.为了便于分析,在本申请一实施例中,将每列的累加结果投影到直方图上获取垂直方向上的梯度投影直方图,直方图中最高的线便是合成图的纵向边界。
进一步的,在本申请一实施例中,设定以下函数关系:
式4中,Gx(x,y)表示在合成图的(x,y)坐标处X轴方向的梯度值。
根据式4的函数关系,的值即为该行中大于等于边界梯度阈值的梯度值个数。
进一步的,在本申请一实施例中,将每行的累加结果投影到直方图上获取水平方向上的梯度投影直方图,直方图中最宽的线便是合成图的横向边界。
图9为根据本申请一实施例的应用场景的合成图示例。图9所示的合成图既为纵向排列模式也为横向排列模式。
图10为根据本申请一实施例的应用场景的梯度图示例。对图9所示合成图进行X轴方向梯度计算可以获得如图10所示梯度图。
图11为根据本申请一实施例的应用场景的垂直方向梯度投影直方图示例。对图10所示梯度图上每列大于等于边界梯度阈值的梯度值个数进行统计并进行直方图投影可以获得如图11所示直方图。图11所示直方图中最高的线段位置即对应图9所示的合成图中间的纵向边界。
图12为根据本申请一实施例的应用场景的梯度图示例。对图9所示合成图进行Y轴方向梯度计算可以获得如图12所示梯度图。
图13为根据本申请一实施例的应用场景的水平方向梯度投影直方图示例。对图12所示梯度图上每行大于等于边界梯度阈值的梯度值个数进行统计并进行直方图投影可以获得如图13所示直方图。图13所示直方图中最宽的线段位置即对应图9所示的合成图中间的横向边界。
进一步的,在本申请一实施例中,采用迭代拆分识别的方式识别边界。具体的,在识别合成图的贯通边界之后,基于贯通边界进行子区域划分,针对子区域再次进行贯通边界的识别,不断迭代子区域划分以及针对子区域的贯通边界识别,直到无法识别出新的边界。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
识别纵向贯通边界和/或横向贯通边界;
基于识别出的纵向贯通边界和/或横向贯通边界将所述合成图划分为多个子区域,针对每个子区域进行边界识别,其中:
将子区域中所有像素均为第一像素的像素列识别为一条纵向边界;
将子区域中所有像素均为第二像素的像素行识别为一条横向边界;
迭代执行子区域的划分以及边界识别,直到无法识别出新的纵向边界以及横向边界。
进一步的,在本申请一实施例中,根据边界的特征属性识别边界。具体的,边界的特征属性包括边界长度、和/或边界位置、和/或边界线与附近像素线对比情况。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
当合成图中目标轴方向的像素集合满足边界判定条件时,将像素集合识别为目标轴方向的边界,像素集合为目标轴方向的一列像素或一行像素,边界判定条件包括:
像素集合中的目标像素的个数大于等于目标轴方向的像素数阈值。
具体的,在本申请一实施例中,目标轴方向的像素数阈值包括纵向像素数阈值和/或横向像素数阈值。根据合成图的具体情况设定纵向像素数阈值/横向像素数阈值的具体数值。在本申请一实施例中,对纵向像素数阈值/横向像素数阈值的具体数值不作详细限定。例如,在一应用场景中,纵向像素数阈值设置为合成图列像素数的1/3,横向像素数阈值设置为合成图行像素的1/3。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
当合成图中目标轴方向的像素集合满足边界判定条件时,将像素集合识别为目标轴方向的边界,像素集合为目标轴方向的一列像素或一行像素,边界判定条件包括:
像素集合(像素行或者像素列)在合成图中的位置与合成图的等分线位置匹配。
例如,当像素列出现在合成图横向坐标1/2(合成图垂直2等分)、1/3和2/3时(合成图垂直3等分)、1/4,1/2和3/4处(合成图垂直4等分)时,判定像素列在合成图中的位置与合成图的等分线位置匹配。
具体的,在步骤120的一种实现方式中,基于目标像素识别目标轴方向的边界的过程包括:
当合成图中目标轴方向的像素集合满足边界判定条件时,将像素集合识别为目标轴方向的边界,像素集合为目标轴方向的一列像素或一行像素,边界判定条件包括:
像素集合与像素集合两侧第一预设范围内相同目标轴方向的其他像素集合中目标像素的个数差值大于等于预设的像素个数差值阈值;即,像素行与该像素行两侧第一预设范围内的其他像素行中目标像素的个数差值大于等于预设的像素个数差值阈值,或者,像素列与该像素列两侧第一预设范围内的其他像素列中目标像素的个数差值大于等于预设的像素个数差值阈值。
具体的,在本申请一实施例中,根据合成图的具体情况设定第一预设范围以及像素个数差值阈值的具体数值。在本申请一实施例中,对第一预设范围以及像素个数差值阈值的具体数值不作具体限定。例如,在一应用场景中,第一预设范围设置为15个像素,像素个数差值阈值设置为像素列/像素行像素数的1/4。
进一步,在本申请一实施例中,边界判定条件可以为上述边界判定条件中的一种或多种的组合。在本申请另一实施例中,边界判定条件还可以包含上述边界判定条件以外的其他边界判定条件。
进一步的,在实际应用场景中,合成图中的某些子图属于其他子图的附属描述图。例如,在一应用场景中,在多监控子画面合成的合成图中,每个监控子画面下方附加有一用于描述上方监控子画面拍摄时间和/或拍摄设备标识的条状子图(字符区域)。
图14为根据本申请一实施例的应用场景的合成图示例。图15为根据本申请一实施例的应用场景的合成图布局示例。整理图14所示合成图的布局,可以得到如图15所示的布局示意图。
如图15所示,合成图包含1401~1406六个子图,合成图还包含1411~1414四个子图,1411~1414四个子图分别为1402、1403、1404、1405的附属描述图。即,1411~1414四个子图为合成图的字符区域。
图16为根据本申请一实施例的应用场景的合成图示例。图17为根据本申请一实施例的应用场景的合成图布局示例。整理图16所示合成图的布局,可以得到如图17所示的布局示意图。如图17所示,合成图包含1601~1604四个子图,合成图还包含1611~1614四个子图,1611~1614四个子图分别为1601~1604的附属描述图。即,1611~1614四个子图为合成图的字符区域。
在实际应用场景中,基于不同的应用需求,对字符区域的分割要求也不同。例如,在一应用场景中,合成图分割后的处理操作不涉及到字符区域,在图像分割后,需要确保输出的图像中不包含字符区域;又例如,在一应用场景中,合成图分割后的处理操作涉及到字符区域,并且,在图像分割时,需要将字符区域与其附属的子图视为同一张图像。
在本申请一实施例中,当合成图包含字符区域时,基于预设的字符区域处理策略进行合成图的分割。具体的,在本申请一实施例中,字符区域处理策略由实际应用场景的应用需求而定。
具体的,在步骤120的一种实现方式中,根据目标轴方向的边界对合成图进行分割,包括:
根据相邻的目标轴方向的边界之间、目标轴方向的边界与合成图边缘之间的位置关系识别合成图中的字符区域;
基于预设的字符区域处理策略,在根据目标轴方向的边界对合成图进行分割的过程中,删除字符区域,或者,保留字符区域。
具体的,在识别字符区域的过程中,根据相邻的纵向边界之间、纵向边界与合成图纵向边缘之间的位置关系识别合成图中的字符区域,和/或,根据相邻的横向边界之间、横向边界与合成图横向边缘之间的位置关系识别合成图中的字符区域;
进一步的,考虑到在实际应用场景中,在保留字符区域时,需要将字符区域与其附属的子图视为同一张图像。具体的,在步骤120的一种实现方式中,在根据目标轴方向的边界对合成图进行分割之前,还执行下述步骤:
当字符区域处理策略为保留字符区域时,确认字符区域的附加方式(例如,附加在子图上/下侧,和/或,左/右侧)(例如,在一应用场景中,字符区域附加在子图下方);
根据字符区域的附加方式以及字符区域的识别结果,确定字符区域与其对应的子图像间的分界线;
从目标轴方向的边界中删除字符区域与其对应的子图像间的分界线。
在上述步骤执行之后,根据已删除分界线的边界对合成图进行分割。
进一步的,考虑到字符区域与其他子图的显著差别在于字符区域的面积远远小于其他子图,因此,在本申请一实施例中,根据相邻的目标轴方向的边界之间、目标轴方向的边界与合成图边缘之间的位置关系识别合成图中的字符区域,包括:
判断相邻的两条目标轴方向的边界的间距是否小于等于目标轴方向的字符区域阈值,当相邻的两条目标轴方向的边界的间距小于等于目标轴方向的字符区域阈值时,相邻的两条目标轴方向的边界之间的区域为字符区域;
判断单条目标轴方向的边界与合成图边缘的间距是否小于等于目标轴方向的字符区域阈值,当单条所述目标轴方向的边界与合成图边缘的间距小于等于目标轴方向的字符区域阈值时,单条所述目标轴方向的边界与合成图边缘之间的区域为字符区域。
具体的,根据相邻的纵向边界之间、纵向边界与合成图纵向边缘之间的位置关系识别合成图中的字符区域,包括:
判断相邻的两条纵向边界的间距是否小于等于字符区域宽度阈值,当相邻的两条纵向边界的间距小于等于字符区域宽度阈值时,相邻的两条纵向边界间的区域为字符区域;
判断单条纵向边界与合成图左/右边缘的间距是否小于等于字符区域宽度阈值,当单条纵向边界与所述合成图左/右边缘的间距小于等于字符区域宽度阈值时,单条纵向边界与合成图左/右边缘间的区域为字符区域。
在本申请一实施例中,根据相邻的横向边界之间、横向边界与合成图横向边缘之间的的位置关系识别合成图中的字符区域,包括:
判断相邻的两条横向边界的间距是否小于等于字符区域高度阈值,当相邻的两条横向边界的间距小于等于字符区域高度阈值时,相邻的两条横向边界间的区域为字符区域;
判断单条横向边界与合成图上/下边缘的间距是否小于等于字符区域高度阈值,当单条横向边界与合成图上/下边缘的间距小于等于字符区域高度阈值时,单条横向边界与合成图上/下边缘间的区域为字符区域。
在本申请一实施例中,根据实际应用场景设定字符区域宽度阈值以及字符区域高度阈值。在本申请一实施例中,对字符区域宽度阈值以及字符区域高度阈值的具体取值不做限定。例如,在一应用场景中,将字符区域宽度阈值和/或字符区域高度阈值设定为两个字符高度。在一应用场景中,将字符区域宽度阈值和/或字符区域高度阈值设定为60个像素。
进一步的,在本申请一实施例中,考虑到字符区域的干扰,边界判定条件中的,像素列/像素行在合成图中的位置与合成图的等分线位置匹配,指的是像素列/像素行在合成图中的位置与合成图的等分线间的距离小于等于预设距离阈值。具体的,在本申请一实施例中,根据字符区域的宽度和/或高度设定预设距离阈值的数值。例如,考虑到字符的宽度最大为60个像素,因此将预设距离阈值设置为70个像素。
可以理解的是,上述实施例中的部分或全部步骤骤或操作仅是示例,本申请实施例还可以执行其它操作或者各种操作的变形。此外,各个步骤可以按照上述实施例呈现的不同的顺序来执行,并且有可能并非要执行上述实施例中的全部操作。
以图14所示合成图为例。如图15所示,经过梯度计算确认纵向边界为1431(纵向贯通合成图)以及1432(纵向贯通合成图),横向边界为1441、1442(横向贯通合成图)以及1443。横向边界1441与1442的间距为两个字符高度,横向边界1443与合成图下边缘的间距为两个字符高度。因此,横向边界1441与1442间的区域以及横向边界1443与合成图下边缘间的区域为字符区域。由于字符区域的附加方式为附加在其所属的子图下方,横向边界1441以及横向边界1443为字符区域与其所属子图间的分界线。
在不需要删除字符区域的应用场景中,基于纵向边界1431以及1432,横向边界1442进行合成图的分割。
图18为根据本申请一实施例的应用场景的合成图分割结果示例。在需要删除字符区域的应用场景中,图14所示合成图分割后的结果如图18所示的图像1801~1806。
以图16所示合成图为例。如图17所示,经过梯度计算确认纵向边界为1631(纵向贯通合成图)以及1632(纵向贯通合成图),横向边界为1641(横向贯通合成图)、1642(横向贯通合成图)以及1643(横向贯通合成图)。横向边界1641与1642的间距为两个字符高度,横向边界1643与合成图下边缘的间距为两个字符高度。因此,横向边界1641与1642间的区域以及横向边界1643与合成图下边缘间的区域为字符区域。由于字符区域的附加方式为附加在其所属的子图下方,横向边界1641以及横向边界1643为字符区域与其所属子图间的分界线。
在不需要删除字符区域的应用场景中,基于纵向边界1531以及1532,横向边界1542进行合成图的分割。
图19为根据本申请一实施例的应用场景的合成图分割结果示例。在需要删除字符区域的应用场景中,图16所示合成图分割后的结果如图19所示的图像1901~1904。
进一步的,基于本申请实施例所提出的方法,在本申请一实施例中还提出了一种合成图分割装置。具体的,图20所示为根据本申请合成图分割装置一实施例的结构图。在本申请一实施例中,如图20所示,合成图分割装置2000包括:
梯度计算模块2010,其用于针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,目标轴方向包括X轴方向和/或Y轴方向;
边界识别模块2020,其用于根据目标轴梯度计算结果确认目标轴梯度计算结果大于等于目标轴方向的梯度阈值的目标像素,基于目标像素识别目标轴方向的边界,其中:
识别Y轴方向的纵向贯通边界,其中,当合成图的目标像素列中所有的像素均为第一像素时,将目标像素列识别为一条纵向贯通边界,第一像素为目标像素中的一种,用于表示目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;
和/或,
识别X轴方向的横向贯通边界,其中,当合成图的目标像素行中所有的像素均为第二像素时,将目标像素行识别为一条横向贯通边界,第二像素为目标像素中的一种,用于表示目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;
图像分割模块2030,其用于根据目标轴方向的边界对合成图进行分割。
图20所示的本申请一实施例提供的装置可用于执行本申请图1所示实施例的方法实施例的技术方案,其实现原理和技术效果可以进一步参考方法实施例中的相关描述。
进一步的,在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(FieldProgrammable Gate Array,FPGA))就是这样一种集成电路,其逻辑功能由访问方对器件编程来确定。由设计人员自行编程来把一个数字装置“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera HardwareDescription Language)、Confluence、CUPL(Cornell University ProgrammingLanguage)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等,目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
进一步的,在当前的技术应用场景中,电子设备的控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、MicrochipPIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
因此,在本申请实施例的描述中,为了描述的方便,描述装置时以功能分为各种模块/单元分别描述,各个模块/单元的划分仅仅是一种逻辑功能的划分,在实施本申请实施例时可以把各模块/单元的功能在同一个或多个软件和/或硬件中实现。
具体的,本申请实施例所提出的装置在实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块以软件通过处理元件调用的形式实现,部分模块通过硬件的形式实现。例如,检测模块可以为单独设立的处理元件,也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,ASIC),或,一个或多个微处理器(Digital Singnal Processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,这些模块可以集成在一起,以片上装置(System-On-a-Chip,SOC)的形式实现。
本申请一实施例还提出了一种电子设备,电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发电子设备执行本申请实施例所述的方法步骤。
本申请实施例阐明的电子设备、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,例如可以为台式电脑、笔记本电脑、平板电脑、手机、个人数字助理、媒体播放器、导航设备、游戏控制台、可穿戴设备或者这些设备中的任何设备的组合。具体的,在本申请一实施例中,上述电子设备可以为是终端设备,例如,移动终端(手机、平板电脑、笔记本电脑)、本地终端(个人/工业电脑)、云端服务器等设备;也可以是内置于上述终端设备的电路设备。
进一步的,在本申请一实施例中,电子设备的处理器可以是片上装置SOC,该处理器中可以包括中央处理器(Central Processing Unit,CPU)、DSP、微控制器、AP、GPU、嵌入式神经网络处理器(Neural-network Process Units,NPU)、图像信号处理器(ImageSignal Processing,ISP)、调制解调处理器、视频编解码器、基带处理器、脉冲宽度调制(Pulse width modulation,PWM)控制器,还可以进一步包括其他类型的处理器。
进一步的,在本申请一实施例中,处理器还可包括必要的硬件加速器或逻辑处理硬件电路,如ASIC,或一个或多个用于控制本申请技术方案程序执行的集成电路等。此外,处理器可以具有操作一个或多个软件程序的功能,软件程序可以存储在存储介质中。
进一步的,在本申请一实施例中,电子设备的存储器包括永久性和非永久性、可移动和非可移动的可以由任何方法或技术来实现信息存储的计算机可读介质。存储器的计算机可读介质存储的信息可以是计算机可读指令、数据结构、程序的模块或其他数据。
用于构造存储器的计算机可读介质例子包括但不限于:只读存储器(Read-OnlyMemory,ROM)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(Random Access Memory,RAM)、电可擦可编程只读存储器(Electrically ErasableProgrammable Read-Only Memory,EEPROM)、相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、快闪记忆体或其他内存技术的记忆体、只读光盘(Compact Disc Read-Only Memory,CD-ROM)、数字多功能光盘(DVD)或其他光学存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质等各种可以存储程序代码的、可以被计算设备访问的介质。
进一步的,在本申请一实施例中,处理器可以和存储器可以合成一个处理装置,更常见的是彼此独立的部件,处理器用于执行存储器中存储的程序代码来实现本申请实施例方法。具体实现时,该存储器也可以集成在处理器中,或者,独立于处理器。
本领域内的技术人员应明白,本申请实施例可提供为方法、装置、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。
在本申请所提供的几个实施例中,任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。
具体的,本申请一实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行本申请实施例提供的方法。
本申请一实施例还提供一种计算机程序产品,该计算机程序产品包括计算机程序,当其在计算机上运行时,使得计算机执行本申请实施例提供的方法。
本申请中的实施例描述是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
还需要说明的是,本申请实施例中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达,是指的这些项中的任意组合,包括单项或复数项的任意组合。例如,a,b和c中的至少一项可以表示:a,b,c,a和b,a和c,b和c或a和b和c,其中a,b,c可以是单个,也可以是多个。
本申请实施例中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以意识到,本申请实施例中描述的各单元及算法步骤,能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上,仅为本申请实施例的具体实施方式,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。本申请的保护范围应以权利要求的保护范围为准。

Claims (9)

1.一种合成图分割方法,其特征在于,包括:
针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,所述目标轴方向包括X轴方向和/或Y轴方向;
根据所述目标轴梯度计算结果确认所述目标轴梯度计算结果大于等于所述目标轴方向的梯度阈值的目标像素;
基于所述目标像素识别所述目标轴方向的边界,所述目标轴方向的边界包括Y轴方向的纵向贯通边界和/或X轴方向的横向贯通边界,所述基于所述目标像素识别所述目标轴方向的边界,包括:识别所述合成图的纵向贯通边界,其中,当所述合成图的目标像素列中所有的像素均为第一像素时,将所述目标像素列识别为一条纵向贯通边界,所述第一像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;和/或,识别所述合成图的横向贯通边界,其中,当所述合成图的目标像素行中所有的像素均为第二像素时,将所述目标像素行识别为一条横向贯通边界,所述第二像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;基于识别出的纵向贯通边界和/或横向贯通边界将所述合成图划分为多个子区域,针对每个子区域进行边界识别,其中:将所述子区域中所有像素均为所述第一像素的像素列识别为一条纵向边界;将所述子区域中所有像素均为所述第二像素的像素行识别为一条横向边界;基于识别出的纵向边界和/或横向边界进行进一步的子区域划分以及边界识别,迭代执行子区域划分以及边界识别,直到无法识别出新的纵向边界以及横向边界;
根据所述目标轴方向的边界对所述合成图进行分割,包括:根据所述合成图的纵向贯通边界和/或横向贯通边界将所述合成图分割为多个子区域;识别所述子区域的纵向贯通边界和/或横向贯通边界;根据所述子区域的纵向贯通边界和/或横向贯通边界分割所述子区域;根据相邻的所述目标轴方向的边界之间、所述目标轴方向的边界与所述合成图边缘之间的位置关系识别所述合成图中的字符区域,包括:判断相邻的两条所述目标轴方向的边界的间距是否小于等于所述目标轴方向的字符区域阈值,当所述相邻的两条所述目标轴方向的边界的间距小于等于所述目标轴方向的字符区域阈值时,所述相邻的两条所述目标轴方向的边界之间的区域为字符区域;判断单条所述目标轴方向的边界与所述合成图边缘的间距是否小于等于所述目标轴方向的字符区域阈值,当所述单条所述目标轴方向的边界与所述合成图边缘的间距小于等于所述目标轴方向的字符区域阈值时,所述单条所述目标轴方向的边界与所述合成图边缘之间的区域为字符区域。
2.根据权利要求1所述的方法,其特征在于:
所述识别所述合成图的纵向贯通边界,包括,统计所述合成图每列像素中所述第一像素的个数,将所述第一像素的个数最高的一列或多列像素识别为所述纵向贯通边界;
基于所述目标像素识别所述目标轴方向的边界,还包括:
基于所述纵向贯通边界将所述合成图划分为多个纵向区域;
针对每个所述纵向区域,统计所述纵向区域每行像素中所述第二像素的个数,将所述第二像素的个数最高的一行或多行像素识别为横向边界。
3.根据权利要求1所述的方法,其特征在于:
所述识别所述合成图的横向贯通边界,包括,统计所述合成图每行像素中所述第二像素的个数,将所述第二像素的个数最高的一行或多行像素识别为所述横向贯通边界;
基于所述目标像素识别所述目标轴方向的边界,还包括:
基于所述横向贯通边界将所述合成图划分为多个横向区域;
针对每个所述横向区域,统计所述横向区域每列像素中所述第一像素的个数,将所述第一像素的个数最高的一列或多列像素识别为纵向边界。
4.根据权利要求1所述的方法,其特征在于,基于所述目标像素识别所述目标轴方向的边界,还包括:
当所述合成图中所述目标轴方向的像素集合满足边界判定条件时,将所述像素集合识别为所述目标轴方向的边界,所述像素集合为所述目标轴方向的一列像素或一行像素,所述边界判定条件包括以下至少之一:
所述像素集合中的所述目标像素的个数大于等于所述目标轴方向的像素数阈值;
所述像素集合在所述合成图中的位置与所述合成图的等分线位置匹配;
所述像素集合与所述像素集合两侧第一预设范围内相同目标轴方向的其他像素集合中所述目标像素的个数差值大于等于预设的像素个数差值阈值。
5.根据权利要求1~4中任一项所述的方法,其特征在于,根据所述目标轴方向的边界对所述合成图进行分割,还包括:
基于预设的字符区域处理策略,在根据所述目标轴方向的边界对所述合成图进行分割的过程中,删除所述字符区域,或者,保留所述字符区域。
6.根据权利要求5所述的方法,其特征在于,所述根据所述目标轴方向的边界对所述合成图进行分割之前,还包括:
当所述字符区域处理策略为保留所述字符区域时,确认所述字符区域的附加方式;
根据所述字符区域的附加方式以及所述字符区域的识别结果,确定所述字符区域与其对应的子图像间的分界线;
从所述目标轴方向的边界中删除所述字符区域与其对应的子图像间的分界线。
7.一种合成图分割装置,其特征在于,包括:
梯度计算模块,其用于针对合成图进行目标轴方向的梯度计算,获取目标轴梯度计算结果,所述目标轴方向包括X轴方向和/或Y轴方向;
边界识别模块,其用于根据所述目标轴梯度计算结果确认所述目标轴梯度计算结果大于等于所述目标轴方向的梯度阈值的目标像素,基于所述目标像素识别所述目标轴方向的边界,其中:所述目标轴方向的边界包括Y轴方向的纵向贯通边界和/或X轴方向的横向贯通边界;所述基于所述目标像素识别所述目标轴方向的边界,包括:识别所述合成图的纵向贯通边界,其中,当所述合成图的目标像素列中所有的像素均为第一像素时,将所述目标像素列识别为一条纵向贯通边界,所述第一像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于Y轴方向梯度阈值的像素;和/或,识别所述合成图的横向贯通边界,其中,当所述合成图的目标像素行中所有的像素均为第二像素时,将所述目标像素行识别为一条横向贯通边界,所述第二像素为所述目标像素中的一种,用于表示所述目标轴梯度计算结果大于等于X轴方向梯度阈值的像素;基于识别出的纵向贯通边界和/或横向贯通边界将所述合成图划分为多个子区域,针对每个子区域进行边界识别,其中:将所述子区域中所有像素均为所述第一像素的像素列识别为一条纵向边界;将所述子区域中所有像素均为所述第二像素的像素行识别为一条横向边界;基于识别出的纵向边界和/或横向边界进行进一步的子区域划分以及边界识别,迭代执行子区域划分以及边界识别,直到无法识别出新的纵向边界以及横向边界;
图像分割模块,其用于根据所述目标轴方向的边界对所述合成图进行分割,包括:根据所述合成图的纵向贯通边界和/或横向贯通边界将所述合成图分割为多个子区域;识别所述子区域的纵向贯通边界和/或横向贯通边界;根据所述子区域的纵向贯通边界和/或横向贯通边界分割所述子区域;根据相邻的所述目标轴方向的边界之间、所述目标轴方向的边界与所述合成图边缘之间的位置关系识别所述合成图中的字符区域,包括:判断相邻的两条所述目标轴方向的边界的间距是否小于等于所述目标轴方向的字符区域阈值,当所述相邻的两条所述目标轴方向的边界的间距小于等于所述目标轴方向的字符区域阈值时,所述相邻的两条所述目标轴方向的边界之间的区域为字符区域;判断单条所述目标轴方向的边界与所述合成图边缘的间距是否小于等于所述目标轴方向的字符区域阈值,当所述单条所述目标轴方向的边界与所述合成图边缘的间距小于等于所述目标轴方向的字符区域阈值时,所述单条所述目标轴方向的边界与所述合成图边缘之间的区域为字符区域。
8.一种电子设备,其特征在于,所述电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发所述电子设备执行如权利要求1~6中任一项所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当其在计算机上运行时,使得计算机执行如权利要求1-6中任一项所述的方法。
CN202010238572.9A 2020-03-30 2020-03-30 一种合成图分割方法、装置和电子设备 Active CN113470053B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010238572.9A CN113470053B (zh) 2020-03-30 2020-03-30 一种合成图分割方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010238572.9A CN113470053B (zh) 2020-03-30 2020-03-30 一种合成图分割方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN113470053A CN113470053A (zh) 2021-10-01
CN113470053B true CN113470053B (zh) 2024-03-05

Family

ID=77865049

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010238572.9A Active CN113470053B (zh) 2020-03-30 2020-03-30 一种合成图分割方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN113470053B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567952A (zh) * 2010-12-16 2012-07-11 阿里巴巴集团控股有限公司 一种图像分割方法及系统
CN108305284A (zh) * 2018-02-28 2018-07-20 北京奇艺世纪科技有限公司 一种文字笔画宽度的确定方法及装置
CN108520263A (zh) * 2018-03-29 2018-09-11 优酷网络技术(北京)有限公司 一种全景图像的识别方法、系统及计算机存储介质
CN108629227A (zh) * 2017-03-15 2018-10-09 纵目科技(上海)股份有限公司 在图像中确定车辆左右边界的方法及系统
CN110415263A (zh) * 2019-07-29 2019-11-05 马婷 图像分割方法以及图像分割装置
CN110443809A (zh) * 2019-07-12 2019-11-12 太原科技大学 带边界约束的结构敏感性彩色图像分割超像素化方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7899248B2 (en) * 2007-08-30 2011-03-01 Seiko Epson Corporation Fast segmentation of images
US8467606B2 (en) * 2011-08-25 2013-06-18 Eastman Kodak Company Method for segmenting a composite image
US10290109B2 (en) * 2015-12-22 2019-05-14 Shanghai United Imaging Healthcare Co., Ltd. Method and system for cardiac image segmentation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567952A (zh) * 2010-12-16 2012-07-11 阿里巴巴集团控股有限公司 一种图像分割方法及系统
CN108629227A (zh) * 2017-03-15 2018-10-09 纵目科技(上海)股份有限公司 在图像中确定车辆左右边界的方法及系统
CN108305284A (zh) * 2018-02-28 2018-07-20 北京奇艺世纪科技有限公司 一种文字笔画宽度的确定方法及装置
CN108520263A (zh) * 2018-03-29 2018-09-11 优酷网络技术(北京)有限公司 一种全景图像的识别方法、系统及计算机存储介质
CN110443809A (zh) * 2019-07-12 2019-11-12 太原科技大学 带边界约束的结构敏感性彩色图像分割超像素化方法
CN110415263A (zh) * 2019-07-29 2019-11-05 马婷 图像分割方法以及图像分割装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于梯度信息的C-V模型图像分割算法;刘建磊;冯大政;张莉;;光电子.激光(03);全文 *

Also Published As

Publication number Publication date
CN113470053A (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
CN109977997B (zh) 基于卷积神经网络快速鲁棒的图像目标检测与分割方法
JP4916548B2 (ja) 画像のドミナントライン(dominantline)の確定及び使用
JP6435740B2 (ja) データ処理システム、データ処理方法およびデータ処理プログラム
CN111640089B (zh) 一种基于特征图中心点的缺陷检测方法及装置
CN109583509B (zh) 数据生成方法、装置及电子设备
JP4653807B2 (ja) リアルタイム安定化
US20230100776A1 (en) Visual positioning based on a plurality of image frames
CN114365201A (zh) 结构注释
US10289634B2 (en) Data clustering employing mapping and merging
Yang et al. MGC-VSLAM: A meshing-based and geometric constraint VSLAM for dynamic indoor environments
WO2022179002A1 (zh) 图像匹配方法、装置、电子设备以及存储介质
CN112800955A (zh) 基于加权双向特征金字塔的遥感影像旋转目标检测方法及系统
CN112418165A (zh) 基于改进型级联神经网络的小尺寸目标检测方法与装置
CN110046623B (zh) 一种图像特征点提取方法和相机
CN111462235A (zh) 基于yolo v3算法的倾斜目标检测方法、装置及存储介质
US7542589B2 (en) Road position detection
CN113470053B (zh) 一种合成图分割方法、装置和电子设备
CN112734747A (zh) 一种目标检测方法、装置、电子设备和存储介质
CN112418220A (zh) 一种单字检测方法、装置、设备及介质
CN109657577B (zh) 一种基于熵和运动偏移量的动物检测方法
CN109961061A (zh) 一种边缘计算视频数据结构化方法及系统
CN116228850A (zh) 物体姿态估计方法、装置、电子设备及可读存储介质
Kurlin et al. A persistence-based approach to automatic detection of line segments in images
CN113033593A (zh) 基于深度学习的文本检测训练方法及装置
CN110807113A (zh) 可视化布局中的矩形图元重叠的非迭代消除方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant