CN114612492A - 图像边框的检测方法、装置及电子设备 - Google Patents

图像边框的检测方法、装置及电子设备 Download PDF

Info

Publication number
CN114612492A
CN114612492A CN202210326874.0A CN202210326874A CN114612492A CN 114612492 A CN114612492 A CN 114612492A CN 202210326874 A CN202210326874 A CN 202210326874A CN 114612492 A CN114612492 A CN 114612492A
Authority
CN
China
Prior art keywords
frame
region
target
image
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210326874.0A
Other languages
English (en)
Other versions
CN114612492B (zh
Inventor
连天培
谢强
邓天生
于天宝
贠挺
陈国庆
林赛群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210326874.0A priority Critical patent/CN114612492B/zh
Publication of CN114612492A publication Critical patent/CN114612492A/zh
Application granted granted Critical
Publication of CN114612492B publication Critical patent/CN114612492B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本公开提供了一种图像边框的检测方法、装置及电子设备,涉及人工智能技术领域,尤其涉及图像处理技术。该方法包括:确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;根据所述目标线段确定初始边框;根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框,提高了图像边框检测的准确性。

Description

图像边框的检测方法、装置及电子设备
技术领域
本公开涉及人工智能技术领域中的图像处理技术,尤其涉及一种图像边框的检测方法、装置及电子设备。
背景技术
随着短视频作品的快速增加,视频质量对于短视频的传播以及视频平台的运营显得十分重要。视频封面图的质量是视频质量中极为重要的一个环节,是用户对于该视频第一印象的关键所在。用户上传视频封面时可能会因为适配尺寸要求或个人审美等需求,在封面图像的边缘添加边框。
然而,当边框尺寸不恰当时,会严重影响用户观感,从而降低视频被点击的概率以及视频平台的口碑。在此背景下,视频平台需要准确识别封面图像的边框位置,从而进一步基于边框位置决定该视频是否准入。
目前,相关技术中对图像边框的检测通常是采用基于边缘检测加直线检测的方法,然而,这种方法十分容易受到图像中具有水平或竖直边缘的物体的干扰,准确性较差。
发明内容
本公开提供了一种提高了检测准确性的图像边框的检测方法、装置及电子设备。
根据本公开的第一方面,提供了一种图像边框的检测方法,包括:
确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;
根据所述目标线段确定初始边框;
根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框。
根据本公开的第二方面,提供了一种图像边框的检测装置,包括:
第一确定模块,用于确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;
第二确定模块,用于根据所述目标线段确定初始边框;
校验模块,用于根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述第一方面所述的方法。
根据本公开的第五方面,提供了一种计算机程序产品,所述程序产品包括:计算机程序,所述计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得电子设备执行第一方面所述的方法。
根据本公开的技术方案,提高了图像边框检测的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例提供的一种图像边框的检测方法的流程示意图;
图2是根据本公开实施例提供的线段聚合示意图;
图3是根据本公开实施例提供的校验流程示意图一;
图4是根据本公开实施例提供的区域示意图;
图5是根据本公开实施例提供的校验流程示意图二;
图6是根据本公开实施例提供的校验流程示意图三;
图7是根据本公开实施例提供的一种图像边框的检测装置的结构示意图;
图8是用来实现本公开实施例的方法的电子设备的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本公开实施例的方法中,基于从待检测图像中检测到的线段确定待检测图像的初始边框后,考虑到边框部分的颜色通常为纯色、边框颜色通常与其他部分的颜色不同,以及边框大多对称分布等特点,利用待检测图像的主要颜色分布,对初始边框进行校验,极大避免了图像中具有水平或竖直边缘的物体的干扰,从而提高准确性。
本公开提供一种图像边框的检测方法、装置及电子设备,应用于人工智能技术领域的图像处理领域,具体可以应用在图像、视频封面等的边框检测中,以准确地检测出图像的边框信息。
下面,将通过具体的实施例对本公开提供的图像边框的检测方法进行详细地说明。可以理解的是,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例不再赘述。
图1是根据本公开实施例提供的一种图像边框的检测方法的流程示意图。该方法的执行主体为图像边框的检测装置,该装置可以通过软件和/或硬件的方式实现。如图1所示,该方法包括:
S101、确定待检测图像中的目标线段,目标线段包括水平线段和/或竖直线段。
待检测图像可以是任意的需要检测是否添加了边框的图像。例如用户拍摄图像后,通过图像处理软件在图像上添加边框,又如用户在上传视频封面时,为了匹配尺寸在封面图像上添加边框。由于边框的线条通常是直线且是水平或竖直的,因此,本步骤中通过对待检测图像中的直线进行检测,确定其中包括的水平线段和/或竖直线段。
S102、根据目标线段确定初始边框。
在确定了待检测图像中的水平线段和/或竖直线段后,根据这些线段可以确定出初始边框,可以理解的是,初始边框的位置存在水平线段或竖直线段,而这个水平线段或竖直线段有可能确实是待检测图像的边框,也有可能是图像中的物体的边缘,例如图像中若拍摄了一个柱子,该柱子的边缘是竖直线段,则很有可能在确定初始边框时被误确定为边框,因此,还需要进一步对初始边框进行校验。
S103、根据待检测图像的颜色分布,对初始边框进行校验,以确定待检测图像的边框。
考虑到在实际应用中,对图像添加的边框通常为纯色边框或接近纯色的边框(可能包含少量杂色),或者边框区域的颜色通常与待检测图像的其他区域的颜色不同,又或者边框大多是上下对阵或左右对称等特点,因此,根据待检测图像的颜色分布,对初始边框进行校验,若初始边框所构成的边框区域不满足实际应用场景的颜色分布,则可以确定其并不是待检测图像的真实边框,从而可以将其剔除。
本公开实施例的方法,基于从待检测图像中检测到的线段确定待检测图像的初始边框后,利用待检测图像的主要颜色分布,对初始边框进行校验,极大避免了图像中具有水平或竖直边缘的物体的干扰,从而提高准确性。
在上述实施例的基础上,对各步骤做进一步说明。
首先,S101中确定待检测图像中的目标线段,包括:对待检测图像进行边缘检测得到边缘图,并对待检测图像进行文字识别,确定文字所在区域;将边缘图中文字所在区域转变为黑色后,对边缘图进行直线检测,并确定检测到的直线中的目标线段。
示例的,将待检测图像转化为灰度图,对灰度图进行边缘检测得到待检测图像的边缘图,在边缘图中,非边缘部分为黑色,为了避免待检测图像中的文字对后续直线检测产生干扰,对待检测图像利用光学字符识别(Optical Character Recognition,OCR)技术检测出文字所在区域,将边缘图中文字所在区域清除,也就是将文字所在区域转变为黑色。之后,采用霍夫变换对处理后的边缘图进行直线检测,可选的,采用的霍夫变换可以为OpenCV中的HoughLinesP函数,之后,再确定出检测到的直线中的目标线段,即水平线段和/或竖直线段。
在确定出目标线段后,即可执行S102,根据目标线段确定初始边框。以下进行说明。
由于在进行边缘检测或者之间检测时,一条连续的边缘或直线可能被检测算法分成距离比较近的两条线,因此本公开实施例中对目标线段进行聚合,在聚合的基础上确定初始边框。
可选的,将目标线段中的所有第一线段中间距小于或等于预设值的第一目标线段进行聚合,以确定聚合得到的第二目标线段的线段长度和线段位置,第一线段为水平线段或竖直线段;根据第二目标线段的线段长度和线段位置以及第三目标线段的线段长度和线段位置,确定初始边框,其中,第三目标线段为第一线段中除第一目标线段之外的其他线段。
以第一线段为水平线段为例进行说明,竖直线段的情况于此类似。示例的,如图2所示,第一目标线段a、b、c在竖直方向上的距离,也就是第一目标线段a、b、c的间距小于预设值,例如小于5个像素,因此,第一目标线段a、b、c有可能是同一条线段,但是在前面的步骤中被检测算法分为几个小段,因此本步骤中将第一目标线段a、b、c进行聚合,得到对应的第二目标线段。
可选的,将第一目标线段向待检测图像的第一边投影后的总长度确定为第二目标 线段的线段长度,第一边为与第一目标线段平行且与第一目标线段的距离最近的边;将第 一目标线段中与第一边距离最近的第一目标线段的位置确定为第二目标线段的线段位置。 如图2中所示,将第一目标线段a、b、c向待检测图像的第一边(图2中的下边)进行投影,线段 a和线段b的投影存在部分重叠,线段a和线段b在第一边上的投影后得到的长度为
Figure 853822DEST_PATH_IMAGE001
,线段c 在第一边上投影的长度为
Figure 705103DEST_PATH_IMAGE002
,因此,将线段a、b、c进行聚合得到的第二目标线段的线段长度 l为投影后的总长度,即
Figure 869368DEST_PATH_IMAGE003
,而第二目标线段的线段位置则是线段c所在的位置 (线段c的竖直坐标),也就是在线段c的竖直坐标处的长度为l的水平线段。通过上述方法提 供了线段长度和线段位置的准确性。
对所有水平线段均进行上述判断后对满足条件的第一目标线段进行聚合,得到对应的第二目标线段,而其他不满足聚合条件,即未参与聚合的第一线段则称为第三目标线段,在上述聚合处理后,基于第二目标线段和第三目标线段的线段长度和线段位置来确定初始边框,避免了真实的长线段由于被检测算法分段而导致确定的初始边框不准确。
由于图像的边框的长度通常不会太短,因此,在进行聚合处理后,还可以将过短的线段过滤掉,之后再确定初始边框。
可选的,将第二目标线段和第三目标线段中,线段长度小于预设长度的线段进行过滤;例如,将第二目标线段和第三目标线段中线段长度小于0.15*图像边长的线段去除,以减少无关线段的干扰。
在对线段进行过滤后,还不能确定剩下的线段中哪些是边框,考虑到真实的边框其外部区域往往颜色纯净,包含的物体极少或没有,因此利用边缘图的灰度是否纯净来初步判断边框,也就是确定初始边框,能够提高初始边框的准确性。
针对待检测图像的每条边,由外向内遍历过滤后的第二目标线段以及第三目标线段的线段位置,从待检测图像的边缘图中获取当前遍历的线段位置与边之间的目标边缘图,对目标边缘图进行二值化处理,确定二值化处理后目标边缘图的平均灰度值,若平均灰度值小于或等于预设值,则确定当前遍历的线段位置处存在初始边框,若平均灰度值大于预设值,则遍历下一个线段位置,直至确定出初始边框或遍历完所有线段。
对于待检测图像的四条边均按照上述方法进行遍历,以确定四个边是否存在初始边框。示例的,对于左侧的边,根据线段位置,从最左侧的竖直线段开始遍历,从待检测图像的边缘中,取出当前遍历的线段位置与待检测图像的边之间的目标边缘图,采用预设的灰度阈值对目标边缘图进行二值化处理,例如灰度阈值为50,将目标边缘图中灰度值大于等于50的部分置为250,灰度值小于50的部分置为0,二值化处理后目标边缘图的平均灰度值是指各像素的灰度值的和除以像素总数再除以250,若平均灰度值小于或等于预设值,例如0.01,则表示该线段外侧图像较纯净,对应的边缘图应该比较干净,因此,由于图像的边框通常是纯色的或仅有较少杂色的,因此可以确定当前遍历的线段位置处的线段为一条初始边框,而若平均灰度值大于预设值,则遍历下一个线段位置,直至确定出初始边框或遍历完所有线段。若遍历完所有线段(对于每条边,从最外侧遍历至待检测图像的中间位置即可),仍没有确定出边框,则可以确定待检测图像的这条边的一侧没有边框。
由于边缘检测和直线检测对于图像内容十分敏感,因此,前述得到的初始边框仍然可能会受到图像物体、边框类型的影响,容易误检或漏检,因此需要结合先验知识进一步进行校验。本公开主要依赖三点先验知识:首先,边框区域的颜色比较纯净;其次,边框内外的颜色差距较大;第三,大多数图像的边框成对称分布。基于上述先验知识,基于待检测图像的颜色对初始边框进行校验。
可选的,确定待检测图像中的目标区域的颜色分布,目标区域包括初始边框与待检测图像的边之间的边框区域、边框区域的相邻区域以及边框区域的对称区域中的至少一项;根据目标区域的颜色分布对初始边框进行校验,以确定待检测图像的边框。
可选的,根据目标区域的颜色分布,确定目标区域的颜色是否纯净以及目标区域中包括的区域的颜色是否相近;基于目标区域的颜色是否纯净以及目标区域中包括的区域的颜色是否相近对初始边框进行校验,以确定待检测图像的边框。
需要说明的是,本公开实施例的上述步骤中并不限定要先确定出目标区域中所有区域的颜色分布,在实际执行过程中,可以根据校验流程逐个区域进行确定,若根据部分区域的颜色分布即可得到校验结果,则不必再确定其他区域的颜色分布。
在一种场景中,待检测图像的对称边中的一边具有初始边框,例如,初始边框中包括上边框而不包括下边框,或者,初始边框中包括下边框而不包括上边框;和/或,初始边框中包括左边框而不包括右边框,或者,初始边框中包括右边框而不包括左边框。针对这种场景,参照图3中所示的流程进行校验。
S301、确定边框区域的颜色分布,并判断边框区域的颜色分布是否纯净;若否,则执行S302;若是,则执行S303。
S302、确定待检测图像的边框不包括初始边框以及与初始边框对称的边框。
S303、确定相邻区域的颜色分布,并判断相邻区域的颜色分布是否纯净以及相邻区域与边框区域的颜色分布是否相近;若是,则执行S302;若否,则执行S304。
S304、确定对称区域的颜色分布,并判断对称区域的颜色分布是否纯净以及对称区域与边框区域的颜色分布是否相近;若否,则执行S305;若是,则执行S306。
S305、确定待检测图像的边框包括初始边框但不包括与初始边框对称的边框。
S306、确定待检测图像的边框包括初始边框以及与初始边框对称的边框。
以初始边框中包括上边框而不包括下边框为例进行说明,其他对称边中的一边具有初始边框的情况与此类似。其中,边框区域、相邻区域以及对称区域如图4所示,首先,确定上边框与待检测图像的上边之间的边框区域的颜色分布是否纯净;若否,则确定待检测图像的边框不包括上边框也不包括下边框;若是,则确定边框区域的相邻区域的颜色分布是否纯净以及相邻区域与边框区域的颜色分布是否相近;若是,则确定待检测图像的边框不包括上边框也不包括下边框;若否,则确定边框区域的对称区域的颜色分布是否纯净以及对称区域与边框区域的颜色分布是否相近;若否,则确定待检测图像的边框包括上边框但不包括下边框;若是,则确定待检测图像的边框包括上边框以及下边框(下边框的位置与检测出的上边框的位置对称)。从而在初始边框中检测出一边的边框的情况下,实现对两边的校验,提高了准确性。
在一种场景中,待检测图像的对称边中的两边均具有初始边框,例如,初始边框中包括上边框和下边框,和/或,初始边框中包括左边框和右边框;在这种场景中,若对称的两个边框的宽度比值在预设范围内,例如0.8-1.25之间,则认为二者宽度是对称的,如果一边的边框校验不符合要求,即一边被确定没有边框,可以直接认为两边都没有边框。针对这种场景,参照图5中所示的流程进行校验。
S501、对于对称边中任一边的初始边框,确定边框区域的颜色分布,并判断边框区域的颜色分布是否纯净;若否,则执行S502;若是,则执行S503。
S502、确定待检测图像的边框不包括对称边的两个初始边框。
S503、确定相邻区域的颜色分布,并判断相邻区域的颜色分布是否纯净以及相邻区域与边框区域的颜色分布是否相近;若是,则执行S502;若否,则执行S504。
S504、确定对称边框区域(另一边的初始边框的边框区域)的颜色分布,并判断对称边框区域的颜色分布是否纯净;若否,则执行S502;若是,则执行S505。
S505、确定对称相邻区域(另一边的边框区域的相邻区域)的颜色分布,并判断对称相邻区域的颜色分布是否纯净以及对称相邻区域与对称边框区域的颜色分布是否相近;若是,则执行S502;若否,则执行S506。
S506、确定待检测图像的边框包括对称边的两个初始边框。
以初始边框中包括上边框和下边框为例进行说明,初始边框中包括左边框和右边框的情况与此类似。确定上边框的边框区域的颜色分布是否纯净;若否,则确定待检测图像的边框不包括上边框以及下边框;若是,则确定上边框的边框区域的相邻区域的颜色分布是否纯净以及上边框的边框区域的相邻区域与上边框的边框区域的颜色分布是否相近;若是,则确定待检测图像的边框不包括上边框以及下边框;若否,则确定下边框的边框区域的颜色分布是否纯净;若否,则确定待检测图像的边框不包括上边框以及下边框;若是,则确定下边框的边框区域的相邻区域的颜色分布是否纯净以及下边框的边框区域的相邻区域与下边框的边框区域的颜色分布是否相近;若是,则确定待检测图像的边框不包括上边框以及下边框;若否,则确定待检测图像的边框包括上边框以及下边框。从而实现了利用边框的对称性对两边边框的校验。
在另一种场景中,待检测图像的对称边中的两边均具有初始边框,例如,初始边框中包括上边框和下边框,和/或,初始边框中包括左边框和右边框;在这种场景中,若对称的两个边框的宽度比值不在预设范围内,例如不在0.8-1.25之间,则认为二者宽度不是对称的,此时可以分别判断两边的初始边框是否真实存在。针对这种场景,参照图6中所示的流程进行校验。需要说明的是,对于前述的宽度比值在预设范围内的情况,同样可以不考虑两者之间的对称性,采用与本场景相同的方法分别判断两边的初始边框是否真实存在。
S601、对于任一边的初始边框,确定边框区域的颜色分布,并判断边框区域的颜色分布是否纯净;若否,则执行S602;若是,则执行S603。
S602、确定待检测图像的边框不包括该任一边的初始边框。
S603、确定相邻区域的颜色分布,并判断相邻区域的颜色分布是否纯净以及相邻区域与边框区域的颜色分布是否相近;若是,则执行S602;若否,则执行S604。
S604、确定待检测图像的边框包括该任一边的初始边框。
以初始边框中包括上边框和下边框为例进行说明,初始边框中包括左边框和右边框的情况与此类似。对于上边框(或下边框),确定边框区域的颜色分布是否纯净;若否,则确定待检测图像的边框不包括上边框(或下边框);若是,则确定相邻区域的颜色分布是否纯净以及相邻区域与边框区域的颜色分布是否相近;若是,则确定待检测图像的边框不包括上边框(或下边框);若否,则确定待检测图像的边框包括上边框(或下边框)。从而实现了对两边边框的分别校验。
在上述任一实施例的基础上,对于如何确定一个区域的颜色分布以及区域的颜色分布是否纯净以及相近。
可选的,对于任一区域,区域的颜色分布通过以下方式确定:
确定区域中的每种颜色对应的像素占比;根据每种颜色对应的像素占比确定排名前预设数量的颜色;合并排名前预设数量的颜色中相似的颜色及对应的像素占比,将合并后得到的颜色及对应的像素占比确定为区域的颜色分布。
可选的,为了避免待检测图像中的文字的干扰,在每种颜色的像素占比时,可以将文字部分进行排除,即,对区域进行文字识别,若区域中有存在文字的区域,则将存在文字的区域的像素用黑色填充,并记录填充像素数量;确定区域中的每种颜色对应的像素数量;将黑色对应的像素数量减去填充像素数量后,根据每种颜色对应的像素数量确定每种颜色对应的像素占比。
将区域从待检测图像中分离出来,利用OCR技术识别区域中存在文字的区域,将其用纯黑色(0,0,0)填充,并记录填充像素数量。将区域转化为n*3尺寸,其中n为区域的像素数量,3代表RGB三个颜色通道。统计各颜色对应的像素数量,并将黑色对应的像素数减去上一步填充的像素数量。确定排名前预设数量的颜色,例如排名前10的颜色及对应的像素占比,并合并相似颜色。
可选的,若两种颜色的RGB三通道各自的差值中的最大值小于第一阈值,且RGB三通道各自的差值的和小于第二阈值,则确定两种颜色相似。
采用
Figure 845414DEST_PATH_IMAGE004
Figure 854959DEST_PATH_IMAGE005
分别代表两种颜色,若两种颜色满足以下公式,则 可以确定两个颜色相似:
Figure 867738DEST_PATH_IMAGE006
Figure 937325DEST_PATH_IMAGE007
其中,
Figure 400667DEST_PATH_IMAGE008
为第一阈值,
Figure 213903DEST_PATH_IMAGE009
为第二阈值,例如
Figure 570935DEST_PATH_IMAGE010
Figure 77002DEST_PATH_IMAGE011
可选的,若区域的颜色分布满足以下任一条件,则确定区域的颜色分布纯净:
排名第一的颜色的像素占比大于第一比值;或,排名第一的颜色的像素占比大于第二比值,且排名前预设数量的颜色的像素占比大于第三比值;或,合并后只有一种颜色,且像素占比大于第二比值,其中,第一比值大于第二比值且小于第三比值。其中,排名第一的颜色是指对排名前预设数量的颜色进行合并后排名第一的颜色。
例如,排名第一的颜色的像素占比大于90%;或,排名第一的颜色的像素占比大于60%,且排名前10的颜色的像素占比大于95%;或,合并后只有一种颜色,且像素占比大于60%。
可选的,若两个区域的颜色分布均纯净,且两个区域各自排名第一的颜色相似,则确定两个区域的颜色分布相近。其中,区域颜色分布是否纯净,以及排名个第一的颜色是否相似可以采用前述方法进行判断,此处不再赘述。
在一种应用场景中,本公开实施例的待检测图像为视频封面;在这种场景中,视频封面的边框尺寸设置不当,会严重影响用户观感,降低视频被点击的概率以及视频平台的口碑,因此,本公开实施例中,可以在平台审核中,对不满足边框尺寸要求的视频进行屏蔽,避免推送给用户。
可选的,确定视频封面的边框的宽度;若视频封面的边框的宽度大于预设阈值,则对视频封面对应的视频进行屏蔽。从而提高了视频平台推送给用户的视频的质量,提升用户体验。
图7是根据本公开实施例提供的一种图像边框的检测装置的结构示意图。如图7所示,图像边框的检测装置700包括:
第一确定模块701,用于确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;
第二确定模块702,用于根据所述目标线段确定初始边框;
校验模块703,用于根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框。
在一种实施方式中,所述第二确定模块702,包括:
聚合单元,用于将所述目标线段中的所有第一线段中间距小于或等于预设值的第一目标线段进行聚合,以确定聚合得到的第二目标线段的线段长度和线段位置,所述第一线段为水平线段或竖直线段;
第一确定单元,用于根据所述第二目标线段的线段长度和线段位置以及第三目标线段的线段长度和线段位置,确定初始边框,其中,第三目标线段为所述第一线段中除所述第一目标线段之外的其他线段。
在一种实施方式中,所述聚合单元,包括:
第一确定子单元,用于将所述第一目标线段向所述待检测图像的第一边投影后的总长度确定为所述第二目标线段的线段长度,所述第一边为与所述第一目标线段平行且与所述第一目标线段的距离最近的边;
第二确定子单元,用于将所述第一目标线段中与所述第一边距离最近的第一目标线段的位置确定为所述第二目标线段的线段位置。
在一种实施方式中,所述第一确定单元,包括:
过滤子单元,用于将所述第二目标线段和所述第三目标线段中,线段长度小于预设长度的线段进行过滤;
遍历子单元,用于针对所述待检测图像的每条边,由外向内遍历过滤后的第二目标线段以及第三目标线段的线段位置,从所述待检测图像的边缘图中获取当前遍历的线段位置与所述边之间的目标边缘图,对所述目标边缘图进行二值化处理,确定二值化处理后目标边缘图的平均灰度值,若平均灰度值小于或等于预设值,则确定当前遍历的线段位置处存在初始边框,若平均灰度值大于预设值,则遍历下一个线段位置,直至确定出初始边框或遍历完所有线段。
在一种实施方式中,校验模块703,包括:
第二确定单元,用于确定待检测图像中的目标区域的颜色分布,目标区域包括初始边框与待检测图像的边之间的边框区域、边框区域的相邻区域以及边框区域的对称区域中的至少一项;
校验单元,用于根据目标区域的颜色分布对初始边框进行校验,以确定待检测图像的边框。
在一种实施方式中,校验单元,包括:
第三确定子单元,用于根据目标区域的颜色分布,确定目标区域的颜色是否纯净以及目标区域中包括的区域的颜色是否相近;
校验子单元,用于基于目标区域的颜色是否纯净以及目标区域中包括的区域的颜色是否相近对初始边框进行校验,以确定待检测图像的边框。
在一种实施方式中,第二确定单元包括:
第四确定子单元,用于对于目标区域中的任一区域,确定区域中的每种颜色对应的像素占比;
第五确定子单元,用于根据每种颜色对应的像素占比确定排名前预设数量的颜色;
第六确定子单元,用于合并排名前预设数量的颜色中相似的颜色及对应的像素占比,将合并后得到的颜色及对应的像素占比确定为区域的颜色分布。
在一种实施方式中,第四确定子单元用于:
对区域进行文字识别,若区域中有存在文字的区域,则将存在文字的区域的像素用黑色填充,并记录填充像素数量;
确定区域中的每种颜色对应的像素数量;
将黑色对应的像素数量减去填充像素数量后,根据每种颜色对应的像素数量确定每种颜色对应的像素占比。
在一种实施方式中,第三确定子单元用于:
对于目标区域中的两个区域,若两个区域的颜色分布均纯净,且两个区域各自对应的合并后排名第一的颜色相似,则确定两个区域的颜色分布相近。
在一种实施方式中,第三确定子单元用于:
对于目标区域中的任一区域,若区域的颜色分布满足以下任一条件,则确定区域的颜色分布纯净:
合并后排名第一的颜色的像素占比大于第一比值;
合并后排名第一的颜色的像素占比大于第二比值,且排名前预设数量的颜色的像素占比大于第三比值;
合并后只有一种颜色,且像素占比大于第二比值;
其中,第一比值大于第二比值且小于第三比值。
在一种实施方式中,第六确定子单元还用于:
若两种颜色的RGB三通道各自的差值中的最大值小于第一阈值,且RGB三通道各自的差值的和小于第二阈值,则确定两种颜色相似。
在一种实施方式中,校验子单元包括:
第一校验子单元,用于对于任一初始边框,若边框区域的颜色分布不纯净,或者,若边框区域和相邻区域的颜色分布均纯净且相邻区域与边框区域的颜色分布相近,则确定待检测图像的边框不包括初始边框。
在一种实施方式中,第一校验子单元,还用于:
确定待检测图像的边框不包括与初始边框对称的边框。
在一种实施方式中,待检测图像的对称边中的一边具有初始边框;校验子单元包括:
第二校验子单元,用于若边框区域的颜色分布均纯净,且相邻区域的颜色分布不纯净和/或相邻区域与边框区域的颜色分布不相近,则:
若对称区域的颜色分布不纯净和/或对称区域与边框区域的颜色分布不相近,则确定待检测图像的边框包括初始边框但不包括与初始边框对称的边框,或者,若对称区域的颜色分布纯净且对称区域与边框区域的颜色分布相近,则确定待检测图像的边框包括初始边框以及与初始边框对称的边框。
在一种实施方式中,待检测图像的对称边中的两边均具有初始边框,校验子单元包括:
第三校验子单元,用于对于对称边中任一边的初始边框,若边框区域的颜色分布纯净,且相邻区域的颜色分布不纯净和/或相邻区域与边框区域的颜色分布不相近,则确定待检测图像的边框包括初始边框。
在一种实施方式中,待检测图像的对称边中的两边均具有初始边框,校验子单元包括:
第四校验子单元,用于对于对称边中任一边的初始边框,若边框区域的颜色分布纯净,且相邻区域的颜色分布不纯净和/或及相邻区域与边框区域的颜色分布不相近,且对称边框区域的颜色分布不纯净和/或对称边框区域与边框区域的颜色分布不相近,则确定待检测图像的边框不包括对称边的两个初始边框。
在一种实施方式中,第四校验子单元,还用于:
若边框区域的颜色分布纯净,且相邻区域的颜色分布不纯净和/或及相邻区域与边框区域的颜色分布不相近,且对称边框区域的颜色分布纯净以及对称边框区域与边框区域的颜色分布相近,则:
若对称相邻区域的颜色分布纯净以及对称相邻区域与对称边框区域的颜色分布相近,则确定待检测图像的边框不包括对称边的两个初始边框,或者,若对称相邻区域的颜色分布不纯净和/或对称相邻区域与对称边框区域的颜色分布不相近,则确定待检测图像的边框包括对称边的两个初始边框。
在一种实施方式中,第一确定模块701包括:
第三确定单元,用于对待检测图像进行边缘检测得到边缘图,并对待检测图像进行文字识别,确定文字所在区域;
第四确定单元,用于将边缘图中文字所在区域转变为黑色后,对边缘图进行直线检测,并确定检测到的直线中的目标线段。
在一种实施方式中,待检测图像为视频封面;装置还包括:
第五确定单元,应用于确定视频封面的边框的宽度;
屏蔽单元,用于若宽度大于预设阈值,则对视频封面对应的视频进行屏蔽。
本公开实施例的装置可用于执行上述方法实施例中的图像边框的检测方法,其实现原理和技术效果类似,此处不再赘述。
根据本公开的实施例,本公开还提供了一种电子设备和存储有计算机指令的非瞬时计算机可读存储介质。
根据本公开的实施例,本公开还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,电子设备的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得电子设备执行上述任一实施例提供的方案。
图8是用来实现本公开实施例的方法的电子设备的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图8所示,电子设备800包括计算单元801,其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序,来执行各种适当的动作和处理。在RAM 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
电子设备800中的多个部件连接至I/O接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如图像边框的检测方法。例如,在一些实施例中,图像边框的检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时,可以执行上文描述的图像边框的检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行图像边框的检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务("Virtual Private Server",或简称 "VPS")中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (33)

1.一种图像边框的检测方法,包括:
确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;
根据所述目标线段确定初始边框;
根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框。
2.根据权利要求1所述的方法,其中,所述根据所述目标线段确定初始边框,包括:
将所述目标线段中的所有第一线段中间距小于或等于预设值的第一目标线段进行聚合,以确定聚合得到的第二目标线段的线段长度和线段位置,所述第一线段为水平线段或竖直线段;
根据所述第二目标线段的线段长度和线段位置以及第三目标线段的线段长度和线段位置,确定初始边框,其中,第三目标线段为所述第一线段中除所述第一目标线段之外的其他线段。
3.根据权利要求2所述的方法,其中,所述将所述目标线段中的所有第一线段中间距小于或等于预设值的第一目标线段进行聚合,以确定聚合得到的第二目标线段的线段长度和线段位置,包括:
将所述第一目标线段向所述待检测图像的第一边投影后的总长度确定为所述第二目标线段的线段长度,所述第一边为与所述第一目标线段平行且与所述第一目标线段的距离最近的边;
将所述第一目标线段中与所述第一边距离最近的第一目标线段的位置确定为所述第二目标线段的线段位置。
4.根据权利要求2所述的方法,其中,所述根据所述第二目标线段的线段长度和线段位置以及第三目标线段的线段长度和线段位置,确定初始边框,包括:
将所述第二目标线段和所述第三目标线段中,线段长度小于预设长度的线段进行过滤;
针对所述待检测图像的每条边,由外向内遍历过滤后的第二目标线段以及第三目标线段的线段位置,从所述待检测图像的边缘图中获取当前遍历的线段位置与所述边之间的目标边缘图,对所述目标边缘图进行二值化处理,确定二值化处理后目标边缘图的平均灰度值,若平均灰度值小于或等于预设值,则确定当前遍历的线段位置处存在初始边框,若平均灰度值大于预设值,则遍历下一个线段位置,直至确定出初始边框或遍历完所有线段。
5.根据权利要求1-4任一项所述的方法,其中,所述根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框,包括:
确定所述待检测图像中的目标区域的颜色分布,所述目标区域包括所述初始边框与所述待检测图像的边之间的边框区域、所述边框区域的相邻区域以及所述边框区域的对称区域中的至少一项;
根据所述目标区域的颜色分布对所述初始边框进行校验,以确定所述待检测图像的边框。
6.根据权利要求5所述的方法,其中,所述确定所述待检测图像中的目标区域的颜色分布,包括:
对于所述目标区域中的任一区域,确定所述区域中的每种颜色对应的像素占比;
根据每种颜色对应的像素占比确定排名前预设数量的颜色;
合并所述排名前预设数量的颜色中相似的颜色及对应的像素占比,将合并后得到的颜色及对应的像素占比确定为所述区域的颜色分布。
7.根据权利要求6所述的方法,还包括:
若两种颜色的RGB三通道各自的差值中的最大值小于第一阈值,且RGB三通道各自的差值的和小于第二阈值,则确定所述两种颜色相似。
8.根据权利要求5所述的方法,其中,根据所述目标区域的颜色分布对所述初始边框进行校验,以确定所述待检测图像的边框,包括:
根据所述目标区域的颜色分布,确定所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近;
基于所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近对所述初始边框进行校验,以确定所述待检测图像的边框。
9.根据权利要求8所述的方法,其中,根据所述目标区域的颜色分布,确定所述目标区域的颜色是否纯净,包括:
对于所述目标区域中的任一区域,所述区域的颜色分布包括将所述区域中像素占比排名前预设数量的颜色中相似的颜色进行合并后得到的颜色及对应的像素占比,若所述区域的颜色分布满足以下任一条件,则确定所述区域的颜色分布纯净:
合并后排名第一的颜色的像素占比大于第一比值;
合并后排名第一的颜色的像素占比大于第二比值,且所述排名前预设数量的颜色的像素占比大于第三比值;
合并后只有一种颜色,且像素占比大于第二比值;
其中,第一比值大于第二比值且小于第三比值。
10.根据权利要求8所述的方法,其中,根据所述目标区域的颜色分布,确定所述目标区域中包括的区域的颜色是否相近,包括:
对于所述目标区域中的两个区域,若所述两个区域的颜色分布均纯净,且所述两个区域各自对应的排名第一的颜色相似,则确定两个区域的颜色分布相近。
11.根据权利要求8-10任一项所述的方法,其中,所述基于所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近对所述初始边框进行校验,以确定所述待检测图像的边框,包括:
若所述待检测图像的对称边中的一边具有初始边框,所述边框区域的颜色分布均纯净,且所述相邻区域的颜色分布不纯净和/或所述相邻区域与所述边框区域的颜色分布不相近,则:
若所述对称区域的颜色分布不纯净和/或所述对称区域与所述边框区域的颜色分布不相近,则确定所述待检测图像的边框包括所述初始边框但不包括与所述初始边框对称的边框,或者,若所述对称区域的颜色分布纯净且所述对称区域与所述边框区域的颜色分布相近,则确定所述待检测图像的边框包括所述初始边框以及与所述初始边框对称的边框。
12.根据权利要求8-10任一项所述的方法,其中,所述基于所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近对所述初始边框进行校验,以确定所述待检测图像的边框,包括:
若所述待检测图像的对称边中的两边均具有初始边框,对于对称边中任一边的初始边框,若所述边框区域的颜色分布纯净,且所述相邻区域的颜色分布不纯净和/或所述相邻区域与所述边框区域的颜色分布不相近,则确定所述待检测图像的边框包括所述初始边框。
13.根据权利要求8-10任一项所述的方法,其中,所述基于所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近对所述初始边框进行校验,以确定所述待检测图像的边框,包括:
若所述待检测图像的对称边中的两边均具有初始边框,对于对称边中任一边的初始边框,若所述边框区域的颜色分布纯净,且所述相邻区域的颜色分布不纯净和/或及所述相邻区域与所述边框区域的颜色分布不相近,且对称边框区域的颜色分布纯净,对称相邻区域的颜色分布不纯净和/或所述对称相邻区域与所述对称边框区域的颜色分布不相近,则确定所述待检测图像的边框包括对称边的两个初始边框。
14.根据权利要求1-4任一项所述的方法,其中,所述确定待检测图像中的目标线段,包括:
对所述待检测图像进行边缘检测得到边缘图,并对所述待检测图像进行文字识别,确定文字所在区域;
将所述边缘图中所述文字所在区域转变为黑色后,对所述边缘图进行直线检测,并确定检测到的直线中的所述目标线段。
15.根据权利要求1-4任一项所述的方法,其中,所述待检测图像为视频封面;所述方法还包括:
确定所述视频封面的边框的宽度;
若所述宽度大于预设阈值,则对所述视频封面对应的视频进行屏蔽。
16.一种图像边框的检测装置,包括:
第一确定模块,用于确定待检测图像中的目标线段,所述目标线段包括水平线段和/或竖直线段;
第二确定模块,用于根据所述目标线段确定初始边框;
校验模块,用于根据所述待检测图像的颜色分布,对所述初始边框进行校验,以确定所述待检测图像的边框。
17.根据权利要求16所述的装置,其中,所述第二确定模块,包括:
聚合单元,用于将所述目标线段中的所有第一线段中间距小于或等于预设值的第一目标线段进行聚合,以确定聚合得到的第二目标线段的线段长度和线段位置,所述第一线段为水平线段或竖直线段;
第一确定单元,用于根据所述第二目标线段的线段长度和线段位置以及第三目标线段的线段长度和线段位置,确定初始边框,其中,第三目标线段为所述第一线段中除所述第一目标线段之外的其他线段。
18.根据权利要求17所述的装置,其中,所述聚合单元,包括:
第一确定子单元,用于将所述第一目标线段向所述待检测图像的第一边投影后的总长度确定为所述第二目标线段的线段长度,所述第一边为与所述第一目标线段平行且与所述第一目标线段的距离最近的边;
第二确定子单元,用于将所述第一目标线段中与所述第一边距离最近的第一目标线段的位置确定为所述第二目标线段的线段位置。
19.根据权利要求17所述的装置,其中,所述第一确定单元,包括:
过滤子单元,用于将所述第二目标线段和所述第三目标线段中,线段长度小于预设长度的线段进行过滤;
遍历子单元,用于针对所述待检测图像的每条边,由外向内遍历过滤后的第二目标线段以及第三目标线段的线段位置,从所述待检测图像的边缘图中获取当前遍历的线段位置与所述边之间的目标边缘图,对所述目标边缘图进行二值化处理,确定二值化处理后目标边缘图的平均灰度值,若平均灰度值小于或等于预设值,则确定当前遍历的线段位置处存在初始边框,若平均灰度值大于预设值,则遍历下一个线段位置,直至确定出初始边框或遍历完所有线段。
20.根据权利要求16-19任一项所述的装置,其中,所述校验模块,包括:
第二确定单元,用于确定所述待检测图像中的目标区域的颜色分布,所述目标区域包括所述初始边框与所述待检测图像的边之间的边框区域、所述边框区域的相邻区域以及所述边框区域的对称区域中的至少一项;
校验单元,用于根据所述目标区域的颜色分布对所述初始边框进行校验,以确定所述待检测图像的边框。
21.根据权利要求20所述的装置,其中,所述第二确定单元包括:
第四确定子单元,用于对于所述目标区域中的任一区域,确定所述区域中的每种颜色对应的像素占比;
第五确定子单元,用于根据每种颜色对应的像素占比确定排名前预设数量的颜色;
第六确定子单元,用于合并所述排名前预设数量的颜色中相似的颜色及对应的像素占比,将合并后得到的颜色及对应的像素占比确定为所述区域的颜色分布。
22.根据权利要求21所述的装置,其中,所述第六确定子单元还用于:
若两种颜色的RGB三通道各自的差值中的最大值小于第一阈值,且RGB三通道各自的差值的和小于第二阈值,则确定所述两种颜色相似。
23.根据权利要求20所述的装置,其中,所述校验单元,包括:
第三确定子单元,用于根据所述目标区域的颜色分布,确定所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近;
校验子单元,用于基于所述目标区域的颜色是否纯净以及所述目标区域中包括的区域的颜色是否相近对所述初始边框进行校验,以确定所述待检测图像的边框。
24.根据权利要求23所述的装置,其中,所述第三确定子单元用于:
对于所述目标区域中的任一区域,所述区域的颜色分布包括将所述区域中像素占比排名前预设数量的颜色中相似的颜色进行合并后得到的颜色及对应的像素占比,若所述区域的颜色分布满足以下任一条件,则确定所述区域的颜色分布纯净:
合并后排名第一的颜色的像素占比大于第一比值;
合并后排名第一的颜色的像素占比大于第二比值,且所述排名前预设数量的颜色的像素占比大于第三比值;
合并后只有一种颜色,且像素占比大于第二比值;
其中,第一比值大于第二比值且小于第三比值。
25.根据权利要求23所述的装置,其中,所述第三确定子单元用于:
对于所述目标区域中的两个区域,若所述两个区域的颜色分布均纯净,且所述两个区域各自对应的排名第一的颜色相似,则确定两个区域的颜色分布相近。
26.根据权利要求23-25任一项所述的装置,其中,所述校验子单元包括:
第二校验子单元,用于若所述待检测图像的对称边中的一边具有初始边框,所述边框区域的颜色分布均纯净,且所述相邻区域的颜色分布不纯净和/或所述相邻区域与所述边框区域的颜色分布不相近,则:
若所述对称区域的颜色分布不纯净和/或所述对称区域与所述边框区域的颜色分布不相近,则确定所述待检测图像的边框包括所述初始边框但不包括与所述初始边框对称的边框,或者,若所述对称区域的颜色分布纯净且所述对称区域与所述边框区域的颜色分布相近,则确定所述待检测图像的边框包括所述初始边框以及与所述初始边框对称的边框。
27.根据权利要求23-25任一项所述的装置,其中,所述校验子单元包括:
第三校验子单元,用于若所述待检测图像的对称边中的两边均具有初始边框,对于对称边中任一边的初始边框,若所述边框区域的颜色分布纯净,且所述相邻区域的颜色分布不纯净和/或所述相邻区域与所述边框区域的颜色分布不相近,则确定所述待检测图像的边框包括所述初始边框。
28.根据权利要求23-25任一项所述的装置,其中,所述校验子单元包括:
第四校验子单元,用于若所述边框区域的颜色分布纯净,且所述相邻区域的颜色分布不纯净和/或及所述相邻区域与所述边框区域的颜色分布不相近,且对称边框区域的颜色分布纯净,对称相邻区域的颜色分布不纯净和/或所述对称相邻区域与所述对称边框区域的颜色分布不相近,则确定所述待检测图像的边框包括对称边的两个初始边框。
29.根据权利要求16-19任一项所述的装置,其中,所述第一确定模块包括:
第三确定单元,用于对所述待检测图像进行边缘检测得到边缘图,并对所述待检测图像进行文字识别,确定文字所在区域;
第四确定单元,用于将所述边缘图中所述文字所在区域转变为黑色后,对所述边缘图进行直线检测,并确定检测到的直线中的所述目标线段。
30.根据权利要求16-19任一项所述的装置,其中,所述待检测图像为视频封面;所述装置还包括:
第五确定单元,用于确定所述视频封面的边框的宽度;
屏蔽单元,用于若所述宽度大于预设阈值,则对所述视频封面对应的视频进行屏蔽。
31.一种电子设备,包括:
至少一个处理器;以及与至少一个处理器通信连接的存储器;
其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行权利要求1-15中任一项所述的方法。
32.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-15中任一项所述的方法。
33.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1-15中任一项所述的方法。
CN202210326874.0A 2022-03-30 2022-03-30 图像边框的检测方法、装置及电子设备 Active CN114612492B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210326874.0A CN114612492B (zh) 2022-03-30 2022-03-30 图像边框的检测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210326874.0A CN114612492B (zh) 2022-03-30 2022-03-30 图像边框的检测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN114612492A true CN114612492A (zh) 2022-06-10
CN114612492B CN114612492B (zh) 2023-01-31

Family

ID=81867068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210326874.0A Active CN114612492B (zh) 2022-03-30 2022-03-30 图像边框的检测方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN114612492B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070127774A1 (en) * 2005-06-24 2007-06-07 Objectvideo, Inc. Target detection and tracking from video streams
US20080062164A1 (en) * 2006-08-11 2008-03-13 Bassi Zorawar System and method for automated calibration and correction of display geometry and color
US20090154808A1 (en) * 2007-12-13 2009-06-18 Feng Gao Method and apparatus for segmenting an object region of interest from an image
WO2014051581A1 (en) * 2012-09-27 2014-04-03 Hewlett-Packard Development Company, L.P. Clothing stripe detection based on line segment orientation
CN104112139A (zh) * 2014-06-30 2014-10-22 南京富士通南大软件技术有限公司 一种lpr车牌精确定位的方法和系统
CN109583442A (zh) * 2018-11-07 2019-04-05 北京智芯原动科技有限公司 基于线段检测的虚假车牌检测方法及装置
US10475250B1 (en) * 2018-08-30 2019-11-12 Houzz, Inc. Virtual item simulation using detected surfaces
CN111553943A (zh) * 2020-06-09 2020-08-18 山西农业大学 基于多元正态分布统计和水平集变分法的叶面积自动测量系统
CN111970556A (zh) * 2020-08-21 2020-11-20 广州欢网科技有限责任公司 视频画面黑边的处理方法及装置
CN112184837A (zh) * 2020-09-30 2021-01-05 百度(中国)有限公司 一种图像检测方法、装置、电子设备及存储介质
CN112241714A (zh) * 2020-10-22 2021-01-19 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备
CN112347887A (zh) * 2020-10-28 2021-02-09 深圳市优必选科技股份有限公司 一种物体检测方法、物体检测装置及电子设备
CN112561989A (zh) * 2020-12-23 2021-03-26 清华大学 一种建造场景下吊装对象的识别方法
CN112634235A (zh) * 2020-12-24 2021-04-09 深圳艾灵网络有限公司 产品图像的边界检测方法和电子设备
US20220036568A1 (en) * 2020-07-30 2022-02-03 Walmart Apollo, Llc Systems and methods for detecting and tracking humans in captured images

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070127774A1 (en) * 2005-06-24 2007-06-07 Objectvideo, Inc. Target detection and tracking from video streams
US20080062164A1 (en) * 2006-08-11 2008-03-13 Bassi Zorawar System and method for automated calibration and correction of display geometry and color
US20090154808A1 (en) * 2007-12-13 2009-06-18 Feng Gao Method and apparatus for segmenting an object region of interest from an image
WO2014051581A1 (en) * 2012-09-27 2014-04-03 Hewlett-Packard Development Company, L.P. Clothing stripe detection based on line segment orientation
CN104112139A (zh) * 2014-06-30 2014-10-22 南京富士通南大软件技术有限公司 一种lpr车牌精确定位的方法和系统
US10475250B1 (en) * 2018-08-30 2019-11-12 Houzz, Inc. Virtual item simulation using detected surfaces
CN109583442A (zh) * 2018-11-07 2019-04-05 北京智芯原动科技有限公司 基于线段检测的虚假车牌检测方法及装置
CN111553943A (zh) * 2020-06-09 2020-08-18 山西农业大学 基于多元正态分布统计和水平集变分法的叶面积自动测量系统
US20220036568A1 (en) * 2020-07-30 2022-02-03 Walmart Apollo, Llc Systems and methods for detecting and tracking humans in captured images
CN111970556A (zh) * 2020-08-21 2020-11-20 广州欢网科技有限责任公司 视频画面黑边的处理方法及装置
CN112184837A (zh) * 2020-09-30 2021-01-05 百度(中国)有限公司 一种图像检测方法、装置、电子设备及存储介质
CN112241714A (zh) * 2020-10-22 2021-01-19 北京字跳网络技术有限公司 图像中指定区域的识别方法、装置、可读介质和电子设备
CN112347887A (zh) * 2020-10-28 2021-02-09 深圳市优必选科技股份有限公司 一种物体检测方法、物体检测装置及电子设备
CN112561989A (zh) * 2020-12-23 2021-03-26 清华大学 一种建造场景下吊装对象的识别方法
CN112634235A (zh) * 2020-12-24 2021-04-09 深圳艾灵网络有限公司 产品图像的边界检测方法和电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈飞等: "复杂环境下的交通标志检测与识别方法综述", 《计算机工程与应用》 *

Also Published As

Publication number Publication date
CN114612492B (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
US10896349B2 (en) Text detection method and apparatus, and storage medium
WO2021189889A1 (zh) 场景图像中的文本检测方法、装置、计算机设备及存储介质
CN111241927A (zh) 级联式人脸图像优选方法、系统、设备及可读存储介质
CN113691733B (zh) 视频抖动检测方法、装置、电子设备和存储介质
CN107038441B (zh) 书写板检测和校正
WO2020151156A1 (zh) 视频流播放方法、系统、计算机装置及可读存储介质
CN111368717A (zh) 视线确定方法、装置、电子设备和计算机可读存储介质
CN112995535B (zh) 用于处理视频的方法、装置、设备以及存储介质
WO2023273344A1 (zh) 车辆跨线识别方法、装置、电子设备和存储介质
WO2023147717A1 (zh) 文字检测方法、装置、电子设备和存储介质
CN112184837A (zh) 一种图像检测方法、装置、电子设备及存储介质
CN115294332A (zh) 一种图像处理方法、装置、设备和存储介质
CN114037087B (zh) 模型训练方法及装置、深度预测方法及装置、设备和介质
CN115272290A (zh) 一种缺陷检测方法、装置、电子设备及存储介质
CN114612492B (zh) 图像边框的检测方法、装置及电子设备
CN116259064A (zh) 表格结构识别方法、表格结构识别模型的训练方法及装置
CN113378847B (zh) 字符分割方法、系统、计算机设备和存储介质
CN112991308B (zh) 一种图像质量的确定方法、装置、电子设备和介质
CN113221742B (zh) 视频分屏线确定方法、装置、电子设备、介质和程序产品
CN112489450B (zh) 交通路口处的车辆流量控制方法、路侧设备及云控平台
CN115018730A (zh) 一种图像条纹噪声的去除方法、装置、设备及介质
US20220351493A1 (en) Method and apparatus for detecting object, electronic device and storage medium
CN113643266B (zh) 图像检测方法、装置及电子设备
US20220375118A1 (en) Method and apparatus for identifying vehicle cross-line, electronic device and storage medium
CN115187585A (zh) 一种缺陷检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant