CN106384111A - 图片检测方法和装置 - Google Patents

图片检测方法和装置 Download PDF

Info

Publication number
CN106384111A
CN106384111A CN201610770975.1A CN201610770975A CN106384111A CN 106384111 A CN106384111 A CN 106384111A CN 201610770975 A CN201610770975 A CN 201610770975A CN 106384111 A CN106384111 A CN 106384111A
Authority
CN
China
Prior art keywords
picture
text
input picture
determined
described input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610770975.1A
Other languages
English (en)
Other versions
CN106384111B (zh
Inventor
张阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing 58 Information Technology Co Ltd
Original Assignee
Beijing 58 Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing 58 Information Technology Co Ltd filed Critical Beijing 58 Information Technology Co Ltd
Priority to CN201610770975.1A priority Critical patent/CN106384111B/zh
Publication of CN106384111A publication Critical patent/CN106384111A/zh
Application granted granted Critical
Publication of CN106384111B publication Critical patent/CN106384111B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种图片检测方法和装置,该方法包括:对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片;若是,则确定输入图片为违规图片;若否,则对输入图片进行文本检测,判断输入图片是否包含文本;若是,则确定输入图片为违规图片。本发明提供的图片检测方法和装置,考虑到现有的大部分违规图片为使广告直接明显,通常直接将违规文字信息直接以图片形式显示,且纯文本图片检测算法的复杂度比图片中的文本检测的复杂度低,检测速度快,因此在对输入图片进行文本检测之前,增加纯文本图片检测的步骤,可提高违规图片的检测速度。

Description

图片检测方法和装置
技术领域
本发明涉及图像处理领域,尤其涉及一种图片检测方法和装置。
背景技术
随着网络技术的发展,越来越多的用户可以根据业务需要,通过网络在不同的网站或应用软件上进行商品、技术或其他内容的展示,展示方式主要包括文字、图片、视频等。但是,部分恶意用户上传的图片中可能存在各类违规图片,如广告图片、违法图片等。
网站的运营商需针对用户上传的图片,进行图片是否违规的检测,当检测到违规图片时,可停止图片的正常显示。针对图片中可能存在广告,现有的检测方法主要采用图像文字检测技术对所有图片进行检测,检测是否存在文字区域,并对检测到的文字区域进行光学字符识别,识别其中的联系方式。
由于图像文字检测技术较为复杂,耗时较长,现有技术中针对所有图片统一采用较为复杂的图像文字检测技术进行处理,导致违规图片检测的速度较慢。
发明内容
本发明提供一种图片检测方法和装置,用以解决现有的违规图片检测方法存在检测速度慢的问题。
本发明一方面提供一种图片检测方法,包括:
对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片;
若是,则确定所述输入图片为违规图片;
若否,则对所述输入图片进行文本检测,判断所述输入图片是否包含文本;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测方法,若所述输入图片包含文本,则确定所述输入图片为违规图片,包括:
若所述输入图片包含文本,判断所述文本中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测方法,若所述文本中包含联系方式,则确定所述输入图片为违规图片,包括:
若所述文本中包含联系方式,判断所述联系方式与预设联系方式是否一致;
若否,则确定所述输入图片为违规图片。
如上所述的图片检测方法,若所述输入图片为纯文本图片,所述方法还包括:
判断所述输入图片中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测方法,若所述输入图片中包含联系方式,则确定所述输入图片为违规图片,包括:
若所述输入图片中包含联系方式,判断所述联系方式与预设联系方式是否一致;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测方法,所述对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片,包括:
对所述输入图片进行缩放处理、二值化处理、连通域标定处理,得到至少一个连通域;
对所述至少一个连通域进行过滤和融合,得到处理后的待确定连通域;
判断所有所述待确定连通域是否均为文本类连通域;
若是,则确定所述输入图片为纯文本图片;
若否,则确定所述输入图片不是纯文本图片。
如上所述的图片检测方法,所述判断所述输入图片中是否包含联系方式,包括:
判断所有所述待确定连通域中是否存在数字连通域;
若否,则确定所述输入图片中不包含联系方式;
若是,则对所述数字连通域进行字符识别,得到第一识别结果;判断所述第一识别结果是否符合预设联系方式规则;
若是,则确定所述输入图片中包含联系方式;
若否,则确定所述输入图片中不包含联系方式。
如上所述的图片检测方法,所述对所述输入图片进行文本检测,判断所述输入图片是否包含文本,包括:
对所述输入图片进行最大稳定极值区域检测,得到至少一个区域;
对所述至少一个区域进行过滤和融合,得到处理后的待确定区域;
判断所有所述待确定区域中是否存在文本区域;
若是,则确定所述输入图片包含文本;
若否,则确定所述输入图片不包含文本。
如上所述的图片检测方法,所述若所述输入图片包含文本,判断所述文本中是否包含联系方式,包括:
判断所述文本区域中是否存在数字文本区域;
若否,则确定所述文本中不包含联系方式;
若是,则对所述数字文本区域进行字符识别,得到第二识别结果;判断所述第二识别结果是否符合预设联系方式规则;
若是,则确定所述文本中包含联系方式;
若否,则确定所述文本中不包含联系方式。
下面介绍本发明实施例提供的一种图片检测装置,该装置与方法一一对应,用以实现上述实施例中的图片检测方法,具有相同的技术特征和技术效果,本发明对此不再赘述。
本发明另一方面提供一种图片检测装置,包括:
纯文本图片检测模块,用于对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片;若是,则确定所述输入图片为违规图片;
文本检测模块,用于在所述输入图片不是纯文本图片时,对所述输入图片进行文本检测,判断所述输入图片是否包含文本;若是,则确定所述输入图片为违规图片。
如上所述的图片检测装置,所述文本检测模块具体用于,若所述输入图片包含文本,判断所述文本中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测装置,所述文本检测模块具体用于,若所述文本中包含联系方式,判断所述联系方式与预设联系方式是否一致;若是,则确定所述输入图片为违规图片。
如上所述的图片检测装置,所述装置还包括:
联系方式检测模块,用于若所述输入图片为纯文本图片,判断所述输入图片中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
如上所述的图片检测装置,所述联系方式检测模块具体用于,
若所述输入图片中包含联系方式,判断所述联系方式与预设联系方式是否一致;
若否,则确定所述输入图片为违规图片。
如上所述的图片检测装置,所述纯文本图片检测模块包括:
连通域获取单元,用于对所述输入图片进行缩放处理、二值化处理、连通域标定处理,得到至少一个连通域;
连通域优化单元,用于对所述至少一个连通域进行过滤和融合,得到处理后的待确定连通域;
纯文本图片检测单元,用于判断所有所述待确定连通域是否均为文本类连通域;若是,则确定所述输入图片为纯文本图片;若否,则确定所述输入图片不是纯文本图片。
如上所述的图片检测装置,所述联系方式检测模块,具体用于,
判断所有所述待确定连通域中是否存在数字连通域;
若否,则确定所述输入图片中不包含联系方式;
若是,则对所述数字连通域进行字符识别,得到第一识别结果;判断所述第一识别结果是否符合预设联系方式规则;
若是,则确定所述输入图片中包含联系方式;
若否,则确定所述输入图片中不包含联系方式。
如上所述的图片检测装置,所述文本检测模块包括:
区域获取单元,用于对所述输入图片进行最大稳定极值区域检测,得到至少一个区域;
区域优化单元,用于对所述至少一个区域进行过滤和融合,得到处理后的待确定区域;
文本检测单元,用于判断所有所述待确定区域中是否存在文本区域;
若是,则确定所述输入图片包含文本;
若否,则确定所述输入图片不包含文本。
如上所述的图片检测装置,所述文本检测模块具体用于,
判断所述文本区域中是否存在数字文本区域;
若否,则确定所述文本中不包含联系方式;
若是,则对所述数字文本区域进行字符识别,得到第二识别结果;判断所述第二识别结果是否符合预设联系方式规则;
若是,则确定所述文本中包含联系方式;
若否,则确定所述文本中不包含联系方式。
本发明提供的图片检测方法和装置,考虑到现有的大部分违规图片为使广告直接明显,通常直接将违规文字信息直接以图片形式显示,且纯文本图片检测算法的复杂度比图片中的文本检测的复杂度低,检测速度快,因此在对输入图片进行文本检测之前,增加纯文本图片检测的步骤,可提高违规图片的检测速度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的图片检测方法实施例一的流程示意图;
图2为本发明提供的图片检测方法实施例二的流程示意图;
图3为本发明提供的图片检测方法实施例三的流程示意图;
图4为本发明提供的图片检测方法实施例四的流程示意图;
图5为本发明提供的图片检测方法实施例五的流程示意图;
图6为本发明提供的图片检测装置实施例一的结构示意图;
图7为本发明提供的图片检测装置实施例二的结构示意图;
图8为本发明提供的图片检测装置实施例三的结构示意图;
图9为本发明提供的图片检测装置实施例四的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
恶意用户通常将广告信息或违法信息等发布在用户量较大的网站、应用软件上,且考虑到文字审查速度快且准确率高,通常将上述信息以图片形式上传至网站或应用软件。网站或应用软件运营商需对用户上传的图片进行检测,阻止用户上传非法信息,现有检测方法主要为对用户上传的每一张图片或视频中的每一帧图片先进行图像文字检测、再进行光学字符识别,判断是否为非法信息,存在处理速度慢的问题。
为解决上述问题,本发明提供一种图片检测方法和装置,通过先判断图片是否为纯文本图片,再对图片进行复杂背景下的本文检测,以提高检测速度。下面采用具体实施例对本发明提供的图片检测方法和装置进行详细说明。
一方面本发明提供一种图片检测方法,图1为本发明提供的图片检测方法实施例一的流程示意图,该方法的执行主体为图片检测装置,该装置可以通过软件或硬件的方式实现,可直接集成在网站服务器中,本发明对此不做限定。如图1所示,该方法包括:
S101、对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片;若否,则执行S102;若是,则执行S103;
S102、对输入图片进行文本检测,判断输入图片是否包含文本;若是,则执行S103;
S103、确定输入图片为违规图片。
具体的,对于恶意用户上传的违规图片,可以为仅将违规文字信息以图片形式上传,也可以是将违规信息融合在具有复杂背景的图片中,以图片形式上传。不同的网站或应用软件可根据其业务种类确定违规图片的类型,示例性的,对于社交网站,考虑到用户上传的图片主要为日常生活、旅游、见闻等类型图片,该类图片中很少存在仅包含文字的纯文本图片,故可直接将用户上传的纯文本图片,视为包含广告信息或违法信息的违规图片,可减少违规图片检测工作量提高检测速度。
具体的,在S101中,图片检测装置可在检测到用户有上传图片时进行检测,也可在预设时间点对收收集到的图片进行集中检测。在对用户输入图片进行文本检测前,先对输入图片进行纯文本图片的检测,纯文本检测可以采用现有的纯文本检测技术,本发明对此不做限定。然后根据纯文本图片检测的检测结果,判断输入图片是否为纯文本图片。
具体的,当检测到输入图片为纯文本图片时,可直接确定输入图片为违规图片,无需再对输入图片进行文本检测,图片检测装置可直接采取相应的措施,如向用户提出告警,删除用户上传的图片等。由于纯文本图片检测算法的复杂度比图片中的文本检测的复杂度低,检测速度快,考虑到现有的大部分违规图片为使广告直接明显,通常直接将违规文字信息直接以图片形式显示,因此通过在对输入图片进行文本检测之前,增加纯文本图片检测的步骤,可提高违规图片的检测速度。
具体的,在S102中,当检测到输入图片不是纯文本图片,具有复杂的背景时,还需对输入图片进行文本检测,以判断输入图片是否包含文本,示例性的,当输入图片中包含本文时,可认为输入图片为违规图片,当输入图片中不包含文本时,可认为输入图片为合法图片。具体的文本检测方法可采用现有的文本检测方法,本发明对此不做限定。
本发明提供的图片检测方法,考虑到现有的大部分违规图片为使广告直接明显,通常直接将违规文字信息直接以图片形式显示,且纯文本图片检测算法的复杂度比图片中的文本检测的复杂度低,检测速度快,因此在对输入图片进行文本检测之前,增加纯文本图片检测的步骤,可提高违规图片的检测速度。
进一步的,在图1所示实施例的基础上,对S103中的确定输入图片为违规图片进行进一步的详细说明。图2为本发明提供的图片检测方法实施例二的流程示意图。如图2所示,该方法包括:
S201、对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片;若否,则执行S202;若是,则执行S204;
S202、对输入图片进行文本检测,判断输入图片是否包含文本;若是,则执行S203;
S203、判断文本中是否包含联系方式;若是,则执行S204;
S204、确定输入图片为违规图片。
其中,S201和S202与图1所示实施例中的S101和S102相同,本发明不再赘述。
示例性的,在对图片进行文本检测时,数字、汉字、字符等都属于文本,考虑到恶意用户为实现广告效果,在违规图片中将会存在清晰的联系方式,因此,为提高违规图片检测精度,可在确定输入图片中包含文本之后,对文本进行进一步检测,具体的,在S203中,判断文本中是否包含联系方式,示例性的,可采用机器学习算法对文本进行分类,确定每个文本类型,对其中确定为数字文本的文本再进行字符识别,判断是否包含联系方式。当确定存在包含联系方式时,则确定输入为违规图片,当输入图片中不包含联系方式时,则确定输入图片为合法图片。
进一步的,考虑到部分商品销售网站中,商家可能会在图片中添加商家联系方式,因此,可在确定文本中包含联系方式后,判断联系方式与预设联系方式是否一致;若是,则确定输入图片为违规图片。
具体的,为提高违规图片检测精度,可将输入图片中识别出的联系方式与商家在网站中的预设联系方式进行比较,若是,则确认输入图片为合法图片;若否,则确认输入图片为违规图片,可能为合法商家的账户被恶意用户盗用等。
进一步的,在图1或图2实施例的基础上,对S103中的确定输入图片为违规图片进行进一步的详细说明。图3为本发明提供的图片检测方法实施例三的流程示意图。如图3所示,该方法包括:
S301、对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片;若否,则执行S302;若是,则执行S303;
S302、对输入图片进行文本检测,判断输入图片是否包含文本;若是,则执行S304;
S303、判断所述输入图片中是否包含联系方式;若是,则执行S304;
S304、确定输入图片为违规图片。
其中,S301和S302与图1所示实施例中的S101和S102相同,本发明不再赘述。
示例性的,与图2所示实施例相似,为提高违规图片检测精度,可在确定输入图片为纯文本图片之后,对输入图片进行进一步检测,具体的,在S303中,判断纯文本图片中是否包含联系方式,示例性的,在判断输入图片是否为纯文本图片时,已获得输入图片中的文本,可采用机器学习算法对输入图片中的文本进行分类,确定每个文本类型,对其中确定为数字文本的文本再进行字符识别,判断是否包含联系方式。当确定存在包含联系方式时,则确定输入为违规图片,当输入图片中不包含联系方式时,则确定输入图片为合法图片。
进一步的,与图2所示实施例相似,在确定输入图片中包含联系方式后,判断联系方式与预设联系方式是否一致;若是,则确定输入图片为违规图片。
进一步的,在上述任一实施例的基础上,对纯文本图片检测的过程进行详细说明。图4为本发明提供的图片检测方法实施例四的流程示意图。如图4所示,对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片,包括:
S401、对输入图片进行缩放处理、二值化处理、连通域标定处理,得到至少一个连通域;
S402、对至少一个连通域进行过滤和融合,得到处理后的待确定连通域;
S403、判断所有待确定连通域是否均为文本类连通域;若是,则执行S404;若否,则执行S405;
S404、确定输入图片为纯文本图片;
S405、确定输入图片不是纯文本图片。
具体的,在S401中,考虑到当输入图片较大,包含像素点较多时,图片细节较为丰富,纯文本检测过程中需处理数据较多,导致检测速度变慢,可首先对输入图片进行缩放处理,得到缩小后的图片。示例性的,例如原输入图片为包括1200×1200个像素点的图片时,为简化处理过程,可先将原输入图片进行缩小,示例性的,可将原输入图片缩小得到一个包含600×600个像素点的图片。对于纯文本图片,可以认为是由文本叠加在单色背景图片得到,文本区域与背景区域存在明显的亮度差别,以使人眼能迅速获取文本信息。因此可对缩小后的图片进行二值化处理,示例性的,获取缩小后的图片的亮度分量,对亮度分量进行二值化处理,分离出背景和文本。然后根据二值化处理结果进行连通域标定,得到多个连通域,一个连通域即可认为是一个文本。
具体的,在S402中,为提高检测结果准确性,可对检测得到的连通域进行过滤与融合,将包含像素点较少的连通域视为噪声点,进行滤除。并根据各个连通域之间的距离确定是否将一个文本划分为两个连通域,可将两个连通域融合为一个连通域,得到处理后的待确定连通域。
具体的,在S403中,对所有待确定连通域采用机器学习算法进行分类,根据文本连通域本身具有的结构特性,可将文本连通域与其他连通域划分。示例性的,也可采用特征匹配算法,将各待确定连通域与预设的文本连通域进行特征匹配,当发现特征相互匹配时,则确定为文本连通域。通过对所有待确定连通域进行识别,可确定是否输入图片中的所有待确定连通域均为文本连通域。若是,则执行S404,确定输入图片为纯文本图片;若否,则执行S405,确定输入图片不是纯文本图片。
进一步的,在上述任一实施例的基础上,对非纯文本图片的文本检测过程进行详细说明。图5为本发明提供的图片检测方法实施例五的流程示意图。如图5所示,对输入图片进行文本检测,判断输入图片是否包含文本,包括:
S501、对输入图片进行最大稳定极值区域检测,得到至少一个区域;
S502、对至少一个区域进行过滤和融合,得到处理后的待确定区域;
S503、判断所有待确定区域中是否存在文本区域;若是,则执行S504;若否,则执行S505;
S504、确定输入图片包含文本;
S505、确定输入图片不包含文本。
具体的,在S501中,考虑到输入图片为非纯文本图片,其背景结构复杂,文本与背景无法通过二值化处理直接区分,故采用与纯文本图片的文本检测方法不同的方法,示例性的,对输入图片采用最大稳定极值区域检测,获取多个区域。
具体的,在S502中,与图4所示实施例中的S402相似,对多个区域进行过滤和融合,滤除面积过小的区域,并将相连的区域融合为一个区域,得到待确定区域。
具体的,在S503中,与图4所示实施例中的S403相似,对所有待确定区域采用机器学习算法进行分类,或采用特征匹配算法与已有的文本区域进行匹配。通过对所有待确定区域进行识别,可确定待确定区域中是否存在文本区域。若是,则执行S504,确定输入图片中包含文本;若否,则执行S505,确定输入图片中不包含文本,即输入图片不是违规图片。
进一步的,在图4和图5所示实施例的基础上,当确定图片中存在文本时,对进一步确定文本中是否包含联系方式的过程进行详细说明。具体的,判断文本连通域或文本区域中是否包含联系方式,包括:
S001、判断文本连通域或文本区域中是否存在数字连通域或数字文本区域;若是,则执行S002;若否,则执行S005;
S002、对数字连通域或数字文本区域进行字符识别,得到识别结果;
S003、判断识别结果是否符合预设联系方式规则;若是,则执行S004;若否,则执行S005;
S004、确定包含联系方式;
S005、确定不包含联系方式。
具体的,在S001中,判断文本连通域或文本区域中是否存在数字连通域或数字文本区域,可选的,可根据S403或S503中的分类结果直接确定。也可根据数字文本本身的结构特征,进行特征匹配。
具体的,当确定存在数字连通域或数字文本区域时,执行S002,进行字符识别,示例性的,字符识别算法可以采用光学字符识别。也可以对数字连通域或数字文本区域依次进行分割、特征提取、分类、匹配处理,进行字符识别。
具体的,在识别出字符,得到识别结果后,在S003中,判断识别结果是否符合预设联系方式规则。示例性的,联系方式主要包括手机、座机、聊天软件账号等。因此,可根据手机号码、座机号码长度设置预设联系方式规则,例如文本长度应大于7位,小于10位。当识别结果为一串数字时,当数字位数仅为3位时,可认为该串数字不属于联系方式,当数字位数达到9位时,且第一位为1时,可认为该串数字为一个手机号码。故当符合预设联系方式规则时,可确定输入图片中包含联系方式,当不符合预设联系方式规则时,确定输入图片中不包含联系方式。
可选的,在实际应用过程中,图片检测装置也可仅将各个步骤中的判断结果输出,由网站或应用软件管理人员判断是否为违规图片。
本发明另一方面还提供的一种图片检测装置,该装置可以由软件/硬件实现,本发明对此不做限定。该装置与方法实施例一一对应,用以实现上述实施例中的图片检测方法,具有相同的技术特征和技术效果,本发明实施例对此不再赘述。
图6为本发明提供的图片检测装置实施例一的结构示意图。如图6所示,该装置包括:
纯文本图片检测模块601,用于对输入图片进行纯文本图片检测,判断输入图片是否为纯文本图片;若是,则确定输入图片为违规图片;
文本检测模块602,用于在输入图片不是纯文本图片时,对输入图片进行文本检测,判断输入图片是否包含文本;若是,则确定输入图片为违规图片。
可选的,文本检测模块602具体用于,若输入图片包含文本,判断文本中是否包含联系方式;
若是,则确定输入图片为违规图片。
可选的,文本检测模块602具体用于,若文本中包含联系方式,判断联系方式与预设联系方式是否一致;若是,则确定输入图片为违规图片。
进一步的,在图6所示实施例的基础上,图7为本发明提供的图片检测装置实施例二的结构示意图。如图7所示,图片检测装置还包括:
联系方式检测模块603,用于若输入图片为纯文本图片,判断输入图片中是否包含联系方式;
若是,则确定输入图片为违规图片。
可选的,联系方式检测模块603具体用于,
若输入图片中包含联系方式,判断联系方式与预设联系方式是否一致;
若否,则确定输入图片为违规图片。
可选的,上述任一实施例的基础上,图8为本发明提供的图片检测装置实施例三的结构示意图。如图8所示,纯文本图片检测模块601包括:
连通域获取单元801,用于对输入图片进行缩放处理、二值化处理、连通域标定处理,得到至少一个连通域;
连通域优化单元802,用于对至少一个连通域进行过滤和融合,得到处理后的待确定连通域;
纯文本图片检测单元803,用于判断所有待确定连通域是否均为文本类连通域;若是,则确定输入图片为纯文本图片;若否,则确定输入图片不是纯文本图片。
可选的,联系方式检测模块603,具体用于,
判断所有待确定连通域中是否存在数字连通域;
若否,则确定输入图片中不包含联系方式;
若是,则对数字连通域进行字符识别,得到第一识别结果;判断第一识别结果是否符合预设联系方式规则;
若是,则确定输入图片中包含联系方式;
若否,则确定输入图片中不包含联系方式。
进一步的,在上述任一实施例的基础上,图9为本发明提供的图片检测装置实施例四的结构示意图。如图9所示,文本检测模块602包括:
区域获取单元901,用于对输入图片进行最大稳定极值区域检测,得到至少一个区域;
区域优化单元902,用于对至少一个区域进行过滤和融合,得到处理后的待确定区域;
文本检测单元903,用于判断所有待确定区域中是否存在文本区域;若是,则确定输入图片包含文本;若否,则确定输入图片不包含文本。
可选的,文本检测模块602具体用于,判断文本区域中是否存在数字文本区域;
若否,则确定文本中不包含联系方式;
若是,则对数字文本区域进行字符识别,得到第二识别结果;判断第二识别结果是否符合预设联系方式规则;
若是,则确定文本中包含联系方式;
若否,则确定文本中不包含联系方式。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。另外,本发明所提供的几个实施例可以整体或部分的相互结合形成新的实施例,而这些新的实施例,仍属于本发明范围内。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种图片检测方法,其特征在于,包括:
对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片;
若是,则确定所述输入图片为违规图片;
若否,则对所述输入图片进行文本检测,判断所述输入图片是否包含文本;
若是,则确定所述输入图片为违规图片。
2.根据权利要求1所述的方法,其特征在于,若所述输入图片包含文本,则确定所述输入图片为违规图片,包括:
若所述输入图片包含文本,判断所述文本中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
3.根据权利要求2所述的方法,其特征在于,若所述文本中包含联系方式,则确定所述输入图片为违规图片,包括:
若所述文本中包含联系方式,判断所述联系方式与预设联系方式是否一致;
若否,则确定所述输入图片为违规图片。
4.根据权利要求1所述的方法,其特征在于,若所述输入图片为纯文本图片,所述方法还包括:
判断所述输入图片中是否包含联系方式;
若是,则确定所述输入图片为违规图片。
5.根据权利要求4所述的方法,其特征在于,若所述输入图片中包含联系方式,则确定所述输入图片为违规图片,包括:
若所述输入图片中包含联系方式,判断所述联系方式与预设联系方式是否一致;
若是,则确定所述输入图片为违规图片。
6.根据权利要求4所述的方法,其特征在于,所述对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片,包括:
对所述输入图片进行缩放处理、二值化处理、连通域标定处理,得到至少一个连通域;
对所述至少一个连通域进行过滤和融合,得到处理后的待确定连通域;
判断所有所述待确定连通域是否均为文本类连通域;
若是,则确定所述输入图片为纯文本图片;
若否,则确定所述输入图片不是纯文本图片。
7.根据权利要求6所述的方法,其特征在于,所述判断所述输入图片中是否包含联系方式,包括:
判断所有所述待确定连通域中是否存在数字连通域;
若否,则确定所述输入图片中不包含联系方式;
若是,则对所述数字连通域进行字符识别,得到第一识别结果;判断所述第一识别结果是否符合预设联系方式规则;
若是,则确定所述输入图片中包含联系方式;
若否,则确定所述输入图片中不包含联系方式。
8.根据权利要求2所述的方法,其特征在于,所述对所述输入图片进行文本检测,判断所述输入图片是否包含文本,包括:
对所述输入图片进行最大稳定极值区域检测,得到至少一个区域;
对所述至少一个区域进行过滤和融合,得到处理后的待确定区域;
判断所有所述待确定区域中是否存在文本区域;
若是,则确定所述输入图片包含文本;
若否,则确定所述输入图片不包含文本。
9.根据权利要求8所述的方法,其特征在于,所述若所述输入图片包含文本,判断所述文本中是否包含联系方式,包括:
判断所述文本区域中是否存在数字文本区域;
若否,则确定所述文本中不包含联系方式;
若是,则对所述数字文本区域进行字符识别,得到第二识别结果;判断所述第二识别结果是否符合预设联系方式规则;
若是,则确定所述文本中包含联系方式;
若否,则确定所述文本中不包含联系方式。
10.一种图片检测装置,其特征在于,包括:
纯文本图片检测模块,用于对输入图片进行纯文本图片检测,判断所述输入图片是否为纯文本图片;若是,则确定所述输入图片为违规图片;
文本检测模块,用于在所述输入图片不是纯文本图片时,对所述输入图片进行文本检测,判断所述输入图片是否包含文本;若是,则确定所述输入图片为违规图片。
CN201610770975.1A 2016-08-30 2016-08-30 图片检测方法和装置 Active CN106384111B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610770975.1A CN106384111B (zh) 2016-08-30 2016-08-30 图片检测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610770975.1A CN106384111B (zh) 2016-08-30 2016-08-30 图片检测方法和装置

Publications (2)

Publication Number Publication Date
CN106384111A true CN106384111A (zh) 2017-02-08
CN106384111B CN106384111B (zh) 2020-03-31

Family

ID=57938288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610770975.1A Active CN106384111B (zh) 2016-08-30 2016-08-30 图片检测方法和装置

Country Status (1)

Country Link
CN (1) CN106384111B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523591A (zh) * 2018-11-21 2019-03-26 北京锐安科技有限公司 图片的处理方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276417A (zh) * 2008-04-17 2008-10-01 上海交通大学 基于内容的互联网动画媒体垃圾信息过滤方法
CN101789111A (zh) * 2009-12-30 2010-07-28 中国科学院自动化研究所 一种场所广告与电子广告数据实时交互的系统
CN104270304A (zh) * 2014-10-14 2015-01-07 四川神琥科技有限公司 一种图像邮件的检测分析方法
CN104298982A (zh) * 2013-07-16 2015-01-21 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
CN104376304A (zh) * 2014-11-18 2015-02-25 新浪网技术(中国)有限公司 一种文本广告图像的识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101276417A (zh) * 2008-04-17 2008-10-01 上海交通大学 基于内容的互联网动画媒体垃圾信息过滤方法
CN101789111A (zh) * 2009-12-30 2010-07-28 中国科学院自动化研究所 一种场所广告与电子广告数据实时交互的系统
CN104298982A (zh) * 2013-07-16 2015-01-21 深圳市腾讯计算机系统有限公司 一种文字识别方法及装置
CN104270304A (zh) * 2014-10-14 2015-01-07 四川神琥科技有限公司 一种图像邮件的检测分析方法
CN104376304A (zh) * 2014-11-18 2015-02-25 新浪网技术(中国)有限公司 一种文本广告图像的识别方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王新艳: "基于内容的网页图片广告检测技术的研究与实现", 《软件》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109523591A (zh) * 2018-11-21 2019-03-26 北京锐安科技有限公司 图片的处理方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN106384111B (zh) 2020-03-31

Similar Documents

Publication Publication Date Title
WO2020141961A1 (en) Method and apparatus for retrieving intelligent information from electronic device
CN108921002A (zh) 基于多线索融合的暴恐音视频识别方法及装置
CN108734106A (zh) 基于对比的快速暴恐视频识别方法
WO2021169616A1 (zh) 非活体人脸的检测方法、装置、计算机设备及存储介质
CN108961183A (zh) 图像处理方法、终端设备及计算机可读存储介质
CN103870799A (zh) 字符方向判断方法及装置
CN113850627B (zh) 电梯广告展示方法、装置和电子设备
CN109068150A (zh) 一种视频的精彩画面提取方法、终端及计算机可读介质
CN110191356A (zh) 视频审核方法、装置和电子设备
CN103237165A (zh) 实时查看名片扩展信息的方法及电子设备
US20200244792A1 (en) Method for inputting and processing phone number, mobile terminal and storage medium
CN111783515A (zh) 行为动作识别的方法和装置
CN111739181A (zh) 考勤方法及装置、电子设备及存储介质
CN108363944A (zh) 人脸识别终端双摄防伪方法、装置及系统
CN106384111A (zh) 图片检测方法和装置
CN113011254A (zh) 一种视频数据处理方法、计算机设备及可读存储介质
CN111093046B (zh) 一种基于图像采集设备的显示屏开启方法及终端设备
CN110147817B (zh) 训练数据集生成方法及装置
CN114840477B (zh) 一种基于云会议的文件敏感指数确定方法及相关产品
US11068121B2 (en) System and method for visual exploration of subnetwork patterns in two-mode networks
CN114155580A (zh) 一种红外图像处理、活体检测方法及装置
US11048713B2 (en) System and method for visual exploration of search results in two-mode networks
CN109242763B (zh) 图片处理方法、图片处理装置、终端设备
CN118296645A (zh) 信息分享方法、电子设备及可读存储介质
CN110084099A (zh) 基于图像识别技术的信息反馈方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant