CN111462035B - 一种图片检测方法及装置 - Google Patents
一种图片检测方法及装置 Download PDFInfo
- Publication number
- CN111462035B CN111462035B CN202010069136.3A CN202010069136A CN111462035B CN 111462035 B CN111462035 B CN 111462035B CN 202010069136 A CN202010069136 A CN 202010069136A CN 111462035 B CN111462035 B CN 111462035B
- Authority
- CN
- China
- Prior art keywords
- gray
- straight line
- picture
- determining
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 51
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012216 screening Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
一种图片检索方法,包括检测图片中的所有直线,并筛选出符合预设条件的直线;根据筛选出的直线检测轮廓;根据所检测出的轮廓,在所述图片中确定目标区域。本申请能够通过检测出图片中的轮廓区域,并通过轮廓检测快速确定目标区域,从而极大方便了工业上的应用。
Description
技术领域
本文涉及计算机技术,尤指一种图片检测方法及装置。
背景技术
通常当需要锁定多张图片,或者视频中是否包含搜寻目标,需要进行大量的人工比对,耗时耗力,并且容易遗漏。
例如,在广告监测任务中,我们需要检测一张图片A中是否包含指定的广告图片B。图片A可能来源于网页截图、手机上视频播放器截图、手机拍摄的广告海报图片等,图片B为广告商提供的广告素材图片。
若,图片A中存在一个矩形(或近似矩形)框a,该矩形框和图片B具有相同的内容,二者之间可能会有一些细微的差别如大小、长宽比、光照条件、文字噪音等细微的差别。如何从图片A中检测出矩形框a,并判断其是否为图片B,是广告监测中一项很重要的任务。
现有技术一般会使用滑动窗口的方法,采用不同大小、长宽比的窗口在图片A上滑动,得到多个矩形框后,分别和图片B进行比较。但是滑动窗口的大小、长宽比和滑动步长不易确定,多个窗口极大增加了计算成本,此外得到的矩形框通常不够精确。
现有技术也会采用基于目标检测的方法,训练一个用于目标检测的卷积神经网络,该网络的输入是图片,输出为图片中矩形框的位置。但是需要大量的标记数据进行训练。此外,由于图片A中矩形框的内容并不包含类别信息,而目标检测的目的是检测出包含特定类别的矩形框。因而目标检测方法的适用性有限,只能检测特定种类的图片。往病史,如果小于45岁,需要得知用户的职业信息进而判断其是否久坐).
因此,如何根据众多限制条件为用户提供一种高效的信息检索系统成为一项亟待解决的新问题。
发明内容
本申请提供了一种图片检测方法及装置,能够达到快速准确地检测出图片中的所有轮廓区域,通过轮廓检测快速确定目标区域目的。
本申请提供了一种图片检索方法,包括检测图片中的直线,并筛选出符合预设条件的直线;根据所筛选出的直线检测轮廓;根据所检测出的轮廓,在所述图片中确定目标区域。
在一个示例性实施例中,所述检测图片中的直线,包括:将图片转换为灰度图,在所述灰度图中检测出所述直线。
在一个示例性实施例中,所述根据筛选出的直线检测轮廓,包括:获取所筛选出的直线中每条直线两侧的灰度值;根据所获取的所筛选出的每条直线两侧的灰度值,确定灰度阈值;根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测。
在一个示例性实施例中,所述根据所获取的所筛选出的直线两侧的灰度值,确定灰度阈值,包括以下方式之一:对所筛选出的直线的两侧的灰度值范围进行聚类,通过聚类中心确定灰度阈值;根据所筛选出的直线两侧的最大灰度值构建数组确定灰度阈值。
在一个示例性实施例中,当所确定的灰度阈值包括多个时,所述根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,包括:根据能区分直线的数目按照由多到少的顺序对所述多个灰度阈值进行排序;根据所得到的多个灰度阈值的排序顺序,分别对灰度图进行二值化得到每个灰度阈值对应的二值化图片;对每张所得到的二值化图片进行轮廓检测。
在一个示例性实施例中,所述根据所检测出的轮廓,在所述图片中确定目标区域,包括:根据所检测出的每张二值化图片的轮廓分别对所述灰度图进行切割,得到最终的灰度图为所述目标区域。
在一个示例性实施例中,根据所检测出的轮廓,在所述图片中确定目标区域,包括:提取所述轮廓的对角点,根据所提取的对角点在所述图片中确定目标区域。
在一个示例性实施例中,所述根据所检测出的轮廓,在所述图片中确定目标区域之后,还包括:将所确定的目标区域对应的图像与预设图像进行对比,若相似度满足预设条件则确定所述图片为包含预设图像的目标图片。
本申请提供了一种图片检索装置,包括:直线检测模块,用于检测图片中的直线,并筛选出符合预设条件的直线;轮廓检测模块,用于根据筛选出的直线检测轮廓;确定模块,用于根据所检测出的轮廓,在所述图片中确定目标区域。
在一个示例性实施例中,所述直线检测模块,用于检测图片中的直线,是指:直线检测模块将图片转换为灰度图,在所述灰度图中检测出所述直线。
与相关技术相比,本申请通过对图片进行直线检测,从而检测出图片中的轮廓,通过轮廓确定图片的目标区域,速度快且效率高。
在一个示例性实施例中,本申请实施例采用对原始彩色图片进行灰度处理后进行后续处理,能够减少计算机的处理数据,提高后续处理速度和精度。
在一个示例性实施例中,本申请通过自动对灰度阈值进行确定,不需要人为设置图片灰度化的阈值,自动对图片做灰度化处理。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中所描述的方案来实现和获得。
附图说明
附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
图1为本申请实施例图片检测方法流程图;
图2为本申请实施例视频图片灰度处理图;
图3为本申请实施例灰度处理图检测出的直线示意图;
图4为本申请实施例图片经二值化后的二值化图片;
图5为本申请实施例采用检测出的轮廓在图片中锁定的区域;
图6为本申请实施例经第一阈值处理后得到目标区域的图像;
图7为本申请实施例经第二阈值处理后得到的二值化图片;
图8为本申请图片检测装置模块示意图。
具体实施方式
本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。
本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。
此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。
如图1所示,本申请实施例一种图片检索方法,包括如下步骤:
S1、检测图片中的直线,并筛选出符合预设条件的直线;
S2、根据所筛选出的直线检测轮廓;
S3、根据所检测出的轮廓,在所述图片中确定目标区域。
在一个示例性实施例中,可以采用霍夫变换检测灰度图中的所有直线。
在一个示例性实施例中,本申请实施例中的图片可以为任意来源图片,可以为视频中的帧图片,也可以为图片库中的图片等。
本申请实施例中可以通过对图片进行直线检测,找到图片中直线构成的轮廓,从而确定图片是否包含目标区域,能够自动从大量的图片中筛选出包含目标区域的图片,或者从大量或者长度较长的视频中检测出包含目标区域的帧图片,从而确定视频是否播放目标区域的内容。
在一个示例性实施例中,步骤S1中所述检测图片中的所有直线,包括:将图片转换为灰度图,在所述灰度图中检测出所有直线。
本申请实施例,采用对原始彩色图片进行灰度处理后进行后续处理,能够减少计算机的处理数据,提高后续处理速度和精度。
在一个示例性实施例中,步骤S2中所述根据筛选出的直线检测轮廓,包括如下步骤:
S21、获取所有筛选出的直线中每条直线两侧的灰度值;
S22、根据所获取的所筛选出的每条直线两侧的灰度值,确定灰度阈值;
S23、根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测。
本实施例中所筛选出的直线中每条直线两侧的灰度值是指以该直线为分界线两侧每侧的灰度值。由于直线的两侧存在多个像素点,故,直线每侧的灰度值可能只有一个,也可能有多个。当有多个时,可以选择每侧多个像素点的平均值作为该侧的灰度值,也可以选择最大值作为该侧的灰度值,具体的,根据实际情况,对直线的每一侧选择一个合适的灰度值。
本实施例中的灰度阈值是指选择一个或者多个灰度值能够将所筛选出的直线两侧的灰度值进行区分。例如,当第一条直线两侧的灰度值分别为X1=70,X2=255;第二直线两侧的灰度值分别为X1=10,X2=230;则可以在70-230之间选择任意一个灰度阈值来将第一条直线两侧的灰度阈和第二条直线两侧的灰度阈值均区分开。
在一个示例性实施例中,步骤S22中所述根据所获取的所有筛选出的直线两侧的灰度值,确定灰度阈值,可以通过以下方式确定:
第一种方式,对所筛选出的直线的两侧的灰度值范围进行聚类,通过聚类中心确定灰度阈值;
第二种方式,根据所筛选出的直线的两侧的最大灰度值构建数组确定灰度阈值。
将所筛选出的直线的两侧的最大灰度值存入预设的数组中进行排序确定灰度阈值。
在一个示例性实施例中,当所确定的灰度阈值包括多个时,步骤S23中所述根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,包括如下步骤:
S231、根据能区分直线数目按照由多到少的顺序对所述多个灰度阈值进行排序;
S232、根据所述多个灰度阈值的排序顺序,依次对灰度图进行二值化,得到每个灰度阈值对应的二值化图片;
S233、对每张所得到的二值化图片进行轮廓检测。
在一个示例性实施例中,步骤S3中所述根据所检测出的轮廓,在所述图片中确定目标区域,包括:根据所得到的每张二值化图片所检测出的轮廓分别对所述灰度图做切割,得到最终的灰度图为所述目标区域。
在一个示例性实施例中,步骤S3中所述根据所检测出的轮廓,在所述图片中确定目标区域,包括:提取所述轮廓的对角点,根据所提取的对角点在所述图片中确定目标区域。
示例性的,当目标区域为矩形时,由于两个对角点可以确定一个矩形框,所以当目标区域的轮廓为矩形框时,可以直接提取轮廓的两个对角点在原图片中提取目标区域;当轮廓为多边形轮廓时,同样也可采用多个角的点提取目标区域。在其他实施方式中,也可以通过直接采用轮廓确定目标区域。
在一个示例性实施例中,步骤S3中所述根据所检测出的轮廓,在所述图片中确定目标区域之后,还包括:
将所确定的目标区域对应的图像与预设图像进行对比,若相似度满足预设条件则确定所述图片为包含预设图像的目标图片。
示例性的,当需要确定图片是否包含需要甄别物体时,可以将图片中检测出的多个轮廓对应的图片区域与物体实际图片进行对比,当对比相似度比较高的轮廓区域确定为目标区域。实际使用时,图片一般为多张,当检测出包含目标区域的图片则确定为包含该物体的目标图片。
本申请实施例采用上述技术对目标区域进行自动甄别,减少了大量的人类成本,并且效率大大提高。
以下,以确定视频中是否播放广告内容为例对上述方法进行解释说明,视频中包含广告的内容区域则为需要寻找的目标区域。
具体的,视频中包括多张帧图片,检测出视频中的多张彩色帧图片,作为原始图片。如图2所示,每张原始图片包括包含广告内容展示界面、简介展示界面、选集展示界面、周边视频展示界面等等。本申请实施例的目的是从原始图片中识别包含广告内容的展示界面,包含广告内容的展示界面为需要识别的目标图片。
首先将原始图片进行灰度处理,得到处理后的灰度图。一般,灰度值为0代表纯黑色,灰度值为255代表纯白色,本申请实施例采用合适的灰度值进行处理,处理后的结果如图2所示。
然后,采用霍夫变换检测灰度图中的所有直线。在处理后的灰度图中的广告内容展示界面、选集展示界面、周边视频展示界面等等,分别检测到条直线如图3所示。
霍夫变换是一种特征检测(feature extraction),被广泛应用在图像分析(imageanalysis)、计算机视觉(computer vision)以及数位影像处理(digital imageprocessing)。霍夫变换是用来辨别找出物件中的特征,例如:线条。他的算法流程大致如下,给定一个物件、要辨别的形状的种类,算法会在参数空间(parameter space)中执行投票来决定物体的形状,而这是由累加空间(accumulator space)里的局部最大值(localmaximum)来决定。现在广泛使用的霍夫变换是由RichardDuda和PeterHart在公元1972年发明,并称之为广义霍夫变换(generalizedHoughtransform),广义霍夫变换和更早前1962年的PaulHough的专利有关。经典的霍夫变换是侦测图片中的直线,之后,霍夫变换不仅能识别直线,也能够识别任何形状,常见的有圆形、椭圆形。1981年,因为DanaH.Ballard的一篇期刊论文"Generalizing the Hough transform to detectarbitrary shapes",让霍夫变换开始流行于计算机视觉界。
其次,对检测出所有的直线首先进行筛选,筛选的方式根据预定的方式进行,例如:剔除较短的、相隔较近的、倾斜程度大的直线。
示例性的,如图3所示,检测出选集展示界面的多条直线,其长度小于原图最短边(400个像素点)的四分之一(100个像素点),予以剔除;对非水平或垂直的直线,予以剔除。
经过筛选得到筛选后的直线集合,对集合中的每一条直线,用两个有序数字(x1,x2)表示该直线两侧像素灰度值的范围,其中x1<x2。
如图3所示,经过筛选得到筛选后的直线经过标注共14条直线,分别标注为L1,L2,…,L14,这些线段两侧的灰度值的范围分别如下表所示:
本实施例中取灰度阈值的方式是通过取每侧灰度值的最大值,如下表所示:
依据上表,我们要找到m个灰度阈值,能够将所有的X1最大值和X2最小值区分开来:
由于X1和X2的取值都是[0,255]之间的整数,我们可以构造一个长度为256的数组arr,在本例中,arr[0]=0,arr[1]=0,…,arr[9]=1,…,arr[238]=13,arr[239]=13,…,arr[255]=0。其中arr[x]=y表示以x作为阈值,能够将上表中的y条直线区分开来。找到数组arr中最大值的索引,本例中,数组arr在索引为238到254之间均可以取得最大值13,我们可以在该范围内随机选取一个阈值如250。
此时,未能区分的直线只剩余L1一条,重复上面段落的步骤,可以选择第二个阈值为70。所有的直线均被区分开来。m=2
本例中,m=2。如上表所示,第1个灰度阈值为250,可以将L2-L14区分开来;确定第2个灰度阈值为70,可以将L1区分开来。
如图4所示,以250为阈值,将灰度图二值化后,得到二值图:对二值图进行轮廓检测得到多个黑色区域的轮廓。将检测到的多个轮廓画在原始图片上;具体的,对每个轮廓,提取出左上角点和右下角点,即得到了一个矩形框,通过该步骤提取所有矩形框,从上到下,从左到右分别为矩形框1,2,3,4,5。原图左上角坐标为(0,0),右下角坐标为(400,800),则4个矩形框的顶点坐标分别如下表所示:
左上角 | 右上角 | 左下角 | 右上角 | |
矩形框1 | (0,0) | (400,0) | (0,250) | (400,250) |
矩形框2 | (12,600) | (148,600) | (12,670) | (148,670) |
矩形框3 | (156,600) | (288,600) | (156,670) | (288,670) |
矩形框4 | (286,600) | (400,600) | (296,670) | (400,670) |
矩形框5 | (0,755) | (400,755) | (0,800) | (400,800) |
图像二值化(Image Binarization)就是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的黑白效果的过程。在数字图像处理中,二值图像占有非常重要的地位,图像的二值化使图像中数据量大为减少,从而能凸显出目标的轮廓。
通过每个轮廓的对角的坐标能够分别在原始图片中截取一个轮廓图片。
如图5-7所示,广告内容展示界面的轮廓,通过该轮廓在原始图片中截取广告内容展示界面图片。
将截取的每张轮廓图片与预先查找的图片进行对比,如果比对的相似度满足要求,则确定该轮廓图片为目标图片。例如将上述截取的带广告内容的展示界面图片与预先准备的广告展示图片进行比对,比对一致,则确定原始图片中包含该广告图片,也就是该广告内容会随视频进行播放。
同理,上述确定第2个灰度阈值为70,以70为阈值,将灰度图二值化后,得到另外一张二值图,重复上述方法。可得到带广告内容的展示界面更为精确,但这步操作主要根据具体情况和需求进行处理,可选择两个灰度阈值都进行处理,也可以只选择一种灰度阈值进行处理。
具体的,第一次采用250作为阈值,将灰度图(如图2)二值化后得到二值图(如图4)。轮廓检测算法的输入是图4,输出是组成轮廓的点的坐标(如图5中的轮廓)。确定上述坐标后,在灰度图(如图2)上做切除,得到灰度图(如图6)。再以70作为阈值,切除多余部分,得到二值图(如图7)。
如图8所示,本申请实施例一种图片检测装置,包括如下模块:
直线检测模块10,用于检测图片中的直线,并筛选出符合预设条件的直线;
轮廓检测模块20,用于根据所筛选出的直线检测轮廓;
确定模块30,用于根据所检测出的轮廓,在所述图片中确定目标区域
在一个示例性实施例中,所述直线检测模块10,用于检测图片中的直线,是指:直线检测模块10将图片转换为灰度图,在所述灰度图中检测出所有直线。
在一个示例性实施例中,轮廓检测模块20,用于根据筛选出的直线检测轮廓,是指:
轮廓检测模块20,获取所有筛选出的直线中每条直线两侧的灰度值;
轮廓检测模块20,用于根据所获取的所筛选出的每条直线两侧的灰度值,确定灰度阈值;
轮廓检测模块20,用于根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测。
轮廓检测模块20,用于根据所获取的所有筛选出的直线两侧的灰度值,确定灰度阈值,可以通过以下任意方式确定:
第一种方式,对所筛选出的直线的两侧的灰度值范围进行聚类,通过聚类中心确定灰度阈值;
第二种方式,根据所筛选出的直线的两侧的最大灰度值构建数组确定灰度阈值。
在一个示例性实施例中,当所确定的灰度阈值包括多个时,轮廓检测模块20,用于根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,是指:
在一个示例性实施例中,当所确定的灰度阈值包括多个时,步骤S23中所述根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,是指:
轮廓检测模块20,用于根据能区分直线数目按照由多到少的顺序对所述多个灰度阈值进行排序;
轮廓检测模块20,用于根据所述多个灰度阈值的排序顺序,依次对灰度图进行二值化,得到每个灰度阈值对应的二值化图片;
轮廓检测模块20,用于对每张所得到的二值化图片进行轮廓检测。
在一个示例性实施例中,确定模块30,用于所述根据所检测出的轮廓,在所述图片中确定目标区域,是指:确定模块30,用于根据所得到的每张二值化图片所检测出的轮廓分别对所述灰度图做切割,得到最终的灰度图为所述目标区域。
在一个示例性实施例中,确定模块30,用于根据所检测出的轮廓,在所述图片中确定目标区域,是指:确定模块30,用于提取所述轮廓的对角点,根据所提取的对角点在所述图片中确定目标区域。
在一个示例性实施例中,上述装置还包括甄别模块40,用于在确定模块30根据所检测出的轮廓,在所述图片中确定目标区域之后,用于:将所确定的目标区域对应的图像与预设图像进行对比,若相似度满足预设条件则确定所述图片为包含预设图像的目标图片。
本申请实施例还提供一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述中任一项所述的方法。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
Claims (6)
1.一种图片检索方法,其特征在于,包括:
检测图片中的直线,并筛选出符合预设条件的直线;
根据所筛选出的直线检测轮廓;
根据所检测出的轮廓,在所述图片中确定目标区域,
其中,所述检测图片中的直线,包括:将图片转换为灰度图,在所述灰度图中检测出所述直线,
其中,所述根据所筛选出的直线检测轮廓,包括:
获取所筛选出的直线中每条直线两侧的灰度值;
根据所获取的所筛选出的每条直线两侧的灰度值,确定灰度阈值;
根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,
其中,所述根据所获取的所筛选出的直线两侧的灰度值,确定灰度阈值,包括以下方式之一:
方式一:对所筛选出的直线的两侧的灰度值范围进行聚类,通过聚类中心确定灰度阈值;
方式二:经过筛选得到筛选后的直线集合,对集合中的每一条直线,用两个有序数字(x1,x2)表示该直线两侧像素灰度值的范围,其中x1 < x2;找到m个灰度阈值,能够将所有的x1最大值和x2最小值区分开来。
2.根据权利要求1所述的方法,其特征在于,当所确定的灰度阈值包括多个时,所述根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,包括:
根据能区分直线的数目按照由多到少的顺序对所述多个灰度阈值进行排序;
根据所得到的多个灰度阈值的排序顺序,分别对灰度图进行二值化得到每个灰度阈值对应的二值化图片;
对每张所得到的二值化图片进行轮廓检测。
3.根据权利要求2所述的方法,其特征在于,所述根据所检测出的轮廓,在所述图片中确定目标区域,包括:根据所检测出的每张二值化图片的轮廓分别对所述灰度图进行切割,得到最终的灰度图为所述目标区域。
4.根据权利要求1所述的方法,其特征在于,根据所检测出的轮廓,在所述图片中确定目标区域,包括:
提取所述轮廓的对角点,根据所提取的对角点在所述图片中确定目标区域。
5.根据权利要求1所述的方法,其特征在于,所述根据所检测出的轮廓,在所述图片中确定目标区域之后,还包括:
将所确定的目标区域对应的图像与预设图像进行对比,若相似度满足预设条件则确定所述图片为包含预设图像的目标图片。
6.一种图片检索装置,其特征在于,包括:
直线检测模块,用于检测图片中的直线,并筛选出符合预设条件的直线;
轮廓检测模块,用于根据筛选出的直线检测轮廓;
确定模块,用于根据所检测出的轮廓,在所述图片中确定目标区域,
其中,所述直线检测模块,用于检测图片中的直线,是指:直线检测模块将图片转换为灰度图,在所述灰度图中检测出所述直线,
其中,轮廓检测模块,用于根据筛选出的直线检测轮廓,是指:
获取所筛选出的直线中每条直线两侧的灰度值;
根据所获取的所筛选出的每条直线两侧的灰度值,确定灰度阈值;
根据所得到的灰度阈值对所述灰度图进行二值化,得到二值化图片并对所得到的二值化图片进行轮廓检测,
其中,所述根据所获取的所筛选出的直线两侧的灰度值,确定灰度阈值,包括以下方式之一:
方式一:对所筛选出的直线的两侧的灰度值范围进行聚类,通过聚类中心确定灰度阈值;
方式二:经过筛选得到筛选后的直线集合,对集合中的每一条直线,用两个有序数字(x1,x2)表示该直线两侧像素灰度值的范围,其中x1 < x2;找到m个灰度阈值,能够将所有的x1最大值和x2最小值区分开来。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010069136.3A CN111462035B (zh) | 2020-01-21 | 2020-01-21 | 一种图片检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010069136.3A CN111462035B (zh) | 2020-01-21 | 2020-01-21 | 一种图片检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111462035A CN111462035A (zh) | 2020-07-28 |
CN111462035B true CN111462035B (zh) | 2024-03-08 |
Family
ID=71685058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010069136.3A Active CN111462035B (zh) | 2020-01-21 | 2020-01-21 | 一种图片检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111462035B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105783712A (zh) * | 2014-12-26 | 2016-07-20 | 北京中电科电子装备有限公司 | 一种检测刀痕的方法及装置 |
WO2017148377A1 (zh) * | 2016-03-02 | 2017-09-08 | 平安科技(深圳)有限公司 | 行驶证有效期自动提取方法、设备、系统及存储介质 |
CN107480683A (zh) * | 2017-08-24 | 2017-12-15 | 郑州云海信息技术有限公司 | 一种图像处理方法及装置 |
WO2018019041A1 (zh) * | 2016-07-29 | 2018-02-01 | 广州广电运通金融电子股份有限公司 | 一种粘贴钞检测方法和装置 |
WO2018068415A1 (zh) * | 2016-10-11 | 2018-04-19 | 广州视源电子科技股份有限公司 | 元件错件检测方法和系统 |
CN109902530A (zh) * | 2019-03-04 | 2019-06-18 | 厦门商集网络科技有限责任公司 | 一种二维码解码方法及终端 |
CN110415183A (zh) * | 2019-06-18 | 2019-11-05 | 平安科技(深圳)有限公司 | 图片校正方法、装置、计算机设备及计算机可读存储介质 |
-
2020
- 2020-01-21 CN CN202010069136.3A patent/CN111462035B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105783712A (zh) * | 2014-12-26 | 2016-07-20 | 北京中电科电子装备有限公司 | 一种检测刀痕的方法及装置 |
WO2017148377A1 (zh) * | 2016-03-02 | 2017-09-08 | 平安科技(深圳)有限公司 | 行驶证有效期自动提取方法、设备、系统及存储介质 |
WO2018019041A1 (zh) * | 2016-07-29 | 2018-02-01 | 广州广电运通金融电子股份有限公司 | 一种粘贴钞检测方法和装置 |
WO2018068415A1 (zh) * | 2016-10-11 | 2018-04-19 | 广州视源电子科技股份有限公司 | 元件错件检测方法和系统 |
CN107480683A (zh) * | 2017-08-24 | 2017-12-15 | 郑州云海信息技术有限公司 | 一种图像处理方法及装置 |
CN109902530A (zh) * | 2019-03-04 | 2019-06-18 | 厦门商集网络科技有限责任公司 | 一种二维码解码方法及终端 |
CN110415183A (zh) * | 2019-06-18 | 2019-11-05 | 平安科技(深圳)有限公司 | 图片校正方法、装置、计算机设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111462035A (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609549B (zh) | 一种自然场景下证件图像的文本检测方法 | |
EP3493101B1 (en) | Image recognition method, terminal, and nonvolatile storage medium | |
US9053361B2 (en) | Identifying regions of text to merge in a natural image or video frame | |
US8340420B2 (en) | Method for recognizing objects in images | |
US9171204B2 (en) | Method of perspective correction for devanagari text | |
JP5775225B2 (ja) | マルチレイヤ連結成分をヒストグラムと共に用いるテキスト検出 | |
CN101122953A (zh) | 一种图片文字分割的方法 | |
CN108805116B (zh) | 图像文本检测方法及其系统 | |
US20140168478A1 (en) | Text Image Quality Based Feedback For Improving OCR | |
US9576210B1 (en) | Sharpness-based frame selection for OCR | |
MX2011002293A (es) | Localizacion de texto para ocr de imagenes y video. | |
CN112153483A (zh) | 信息植入区域的检测方法、装置及电子设备 | |
WO2017181892A1 (zh) | 前景分割方法及装置 | |
CN101122952A (zh) | 一种图片文字检测的方法 | |
CN104573675B (zh) | 作业图像的展示方法和装置 | |
Wang et al. | Natural scene text detection with multi-channel connected component segmentation | |
EP2259207A1 (en) | Method of detection and recognition of logos in a video data stream | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN111507344A (zh) | 从图像中识别出文字的方法和装置 | |
WO2022121021A1 (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
US20090218404A1 (en) | Camera based code reading | |
CN111598076A (zh) | 一种标签图像中日期检测处理方法及装置 | |
CN105678301B (zh) | 一种自动识别并分割文本图像的方法、系统及装置 | |
CN112733666A (zh) | 一种难例图像的搜集、及模型训练方法、设备及存储介质 | |
CN113723410B (zh) | 一种数码管数字识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |