CN108009554A - 一种图像处理方法以及装置 - Google Patents
一种图像处理方法以及装置 Download PDFInfo
- Publication number
- CN108009554A CN108009554A CN201711252580.3A CN201711252580A CN108009554A CN 108009554 A CN108009554 A CN 108009554A CN 201711252580 A CN201711252580 A CN 201711252580A CN 108009554 A CN108009554 A CN 108009554A
- Authority
- CN
- China
- Prior art keywords
- candidate frame
- pending image
- target
- default
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图像处理方法以及装置,其中,该方法包括:接收输入的待处理图像;采用预设候选框确定方法对待处理图像进行处理,确定可能包含待处理图像中目标的候选框;确定待处理图像中目标与确定的各候选框内目标之间的相似度;基于相似度达到预设相似度阈值的候选框,对待处理图像进行分类处理。该方法通过确定待处理图像中目标与确定的各候选框之内目标之间的相似度,来对候选框进行进一步的筛选,只有在待处理图像中目标与确定的各候选框之间的相似度达到预设相似度阈值的候选框,才会将其基于深度学习算法进行分类,从而能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
Description
技术领域
本发明涉及图像处理技术领域,具体而言,涉及一种图像处理方法以及装置。
背景技术
随着计算机和人工智能技术的发展,探测机器人可以代替人进入危险环境或者无法到达的区域进行探测和工作,如军事制导、民用、海洋勘探、矿井探测、反恐排爆等领域,探测人员不需要亲临现场,只需要远程接收探测机器人发送的探测图像或者探测数据就能够实现探测目的。
为了实现对特定物的识别,探测机器人通常具有视觉识别和视频跟踪功能,该功能的基础即为图像识别。目前采用深度学习对图像进行识别或者对图像识别模型进行训练的时候,所采用的方法一般包括三种,分别为区域卷积学习神经网络(Regions withConvolutional Neural Network,R-CNN)、快速区域卷积学习神经网络(Fast Regionswith Convolutional Neural Network,Fast R-CNN)以及Faster R-CNN。R-CNN中首先采用目标检测算法从待识别图像中提取2000个左右的筛选窗口,然后将每个筛选窗口中的图像缩放成227×227的大小,并输入至卷积神经学习网络(Convolutional Neural Network,CNN);Fast R-CNN与R-CNN类似,也是采用目标检测算法从待识别图像中提取2000个左右的筛选窗口;再将待识别图像输入至CNN中;而对于Faster R-CNN,首先将待识别图像输入至CNN进行特征提取,然后生成300个筛选窗口,然后把筛选窗口隐射到CNN的最后一层卷积层上。
以上不论哪种图像处理方法,都会在将筛选窗口输入至CNN之前,产生大量的筛选窗口,导致在对筛选窗口进行特征提取以及训练时所需计算量大,需要耗费的时间长。
发明内容
有鉴于此,本发明实施例的目的在于提供一种图像处理方法以及装置,能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
第一方面,本发明实施例提供了一种图像处理方法,包括:
接收输入的待处理图像;
采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框;
确定所述待处理图像中目标与确定的各候选框内目标之间的相似度;
基于相似度达到预设相似度阈值的候选框,对所述待处理图像进行分类处理。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中:确定所述待处理图像中目标与确定的各候选框内目标之间的相似度,具体包括:
采用预设特征提取方法对所述确定的候选框以及所述待处理图像进行特征提取;
采用预设边缘检测算法确定所述待处理图像中提取的第一目标特征,以及所述确定的各候选框中提取的第二目标特征;
确定所述第一目标特征分别与各第二目标特征之间的相似度。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中:所述预设特征提取方法包括:方向梯度直方图HOG特征提取,以及局部二值模式LBP(LocalBinary Pattern)特征提取。
结合第一方面,本发明实施例提供了第一方面的第三种可能的实施方式,其中:采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用预设候选框确定方法对所述待处理图像进行处理,确定与所述待处理图像中目标重合区域大于预设阈值的候选框;并
将确定的候选框确定为可能包含所述待处理图像中目标的候选框。
结合第一方面,本发明实施例提供了第一方面的第四种可能的实施方式,其中:针对所述方法应用于R-CNN模型的情况,采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用预设数量大小不同的候选框对所述待处理图像进行扫描;
采用非极大抑制算法从完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框;
针对所述方法应用于Faster R-CNN模型的情况,采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用区域建议网络RPN对所述待处理图像进行处理,确定检测评价函数IoU评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
第二方面,本发明实施例还提供一种图像处理装置,包括:
接收模块,用于接收输入的待处理图像;
选取模块,用于采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框;
确定模块,用于确定所述待处理图像中目标与确定的各候选框内目标之间的相似度;
处理模块,用于基于相似度达到预设相似度阈值的候选框,对所述待处理图像进行分类处理。
结合第二方面,本发明实施例提供了第二方面的第一种可能的实施方式,其中:所述确模块,具体用于:采用预设特征提取方法对所述确定的候选框以及所述待处理图像进行特征提取;采用预设边缘检测算法确定所述待处理图像中提取的第一目标特征,以及所述确定的各候选框中提取的第二目标特征;确定所述第一目标特征分别与各第二目标特征之间的相似度。
结合第二方面,本发明实施例提供了第二方面的第二种可能的实施方式,其中:所述预设特征提取方法包括:方向梯度直方图HOG特征提取,以及局部二值模式LBP(LocalBinary Pattern)特征提取。
结合第二方面,本发明实施例提供了第二方面的第三种可能的实施方式,其中:所述选取模块,具体用于:采用预设候选框确定方法对所述待处理图像进行处理,确定与所述待处理图像中目标重合区域大于预设阈值的候选框;并将确定的候选框确定为可能包含所述待处理图像中目标的候选框。
结合第二方面,本发明实施例提供了第二方面的第四种可能的实施方式,其中:针对所述方法应用于R-CNN模型的情况,所述选取模块,具体用于:
采用预设数量大小不同的候选框对所述待处理图像进行扫描;
采用非极大抑制算法从完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框;
针对所述方法应用于Faster R-CNN模型的情况,所述选取模块,具体用于:
采用区域建议网络RPN对所述待处理图像进行处理,确定检测评价函数IoU评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
本申请实施例所提供的图像处理方法以及装置,在采用与蛇候选框确定方法对接入的待处理图像进行处理时,确定可能包含待处理图像中目标的候选框后,再通过确定待处理图像中目标与确定的各候选框之内目标之间的相似度,来对候选框进行进一步的筛选,只有在待处理图像中目标与确定的各候选框之间的相似度达到预设相似度阈值的候选框,才会将其基于深度学习算法进行分类,从而能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种图像处理方法的流程图;
图2示出了本发明实施例所提供的图像处理方法中,确定候选框具体方法的流程图;
图3示出了本发明实施例所提供的图像处理方法中,候选框选取的示意图;
图4示出了本发明实施例所提供的图像处理方法中,候选框与目标图像重叠关系的示意图;
图5示出了本发明实施例所提供的图像处理方法中,确定待处理图像中目标与确定的各候选框内目标之间的相似度的方法流程图;
图6示出了本发明实施例所提供的图像处理方法中,从待处理图像中提取的特征、目标边缘以及目标的特征之间关系的示意图;
图7示出了本发明实施例所提供的一种图像处理装置的结构示意图;
图8示出了本发明实施例所提供的一种计算机设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前在对图像进行识别的时候,所采用的深度学习方法,会在通过深度学习模型对图像进行训练之前,生成大量的可能包括待识别目标的候选框,然后将候选框输入至深度学习进行训练;候选框多,使用深度学习进行训练时所需计算量大,耗费训练时间久。基于此,本申请提供的一种图像处理方法以及装置,可以通过提高候选框中所包括的识别目标与图形中识别目标之间的相似度,对候选框进行筛选,减少候选框的数量,从而降低深度学习模型的计算量,减少训练时间。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种图像处理方法进行详细介绍,该图像处理方法用于对图像中的目标进行识别。
参见图1所示,本申请实施例所提供的图像处理方法包括:
S101:接收输入的待处理图像。
在具体实现的时候,对图像中的目标进行识别的方法一般包括两个过程,其一,基于大量的样本图像对深度学习模型进行训练的过程,该训练过程会采用有监督训练的方式,生成深度学习模型;其二,将待识别图像输入至已经训练好的深度学习模型,基于该训练好的深度学习模型,对图像中的目标进行识别。
基于上述两个过程,待处理图像可能有另种:如果该图像处理方法应用于深度学习模型的训练过程,则将训练过程所使用的样本图像作为待处理图像;如果该图像处理方法应用于使用训练好的深度学习模型对要识别的图像的识别,则将待识别图像作为待处理图像。
S102:采用预设候选框确定方法对待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框。
在具体实现的时候,当获取了待处理图像之后,要从待处理图像中获取可能包括待处理图像中的待识别目标的候选框。在获取可能包括待处理图像中的待识别目标的候选框时,可以采用预设候选框确定方法对待处理图像进行处理,确定与待处理图像中目标重合区域大于预设阈值的候选框,并将确定的候选框确定为可能包含待处理图像中目标的候选框。
现有技术中通常将预设阈值设置为70%,本发明实施例中,为了使筛选出来的候选框更加有效,使对筛选窗口进行特征提取以及训练时所需的计算量减小,可以将阈值提高,即设置预设阈值大于70%,较佳地,可以设置为90%。
参见图2所示,当深度学习模型为R-CNN模型的时候,可以采用下述过程确定候选框。
S201:采用预设数量大小不同的候选框对待处理图像进行扫描。
在具体实现的时候,可以采用选择性搜索(Selective Search)算法对图像进行扫描。
在采用Selective Search算法对图像进行扫描的时候,要设定多个大小不同的候选框,并使用候选框从图像上进行扫描,其中扫描是所采用的步长可以根据实际需要进行设定。如图3所示的待处理图像中,将候选框的大小设定为5×5,然后按照3个像素点的步长对待处理图像进行扫描,使用每种尺寸的候选框在图像上进行扫描的时候,都能够获得多个候选框。
需要注意的是,如果待处理图像为样本图像,那么在样本图像中实际上已经标注出目标的具体位置,候选框与目标的具体位置具有重叠部分,在采用候选框对待处理图像进行扫描的时候,为了减少扫描的步骤,可以仅仅是扫描标注出目标物的位置,也可以对样本图像的全局进行扫描。
如果待处理图像为待识别图像,用于是使用训练好的模型对待识别图像进行目标的识别,而执行该图像处理方法的设备并没有预先获知目标的具体位置,因此将待处理图像上任意一个位置都认为是可能具有目标的位置,因此候选框要从待识别图像的全局进行扫描。
S202:采用非极大抑制算法从S102完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
本步骤中,检测结果为使用不同大小的候选框从样本图像中进行扫描时所获得的候选框。当获得了候选框后,确定与待处理图像中目标重合区域,如果重合区域大于预设阈值,则将该候选框作为可能包括待处理图像中目标的候选框。本步骤中,可以将阈值提高,即设置预设阈值大于70%,较佳地,可以设置为90%。
如图4所示,线条较粗的线框内为目标图像,线条较细的线框为三个尺寸均不相同的候选框A、候选框B和候选框C,在该图中候选框A与目标图像有交集,且在计算该候选框A与目标图像的重合区域时,符合大于预设阈值,将候选框A作为可能包括待处理图像中目标的候选框;候选框B虽然与目标图像有交集,但该候选框B与目标图像的重合区域不符合大于预设阈值,因此候选框B作为未包括待处理图像中目标的候选框;候选框C与目标图像完全没有交集,因此候选框C作为未包括待处理图像中目标的候选框。
当深度学习模型为Faster R-CNN模型的时候,可以采用区域建议网络(RegionProposal Network,RPN)对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框。
在确定可能包含待处理图像中目标的候选框的过程中,可以确定检测评价函数(Intersection-over-Union,IoU)评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
在目标检测评价体系中,IoU是模型产生的目标窗口和原来标记窗口的交叠率,即检测结果(Detection Result)与参考标准(Ground Truth)的交集比上它们的并集,其中,IoU满足:
本实施例中,可以将阈值提高,即设置预设阈值大于70%,较佳地,可以设置为90%,即将IoU的值大于预设阈值的候选框确定为可能出现目标的候选框。
S103:确定待处理图像中目标与确定的各候选框内目标之间的相似度。
在具体实现的时候,在采用预设候选框确定方法对待处理图像进行处理,并且确定可能包含待处理图像中目标的候选框时,最终所得到的候选框非常多,要减少候选框的数量,就要进一步的对候选框进行过滤。该实施例中采用确定待处理图像中目标与确定的各候选框内目标之间的相似度的方法来判别候选框是否需要被过滤,如果候选框中所包括的目标,和待处理图像中的目标相似度太低,则认为该候选框没有被训练的必要,因此要将这部分候选框过滤掉。
此处,在确定待处理图像中目标与确定的各候选框内目标之间的相似度时,可以基于特征提取的方法来确定。
在一可选实施例中,参见图5所示,还提供一种确定待处理图像中目标与确定的各候选框内目标之间的相似度的方法,方法包括:
S501:采用预设特征提取方法对确定的候选框以及待处理图像进行特征提取。
在具体实现的时候,特征提取方法有多种,与每种特征提取方法对应的特征也不同。
所提取的特征可以为方向梯度直方图(Histogram of Oriented Gradient,HOG)特征,对应的特征提取方法通过计算和统计图像局部区域的梯度方向直方图来构成特征。在提取HOG特征时,可以将待处理图像分成小的连通区域,每一个区域称为一个细胞单元,单后采集细胞单元中各像素点的梯度的方向直方图或边缘的方向直方图,然后将这些直方图组合起来就可以构成待处理图像的HOG特征。
其提取过程为:
1、将待处理图像转化为灰度图像。
2、对灰度图像进行颜色空间的归一化,以调节图像的对比度,降低图像局部阴影和光照变化所造成的影响,同时抑制噪音的干扰。
3、计算归一化后的灰度图像中每个像素的梯度,以捕捉轮廓信息,并进一步弱化光照的干扰。
4、将图像划分为多个细胞单元(cell)。
5、统计每个细胞单元中所包括的所有像素点的不同梯度个数,形成每个细胞单元的特征(descriptor)。
6、将预设数量个细胞单元组成一个块(block),一个block内所有cell的特征descriptor串联起来便得到该block的HOG特征描述。
7、将待处理图像内所有的block的HOG特征串联起来就可以得到整个待处理图像内所有block的HOG特征。
所提取的特征还可以为局部二值模式(Local Binary Pattern,LBP)特征,该LBP特征是用来描述图像的局部纹理特征的算子,它具有旋转不变形和灰度不变性等显著的优点。
LBP算子定义在以预设尺寸的窗口内,以窗口中心像素为阈值,将该中心像素相邻的像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该周围像素的位置被标记为1,否则为0。将组中形成的结果作为该窗口中心像素点的LBP值,并用这个值来反映该区域的纹理信息。
其提取过程为:
1、将检测窗口划分为16×16的小区域(cell);
2、对于每个cell中的一个像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值;
3、计算每个cell的直方图,即每个数字(假定是十进制数LBP值)出现的频率;然后对该直方图进行归一化处理。
4、将得到的每个cell的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量。
S502:采用预设边缘检测算法确定待处理图像中提取的第一目标特征,以及确定的各候选框中提取的第二目标特征。
在具体实现的时候,当提取的候选框和待处理图像的特征后,要对候选框和待处理图像中的目标进行定位。一般地,目标和背景之间通常具有较大的纹理或者颜色差异,因此能够基于这种差异,检测出目标和背景之间的分割线,该分割线即为目标的边缘。当对待处理图像进行边缘检测,得到目标边缘后,就能够基于该目标边缘和S501中所提取待处理图像的特征,将目标对应的特征从所提取的待处理图像的特征中提取出来,作为从待处理图像中提取的第一目标特征。当对候选框进行边缘检测,得到目标边缘后,就能够基于该边缘和S501中所提取的候选框的特征,将目标对应的特征从所提取的候选框的特征中提取出来,作为从候选框中提取的第二目标特征。
例如图6中所示,粗线框表示待处理图像中的目标边缘;从待处理图像中提取的特征如图6中a,则所确定的待处理图像中的目标的特征如图6中所示。
S503:确定第一目标特征分别与各第二目标特征之间的相似度。
在对待处理图像进行特征提取的时候,所得到的结果可以形成一个特征向量,确定第一目标特征分别与第二目标特征之间的相似度时,一般为将第一目标特征中对应的特征向量中的值与第二目标特征对应的特征向量中的值进行比对,即两个特征向量中,相同的特征向量值的数量在第二目标特征所对应的特征向量中占据的百分比,即为第一特征向量和第二特征向量的相似度;也可以通过第一目标特征向量与第二目标特征向量之间的距离确定第一特征向量和第二特征向量的相似度,这里不再赘述。
S104:基于相似度达到预设相似度阈值的候选框,对待处理图像进行分类处理。
此处,该相似度阈值可以根据实际的需要进行具体设置。例如将该相似度阈值设置为70%,80%,90%等。
当相似度达到预设的相似度阈值时,则认为与该相似度对应的候选框为较为合理的候选框;但相似度无法达到预设的相似度阈值时,则认为与该相似度对应的候选框不需要输入至CNN中进行训练。
对于相似度达到预设相似度阈值的候选框,对待处理图像进行分类处理时,是直接将候选框输入至CNN中进行训练。
本申请实施例所提供的图像处理方法,在采用预设候选框确定方法对接入的待处理图像进行处理时,确定可能包含待处理图像中目标的候选框后,再通过确定待处理图像中目标与确定的各候选框之内目标之间的相似度,来对候选框进行进一步的筛选,只有在待处理图像中目标与确定的各候选框之间的相似度达到预设相似度阈值的候选框,才会将其基于深度学习算法进行分类,从而能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
基于同一发明构思,本发明实施例中还提供了与图像处理方法对应的图像处理装置,由于本发明实施例中的装置解决问题的原理与本发明实施例上述图像处理方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
参见图7所示,本申请实施例所提供的图像处理装置包括:
接收模块710,用于接收输入的待处理图像;
选取模块720,用于采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框;
确定模块730,用于确定所述待处理图像中目标与确定的各候选框内目标之间的相似度;
处理模块740,用于基于将相似度达到预设相似度阈值的候选框,对所述待处理图像进行分类处理。
本申请实施例所提供的图像处理装置,在采用与蛇候选框确定方法对接入的待处理图像进行处理时,确定可能包含待处理图像中目标的候选框后,再通过确定待处理图像中目标与确定的各候选框之内目标之间的相似度,来对候选框进行进一步的筛选,只有在待处理图像中目标与确定的各候选框之间的相似度达到预设相似度阈值的候选框,才会将其基于深度学习算法进行分类,从而能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
在一可选实施例中,所述确模块730,具体用于:采用预设特征提取方法对所述确定的候选框以及所述待处理图像进行特征提取;采用预设边缘检测算法确定所述待处理图像中提取的第一目标特征,以及所述确定的各候选框中提取的第二目标特征;确定所述第一目标特征分别与各第二目标特征之间的相似度。
在一可选实施例中,所述预设特征提取方法包括:方向梯度直方图HOG特征提取,以及局部二值模式LBP(Local Binary Pattern)特征提取。
在一可选实施例中,所述选取模块720,具体用于:采用预设候选框确定方法对所述待处理图像进行处理,确定与所述待处理图像中目标重合区域大于预设阈值的候选框;并将确定的候选框确定为可能包含所述待处理图像中目标的候选框。
在一可选实施例中,针对所述方法应用于R-CNN模型的情况,所述选取模块720,具体用于:
采用预设数量大小不同的候选框对所述待处理图像进行扫描;
采用非极大抑制算法从完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框;
针对所述方法应用于Faster R-CNN模型的情况,所述选取模块720,具体用于:
采用区域建议网络RPN对所述待处理图像进行处理,确定检测评价函数IoU评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
对应于图1中的图像处理方法,本发明实施例还提供了一种计算机设备,如图8所示,该设备包括存储器1000、处理器2000及存储在该存储器1000上并可在该处理器2000上运行的计算机程序,其中,上述处理器2000执行上述计算机程序时实现上述图像处理方法的步骤。
具体地,上述存储器1000和处理器2000能够为通用的存储器和处理器,这里不做具体限定,当处理器2000运行存储器1000存储的计算机程序时,能够执行上述图像处理方法,从而解决输入至深度学习模型中的候选框数量过多,导致在对筛选窗口进行特征提取以及训练时所需计算量大,需要耗费的时间长的问题,进而达到能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
对应于图1中的图像处理方法,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述图像处理方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述图像处理方法,从而解决输入至深度学习模型中的候选框数量过多,导致在对筛选窗口进行特征提取以及训练时所需计算量大,需要耗费的时间长的问题,进而达到能够减少输入至CNN的筛选窗口数量,减小对筛选窗口进行特征提取以及训练时所需的计算量,缩短图像处理时间。
本发明实施例所提供的图像处理方法以及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种图像处理方法,其特征在于,包括:
接收输入的待处理图像;
采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框;
确定所述待处理图像中目标与确定的各候选框内目标之间的相似度;
基于相似度达到预设相似度阈值的候选框,对所述待处理图像进行分类处理。
2.根据权利要求1所述的方法,其特征在于,确定所述待处理图像中目标与确定的各候选框内目标之间的相似度,具体包括:
采用预设特征提取方法对所述确定的候选框以及所述待处理图像进行特征提取;
采用预设边缘检测算法确定所述待处理图像中提取的第一目标特征,以及所述确定的各候选框中提取的第二目标特征;
确定所述第一目标特征分别与各第二目标特征之间的相似度。
3.根据权利要求1或2所述的方法,其特征在于,所述预设特征提取方法包括:方向梯度直方图HOG特征提取,以及局部二值模式LBP(Local Binary Pattern)特征提取。
4.根据权利要求1所述的方法,其特征在于,采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用预设候选框确定方法对所述待处理图像进行处理,确定与所述待处理图像中目标重合区域大于预设阈值的候选框;并
将确定的候选框确定为可能包含所述待处理图像中目标的候选框。
5.根据权利要求1所述的方法,其特征在于,针对所述方法应用于R-CNN模型的情况,采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用预设数量大小不同的候选框对所述待处理图像进行扫描;
采用非极大抑制算法从完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框;
针对所述方法应用于Faster R-CNN模型的情况,采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框,具体包括:
采用区域建议网络RPN对所述待处理图像进行处理,确定检测评价函数IoU评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
6.一种图像处理装置,其特征在于,包括:
接收模块,用于接收输入的待处理图像;
选取模块,用于采用预设候选框确定方法对所述待处理图像进行处理,确定可能包含所述待处理图像中目标的候选框;
确定模块,用于确定所述待处理图像中目标与确定的各候选框内目标之间的相似度;
处理模块,用于基于相似度达到预设相似度阈值的候选框,对所述待处理图像进行分类处理。
7.根据权利要求6所述的装置,其特征在于,所述确模块,具体用于:采用预设特征提取方法对所述确定的候选框以及所述待处理图像进行特征提取;采用预设边缘检测算法确定所述待处理图像中提取的第一目标特征,以及所述确定的各候选框中提取的第二目标特征;确定所述第一目标特征分别与各第二目标特征之间的相似度。
8.根据权利要求6或7所述的装置,其特征在于,所述预设特征提取方法包括:方向梯度直方图HOG特征提取,以及局部二值模式LBP(Local Binary Pattern)特征提取。
9.根据权利要求6所述的装置,其特征在于,所述选取模块,具体用于:采用预设候选框确定方法对所述待处理图像进行处理,确定与所述待处理图像中目标重合区域大于预设阈值的候选框;并将确定的候选框确定为可能包含所述待处理图像中目标的候选框。
10.根据权利要求6所述的装置,其特征在于,针对所述方法应用于R-CNN模型的情况,所述选取模块,具体用于:
采用预设数量大小不同的候选框对所述待处理图像进行扫描;
采用非极大抑制算法从完成扫描的候选框中确定与待处理图像中目标重合区域大于预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框;
针对所述方法应用于Faster R-CNN模型的情况,所述选取模块,具体用于:
采用区域建议网络RPN对所述待处理图像进行处理,确定检测评价函数IoU评价指标的指标值符合预设阈值的候选框,并作为可能包含所述待处理图像中目标的候选框。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711252580.3A CN108009554A (zh) | 2017-12-01 | 2017-12-01 | 一种图像处理方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711252580.3A CN108009554A (zh) | 2017-12-01 | 2017-12-01 | 一种图像处理方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108009554A true CN108009554A (zh) | 2018-05-08 |
Family
ID=62056099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711252580.3A Pending CN108009554A (zh) | 2017-12-01 | 2017-12-01 | 一种图像处理方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108009554A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410190A (zh) * | 2018-10-15 | 2019-03-01 | 广东电网有限责任公司 | 基于高分辨率遥感卫星影像的杆塔倒断检测模型训练方法 |
CN109492576A (zh) * | 2018-11-07 | 2019-03-19 | 北京旷视科技有限公司 | 图像识别方法、装置及电子设备 |
CN109685142A (zh) * | 2018-12-25 | 2019-04-26 | 国信优易数据有限公司 | 一种图像匹配方法及装置 |
CN109871829A (zh) * | 2019-03-15 | 2019-06-11 | 北京行易道科技有限公司 | 一种基于深度学习的检测模型训练方法和装置 |
CN109934223A (zh) * | 2019-03-01 | 2019-06-25 | 北京地平线机器人技术研发有限公司 | 一种基于神经网络的实例分割确定方法、神经网络模型训练方法及装置 |
CN110347854A (zh) * | 2019-06-13 | 2019-10-18 | 西安理工大学 | 基于目标定位的图像检索方法 |
CN111160065A (zh) * | 2018-11-07 | 2020-05-15 | 中电科海洋信息技术研究院有限公司 | 遥感图像舰船检测方法、装置、设备及其存储介质 |
CN111353419A (zh) * | 2020-02-26 | 2020-06-30 | 北京百度网讯科技有限公司 | 图像比对方法、装置、电子设备及存储介质 |
CN111428649A (zh) * | 2020-03-26 | 2020-07-17 | 自然资源部国土卫星遥感应用中心 | 一种风力发电设施遥感智能提取方法 |
CN111626313A (zh) * | 2019-02-28 | 2020-09-04 | 银河水滴科技(北京)有限公司 | 一种特征提取模型训练方法、图像处理方法及装置 |
CN112256906A (zh) * | 2020-10-23 | 2021-01-22 | 安徽启新明智科技有限公司 | 在显示屏上标记批注的方法、装置和存储介质 |
WO2021051601A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 利用Mask R-CNN选择检测框的方法及系统、电子装置及存储介质 |
WO2021164653A1 (zh) * | 2020-02-18 | 2021-08-26 | 京东方科技集团股份有限公司 | 动画形象的生成方法、设备及存储介质 |
CN114584673A (zh) * | 2020-12-01 | 2022-06-03 | 京东方科技集团股份有限公司 | 一种图像处理方法和装置 |
CN115543161A (zh) * | 2022-11-04 | 2022-12-30 | 广州市保伦电子有限公司 | 一种适用于白板一体机的抠图方法及装置 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102629318A (zh) * | 2012-03-22 | 2012-08-08 | 中国电子科技集团公司第五十八研究所 | 一种基于支持向量机的指纹图像分割方法 |
CN105512683A (zh) * | 2015-12-08 | 2016-04-20 | 浙江宇视科技有限公司 | 基于卷积神经网络的目标定位方法及装置 |
CN105678231A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于稀疏编码和神经网络的行人图片检测方法 |
US20170011291A1 (en) * | 2015-07-07 | 2017-01-12 | Adobe Systems Incorporated | Finding semantic parts in images |
CN106886757A (zh) * | 2017-01-19 | 2017-06-23 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN107105159A (zh) * | 2017-04-13 | 2017-08-29 | 山东万腾电子科技有限公司 | 基于SoC的嵌入式运动目标实时检测跟踪系统及方法 |
CN107230205A (zh) * | 2017-05-27 | 2017-10-03 | 国网上海市电力公司 | 一种基于卷积神经网络的输电线路螺栓检测方法 |
-
2017
- 2017-12-01 CN CN201711252580.3A patent/CN108009554A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102629318A (zh) * | 2012-03-22 | 2012-08-08 | 中国电子科技集团公司第五十八研究所 | 一种基于支持向量机的指纹图像分割方法 |
US20170011291A1 (en) * | 2015-07-07 | 2017-01-12 | Adobe Systems Incorporated | Finding semantic parts in images |
CN105512683A (zh) * | 2015-12-08 | 2016-04-20 | 浙江宇视科技有限公司 | 基于卷积神经网络的目标定位方法及装置 |
CN105678231A (zh) * | 2015-12-30 | 2016-06-15 | 中通服公众信息产业股份有限公司 | 一种基于稀疏编码和神经网络的行人图片检测方法 |
CN106886757A (zh) * | 2017-01-19 | 2017-06-23 | 华中科技大学 | 一种基于先验概率图的多类交通灯检测方法及系统 |
CN107105159A (zh) * | 2017-04-13 | 2017-08-29 | 山东万腾电子科技有限公司 | 基于SoC的嵌入式运动目标实时检测跟踪系统及方法 |
CN107230205A (zh) * | 2017-05-27 | 2017-10-03 | 国网上海市电力公司 | 一种基于卷积神经网络的输电线路螺栓检测方法 |
Non-Patent Citations (1)
Title |
---|
颜伟鑫: "深度学习及其在工件缺陷自动检测中的应用研究", 《中国优秀硕士学位论文全文数据库-工程科技I辑》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109410190A (zh) * | 2018-10-15 | 2019-03-01 | 广东电网有限责任公司 | 基于高分辨率遥感卫星影像的杆塔倒断检测模型训练方法 |
CN109492576A (zh) * | 2018-11-07 | 2019-03-19 | 北京旷视科技有限公司 | 图像识别方法、装置及电子设备 |
CN111160065A (zh) * | 2018-11-07 | 2020-05-15 | 中电科海洋信息技术研究院有限公司 | 遥感图像舰船检测方法、装置、设备及其存储介质 |
CN109685142A (zh) * | 2018-12-25 | 2019-04-26 | 国信优易数据有限公司 | 一种图像匹配方法及装置 |
CN111626313A (zh) * | 2019-02-28 | 2020-09-04 | 银河水滴科技(北京)有限公司 | 一种特征提取模型训练方法、图像处理方法及装置 |
CN111626313B (zh) * | 2019-02-28 | 2023-06-02 | 银河水滴科技(北京)有限公司 | 一种特征提取模型训练方法、图像处理方法及装置 |
CN109934223A (zh) * | 2019-03-01 | 2019-06-25 | 北京地平线机器人技术研发有限公司 | 一种基于神经网络的实例分割确定方法、神经网络模型训练方法及装置 |
CN109871829A (zh) * | 2019-03-15 | 2019-06-11 | 北京行易道科技有限公司 | 一种基于深度学习的检测模型训练方法和装置 |
CN109871829B (zh) * | 2019-03-15 | 2021-06-04 | 北京行易道科技有限公司 | 一种基于深度学习的检测模型训练方法和装置 |
CN110347854B (zh) * | 2019-06-13 | 2022-02-22 | 西安理工大学 | 基于目标定位的图像检索方法 |
CN110347854A (zh) * | 2019-06-13 | 2019-10-18 | 西安理工大学 | 基于目标定位的图像检索方法 |
WO2021051601A1 (zh) * | 2019-09-19 | 2021-03-25 | 平安科技(深圳)有限公司 | 利用Mask R-CNN选择检测框的方法及系统、电子装置及存储介质 |
US11836839B2 (en) | 2020-02-18 | 2023-12-05 | Boe Technology Group Co., Ltd. | Method for generating animation figure, electronic device and storage medium |
WO2021164653A1 (zh) * | 2020-02-18 | 2021-08-26 | 京东方科技集团股份有限公司 | 动画形象的生成方法、设备及存储介质 |
CN111353419B (zh) * | 2020-02-26 | 2023-08-11 | 北京百度网讯科技有限公司 | 图像比对方法、装置、电子设备及存储介质 |
CN111353419A (zh) * | 2020-02-26 | 2020-06-30 | 北京百度网讯科技有限公司 | 图像比对方法、装置、电子设备及存储介质 |
CN111428649A (zh) * | 2020-03-26 | 2020-07-17 | 自然资源部国土卫星遥感应用中心 | 一种风力发电设施遥感智能提取方法 |
CN111428649B (zh) * | 2020-03-26 | 2021-02-09 | 自然资源部国土卫星遥感应用中心 | 一种风力发电设施遥感智能提取方法 |
CN112256906A (zh) * | 2020-10-23 | 2021-01-22 | 安徽启新明智科技有限公司 | 在显示屏上标记批注的方法、装置和存储介质 |
CN114584673A (zh) * | 2020-12-01 | 2022-06-03 | 京东方科技集团股份有限公司 | 一种图像处理方法和装置 |
CN114584673B (zh) * | 2020-12-01 | 2024-01-09 | 京东方科技集团股份有限公司 | 一种图像处理方法和装置 |
CN115543161A (zh) * | 2022-11-04 | 2022-12-30 | 广州市保伦电子有限公司 | 一种适用于白板一体机的抠图方法及装置 |
CN115543161B (zh) * | 2022-11-04 | 2023-08-15 | 广东保伦电子股份有限公司 | 一种适用于白板一体机的抠图方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009554A (zh) | 一种图像处理方法以及装置 | |
CN107230203B (zh) | 基于人眼视觉注意机制的铸件缺陷识别方法 | |
CN108537102B (zh) | 基于稀疏特征与条件随机场的高分辨sar图像分类方法 | |
CN110874841A (zh) | 参照边缘图像的客体检测方法及装置 | |
CN104077579B (zh) | 基于专家系统的人脸表情图像识别方法 | |
CN104866868A (zh) | 基于深度神经网络的金属币识别方法和装置 | |
CN111046880A (zh) | 一种红外目标图像分割方法、系统、电子设备及存储介质 | |
CN109118504B (zh) | 一种基于神经网络的图像边缘检测方法、装置及其设备 | |
CN106408037A (zh) | 图像识别方法及装置 | |
CN111914665A (zh) | 一种人脸遮挡检测方法、装置、设备及存储介质 | |
CN110335322B (zh) | 基于图像的道路识别方法及道路识别装置 | |
CN114399480A (zh) | 蔬菜叶片病害严重程度检测方法及装置 | |
CN116228757B (zh) | 一种基于图像处理算法的深海网箱网衣检测方法 | |
CN103871062A (zh) | 一种基于超像素描述的月面岩石检测方法 | |
CN113435456A (zh) | 基于机器学习的岩石薄片组分识别方法、装置及介质 | |
CN113223614A (zh) | 一种染色体核型分析方法、系统、终端设备和存储介质 | |
CN114266894A (zh) | 一种图像分割方法、装置、电子设备及存储介质 | |
CN112819753A (zh) | 一种建筑物变化检测方法、装置、智能终端及存储介质 | |
CN115937552A (zh) | 一种基于融合手工特征与深度特征的图像匹配方法 | |
CN104268550A (zh) | 特征提取方法及装置 | |
US20230186478A1 (en) | Segment recognition method, segment recognition device and program | |
CN113469224A (zh) | 一种基于卷积神经网络与特征描述算子相融合的大米分类方法 | |
US20080247648A1 (en) | System and method for improving display of tuned multi-scaled regions of an image with local and global control | |
Kanwar et al. | Multi-artifact detection and filtering in digital pathology using intrinsic image properties | |
Yuan et al. | Automatic road extraction from satellite imagery using LEGION networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 101-8, 1st floor, building 31, area 1, 188 South Fourth Ring Road West, Fengtai District, Beijing Applicant after: Guoxin Youyi Data Co., Ltd Address before: 100070, No. 188, building 31, headquarters square, South Fourth Ring Road West, Fengtai District, Beijing Applicant before: SIC YOUE DATA Co.,Ltd. |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180508 |
|
RJ01 | Rejection of invention patent application after publication |