CN111369489B - 一种图像识别方法、装置及终端设备 - Google Patents
一种图像识别方法、装置及终端设备 Download PDFInfo
- Publication number
- CN111369489B CN111369489B CN201811580564.1A CN201811580564A CN111369489B CN 111369489 B CN111369489 B CN 111369489B CN 201811580564 A CN201811580564 A CN 201811580564A CN 111369489 B CN111369489 B CN 111369489B
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- convolutional neural
- data set
- training data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012549 training Methods 0.000 claims description 133
- 238000013527 convolutional neural network Methods 0.000 claims description 130
- 238000001514 detection method Methods 0.000 claims description 78
- 238000011176 pooling Methods 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 31
- 230000007547 defect Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 26
- 238000007781 pre-processing Methods 0.000 claims description 22
- 238000010276 construction Methods 0.000 claims description 18
- 238000003860 storage Methods 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims 1
- 230000002708 enhancing effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008030 elimination Effects 0.000 description 3
- 238000003379 elimination reaction Methods 0.000 description 3
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000002087 whitening effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30121—CRT, LCD or plasma display
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明适用于图像识别技术领域,提供了一种图像识别方法、装置及终端设备,通过获取原始图像,并对该原始图像进行预处理得到第一图像和第二图像后,将该第一图像输入一级分类卷积神经网络,得到图像类别信息,再将该第二图像输入与该图像类别信息对应的二级检测卷积神经网络,得到图像识别结果,从而实现了对原始图像的自动分类及图像识别,提高了对缺陷目标的识别效率及正确率,而且由于引入卷积神经网络,使得图像识别的扩展性增强,并提高了图像识别的鲁棒性。
Description
技术领域
本发明属于图像识别技术领域,尤其涉及一种图像识别方法、装置及终端设备。
背景技术
在显示屏生产线上,通过大量采集生产过程图片,用于显示屏缺陷的判断。目前对显示屏缺陷的判断,仍然以人工判断为主,因此制造单位一直面临人力需求大等相关问题。另外因受个人经验和状态影响,人工判别准确率不稳定,时有误判情况发生。
当前虽然已有利用图像处理和识别技术进行屏幕缺陷检测的相关应用,但是普遍还存在识别率不高、扩展性不强、鲁棒性低等问题,无法真正实现替代人工。
发明内容
有鉴于此,本发明实施例提供了一种图像识别方法、装置及终端设备,以解决现有利用图像处理和识别技术进行屏幕缺陷检测的相关应用中普遍存在的识别率不高,扩展性不强、鲁棒性低的问题。
本发明实施例的第一方面提供了一种图像识别方法,包括:
获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
本发明实施例的第二方面提供了一种图像识别装置,包括:
图像预处理单元,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
本发明实施例的第三方面提供了一种终端设备,包括:
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现本发明实施例的第一方面提供的图像识别方法的步骤。
其中,所述计算机程序包括:
图像预处理单元,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行时实现本发明实施例的第一方面提供的图像识别方法的步骤。
其中,所述计算机程序包括:
图像预处理单元,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
本发明实施例与现有技术相比存在的有益效果是:通过获取原始图像,并对该原始图像进行预处理得到第一图像和第二图像后,将该第一图像输入一级分类卷积神经网络,得到图像类别信息,再将该第二图像输入与该图像类别信息对应的二级检测卷积神经网络,得到图像识别结果,从而实现了对原始图像的自动分类及图像识别,提高了对缺陷目标的识别效率及正确率,而且由于引入卷积神经网络,使得图像识别的扩展性增强,并提高了图像识别的鲁棒性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像识别方法的实现流程图;
图2是本发明实施例提供的一种对原始图像进行预处理的方法的具体实现流程图;
图3是本发明实施例提供的一种构建一级分类卷积神经网络的方法的具体实现流程图;
图4-1是本发明实施例提供的一种一级分类卷积神经网络的示意图;
图4-2是本发明实施例提供的一种区域块Block A的示意图;
图5是本发明实施例提供的一种对一级分类卷积神经网络进行训练的方法的具体实现流程图;
图6是本发明实施例提供的一种构建训练数据集的方法的具体实现流程图;
图7是本发明实施例提供的一种构建二级检测卷积神经网络的方法的具体实现流程图;
图8-1是本发明实施例提供的一种二级检测卷积神经网络的示意图;
图8-2是本发明实施例提供的一种区域DensBlock的示意图;
图9是本发明实施例提供的一种对二级检测卷积神经网络进行训练的方法的具体实现流程图;
图10是本发明实施例提供的一种图像识别装置的示意图;
图11是本发明实施例提供的一种终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、系统、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。请参考图1,图1示出了本发明实施例提供的一种图像识别方法的实现流程,详述如下:
在步骤S101中,获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像。
在本发明实施例中,原始图像具体为在显示屏生产过程的不同环节中所采集的图像。基于该原始图像,可以在进行图像识别处理后查找到显示屏发生缺陷的位置坐标和该缺陷的类别。这里所指的不同环节具体为生产环境的不同关键节点。
在这里,预处理具体为按照预设图像尺寸对原始图像的尺寸进行调整,比如,第一图像为原始图像按照112*112的图像尺寸进行调整后得到的图像,即第一图像为大小为112*112的图像;第二图像为原始图像按照416*416的图像尺寸进行调整后得到的图像,即第二图像为大小为416*416的图像。
可选的,步骤S101的具体实现流程请参考图2,图2示出了本发明实施例提供的一种对原始图像进行预处理的方法的具体实现流程,详述如下:
在步骤S201中,按照第一预设图像尺寸,对所述原始图像进行尺寸调整,得到第一图像。
在本发明实施例中,对原始图像的尺寸并没有限制,其可以大于或小于第一预设图像尺寸,也可以等于第一预设图像尺寸。也就是说,这里对输入的原始图像的尺寸并无具体限制,可以是任意大小。而第一预设图像尺寸和第二预设图像尺寸为预先设定的图像尺寸,并不能进行随意更改。
在步骤S202中,按照第二预设图像尺寸,对所述原始图像进行尺寸调整,得到第二图像。
在本发明实施例中,第一预设图像尺寸和第二预设图像尺寸为预先设置的图像尺寸,并按照该图像尺寸对原始图像的尺寸进行调整以得到对应的第一图像和第二图像。优选的,第一预设图像尺寸小于第二预设图像尺寸,并且第一预设图像尺寸小于原始图像尺寸。
在这里,第一图像和第二图像中的第一和第二并无特殊含义,仅是用来表示不同尺寸的图像。
可以理解的是,步骤S201和步骤S202并无先后之分,两者可以同时进行,也可以分别进行。
在这里,将第一图像输入到一级分类卷积神经网络后,由于该第一图像的图像尺寸较小,从而一级分类卷积神经网络能够快速地查找到该第一图像对应的图像类别信息,提高了图像识别的效率。
在步骤S203中,消除所述第一图像和所述第二图像的边缘非判断区域。
在本发明实施例中,为了进一步提高图像识别的效率及准确率,在得到第一图像和第二图像后,分别消除第一图像和第二图像中的边缘非判断区域,这里所指的边缘非判断区域具体为不需要判断目标图像的缺陷的图像区域。由于减少了需要识别的图像区域,使得图像识别的效率更高,并且由于数据集中,使得图像识别的准确率也相应提高了。
在步骤S102中,将所述第一图像输入一级分类卷积神经网络,得到图像类别信息。
在本发明实施例中,图像类别信息具体为原始图像中基于显示屏所发生的缺陷进行分类后得到的图像类别信息,不同的缺陷类型对应不同的图像类别信息。
在这里,一级分类卷积神经网络主要用于对输入该卷积神经网络的图像进行缺陷分类,得到对应的图像类别信息。
可选的,在步骤S102之前,还包括了构建一级分类卷积神经网络的具体实现步骤。请参考图3,图3示出了本发明实施例提供的一种构建一级分类卷积神经网络的方法的具体实现流程,详述如下:
在步骤S301中,根据常规卷积核Convolution和深度卷积核DepthwiseConvolution的大小以及通道数,按照预先设置的层数,构建分类卷积层。
在本发明实施例中,预先设置有常规卷积核和深度卷积核的大小以及通道数,以及常规卷积核和深度卷积核的层数。这里所指的卷积核的大小为不同行列数的矩阵,比如1行1列的矩阵、3行3列的矩阵。
在步骤S302中,根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络。
在本发明实施例中,请参考图4-1和图4-2,图4-1示出了本发明实施例提供的一种一级分类卷积神经网络的示意图,图4-2示出了本发明实施例提供的一种区域块Block A的示意图。结合图4-1和图4-2图对步骤S302中所构建的一级分类卷积神经网络进行说明。从图4-1中我们可以看到,一级分类卷积神经网络中包括有3个不同大小及通道数的常规卷积核,5个具有不同通道数的区域块Block A以及平均池化层。从图4-2中可以看到,区域块Block A由两个具有不同大小和通道数的深度卷积核组成,进一步的,该深度卷积核均由线性整流函数(Rectified Linear Unit,ReLU)进行修正后输出。
在这里,将第一图像输入到一级分类卷积神经网络后,经大小为3*3矩阵、通道数为32的第一常规卷积核处理后,输入5个具有不同通道数的区域块Block A进行深度卷积后,再将结果输入到大小为1*1矩阵,通道数为1280的第二常规卷积核以及平均池化层进行相应处理后,再经大小为1*1,通道数为2的第三常规卷积核处理后得到该第一图像对应的分类结果,即得到该第一图像对应的图像分类信息。
可选的,在步骤S302之后,还包括对一级分类卷积神经网络进行训练的具体实现步骤,请参考图5,图5示出了本发明实施例提供的一种对一级分类卷积神经网络进行训练的方法的具体实现流程,详述如下:在步骤S501中,将第一训练数据集输入所述一级分类卷积神经网络。
在本发明实施例中,第一训练数据集用于训练一级分类卷积神经网络,对该一级分类卷积神经网络中的各个参数进行修正,以使得该一级分类卷积神经网络能达到预设的识别准确率或者该一级分类卷积神经网络所能达到的最高的识别准确率。
在本发明实施例中,第一训练数据集由大量的标注了具体的显示屏的缺陷类别的图像构成。
可选的,在步骤S501之前,本发明实施例还包括了构建训练数据集的具体实现步骤,请参考图6,图6示出了本发明实施例提供的一种构建训练数据集的方法的具体实现流程,详述如下:
在步骤S601中,基于预分类图像,构建原始训练数据集。
在本发明实施例中,预分类图像具体为对原始图像中所包含的缺陷类型进行分类后的图像组,一般通过筛选和标识的方法,把不同缺陷的原始图像进行分类存储,并基于该预分类图像构建原始训练数据集。
在步骤S602中,按照预设图像处理方式,对所述原始训练数据集的图像数据进行增强和扩充处理,得到扩充后的训练数据集。
在本发明实施例中,为了训练卷积神经网络,以得到更高的准确了,所使用的数据是非常大的,而原始训练数据集中的数据有限,需要对该原始训练集中的图像数据进行增强和扩充data augmentation,以得到更多的数据量,提高卷积神经网络的准确率。
在这里,预设图像处理方式包括但不限于归一化处理、白化处理、随机水平移动、随机垂直移动、随机缩放、随机通道转换、随机水平翻转、随机垂直翻转等图像处理方式。通过预设图像处理方式对原始训练数据集中的图像数据进行增强和扩充后,所得到的扩充后的训练数据集,比原始训练数据集增多了二十多倍的数据量。
在步骤S603中,按照第一预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第一训练数据集。
在本发明实施例中,按照第一预设图像尺寸,对扩充后的训练数据集中的所有图像进行尺寸调整,尺寸调整为第一预设图像尺寸的所有图像构成了第一训练数据集。
在步骤S604中,按照第二预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第二训练数据集。
在本发明实施例中,按照第二预设图像尺寸,对扩充后的训练数据集中的所有图像进行尺寸调整,尺寸调整为第二预设图像尺寸的所有图像构成了第二训练数据集。
可以理解的是,步骤S603和步骤S604并无先后之分,两者可以同时进行,也可以分别进行。
在步骤S502中,基于所述第一训练数据集,对所述一级分类卷积神经网络进行训练。
在本发明实施例中,一级分类卷积神经网络中预先设置的学习率为0.001,学习率衰减为0.001,批量大小BatchSize为64,动量Momentum为0.97,训练迭代次数为3万,在这里,每训练7000步,对一级分类卷积神经网络中的学习率以0.1的系数线性衰减,这里所使用的损失函数为通用Adam损失函数。
在步骤S503中,当训练次数达到第一预设阈值时,停止对所述一级分类卷积神经网络的训练。
在本发明实施例中,第一预设阈值为预先设定的训练次数阈值,当达到这一训练次数阈值时,一级分类卷积神经网络的分类准确率也就达到了预期的准确率,可以停止对一级分类卷积神经网络的训练,以减少无限循环的训练,有效地均衡了图像分类的准确率和时效性。
在步骤S103中,将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
在本发明实施例中,二级检测卷积神经网络的数量至少为1个,其实际数量与缺陷类别的种类数量相同,也就是有多少种缺陷类别,就有多少个二级检测卷积神经网络,比如有N组缺陷类别,就有N个对应的二级检测卷积神经网络。
在这里,图像识别结果包括但不限于缺陷类别,该缺陷对应的坐标位置等信息。
可选的,在步骤S103之前,还包括构建二级检测卷积神经网络的具体实现步骤,请参考图7,图7示出了本发明实施例提供的一种构建二级检测卷积神经网络的具体实现流程,详述如下:
在步骤S701中,根据常规卷积核Convolution的大小和通道数,按照预先设置的层数,并结合图像下采样DownScale,构建检测卷积层。
在步骤S702中,根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROI Pooling,构建所述二级检测卷积神经网络。
在本发明实施例中,请参考图8-1和图8-2,图8-1示出了本发明实施例提供的一种二级检测卷积神经网络的示意图,图8-2示出了本发明实施例提供的一种区域块DensBlock的示意图。结合图8-1和图8-2图对步骤S702中所构建的二级卷积神经网络进行说明。
从图8-1中可以看到,第二图像输入二级检测卷积神经网络后,经一个大小为3*3,通道数为32的常规卷积核处理后,再经过5组图像下采样DownScale和不同通道数的区域块DensBlock处理后,所得的的结果输入平均池化层Average Pooling和兴趣区池化层ROIPooling后得到图像识别结果,该图像识别结果包括原始图像、图像中缺陷的位置坐标和种类。
可选的,在步骤S702之后,还包括对二级检测卷积神经网络进行训练的具体实现步骤,请参考图9,图9示出了本发明实施例提供的一种对二级检测卷积神经网络进行训练的方法的具体实现流程,详述如下:
在步骤S901中,将第二训练数据集输入所述二级检测卷积神经网络。
在本发明实施例中,第二训练数据集用于训练二级检测卷积神经网络,对该二级检测卷积神经网络中的各个参数进行修正,以使得该二级检测卷积神经网络能达到预设的识别准确率或者该二级检测卷积神经网络所能达到的最高的识别准确率。
在步骤S902中,基于所述第二训练数据集,对所述二级检测卷积神经网络进行训练。
在本发明实施例中,二级检测卷积神经网络中预先设置的学习率为0.001,学习率衰减为0.0005,批量大小BatchSize为32,动量Momentum为0.9,训练迭代次数为10万,在这里,每训练5000步,对二级检测卷积神经网络中的学习率以0.1的系数线性衰减,这里所使用的损失函数由坐标损失,分类损失和IOU(Intersection over Union,一种测量在特定数据集中检测相应物体准确度的一个标准)损失三部分组成。
在步骤S903中,当训练次数达到第二预设阈值时,停止对所述二级检测卷积神经网络的训练。
在本发明实施例中,第二预设阈值为预先设定的训练次数阈值,当达到这二训练次数阈值时,二级检测卷积神经网络的分类准确率也就达到了预期的准确率,可以停止对二级检测卷积神经网络的训练,以减少无限循环的训练,有效地均衡了图像识别的准确率和时效性。
在这里,当有N个二级检测卷积神经网络时,分别或者同时对该N个二级检测卷积神经网络进行训练。
在本发明实施例,当出现新的缺陷类别时,可以在不影响二级检测卷积神经网络的情况下,即不需要再对该二级检测卷积神经网络进行训练以修正其参数,仅通过单独训练一级分类卷积神经网络进行迭代,从而使得本发明实施例所提供的图像识别方法易于扩展,并提高了图像识别的鲁棒性。
在本发明实施例中,通过获取原始图像,并对该原始图像进行预处理得到第一图像和第二图像后,将该第一图像输入一级分类卷积神经网络,得到图像类别信息,再将该第二图像输入与该图像类别信息对应的二级检测卷积神经网络,得到图像识别结果,从而实现了对原始图像的自动分类及图像识别,提高了对缺陷目标的识别效率及正确率,而且由于引入卷积神经网络,使得图像识别的扩展性增强,并提高了图像识别的鲁棒性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑控制,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种图像识别方法,图10示出了本发明实施例提供的一种图像识别装置的示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图10,该装置包括:
图像预处理单元101,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元102,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元103,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
可选的,该装置还包括:
分类卷积层构建单元,用于根据常规卷积核Convolution和深度卷积核DepthwiseConvolution的大小以及通道数,按照预先设置的层数,构建分类卷积层;
一级分类卷积神经网络构建单元,用于根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络。
可选的,该装置还包括:
第一训练数据集输入单元,用于将第一训练数据集输入所述一级分类卷积神经网络;
一级分类卷积神经网络训练单元,用于基于所述第一训练数据集,对所述一级分类卷积神经网络进行训练;
第一训练停止单元,用于当训练次数达到第一预设阈值时,停止对所述一级分类卷积神经网络的训练。
可选的,该装置还包括:
原始训练数据集构建单元,用于基于预分类图像,构建原始训练数据集;
训练数据集扩充单元,用于按照预设图像处理方式,对所述原始训练数据集的图像数据进行增强和扩充处理,得到扩充后的训练数据集;
第一训练数据集处理单元,用于按照第一预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第一训练数据集;
第二训练数据集处理单元,用于按照第二预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第二训练数据集。
可选的,所述图像预处理单元101包括:
第一图像尺寸调整子单元,用于按照第一预设图像尺寸,对所述原始图像进行尺寸调整,得到第一图像;
第二图像尺寸调整子单元,用于按照第二预设图像尺寸,对所述原始图像进行尺寸调整,得到第二图像;
边缘非判断区域消除子单元,用于消除所述第一图像和所述第二图像的边缘非判断区域。
可选的,该装置还包括:
检测卷积层构建单元,用于根据常规卷积核Convolution的大小和通道数,按照预先设置的层数,并结合图像下采样DownScale,构建检测卷积层;
二级检测卷积神经网络构建单元,用于根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROI Pooling,构建所述二级检测卷积神经网络。
可选的,该装置还包括:
第二训练数据集输入单元,用于将第二训练数据集输入所述二级检测卷积神经网络;
二级检测卷积神经网络训练单元,用于基于所述第二训练数据集,对所述二级检测卷积神经网络进行训练;
第二训练停止单元,用于当训练次数达到第二预设阈值时,停止对所述二级检测卷积神经网络的训练。
在本发明实施例中,通过获取原始图像,并对该原始图像进行预处理得到第一图像和第二图像后,将该第一图像输入一级分类卷积神经网络,得到图像类别信息,再将该第二图像输入与该图像类别信息对应的二级检测卷积神经网络,得到图像识别结果,从而实现了对原始图像的自动分类及图像识别,提高了对缺陷目标的识别效率及正确率,而且由于引入卷积神经网络,使得图像识别的扩展性增强,并提高了图像识别的鲁棒性。
图11是本发明一实施例提供的一种终端的示意图。如图11所示,该实施例的终端设备11包括:处理器110、存储器111以及存储在所述存储器111中并可在所述处理器110上运行的计算机程序112。所述处理器110执行所述计算机程序112时实现上述各个图像识别方法实施例中的步骤,例如图1所示的步骤101至103。或者,所述处理器110执行所述计算机程序112时实现上述各系统实施例中各单元的功能,例如图10所示模块101至103的功能。
示例性的,所述计算机程序112可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器111中,并由所述处理器110执行,以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序112在所述终端设备11中的执行过程。例如,所述计算机程序112可以被分割成图像预处理单元101、图像分类单元102、图像识别单元103,各单元具体功能如下:
图像预处理单元101,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元102,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元103,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果。
可选的,所述计算机程序112还可以被分割成分类卷积层构建单元、一级分类卷积神经网络构建单元,各单元具体功能如下:
分类卷积层构建单元,用于根据常规卷积核Convolution和深度卷积核DepthwiseConvolution的大小以及通道数,按照预先设置的层数,构建分类卷积层;
一级分类卷积神经网络构建单元,用于根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络。
可选的,所述计算机程序112还可以被分割成第一训练数据集输入单元、一级分类卷积神经网络训练单元、第一训练停止单元,各单元具体功能如下:
第一训练数据集输入单元,用于将第一训练数据集输入所述一级分类卷积神经网络;
一级分类卷积神经网络训练单元,用于基于所述第一训练数据集,对所述一级分类卷积神经网络进行训练;
第一训练停止单元,用于当训练次数达到第一预设阈值时,停止对所述一级分类卷积神经网络的训练。
可选的,所述计算机程序112还可以被分割成原始训练数据集构建单元、训练数据集扩充单元、第一训练数据集处理单元、第二训练数据集处理单元,各单元具体功能如下:
原始训练数据集构建单元,用于基于预分类图像,构建原始训练数据集;
训练数据集扩充单元,用于按照预设图像处理方式,对所述原始训练数据集的图像数据进行增强和扩充处理,得到扩充后的训练数据集;
第一训练数据集处理单元,用于按照第一预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第一训练数据集;
第二训练数据集处理单元,用于按照第二预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第二训练数据集。
可选的,所述计算机程序112中的所述图像预处理单元101还可以被分割成第一图像尺寸调整子单元、第二图像尺寸调整子单元、边缘非判断区域消除子单元,各单元具体功能如下:
第一图像尺寸调整子单元,用于按照第一预设图像尺寸,对所述原始图像进行尺寸调整,得到第一图像;
第二图像尺寸调整子单元,用于按照第二预设图像尺寸,对所述原始图像进行尺寸调整,得到第二图像;
边缘非判断区域消除子单元,用于消除所述第一图像和所述第二图像的边缘非判断区域。
可选的,所述计算机程序112还可以被分割成检测卷积层构建单元、二级检测卷积神经网络构建单元,各单元具体功能如下:
检测卷积层构建单元,用于根据常规卷积核Convolution的大小和通道数,按照预先设置的层数,并结合图像下采样DownScale,构建检测卷积层;
二级检测卷积神经网络构建单元,用于根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROI Pooling,构建所述二级检测卷积神经网络。
可选的,所述计算机程序112还可以被分割成第二训练数据集输入单元、二级检测卷积神经网络训练单元、第二训练停止单元,各单元具体功能如下:
第二训练数据集输入单元,用于将第二训练数据集输入所述二级检测卷积神经网络;
二级检测卷积神经网络训练单元,用于基于所述第二训练数据集,对所述二级检测卷积神经网络进行训练;
第二训练停止单元,用于当训练次数达到第二预设阈值时,停止对所述二级检测卷积神经网络的训练。
所述终端设备11可以是桌上型计算机、笔记本、服务器、大型计算机等终端设备。所述终端设备11可包括,但不仅限于,处理器110、存储器111。本领域技术人员可以理解,图11仅仅是终端设备11的示例,并不构成对终端设备11的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端还可以包括输入输出设备、网络接入设备、总线等。
所称处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器111可以是所述终端设备11的内部存储单元,例如终端设备11的硬盘或内存。所述存储器111也可以是所述终端设备11的外部存储设备,例如所述终端设备11上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器111还可以既包括所述终端设备11的内部存储单元也包括外部存储设备。所述存储器111用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器111还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的系统/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的系统/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,系统或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或系统、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (8)
1.一种图像识别方法,用于显示屏缺陷的判断,其特征在于,所述方法包括:
获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果;所述图像识别结果包括图像中缺陷的位置坐标;
在所述将所述第一图像输入一级分类卷积神经网络,得到图像类别信息的步骤之前,还包括:
根据常规卷积核Convolution和深度卷积核Depthwise Convolution的大小以及通道数,按照预先设置的层数,构建分类卷积层;
根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络;
在所述将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果的步骤之前,还包括:
根据常规卷积核Convolution的大小和通道数,按照预先设置的层数,并结合图像下采样DownScale,构建检测卷积层;
根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROIPooling,构建所述二级检测卷积神经网络。
2.如权利要求1所述的方法,其特征在于,在所述根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络的步骤之后,还包括:
将第一训练数据集输入所述一级分类卷积神经网络;
基于所述第一训练数据集,对所述一级分类卷积神经网络进行训练;
当训练次数达到第一预设阈值时,停止对所述一级分类卷积神经网络的训练。
3.如权利要求2所述的方法,其特征在于,在所述将第一训练数据集输入所述一级分类卷积神经网络的步骤之前,还包括:
基于预分类图像,构建原始训练数据集;
按照预设图像处理方式,对所述原始训练数据集的图像数据进行增强和扩充处理,得到扩充后的训练数据集;
按照第一预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第一训练数据集;
按照第二预设图像尺寸,对扩充后的训练数据集进行尺寸调整,得到第二训练数据集。
4.如权利要求1所述的方法,其特征在于,所述获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像的步骤,包括:
按照第一预设图像尺寸,对所述原始图像进行尺寸调整,得到第一图像;
按照第二预设图像尺寸,对所述原始图像进行尺寸调整,得到第二图像,所述第一预设图像尺寸小于所述第二预设图像尺寸;
消除所述第一图像和所述第二图像的边缘非判断区域。
5.如权利要求1所述的方法,其特征在于,在所述根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROIPooling,构建所述二级检测卷积神经网络的步骤之后,还包括:
将第二训练数据集输入所述二级检测卷积神经网络;
基于所述第二训练数据集,对所述二级检测卷积神经网络进行训练;
当训练次数达到第二预设阈值时,停止对所述二级检测卷积神经网络的训练。
6.一种图像识别装置,其特征在于,所述装置包括:
图像预处理单元,用于获取原始图像,并对所述原始图像进行预处理得到第一图像和第二图像;
图像分类单元,用于将所述第一图像输入一级分类卷积神经网络,得到图像类别信息;
图像识别单元,用于将所述第二图像输入与所述图像类别信息对应的二级检测卷积神经网络,得到图像识别结果;所述图像识别结果包括图像中缺陷的位置坐标;
所述图像识别装置还包括:
分类卷积层构建单元,用于根据常规卷积核Convolution和深度卷积核DepthwiseConvolution的大小以及通道数,按照预先设置的层数,构建分类卷积层;
一级分类卷积神经网络构建单元,用于根据所述分类卷积层,并结合平均池化层Average Pooling,构建所述一级分类卷积神经网络;
检测卷积层构建单元,用于根据常规卷积核Convolution的大小和通道数,按照预先设置的层数,并结合图像下采样DownScale,构建检测卷积层;
二级检测卷积神经网络构建单元,用于根据所述检测卷积层,并结合平均池化层Average Pooling和兴趣区池化层ROIPooling,构建所述二级检测卷积神经网络。
7.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述图像识别方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述图像识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811580564.1A CN111369489B (zh) | 2018-12-24 | 2018-12-24 | 一种图像识别方法、装置及终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811580564.1A CN111369489B (zh) | 2018-12-24 | 2018-12-24 | 一种图像识别方法、装置及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111369489A CN111369489A (zh) | 2020-07-03 |
CN111369489B true CN111369489B (zh) | 2024-04-16 |
Family
ID=71207854
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811580564.1A Active CN111369489B (zh) | 2018-12-24 | 2018-12-24 | 一种图像识别方法、装置及终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111369489B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449814B (zh) * | 2021-07-20 | 2022-10-04 | 曲阜师范大学 | 一种图片层级分类方法及系统 |
CN116503414B (zh) * | 2023-06-29 | 2023-11-03 | 深圳思谋信息科技有限公司 | 屏幕缺陷检测方法、装置、计算机设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990086856A (ko) * | 1998-05-30 | 1999-12-15 | 윤종용 | 계층적 신경망을 이용한 물체 감지 장치 및방법 |
CN106980871A (zh) * | 2016-01-13 | 2017-07-25 | 福特全球技术公司 | 应用到道路场景图像的低保真分类器和高保真分类器 |
CN108537283A (zh) * | 2018-04-13 | 2018-09-14 | 厦门美图之家科技有限公司 | 一种图像分类方法及卷积神经网络生成方法 |
CN108776819A (zh) * | 2018-06-05 | 2018-11-09 | Oppo广东移动通信有限公司 | 一种目标识别方法、移动终端及计算机可读存储介质 |
-
2018
- 2018-12-24 CN CN201811580564.1A patent/CN111369489B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR19990086856A (ko) * | 1998-05-30 | 1999-12-15 | 윤종용 | 계층적 신경망을 이용한 물체 감지 장치 및방법 |
CN106980871A (zh) * | 2016-01-13 | 2017-07-25 | 福特全球技术公司 | 应用到道路场景图像的低保真分类器和高保真分类器 |
CN108537283A (zh) * | 2018-04-13 | 2018-09-14 | 厦门美图之家科技有限公司 | 一种图像分类方法及卷积神经网络生成方法 |
CN108776819A (zh) * | 2018-06-05 | 2018-11-09 | Oppo广东移动通信有限公司 | 一种目标识别方法、移动终端及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111369489A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11295435B2 (en) | Product defect detection method, device and system | |
CN110705583B (zh) | 细胞检测模型训练方法、装置、计算机设备及存储介质 | |
CN108876792B (zh) | 语义分割方法、装置和系统及存储介质 | |
CN110942074B (zh) | 字符切分识别方法、装置、电子设备、存储介质 | |
CN112132193A (zh) | 一种用于遥感图像分类的神经网络优化方法、终端以及存储介质 | |
CN111860398B (zh) | 遥感图像目标检测方法、系统及终端设备 | |
US9619753B2 (en) | Data analysis system and method | |
CN112183501B (zh) | 深度伪造图像检测方法及装置 | |
CN109377500B (zh) | 基于神经网络的图像分割方法及终端设备 | |
CN106909901B (zh) | 从图像中检测物体的方法及装置 | |
CN111080660A (zh) | 一种图像分割方法、装置、终端设备及存储介质 | |
CN109919992B (zh) | 估测图像中的深度的方法 | |
CN111950408B (zh) | 基于规则图的手指静脉图像识别方法、装置及存储介质 | |
CN106203454A (zh) | 证件版式分析的方法及装置 | |
CN111369489B (zh) | 一种图像识别方法、装置及终端设备 | |
CN114974421B (zh) | 基于扩散-降噪的单细胞转录组测序数据补插方法及系统 | |
CN116994044A (zh) | 一种基于掩码多模态生成对抗网络的图像异常检测模型的构建方法 | |
CN109034070B (zh) | 一种置换混叠图像盲分离方法及装置 | |
CN111738272A (zh) | 一种目标特征提取方法、装置及电子设备 | |
CN113269752A (zh) | 一种图像检测方法、装置终端设备及存储介质 | |
CN115345895B (zh) | 用于视觉检测的图像分割方法、装置、计算机设备及介质 | |
CN108510636B (zh) | 图像分割方法、图像分割装置及终端设备 | |
US20220207892A1 (en) | Method and device for classifing densities of cells, electronic device using method, and storage medium | |
EP4328812A1 (en) | Training device, training method, image processing device, and image processing method | |
CN113657196A (zh) | Sar图像目标检测方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 516006 TCL science and technology building, No. 17, Huifeng Third Road, Zhongkai high tech Zone, Huizhou City, Guangdong Province Applicant after: TCL Technology Group Co.,Ltd. Address before: 516006 Guangdong province Huizhou Zhongkai hi tech Development Zone No. nineteen District Applicant before: TCL Corp. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |