CN108256575A - 图像识别方法、装置、计算机设备和存储介质 - Google Patents
图像识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN108256575A CN108256575A CN201810043722.3A CN201810043722A CN108256575A CN 108256575 A CN108256575 A CN 108256575A CN 201810043722 A CN201810043722 A CN 201810043722A CN 108256575 A CN108256575 A CN 108256575A
- Authority
- CN
- China
- Prior art keywords
- image
- vgg
- vgg networks
- networks
- initial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/29—Graphical models, e.g. Bayesian networks
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种图像识别方法,所述方法包括:获取图像,并在GUI界面显示所述图像;响应用户操作,调用识别函数;通过所述识别函数调用预设VGG网络;将所述图像转化为矩阵;将所述矩阵输入所述预设VGG网络,得到识别结果。采用本方法用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。此外,本发明还提供了一种图像识别装置,计算机设备以及存储介质。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种图像方法、装置、计算机设备和存储介质。
背景技术
随着机器学习技术的发展,出现了深度学习技术,深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。而深度学习中比较主流的算法就是CNN((Convolutional Neural Network,卷积神经网络)。而VGG网络是经典CNN模型中的一种。
然而,目前的基于VGG网络的图像识别系统,存在使用效率低下的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够使用效率高的图像识别方法、装置、计算机设备和存储介质。
一种图像识别方法,其特征在于,所述方法包括:
获取图像,并在GUI(Graphical User Interface,图形用户接口)界面显示所述图像;
响应用户操作,调用识别函数;
通过所述识别函数调用预设VGG网络;
将所述图像转化为矩阵;
根据所述矩阵以及所述预设VGG网络得到识别结果,并在所述GUI界面显示所述识别结果。
在其中一个实施例中,所述将所述图像转化为矩阵的步骤包括:
将所述图像转化为1*N的矩阵,所述N为正整数。
在其中一个实施例中,所述将所述矩阵输入所述预设VGG网络,得到识别结果的步骤具体包括:
将所述矩阵输入所述预设VGG网络;
通过所述预设VGG网络内的softmax函数对所述矩阵进行识别,获得识别结果。
在其中一个实施例中,所述通过所述识别函数调用预设VGG网络的步骤前还包括:
搭建初始VGG网络,随机初始化所述初始VGG网络的权重参数和偏置参数;
将带有分类标识的图像输入所述初始VGG网络,并通过所述初始VGG网络内的softmax函数对所述带有分类标识的图像进行识别分类,获得分类结果;
根据所述分类标识与所述分类结果得到模型偏差值;
根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
在其中一个实施例中,所述根据所述分类标识与所述分类结果得到模型偏差值的步骤具体包括:
将所述分类结果与所述分类标识进行对比,获得对比结果;
通过交叉熵损失函数对所述对比结果进行计算,获得模型偏差值。
在其中一个实施例中,所述根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数的步骤具体包括:
根据所述模型偏差值,利用反向传播算法更新所述初始VGG网络模型中的权重参数和偏置参数。
在其中一个实施例中,所述根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数的步骤后还包括:
判断所述模型偏差值与预设阈值的大小关系;
当所述模型偏差值大于所述预设阈值时,跳至所述将带有分类标识的图像输入所述初始VGG网络,并通过所述初始VGG网络内的softmax函数对所述带有分类标识的图像进行识别分类的步骤;
当所述模型偏差值小于或等于所述预设阈值时,跳至所述获得预设VGG网络的步骤。
一种图像识别装置,所述装置包括:
图像显示模块,用于获取图像,并在GUI界面显示所述图像;
识别函数获取模块,用于响应用户操作,调用识别函数;
VGG网络调用模块,用于通过所述识别函数调用预设VGG网络;
矩阵转换模块,用于将所述图像转化为矩阵;
图像识别模块,用于将所述矩阵输入所述预设VGG网络,得到识别结果。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取图像,并在GUI界面显示所述图像;
响应用户操作,调用识别函数;
通过所述识别函数调用预设VGG网络;
将所述图像转化为矩阵;
将所述矩阵输入所述预设VGG网络,得到识别结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取图像,并在GUI界面显示所述图像;
响应用户操作,调用识别函数;
通过所述识别函数调用预设VGG网络;
将所述图像转化为矩阵;
将所述矩阵输入所述预设VGG网络,得到识别结果。
上述图像识别方法、装置、计算机设备和存储介质,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
附图说明
图1为一个实施例中图像识别方法的应用环境图;
图2为一个实施例中图像识别方法的流程示意图;
图3为一个实施例中图像识别方法的流程示意图;
图4为一个实施例中图像识别方法中获取预设VGG网络的流程示意图;
图5为一个实施例中图像识别方法中获取预设VGG网络的流程示意图;
图6为一个实施例中图像识别装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的图像识别方法,可以应用于如图1所示的应用环境中。其中,上位机内存储有基于VGG网络的图像识别算法,图像识别算法可以打包成应用程序给用户执行,用户打开应用即可调用GUI,在GUI上进行操作。该系统还能附加拍照模块作为下位机,用户可操控外接在系统上的摄像头模块对物体进行拍照,并在拍照结束后对拍照所得图像进行命名和保存,接着可以利用GUI导出图像文件并在GUI上显示出来,调用算法,对被拍照物体进行识别。其中,上位机可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或STM32(ARM Cortex-M内核的32位微控制器)。
在一个实施例中,如图2所示,提供了一种图像识别方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:
步骤S100,获取图像,并在GUI界面显示图像。
其中,图像是指待识别的图像,图像可以是用户通过终端自带的拍照模块拍摄的图像,也可以是用户导入系统的图像,GUI界面是指终端上运行的软件的用户图形界面,该软件用于图像识别,它可以调用VGG模型进行图像识别操作。获取用户提供的待识别图像,并在GUI界面显示图像,等待用户的图像识别指令。
步骤S300,响应用户操作,调用识别函数。
用户操作是指用户对GUI界面的操作,GUI界面包含了各个按钮,其中包含了图像识别确认按钮。识别函数是终端上运行的软件携带有的函数,是用于进行图像识别操作的函数,可以通过用户对GUI界面的操作来调动该识别函数进行图像识别。在GUI显示了待识别图像后,用户按下GUI界面的图像识别确认按钮后,终端开始调用识别函数对待识别图像进行识别操作。
步骤S500,通过所述识别函数调用预设VGG网络。
预设VGG网络指训练完成的VGG网络,VGG网络的结构用的都是特别小的3x3的卷积模版,以及5个2x2的池化层,将卷积层的深度提升到了16-19层,通过VGG网络进行图像的识别过程需先进行网络的训练过程,才可进行图像识别操作。识别函数可调用训练完成的VGG网络进行图像识别操作。
步骤S700,将图像转化为矩阵。
矩阵是指将数字图像数据转化为矩阵,从而可以采用矩阵理论和矩阵算法对数字图像进行分析和处理。将待识别的图像转化为矩阵,以进行图像识别操作。
步骤S900,将矩阵输入预设VGG网络,得到识别结果。
将待识别图像转化而得的矩阵输入训练完成的VGG网络,就可以得到图像识别的结果。识别结果可以通过GUI界面显示,用户直观地得到图像识别的结果。
上述图像识别方法,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
如图3所示,在其中一个实施例中,步骤S300将图像转化为矩阵的步骤包括:
将图像转化为1*N的矩阵,N为正整数。将图像转化为1*N的矩阵再输入预设VGG网络能进行更有效地进行识别。
在其中一个实施例中,步骤S900:将矩阵输入预设VGG网络,得到识别结果具体包括:
步骤S920,将矩阵输入预设VGG网络。
步骤S940,通过预设VGG网络内的softmax函数对矩阵进行识别,获得识别结果。
softmax函数是VGG网络内用于图像识别的函数,通过VGG网络中的VGG网络对待识别图像识别,可以直接得到图像识别的结果。
如图4所示,在其中一个实施例中,步骤S500,通过识别函数调用预设VGG网络前还包括:
步骤S410,搭建初始VGG网络,随机初始化初始VGG网络的权重参数和偏置参数。
步骤S430,将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类,获得分类结果。
步骤S450,根据分类标识与分类结果得到模型偏差值。
步骤S470,根据模型偏差值更新初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
在使用VGG网络进行图像识别之前要先对VGG网络进行训练。生物的脑的神经元的具体的连接可以很复杂,所有可能性合起来可以组成一个“解空间”。神经网络作为模仿/借鉴上面的网络的东西,在设计时要设法圈出一个有用的“解空间”好容纳尽可能多的解。最后能用的神经网络,很多连接可以去掉,这等于把一开始圈出来的解空间“退化成更小的、可用的东西;这个过程具体的表现,就是权重和偏置的变化;这个过程本身不一定能对应成生物脑里发生的过程,但是它的开端相当于开始发育/被训练的生物的脑,可以容纳很多可能的结构,而它的结束相当于长成/训练好/学好了的生物的脑,可以有用处。训练过程实际就是对权重参数和偏置参数的设置过程。
首先设置好初始的VGG网络,并随机设置初始的VGG网络中的各权重参数和各偏置参数。将大量的带有分类标识的图像输入初始的VGG网络中进行识别分类,其中分类标识可以是将携带有共同图像特征的一类图片使用相同标记标记出来,比如将具有相同特征A的图像附带上分类标记甲,将具有相同特征B的图像附带上分类标记乙,其中指定的特征可以根据不同的分类要求进行选取。分类即是指将这些带有分类标记的图像输入初始VGG网络进行识别,将其归类为具有特征A的图像群A和具有特征B的图像群B。根据识别分类的结果与图像原本携带的分类标识的对比来获得初始模型的偏差值,根据分类后图像群A中可能存在带有分类标记乙的图像,分类后图像群B中可能存在带有分类标记甲的图像,即分类结果出现了偏差,根据出现偏差的比例可以得出VGG模型的模型偏差。而后再根据模型偏差值来调整权重参数和偏置参数,获得预设VGG网络即训练完成的VGG网络来进行图像识别。使用训练完成的VGG网络进行识别能获得更高的识别精度。
如图5所示,在其中一个实施例中,步骤S450,根据分类标识与分类结果得到模型偏差值具体包括:
步骤S452,将分类结果与分类标识进行对比,获得对比结果。
步骤S454,通过交叉熵损失函数对对比结果进行计算,获得模型偏差值。
交叉熵可在神经网络(机器学习)中作为损失函数,用p表示真实标记的分布,q则为训练后的模型的预测标记分布,交叉熵损失函数可以衡量p与q的相似性。可以通过交叉熵损失函数来对对比结果进行计算获得模型偏差值,获得模型偏差值。使用交叉熵损失函数来计算模型偏差值能加快训练过程。
在其中一个实施例中,根据模型偏差值更新初始VGG网络的权重参数和偏置参数的步骤具体包括:
步骤S472,根据模型偏差值,利用反向传播算法更新初始VGG网络模型中的权重参数和偏置参数。
反向传播算法的学习过程由正向传播过程和反向传播过程组成。在正向传播过程中,输入信息通过输入层经隐含层,逐层处理并传向输出层。如果在输出层得不到期望的输出值,则取输出与期望的误差的平方和作为目标函数,转入反向传播,逐层求出目标函数对各神经元权值的偏导数,构成目标函数对权值向量的梯量,作为修改权值的依据,网络的学习在权值修改过程中完成。通过反向传播算法可以准确地更新初始的权重参数和偏置参数。
在其中一个实施例中,根据模型偏差值更新初始VGG网络的权重参数和偏置参数的步骤后还包括:
步骤S474,判断模型偏差值与预设阈值的大小关系;
当模型偏差值大于预设阈值时,跳至步骤S430,将带有分类标识的图像输入所述初始VGG网络,通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类。
当模型偏差值小于或等于预设阈值时,跳至步骤S476,获得预设VGG网络。
在更新完权重参数和偏置参数之后,还要判断模型偏差值是否超出了设定阈值。即判断识别误差是否过大,当识别误差过大时,使用更新后的权重参数和偏置参数在进行一次训练,直到误差到达可控范围后,即完成训练后才使用训练完成的VGG网络进行图像识别操作。应当理解的是,此处的初始VGG网络指的是权重参数和偏置参数更新后的VGG网络。通过多次训练后再使用VGG网络进行图像识别,可以大大提高图像识别的精度。
在其中一个实施例中,图像识别方法包括以下步骤:
步骤S100,获取图像,并在GUI界面显示图像。
步骤S300,响应用户操作,调用识别函数。
步骤S410,搭建初始VGG网络,随机初始化初始VGG网络的权重参数和偏置参数。
步骤S430,将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类,获得分类结果。
步骤S452,将分类结果与分类标识进行对比,获得对比结果。
步骤S454,通过交叉熵损失函数对对比结果进行计算,获得模型偏差值。
步骤S472,根据模型偏差值,利用反向传播算法更新初始VGG网络模型中的权重参数和偏置参数。
步骤S474,判断模型偏差值与预设阈值的大小关系;
当模型偏差值大于预设阈值时,跳至步骤S430,将带有分类标识的图像输入所述初始VGG网络,通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类。
当模型偏差值小于或等于预设阈值时,跳至步骤S476,获得预设VGG网络。
步骤S500,通过所述识别函数调用预设VGG网络。
步骤S700,将图像转化为1*N的矩阵,N为正整数。
步骤S920,将矩阵输入预设VGG网络。
步骤S940,通过预设VGG网络内的softmax函数对矩阵进行识别,获得识别结果。
上述图像识别方法,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
应该理解的是,虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
一种图像识别装置,如图6所示,包括:
图像显示模块100,用于获取图像,并在GUI界面显示图像。
识别函数获取模块300,用于响应用户操作,调用识别函数。
VGG网络调用模块500,用于通过识别函数调用预设VGG网络。
矩阵转换模块700,用于将图像转化为矩阵。
图像识别模块900,用于将矩阵输入预设VGG网络,得到识别结果。
上述图像识别装置,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
在其中一个实施例中,矩阵转换模块700具体用于将图像转化为1*N的矩阵,N为正整数。
在其中一个实施例中,图像识别模块900具体包括:
矩阵输入单元,用于将矩阵输入预设VGG网络。
图像识别单元,用于通过预设VGG网络内的softmax函数对矩阵进行识别,获得识别结果。
在其中一个实施例中,图像识别装置还包括VGG网络训练模块,VGG网络训练模块包括:
初始网络构建单元,搭建初始VGG网络,随机初始化初始VGG网络的权重参数和偏置参数。
训练单元,将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类,获得分类结果。
偏差获取单元,根据分类标识与分类结果得到模型偏差值。
参数更新单元,根据模型偏差值更新初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
在其中一个实施例中,偏差获取单元具体用于将分类结果与分类标识进行对比,获得对比结果,通过交叉熵损失函数对对比结果进行计算,获得模型偏差值。
在其中一个实施例中,参数更新单元具体用于根据模型偏差值,利用反向传播算法更新初始VGG网络模型中的权重参数和偏置参数。
在其中一个实施例中,参数更新单元在根据模型偏差值更新初始VGG网络的权重参数和偏置参数后还用于:
判断模型偏差值与预设阈值的大小关系;
当模型偏差值大于预设阈值时,跳至训练单元,完成将带有分类标识的图像输入初始VGG网络,执行并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类的功能。
当模型偏差值小于或等于预设阈值时,则直接获得预设VGG网络。
关于图像识别装置的具体限定可以参见上文中对于图像识别方法的限定,在此不再赘述。上述图像识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
获取图像,并在GUI界面显示图像;
响应用户操作,调用识别函数;
通过识别函数调用预设VGG网络;
将图像转化为矩阵;
将矩阵输入预设VGG网络,得到识别结果。
上述计算机设备,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将图像转化为1*N的矩阵,N为正整数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将矩阵输入预设VGG网络;
通过预设VGG网络内的softmax函数对矩阵进行识别,获得识别结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
搭建初始VGG网络,随机初始化初始VGG网络的权重参数和偏置参数;
将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类,获得分类结果;
根据分类标识与分类结果得到模型偏差值;
根据模型偏差值更新初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将分类结果与分类标识进行对比,获得对比结果;
通过交叉熵损失函数对对比结果进行计算,获得模型偏差值。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据模型偏差值,利用反向传播算法更新初始VGG网络模型中的权重参数和偏置参数。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
判断模型偏差值与预设阈值的大小关系;
当模型偏差值大于预设阈值时,跳至将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类的步骤;
当模型偏差值小于或等于预设阈值时,跳至获得预设VGG网络的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取图像,并在GUI界面显示图像;
响应用户操作,调用识别函数;
通过识别函数调用预设VGG网络;
将图像转化为矩阵;
将矩阵输入预设VGG网络,得到识别结果。
上述计算机可读存储介质,用户只需要在GUI界面选取图像,并输入识别指令,就可以通过识别函数调用VGG网络,对选取的图像进行图像识别,得到图像识别操作的结果。操作简便,提高了基于VGG网络的图像识别系统的使用效率。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将图像转化为1*N的矩阵,N为正整数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将矩阵输入预设VGG网络;
通过预设VGG网络内的softmax函数对矩阵进行识别,获得识别结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
搭建初始VGG网络,随机初始化初始VGG网络的权重参数和偏置参数;
将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类,获得分类结果;
根据分类标识与分类结果得到模型偏差值;
根据模型偏差值更新初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将分类结果与分类标识进行对比,获得对比结果;
通过交叉熵损失函数对对比结果进行计算,获得模型偏差值。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据模型偏差值,利用反向传播算法更新初始VGG网络模型中的权重参数和偏置参数。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
判断模型偏差值与预设阈值的大小关系;
当模型偏差值大于预设阈值时,跳至将带有分类标识的图像输入初始VGG网络,并通过初始VGG网络内的softmax函数对带有分类标识的图像进行识别分类的步骤;
当模型偏差值小于或等于预设阈值时,跳至获得预设VGG网络的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种图像识别方法,其特征在于,所述方法包括:
获取图像,并在GUI界面显示所述图像;
响应用户操作,调用识别函数;
通过所述识别函数调用预设VGG网络;
将所述图像转化为矩阵;
将所述矩阵输入所述预设VGG网络,得到识别结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述图像转化为矩阵的步骤包括:
将所述图像转化为1*N的矩阵,所述N为正整数。
3.根据权利要求1所述的图像识别方法,其特征在于,所述将所述矩阵输入所述预设VGG网络,得到识别结果的步骤具体包括:
将所述矩阵输入所述预设VGG网络;
通过所述预设VGG网络内的softmax函数对所述矩阵进行识别,获得识别结果。
4.根据权利要求1所述的方法,其特征在于,所述通过所述识别函数调用预设VGG网络的步骤前还包括:
搭建初始VGG网络,随机初始化所述初始VGG网络的权重参数和偏置参数;
将带有分类标识的图像输入所述初始VGG网络,并通过所述初始VGG网络内的softmax函数对所述带有分类标识的图像进行识别分类,获得分类结果;
根据所述分类标识与所述分类结果得到模型偏差值;
根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数,获得预设VGG网络。
5.根据权利要求4所述的方法,其特征在于,所述根据所述分类标识与所述分类结果得到模型偏差值的步骤具体包括:
将所述分类结果与所述分类标识进行对比,获得对比结果;
通过交叉熵损失函数对所述对比结果进行计算,获得模型偏差值。
6.根据权利要求5所述的方法,其特征在于,所述根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数的步骤具体包括:
根据所述模型偏差值,利用反向传播算法更新所述初始VGG网络模型中的权重参数和偏置参数。
7.根据权利要求4所述的方法,其特征在于,所述根据所述模型偏差值更新所述初始VGG网络的权重参数和偏置参数的步骤后还包括:
判断所述模型偏差值与预设阈值的大小关系;
当所述模型偏差值大于所述预设阈值时,跳至所述将带有分类标识的图像输入所述初始VGG网络,并通过所述初始VGG网络内的softmax函数对所述带有分类标识的图像进行识别分类的步骤;
当所述模型偏差值小于或等于所述预设阈值时,跳至所述获得预设VGG网络的步骤。
8.一种图像识别装置,其特征在于,所述装置包括:
图像显示模块,用于获取图像,并在GUI界面显示所述图像;
识别函数获取模块,用于响应用户操作,调用识别函数;
VGG网络调用模块,用于通过所述识别函数调用预设VGG网络;
矩阵转换模块,用于将所述图像转化为矩阵;
图像识别模块,用于将所述矩阵输入所述预设VGG网络,得到识别结果。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810043722.3A CN108256575A (zh) | 2018-01-17 | 2018-01-17 | 图像识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810043722.3A CN108256575A (zh) | 2018-01-17 | 2018-01-17 | 图像识别方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108256575A true CN108256575A (zh) | 2018-07-06 |
Family
ID=62726695
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810043722.3A Pending CN108256575A (zh) | 2018-01-17 | 2018-01-17 | 图像识别方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108256575A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263707A (zh) * | 2019-06-19 | 2019-09-20 | 湖南大学 | 图像识别方法、装置、计算机设备以及存储介质 |
CN110378337A (zh) * | 2019-07-05 | 2019-10-25 | 上海交通大学 | 金属切削刀具图纸标识信息视觉输入方法及系统 |
CN111144468A (zh) * | 2019-12-19 | 2020-05-12 | 国网冀北电力有限公司信息通信分公司 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104157290A (zh) * | 2014-08-19 | 2014-11-19 | 大连理工大学 | 一种基于深度学习的说话人识别方法 |
CN106228177A (zh) * | 2016-06-30 | 2016-12-14 | 浙江大学 | 基于卷积神经网络的日常生活物体图像识别方法 |
US20170140240A1 (en) * | 2015-07-27 | 2017-05-18 | Salesforce.Com, Inc. | Neural network combined image and text evaluator and classifier |
CN106778682A (zh) * | 2017-01-11 | 2017-05-31 | 厦门中控生物识别信息技术有限公司 | 一种卷积神经网络模型的训练方法及其设备 |
-
2018
- 2018-01-17 CN CN201810043722.3A patent/CN108256575A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104157290A (zh) * | 2014-08-19 | 2014-11-19 | 大连理工大学 | 一种基于深度学习的说话人识别方法 |
US20170140240A1 (en) * | 2015-07-27 | 2017-05-18 | Salesforce.Com, Inc. | Neural network combined image and text evaluator and classifier |
CN106228177A (zh) * | 2016-06-30 | 2016-12-14 | 浙江大学 | 基于卷积神经网络的日常生活物体图像识别方法 |
CN106778682A (zh) * | 2017-01-11 | 2017-05-31 | 厦门中控生物识别信息技术有限公司 | 一种卷积神经网络模型的训练方法及其设备 |
Non-Patent Citations (1)
Title |
---|
马珍玉: "基于深度学习和SVM的植物叶片识别系统的研究与测试", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110263707A (zh) * | 2019-06-19 | 2019-09-20 | 湖南大学 | 图像识别方法、装置、计算机设备以及存储介质 |
CN110263707B (zh) * | 2019-06-19 | 2021-09-10 | 湖南大学 | 图像识别方法、装置、计算机设备以及存储介质 |
CN110378337A (zh) * | 2019-07-05 | 2019-10-25 | 上海交通大学 | 金属切削刀具图纸标识信息视觉输入方法及系统 |
CN110378337B (zh) * | 2019-07-05 | 2023-03-31 | 上海交通大学 | 金属切削刀具图纸标识信息视觉输入方法及系统 |
CN111144468A (zh) * | 2019-12-19 | 2020-05-12 | 国网冀北电力有限公司信息通信分公司 | 电力用户信息标签化方法和装置、电子设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080397A (zh) | 信用评估方法、装置及电子设备 | |
CN109360097A (zh) | 基于深度学习的股票预测方法、装置、设备及存储介质 | |
CN108256575A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN107977707A (zh) | 一种对抗蒸馏神经网络模型的方法及计算设备 | |
JP2018018350A (ja) | 画像認識装置、画像認識プログラム、画像認識方法および認識装置 | |
KR20180060257A (ko) | 객체 인식 방법 및 장치 | |
JP7287397B2 (ja) | 情報処理方法、情報処理装置及び情報処理プログラム | |
CN110046706A (zh) | 模型生成方法、装置及服务器 | |
CN108830376B (zh) | 针对时间敏感的环境的多价值网络深度强化学习方法 | |
US20230266721A1 (en) | Method for configuring a control agent for a technical system, and control device | |
US20230268035A1 (en) | Method and apparatus for generating chemical structure using neural network | |
CN112883806B (zh) | 基于神经网络的视频风格迁移方法、装置、计算机设备和存储介质 | |
CN112668381A (zh) | 用于识别图像的方法和设备 | |
EP4113388A1 (en) | Method of optimizing neural network model and neural network model processing system performing the same | |
CN110443347A (zh) | 神经网络方法和装置 | |
CN110334716A (zh) | 特征图处理方法、图像处理方法及装置 | |
CN107292322A (zh) | 一种图像分类方法、深度学习模型及计算机系统 | |
CN113626610A (zh) | 知识图谱嵌入方法、装置、计算机设备和存储介质 | |
CN115392594B (zh) | 一种基于神经网络和特征筛选的用电负荷模型训练方法 | |
CN114358274A (zh) | 训练用于图像识别的神经网络的方法和设备 | |
CN116011681A (zh) | 一种气象数据预测方法、装置、存储介质及电子装置 | |
Jha | Mastering PyTorch: build powerful neural network architectures using advanced PyTorch 1. x features | |
CN113743448B (zh) | 模型训练数据获取方法、模型训练方法和装置 | |
WO2022127603A1 (zh) | 一种模型处理方法及相关装置 | |
CN115639756A (zh) | 用于生成工艺仿真模型的方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180706 |