CN107563390A - 一种图像识别方法及系统 - Google Patents

一种图像识别方法及系统 Download PDF

Info

Publication number
CN107563390A
CN107563390A CN201710756031.3A CN201710756031A CN107563390A CN 107563390 A CN107563390 A CN 107563390A CN 201710756031 A CN201710756031 A CN 201710756031A CN 107563390 A CN107563390 A CN 107563390A
Authority
CN
China
Prior art keywords
mrow
image
msub
mtd
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710756031.3A
Other languages
English (en)
Inventor
向拓闻
刘柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Wisdom Electronic Technology Co Ltd
Original Assignee
Suzhou Wisdom Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Wisdom Electronic Technology Co Ltd filed Critical Suzhou Wisdom Electronic Technology Co Ltd
Priority to CN201710756031.3A priority Critical patent/CN107563390A/zh
Publication of CN107563390A publication Critical patent/CN107563390A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种图像识别方法及系统,包括获取目标图像;对输入的目标图像进行预处理;在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大,将放大后的特征进行融合,获取特征融合后的特征表达;采用分类器对融合后的特征进行图像分类;对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。通过添加特征提取层,将图像特征放大并融合,有利于某些特征不明显的图像的提取,从而能够有效的提升图像识别率。

Description

一种图像识别方法及系统
技术领域
本发明属于图像识别技术领域,具体涉及一种图像识别方法及系统。
背景技术
图像识别就是用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。借助图像识别技术,我们可以通过图片搜索更快的获取信息。
常规的图像识别技术主要是利用图像分类模型识别出图像中的物体,进而按照该物体的类别对该图片进行描述,具体的说就是从图像中提取出特征点,然后利用该特征来对图像进行识别。目前,被用于图像识别的主要方法有小波分析,支持向量机(SVM),遗传算法,神经网络算法等。
卷积神经网络(Constitutional Neural Networks,CNN)是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。卷积神经网络使用了针对图像识别的特殊结构,可以快速训练。但传统的卷积神经网络是把图像逐层映射,映射到最后一层提取特征结果,导致识别图像的效率和正确率不够。
发明内容
1、本发明的目的。
本发明提供了一种图像识别方法及系统,通过在卷积神经网络中加入特征提取层,将图像特征放大并融合,增强其特征提取能力,有利于某些特征不明显的图像的提取,从而能够有效的提升图像识别率。
2、本发明所采用的技术方案。
一种图像识别方法,包括如下步骤:
步骤1,获取目标图像,所述目标图像为待识别的图像;
步骤2,对输入的目标图像进行预处理;
步骤3,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;
步骤4,将放大后的特征进行融合,获取特征融合后的特征表达;
步骤5,采用分类器对融合后的特征进行图像分类;
步骤6,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
进一步地,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
进一步地,所述分类器采用支持向量机;
基于以上图像识别方法的图像识别系统,包括图像获取模块、特征提取模块和结果输出模块。
所述图像获取模块,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理。
所述特征提取模块,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类。
所述结果输出模块,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
进一步地,所述图像获取模块可以为手机或平板电脑。
3、本发明的有益效果。
本发明与现有技术相比,其显著优点:
1)通过增加特征提取层,能够对于卷积神经网络的特征提取过程进行指导,增强了特征提取能力,提高识别效率;
2)对于输入的图像不需要过多的人工预处理。
附图说明
图1是图像识别方法的流程图;
图2是图像识别系统的框图。
具体实施方式
实施例
下面结合附图,对本发明的具体实施方式进行描述,图1为图像识别方法的流程图,包括以下步骤:
在步骤101中,获取目标图像,所述目标图像为待识别的图像。
在步骤102中,对输入的目标图像数据进行预处理,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
在步骤103中,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;在本实施例中,特征点在RGB空间内不是特别的明显,通过变换色彩空间的方法对其特征进行放大,将原来的RGB数据变换到HLS色彩空间;
变换公式如下所示:
Vmax=max(R,G,B)
Vmin=min(R,G,B)
在步骤104中,将放大后的特征进行融合,获取特征融合后的特征表达。
在步骤105中,采用分类器对融合后的特征进行图像分类,该分类器采用支持向量机。
在步骤106中,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
基于以上识别方法的图像识别系统,如图2所示,包括图像获取模块201、特征提取模块202和结果输出模块203。
图像获取模块201,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理。
特征提取模块202,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类。
结果输出模块203,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
所述图像获取模块可以为手机或平板电脑。
上述实施例不以任何方式限制本发明,凡是采用等同替换或等效变换的方式获得的技术方案均落在本发明的保护范围内。

Claims (6)

1.一种图像识别方法,其特征在于,包括如下步骤:
步骤1,获取目标图像,所述目标图像为待识别的图像;
步骤2,对输入的目标图像进行预处理;
步骤3,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;
步骤4,将放大后的特征进行融合,获取特征融合后的特征表达;
步骤5,采用分类器对融合后的特征进行图像分类;
步骤6,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
2.根据权利要求1所述的图像识别方法,其特征在于,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
3.根据权利要求1所述的图像识别方法,其特征在于,所述步骤3的特征放大采用将特征点在RGB空间变换到HLS色彩空间,变换公式如下:
Vmax=max(R,G,B)
Vmin=min(R,G,B)
<mrow> <mi>L</mi> <mo>=</mo> <mfrac> <mrow> <msub> <mi>V</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mo>+</mo> <msub> <mi>V</mi> <mi>min</mi> </msub> </mrow> <mn>2</mn> </mfrac> </mrow>
<mrow> <mi>S</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mfrac> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>-</mo> <msub> <mi>V</mi> <mi>min</mi> </msub> </mrow> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>+</mo> <msub> <mi>V</mi> <mi>min</mi> </msub> </mrow> </mfrac> </mtd> <mtd> <mrow> <mi>L</mi> <mo>&lt;</mo> <mn>0.5</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mfrac> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>-</mo> <msub> <mi>V</mi> <mi>min</mi> </msub> </mrow> <mrow> <mn>2</mn> <mo>-</mo> <mrow> <mo>(</mo> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>+</mo> <msub> <mi>V</mi> <mi>min</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> </mtd> <mtd> <mrow> <mi>L</mi> <mo>&amp;GreaterEqual;</mo> <mn>0.5</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
<mrow> <mi>H</mi> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>60</mn> <mrow> <mo>(</mo> <mi>G</mi> <mo>-</mo> <mi>B</mi> <mo>)</mo> </mrow> <mo>/</mo> <mi>S</mi> </mrow> </mtd> <mtd> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>=</mo> <mi>R</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>120</mn> <mo>+</mo> <mn>60</mn> <mrow> <mo>(</mo> <mi>B</mi> <mo>-</mo> <mi>R</mi> <mo>)</mo> </mrow> <mo>/</mo> <mi>S</mi> </mrow> </mtd> <mtd> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>=</mo> <mi>G</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>240</mn> <mo>+</mo> <mn>60</mn> <mrow> <mo>(</mo> <mi>B</mi> <mo>-</mo> <mi>R</mi> <mo>)</mo> </mrow> <mo>/</mo> <mi>S</mi> </mrow> </mtd> <mtd> <mrow> <msub> <mi>V</mi> <mi>max</mi> </msub> <mo>=</mo> <mi>B</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>.</mo> </mrow>
4.根据权利要求1所述的图像识别方法,其特征在于,所述分类器采用支持向量机。
5.一种基于权利要求1所述的图像识别方法的图像识别系统,其特征在于,包括图像获取模块、特征提取模块和结果输出模块,其中:
所述图像获取模块,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理;
所述特征提取模块,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类;
所述结果输出模块,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
6.根据权利要求5所述的图像识别系统,其特征在于,所述图像获取模块可以为手机或平板电脑。
CN201710756031.3A 2017-08-29 2017-08-29 一种图像识别方法及系统 Pending CN107563390A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710756031.3A CN107563390A (zh) 2017-08-29 2017-08-29 一种图像识别方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710756031.3A CN107563390A (zh) 2017-08-29 2017-08-29 一种图像识别方法及系统

Publications (1)

Publication Number Publication Date
CN107563390A true CN107563390A (zh) 2018-01-09

Family

ID=60977423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710756031.3A Pending CN107563390A (zh) 2017-08-29 2017-08-29 一种图像识别方法及系统

Country Status (1)

Country Link
CN (1) CN107563390A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110223334A (zh) * 2019-05-07 2019-09-10 深圳云天励飞技术有限公司 一种景深图获取方法及装置
WO2020015470A1 (zh) * 2018-07-16 2020-01-23 Oppo广东移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1538825A2 (en) * 2003-12-03 2005-06-08 Seiko Epson Corporation Color reduction processing apparatus, printer control device, color reduction method, and printer control method
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1538825A2 (en) * 2003-12-03 2005-06-08 Seiko Epson Corporation Color reduction processing apparatus, printer control device, color reduction method, and printer control method
CN104112113A (zh) * 2013-04-19 2014-10-22 无锡南理工科技发展有限公司 一种基于改进型特征卷积神经网络图像识别方法
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020015470A1 (zh) * 2018-07-16 2020-01-23 Oppo广东移动通信有限公司 图像处理方法、装置、移动终端及计算机可读存储介质
CN110223334A (zh) * 2019-05-07 2019-09-10 深圳云天励飞技术有限公司 一种景深图获取方法及装置

Similar Documents

Publication Publication Date Title
CN111401372B (zh) 一种扫描文档图文信息提取与鉴别的方法
CN104050471B (zh) 一种自然场景文字检测方法及系统
CN103745449B (zh) 一种搜跟系统中航拍视频的快速自动拼接技术
CN109145872B (zh) 一种基于CFAR与Fast-RCNN融合的SAR图像舰船目标检测方法
CN104751142B (zh) 一种基于笔划特征的自然场景文本检测方法
CN104408449B (zh) 智能移动终端场景文字处理方法
CN105590319A (zh) 一种深度学习的图像显著性区域检测方法
CN107657257A (zh) 一种基于多通道卷积神经网络的语义图像分割方法
CN110033471A (zh) 一种基于连通域分析和形态学操作的框线检测方法
CN112907598B (zh) 一种基于注意力cnn文档证件类图像篡改检测方法
CN106548149A (zh) 监控视频序列中人脸微表情图像序列的识别方法
CN107729820A (zh) 一种基于多尺度hog的手指静脉识别方法
CN104463242B (zh) 基于特征变换和词典学习的多特征动作识别方法
CN111080615B (zh) 基于卷积神经网络的pcb缺陷检测系统及检测方法
CN107516083A (zh) 一种面向识别的远距离人脸图像增强方法
CN104143091A (zh) 基于改进mLBP的单样本人脸识别方法
CN111047618B (zh) 基于多尺度的无参考屏幕内容图像质量评估方法
CN111178121A (zh) 基于空间特征和深度特征强化技术的害虫图像定位识别方法
CN107563390A (zh) 一种图像识别方法及系统
CN109460767A (zh) 基于规则的凸印银行卡卡号分割与识别方法
CN115482529A (zh) 近景色水果图像识别方法、设备、存储介质及装置
CN108399454A (zh) 一种全新的分段卷积神经网络目标识别方法
CN111199199B (zh) 一种基于自适应上下文区域选取的动作识别方法
CN106295478A (zh) 一种图像特征提取方法和装置
CN110555379B (zh) 一种根据性别动态调整特征的人脸愉悦度估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180109

WD01 Invention patent application deemed withdrawn after publication