CN107563390A - 一种图像识别方法及系统 - Google Patents
一种图像识别方法及系统 Download PDFInfo
- Publication number
- CN107563390A CN107563390A CN201710756031.3A CN201710756031A CN107563390A CN 107563390 A CN107563390 A CN 107563390A CN 201710756031 A CN201710756031 A CN 201710756031A CN 107563390 A CN107563390 A CN 107563390A
- Authority
- CN
- China
- Prior art keywords
- mrow
- image
- msub
- mtd
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别方法及系统,包括获取目标图像;对输入的目标图像进行预处理;在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大,将放大后的特征进行融合,获取特征融合后的特征表达;采用分类器对融合后的特征进行图像分类;对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。通过添加特征提取层,将图像特征放大并融合,有利于某些特征不明显的图像的提取,从而能够有效的提升图像识别率。
Description
技术领域
本发明属于图像识别技术领域,具体涉及一种图像识别方法及系统。
背景技术
图像识别就是用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。借助图像识别技术,我们可以通过图片搜索更快的获取信息。
常规的图像识别技术主要是利用图像分类模型识别出图像中的物体,进而按照该物体的类别对该图片进行描述,具体的说就是从图像中提取出特征点,然后利用该特征来对图像进行识别。目前,被用于图像识别的主要方法有小波分析,支持向量机(SVM),遗传算法,神经网络算法等。
卷积神经网络(Constitutional Neural Networks,CNN)是在多层神经网络的基础上发展起来的针对图像分类和识别而特别设计的一种深度学习方法。卷积神经网络使用了针对图像识别的特殊结构,可以快速训练。但传统的卷积神经网络是把图像逐层映射,映射到最后一层提取特征结果,导致识别图像的效率和正确率不够。
发明内容
1、本发明的目的。
本发明提供了一种图像识别方法及系统,通过在卷积神经网络中加入特征提取层,将图像特征放大并融合,增强其特征提取能力,有利于某些特征不明显的图像的提取,从而能够有效的提升图像识别率。
2、本发明所采用的技术方案。
一种图像识别方法,包括如下步骤:
步骤1,获取目标图像,所述目标图像为待识别的图像;
步骤2,对输入的目标图像进行预处理;
步骤3,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;
步骤4,将放大后的特征进行融合,获取特征融合后的特征表达;
步骤5,采用分类器对融合后的特征进行图像分类;
步骤6,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
进一步地,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
进一步地,所述分类器采用支持向量机;
基于以上图像识别方法的图像识别系统,包括图像获取模块、特征提取模块和结果输出模块。
所述图像获取模块,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理。
所述特征提取模块,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类。
所述结果输出模块,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
进一步地,所述图像获取模块可以为手机或平板电脑。
3、本发明的有益效果。
本发明与现有技术相比,其显著优点:
1)通过增加特征提取层,能够对于卷积神经网络的特征提取过程进行指导,增强了特征提取能力,提高识别效率;
2)对于输入的图像不需要过多的人工预处理。
附图说明
图1是图像识别方法的流程图;
图2是图像识别系统的框图。
具体实施方式
实施例
下面结合附图,对本发明的具体实施方式进行描述,图1为图像识别方法的流程图,包括以下步骤:
在步骤101中,获取目标图像,所述目标图像为待识别的图像。
在步骤102中,对输入的目标图像数据进行预处理,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
在步骤103中,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;在本实施例中,特征点在RGB空间内不是特别的明显,通过变换色彩空间的方法对其特征进行放大,将原来的RGB数据变换到HLS色彩空间;
变换公式如下所示:
Vmax=max(R,G,B)
Vmin=min(R,G,B)
在步骤104中,将放大后的特征进行融合,获取特征融合后的特征表达。
在步骤105中,采用分类器对融合后的特征进行图像分类,该分类器采用支持向量机。
在步骤106中,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
基于以上识别方法的图像识别系统,如图2所示,包括图像获取模块201、特征提取模块202和结果输出模块203。
图像获取模块201,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理。
特征提取模块202,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类。
结果输出模块203,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
所述图像获取模块可以为手机或平板电脑。
上述实施例不以任何方式限制本发明,凡是采用等同替换或等效变换的方式获得的技术方案均落在本发明的保护范围内。
Claims (6)
1.一种图像识别方法,其特征在于,包括如下步骤:
步骤1,获取目标图像,所述目标图像为待识别的图像;
步骤2,对输入的目标图像进行预处理;
步骤3,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大;
步骤4,将放大后的特征进行融合,获取特征融合后的特征表达;
步骤5,采用分类器对融合后的特征进行图像分类;
步骤6,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
2.根据权利要求1所述的图像识别方法,其特征在于,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。
3.根据权利要求1所述的图像识别方法,其特征在于,所述步骤3的特征放大采用将特征点在RGB空间变换到HLS色彩空间,变换公式如下:
Vmax=max(R,G,B)
Vmin=min(R,G,B)
<mrow>
<mi>L</mi>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>V</mi>
<mrow>
<mi>m</mi>
<mi>a</mi>
<mi>x</mi>
</mrow>
</msub>
<mo>+</mo>
<msub>
<mi>V</mi>
<mi>min</mi>
</msub>
</mrow>
<mn>2</mn>
</mfrac>
</mrow>
<mrow>
<mi>S</mi>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mfrac>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>min</mi>
</msub>
</mrow>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>+</mo>
<msub>
<mi>V</mi>
<mi>min</mi>
</msub>
</mrow>
</mfrac>
</mtd>
<mtd>
<mrow>
<mi>L</mi>
<mo><</mo>
<mn>0.5</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mfrac>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>-</mo>
<msub>
<mi>V</mi>
<mi>min</mi>
</msub>
</mrow>
<mrow>
<mn>2</mn>
<mo>-</mo>
<mrow>
<mo>(</mo>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>+</mo>
<msub>
<mi>V</mi>
<mi>min</mi>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mtd>
<mtd>
<mrow>
<mi>L</mi>
<mo>&GreaterEqual;</mo>
<mn>0.5</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
</mrow>
<mrow>
<mi>H</mi>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mn>60</mn>
<mrow>
<mo>(</mo>
<mi>G</mi>
<mo>-</mo>
<mi>B</mi>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mi>S</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>=</mo>
<mi>R</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>120</mn>
<mo>+</mo>
<mn>60</mn>
<mrow>
<mo>(</mo>
<mi>B</mi>
<mo>-</mo>
<mi>R</mi>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mi>S</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>=</mo>
<mi>G</mi>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<mn>240</mn>
<mo>+</mo>
<mn>60</mn>
<mrow>
<mo>(</mo>
<mi>B</mi>
<mo>-</mo>
<mi>R</mi>
<mo>)</mo>
</mrow>
<mo>/</mo>
<mi>S</mi>
</mrow>
</mtd>
<mtd>
<mrow>
<msub>
<mi>V</mi>
<mi>max</mi>
</msub>
<mo>=</mo>
<mi>B</mi>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>.</mo>
</mrow>
4.根据权利要求1所述的图像识别方法,其特征在于,所述分类器采用支持向量机。
5.一种基于权利要求1所述的图像识别方法的图像识别系统,其特征在于,包括图像获取模块、特征提取模块和结果输出模块,其中:
所述图像获取模块,用于获取目标图像,所述目标图像为待识别的图像,并对输入的目标图像进行预处理;
所述特征提取模块,用于通过在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,将特征放大,并将放大后的特征进行融合,获取特征融合后的特征表达,采用分类器对融合后的特征进行图像分类;
所述结果输出模块,用于将对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。
6.根据权利要求5所述的图像识别系统,其特征在于,所述图像获取模块可以为手机或平板电脑。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710756031.3A CN107563390A (zh) | 2017-08-29 | 2017-08-29 | 一种图像识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710756031.3A CN107563390A (zh) | 2017-08-29 | 2017-08-29 | 一种图像识别方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107563390A true CN107563390A (zh) | 2018-01-09 |
Family
ID=60977423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710756031.3A Pending CN107563390A (zh) | 2017-08-29 | 2017-08-29 | 一种图像识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107563390A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110223334A (zh) * | 2019-05-07 | 2019-09-10 | 深圳云天励飞技术有限公司 | 一种景深图获取方法及装置 |
WO2020015470A1 (zh) * | 2018-07-16 | 2020-01-23 | Oppo广东移动通信有限公司 | 图像处理方法、装置、移动终端及计算机可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1538825A2 (en) * | 2003-12-03 | 2005-06-08 | Seiko Epson Corporation | Color reduction processing apparatus, printer control device, color reduction method, and printer control method |
CN104112113A (zh) * | 2013-04-19 | 2014-10-22 | 无锡南理工科技发展有限公司 | 一种基于改进型特征卷积神经网络图像识别方法 |
CN106408086A (zh) * | 2016-09-12 | 2017-02-15 | 上海影城有限公司 | 用于图像优化的深度学习神经网络处理方法及系统 |
-
2017
- 2017-08-29 CN CN201710756031.3A patent/CN107563390A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1538825A2 (en) * | 2003-12-03 | 2005-06-08 | Seiko Epson Corporation | Color reduction processing apparatus, printer control device, color reduction method, and printer control method |
CN104112113A (zh) * | 2013-04-19 | 2014-10-22 | 无锡南理工科技发展有限公司 | 一种基于改进型特征卷积神经网络图像识别方法 |
CN106408086A (zh) * | 2016-09-12 | 2017-02-15 | 上海影城有限公司 | 用于图像优化的深度学习神经网络处理方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020015470A1 (zh) * | 2018-07-16 | 2020-01-23 | Oppo广东移动通信有限公司 | 图像处理方法、装置、移动终端及计算机可读存储介质 |
CN110223334A (zh) * | 2019-05-07 | 2019-09-10 | 深圳云天励飞技术有限公司 | 一种景深图获取方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401372B (zh) | 一种扫描文档图文信息提取与鉴别的方法 | |
CN104050471B (zh) | 一种自然场景文字检测方法及系统 | |
CN103745449B (zh) | 一种搜跟系统中航拍视频的快速自动拼接技术 | |
CN109145872B (zh) | 一种基于CFAR与Fast-RCNN融合的SAR图像舰船目标检测方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
CN105590319A (zh) | 一种深度学习的图像显著性区域检测方法 | |
CN107657257A (zh) | 一种基于多通道卷积神经网络的语义图像分割方法 | |
CN110033471A (zh) | 一种基于连通域分析和形态学操作的框线检测方法 | |
CN112907598B (zh) | 一种基于注意力cnn文档证件类图像篡改检测方法 | |
CN106548149A (zh) | 监控视频序列中人脸微表情图像序列的识别方法 | |
CN107729820A (zh) | 一种基于多尺度hog的手指静脉识别方法 | |
CN104463242B (zh) | 基于特征变换和词典学习的多特征动作识别方法 | |
CN111080615B (zh) | 基于卷积神经网络的pcb缺陷检测系统及检测方法 | |
CN107516083A (zh) | 一种面向识别的远距离人脸图像增强方法 | |
CN104143091A (zh) | 基于改进mLBP的单样本人脸识别方法 | |
CN111047618B (zh) | 基于多尺度的无参考屏幕内容图像质量评估方法 | |
CN111178121A (zh) | 基于空间特征和深度特征强化技术的害虫图像定位识别方法 | |
CN107563390A (zh) | 一种图像识别方法及系统 | |
CN109460767A (zh) | 基于规则的凸印银行卡卡号分割与识别方法 | |
CN115482529A (zh) | 近景色水果图像识别方法、设备、存储介质及装置 | |
CN108399454A (zh) | 一种全新的分段卷积神经网络目标识别方法 | |
CN111199199B (zh) | 一种基于自适应上下文区域选取的动作识别方法 | |
CN106295478A (zh) | 一种图像特征提取方法和装置 | |
CN110555379B (zh) | 一种根据性别动态调整特征的人脸愉悦度估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20180109 |
|
WD01 | Invention patent application deemed withdrawn after publication |