CN111967479A - 基于卷积神经网络思想的图像目标识别方法 - Google Patents
基于卷积神经网络思想的图像目标识别方法 Download PDFInfo
- Publication number
- CN111967479A CN111967479A CN202010733456.4A CN202010733456A CN111967479A CN 111967479 A CN111967479 A CN 111967479A CN 202010733456 A CN202010733456 A CN 202010733456A CN 111967479 A CN111967479 A CN 111967479A
- Authority
- CN
- China
- Prior art keywords
- image
- structure balance
- matrix
- balance matrix
- local
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 28
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 13
- 239000011159 matrix material Substances 0.000 claims abstract description 80
- 230000009466 transformation Effects 0.000 claims description 21
- 238000013507 mapping Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000004392 development of vision Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000011089 mechanical engineering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012634 optical imaging Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明的目的在于提供一种基于卷积神经网络思想的图像目标识别方法,其特征在于:通过预先构建的变化结构平衡矩阵与图像中的局部结构平衡矩阵做Hadamard乘积得到局部的目标结构平衡矩阵,增加识别参数的数量提高识别的精度。本发明采用CNN提取局部初始结构平衡矩阵,与预先构建的变化结构平衡矩阵做Hadamad乘积,得到局部的目标结构平衡矩阵。现有技术是对图像整体进行处理没有考虑局部,最终得到的只有3个特征参数,现在采用CNN可以得到多组局部的识别参数向量组,增加了识别参数的数量,提高图像目标识别的精度。
Description
技术领域
本发明涉及机器视觉领域,特别是一种基于卷积神经网络思想的图像目标识别方法。
背景技术
机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术(图像增强和分析算法、图像卡、I/O卡等)。随着图像处理和模式识别等技术的快速发展,也大大地推动了机器视觉的发展。而视觉的发展离不开图像的识别,图像识别是机器视觉技术的重要组成部分,精度和速度是衡量目标图像识别的两个重要的指标。目前有很多的图像识别方法,如基于关键点的图像识别方法、基于纹理的图像识别方法、基于模型的图像识别方法、基于K-L的图像识别方法、基于几何特征的图像识别方法、基于神经网络的图像识别方法、基于边缘轮廓的图像识别方法以及结合复杂网络和分水岭算法的图像识别方法。基于结构平衡网络的目标识别方法,将结构平衡网络应用于图像目标识别领域,通过将基于轮廓的图像识别方法与结构均衡网络方法的相结合,将对待识别图像进行基于结构平衡网络的灰度图像预处理,得到待识别图像的初始结构平衡矩阵,然后与构建的变化结构平衡矩阵做hadamard乘积,得到目标结构平衡矩阵,提取目标结构平衡矩阵特征参数后根据特征参数进行识别。
发明内容
本发明的目的在于提供一种基于卷积神经网络思想的图像目标识别方法,能够增加识别参数的数量,从而提高识别的精度。
本发明的技术方案是:一种基于卷积神经网络思想的图像目标识别方法,其特征在于:通过预先构建的变化结构平衡矩阵与图像中的局部结构平衡矩阵做Hadamard乘积得到局部的目标结构平衡矩阵,增加识别参数的数量提高识别的精度。
具体包括以下步骤:
构造局部初始结构平衡矩阵;
基于hadamard变换进行图像变换:
根据结构平衡网络的分类性质进行图像特征参量提取;
根据图像特征参量对待识别图像进行识别。
所述“构造局部初始结构平衡矩阵”包括:
记所有N阶结构平衡矩阵构成的集合为FN;设P是FN上的一个映射,即:P:FN→FN;采用一个3*3的矩阵作为预先构造的局部初始结构平衡矩阵,得到K=(N-2)2个局部初始结构平衡矩阵。
所述“基于hadamard变换进行图像变换”包括:设X=(xij)是一个构造的N阶变化结构平衡矩阵,Y∈FN是局部初始结构平衡矩阵,Z代表经过Hadamard变换之后的结构平衡矩阵,则映射Z=XoY为一个结构平衡矩阵变换关系,其中“o”表示矩阵间的阿达玛乘积;Y为局部初始结构平衡矩阵;若X=(xij)是一个N阶二值结构平衡矩阵,Z=XoY可以表示为:
Zij=sign(xij)yij
其中,sign表示符号函数,定义如下:
所述“基于Hadamard变换进行图像特征参量提取”包括:采用一个3*3的矩阵作为变化结构平衡矩阵与初始结构平衡矩阵做Hadamard乘积,每个局部初始结构平衡矩阵得到三个识别参数,假如初始结构平衡矩阵中存在P个满足要求的局部初始结构平衡矩阵,做Hadamard乘积后则有P*3个特征识别参数。
所述“根据图像特征参量对待识别图像进行识别”包括:利用所述“基于Hadamard变换进行图像特征参量提取”获得的P*3个特征识别参数对目标图像进行识别。
本发明的有益效果是:在现有技术中,基于结构平衡网络的图像目标识别参数相对较少,识别精度不是很高。本发明提出一种新的基于卷积神经网络,采用CNN提取局部初始结构平衡矩阵,与预先构建的变化结构平衡矩阵做Hadamad乘积,得到局部的目标结构平衡矩阵。现有技术是对图像整体进行处理没有考虑局部,最终得到的只有3个特征参数,现在采用CNN可以得到多组局部的识别参数向量组,增加了识别参数的数量,提高图像目标识别的精度。
附图说明
图1为图像分割提取识别参数组流程图
具体实施方式
下面结合附图对本申请进行进一步的说明。
一种基于卷积神经网络思想的图像目标识别方法,其特征在于:通过预先构建的变化结构平衡矩阵与图像中的局部结构平衡矩阵做Hadamard乘积得到局部的目标结构平衡矩阵,增加识别参数的数量提高识别的精度。
具体的,本发明技术方案分为以下四个步骤:
1.构造局部初始结构平衡矩阵:
记所有N阶结构平衡矩阵构成的集合为FN(对称矩阵集合的子集).设P是FN上的一个映射,即:
P:FN→FN
采用CNN的思想,采用一个3*3的矩阵作为预先构造的局部初始结构平衡矩阵,对于N阶方阵,就有K=(N-2)2(N≥3)个局部初始结构平衡矩阵。
2.基于hadamard变换的图像变换:
Hadamard变换:设X=(xij)是一个构造的N阶结构平衡矩阵,Y∈FN是局部初始结构平衡矩阵,Z代表经过Hadamard变换之后的结构平衡矩阵,则映射Z=XoY为一个结构平衡矩阵变换关系,其中“o”表示矩阵间的阿达玛(Hadamard)乘积,定义为:
由zikzkjzji=(xikxkjxji)(yikykjyji)>0,可得上列变换像矩阵Z是结构平衡矩阵。
其中Z=XoY称为Hadamard结构平衡矩阵变换,Y为局部初始结构平衡矩阵,若X=(xij)是一个N阶二值结构平衡矩阵(矩阵元素只有1和-1),那么阿达玛变换Z=XoY可以表示为:
Zij=sign(xij)yij
其中,sign表示符号函数,定义如下:
利用二值结构平衡矩阵阿达玛变换相当于利用二值矩阵X的元素符号改变了矩阵Y中相应元素的符号从而得到变换像Z。利用Hadamard变换定理知,不同的局部初始结构平衡矩阵具有不同的Hadamard变换像,对于不同的图像就会有对应的Hadamard变换像,根据不同变换像可以区分不同图像。利用结构平衡网络的基本定理知,Hadamard变换像Z对应的结构平衡网络中的所有节点可以分成两类,同类中的节点具有正连接,分属异类的节点具有负连接。矩阵Z中的正元素表示同一类中两节点的连接强度,负元素表示不同类中两节点的连接强度。
3.基于Hadamard变换的图像特征参量提取
如图1,因为二值结构平衡矩阵和原始图像的结构平衡矩阵经过hadamard变换(同类矩阵对应位置相乘)后,元素只有正元素和负元素,正元素表示同一朋友圈中两个节点的连接关系强度,负元素表示不同朋友圈中两个节点的连接关系。
记Z中每一类的正连接强度平均值分别为α1和α2,记Z中的所有负元素的平均值为β。这样每个局部初始结构平衡矩阵得到三个识别参数,采用CNN的思想,采用一个3*3的矩阵作为预先构造的变化结构平衡矩阵去与目标图像中的像素点对应的初始结构平衡矩阵做Hadamard乘积,每个局部初始结构平衡矩阵得到三个识别参数,假如初始结构平衡矩阵中存在P个满足要求的局部初始结构平衡矩阵,做Hadamard乘积后则有P*3个识别参数。
4.根据特征参数对待识别图像进行识别
利用上述得到的P*3个特征参数,即正连接强度平均值α1和α2和负连接强度平均值β,即可对目标图像进行识别。
本发明采用CNN的思想,对局部初始结构平衡矩阵与预先构建的变化结构平衡矩阵做Hadamad乘积,得到局部的目标结构平衡矩阵。
以上所述仅为发明的较佳实施例而己,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.基于卷积神经网络思想的图像目标识别方法,其特征在于:
通过预先构建的变化结构平衡矩阵与图像中的局部结构平衡矩阵做Hadamard乘积得到局部的目标结构平衡矩阵,增加识别参数的数量提高识别的精度。
2.根据权利要求1所述的基于卷积神经网络思想的图像目标识别方法,其特征在于:包括以下步骤:
构造局部初始结构平衡矩阵;
基于hadamard变换进行图像变换:
根据结构平衡网络的分类性质进行图像特征参量提取;
根据图像特征参量对待识别图像进行识别。
3.根据权利要求2所述的基于卷积神经网络思想的图像目标识别方法,其特征在于:
所述“构造局部初始结构平衡矩阵”包括:
记所有N阶结构平衡矩阵构成的集合为FN;设P是FN上的一个映射,即:P:FN→FN;
采用一个3*3的矩阵作为预先构造的局部初始结构平衡矩阵,得到K=(N-2)2(N≥3)个局部初始结构平衡矩阵。
5.根据权利要求2所述的基于卷积神经网络思想的图像目标识别方法,其特征在于:
所述“基于Hadamard变换进行图像特征参量提取”包括:
采用一个3*3的矩阵作为变化结构平衡矩阵与初始结构平衡矩阵做Hadamard乘积,每个局部初始结构平衡矩阵得到三个识别参数,假如初始结构平衡矩阵中存在P个满足要求的局部初始结构平衡矩阵,做Hadamard乘积后则有P*3个特征识别参数。
6.根据权利要求5所述的基于卷积神经网络思想的图像目标识别方法,其特征在于:
所述“根据图像特征参量对待识别图像进行识别”包括:
利用所述“基于Hadamard变换进行图像特征参量提取”获得的P*3个特征识别参数对目标图像进行识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733456.4A CN111967479A (zh) | 2020-07-27 | 2020-07-27 | 基于卷积神经网络思想的图像目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010733456.4A CN111967479A (zh) | 2020-07-27 | 2020-07-27 | 基于卷积神经网络思想的图像目标识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111967479A true CN111967479A (zh) | 2020-11-20 |
Family
ID=73363121
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010733456.4A Pending CN111967479A (zh) | 2020-07-27 | 2020-07-27 | 基于卷积神经网络思想的图像目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111967479A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205695A (ja) * | 2009-06-15 | 2009-09-10 | National Institute Of Advanced Industrial & Technology | 対象個数検出装置および対象個数検出方法 |
CN107886123A (zh) * | 2017-11-08 | 2018-04-06 | 电子科技大学 | 一种基于辅助判决更新学习的合成孔径雷达目标识别方法 |
CN109063716A (zh) * | 2018-08-28 | 2018-12-21 | 广东工业大学 | 一种图像识别方法、装置、设备及计算机可读存储介质 |
CN109215034A (zh) * | 2018-07-06 | 2019-01-15 | 成都图必优科技有限公司 | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 |
CN110363086A (zh) * | 2019-06-11 | 2019-10-22 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据识别方法、装置、计算机设备和存储介质 |
CN110378372A (zh) * | 2019-06-11 | 2019-10-25 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据识别方法、装置、计算机设备和存储介质 |
CN110490180A (zh) * | 2019-07-05 | 2019-11-22 | 平安国际智慧城市科技股份有限公司 | 基于图像识别的作业批改方法、装置、存储介质及服务器 |
-
2020
- 2020-07-27 CN CN202010733456.4A patent/CN111967479A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009205695A (ja) * | 2009-06-15 | 2009-09-10 | National Institute Of Advanced Industrial & Technology | 対象個数検出装置および対象個数検出方法 |
CN107886123A (zh) * | 2017-11-08 | 2018-04-06 | 电子科技大学 | 一种基于辅助判决更新学习的合成孔径雷达目标识别方法 |
CN109215034A (zh) * | 2018-07-06 | 2019-01-15 | 成都图必优科技有限公司 | 一种基于空间金字塔掩盖池化的弱监督图像语义分割方法 |
CN109063716A (zh) * | 2018-08-28 | 2018-12-21 | 广东工业大学 | 一种图像识别方法、装置、设备及计算机可读存储介质 |
CN110363086A (zh) * | 2019-06-11 | 2019-10-22 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据识别方法、装置、计算机设备和存储介质 |
CN110378372A (zh) * | 2019-06-11 | 2019-10-25 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据识别方法、装置、计算机设备和存储介质 |
CN110490180A (zh) * | 2019-07-05 | 2019-11-22 | 平安国际智慧城市科技股份有限公司 | 基于图像识别的作业批改方法、装置、存储介质及服务器 |
Non-Patent Citations (1)
Title |
---|
高沛涛,等,: "基于结构平衡网络的图像识别新方法", 软件导刊, vol. 19, no. 3, 15 March 2020 (2020-03-15), pages 220 - 224 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401384B (zh) | 一种变电设备缺陷图像匹配方法 | |
US9633282B2 (en) | Cross-trained convolutional neural networks using multimodal images | |
Tao et al. | Principal component 2-D long short-term memory for font recognition on single Chinese characters | |
CN109903299B (zh) | 一种条件式生成对抗网络的异源遥感图像配准方法及装置 | |
Li et al. | LPSNet: a novel log path signature feature based hand gesture recognition framework | |
CN111191583A (zh) | 基于卷积神经网络的空间目标识别系统及方法 | |
CN106650721A (zh) | 一种基于卷积神经网络的工业字符识别方法 | |
CN110598692B (zh) | 一种基于深度学习的椭圆识别方法 | |
Ding et al. | Fish recognition using convolutional neural network | |
CN111898621B (zh) | 一种轮廓形状识别方法 | |
CN107944459A (zh) | 一种rgb‑d物体识别方法 | |
CN105184772A (zh) | 一种基于超像素的自适应彩色图像分割方法 | |
CN109740539B (zh) | 基于超限学习机和融合卷积网络的3d物体识别方法 | |
JP2015099563A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN112364881B (zh) | 一种进阶采样一致性图像匹配方法 | |
Cui et al. | Compact feature representation for image classification using elms | |
Thakur et al. | Hybrid deep learning and machine learning approach for passive image forensic | |
CN115527072A (zh) | 一种基于稀疏空间感知与元学习的芯片表面缺陷检测方法 | |
Tran et al. | Improving the face recognition accuracy under varying illumination conditions for local binary patterns and local ternary patterns based on weber-face and singular value decomposition | |
Martin et al. | Deep learning strategies for industrial surface defect detection systems | |
Raveane et al. | Texture classification with neural networks | |
CN111079585B (zh) | 图像增强结合伪孪生卷积神经网络的行人再识别方法 | |
CN111639659B (zh) | 一种水下沉底小目标融合分类方法 | |
CN111967479A (zh) | 基于卷积神经网络思想的图像目标识别方法 | |
Bastidas-Rodríguez et al. | A textural deep neural network combined with handcrafted features for mechanical failure classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |