CN112488136A - 一种图像识别系统以及图像识别装置 - Google Patents
一种图像识别系统以及图像识别装置 Download PDFInfo
- Publication number
- CN112488136A CN112488136A CN202110089334.0A CN202110089334A CN112488136A CN 112488136 A CN112488136 A CN 112488136A CN 202110089334 A CN202110089334 A CN 202110089334A CN 112488136 A CN112488136 A CN 112488136A
- Authority
- CN
- China
- Prior art keywords
- image
- characteristic
- module
- identification
- recognition system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000003702 image correction Methods 0.000 claims abstract description 9
- 238000003062 neural network model Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000012937 correction Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及图像识别技术领域,具体涉及一种图像识别系统以及图像识别装置,该系统包括:图像采集模块,用于实现目标图像的采集;图像特征区识别模块,用于基于神经网络模型实现图像特征区的识别;图像校正模块,用于实现图像特征区偏转角度的校正;图像特征提取模块,用于实现图像特征区特征参数的提取;图像识别模块,用于融合所述图像特征区的特征参数,并实现图像的识别。本发明通过将图像分割成若干图像特征区,并为每一种图像特征区配置不同的特征提取算法,从而可以避免图像识别过程中存在的特征提取盲区,大大提高图像识别的精确度。
Description
技术领域
本发明涉及图像识别领域,具体涉及一种图像识别系统以及图像识别装置。
背景技术
图像是人类视觉的基础,是自然景物的客观反映,也是人类信息收集和交流的有效途径之一,随着计算机、互联网等技术的发展,数字图像处理技术在工业、医疗、军事、交通等行业中发挥着日益重要的作用。
图像识别是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。
目前,传统的图像识别系统,通常采用图像整体特征提取,再通过人工智能模型进行识别的方式实现图像的识别,未充分考虑图像可能会包含多种不同属性的特征,特征提取的过程存在很大的盲区,图像识别准确率较低。
发明内容
为解决上述技术问题,本发明提供了一种图像识别系统以及图像识别装置,可以实现图像的精准化识别。
为实现上述目的,本发明采取的技术方案为:
一种图像识别系统,包括:
图像采集模块,用于实现目标图像的采集;
图像特征区识别模块,用于基于神经网络模型实现图像特征区的识别;
图像校正模块,用于实现图像特征区偏转角度的校正;
图像特征提取模块,用于实现图像特征区特征参数的提取;
图像识别模块,用于融合所述图像特征区的特征参数,并实现图像的识别。
进一步地,所述图像采集模块内载有三维姿态传感器,每一张目标图像均携带有图像采集模块的三维姿态信息。
进一步地,所述神经网络模型采用DSSD InceptionV3 COCO 模型。
进一步地,所述图像校正模块基于每一张目标图像的三维姿态信息实现图像特征区偏转角度的校正。
进一步地,所述图像特征提取模块基于卷积神经网络实现图像特征区特征参数的提取。
进一步地,所述图像识别模块首先将各图像特征区的特征参数串联形成增强特征向量,然后基于Bi-LSTM+Attention模型实现图像的识别。
进一步地,还包括:
图像特征区标记模块,用于基于图像采集模块所在位置信息和三维姿态信息实现图像特征区三维坐标点的标记。
本发明还提供了一种图像识别装置,其采用上述的系统实现图像的识别。
本发明具有以下有益效果:
1)通过将图像分割成若干图像特征区,并为每一种图像特征区配置不同的特征提取算法,从而可以避免图像识别过程中存在的特征提取盲区,大大提高图像识别的精确度。
2)充分考虑图像特征区偏转角度特征和所在位置特征,进一步提高图像识别的精确度。
附图说明
图1为本发明实施例1一种图像识别系统的系统框图。
图2为本发明实施例2一种图像识别装置的系统框图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
实施例1
一种图像识别系统,包括:
图像采集模块,用于实现目标图像的采集;
图像特征区识别模块,用于基于神经网络模型实现图像特征区的识别;
图像校正模块,用于实现图像特征区偏转角度的校正;
图像特征提取模块,用于实现图像特征区特征参数的提取;
图像识别模块,用于融合所述图像特征区的特征参数,并实现图像的识别。
本实施例中,所述图像采集模块内载有三维姿态传感器,每一张目标图像均携带有图像采集模块的三维姿态信息。所述神经网络模型采用DSSD InceptionV3 COCO 模型。所述图像校正模块基于每一张目标图像的三维姿态信息实现图像特征区偏转角度的校正。所述图像特征提取模块基于卷积神经网络实现图像特征区特征参数的提取,基于DSSDInceptionV3 COCO 模型的识别结果调用对应的卷积神经网络算法实现图像特征区特征参数的提取。所述图像识别模块首先将各图像特征区的特征参数串联形成增强特征向量,然后基于Bi-LSTM+Attention模型实现图像的识别。
实施例2
一种图像识别装置,包括:
图像采集模块,用于实现目标图像的采集;
图像特征区识别模块,用于基于神经网络模型实现图像特征区的识别;
图像特征区标记模块,用于基于图像采集模块所在位置信息和三维姿态信息实现图像特征区三维坐标点的标记;
图像校正模块,用于实现图像特征区偏转角度的校正;
图像特征提取模块,用于实现图像特征区特征参数的提取;
图像识别模块,用于融合所述图像特征区的特征参数,并实现图像的识别。
本实施例中,所述图像采集模块内载有三维姿态传感器,每一张目标图像均携带有图像采集模块的三维姿态信息。所述神经网络模型采用DSSD InceptionV3 COCO 模型。所述图像校正模块基于每一张目标图像的三维姿态信息实现图像特征区偏转角度的校正。所述图像特征提取模块基于卷积神经网络实现图像特征区特征参数的提取,基于DSSDInceptionV3 COCO 模型的识别结果调用对应的卷积神经网络算法实现图像特征区特征参数的提取。所述图像识别模块首先将携带有特征区未知信息的特征参数串联形成增强特征向量,然后基于Bi-LSTM+Attention模型实现图像的识别。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。
Claims (8)
1.一种图像识别系统,其特征在于:包括:
图像采集模块,用于实现目标图像的采集;
图像特征区识别模块,用于基于神经网络模型实现图像特征区的识别;
图像校正模块,用于实现图像特征区偏转角度的校正;
图像特征提取模块,用于实现图像特征区特征参数的提取;
图像识别模块,用于融合所述图像特征区的特征参数,并实现图像的识别。
2.如权利要求1所述的一种图像识别系统,其特征在于:所述图像采集模块内载有三维姿态传感器,每一张目标图像均携带有图像采集模块的三维姿态信息。
3.如权利要求1所述的一种图像识别系统,其特征在于:所述神经网络模型采用DSSDInceptionV3 COCO 模型。
4.如权利要求1所述的一种图像识别系统,其特征在于:所述图像校正模块基于每一张目标图像的三维姿态信息实现图像特征区偏转角度的校正。
5.如权利要求1所述的一种图像识别系统,其特征在于:所述图像特征提取模块基于卷积神经网络实现图像特征区特征参数的提取。
6.如权利要求1所述的一种图像识别系统,其特征在于:所述图像识别模块首先将各图像特征区的特征参数串联形成增强特征向量,然后基于Bi-LSTM+Attention模型实现图像的识别。
7.如权利要求1所述的一种图像识别系统,其特征在于:还包括:
图像特征区标记模块,用于基于图像采集模块所在位置信息和三维姿态信息实现图像特征区三维坐标点的标记。
8.一种图像识别装置,其特征在于:采用如权利要求1-7任一项所述的系统实现图像的识别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110089334.0A CN112488136A (zh) | 2021-01-22 | 2021-01-22 | 一种图像识别系统以及图像识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110089334.0A CN112488136A (zh) | 2021-01-22 | 2021-01-22 | 一种图像识别系统以及图像识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112488136A true CN112488136A (zh) | 2021-03-12 |
Family
ID=74912170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110089334.0A Pending CN112488136A (zh) | 2021-01-22 | 2021-01-22 | 一种图像识别系统以及图像识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112488136A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114568185A (zh) * | 2022-04-08 | 2022-06-03 | 西藏自治区农牧科学院蔬菜研究所 | 一种果树病虫害的防治方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514450A (zh) * | 2012-06-29 | 2014-01-15 | 华为技术有限公司 | 一种图像特征提取方法和图像校正方法以及设备 |
CN104134076A (zh) * | 2014-07-10 | 2014-11-05 | 杭州电子科技大学 | 基于cs和svm决策级融合的sar图像目标识别方法 |
CN109034133A (zh) * | 2018-09-03 | 2018-12-18 | 北京诚志重科海图科技有限公司 | 一种人脸识别方法及装置 |
CN109934177A (zh) * | 2019-03-15 | 2019-06-25 | 艾特城信息科技有限公司 | 行人再识别方法、系统及计算机可读存储介质 |
CN110909809A (zh) * | 2019-11-27 | 2020-03-24 | 上海智臻智能网络科技股份有限公司 | 基于深度学习的卡证图像识别方法 |
US20200126261A1 (en) * | 2017-07-28 | 2020-04-23 | Zhejiang Dahua Technology Co., Ltd. | Systems and methods for image processing |
CN111414894A (zh) * | 2020-04-10 | 2020-07-14 | 吉林农业大学 | 一种基于遥感图像的农作物病害识别方法 |
CN111507978A (zh) * | 2020-05-08 | 2020-08-07 | 延安大学 | 一种泌尿外科用智能数字影像处理系统 |
CN111539458A (zh) * | 2020-04-02 | 2020-08-14 | 咪咕文化科技有限公司 | 特征图处理方法、装置、电子设备及存储介质 |
CN111860496A (zh) * | 2020-06-22 | 2020-10-30 | 中国平安财产保险股份有限公司 | 车牌识别方法、装置、设备及计算机可读存储介质 |
CN112101276A (zh) * | 2020-09-24 | 2020-12-18 | 甘肃省小陇山林业实验局林业科学研究所 | 一种森林资源分布式管理系统 |
WO2021003938A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
-
2021
- 2021-01-22 CN CN202110089334.0A patent/CN112488136A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514450A (zh) * | 2012-06-29 | 2014-01-15 | 华为技术有限公司 | 一种图像特征提取方法和图像校正方法以及设备 |
CN104134076A (zh) * | 2014-07-10 | 2014-11-05 | 杭州电子科技大学 | 基于cs和svm决策级融合的sar图像目标识别方法 |
US20200126261A1 (en) * | 2017-07-28 | 2020-04-23 | Zhejiang Dahua Technology Co., Ltd. | Systems and methods for image processing |
CN109034133A (zh) * | 2018-09-03 | 2018-12-18 | 北京诚志重科海图科技有限公司 | 一种人脸识别方法及装置 |
CN109934177A (zh) * | 2019-03-15 | 2019-06-25 | 艾特城信息科技有限公司 | 行人再识别方法、系统及计算机可读存储介质 |
WO2021003938A1 (zh) * | 2019-07-05 | 2021-01-14 | 平安科技(深圳)有限公司 | 图像分类方法、装置、计算机设备和存储介质 |
CN110909809A (zh) * | 2019-11-27 | 2020-03-24 | 上海智臻智能网络科技股份有限公司 | 基于深度学习的卡证图像识别方法 |
CN111539458A (zh) * | 2020-04-02 | 2020-08-14 | 咪咕文化科技有限公司 | 特征图处理方法、装置、电子设备及存储介质 |
CN111414894A (zh) * | 2020-04-10 | 2020-07-14 | 吉林农业大学 | 一种基于遥感图像的农作物病害识别方法 |
CN111507978A (zh) * | 2020-05-08 | 2020-08-07 | 延安大学 | 一种泌尿外科用智能数字影像处理系统 |
CN111860496A (zh) * | 2020-06-22 | 2020-10-30 | 中国平安财产保险股份有限公司 | 车牌识别方法、装置、设备及计算机可读存储介质 |
CN112101276A (zh) * | 2020-09-24 | 2020-12-18 | 甘肃省小陇山林业实验局林业科学研究所 | 一种森林资源分布式管理系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114568185A (zh) * | 2022-04-08 | 2022-06-03 | 西藏自治区农牧科学院蔬菜研究所 | 一种果树病虫害的防治方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109359538B (zh) | 卷积神经网络的训练方法、手势识别方法、装置及设备 | |
CN110348330B (zh) | 基于vae-acgan的人脸姿态虚拟视图生成方法 | |
CN108364023A (zh) | 基于注意力模型的图像识别方法和系统 | |
CN108764041B (zh) | 用于下部遮挡人脸图像的人脸识别方法 | |
CN102831403B (zh) | 一种基于指纹特征点的识别方法 | |
CN110659589B (zh) | 基于姿态和注意力机制的行人再识别方法、系统、装置 | |
Lu et al. | Finger vein identification using polydirectional local line binary pattern | |
Vretos et al. | 3D facial expression recognition using Zernike moments on depth images | |
CN105138974B (zh) | 一种基于Gabor编码的手指多模态特征融合方法 | |
CN106650568B (zh) | 一种人脸识别方法及装置 | |
CN110796101A (zh) | 一种嵌入式平台的人脸识别方法及系统 | |
CN111191582B (zh) | 三维目标检测方法、检测装置、终端设备及计算机可读存储介质 | |
CN111091075A (zh) | 人脸识别方法、装置、电子设备及存储介质 | |
CN110991258B (zh) | 一种人脸融合特征提取方法及系统 | |
CN112381061B (zh) | 一种面部表情识别方法及系统 | |
CN112287865B (zh) | 一种人体姿态识别的方法及装置 | |
CN103761515A (zh) | 一种基于lbp的人脸特征提取方法及装置 | |
CN108090451A (zh) | 一种人脸识别方法及系统 | |
Chaudhary et al. | A vision based geometrical method to find fingers positions in real time hand gesture recognition. | |
CN112651380A (zh) | 人脸识别方法、人脸识别装置、终端设备及存储介质 | |
Ravi et al. | Sign language recognition with multi feature fusion and ANN classifier | |
Liu et al. | UAV transmission line inspection object recognition based on mask R-CNN | |
CN112488136A (zh) | 一种图像识别系统以及图像识别装置 | |
CN111108508A (zh) | 脸部情感识别方法、智能装置和计算机可读存储介质 | |
CN113658324A (zh) | 图像处理方法及相关设备、迁移网络训练方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210312 |
|
RJ01 | Rejection of invention patent application after publication |