CN110837840A - 一种基于注意力机制的图片特征检测方法 - Google Patents

一种基于注意力机制的图片特征检测方法 Download PDF

Info

Publication number
CN110837840A
CN110837840A CN201911082573.2A CN201911082573A CN110837840A CN 110837840 A CN110837840 A CN 110837840A CN 201911082573 A CN201911082573 A CN 201911082573A CN 110837840 A CN110837840 A CN 110837840A
Authority
CN
China
Prior art keywords
picture
attention
attention mechanism
attention area
feature detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911082573.2A
Other languages
English (en)
Inventor
王淑栋
尹文静
董玉坤
李月凤
乔思波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201911082573.2A priority Critical patent/CN110837840A/zh
Publication of CN110837840A publication Critical patent/CN110837840A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于注意力机制的图片特征检测方法,本方法可以通过注意力机制确定图片中感兴趣的区域。本发明首先根据自行采集的包含人体的图片数据集训练了一个改进的YOLO模型,利用该模型将图片背景及其他不重要的部分去除,确定注意力区域(除人体头部);之后输出注意力区域的灰度图矩阵;最后,利用sift检测算法注意力区域进行图案的检测。通过实验证明,本发明的基于注意力机制的图片特征点检测方法相比未应用注意力机制的现有方法,能大大降低图片背景的影响,在一定程度上提高图片特征检测的精度与效率。

Description

一种基于注意力机制的图片特征检测方法
技术领域
本发明涉及特征检测方法,尤其涉及一种基于注意力机制的图片特征检测方法。
背景技术
随着计算机技术的迅猛发展,目标检测已广泛的应用于交通监控、人机交互、精确制导等各个领域。特征检测是目标检测技术中的重要方法。对于图片来说,特征检测是对图片进行分析与识别的前提,它将高维的图像数据通过特征进行简化表达,适用于对图片进行识别、匹配、检索等应用。目前特征检测算法主要有SIFT、Harris、ORB等。
然而在对图片进行特征检测时,传统的检测方法易受图片背景的干扰,无法准确对图片重要部分的特征进行提取与检测,从而影响对图像的分析、匹配。
注意力机制是帮助检测模型关注重要部分或感兴趣部分并减少背景影响的有效方法。通过注意力机制可以确定感兴趣的部分,进而做进一步的研究与分析,提取其有用的信息,而对不感兴趣的部分则不予处理。基于注意力机制对图片特征进行检测,可以大大降低背景的干扰,同时提高图片特征检测的效率与精度,提高计算机资源利用率。
发明内容
有鉴于此,为了解决现有特征检测算法易受背景干扰的问题,本发明提出了一种基于注意力机制的图片特征检测方法。本发明利用注意力机制关注重要部分的特点,将图片背景及其他不重要的部分区域去除,从而提高特征检测的精度。
为达到上述目的,本发明的技术方案是这样实现的:
一种基于注意力机制的图片特征检测方法,该方法包括:
1、一种基于注意力机制的图片特征检测方法,其特征在于,该检测方法包括以下几个步骤:
A、改进的可对图片中人体进行识别的YOLO模型;
B、基于注意力机制的特征检测算法。
其中,所述步骤A中改进的可对图片中人体进行识别的YOLO模型,具体如下:
A1、将传统YOLO模型对目标的检测输出修改为注意力区域的灰度图矩阵。
所述步骤B中基于注意力机制的特征检测算法,具体过程如下:
B1、利用自行采集的图片,训练针对人体识别的YOLO模型;
B2、利用训练的YOLO模型确定注意力区域,即图片中人体(除头部);
B3、将注意力区域转换为灰度图,并输出其灰度图矩阵;
B4、利用SIFT算法进行人体特征检测。
本发明所提供的基于注意力机制的图片特征检测方法,具有以下优点:
本发明将注意力机制应用于图片特征检测,相较于传统特征检测方法,可大大降低图片背景的干扰,提高图片特征检测的准确率。
附图说明
图1为本发明基于注意力机制的特征检测流程示意图;
图2为本发明采集的包含人模的图片示例;
图3为利用本发明确定的注意力区域;
图4为本发明对注意力区域内图案的检测效果。
具体实施方式
为使本发明的目的、技术方案与优点更加清楚,下面结合附图对本发明的特征检测方法作进一步详细的说明。
本实施例的基础在于,自行采集的带人体的图片数据集。实验设备为Linux系统台式机、英伟达1018TiGPU、英特尔i7CPU。用Python语言编程实现所涉及的基于注意力机制的图片特征检测算法。
本发明自行采集100张包含人模的图片。通过对人模服装腰围出正面三个图案匹配正确的图片数量比较本发明与传统特征检测方法的性能。本发明在匹配过程中首先识别出包含图案的人模区域(除头部),并在该区域内进行图案特征的检测,完成匹配。通过该方法大大降低图片背景对匹配的干扰,最终可成功匹配97张图片,而利用传统方法,只成功匹配61张图片上的图案。

Claims (3)

1.一种基于注意力机制的图片特征检测方法,其特征在于,该识别方法包括以下几个步骤:
A、改进的可对图片中人体进行识别的YOLO模型;
B、基于注意力机制的特征检测算法。
2.根据权利要求1所述的基于注意力机制的图片特征检测方法,其特征在于,所述步骤A中改进的可对图片中人体进行识别的YOLO模型,具体过程如下:
A1、将传统YOLO模型的输出设计成为输出是注意力区域的灰度图矩阵。
A2、设计自适应裁剪算法,避免因为yolo识别的误差早晨注意力区域图像的损失。注意力区域需要裁剪的宽和高分别为:W=w+w/30,H=h+h/30,其中W,H分别为最终要裁剪的宽和高,w,h为yolo模型输出的宽和高。
3.根据权利要求1所述的基于注意力机制的图片特征检测方法,其特征在于,所述步骤B中基于注意力机制的特征检测算法,具体过程如下:
B1、利用自行采集的图片,训练针对人体识别的YOLO模型;
B2、利用训练的YOLO模型确定注意力区域,即图片中人体(除头部);
B3、将注意力区域转换为灰度图,并输出其灰度图矩阵;
B4、利用SIFT算法检测注意力区域内的特征。
CN201911082573.2A 2019-11-07 2019-11-07 一种基于注意力机制的图片特征检测方法 Pending CN110837840A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911082573.2A CN110837840A (zh) 2019-11-07 2019-11-07 一种基于注意力机制的图片特征检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911082573.2A CN110837840A (zh) 2019-11-07 2019-11-07 一种基于注意力机制的图片特征检测方法

Publications (1)

Publication Number Publication Date
CN110837840A true CN110837840A (zh) 2020-02-25

Family

ID=69574648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911082573.2A Pending CN110837840A (zh) 2019-11-07 2019-11-07 一种基于注意力机制的图片特征检测方法

Country Status (1)

Country Link
CN (1) CN110837840A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903265A (zh) * 2014-03-31 2014-07-02 东华大学 检测工业产品包装破损的方法
US20160078306A1 (en) * 2014-09-15 2016-03-17 Xerox Corporation System and method for detecting seat belt violations from front view vehicle images
CN108303078A (zh) * 2018-01-29 2018-07-20 哈尔滨工程大学 一种基于立体视觉的全方向船舶防撞预警与导航系统
CN109543606A (zh) * 2018-11-22 2019-03-29 中山大学 一种加入注意力机制的人脸识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103903265A (zh) * 2014-03-31 2014-07-02 东华大学 检测工业产品包装破损的方法
US20160078306A1 (en) * 2014-09-15 2016-03-17 Xerox Corporation System and method for detecting seat belt violations from front view vehicle images
CN108303078A (zh) * 2018-01-29 2018-07-20 哈尔滨工程大学 一种基于立体视觉的全方向船舶防撞预警与导航系统
CN109543606A (zh) * 2018-11-22 2019-03-29 中山大学 一种加入注意力机制的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TIANWEI LI ETC: ""Research on ROI Algorithm of Ship Image Based on Improved YOLO"", 《2019 INTERNATIONAL CONFERENCE ON ARTIFICIAL INTELLIGENCE AND ADVANCED MANUFACTURING (AIAM)》 *

Similar Documents

Publication Publication Date Title
Chen et al. Norm-aware embedding for efficient person search
CN105740899B (zh) 一种机器视觉图像特征点检测与匹配复合的优化方法
CN109145742B (zh) 一种行人识别方法及系统
CN111709311B (zh) 一种基于多尺度卷积特征融合的行人重识别方法
CN110197502B (zh) 一种基于身份再识别的多目标跟踪方法及系统
US8855363B2 (en) Efficient method for tracking people
CN109190544B (zh) 一种基于序列深度图像的人体身份识别方法
CN108171201B (zh) 基于灰度形态学的睫毛快速检测方法
JP6756406B2 (ja) 画像処理装置、画像処理方法および画像処理プログラム
CN108196680B (zh) 一种基于人体特征提取与检索的机器人视觉跟随方法
CN111444817B (zh) 一种人物图像识别方法、装置、电子设备和存储介质
CN111367901A (zh) 一种船舶数据去噪方法
CN108021894B (zh) 一种基于深度策略学习的小麦病害检测方法
Foytik et al. Tracking and recognizing multiple faces using Kalman filter and ModularPCA
Ikram et al. Real time hand gesture recognition using leap motion controller based on CNN-SVM architechture
CN110837840A (zh) 一种基于注意力机制的图片特征检测方法
CN109146861A (zh) 一种改进的orb特征匹配方法
CN114743257A (zh) 图像目标行为的检测识别方法
Wang et al. Ctl-dnnet: effective circular traffic light recognition with a deep neural network
CN114373091A (zh) 基于深度学习融合svm的步态识别方法
CN112149559A (zh) 人脸识别方法、装置、可读存储介质及计算机设备
CN110956095A (zh) 一种基于角点肤色检测的多尺度人脸检测方法
CN113761987A (zh) 一种行人重识别的方法、装置、计算机设备和存储介质
Wu et al. Research and Implementation of Automatic Cable Winding System Based on Machine Vision
CN110334644B (zh) 基于机器视觉的手势识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200225

WD01 Invention patent application deemed withdrawn after publication