CN113255759B - 基于注意力机制的目标内特征检测系统、方法和存储介质 - Google Patents
基于注意力机制的目标内特征检测系统、方法和存储介质 Download PDFInfo
- Publication number
- CN113255759B CN113255759B CN202110554342.8A CN202110554342A CN113255759B CN 113255759 B CN113255759 B CN 113255759B CN 202110554342 A CN202110554342 A CN 202110554342A CN 113255759 B CN113255759 B CN 113255759B
- Authority
- CN
- China
- Prior art keywords
- attention
- detection
- module
- image
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24137—Distances to cluster centroïds
- G06F18/2414—Smoothing the distance, e.g. radial basis function networks [RBFN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于注意力机制的目标内特征检测系统、方法和存储介质,智能安防领域,系统包括语义抽取模块、注意力图模块、和检测模块组成,分类子模块负责对目标进行全局属性分类并监督注意力子模块的训练;注意力子模块负责构建注意力图;检测模块包括锚框过滤层、目标检测层和解析层,锚框过滤层将接收的所述注意力图模块的结果进行数据过滤并发送给目标检测层和解析层进行检测分析,输出检测结果。本发明采用基于深度卷积网络的多任务学习方法,并引入注意力学习,以及单尺度检测的机制,对目标内特征进行检测定位,对目标全局属性进行分类识别,解决了传统方案训练阶段样本分布不均衡、多锚框和多尺度导致算力需求高的问题,提高了检测效率和精度。
Description
技术领域
本发明涉及智能安防领域,具体涉及一种基于注意力机制的目标内特征检测系统、方法和存储介质。
背景技术
目标检测是机器视觉的研究热点之一,而目标内特征检测是指,对目标内组件定位,以进一步分析视频、图像中的目标的结构化信息的技术。目标内特征检测是视频/图像结构化解析的重要技术之一,如车辆结构化任务中,需对车辆目标中的车脸、车窗、车灯、车标、行李架等特征进行定位,并做进一步分析。
现阶段目标内特征检测,主要借助于SSD、YOLO等通用场景检测方法,其不足如下:
1.目标内特征检测通常从固定类型目标内定位多个特征位置,现有通用检测框架未考虑目标属性对目标内特征检测的指导性。
2.使用现有通用检测框架,需要构建多尺度的图像金字塔或特征金字塔,耗时较久,不利于边缘设备部署。
3.现有检测框架,借助深度卷积网络强大的拟合能力,使用同一特征图对目标进行检测框回归和分类,不利于性能的提升。
4.现有检测框架的锚框选取方式,会生成大量的负样本,导致训练阶段样本不均衡问题,分类困难。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种基于注意力机制的目标内特征检测系统、方法和存储介质,其能解决上述问题。
一种基于注意力机制的目标内特征检测系统,系统包括语义抽取模块、注意力模块、和检测模块组成,其中:所述语义抽取模块包括多层深度卷积网络,负责从输入图像抽取高层语义信息,并将抽取的高层语义信息分享给所述注意力模块和检测模块;所述注意力模块包括分类子模块和注意力子模块;其中,所述分类子模块的每个属性分支包括多个卷积层、全局池化层、全局连接层和softmax层,负责对目标进行全局属性分类并监督注意力子模块的训练;其中,所述注意力子模块包括多个卷积层和反卷积层,负责构建注意力图;所述检测模块包括锚框过滤层、目标检测层和解析层,所述锚框过滤层将接收的所述注意力模块的结果进行数据过滤并发送给目标检测层和解析层进行检测分析,输出检测结果。
本发明还提供了一种基于注意力机制的目标内特征检测方法,方法包括以下步骤:
步骤S1、样本准备:获取训练图像,标注图像全局属性标签、图像特征位置及对应的分类标签;
步骤S2、注意力图训练:注意力模块使用训练图像以及特征位置信息,生成注意力图标签信息,并利用注意力图标签信息及图像全局属性标签监督注意力模块训练;
步骤S3、检测网络训练:固定注意力模块及语义提取模块参数,使用图像特征位置、图像特征标签监督检测网络训练,并使用注意力图生成锚框,将注意力模块引入检测框架;
步骤S4、全局网络调优,根据训练,获得优化的网络框架;
步骤S5、针对新的检测目标,通过光学系统获取图像或视频,导入优化后的网络框架,实现目标定位、分析和检测。
本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行前述的方法。
相比现有技术,本发明的有益效果在于:本发明采用基于深度卷积网络的多任务学习方法,并引入注意力学习,以及单尺度检测的机制,对目标内特征进行检测定位,对目标全局属性进行分类识别,解决了传统方案训练阶段样本分布不均衡、多锚框和多尺度导致算力需求高的问题,提高了检测效率和精度。
附图说明
图1为本发明基于注意力机制的目标内特征检测系统示意图;
图2为基于注意力机制的目标内特征检测方法流程示意图;
图3为候选锚框生成示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,本说明书中所使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。
如本说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。
本说明书中使用了流程图用来说明根据本说明书的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
第一实施例
一种基于注意力机制的目标内特征检测系统,参见图1,系统包括语义抽取模块、注意力模块、和检测模块组成。
其中,语义抽取模块包括多层深度卷积网络,负责从输入图像抽取高层语义信息,并将抽取的高层语义信息分享给所述注意力模块和检测模块。
其中,所述注意力模块包括分类子模块和注意力子模块。
所述分类子模块的每个属性分支包括多个卷积层、全局池化层、全局连接层和softmax层,负责对目标进行全局属性分类并监督注意力子模块的训练;其中,所述注意力子模块包括多个卷积层和反卷积层,负责构建注意力图;
其中,所述检测模块包括锚框过滤层、目标检测层和解析层,所述锚框过滤层将接收的所述注意力模块的结果进行数据过滤并发送给目标检测层和解析层进行检测分析,输出检测结果。
以机动车为例,图1中,机动车的全局属性包括机动车方向、车型、车身颜色等,车辆特征包括车窗、车标、车灯、行李架、天窗等。训练步骤分为样本准备、注意力图多任务训练、检测网络训练、全局网络调优等。
第二实施例
一种基于注意力机制的目标内特征检测方法,该方法由第一实施例的系统实施,参见图2,方法包括以下步骤。
步骤S1、样本准备:获取训练图像,标注图像全局属性标签、图像特征位置及对应的分类标签。
步骤S2、注意力图训练:注意力模块使用训练图像以及特征位置信息,生成注意力图标签信息,并利用注意力图标签信息及图像全局属性标签监督注意力模块训练;其中,注意力图标签信息的生成方法包括以下步骤。
S21、计算标签每类特征的均值图像,表示为:
S22、根据样本均值图像计算样本差异图重心(xc,yc);样本差异图重心(xc,yc)的计算公式为:
式中,为样本均值图像/>对应坐标(i,j)处的像素值,pi,j为特征图像(i,j)处的坐标值。
S23、根据差异图重心(xc,yc)生成注意力图G(x,y)。注意力图G(x,y)的计算公式为:
式中,x、y表示像素在注意力图中的坐标,xs、xe、ys、ye分别表示目标特征在图像中横轴、纵轴方向的起始、终止位置。
步骤S3、检测网络训练:固定注意力模块及语义提取模块参数,使用图像特征位置、图像特征标签监督检测网络训练,并使用注意力图生成锚框,将注意力模块引入检测框架;其中,锚框的生成方法为:
S31、生成候选锚框,参见图3,以注意力图中的每个位置为锚点,并以锚点为中心生成不同尺度的矩形框,作为候选框;每个坐标为(i,j)处的锚点对应的多个候选框中的第k个候选框Bboxi,j,k为:
Bboxi,j,k={li,j,k,ti,j,k,wi,j,k,hi,j,k}…………式3;
式中,li,j,k、ti,j,k、wi,j,k、hi,j,k分别为候选框左上角横坐标、左上角纵坐标、候选框宽度及候选框高度;候选框即候选锚框。
S32、计算每个候选框的置信度Ci,j,k:
式中,f为注意力图中锚框区域内各对应点的值。
S33、根据候选框的置信度,对候选框进行过滤得到最终的候选框集合Bboxes:
Bboxes={Ci,j,k≥T}………………………………式5;
式中,T为置信度过滤阈值。
步骤S4、全局网络调优,根据训练,获得优化的网络框架。
步骤S5、针对新的检测目标,通过光学系统获取图像或视频,导入优化后的网络框架,实现目标定位、分析和检测。
第三实施例
本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行前述方法的步骤。其中,所述方法请参见前述部分的详细介绍,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、VisualBasic、Fortran2003、Perl、COBOL2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或处理设备上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (5)
1.一种基于注意力机制的目标内特征检测方法,其特征在于,方法包括以下步骤:
步骤S1、样本准备:获取训练图像,标注图像全局属性标签、图像特征位置及对应的分类标签;
步骤S2、注意力图训练:注意力模块使用训练图像以及特征位置信息,生成注意力图标签信息,并利用注意力图标签信息及图像全局属性标签监督注意力模块训练;步骤S2中的注意力图标签信息的生成方法包括以下步骤:
S21、计算标签每类特征的均值图像,表示为:
S22、根据样本均值图像计算样本差异图重心(xc,yc);
S23、根据差异图重心(xc,yc)生成注意力图G(x,y);
步骤S3、检测网络训练:固定注意力模块及语义提取模块参数,使用图像特征位置、图像特征标签监督检测网络训练,并使用注意力图生成锚框,将注意力模块引入检测框架;具体的,步骤S3中锚框的生成方法为:
S31、生成候选锚框,以注意力图中的每个位置为锚点,并以锚点为中心生成不同尺度的矩形框,作为候选框;每个坐标为(i,j)处的锚点对应的多个候选框中的第k个候选框Bboxi,j,k为:
Bboxi,j,k={li,j,k,ti,j,k,wi,j,k,hi,j,k};
式中,li,j,k、ti,j,k、wi,j,k、hi,j,k分别为候选框左上角横坐标、左上角纵坐标、候选框宽度及候选框框高度;
S32、计算每个候选框的置信度Ci,j,k:
式中,f为注意力图中锚框区域内各对应点的值;
S33、根据候选框的置信度,对候选框进行过滤得到最终的候选框集合Bboxes:
Bboxes={Ci,j,k≥T};
式中,T为置信度过滤阈值;
步骤S4、全局网络调优,根据训练,获得优化的网络框架;
步骤S5、针对新的检测目标,通过光学系统获取图像或视频,导入优化后的网络框架,实现目标定位、分析和检测。
2.根据权利要求1所述的检测方法,其特征在于:样本差异图重心(xc,yc)的计算公式为:
式中,为样本均值图像/>对应坐标(i,j)处的像素值,pi,j为特征图像(i,j)处的坐标值。
3.根据权利要求2所述的检测方法,其特征在于:注意力图G(x,y)的计算公式为:
式中,x、y表示像素在注意力图中的坐标,xs、xe、ys、ye分别表示目标特征在图像中横轴、纵轴方向的起始、终止位置。
4.一种基于注意力机制的目标内特征检测系统,其特征在于:系统包括语义抽取模块、注意力模块、和检测模块组成,并通过权利要求3所述的检测方法进行检测,其中:
所述语义抽取模块包括多层深度卷积网络,负责从输入图像抽取高层语义信息,并将抽取的高层语义信息分享给所述注意力模块和检测模块;
所述注意力模块包括分类子模块和注意力子模块;其中,所述分类子模块的每个属性分支包括多个卷积层、全局池化层、全局连接层和softmax层,负责对目标进行全局属性分类并监督注意力子模块的训练;其中,所述注意力子模块包括多个卷积层和反卷积层,负责构建注意力图;
所述检测模块包括锚框过滤层、目标检测层和解析层,所述锚框过滤层将接收的所述注意力模块的结果进行数据过滤并发送给目标检测层和解析层进行检测分析,输出检测结果。
5.一种计算机可读存储介质,其上存储有计算机指令,其特征在于:所述计算机指令运行时执行权利要求1-3任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110554342.8A CN113255759B (zh) | 2021-05-20 | 2021-05-20 | 基于注意力机制的目标内特征检测系统、方法和存储介质 |
PCT/CN2021/095956 WO2022241803A1 (zh) | 2021-05-20 | 2021-05-26 | 基于注意力机制的目标内特征检测系统、方法和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110554342.8A CN113255759B (zh) | 2021-05-20 | 2021-05-20 | 基于注意力机制的目标内特征检测系统、方法和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113255759A CN113255759A (zh) | 2021-08-13 |
CN113255759B true CN113255759B (zh) | 2023-08-22 |
Family
ID=77183214
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110554342.8A Active CN113255759B (zh) | 2021-05-20 | 2021-05-20 | 基于注意力机制的目标内特征检测系统、方法和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113255759B (zh) |
WO (1) | WO2022241803A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792632A (zh) * | 2021-09-02 | 2021-12-14 | 广州广电运通金融电子股份有限公司 | 基于多方合作的指静脉识别方法、系统和存储介质 |
CN114973064A (zh) * | 2022-04-29 | 2022-08-30 | 华为技术有限公司 | 一种伪标签框生成方法、装置及电子设备 |
CN117275005A (zh) * | 2023-09-21 | 2023-12-22 | 北京百度网讯科技有限公司 | 文本检测、文本检测模型优化、数据标注的方法、装置 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178213A (zh) * | 2019-12-23 | 2020-05-19 | 大连理工大学 | 一种基于深度学习的航拍车辆检测方法 |
CN111242071A (zh) * | 2020-01-17 | 2020-06-05 | 陕西师范大学 | 一种基于锚框的注意力遥感图像目标检测方法 |
CN111275688A (zh) * | 2020-01-19 | 2020-06-12 | 合肥工业大学 | 基于注意力机制的上下文特征融合筛选的小目标检测方法 |
CN111401201A (zh) * | 2020-03-10 | 2020-07-10 | 南京信息工程大学 | 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法 |
CN111539469A (zh) * | 2020-04-20 | 2020-08-14 | 东南大学 | 一种基于视觉自注意力机制的弱监督细粒度图像识别方法 |
CN111666836A (zh) * | 2020-05-22 | 2020-09-15 | 北京工业大学 | M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法 |
CN111985284A (zh) * | 2019-05-21 | 2020-11-24 | 天津科技大学 | 一种基于注意力机制与语义弱监督的无锚箱的单阶段目标检测装置 |
CN112183414A (zh) * | 2020-09-29 | 2021-01-05 | 南京信息工程大学 | 一种基于混合空洞卷积的弱监督遥感目标检测方法 |
CN112200161A (zh) * | 2020-12-03 | 2021-01-08 | 北京电信易通信息技术股份有限公司 | 一种基于混合注意力机制的人脸识别检测方法 |
CN112232231A (zh) * | 2020-10-20 | 2021-01-15 | 城云科技(中国)有限公司 | 行人属性的识别方法、系统、计算机设备和存储介质 |
CN112308019A (zh) * | 2020-11-19 | 2021-02-02 | 中国人民解放军国防科技大学 | 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 |
CN112580664A (zh) * | 2020-12-15 | 2021-03-30 | 哈尔滨理工大学 | 一种基于ssd网络的小目标检测方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9858496B2 (en) * | 2016-01-20 | 2018-01-02 | Microsoft Technology Licensing, Llc | Object detection and classification in images |
US10796152B2 (en) * | 2018-09-21 | 2020-10-06 | Ancestry.Com Operations Inc. | Ventral-dorsal neural networks: object detection via selective attention |
CN109993101B (zh) * | 2019-03-28 | 2021-01-19 | 华南理工大学 | 基于多分支循环自注意力网络与循环边框回归的车辆检测方法 |
CN110647794B (zh) * | 2019-07-12 | 2023-01-03 | 五邑大学 | 基于注意力机制的多尺度sar图像识别方法及装置 |
CN112200089B (zh) * | 2020-10-12 | 2021-09-14 | 西南交通大学 | 一种基于车辆计数感知注意力的稠密车辆检测方法 |
-
2021
- 2021-05-20 CN CN202110554342.8A patent/CN113255759B/zh active Active
- 2021-05-26 WO PCT/CN2021/095956 patent/WO2022241803A1/zh active Application Filing
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111985284A (zh) * | 2019-05-21 | 2020-11-24 | 天津科技大学 | 一种基于注意力机制与语义弱监督的无锚箱的单阶段目标检测装置 |
CN111178213A (zh) * | 2019-12-23 | 2020-05-19 | 大连理工大学 | 一种基于深度学习的航拍车辆检测方法 |
CN111242071A (zh) * | 2020-01-17 | 2020-06-05 | 陕西师范大学 | 一种基于锚框的注意力遥感图像目标检测方法 |
CN111275688A (zh) * | 2020-01-19 | 2020-06-12 | 合肥工业大学 | 基于注意力机制的上下文特征融合筛选的小目标检测方法 |
CN111401201A (zh) * | 2020-03-10 | 2020-07-10 | 南京信息工程大学 | 一种基于空间金字塔注意力驱动的航拍图像多尺度目标检测方法 |
CN111539469A (zh) * | 2020-04-20 | 2020-08-14 | 东南大学 | 一种基于视觉自注意力机制的弱监督细粒度图像识别方法 |
CN111666836A (zh) * | 2020-05-22 | 2020-09-15 | 北京工业大学 | M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法 |
CN112183414A (zh) * | 2020-09-29 | 2021-01-05 | 南京信息工程大学 | 一种基于混合空洞卷积的弱监督遥感目标检测方法 |
CN112232231A (zh) * | 2020-10-20 | 2021-01-15 | 城云科技(中国)有限公司 | 行人属性的识别方法、系统、计算机设备和存储介质 |
CN112308019A (zh) * | 2020-11-19 | 2021-02-02 | 中国人民解放军国防科技大学 | 基于网络剪枝和知识蒸馏的sar舰船目标检测方法 |
CN112200161A (zh) * | 2020-12-03 | 2021-01-08 | 北京电信易通信息技术股份有限公司 | 一种基于混合注意力机制的人脸识别检测方法 |
CN112580664A (zh) * | 2020-12-15 | 2021-03-30 | 哈尔滨理工大学 | 一种基于ssd网络的小目标检测方法 |
Non-Patent Citations (1)
Title |
---|
一种可变锚框候选区域网络的目标检测方法;李承昊 等;北京航空航天大学学报;第46卷(第08期);第1610-1617页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113255759A (zh) | 2021-08-13 |
WO2022241803A1 (zh) | 2022-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113255759B (zh) | 基于注意力机制的目标内特征检测系统、方法和存储介质 | |
US9846821B2 (en) | Fast object detection method based on deformable part model (DPM) | |
CN110414559B (zh) | 智能零售柜商品目标检测统一框架的构建方法及商品识别方法 | |
CN111460968B (zh) | 基于视频的无人机识别与跟踪方法及装置 | |
CN110929593B (zh) | 一种基于细节辨别区别的实时显著性行人检测方法 | |
CN111091101B (zh) | 基于一步法的高精度行人检测方法、系统、装置 | |
US11823310B2 (en) | Context-aware selective object replacement | |
CN103632170A (zh) | 基于特征组合的行人检测方法及装置 | |
CN112488229B (zh) | 一种基于特征分离和对齐的域自适应无监督目标检测方法 | |
CN104615986A (zh) | 利用多检测器对场景变化的视频图像进行行人检测的方法 | |
CN111079638A (zh) | 基于卷积神经网络的目标检测模型训练方法、设备和介质 | |
CN108491828B (zh) | 一种基于层次的成对相似性PVAnet的停车位检测系统及方法 | |
Abdullah et al. | Objects detection and tracking using fast principle component purist and kalman filter. | |
CN114998815A (zh) | 一种基于视频分析的交通车辆识别追踪方法及系统 | |
CN115240035A (zh) | 半监督目标检测模型训练方法、装置、设备以及存储介质 | |
CN114612847A (zh) | 一种Deepfake视频篡改检测方法以及系统 | |
US11132607B1 (en) | Method for explainable active learning, to be used for object detector, by using deep encoder and active learning device using the same | |
CN113591825A (zh) | 基于超分辨网络的目标搜索重建方法、装置及存储介质 | |
CN111144220B (zh) | 适于大数据的人员检测方法、装置、设备和介质 | |
CN112819100A (zh) | 无人机平台多尺度目标检测方法和装置 | |
CN110728229A (zh) | 图像处理方法、装置、设备和存储介质 | |
CN116152696A (zh) | 一种工控系统智慧安防图像识别方法及系统 | |
Thakare et al. | Object interaction-based localization and description of road accident events using deep learning | |
US9798932B2 (en) | Video extraction method and device | |
CN114119128A (zh) | 商品检测方法、装置、服务器及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |