CN116645568A - 目标检测方法、装置、电子设备及存储介质 - Google Patents
目标检测方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116645568A CN116645568A CN202310689145.6A CN202310689145A CN116645568A CN 116645568 A CN116645568 A CN 116645568A CN 202310689145 A CN202310689145 A CN 202310689145A CN 116645568 A CN116645568 A CN 116645568A
- Authority
- CN
- China
- Prior art keywords
- feature map
- transmission line
- image data
- power transmission
- line area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 120
- 230000005540 biological transmission Effects 0.000 claims abstract description 173
- 230000004927 fusion Effects 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 47
- 238000012937 correction Methods 0.000 claims description 35
- 238000010276 construction Methods 0.000 claims description 25
- 230000003993 interaction Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 26
- 238000004422 calculation algorithm Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 238000011176 pooling Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000005286 illumination Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000009435 building construction Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种目标检测方法、装置、电子设备及存储介质。该方法包括:获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;将所述输电线路区域的图像数据输入至注意力模块中,对所述输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;所述浅层特征图的尺寸大于所述深层特征图的尺寸;对所述浅层特征图和所述深层特征图进行融合,得到融合特征图;对所述融合特征图进行特征映射,得到待检测目标的目标检测结果。本发明实施例的技术方案提高了输电线路区域的目标检测的准确度。
Description
技术领域
本发明涉及配电网技术领域,尤其涉及一种目标检测方法、装置、电子设备及存储介质。
背景技术
输电线路是维持电能传输的重要通道,保证其安全稳定运行对整个电力系统至关重要。引发输电线路故障的原因有很多,例如因雷击、覆冰和山火等自然因素引起的输电线路跳闸,又如因外力破坏和设备故障等非自然因素引起的跳闸。其中,外力破坏是是引起输电线路故障的主要原因。因此,对输电线路区域中可能外力破坏输电线路的目标进行自动检测和报警,是当前亟待解决的问题。
目前,主要通过目标检测算法,对输电线路区域进行目标检测,以识别可能外力破坏输电线路的目标。
但是,由于输电线路区域的环境较为复杂,待检测目标在一些场景中被来往车辆、临时棚屋和灌木等其他物体遮挡,极容易发生漏检;并且由于户外天气和光照等因素时常变化,输电线路区域的图像数据的质量极易受到恶劣天气条件的影响,待检测目标很难被检测出来或者会产生误检。
发明内容
本发明提供了一种目标检测方法、装置、电子设备及存储介质,提高了输电线路区域的目标检测的准确度。
根据本发明的一方面,提供了一种目标检测方法,包括:
获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;
将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;浅层特征图的尺寸大于深层特征图的尺寸;
对浅层特征图和深层特征图进行融合,得到融合特征图;
对融合特征图进行特征映射,得到待检测目标的目标检测结果。
根据本发明的另一方面,提供了一种目标检测装置,包括:
图像数据获取模块,用于获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;
深层特征图确定模块,用于将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;浅层特征图的尺寸大于深层特征图的尺寸;
融合特征图确定模块,用于对浅层特征图和深层特征图进行融合,得到融合特征图;
目标检测结果确定模块,用于对融合特征图进行特征映射,得到待检测目标的目标检测结果。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的目标检测方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的目标检测方法。
本发明实施例的技术方案,通过获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图,将所述输电线路区域的图像数据输入至注意力模块中,对所述输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,所述浅层特征图的尺寸大于所述深层特征图的尺寸,对所述浅层特征图和所述深层特征图进行融合,得到融合特征图;对所述融合特征图进行特征映射,得到待检测目标的目标检测结果,解决了由于输电线路区域的环境较为复杂,待检测目标在一些场景中被来往车辆、临时棚屋和灌木等其他物体遮挡,极容易发生漏检的问题,以及由于户外天气和光照等因素时常变化,输电线路区域的图像数据的质量极易受到恶劣天气条件的影响,待检测目标很难被检测出来或者会产生误检的问题,提高了输电线路区域的目标检测的准确度。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种目标检测方法的流程图;
图2是根据本发明实施例一提供的一种目标检测方法的原理图;
图3是根据本发明实施例二提供的一种目标检测方法的流程图;
图4是根据本发明实施例二提供的一种融合模块的结构示意图;
图5是根据本发明实施例二提供的一种输电线路区域的图像数据处理方法的原理图;
图6是根据本发明实施例三提供的一种目标检测装置的结构示意图;
图7是实现本发明实施例的目标检测方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种目标检测方法的流程图。本发明实施例可适用于对输电线路区域的目标进行检测的情况,该方法可以由目标检测装置来执行,该目标检测装置可以采用硬件和/或软件的形式实现,该目标检测装置可配置于承载目标检测功能的电子设备中。
参见图1所示的目标检测方法,包括:
S110、获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图。
输电线路区域可以是杆塔上的摄像头采集到的区域。输电线路区域内包含输电线路。输电线路区域的图像数据可以通过杆塔上的摄像头实时采集的视频数据中逐帧获取。浅层特征图可以是经过较少的卷积层后得到的输出特征图。相较于深层特征图,浅层特征图的尺寸更大,感受野更大。
具体的,可以将杆塔上的摄像头实时采集的输电线路区域的图像数据通过4G(The4th generation mobile communication technology,第四代移动通信及其技术)网络传输至本设备。本设备获取输电线路区域的图像数据,并输入至特征提取模块中进行特征提取,得到输电线路区域的图像数据的浅层特征图。示例性的,特征提取模块可以为CenterNet(点检测)模型中的DLA34-Backbone(深层聚合的轻量主干网络)。
S120、将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;浅层特征图的尺寸大于深层特征图的尺寸。
深层特征图的特征提取维度可以包括通道维度和空间维度等中至少一个。从至少一个维度上进行特征提取,使得输电线路区域的图像数据在进行特征提取时,可以提取更多地特征,进而提高被遮挡的待检测目标的检测准确度。深层特征图可以是经过较多的卷积层后得到的输出特征图。相较于浅层特征图,深层特征图的尺寸较小,深层特征图的感受野较小。
具体的,可以将输电线路区域的图像数据输入至注意力模块中,可以对输电线路区域的图像数据从通道维度和空间维度进行特征提取,并将多维度的特征提取结果进行融合,得到深层特征图。示例性的,注意力模块可以包括CBAM(Convolutional BlockAttention Module,卷积注意力机制模块)或Fusion-CBAM(Fusion Convolutional BlockAttention Module,融合卷积注意力机制模块)等。
S130、对浅层特征图和深层特征图进行融合,得到融合特征图。
具体的,可以将浅层特征图和深层特征图输入至融合模块中进行多尺度特征融合,得到融合特征图。其中,融合模块可以对深层特征图和浅层特征图进行特征融合。
S140、对融合特征图进行特征映射,得到待检测目标的目标检测结果。
待检测目标可以是可能会对输电线路造成外力破坏故障的目标。由于输电线路区域的环境较为复杂,待检测目标在一些场景中被来往车辆、临时棚屋和灌木等其他物体遮挡,极容易发生漏检的问题,以及由于户外天气和光照等因素时常变化,输电线路区域的图像数据的质量极易受到恶劣天气条件的影响,待检测目标很难被检测出来。示例性的,待检测目标可以包括施工机械和大型动物等。目标检测结果可以包括输电线路区域内是否检测到待检测目标、待检测目标的类型和待检测目标的位置等信息。
具体的,可以通过检测头部分中的分类分支和回归分支,对融合特征图进行特征映射,得到待检测目标的目标检测结果。
示例性的,图2为一种目标检测方法的原理图。如图2所示,输电线路区域的图像数据输入至特征提取部分中的特征提取模块中,得到浅层特征图;输电线路区域的图像数据输入至特征提取部分的注意力模块中,得到深层特征图;将深层特征图和浅层特征图输入至特征提取部分的融合模块中进行特征融合,得到融合特征图。将融合特征图输入至检测头部分进行特征映射(例如进行归一化、线性回归和最大池化),得到待检测目标的目标检测结果。通过融合模块对特征提取模块和注意力模块的特征图进行特征融合,相较于单独利用特征提取模块或注意力模块进行特征提取,所得到目标检测结果更准确。
本发明实施例的技术方案,通过获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图,将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,浅层特征图的尺寸大于深层特征图的尺寸,对浅层特征图和深层特征图进行融合,得到融合特征图,对融合特征图进行特征映射,得到待检测目标的目标检测结果,相较于现有技术的目标检测算法检测精度较低,在复杂场景和恶劣天气的检测条件下难以保证检测方法的鲁棒性,极易发生待检测目标的漏检和误检,本发明实施例的技术方案对特征提取部分进行了结构改进,引入了注意力模块,对输电线路区域的图像数据进行多尺度特征融合,将特征提取的注意力引入到了被遮挡的待检测目标上,提高了输电线路区域的目标检测的准确度,实现了对待检测目标的实时检测,提高了复杂的检测条件下目标检测方法的抗干扰性,可以有效减少误检和漏检,具有较高的实用性。
在本发明的一个可选实施例中,待检测目标的目标识别结果包括待检测目标的位置;在得到待检测目标的目标识别结果之后,还包括:获取输电线路区域中的禁止通行区域;在待检测目标的位置位于禁止通行区域中时,发出输电线路区域的告警信息;告警信息用于对输电线路区域的外力破坏故障进行预警。
禁止通行区域可以为输电线路的电子围栏区域。禁止通行区域可以是输电线路区域中待检测目标的禁止通行区域。可以理解为,待检测目标在禁止通行区域内,可能会对禁止通行区域内的输电线路造成破坏。告警信息可以包括声音提示信息、文本提示信息和图形提示信息等。告警信息用于对输电线路区域的外力破坏故障进行预警。通过发送告警信息,以提示可能对输电线路区域造成外力破坏。示例性的,声音提示信息可以包括声光报警器报警或语音提示等。文本提示信息可以包括“请离开该区域!”或“该区域禁止通行!”等。图形提示信息可以包括前端页面显示的注意图标等。
本方案通过对待检测目标位于禁止通行区域时,发出告警信息,实现了对输电线路区域的外力破坏故障的实时预警,进一步避免了输电线路区域的外力破坏故障,保证了输电线路区域的电力系统的稳定运行。
在本发明的一个可选实施例中,在待检测目标的位置位于禁止通行区域中时,发出输电线路区域的告警信息,包括:在待检测目标的位置位于禁止通行区域中时,检测待检测目标在禁止通行区域中的停留时间;在停留时间大于预设停留时间时,发出输电线路区域的告警信息。
停留时间可以是待检测目标在禁止通行区域中停留的时间。预设停留时间可以是预先设定的待检测目标在禁止通行区域中停留的时间的上限值。可选的,预设停留时间可以根据技术人员的经验进行设定和调整。
本方案相较于在待检测目标行驶通过禁止通行区域,并未停留立即发出告警信息,通过检测待检测目标在禁止通行区域中的停留时间,进而判断待检测目标是否会对输电线路区域造成外力破坏,避免了频繁地发出无效的告警信息,减小了告警信息的处理成本,进一步提高了输电线路区域的外力破坏故障预警的准确度。
在本发明的一个可选实施例中,待检测目标包括施工机械;待检测目标的目标检测结果包括施工机械的位置和类型。
由于城镇化建设加快,输电线路区域的面积逐渐被建筑施工面积压缩,施工机械碰线是造成输电线路区域的外力破坏故障的主要因素,施工机械的外力破坏导致输电线路故障的发生率大幅升高,严重地影响了电力系统的安全稳定运行。示例性的,施工机械的类型可以包括吊车、挖掘机、塔吊和泵车等。
具体的,可以获取输电线路区域的图像数据。可以将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图。可以对浅层特征图和深层特征图进行融合,得到融合特征图。可以通过检测头部分中的分类分支对融合特征图进行特征映射,得到施工机械的类型;可以通过检测头部分中的回归分支对融合特征图进行特征映射,得到施工机械的位置。若在输电线路区域内未检测到施工机械,则继续对下一输电线路区域的图像数据进行检测。若在输电线路区域内检测到施工机械,则输出输电线路区域内检测到施工机械、施工机械的类型和施工机械的位置。可选的,还可以根据施工机械的位置和不同类型的施工机械,在输电线路区域的图像数据中为施工机械匹配不同的颜色标识框。示例性的,吊车可以用红色标识框,挖掘机用蓝色标识框。
本方案通过将待检测目标具体化为施工机械,将待检测目标的目标检测结果具体化为施工机械的位置和类型,实现了对输电线路区域内的施工机械的检测,避免了施工机械漏检和误检的问题,提高了输电线路区域的施工机械检测的准确度,保证了电力系统的安全稳定运行。
实施例二
图3为本发明实施例二提供的一种目标检测方法的流程图。本发明实施例在上述实施例的基础上,将“对浅层特征图和深层特征图进行融合,得到融合特征图”具体化为“将深层特征图输入至第一卷积核,对深层特征图进行特征提取,得到第一深层特征图;将深层特征图输入至第二卷积核,对深层特征图进行特征提取,得到第二深层特征图;其中,第一卷积核和第二卷积核的大小不同;将第一深层特征图和第二深层特征图进行归一化和上采样,得到第三深层特征图;将第三深层特征图和浅层特征图进行特征融合,得到融合特征图”,充分利用了深层特征图的浅层特征以及浅层特征图,提高了融合模块对待检测目标的特征提取能力和特征融合能力。需要说明的是,在本发明实施例中未详述的部分,可参见其他实施例的表述。
参见图3所示的目标检测方法,包括:
S310、获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图。
S320、将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;浅层特征图的尺寸大于深层特征图的尺寸。
S330、将深层特征图输入至第一卷积核,对深层特征图进行特征提取,得到第一深层特征图。
第一卷积核可以是对深层特征图进行特征提取的卷积核。示例性的,第一卷积核可以包括3*3卷积核和5*5卷积核等。第一深层特征图可以是通过第一卷积核特征提取得到特征图。
S340、将深层特征图输入至第二卷积核,对深层特征图进行特征提取,得到第二深层特征图;其中,第一卷积核和第二卷积核的大小不同。
第二卷积核可以是对深层特征图进行特征提取的另一个卷积核。第一卷积核和第二卷积核的大小不同。相应的,第一卷积核和第二卷积核的感受野不同。示例性的,第二卷积核的大小可以为1*1卷积核。第二深层特征图可以是通过第二卷积核特征提取得到特征图。
S350、将第一深层特征图和第二深层特征图进行归一化和上采样,得到第三深层特征图。
第三深层特征图可以是对第一深层特征图和第二深层特征图进行归一化和上采样后得到的特征图。
S360、将第三深层特征图和浅层特征图进行特征融合,得到融合特征图。
具体的,可以对第三深层特征图和浅层特征图进行特征融合,得到融合特征图。
S370、对融合特征图进行特征映射,得到待检测目标的目标检测结果。
示例性的,图4为一种融合模块的结构示意图。如图4所示,融合模块由1*1卷积核、3*3深度可分离卷积核、归一化(例如批量归一化)和上采样(例如最近邻插值上采样)组成。其中,3*3深度可分离卷积核由逐通道卷积核和逐点卷积核组成。在逐通道卷积核中,对输入的深层特征图的每个通道进行独立卷积运算。在逐点卷积核中,会将逐通道卷积核的输出在特征通道方向上进行加权卷积运算,生成新的第一深层特征图。相比于1*1卷积核,3*3深度可分离卷积核不仅具有更大的感受野,而且参数量和运算成本也较低。通过在融合模块中添加不同大小的卷积核,可以获得输电线路区域的图像数据中不同大小的感受野信息,有利于提取待检测目标的不同程度的特征,发掘不同大小的感受野对待检测目标的不同程度的感知能力,获得待检测目标更丰富的信息。通过融合模块,可以将深层特征图和浅层特征图进行特征融合,得到融合特征图。相较于利用单个卷积核(例如1*1卷积核)对深层特征图进行特征提取,感受野较小,不能充分利用深层特征图的浅层特征,影响特征融合。本方案在引入融合模块的同时,通过不同的卷积核(例如第一卷积核和第二卷积核),将网络深层输出的小尺寸的深层特征图在进行多尺度的特征提取和上采样后,再与网络浅层(shallow layer)输入的大尺寸的浅层特征图进行特征融合,充分利用了深层特征图的浅层特征以及浅层特征图,提高了融合模块对待检测目标的特征提取能力和特征融合能力。
本发明实施例的技术方案,通过获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图,将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,浅层特征图的尺寸大于深层特征图的尺寸,将深层特征图输入至第一卷积核,对深层特征图进行特征提取,得到第一深层特征图,将深层特征图输入至第二卷积核,对深层特征图进行特征提取,得到第二深层特征图,其中,第一卷积核和第二卷积核的大小不同,将第一深层特征图和第二深层特征图进行归一化和上采样,得到第三深层特征图,将第三深层特征图和浅层特征图进行特征融合,得到融合特征图,对融合特征图进行特征映射,得到待检测目标的目标检测结果,利用不同大小的卷积核对深层特征图进行特征提取,并与浅层特征图进行特征融合,充分利用了深层特征图的浅层特征以及浅层特征图,提高了融合模块对待检测目标的特征提取能力和特征融合能力。
在本发明的一个可选实施例中,将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,包括:对输电线路区域的图像数据进行特征提取,得到输入特征图;将输入特征图沿着高度维度旋转变换后得到高度维度特征图;将输入特征图沿着宽度维度旋转变换后得到宽度维度特征图;获取融合通道注意力模块的通道维度和高度维度之间的跨维度交互的高度注意力分支向量、通道维度和宽度维度之间的跨维度交互的宽度注意力分支向量和通道维度之间的跨维度交互的通道注意力分支分量;将输入特征图、高度维度特征图、宽度维度特征图、高度注意力分支向量、宽度注意力分支向量和通道注意力分支分量进行融合,得到第四深层特征图;获取空间注意力分支分量;对第四深层特征图和空间注意力分支分量进行融合,得到深层特征图。
第四深度特征图可以是对输入特征图进行不同维度的特征提取并融合后得到的特征图。第四深度特征图用于生成深层特征图。
具体的,可以将输电线路区域的图像数据输入注意力模块中,对输电线路区域的图像数据进行特征提取,得到输入特征图。可以将输入特征图沿着特征图的高度维度旋转变换后得到高度维度特征图。可以将输入特征图沿着特征图的宽度维度旋转变换后得到宽度维度特征图。示例性的,注意力模块可以为Fusion-CBAM注意力模块。注意力模块可以包括融合通道注意力单元和空间注意力单元。其中,融合通道注意力单元包括三个负责跨维度交互的注意力分支,分别是:(a)负责捕获通道维度C与空间高度维度H跨维度交互的CH注意力分支;(b)负责捕获通道维度与空间宽度维度W跨维度交互的CW注意力分支;(c)负责捕获不同通道间的跨通道维度交互的GPE注意力分支。可以通过激活函数σ(*)得到高度注意力分支向量CCH、宽度注意力分支向量CCW和通道注意力分支分量CGPE。可以通过融合通道注意力单元的计算公式对各维度的特征图(例如输入特征图、高度维度特征图和宽度维度特征图)进行融合,得到第四深层特征图。
示例性的,可以采用以下公式,表示融合通道注意力单元的计算公式:
式中,AC(*)为融合通道注意力模块的计算函数;F为输入特征图,F∈RC×H×W;为输入特征图F沿第H维旋转变换后得到的高度特征图;/>为输入特征图F沿第W维旋转变换后得到宽度特征图;CCH为高度注意力分支向量;CCW为宽度注意力分支向量;CGPE为通道注意力分支分量。
其中,可以采用以下公式,计算高度注意力分支向量CCH:
式中,CCH为高度注意力分支向量;σ(*)为激活函数;ψ7×7为卷积核大小为7*7的卷积层;Cat(*)为特征拼接;AvgPoolW(*)为沿着宽度维度的平均池化;MaxPoolW(*)为沿着宽度维度的平均池化;为输入特征图F沿第H维旋转变换后得到的高度特征图。
可以采用以下公式,计算宽度注意力分支向量CCW:
式中,CCW为宽度注意力分支向量;σ(*)为激活函数;ψ7×7为卷积核大小为7*7的卷积层;Cat(*)为特征拼接;AvgPoolH(*)为沿着高度维度的平均池化;MaxPoolH(*)为沿着高度维度的平均池化;为输入特征图F沿第W维旋转变换后得到宽度特征图。
可以采用以下公式,计算通道注意力分支分量CGPE:
式中,CGPE为通道注意力分支分量;σ(*)为激活函数;C1d为一维卷积;GAvgPoolC(*)为沿着通道维度的全局平均池化;GMaxPoolC(*)为沿着通道维度的全局最大池化;F为输入特征图。
示例性的,可以采用以下公式,表示空间注意力单元的计算公式:
AS(AC(F))=AC(F)Sa;
式中,AS(*)为空间注意力单元的计算函数;AC(F)为融合通道注意力单元输出的第四深度特征图;F为输入特征图;Sa为空间注意力分支分量。
其中,可以采用以下公式,计算空间注意力分支分量Sa:
式中,Sa为空间注意力分支分量;σ(*)为激活函数;ψ7×7为卷积核大小为7*7的卷积层;Cat(*)为特征拼接;AvgPoolC(*)为沿着通道维度的平均池化;;MaxPoolC(*)为沿着通道维度的最大池化;F为输入特征图。
本方案通过对输电线路区域的图像数据进行高速维度、宽度维度、通道维度和空间维度的特征提取和特征融合,得到深层特征图,相较于仅考虑通道注意力分支分量,对输电线路区域的图像数据进行特征提取和特征融合,考虑了空间维度和通道维度的交互,避免了深层特征图的空间信息缺失,充分利用了注意力机制,提高了待检测目标检测的准确度。
在本发明的一个可选实施例中,在获取输电线路区域的图像数据之后,还包括:对输电线路区域的图像数据进行图像颜色偏差修正;对图像颜色偏差修正后的图像数据进行全局亮度校正;获取输电线路区域的图像数据的边缘细节图像数据;将边缘细节图像数据与全局亮度校正后的图像数据进行融合,更新输电线路区域的图像数据。
具体的,可以采用自动白平衡(Automatic White Balance,AWB)算法对输电线路区域的图像数据进行图像颜色偏差修正。可以采用伽马校正(Gamma Correction)算法对图像颜色偏差修正后的图像数据进行全局亮度校正。可以采用拉普拉斯金字塔(LaplacianPyramid)算法获取输电线路区域的图像数据的边缘细节图像数据。可以将边缘细节图像数据与全局亮度校正后的图像数据进行融合,更新输电线路区域的图像数据。
示例性的,图5为一种输电线路区域的图像数据处理方法的原理图。如图5所示,对于输电线路区域的图像数据,首先,可以采用自动白平衡算法进行图像颜色偏差修正,提高输电线路区域的图像数据的对比度。随后,可以对图像颜色偏差修正后的图像数据的全局亮度进行伽马校正,自适应调整图像颜色偏差修正后的图像数据的色彩保真度。最后,可以通过拉普拉斯金字塔算法,根据输电线路区域的图像数据的反射分量,提取边缘细节图像数据。最终,将边缘细节图像数据与全局亮度校正后的图像数据进行叠加融合,更新输电线路区域的图像数据。可选的,对叠加值超过255的像素,将其设置为255,更新输电线路区域的图像数据。
其中,自动白平衡算法的原理是白色的物体在任何光源下均呈现白色,因此,自动白平衡算法依据环境色温调节白平衡增益,使图像目标颜色接近真实情况。在大雾和沙尘的环境条件下,由监控摄像头采集的输电线路区域的图像数据大多呈现白灰色,图像对比度低。因此,通过基于动态阈值的自动白平衡算法检测并调整白点,从而校正不同色温下拍摄的图像颜色偏差。
(1)自动白平衡算法的具体计算过程如下:
首先,将输电线路区域的图像数据由RGB色彩空间转换至YCbCr色彩空间,并进行分块处理,计算每一块中Cb分量、Cr分量的色度均值Mb、Mr和色度均方差Db、Dr,舍弃色彩均匀即方差较小的区域块。在剩余区域计算整幅图像的色度均值Mb、Mr和色度均方差Db、jr,且按下式选取候补白点:
∣Cb(x,y)-(Mb+Db×sign(Mb)∣<1.5×Db;
∣Cr(x,y)-(Mr+Dr×sign(Mr)∣<1.5×Dr;
式中,Cb(x,y)和Cc(x,y)为输电线路区域的图像数据中(x,y)位置处的像素点的色度值;Mb为每一块中Cb分量的色度均值;Mr为每一块中Cr分量的色度均值;Db为每一块中Cb分量的色度均方差;Dr为每一块中Cr分量的色度均方差;sign(*)是符号函数。
随后,选取亮度值Y(x,y)前10%的候补白点作为参考白点。在RGB色彩空间下分别计算R、G和B三个通道的参考白点的灰度值均值,并按下式计算三个通道的增益:
Rgain=Ymax×(Raverage)-1;
Ggain=Ymax×(Gaverage)-1;
Bgain=Ymax×(Baverage)-1;
式中,Rgain为R通道的增益;Ymax为输电线路区域的图像数据中亮度值的最大值;Raverage为R通道下参考白点的灰度值均值;Ggain为G通道的增益;Gaverage为G通道下参考白点的灰度值均值;Bgain为B通道的增益;Baverage为B通道下参考白点的灰度值均值。
最后,通过将各通道的增益添加至对应的通道下逐个像素值中。以此,校正输电线路区域的图像数据的色彩,提高输电线路区域的图像数据的对比度。
(2)伽马校正算法的具体计算过程如下:
通过自动白平衡算法对输电线路区域的图像数据进行图像颜色偏差修正之后,虽然待检测目标在输电线路区域的图像数据中的颜色接近真实颜色,然而自动白平衡算法通常会导致图像整体偏暗,为了实现色彩自然,提高过暗区域亮度,本方案引用伽马校正算法的计算公式对全局光照分量进行校正。
其中,伽马校正算法的计算公式如下:
式中,O(x,y)为伽马校正后输电线路区域的图像数据的亮度值;i(x,y)为伽马校正前输电线路区域的图像数据的亮度值,即全局亮度校正后的输电线路区域的图像数据;im为伽马校正前输电线路区域的图像数据的亮度值的中间值,i=128;a为亮度调节因子,a=0.4。
在上式中,利用伽马校正前输电线路区域的图像数据中每个像素自身的亮度值构造伽马值,并自适应地进行校正,最终输出伽马校正后输电线路区域的图像数据的亮度值O(x,y)。
(3)拉普拉斯金字塔算法的具体计算过程如下:
拉普拉斯金字塔算法以高斯金字塔算法为基础,可以提取输电线路区域的图像数据在高斯卷积和下采样过程中丢失的高频信息。为了提取图像反射分量中的高频信息,实现输电线路区域的图像数据的边缘细节增强,本方案采用拉普拉斯金字塔算法对输电线路区域的图像数据进行边缘细节提取,获取输电线路区域的图像数据的边缘细节图像。
示例性的,考虑到计算速度,本方案采用的拉普拉斯金字塔可以为两层结构,第一层为输电线路区域的图像数据G1,第二层为经过一次高斯金字塔处理后的图像数据G2。其中,G2的分辨率是G1的一半。可以通过计算G1和G2之间的差异获取输电线路区域的图像数据的边缘细节图像数据。
可以采用以下公式,获取输电线路区域的图像数据的边缘细节图像数据LP:
LP=G1-upSample(G2);
其中,LP为输电线路区域的图像数据的边缘细节图像数据;G1为输电线路区域的图像数据;upSample(*)为最邻近值上采样方法;G2为经过一次高斯金字塔处理后的图像数据。
本方案通过对输电线路区域的图像数据进行图像颜色偏差修正、全局亮度校正和边缘细节图像数据获取,并将全局亮度校正后的图像数据和边缘细节图像数据进行融合,通过自适应地调整输电线路区域的图像数据的对比度、光照强度和反射分量,恢复输电线路区域的图像数据的能见度,解决了恶劣天气条件下图像数据的能见度低导致的待检测目标的检测精度低的问题,减少了因图像数据的能见度地导致的目标检测的漏检率和误检率,提高了待检测目标的检测准确度。
实施例三
图6为本发明实施例三提供的一种目标检测装置的结构示意图。本发明实施例可适用于对输电线路区域的目标进行检测的情况,该装置可以执行目标检测方法,该装置可以采用硬件和/或软件的形式实现,该装置可配置于承载目标检测功能的电子设备中。
参见图6所示的目标检测装置,包括:图像数据获取模块610、深层特征图确定模块620、融合特征图确定模块630和目标检测结果确定模块640。其中,图像数据获取模块610,用于获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;深层特征图确定模块620,用于将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;浅层特征图的尺寸大于深层特征图的尺寸;融合特征图确定模块630,用于对浅层特征图和深层特征图进行融合,得到融合特征图;目标检测结果确定模块640,用于对融合特征图进行特征映射,得到待检测目标的目标检测结果。
本发明实施例的技术方案,通过获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图,将输电线路区域的图像数据输入至注意力模块中,对输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,浅层特征图的尺寸大于深层特征图的尺寸,对浅层特征图和深层特征图进行融合,得到融合特征图,对融合特征图进行特征映射,得到待检测目标的目标检测结果,相较于现有技术的目标检测算法检测精度较低,在复杂场景和恶劣天气的检测条件下难以保证检测方法的鲁棒性,极易发生待检测目标的漏检和误检,本发明实施例的技术方案对特征提取部分进行结构改进,引入了注意力模块,对输电线路区域的图像数据进行多尺度特征融合,将特征提取的注意力引入到了被遮挡的待检测目标上,提高了输电线路区域的目标检测的准确度,实现了对待检测目标的实时检测,提高了复杂的检测条件下目标检测方法的抗干扰性,可以有效减少误检和漏检,具有较高的实用性。
在本发明的一个可选实施例中,融合特征图确定模块630,包括:第一深层特征图确定单元,用于将深层特征图输入至第一卷积核,对深层特征图进行特征提取,得到第一深层特征图;第二深层特征图确定单元,用于将深层特征图输入至第二卷积核,对深层特征图进行特征提取,得到第二深层特征图;其中,第一卷积核和第二卷积核的大小不同;第三深层特征图确定单元,用于将第一深层特征图和第二深层特征图进行归一化和上采样,得到第三深层特征图;融合特征图确定单元,用于将第三深层特征图和浅层特征图进行特征融合,得到融合特征图。
在本发明的一个可选实施例中,深层特征图确定模块620,包括:输入特征图确定单元,用于对输电线路区域的图像数据进行特征提取,得到输入特征图;高度维度特征图确定单元,用于将输入特征图沿着高度维度旋转变换后得到高度维度特征图;宽度维度特征图确定单元,用于将输入特征图沿着宽度维度旋转变换后得到宽度维度特征图;通道注意力分支分量获取单元,用于获取融合通道注意力模块的通道维度和高度维度之间的跨维度交互的高度注意力分支向量、通道维度和宽度维度之间的跨维度交互的宽度注意力分支向量和通道维度之间的跨维度交互的通道注意力分支分量;第四深层特征图确定单元,用于将输入特征图、高度维度特征图、宽度维度特征图、高度注意力分支向量、宽度注意力分支向量和通道注意力分支分量进行融合,得到第四深层特征图;空间注意力分支分量获取单元,用于获取空间注意力分支分量;深层特征图确定单元,用于对第四深层特征图和空间注意力分支分量进行融合,得到深层特征图。
在本发明的一个可选实施例中,在图像数据获取模块610获取输电线路区域的图像数据之后,该装置还包括:图像颜色偏差修正模块,用于对输电线路区域的图像数据进行图像颜色偏差修正;全局亮度校正模块,用于对图像颜色偏差修正后的图像数据进行全局亮度校正;边缘细节图像数据获取模块,用于获取输电线路区域的图像数据的边缘细节图像数据;图像数据更新模块,用于将边缘细节图像数据与全局亮度校正后的图像数据进行融合,更新输电线路区域的图像数据。
在本发明的一个可选实施例中,待检测目标的目标识别结果包括待检测目标的位置;在目标检测结果确定模块640得到待检测目标的目标识别结果之后,该装置还包括:禁止通行区域获取模块,用于获取输电线路区域中的禁止通行区域;告警信息发送模块,用于在待检测目标的位置位于禁止通行区域中时,发出输电线路区域的告警信息;告警信息用于对输电线路区域的外力破坏故障进行预警。
在本发明的一个可选实施例中,告警信息发送模块,包括:停留时间检测单元,用于在待检测目标的位置位于禁止通行区域中时,检测待检测目标在禁止通行区域中的停留时间;告警信息发送单元,用于在停留时间大于预设停留时间时,发出输电线路区域的告警信息。
在本发明的一个可选实施例中,待检测目标包括施工机械;待检测目标的目标检测结果包括施工机械的位置和类型。
本发明实施例所提供的目标检测装置可执行本发明任意实施例所提供的目标检测方法,具备执行方法相应的功能模块和有益效果。
本发明实施例的技术方案中,所涉及的输电线路区域的图像数据、融合通道注意力模块的通道维度和高度维度之间的跨维度交互的高度注意力分支向量、通道维度和宽度维度之间的跨维度交互的宽度注意力分支向量、通道维度之间的跨维度交互的通道注意力分支分量、空间注意力分支分量、输电线路区域的图像数据的边缘细节图像数据和输电线路区域中的禁止通行区域等的获取、存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
实施例四
图7示出了可以用来实施本发明的实施例的电子设备700的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图7所示,电子设备700包括至少一个处理器701,以及与至少一个处理器701通信连接的存储器,如只读存储器(ROM)702、随机访问存储器(RAM)703等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器701可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储电子设备700操作所需的各种程序和数据。处理器701、ROM 702以及RAM703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
电子设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许电子设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器701可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器701执行上文所描述的各个方法和处理,例如目标检测方法。
在一些实施例中,目标检测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到电子设备700上。当计算机程序加载到RAM 703并由处理器701执行时,可以执行上文描述的目标检测方法的一个或多个步骤。备选地,在其他实施例中,处理器701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行目标检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS(VirtualPrivate Server,虚拟专用服务器)服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种目标检测方法,其特征在于,包括:
获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;
将所述输电线路区域的图像数据输入至注意力模块中,对所述输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;所述浅层特征图的尺寸大于所述深层特征图的尺寸;
对所述浅层特征图和所述深层特征图进行融合,得到融合特征图;
对所述融合特征图进行特征映射,得到待检测目标的目标检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述浅层特征图和所述深层特征图进行融合,得到融合特征图,包括:
将所述深层特征图输入至第一卷积核,对所述深层特征图进行特征提取,得到第一深层特征图;
将所述深层特征图输入至第二卷积核,对所述深层特征图进行特征提取,得到第二深层特征图;其中,所述第一卷积核和所述第二卷积核的大小不同;
将所述第一深层特征图和所述第二深层特征图进行归一化和上采样,得到第三深层特征图;
将所述第三深层特征图和所述浅层特征图进行特征融合,得到融合特征图。
3.根据权利要求1所述的方法,其特征在于,所述将所述输电线路区域的图像数据输入至注意力模块中,对所述输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图,包括:
对所述输电线路区域的图像数据进行特征提取,得到输入特征图;
将所述输入特征图沿着高度维度旋转变换后得到高度维度特征图;
将所述输入特征图沿着宽度维度旋转变换后得到宽度维度特征图;
获取融合通道注意力模块的通道维度和所述高度维度之间的跨维度交互的高度注意力分支向量、所述通道维度和所述宽度维度之间的跨维度交互的宽度注意力分支向量和所述通道维度之间的跨维度交互的通道注意力分支分量;
将所述输入特征图、所述高度维度特征图、所述宽度维度特征图、所述高度注意力分支向量、所述宽度注意力分支向量和所述通道注意力分支分量进行融合,得到第四深层特征图;
获取空间注意力分支分量;
对所述第四深层特征图和所述空间注意力分支分量进行融合,得到深层特征图。
4.根据权利要求1所述的方法,其特征在于,在所述获取输电线路区域的图像数据之后,还包括:
对所述输电线路区域的图像数据进行图像颜色偏差修正;
对图像颜色偏差修正后的图像数据进行全局亮度校正;
获取所述输电线路区域的图像数据的边缘细节图像数据;
将所述边缘细节图像数据与全局亮度校正后的图像数据进行融合,更新所述输电线路区域的图像数据。
5.根据权利要求1所述的方法,其特征在于,所述待检测目标的目标识别结果包括待检测目标的位置;
在所述得到待检测目标的目标识别结果之后,还包括:
获取输电线路区域中的禁止通行区域;
在所述待检测目标的位置位于所述禁止通行区域中时,发出输电线路区域的告警信息;所述告警信息用于对所述输电线路区域的外力破坏故障进行预警。
6.根据权利要求5所述的方法,其特征在于,所述在所述待检测目标的位置位于所述禁止通行区域中时,发出输电线路区域的告警信息,包括:
在所述待检测目标的位置位于所述禁止通行区域中时,检测所述待检测目标在所述禁止通行区域中的停留时间;
在所述停留时间大于预设停留时间时,发出输电线路区域的告警信息。
7.根据权利要求1所述的方法,其特征在于,所述待检测目标包括施工机械;所述待检测目标的目标检测结果包括所述施工机械的位置和类型。
8.一种目标检测装置,其特征在于,包括:
图像数据获取模块,用于获取输电线路区域的图像数据,并进行特征提取,得到浅层特征图;
深层特征图确定模块,用于将所述输电线路区域的图像数据输入至注意力模块中,对所述输电线路区域的图像数据从至少一个维度上进行特征提取,并融合得到深层特征图;所述浅层特征图的尺寸大于所述深层特征图的尺寸;
融合特征图确定模块,用于对所述浅层特征图和所述深层特征图进行融合,得到融合特征图;
目标检测结果确定模块,用于对所述融合特征图进行特征映射,得到待检测目标的目标检测结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的目标检测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的目标检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310689145.6A CN116645568A (zh) | 2023-06-09 | 2023-06-09 | 目标检测方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310689145.6A CN116645568A (zh) | 2023-06-09 | 2023-06-09 | 目标检测方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116645568A true CN116645568A (zh) | 2023-08-25 |
Family
ID=87618795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310689145.6A Pending CN116645568A (zh) | 2023-06-09 | 2023-06-09 | 目标检测方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116645568A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116872233A (zh) * | 2023-09-07 | 2023-10-13 | 泉州师范学院 | 校园巡检机器人及其控制方法 |
-
2023
- 2023-06-09 CN CN202310689145.6A patent/CN116645568A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116872233A (zh) * | 2023-09-07 | 2023-10-13 | 泉州师范学院 | 校园巡检机器人及其控制方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111091109B (zh) | 基于人脸图像进行年龄和性别预测的方法、系统和设备 | |
CN111414807B (zh) | 一种基于yolo技术的潮水识别与危机预警方法 | |
US11238301B2 (en) | Computer-implemented method of detecting foreign object on background object in an image, apparatus for detecting foreign object on background object in an image, and computer-program product | |
WO2020228739A1 (zh) | 光伏组件缺陷的检测方法和装置、分类器的训练方法、终端设备及非暂时性存储介质 | |
CN111862013A (zh) | 基于深度卷积神经网络的绝缘子检测方法、装置及设备 | |
CN112989995B (zh) | 文本检测方法、装置及电子设备 | |
CN116645568A (zh) | 目标检测方法、装置、电子设备及存储介质 | |
CN111814637A (zh) | 一种危险驾驶行为识别方法、装置、电子设备及存储介质 | |
CN111047598B (zh) | 基于深度学习的输变电设备紫外放电光斑分割方法及装置 | |
CN116824166B (zh) | 输电线路烟雾识别方法、装置、计算机设备和存储介质 | |
CN116091709B (zh) | 建筑物的三维重建方法、装置、电子设备和存储介质 | |
CN112001336A (zh) | 行人越界报警方法、装置、设备及系统 | |
CN116721516A (zh) | 一种基于视频监控的预警方法、装置及存储介质 | |
CN115410154A (zh) | 一种风电机舱电气设备热故障识别方法 | |
CN115984672A (zh) | 基于深度学习的高清图像内小目标的检测方法和装置 | |
CN112966788A (zh) | 基于深度学习的输电线路间隔棒故障检测方法 | |
CN117152421B (zh) | 输电线路异物检测方法、装置、计算机设备和存储介质 | |
CN114333345B (zh) | 停车位被遮挡时的预警方法、设备、存储介质及程序产品 | |
CN117372988B (zh) | 道路边界检测方法、装置、电子设备及存储介质 | |
CN117333483B (zh) | 一种用于金属凹陷结构底部的缺陷检测方法及装置 | |
CN112507956B (zh) | 信号灯识别方法、装置、电子设备、路侧设备和云控平台 | |
CN116823935A (zh) | 监控图像中屏幕显示信息的定位方法、装置、设备及介质 | |
CN117557777A (zh) | 一种样本图像确定方法、装置、电子设备以及存储介质 | |
CN116883984A (zh) | 一种车牌检测方法、装置、设备及介质 | |
CN116468713A (zh) | 一种车道线确定方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |