CN116110036B - 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 - Google Patents
基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 Download PDFInfo
- Publication number
- CN116110036B CN116110036B CN202310370792.0A CN202310370792A CN116110036B CN 116110036 B CN116110036 B CN 116110036B CN 202310370792 A CN202310370792 A CN 202310370792A CN 116110036 B CN116110036 B CN 116110036B
- Authority
- CN
- China
- Prior art keywords
- module
- power equipment
- nameplate
- information
- defect
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/20—Administration of product repair or maintenance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/758—Involving statistics of pixels or of feature values, e.g. histogram matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Biophysics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Supply And Distribution Of Alternating Current (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法及装置。该方法获取电力设备铭牌图像;检测并识别电力设备铭牌图像上的文字信息;对电力设备铭牌图像进行边缘检测及二值化处理;消除电力设备铭牌图像中的文字信息和网格线;根据所处理完成后的电力设备铭牌图像剩余像素点占图像总像素点比例,对电力设备铭牌信息进行缺陷定级,并在资产管理系统中进行缺陷上报并形成缺陷运维管理策略。本发明提供的方法有利于实现电力设备铭牌管理的标准化,提升运维人员的缺陷管理效率与实时性,有利于缩短消缺时间,优化电力设备的资产运维水平。
Description
技术领域
本发明涉及电力设备铭牌信息管理领域,具体涉及一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法及装置。
背景技术
电力设备铭牌记录着设备的基本参数和身份信息,电力设备的铭牌信息管理是电力运行人员的基本工作之一。完整的电力设备铭牌信息,对配电线路的单线图制作、电力设备的测试检修以及线路的大修技改等有重要的意义。
目前,对电力设备铭牌信息的管理依赖运行人员的主动巡视并手动录入系统,铭牌信息缺陷管理的智能化与规范化水平有待进一步提高。同时也存在以下方面的问题:1)现场部分电力设备,如台变、柱上开关等,装设位置距离地面较高,且设备铭牌较小,用肉眼很难准确判断铭牌是否存在信息缺陷;2)部分计算机视觉技术,虽然提升了铭牌信息缺陷检测的效率,但这一类方法普遍需要进行模版比对,部分运行年限较长、缺乏铭牌模版的电力设备达不到检测要求;3)缺乏对铭牌信息缺陷等级的判断依据,未形成高效的铭牌缺陷处理办法,导致电力设备铭牌缺陷得不到及时有效的运维。
发明内容
本发明实施例提供一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法及装置,该方法有利于实现电力设备铭牌信息缺陷等级管理的智能化和标准化,提升电力设备铭牌的运维效率,优化电力系统资产运维水平。
第一方面,本发明提供一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法,包括:获取电力设备铭牌图像;运用深度学习技术检测电力设备铭牌图像中的文字信息,框选出电力设备铭牌图像中所有的文字信息;运用光学字符识别技术识别被框选出的文字信息,并将文字信息发送至资产管理系统中,建立对应的电力设备铭牌信息目录和缺陷管理目录;
对电力设备铭牌图像进行边缘检测,提取并形成二值化图像;将所述二值化图像中的被框选出的文字信息通过置零操作进行消除;对消除文字信息后的二值化图像进行网格检测,并通过置零操作进行消除网格线,得到消除文字和网格线后的二值化图像;
统计消除文字和网格线后的二值化图像中剩余数值为1的像素点数量,计算数值为1的像素点数量占图像总像素点数量的像素点百分比;根据像素点百分比对电力设备铭牌信息缺陷进行定级;
基于缺陷定级及缺陷情况描述,在资产管理系统中对电力设备铭牌进行缺陷上报并形成缺陷运维管理策略。
进一步优选,根据像素点百分比对电力设备铭牌信息缺陷进行定级的标准为:当像素点百分比数值小于或等于20时,判断电力设备铭牌信息无受损或轻微受损;当像素点百分比数值大于20且小于或等于50时,判断电力设备铭牌信息中度受损;当像素点百分比数值大于50时,判断电力设备铭牌信息严重受损。
进一步优选,所述缺陷运维管理策略包括:当电力设备铭牌信息无受损或轻微受损时,保持当前运维策略;当电力设备铭牌信息中度受损时,更改运维策略为加强巡视和保护,对缺陷信息进行修复,并在资产管理系统中进行登记上报缺陷信息;当电力设备铭牌信息严重受损时,更改运维策略为更换所述电力设备铭牌,并在资产管理系统中进行登记上报缺陷信息。
进一步优选,采用改进YOLOv5模型检测电力设备铭牌图像中的文字信息,改进YOLOv5模型包括输入端、主干网络、颈部网络、输出端四部分。输入端包括数据增强模块、自适应图像填充模块、自适应锚框计算模块,输入端将图像随机缩放、随机裁剪、随机排布。主干网络依次由第一CBH模块、第二CBH模块、第一C3模块、第三CBH模块、第二C3模块、第四CBH模块、第三C3模块、第五CBH模块、第四C3模块和SPPF模块组成。颈部网络包括第六CBH模块、第七CBH模块、第五C3模块、第六C3模块、第七C3模块、第八C3模块、第一CBAM 卷积注意力模块和第二CBAM 卷积注意力模块,SPPF模块输出的特征图进入第六CBH模块,第六CBH模块输出的特征图经上采样后与第四CBH模块输出的特征图进行特征融合,融合后的特征图经过第六C3模块、第七CBH模块处理;第七CBH模块输出的特征图经上采样后与第三CBH模块输出的特征图进行特征融合,然后送入第八C3模块,第八C3模块输出的特征图送入输出端卷积得到第一特征图输出;第八C3模块输出的特征图被第一CBAM 卷积注意力模块关注后与第七CBH模块输出的特征图进行特征融合,然后送入第七C3模块处理,第七C3模块输出的特征图送入输出端卷积得到第二特征图输出;第七C3模块输出的特征图被第二CBAM 卷积注意力模块关注后与第六CBH模块输出的特征图进行特征融合,然后送入第五C3模块处理,第五C3模块输出的特征图送入输出端卷积得到第三特征图输出。
进一步优选,采用的光学字符识别技术是基于CTC-Attention联合机制的场景文本识别模型。
进一步优选,改进YOLOv5模型对电力设备铭牌图像中的文字信息按训练模型得到的权重文件进行检测,检测结果为若干个矩形框,将电力设备铭牌图像中的文字信息进行框选和裁剪,然后基于CTC-Attention联合机制的场景文本识别模型对矩形框内的文字信息进行识别提取;将所述二值化图像中的被框选出的文字信息通过置零操作进行消除是:首先计算改进YOLOv5模型的检测结果坐标并记录,某矩形框中心点坐标为(x1,y1),矩形框长度和宽度分别为l个像素点和h个像素点,然后记录基于CTC-Attention联合机制的场景文本识别模型所识别目标的坐标,文字信息中某个像素点在矩阵框中的坐标为(x2,y2),则对应所述二值化图像中点(x1+x2-l/2,y1+y2-h/2)的像素值置零。
进一步优选,采用霍夫直线检测对消除处理后的二值化图像进行网格检测。
进一步优选,消除网格线是指:记录霍夫直线检测所检测为直线的像素点,在消除文字信息后的二值化图像中对直线的像素点进行置零操作。
第二方面,本发明还提供了一种基于机器视觉的电力设备铭牌信息缺陷等级判断装置,包括:
图像获取模块,用于获取电力设备铭牌图像,由多旋翼无人机和其搭载的高像素摄像机组成;
检测和识别模块,用于检测和识别电力设备铭牌图像中的文字信息,并将所述文字信息发送至管理模块;
缺陷等级判断模块,用于处理电力设备铭牌图像,并根据电力铭牌信息缺陷等级判断方法对所述电力设备铭牌信息缺陷进行等级判断;
管理模块,用于接收检测和识别模块传送的文字信息,用于根据缺陷情况描述和缺陷等级判断,在资产管理系统中进行对应电力设备铭牌信息缺陷上报并形成缺陷运维管理策略,建立电力设备铭牌信息目录和缺陷管理目录。
第三方面,本发明还提供了一种基于机器视觉的电力设备铭牌信息缺陷等级判断设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述基于机器视觉的电力设备铭牌信息缺陷等级判断方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法。
本发明通过获取电力设备铭牌图像;检测并识别电力设备铭牌图像上的文字信息;对电力设备铭牌图像进行边缘检测及二值化处理;将所识别提取的文字信息在边缘检测及二值化处理后的电力设备铭牌图像中消除;对所消除文字信息后的电力设备铭牌图像进行网格检测;消除电力设备铭牌图像上的网格线;根据所处理完成后的电力设备铭牌图像剩余像素点占图像总像素点比例,对电力设备铭牌信息进行缺陷定级,并在资产管理系统中进行缺陷上报并形成缺陷运维管理策略。本发明提供的方法有利于实现电力设备铭牌管理的智能化和标准化,提升运维人员的缺陷管理效率与实时性,有利于缩短消缺时间,且无需建立标准模版,广泛适用于配电网变压器台架和柱上开关等设备,有利于优化电力设备的资产运维水平。
附图说明
图1是本发明的基于机器视觉的电力设备铭牌信息缺陷等级判断方法流程图。
图2是改进YOLOv5模型结构示意图。
图3是本发明实施例提供的基于CTC-Attention联合机制的场景文本识别模型结构图。
图4是基于机器视觉的电力设备铭牌信息缺陷等级判断装置的示意图。
具体实施方式
在下文中,将对本发明的具体实施例进行详细地描述,依照这些详细的描述,所属领域技术人员能够清楚地理解本申请,并能够实施本发明。在不违背本发明原理的情况下,各个不同的实施例中的特征可以进行组合以获得新的实施方式,或者替代某些实施例中的某些特征,获得其它优选的实施方式。
参考图1,基于机器视觉的电力设备铭牌信息缺陷等级判断方法包括:
步骤S1:获取电力设备铭牌图像。配电网变压器、开关等设备在运输、安装过程中会出现各种磕碰,同时电力设备运行过程中也会受到雨、雪、雾等物质的腐蚀以及各种外力损坏,这都导致电力设备铭牌信息出现缺陷。要对电力设备铭牌信息进行缺陷管理,首先需要收集现场的电力设备铭牌图像。本实施例中,运维人员使用多旋翼无人机搭载的高像素摄像机,对电力设备铭牌进行近距离图像获取。
步骤S2:文字检测和文字信息提取。文字检测是运用深度学习技术检测电力设备铭牌图像中的文字信息,框选出电力设备铭牌图像中所有的文字信息;文字信息提取是运用光学字符识别技术识别被框选出的文字信息,并将文字信息发送至资产管理系统中,建立对应的电力设备铭牌信息目录和缺陷管理目录。
步骤S3:对电力设备铭牌图像进行边缘检测,提取并形成二值化图像;将所述二值化图像中的被框选出的文字信息通过置零操作进行消除;对消除文字信息后的二值化图像进行网格检测,并通过置零操作进行消除网格线,得到消除文字和网格线后的二值化图像;
步骤S4:统计消除文字和网格线后的二值化图像中剩余数值为1的像素点数量,计算数值为1的像素点数量占图像总像素点数量的像素点百分比;根据像素点百分比对电力设备铭牌信息缺陷进行定级:根据像素点百分比对电力设备铭牌信息缺陷进行定级的标准为:当像素点百分比数值小于或等于20时,判断电力设备铭牌信息无受损或轻微受损;当像素点百分比数值大于20且小于或等于50时,判断电力设备铭牌信息中度受损;当像素点百分比数值大于50时,判断电力设备铭牌信息严重受损。
步骤S5:基于缺陷定级及缺陷情况描述,在资产管理系统中对电力设备铭牌进行缺陷上报并形成缺陷运维管理策略。缺陷运维管理策略包括:当电力设备铭牌信息无受损或轻微受损时,保持当前运维策略;当电力设备铭牌信息中度受损时,更改运维策略为加强巡视和保护,对缺陷信息进行修复,并在资产管理系统中进行登记上报缺陷信息;当电力设备铭牌信息严重受损时,更改运维策略为更换所述电力设备铭牌,并在资产管理系统中进行登记上报缺陷信息。
本实施例步骤S2中采用改进YOLOv5模型检测电力设备铭牌图像中的文字信息。如图2所示,改进YOLOv5模型包括输入端、主干网络、颈部网络、输出端四部分。输入端包括数据增强模块、自适应图像填充模块、自适应锚框计算模块,输入端将图像随机缩放、随机裁剪、随机排布。主干网络依次由第一CBH模块、第二CBH模块、第一C3模块、第三CBH模块、第二C3模块、第四CBH模块、第三C3模块、第五CBH模块、第四C3模块和SPPF模块组成。颈部网络包括第六CBH模块、第七CBH模块、第五C3模块、第六C3模块、第七C3模块、第八C3模块、第一CBAM 卷积注意力模块和第二CBAM 卷积注意力模块,SPPF模块输出的特征图进入第六CBH模块,第六CBH模块输出的特征图经上采样后与第四CBH模块输出的特征图进行特征融合,融合后的特征图经过第六C3模块、第七CBH模块处理;第七CBH模块输出的特征图经上采样后与第三CBH模块输出的特征图进行特征融合,然后送入第八C3模块,第八C3模块输出的特征图送入输出端卷积得到第一特征图输出;第八C3模块输出的特征图被第一CBAM 卷积注意力模块关注后与第七CBH模块输出的特征图进行特征融合,然后送入第七C3模块处理,第七C3模块输出的特征图送入输出端卷积得到第二特征图输出;第七C3模块输出的特征图被第二CBAM 卷积注意力模块关注后与第六CBH模块输出的特征图进行特征融合,然后送入第五C3模块处理,第五C3模块输出的特征图送入输出端卷积得到第三特征图输出。
本实施例中第一~第七CBH模块结构相同,为卷积层,CBH模块中封装分组卷积、BN层和Hardswish激活函数。改进YOLOv5模型使用C3 模块,简化了原有YOLOv5模型的Bottleneck CSP结构,使得模型捕获特征的能力增强;使用SPPF模块替换了SPP(空间金字塔池化)结构,使模型的前向计算和反向计算速度提升了约1.5倍。
本实施例颈部网络中采用了特征金字塔 FPN 与路径聚合网络 PAN 结合的结构,将常规的FPN层与自底向上的特征金字塔进行结合,将所提取的语义特征与位置特征进行融合,同时将主干层与检测层进行特征融合,使模型获取更加丰富的特征信息。
本实施例改进了颈部网络,在颈部网络中融合两个CBAM 卷积注意力模块, CBAM卷积注意力模块结合了特征通道和特征空间两个维度的注意力机制,包括通道注意力模块(CAM) 和空间注意力模块(SAM)。CBAM 卷积注意力模块同时关注了空间信息和通道信息,对网络中间的特征图进行重构,使模型更加关注重要的特征,提升模型的特征提取能力。CBAM 卷积注意力模块通过学习的方式自动获取每个特征通道的重要程度,此外还通过类似的学习方式自动获取每个特征空间的重要程度,并且利用得到的重要程度来提升特征并抑制对当前任务不重要的特征。CBAM 卷积注意力模块提取特征空间注意力的方式:通过通道注意力模块将经过通道重要性选择后的特征图送入特征空间注意力模块,和通道注意力模块类似,空间注意力是以通道为单位进行最大池化和平均池化,并将两者的结果进行结合,之后通过一个卷积计算降成 1×w×h的特征图空间权重,w为宽,h为高,再将特征图空间权重和输入特征进行点积,从而实现空间注意力机制。将 CBAM 卷积注意力模块融合在颈部网络,突出特征图中的重要信息,经过后面的进一步特征提取,预测输出不同大小特征图的目标检测结果,使得模型在检测不同尺度的文本时,更关注重要的文本特征和提升特征提取能力,从而提升文本的检测精度。
本实施例的颈部网络分为两部分,其中自底向上部分主要是通过上采样和更粗粒度的特征图融合来实现不同层次特征的融合,主要分以下几步:对最底层特征图进行上采样,得到更精细的特征图;将上采样后的特征图与上一层特征图进行融合,得到更丰富的特征表达;重复以上两个步骤,直到达到最高层。自顶向下部分主要是通过卷积融合来自不同层次的特征图,主要分以下几步:最顶层特征图经过CBAM 卷积注意力模块处理,得到更重要的特征表达;将处理后的特征图与采样前特征图进行融合,得到更丰富的特征表达;重复以上两个步骤,直到达到最底层。
本实施例使用Hardswish激活函数替换SiLU激活函数,原因是相较于SiLU函数,Hardswish激活函数用分段线性模拟代替了计算成本高的Sigmoid处理,Hardswish激活函数无上界、非饱和,避免了因饱和而导致梯度为0(梯度消失、梯度爆炸),进而导致训练速度大大下降;Hardswish激活函数有下界,在负半轴有较小的权重,可以防止函数出现的神经元坏死现象,同时可以产生更强的正则化效果;Hardswish激活函数自身本就具有自正则化效果,可以使梯度和函数本身更加平滑,且是每个点几乎都是平滑的,这就更容易优化而且也可以更好的泛化。随着网络越深,信息可以更深入的流动。Hardswish 激活函数公式定义如下。
Hardswish 激活函数分别考虑 3 种输入情况, x是输入值。
参照图3,本实施例步骤S2中采用的光学字符识别技术是基于CTC-Attention联合机制的场景文本识别模型,包括编码器和解码器两部分,编码器由卷积神经网络(ResNet)和双向长短时记忆网络构成,解码器采用联合机制网络和单向长短时记忆网络,待识别的文本图像经卷积神经网络(ResNet)提取特征图,最终得到特征序列,特征序列经过双向长短时记忆网络(Bi-LSTM网络)进行特征编码,输出编码特征序列;联合机制网络利用CTC-Attention联合机制进行训练,逐渐调整参数来优化基于CTC-Attention联合机制的场景文本识别模型;在解码器,通过单向长短时记忆网络(单向LSTM)中结合CTC-Attention联合机制对编码特征序列进行解码输出解码序列,最终生成文字。
序列标注:把特征图进行分割并按列切分,将分割后的特征图映射转换为一系列的向量序列,每个向量都具有/>维度,记为特征序列集合,/>表示第n个特征序列。从卷积神经网络中得到的特征序列之间包含着有用的上下文信息,对单词识别具有重要意义。为了扩大上下文特征,本实施例采用双向长短时记忆网络对特征序列集合/>双向序列分析,得到两个方向的长期依赖关系,输出相同长度的编码特征序列,记为/>,其中/>为/>向量序列的数目,/>表示第n个编码特征子序列。
CTC-Attention联合机制解码:本实施例采用局部Attention机制来替换全局Attention机制,并入CTC模块来进行集成,在最后层添加一个单向长短时记忆网络作为解码网络。联结CTC-Attention的方法,既可以通过Attention机制对当前位置之前的特征进行有效利用,又可以通过CTC机制计算全局概率对当前位置后的特征信息进行分析,可以充分利用特征信息。同时,CTC-Attention机制是通过在Attention模块中并入CTC模块,既加速了网络的收敛速度,又提高了网络的识别性能。双向长短时记忆网络标注后的编码特征序列,通过CTC-Attention联合机制下的解码网络解码,得到最终的解码序列,其中/>表示第k个解码子序列。具体细节如下:
给定的编码特征序列,隐变量/>,输出长度为/>的编码特征序列/>。其中,/>为第t个编码序列隐变量,/>为编码序列个数,/>为字符个数,/>为包含所有字符的字典,/>为第/>个编码特征子序列,blank表示空。CTC模块认为标签之间为独立的,利用贝叶斯定理预测序列后验概率分布:
式中为字符级别的语言模型,/>是由输入的特征序列估计的隐变量概率,/>代表通过上一时刻输出的隐变量对下一时刻的隐变量预测的条件概率,X表示文本特征序列,Y表示字母序列。因为CTC模块局限于对局部信息进行预测,没有考虑整体全局信息,所以无法有效预测长文本序列。
基于CTC-Attention的解码算法既有效解决了纯粹的数据驱动方法对长序列输入难以训练的弊端,又可以充分对长字符提取信息。故CTC-Attention预测的联合概率为:
基于CTC-Attention联合机制的场景文本识别模型是对多任务进行端到端的训练,以最大化联合概率转化为最小化多任务损失函数:
本实施例步骤S3采用Canny算子对电力设备铭牌图像进行边缘检测,过程如下:
加权灰度化,灰度计算公式如下所示:
其中k(x,y)表示(x,y)像素点的灰度值,kR、kG、kB分别表示该点RGB分量值。
高斯平滑滤波,滤波是为了去除噪声,一个大小为(2k+1)×(2k+1)的高斯滤波器核的生成方程式如下式所示:
计算电力设备铭牌图像的梯度幅值M(i,j)和梯度方向H(i,j):
其中kx、 ky是像素点在x、y方向上的梯度, k(x,y)为像素点坐标为(x,y)的点的像素灰度值。
对所有电力设备铭牌图像沿梯度方向的梯度幅值应用非极大值抑制,具体是用3×3窗口在8个方向的领域对M(i,j)的所有电力设备铭牌图像沿梯度方向进行梯度幅值的插值;对经过非极大值抑制的梯度幅值采用双阈值算法检测和连接边缘,用高阈值Hth和低阈值Lth对经过非极大值抑制的梯度幅值处理,分割得到高阈值边缘图像和低阈值边缘图像,并连接高阈值边缘图像和低阈值边缘图像。
其中高阈值Hth和低阈值Lth通过迭代的方法获取,具体步骤如下:
1)通过统计灰度直方图得到初始阈值T0。
其中,v为迭代次数,Zmax为图像中的最大灰度值,Zmin为图像中的最小灰度值,Tv为第v次迭代的阈值。
2)用阈值Tv将图像分为大于等于阈值Tv的图像H1的和小于阈值Tv的图像H2,其中:
f(x,y)为横纵坐标分别为x、y的像素点的灰度值。
3)分别计算H1的灰度值M1和H2的灰度值M2。
f(i,j)为图像中坐标为(i,j)的像素点的灰度值,NH(i,j)为在图像H1中灰度值大于Tv像素点的个数、NL(i,j)为在图像H2中灰度值小于Tv像素点的个数。
式中NH(i,j)、NL(i,j)分别满足:
4)计算第v+1次迭代的阈值Tv+1:
5)当满足Tv= Tv+1时,则以M1作为边缘检测中的高阈值Hth,以M2作为边缘检测中的低阈值Lth。
具体地,在步骤S2中,改进YOLOv5模型对电力设备铭牌图像中的文字信息按训练模型得到的权重文件进行检测,检测结果为若干个矩形框,将电力设备铭牌图像中的文字信息进行框选和裁剪,然后基于CTC-Attention联合机制的场景文本识别模型对矩形框内的文字信息进行识别提取。本实施例步骤S3所指将所述二值化图像中的被框选出的文字信息通过置零操作进行消除是;首先计算改进YOLOv5模型的检测结果坐标并记录,某矩形框中心点坐标为(x1,y1),矩形框长度和宽度分别为l个像素点和h个像素点,然后记录基于CTC-Attention联合机制的场景文本识别模型所识别目标的坐标,文字信息中某个像素点在矩阵框中的坐标为(x2,y2),则对应所述二值化图像中点(x1+x2-l/2,y1+y2-h/2)的像素值置零。
本实施例步骤S3采用霍夫直线检测对消除处理后的二值化图像进行网格检测:首先进行形态学开运算,即先进行腐蚀操作,再进行膨胀操作,用于去除二值化图像中的小型噪声点、断裂和细小的物体,并平滑物体边缘,然后进行直线检测,最后对所检测的直线进行消除处理。
先对经过消除文字信息以及二值化处理后的图像进行腐蚀操作,通过去除较小的物体和平滑物体边缘来实现噪声去除。再对前一步骤中腐蚀操作后的图像进行膨胀操作,通过填补空洞和连接物体来弥补腐蚀操作的影响。然后利用霍夫直线检测技术对前一步骤中膨胀操作后的图像进行直线检测,检测直线像素长度小于阈值15的视为图像噪声或者电力设备铭牌的划痕,检测直线像素长度大于阈值15的视为电力设备铭牌上的网格线。最后将前一步骤中所检测的网格线进行消除操作。
腐蚀操作是数字图像处理中的一种基本形态学操作,其目的是缩小或者消除二值化图像中物体的边界。在这个操作中,每个像素的值将被替换为它与其相邻像素的最小值。这个操作通常被用来去除小的噪声物体,平滑物体边缘以及分离连接的物体。首先将一个称为“结构元素”的小矩阵放在图像上的每个像素处。然后,将结构元素的中心与该像素对齐,计算结构元素与该像素的交集。如果结构元素中的所有元素都包含在图像中且都有相应的像素值,那么该像素将保留,否则它将被视为噪声并消除。这个过程将被重复应用到整个图像上,直到整个图像都被处理完毕。
膨胀操作是数字图像处理中的一种基本形态学操作,其目的是扩大或者增强二值化图像中物体的边界。在这个操作中,每个像素的值将被替换为它与其相邻像素的最大值。这个操作通常被用来填充物体的空洞,连接分离的物体,增强物体边缘等。首先将一个称为“结构元素”的小矩阵放在图像上的每个像素处。然后,将结构元素的中心与该像素对齐,计算结构元素与该像素的并集。如果结构元素中的任何一个元素与图像中的一个像素匹配,则该像素将保留,否则它将被视为噪声并消除。这个过程将被重复应用到整个图像上,直到整个图像都被处理完毕。
霍夫直线检测(Hough Line Transform)是一种在数字图像处理中用于检测直线的技术。它通过在极坐标空间中投票来找出一张二值化图像中的直线。霍夫直线检测的基本思路是将每个像素点在极坐标系中表示为一条直线,进而在极坐标空间中建立一个累加器(accumulator),每当一个像素点在极坐标系上落在一条直线上时,就在累加器相应的位置上加上一个投票。最终,通过在累加器中找到投票最多的位置,就可以确定在原始图像中存在的直线。
本实施例中,消除网格线是指:记录霍夫直线检测所检测为直线的像素点,在消除文字信息后的二值化图像中对直线的像素点进行置零操作。
本发明还提供了如图4所示的一种基于机器视觉的电力设备铭牌信息缺陷等级判断装置,包括:
图像获取模块,用于获取电力设备铭牌图像,由多旋翼无人机和其搭载的高像素摄像机组成;
检测和识别模块,用于检测和识别电力设备铭牌图像中的文字信息,并将所述文字信息发送至管理模块;
缺陷等级判断模块,用于处理电力设备铭牌图像,并根据电力铭牌信息缺陷等级判断方法对所述电力设备铭牌信息缺陷进行等级判断;
管理模块,用于接收检测和识别模块传送的文字信息,用于根据缺陷情况描述和缺陷等级判断,在资产管理系统中进行对应电力设备铭牌信息缺陷上报并形成缺陷运维管理策略,建立电力设备铭牌信息目录和缺陷管理目录。
本发明实施例所提供的基于机器视觉的电力设备铭牌信息缺陷等级判断装置可执行本发明任意实施例所提供的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,具备执行方法相应的功能模块和有益效果。
本实施例提供一种基于机器视觉的电力设备铭牌信息缺陷等级判断设备,其中,包括:一个或多个处理器;存储器,用于存储一个或多个程序,存储器作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的基于机器视觉的电力设备铭牌信息缺陷等级判断方法对应的程序指令/模块。处理器通过运行存储在存储器中的软件程序、指令以及模块,从而执行本发明实施例所提供的基于机器视觉的电力设备铭牌信息缺陷等级判断方法。
存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至企业级资产管理系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任意一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法。
计算机可执行指令在由计算机处理器执行时用于执行一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法,该方法包括:获取现场电力设备铭牌图像;检测并识别电力设备铭牌图像上的文字信息;对电力设备铭牌图像进行边缘检测及二值化处理;将所识别提取的文字在边缘检测及二值化处理后的电力设备铭牌图像中消除;对所消除文字信息后的电力设备铭牌图像进行网格检测;消除电力设备铭牌图像上的网格线;根据所处理完成后的电力设备铭牌图像剩余像素点占图像总像素点比例,对电力设备铭牌信息进行缺陷定级,并在资产管理系统中进行缺陷上报并形成缺陷运维管理策略。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的基于机器视觉的电力设备铭牌信息缺陷等级判断方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整、相互结合和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (9)
1.一种基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,包括:获取电力设备铭牌图像;运用深度学习技术检测电力设备铭牌图像中的文字信息,框选出电力设备铭牌图像中所有的文字信息;运用光学字符识别技术识别被框选出的文字信息,并将文字信息发送至资产管理系统中,建立对应的电力设备铭牌信息目录和缺陷管理目录;
对电力设备铭牌图像进行边缘检测,提取并形成二值化图像;将所述二值化图像中的被框选出的文字信息通过置零操作进行消除;对消除文字信息后的二值化图像进行网格检测,并通过置零操作进行消除网格线,得到消除文字和网格线后的二值化图像;
统计消除文字和网格线后的二值化图像中剩余数值为1的像素点数量,计算数值为1的像素点数量占图像总像素点数量的像素点百分比;根据像素点百分比对电力设备铭牌信息缺陷进行定级;
基于缺陷定级及缺陷情况描述,在资产管理系统中对电力设备铭牌进行缺陷上报并形成缺陷运维管理策略;
其中,采用改进YOLOv5模型检测电力设备铭牌图像中的文字信息,改进YOLOv5模型包括输入端、主干网络、颈部网络、输出端四部分;输入端包括数据增强模块、自适应图像填充模块、自适应锚框计算模块,输入端将图像随机缩放、随机裁剪、随机排布;主干网络依次由第一CBH模块、第二CBH模块、第一C3模块、第三CBH模块、第二C3模块、第四CBH模块、第三C3模块、第五CBH模块、第四C3模块和SPPF模块组成;颈部网络包括第六CBH模块、第七CBH模块、第五C3模块、第六C3模块、第七C3模块、第八C3模块、第一CBAM 卷积注意力模块和第二CBAM 卷积注意力模块,SPPF模块输出的特征图进入第六CBH模块,第六CBH模块输出的特征图经上采样后与第四CBH模块输出的特征图进行特征融合,融合后的特征图经过第六C3模块、第七CBH模块处理;第七CBH模块输出的特征图经上采样后与第三CBH模块输出的特征图进行特征融合,然后送入第八C3模块,第八C3模块输出的特征图送入输出端卷积得到第一特征图输出;第八C3模块输出的特征图被第一CBAM 卷积注意力模块关注后与第七CBH模块输出的特征图进行特征融合,然后送入第七C3模块处理,第七C3模块输出的特征图送入输出端卷积得到第二特征图输出;第七C3模块输出的特征图被第二CBAM 卷积注意力模块关注后与第六CBH模块输出的特征图进行特征融合,然后送入第五C3模块处理,第五C3模块输出的特征图送入输出端卷积得到第三特征图输出。
2.根据权利要求1所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,根据像素点百分比对电力设备铭牌信息缺陷进行定级的标准为:当像素点百分比数值小于或等于20时,判断电力设备铭牌信息无受损或轻微受损;当像素点百分比数值大于20且小于或等于50时,判断电力设备铭牌信息中度受损;当像素点百分比数值大于50时,判断电力设备铭牌信息严重受损。
3.根据权利要求1所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,所述缺陷运维管理策略包括:当电力设备铭牌信息无受损或轻微受损时,保持当前运维策略;当电力设备铭牌信息中度受损时,更改运维策略为加强巡视和保护,对缺陷信息进行修复,并在资产管理系统中进行登记上报缺陷信息;当电力设备铭牌信息严重受损时,更改运维策略为更换所述电力设备铭牌,并在资产管理系统中进行登记上报缺陷信息。
4.根据权利要求1所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,采用的光学字符识别技术是基于CTC-Attention联合机制的场景文本识别模型。
5.根据权利要求4所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,改进YOLOv5模型对电力设备铭牌图像中的文字信息按训练模型得到的权重文件进行检测,检测结果为若干个矩形框,将电力设备铭牌图像中的文字信息进行框选和裁剪,然后基于CTC-Attention联合机制的场景文本识别模型对矩形框内的文字信息进行识别提取;将所述二值化图像中的被框选出的文字信息通过置零操作进行消除是:首先计算改进YOLOv5模型的检测结果坐标并记录,某矩形框中心点坐标为(x 1 ,y 1 ),矩形框长度和宽度分别为l个像素点和h个像素点,然后记录基于CTC-Attention联合机制的场景文本识别模型所识别目标的坐标,文字信息中某个像素点在矩阵框中的坐标为(x 2 ,y 2 ),则对应所述二值化图像中点(x 1 +x 2 -l/2,y 1 +y 2 -h/2)的像素值置零。
6.根据权利要求1所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,采用霍夫直线检测对消除处理后的二值化图像进行网格检测。
7.根据权利要求1所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,其特征在于,消除网格线是指:记录霍夫直线检测所检测为直线的像素点,在消除文字信息后的二值化图像中对直线的像素点进行置零操作。
8.一种基于机器视觉的电力设备铭牌信息缺陷等级判断装置,其特征在于,基于权利要求1-7任意一项所述的基于机器视觉的电力设备铭牌信息缺陷等级判断方法,所述电力设备铭牌信息缺陷等级判断装置包括:
图像获取模块,用于获取电力设备铭牌图像,由多旋翼无人机和其搭载的高像素摄像机组成;
检测和识别模块,用于检测和识别电力设备铭牌图像中的文字信息,并将所述文字信息发送至管理模块;
缺陷等级判断模块,用于处理电力设备铭牌图像,并根据电力铭牌信息缺陷等级判断方法对所述电力设备铭牌信息缺陷进行等级判断;
管理模块,用于接收检测和识别模块传送的文字信息,用于根据缺陷情况描述和缺陷等级判断,在资产管理系统中进行对应电力设备铭牌信息缺陷上报并形成缺陷运维管理策略,建立电力设备铭牌信息目录和缺陷管理目录。
9.一种基于机器视觉的电力设备铭牌信息缺陷等级判断设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其特征在于,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1-7任意一项所述基于机器视觉的电力设备铭牌信息缺陷等级判断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310370792.0A CN116110036B (zh) | 2023-04-10 | 2023-04-10 | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310370792.0A CN116110036B (zh) | 2023-04-10 | 2023-04-10 | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116110036A CN116110036A (zh) | 2023-05-12 |
CN116110036B true CN116110036B (zh) | 2023-07-04 |
Family
ID=86256427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310370792.0A Active CN116110036B (zh) | 2023-04-10 | 2023-04-10 | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116110036B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116563875B (zh) * | 2023-07-05 | 2023-09-08 | 四川集鲜数智供应链科技有限公司 | 一种具有加密功能的智能图文识别方法及系统 |
CN117409400A (zh) * | 2023-10-18 | 2024-01-16 | 无锡九霄科技有限公司 | 基于深度学习网络的复杂条件字符识别方法 |
CN117291911B (zh) * | 2023-11-24 | 2024-02-09 | 山东通广电子股份有限公司 | 一种用于电力设备的缺陷检测方法及系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647784A (zh) * | 2018-06-27 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种基于深度学习的设备资产管理的方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210370993A1 (en) * | 2020-05-27 | 2021-12-02 | University Of South Carolina | Computer vision based real-time pixel-level railroad track components detection system |
CN112446370B (zh) * | 2020-11-24 | 2024-03-29 | 东南大学 | 一种电力设备铭牌文本信息识别的方法 |
CN115063337A (zh) * | 2021-03-08 | 2022-09-16 | 中国石油化工股份有限公司 | 埋地管道智能维修决策方法及装置 |
CN115841669A (zh) * | 2022-09-30 | 2023-03-24 | 国网山西省电力公司大同供电公司 | 一种基于深度学习技术的指针式仪表检测与示数识别方法 |
CN115861768A (zh) * | 2022-12-23 | 2023-03-28 | 江苏大学 | 一种基于改进YOLOv5的金银花目标检测及采摘点定位方法 |
-
2023
- 2023-04-10 CN CN202310370792.0A patent/CN116110036B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647784A (zh) * | 2018-06-27 | 2020-01-03 | 中国移动通信集团浙江有限公司 | 一种基于深度学习的设备资产管理的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN116110036A (zh) | 2023-05-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116110036B (zh) | 基于机器视觉的电力铭牌信息缺陷等级判断方法及装置 | |
CN109902622B (zh) | 一种用于登机牌信息验证的文字检测识别方法 | |
CN114022432B (zh) | 基于改进的yolov5的绝缘子缺陷检测方法 | |
US11475681B2 (en) | Image processing method, apparatus, electronic device and computer readable storage medium | |
CN112597815A (zh) | 一种基于Group-G0模型的合成孔径雷达图像舰船检测方法 | |
CN110689012A (zh) | 一种端到端的自然场景文本识别方法及系统 | |
CN111079821A (zh) | 一种脱轨自动制动拉环脱落故障图像识别方法 | |
CN113255837A (zh) | 工业环境下基于改进的CenterNet网络目标检测方法 | |
CN110210433B (zh) | 一种基于深度学习的集装箱箱号检测与识别方法 | |
CN114782391A (zh) | 少样本工业图像缺陷检测模型构建方法、系统及装置 | |
CN114841972A (zh) | 基于显著性图和语义嵌入特征金字塔的输电线路缺陷识别方法 | |
CN114359088A (zh) | 一种对视频特定目标人物进行打码处理的方法 | |
CN111462090A (zh) | 一种多尺度图像目标检测方法 | |
CN110659572A (zh) | 基于双向特征金字塔的视频动作检测方法 | |
CN113223011B (zh) | 基于引导网络和全连接条件随机场的小样本图像分割方法 | |
CN114581932A (zh) | 一种图片表格线提取模型构建方法及图片表格提取方法 | |
CN107886093B (zh) | 一种字符检测方法、系统、设备及计算机存储介质 | |
CN111507279B (zh) | 一种基于UNet++网络的掌纹识别方法 | |
CN110991374B (zh) | 一种基于rcnn的指纹奇异点检测方法 | |
CN112418229A (zh) | 一种基于深度学习的无人船海上场景图像实时分割方法 | |
CN112614094B (zh) | 基于序列状态编码的绝缘子串异常定位识别方法 | |
CN114463734A (zh) | 文字识别方法、装置、电子设备及存储介质 | |
CN115019321A (zh) | 一种文本识别、模型训练方法、装置、设备及存储介质 | |
CN113793327A (zh) | 一种基于token的高铁异物检测方法 | |
CN114529894A (zh) | 一种融合空洞卷积的快速场景文本检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |