CN112102298A - 图像识别方法及装置、电子设备和存储介质 - Google Patents
图像识别方法及装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN112102298A CN112102298A CN202010983194.7A CN202010983194A CN112102298A CN 112102298 A CN112102298 A CN 112102298A CN 202010983194 A CN202010983194 A CN 202010983194A CN 112102298 A CN112102298 A CN 112102298A
- Authority
- CN
- China
- Prior art keywords
- image
- dropper
- pixel point
- probability
- wire clamp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种图像识别方法及装置、电子设备和存储介质。该方法包括:获取第一图像,所述第一图像中包括吊弦;根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦中与所述承力索吊弦线夹连接的部分;根据所述目标图像,确定所述吊弦是否断裂。
Description
技术领域
本申请涉及图像识别技术领域,具体涉及一种图像识别方法及装置、电子设备和存储介质。
背景技术
接触网吊弦缺陷检测技术在工业中的很多领域都有重要应用,特别是在高铁领域,接触网吊弦缺陷检测技术能够有效的保护乘客的出行安全。
但是,对接触网吊弦缺陷检测的建模是很困难,主要是吊弦缺陷的数据数量比较少,且同样的吊弦在不同的场景下,其呈现的特征也不相同。目前主要通过借助于特殊的硬件检测设备进行接触网吊弦缺陷检测。比如,通过两端的线激光器的光照射在待检测锚段吊弦上形成一亮光区域,工业相机接收待检测锚段吊弦的反射光并形成图像,并将该图像传输至系统控制器,通过系统控制器对图像进行分析,以实现对接触网吊弦进行缺陷检测。
因此,目前对接触网吊弦进行缺陷检测,需要借助于特殊的硬件设备,成本较高。
发明内容
本申请实施例提供了一种图像识别方法及装置、电子设备和存储介质。通过从第一图像中截取目标图像进行吊弦断裂检测,降低了吊弦缺陷检测的成本。
第一方面,本申请实施例提供一种图像识别方法,包括:
获取第一图像,所述第一图像中包括吊弦;
根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦中与所述承力索吊弦线夹连接的部分;
根据所述目标图像,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第二图像,所述承力索吊弦线夹为第一承力索吊弦线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第一像素点,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像。
在一些可能的实施方式中,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
根据所述第一概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第三图像,所述承力索吊弦线夹为第二承力索吊弦线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第二像素点,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第二图像和第三图像,所述承力索吊弦线夹包括第一承力索吊弦线夹和第二承力索线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第一像素点和第二像素点,其中,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第一概率和所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述根据所述第一概率和所述第二概率,确定所述吊弦是否断裂,包括:
确定所述第一概率和所述第二概率中的最大概率;
根据所述最大概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述根据所述第一像素点,从所述第一图像中截取出所述第二图像,包括:
从所述第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到所述第二图像。
在一些可能的实施方式中,所述根据所述第二像素点,从所述第一图像中截取出所述第三图像,包括:
从所述第一像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到所述第三图像。
在一些可能的实施方式中,所述第一图像为原始图像或者对所述原始图像进行目标检测得到的,其中,所述原始图像为对高铁线路进行拍摄得到的,且在所述第一图像为对所述原始图像进行目标检测得到的情况下,在获取第一图像之前,所述方法还包括:
对所述原始图像进行目标检测,得到至少一个候选框;
对每个所述候选框对应的物体进行识别,得到所述吊弦所在的候选框;
对所述吊弦所在的候选框中的图像进行截取,得到所述第一图像。
第二方面,本申请实施例提供一种图像识别装置,包括:
收发单元,用于获取第一图像,所述第一图像中包括吊弦;
处理单元,用于根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦的一部分与所述承力索吊弦线夹连接的部分;
所述处理单元,还用于根据所述目标图像,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第二图像,所述承力索吊弦线夹为第一承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,所述处理单元,具体用于:
对所述第一图像进行关键点检测,得到第一像素点,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,所述处理单元,具体用于:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
根据所述第一概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第三图像,所述承力索吊弦线夹为第二承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,所述处理单元,具体用于:
对所述第一图像进行关键点检测,得到第二像素点,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,所述处理单元,具体用于:
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,目标图像包括第二图像和第三图像,所述承力索吊弦线夹包括第一承力索吊弦线夹和第二承力索线夹,在根据所述第一图像,得到目标图像方面,所述处理单元,具体用于:
对所述第一图像进行关键点检测,得到第一像素点和第二像素点,其中,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,所述处理单元,具体用于:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第一概率和所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一概率和所述第二概率,确定所述吊弦是否断裂方面,所述处理单元,具体用于:
确定所述第一概率和所述第二概率中的最大概率;
根据所述最大概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一像素点,从所述第一图像中截取出所述第二图像方面,所述处理单元,具体用于:
从所述第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到所述第二图像。
在一些可能的实施方式中,在根据所述第二像素点,从所述第一图像中截取出所述第三图像方面,所述处理单元,具体用于:
从所述第一像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到所述第三图像。
在一些可能的实施方式中,所述第一图像为原始图像或者对所述原始图像进行目标检测得到的,其中,所述原始图像为对高铁线路进行拍摄得到的,且在所述第一图像为对所述原始图像进行目标检测得到的情况下,在获取第一图像之前,所述处理单元,还用于对所述原始图像进行目标检测,得到至少一个候选框;对每个所述候选框对应的物体进行识别,得到所述吊弦所在的候选框;对所述吊弦所在的候选框中的图像进行截取,得到所述第一图像。
第三方面,本申请实施例提供一种电子设备,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如第一方面所述的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序使得计算机执行如第一方面所述的方法。
第五方面,本申请实施例提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机可操作来使计算机执行如第一方面所述的方法。
实施本申请实施例,具有如下有益效果:
可以看出,在本申请实施例中,通过从第一图像中截取出目标图像,对目标图像进行识别,可确定出吊弦是否断裂,无需借助特殊的设备,降低对吊弦缺陷检测的成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种图像识别方法的流程示意图;
图2为本申请实施例提供的一种吊弦的示意图;
图3为本申请实施例提供的一种神经网络的示意图;
图4为本申请实施例提供的一种图像识别装置的结构示意图;
图5为本申请实施例提供的一种电子设备的功能单元组成框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1为本申请实施例提供的一种图像识别方法的流程示意图。该方法应用图像识别装置。本实施例的方法包括以下步骤:
101:获取第一图像,其中,所述第一图像中包括吊弦。
其中,该吊弦是该第一图像中的一个完整的吊弦。
示例性的,该第一图像为原始图像或者对第一图像进行目标检测得到的。比如,对该原始图像进行目标检测,得到至少一个候选框;然后,对每个候选框对应的物体进行分类,得到该吊弦所在的候选框,对吊弦所在的候选框中的图像进行截取,得到该第一图像。
其中,对原始图像进行目标检测可以通过已有的模型实现,比如,可以通过FasterR-CNN模型、SSD模型或者YOLO模型对原始图像进行目标检测;对物体进行分类识别可以通过已有的网络模型实现,比如,可以通过卷积网络对物体进行分类。
其中,该原始图像是通过对高铁线路进行拍摄得到的。该原始图像中包括有吊弦,当然,该原始图像中也可能包含有其他物体。
102:根据所述第一图像,得到目标图像,所述目标图像中包括所述吊弦的一部分,所述一部分为所述吊弦中与承力索吊弦线夹连接的部分。
示例性的,对该第一图像截取,可得到该目标图像。具体地,对该第一图像进行截图主要是以承力索吊弦线夹为中心对该吊弦的上端的附近区域进行截取和/或下端的附近区域进行截取,得到该目标图像。因此,该目标图像中包含有该吊弦的一部分,也就是包含有该吊弦中与承力索吊弦线夹所连接的一部分。
示例性的,在该目标图像包括第二图像的情况下,该承力索吊弦线夹为第一承力索吊弦线夹,可对该第一图像进行关键点检测,得到第一像素点,该第一像素点为第一承力索吊弦线夹在该第一图像中对应的像素点,该第一承力索吊弦线夹为该吊弦的上端所连接的承力索吊弦线夹。示例性的,该第一像素点可以为该第一承力索吊弦线夹的中心位置所对应的像素点,也可为第一承力索吊弦线夹的最左端或者左右端对应的像素点。然后,根根据该第一像素点从该第一图像中截取出第二图像。
示例性的,在该目标图像包括第三图像的情况下,该承力索吊弦线夹为第二承力索吊弦线夹,则可对该第一图像进行关键点检测,得到第二像素点,该第二像素点为第二承力索吊弦线夹在该第一图像中对应的像素点,该第二承力索吊弦线夹为该吊弦的下端所连接的承力索吊弦线夹。示例性的,该第二像素点可以为该第二承力索吊弦线夹的中心位置所对应的像素点,也可为第二承力索吊弦线夹的最左端或者左右端对应的像素点。然后,根根据该第二像素点从该第一图像中截取出第三图像。
示例性的,在该目标图像包括第二图像和第三图像的情况下,则该承力索吊弦线包括第一承力索吊弦线夹和第二承力索吊弦线夹,可对该第一图像进行关键点检测,得到该第一像素点和该第二像素点;然后,根据该第二像素点和第三像素点,分别从该第一图像中截取出该第二图像和该第三图像。
示例性的,可以从该第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到该第二图像。其中,该第一数量、第二数量以及第三数量可以相同,也可以不同,本申请对此不做限定。此外,可以从该第二像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到该第三图像。其中,该第四数量、第五数量以及第六数量可以相同,也可以不同,本申请对此不做限定。
如图2所示,通过关键点检测,得到该第一像素点和该第二像素点,该第一像素点和第二像素点分别为该第一承力索吊弦线夹和第二承力索吊弦线夹的中心位置对应的像素点;然后,按照上述的截取方式,根据第一像素点和第二像素点从该第一图像中分别截取出第二图像和第三图像。
下面以第一像素点为例,说明对第一图像进行关键点检测的实现过程,对第二像素点的检测与该第一像素点类似,不再叙述。
示例性的,对该第一图像进行特征提取,得到第四特征图;然后,对该第四特征图进行反卷积处理,得到第五特征图,其中,该第五特征图的维度与该第一图像的维度相同;根据该第五特征图进行关键点预测,得到第一像素坐标;根据该第一像素坐标,确定该第一像素点。
103:根据所述目标图像,确定所述吊弦是否断裂。
示例性的,对该目标图像进行特征提取,得到目标特征图;根据该目标特征图,得到吊弦断裂的概率;根据该概率确定该吊弦是否断裂。比如,在该概率大于阈值(比如,0.5)的情况下,则确定该吊弦断裂。
在该目标图像为第二图像的情况下,可对该第二图像进行特征提取,得到第一特征图;根据该第一特征图,得到吊弦断裂的第一概率;根据该第一概率,确定该吊弦是否断裂。
在该目标图像为第三图像的情况下,可对该第三图像进行特征提取,得到第二特征图;根据该第二特征图,得到吊弦断裂的第二概率;根据该第二概率,确定该吊弦是否断裂。
在该目标图像包括第二图像和第三图像的情况,分别确定出该第一概率和第二概率;根据该第一概率和该第二概率,确定该吊弦是否断裂。示例性的,可确定该第一概率和该第二概率中的最大概率,根据该最大概率,确定该吊弦是否断裂。
在实际应用中,还可以对该第一概率和第二概率进行加权处理或者线性处理或非线性处理,得到目标概率,并根据该目标概率确定吊弦是否断裂。
可以看出,在本申请实施例中,通过截取出目标图像,对目标图像进行识别,可确定出吊弦是否断裂,从而无需借助特殊的设备,降低对吊弦缺陷检测的成本;此外,吊弦断裂,由于重力因素,吊弦的承力绳索会掉下来,造成第二像素点附近区域的图像与正常吊弦(未断裂的吊弦)图像不同。此外,若吊弦断裂是发生在吊弦的载流环处,比如,吊弦上端的载流环处发生断裂,载流环处的绳索会掉落,这样会导致第一像素点附近区域的图像与正常吊弦图像不同。因此,本申请中通过获取目标图像,在吊弦断裂的情况下,可以准确地获取到异常区域的局部图像,相比于用整个吊弦图像进行断裂检测,通过先验知识主动去除了图像中的一些无用信息,可以提高确定吊弦是否断裂的精确度。
在一些可能的实施方式中,识别吊弦是否断裂可通过神经网络实现。如图3所示,该神经网络包括第一网络、第二网络以及第三网络。其中,该第一网络用于对原始图像目标检测,确定吊弦所在的区域,得到该第一图像;第二网络用于对该第一图像进行关键点检测,得到该目标图像;第三网络用于对该目标图像进行分类,确定该吊弦是否断裂。
由于该第一网络、第二网络和第三网络之间所要达到的目的差异性较大。因此,可对该第一网络、第二网络和第三网络单独进行训练,在训练完成后,将该第一网络、第二网络和第三网络进行联调,组成该神经网络。
下面详细叙述对这三个网络的训练过程。
示例性的,获取吊弦图像样本,其中,该吊弦图像样本中的吊弦可以为正常的吊弦,也可以为断裂的吊弦,本申请对此不做限定;将该吊弦图像样本输入到第一网络,得到预测的吊弦区域坐标;根据该预测的吊弦区域坐标与实际的吊弦区域坐标,调整该第一网络的网络参数的参数值,得到该第一网络。
另外,在对该第一网络进行训练之前,可使用亮度调节、翻转、多尺度等数据增广方式对样本进行扩充,得到数量较多的吊弦图像样本。在训练的过程中,可通过在线难例挖掘技术对第一网络进行训练,以提高第一网络的识别精度。
示例性的,获取第二吊弦图像样本,其中,该第二吊弦图像样本中的吊弦可以为正常的吊弦,也可以为断裂的吊弦,本申请对此不做限定;将该第二吊弦图像样本输入到该第二网络,得到预测的承力索吊弦线夹的像素坐标;根据该预测的承力索吊弦线夹的像素坐标与实际的承力索吊弦线夹的像素坐标,调整该第二网络的网络参数的参数值,得到该第二网络。
示例性的,获取第三图像样本,该第三图像样本可以为正样本或负样本,该第三图像样本是从原始图像中截取出的局部图像样本,其中,具体的截取方式与截取第二图像或第三图像的方式类似,不再叙述;将该第三图像样本输入到该第三网络,得到该第三图像样本中的吊弦断裂的概率;根据该概率以及该第三图像样本中的吊弦的实际情况,调整该第三网络的网络参数的参数值。
需要说明,由于实际中吊弦断裂的图像极少。因此,在对第三网络进行训练之前,需要对第三图像样本的数量进行扩充,比如,可以对正常的图像样本进行修改(比如,PS),得到吊弦断裂的样本。因为,第三图像样本只是局部图像,更利于图像修改,得到数量较多的第三图像样本,解决了现有技术中吊弦断裂的图像样本缺少的问题。
参阅图4,图4本申请实施例提供的一种图像识别装置的功能单元组成框图。电子设备400包括:收发单元401和处理单元402,其中:
收发单元401,用于获取第一图像,所述第一图像中包括吊弦;
处理单元402,用于根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦的一部分与所述承力索吊弦线夹连接的部分;
处理单元402,还用于根据所述目标图像,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第二图像,所述承力索吊弦线夹为第一承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,处理单元401,具体用于:
对所述第一图像进行关键点检测,得到第一像素点,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理单元402,具体用于:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
根据所述第一概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第三图像,所述承力索吊弦线夹为第二承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,处理单元402,具体用于:
对所述第一图像进行关键点检测,得到第二像素点,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理单元402,具体用于:
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,目标图像包括第二图像和第三图像,所述承力索吊弦线夹包括第一承力索吊弦线夹和第二承力索线夹,在根据所述第一图像,得到目标图像方面,处理单元402,具体用于:
对所述第一图像进行关键点检测,得到第一像素点和第二像素点,其中,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理单元402,具体用于:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第一概率和所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一概率和所述第二概率,确定所述吊弦是否断裂方面,处理单元402,具体用于:
确定所述第一概率和所述第二概率中的最大概率;
根据所述最大概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一像素点,从所述第一图像中截取出所述第二图像方面,处理单元402,具体用于:
从所述第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到所述第二图像。
在一些可能的实施方式中,在根据所述第二像素点,从所述第一图像中截取出所述第三图像方面,处理单元402,具体用于:
从所述第一像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到所述第三图像。
在一些可能的实施方式中,所述第一图像为原始图像或者对所述原始图像进行目标检测得到的,其中,所述原始图像为对高铁线路进行拍摄得到的,且在所述第一图像为对所述原始图像进行目标检测得到的情况下,在获取第一图像之前,处理单元402,还用于对所述原始图像进行目标检测,得到至少一个候选框;对每个所述候选框对应的物体进行识别,得到所述吊弦所在的候选框;对所述吊弦所在的候选框中的图像进行截取,得到所述第一图像。
参阅图5,图5为本申请实施例提供的一种电子设备的结构示意图。如图5所示,电子设备500包括收发器501、处理器502和存储器503。它们之间通过总线504连接。存储器503用于存储计算机程序和数据,并可以将存储503存储的数据传输给处理器502。
处理器502用于读取存储器503中的计算机程序执行以下操作:
获取第一图像,所述第一图像中包括吊弦;
根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦中与所述承力索吊弦线夹连接的部分;
根据所述目标图像,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第二图像,所述承力索吊弦线夹为第一承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,处理器502,具体用于执行以下操作:
对所述第一图像进行关键点检测,得到第一像素点,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理器502,具体用于执行以下操作:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
根据所述第一概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,所述目标图像包括第三图像,所述承力索吊弦线夹为第二承力索吊弦线夹,在根据所述第一图像,得到目标图像方面,处理器502,具体用于执行以下操作:
对所述第一图像进行关键点检测,得到第二像素点,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理器502,具体用于执行以下操作:
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,目标图像包括第二图像和第三图像,所述承力索吊弦线夹包括第一承力索吊弦线夹和第二承力索线夹,在根据所述第一图像,得到目标图像方面,处理器502,具体用于执行以下操作:
对所述第一图像进行关键点检测,得到第一像素点和第二像素点,其中,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
在一些可能的实施方式中,在根据所述目标图像,确定所述吊弦是否断裂方面,处理器502,具体用于执行以下操作:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第一概率和所述第二概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一概率和所述第二概率,确定所述吊弦是否断裂方面,处理器502,具体用于执行以下操作:
确定所述第一概率和所述第二概率中的最大概率;
根据所述最大概率,确定所述吊弦是否断裂。
在一些可能的实施方式中,在根据所述第一像素点,从所述第一图像中截取出所述第二图像方面,处理器502,具体用于执行以下操作:
从所述第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到所述第二图像。
在一些可能的实施方式中,在根据所述第二像素点,从所述第一图像中截取出所述第三图像方面,处理器502,具体用于执行以下操作:
从所述第一像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到所述第三图像。
在一些可能的实施方式中,所述第一图像为原始图像或者对所述原始图像进行目标检测得到的,其中,所述原始图像为对高铁线路进行拍摄得到的,且在所述第一图像为对所述原始图像进行目标检测得到的情况下,在获取第一图像之前,处理器502,还用于读取存储器503中的计算机程序执行以下操作:
对所述原始图像进行目标检测,得到至少一个候选框;
对每个所述候选框对应的物体进行识别,得到所述吊弦所在的候选框;
对所述吊弦所在的候选框中的图像进行截取,得到所述第一图像。
具体地,上述收发器501可为图4所述的实施例的图像识别装置400的收发单元401,上述处理器502可以为图4所述的实施例的图像识别装置400的处理单元402。
本申请实施例还提供一种计算机存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种图像识别方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种图像识别方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (14)
1.一种图像识别方法,其特征在于,包括:
获取第一图像,所述第一图像中包括吊弦;
根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦中与所述承力索吊弦线夹连接的部分;
根据所述目标图像,确定所述吊弦是否断裂。
2.根据权利要求1所述的方法,其特征在于,所述目标图像包括第二图像,所述承力索吊弦线夹为第一承力索吊弦线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第一像素点,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
根据所述第一概率,确定所述吊弦是否断裂。
4.根据权利要求1或2所述的方法,其特征在于,所述目标图像包括第三图像,所述承力索吊弦线夹为第二承力索吊弦线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第二像素点,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第二概率,确定所述吊弦是否断裂。
6.根据权利要求1或2所述的方法,其特征在于,所述目标图像包括第二图像和第三图像,所述承力索吊弦线夹包括第一承力索吊弦线夹和第二承力索线夹,所述根据所述第一图像,得到目标图像,包括:
对所述第一图像进行关键点检测,得到第一像素点和第二像素点,其中,所述第一像素点为所述第一承力索吊弦线夹在所述第一图像中对应的像素点,所述第一承力索吊弦线夹为所述吊弦的上端所连接的承力索吊弦线夹,所述第二像素点为所述第二承力索吊弦线夹在所述第一图像中对应的像素点,所述第二承力索吊弦线夹为所述吊弦的下端所连接的承力索吊弦线夹;
根据所述第一像素点,从所述第一图像中截取出所述第二图像;
根据所述第二像素点,从所述第一图像中截取出所述第三图像。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标图像,确定所述吊弦是否断裂,包括:
对所述第二图像进行特征提取,得到第一特征图;
根据所述第一特征图,得到吊弦断裂的第一概率;
对所述第三图像进行特征提取,得到第二特征图;
根据所述第二特征图,得到吊弦断裂的第二概率;
根据所述第一概率和所述第二概率,确定所述吊弦是否断裂。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一概率和所述第二概率,确定所述吊弦是否断裂,包括:
确定所述第一概率和所述第二概率中的最大概率;
根据所述最大概率,确定所述吊弦是否断裂。
9.根据权利要求2或6所述的方法,其特征在于,所述根据所述第一像素点,从所述第一图像中截取出所述第二图像,包括:
从所述第一像素点开始,向左截取第一数量的像素点,向右截取第二数量的像素点以及向下截取第三数量的像素点,得到所述第二图像。
10.根据权利要求4或6所述的方法,其特征在于,所述根据所述第二像素点,从所述第一图像中截取出所述第三图像,包括:
从所述第一像素点开始,向左截取第四数量的像素点,向右截取第五数量的像素点以及向下截取第六数量的像素点,得到所述第三图像。
11.根据权利要求1-10中任一项所述的方法,其特征在于,所述第一图像为原始图像或者对所述原始图像进行目标检测得到的,其中,所述原始图像为对高铁线路进行拍摄得到的,且在所述第一图像为对所述原始图像进行目标检测得到的情况下,在获取第一图像之前,所述方法还包括:
对所述原始图像进行目标检测,得到至少一个候选框;
对每个所述候选框对应的物体进行识别,得到所述吊弦所在的候选框;
对所述吊弦所在的候选框中的图像进行截取,得到所述第一图像。
12.一种图像识别装置,其特征在于,包括:
收发单元,用于获取第一图像,所述第一图像中包括吊弦;
处理单元,用于根据所述第一图像,得到目标图像,所述目标图像中包括承力索吊弦线夹以及所述吊弦的一部分与所述承力索吊弦线夹连接的部分;
所述处理单元,还用于根据所述目标图像,确定所述吊弦是否断裂。
13.一种电子设备,其特征在于,包括:处理器,所述处理器与存储器相连,所述存储器用于存储计算机程序,所述处理器用于执行所述存储器中存储的计算机程序,以使得所述电子设备执行如权利要求1-11中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-11任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010983194.7A CN112102298A (zh) | 2020-09-17 | 2020-09-17 | 图像识别方法及装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010983194.7A CN112102298A (zh) | 2020-09-17 | 2020-09-17 | 图像识别方法及装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112102298A true CN112102298A (zh) | 2020-12-18 |
Family
ID=73759895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010983194.7A Pending CN112102298A (zh) | 2020-09-17 | 2020-09-17 | 图像识别方法及装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112102298A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669302A (zh) * | 2020-12-30 | 2021-04-16 | 北京市商汤科技开发有限公司 | 吊弦缺陷检测方法、装置、电子设备及存储介质 |
CN113610854A (zh) * | 2021-10-11 | 2021-11-05 | 深圳市商汤科技有限公司 | 一种线索缺陷检测方法、终端设备以及计算机存储介质 |
-
2020
- 2020-09-17 CN CN202010983194.7A patent/CN112102298A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112669302A (zh) * | 2020-12-30 | 2021-04-16 | 北京市商汤科技开发有限公司 | 吊弦缺陷检测方法、装置、电子设备及存储介质 |
CN113610854A (zh) * | 2021-10-11 | 2021-11-05 | 深圳市商汤科技有限公司 | 一种线索缺陷检测方法、终端设备以及计算机存储介质 |
CN113610854B (zh) * | 2021-10-11 | 2022-04-01 | 深圳市商汤科技有限公司 | 一种线索缺陷检测方法、终端设备以及计算机存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11003941B2 (en) | Character identification method and device | |
CN110705405B (zh) | 目标标注的方法及装置 | |
CN109086780B (zh) | 用于检测电极片毛刺的方法和装置 | |
CN112102298A (zh) | 图像识别方法及装置、电子设备和存储介质 | |
CN111738252B (zh) | 图像中的文本行检测方法、装置及计算机系统 | |
CN109547466B (zh) | 基于机器学习提高风险感知能力的方法及装置、计算机设备和存储介质 | |
CN112967248A (zh) | 生成缺陷图像样本的方法、装置、介质及程序产品 | |
CN111553431A (zh) | 图片清晰度检测方法、装置、计算机设备及存储介质 | |
CN111178445A (zh) | 图像处理方法及装置 | |
CN111783812A (zh) | 违禁图像识别方法、装置和计算机可读存储介质 | |
US9984294B2 (en) | Image classification method and apparatus for preset tour camera | |
CN112669302A (zh) | 吊弦缺陷检测方法、装置、电子设备及存储介质 | |
CN112967224A (zh) | 一种基于人工智能的电子电路板检测系统、方法及介质 | |
CN116091503B (zh) | 一种面板异物缺陷的判别方法、装置、设备及介质 | |
CN110533627B (zh) | 用于检测网绳断裂的方法 | |
KR102170416B1 (ko) | 컴퓨터와 크라우드 소싱을 이용한 비디오 사전 처리 방법 | |
CN112102302B (zh) | 图像识别方法及装置、电子设备和存储介质 | |
CN112446850A (zh) | 适配测试方法、装置及电子设备 | |
CN113361455B (zh) | 人脸鉴伪模型的训练方法、相关装置及计算机程序产品 | |
CN110634124A (zh) | 一种区域检测的方法及设备 | |
CN114965484A (zh) | 缺陷检测系统 | |
CN112069357B (zh) | 视频资源处理方法、装置、电子设备及存储介质 | |
CN114187568A (zh) | 道路标牌破损检测方法、装置及存储介质 | |
CN112257768A (zh) | 一种非法金融图片的识别方法、装置、计算机存储介质 | |
CN112381058A (zh) | 基于行人重识别的黑白名单管控方法及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |