CN112633297B - 目标对象的识别方法、装置、存储介质以及电子装置 - Google Patents
目标对象的识别方法、装置、存储介质以及电子装置 Download PDFInfo
- Publication number
- CN112633297B CN112633297B CN202011589548.6A CN202011589548A CN112633297B CN 112633297 B CN112633297 B CN 112633297B CN 202011589548 A CN202011589548 A CN 202011589548A CN 112633297 B CN112633297 B CN 112633297B
- Authority
- CN
- China
- Prior art keywords
- image
- target
- feature vector
- sample
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/181—Segmentation; Edge detection involving edge growing; involving edge linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Abstract
本发明实施例提供了一种目标对象的识别方法、装置、存储介质以及电子装置,该方法包括:获取第一图像,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,从第一子图像中提取第一特征向量,获取第一特征向量与第二特征向量之间的目标参数,在目标参数符合预定条件的情况下,将第一对象确定为目标对象,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
Description
技术领域
本发明实施例涉及计算机图形及图像处理领域,具体而言,涉及一种目标对象的识别方法、装置、存储介质以及电子装置。
背景技术
目前的相关技术中,在目标对象的识别过程中,仅仅只能初步获取图像的特征信息,再基于特征信息实现对图像中包括的对象进行简单识别,无法对在X光安检机难以区分的对象进行有效识别。
例如,以目标对象为象牙及其制品为例,检查该类型违禁物品的主要手段是将行李物品及邮寄快件等依次通过X光安检机,通过X光扫描和渲染重建得到与其对应的X光渲染图像,其中,需要安全检查员采用人工观察的方式来进行开包检查,以完成对违禁物的检测。
但是,由于例如象牙等生物骨骼为混合物,按X光机渲染标准,其在无遮挡的情况下,在渲染图像中呈现不同等级绿色。而实际生活中,橡胶、陶瓷制品等众多混合物也同时呈现绿色,与上述象牙类违禁品在X光渲染图像中类似,进而,相关技术中对于该类难以直接检测得到的目标对象,通常采用基于X光图像的违禁品检测技术,但是在进行违禁品检测的过程中,只能支持部分易于被检测的违禁品,对于成分复杂或与生活用品相似度高等类型的违禁品而言,通过目前的相关技术,难以将该类违禁品作为目标对象,以实现有效的检测。
因此,目前的相关技术中对于目标对象的识别的过程,还是主要依靠人工鉴别,而该方式在进行目标对象识别时,存在效率较低的技术问题。
针对相关技术中存在的目标对象的识别效率较低的技术问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种目标对象的识别方法、装置、存储介质以及电子装置,以至少解决相关技术中存在的目标对象的识别效率较低的技术问题。
根据本发明的一个实施例,提供了一种目标对象的识别方法,包括:获取第一图像;将所述第一图像输入第一图像识别模型,得到第一识别结果以及与所述第一识别结果对应的第一子图像,其中,所述第一识别结果中包括从所述第一图像中识别出的第一对象的对象信息,所述对象信息包括所述第一对象在所述第一图像中的位置,所述第一子图像为根据所述第一对象在所述第一图像中的位置确定的图像;从所述第一子图像中提取第一特征向量;获取所述第一特征向量与第二特征向量之间的目标参数,其中,所述第二特征向量为目标检索库中包括的特征向量;在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象。
根据本发明的另一个实施例,提供了一种目标对象的识别装置,包括:第一获取模块,用于获取第一图像;处理模块,用于将所述第一图像输入第一图像识别模型,得到第一识别结果以及与所述第一识别结果对应的第一子图像,其中,所述第一识别结果中包括从所述第一图像中识别出的第一对象的对象信息,所述对象信息包括所述第一对象在所述第一图像中的位置,所述第一子图像为根据所述第一对象在所述第一图像中的位置确定的图像;提取模块,用于从所述第一子图像中提取第一特征向量;第二获取模块,用于获取所述第一特征向量与第二特征向量之间的目标参数,其中,所述第二特征向量为目标检索库中包括的特征向量;确定模块,用于在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一项方法实施例中的步骤。
通过本发明,采用获取第一图像,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,从第一子图像中提取第一特征向量,获取第一特征向量与第二特征向量之间的目标参数,在目标参数符合预定条件的情况下,将第一对象确定为目标对象的方式,在将图像输入图像识别模型以得到第一特征向量,并与第二特征向量比较,在第一特征向量和第二特征向量之间的目标参数符合预定条件的情况下,确定出目标对象,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的目标对象的识别方法的移动终端的硬件结构框图;
图2是根据本发明实施例的一种可选的目标对象的识别方法的流程示意图;
图3是根据本发明实施例的一种可选的目标对象的识别方法的示意图;
图4是根据本发明实施例的另一种可选的目标对象的识别方法的示意图;
图5是根据本发明实施例的又一种可选的目标对象的识别方法的示意图;
图6是根据本发明实施例的又一种可选的目标对象的识别方法的示意图;
图7是根据本发明实施例的又一种可选的目标对象的识别方法的示意图;
图8是根据本发明实施例的一种可选的目标对象的识别装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种目标对象的识别方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的目标对象的识别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种运行于移动终端、计算机终端或者类似的运算装置的目标对象的识别方法,图2是根据本发明实施例的一种可选的目标对象的识别方法的流程示意图,如图2所示,该流程包括如下步骤:
S202,获取第一图像;
S204,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,其中,第一识别结果中包括从第一图像中识别出的第一对象的对象信息,对象信息包括第一对象在第一图像中的位置,第一子图像为根据第一对象在第一图像中的位置确定的图像;
S206,从第一子图像中提取第一特征向量;
S208,获取第一特征向量与第二特征向量之间的目标参数,其中,第二特征向量为目标检索库中包括的特征向量;
S210,在目标参数符合预定条件的情况下,将第一对象确定为目标对象。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
可选地,在本实施例中,上述目标对象的识别方法可以包括但不限于监控领域、安检领域等需要从场景中识别出对象的应用场景中,上述仅是一种示例,本实施例不做任何具体的限定。
可选地,在本实施例中,上述第一图像可以包括但不限于由图像采集设备采集到的待识别的图像,还可以包括但不限于从数据库或者存储设备中读取的待识别的图像等。
可选地,在本实施例中,上述第一图像识别模型可以包括但不限于卷积神经网络模型、循环神经网络模型以及深度神经网络模型等,具体而言,可以包括但不限于用于进行目标检测的Yolo和SSD算法,通过均匀地在图像的不同位置进行密集抽样,采用不同尺度和长宽比,利用CNN提取特征后进行分类和回归。上述仅是一种示例,本实施例对此不做任何具体的限定。
可选地,在本实施例中,上述第一识别结果可以包括但不限于对象的位置信息,例如,对象的坐标,对象所处区域的标识等,还可以包括但不限于对象的类别信息,例如,象牙制品、陶瓷制品、橡胶制品等,还可以包括但不限于与对象相关联的置信度,上述置信度用于表示该对象属于预测的对象类别的概率值。上述仅是一种示例,本实施例不做任何具体的限定。
可选地,在本实施例中,上述第一子图像可以包括但不限于基于目标检测算法中得到的先验框或者检测框所对应的子图像,需要说明的是,上述第一子图像为对象信息中对象类别与目标对象相同的对象所对应的子图像。
例如,在第一图片中检测到预测类别为橡胶制品的子图像1和预测类别为象牙制品的子图像2,在确定目标对象的类别为象牙制品的情况下,将象牙制品对应的子图像确定为上述第一子图像。
可选地,在本实施例中,上述第一特征向量可以包括但不限于采用SSD算法从第一子图像中提取特征得到,具体而言,以VGG-16作为基础网络层,将提取的输出结果作为提取到的特征向量,考虑到对象的大小及形状的不确定性。
图3是根据本发明实施例的一种可选地目标对象的识别方法的示意图,如图3所示,可以包括但不限于将SSD模型配置为图3所示的结构,通过CNN预先从第一子图像中提取特征,再通过SSD算法在多个不同尺度上进行检测,以避免尺度较小的对象的漏检,对于每一个尺度的特征图,可以通过包括但不限于3x3卷积核来预测第一子图像所对应的第一图像中的区域是否存在目标对象以及目标对象的位置。
例如,图4是根据本发明实施例的另一种可选地目标对象的识别方法的示意图,如图4所示,通过将第一子图像输入预先配置的SSD算法,以识别出对象402、对象404以及分别对应的置信度406。上述仅是一种示例,本实施例不做任何具体的限定。
可选地,在本实施例中,上述第二特征向量为上述目标检索库中存储的特征向量,上述目标检索库中包括的第二特征向量所指示的对象的类别与目标对象相同,上述目标参数用于表示所述第一特征向量和第二特征向量之间的相关性,例如,相似度参数、距离参数等。
通过本实施例,采用获取第一图像,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,从第一子图像中提取第一特征向量,获取第一特征向量与第二特征向量之间的目标参数,在目标参数符合预定条件的情况下,将第一对象确定为目标对象的方式,在将图像输入图像识别模型以得到第一特征向量,并与第二特征向量比较,在第一特征向量和第二特征向量之间的目标参数符合预定条件的情况下,确定出目标对象,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在获取所述第一特征向量与第二特征向量之间的目标参数之前,所述方法还包括:获取一组样本图像,其中,所述一组样本图像为已标注的存在与所述目标对象类别相同的对象的图像;将所述一组样本图像中包括的每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量;将一组所述第二特征向量保存到所述目标检索库中。
可选地,在本实施例中,上述样本图像可以包括但不限于由图像采集设备采集得到的图像,或者,还可以包括但不限于人工获取包括目标对象的图像,上述样本图像包括已标注的存在与目标对象类别相同的对象,上述样本图像还可以包括但不限于通过基于灰度值的X光图像融合方法来融合生成,以增加样本图像的多样性和复杂性。
可选地,在本实施例中,上述第二图像识别模型可以包括但不限于能够从图像中识别并提取特征的图像识别模型,例如,可以包括但不限于神经网络模型、主色相似度颜色特征模型,以及SIFT等方法,通过多特征融合的方式对样本图像进行特征提取。
通过本实施例,采用获取一组样本图像,其中,一组样本图像为已标注的存在与目标对象类别相同的对象的图像;将一组样本图像中包括的每个样本图像分别输入第二图像识别模型,得到一组第二特征向量;将一组第二特征向量保存到目标检索库中的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,从所述第一子图像中提取第一特征向量包括:将所述第一子图像输入所述第二图像识别模型,得到所述第一特征向量;获取所述第一特征向量与第二特征向量之间的目标参数包括:获取所述第一特征向量与所述第二特征向量之间的余弦距离,其中,所述目标参数包括所述余弦距离。
可选地,在本实施例中,上述将第一子图像输入第二图像识别模型可以包括但不限于从第一子图像中提取特征,以得到上述第一特征向量,上述第二图像识别模型可以包括但不限于能够从图像中识别并提取特征的图像识别模型,例如,可以包括但不限于神经网络模型、主色相似度颜色特征模型,以及SIFT等方法,通过多特征融合的方式对样本图像进行特征提取。
可选地,在本实施例中,上述目标参数可以包括但不限于第一特征向量和第二特征向量之间的余弦距离。
例如,以目标对象为象牙或象牙制品为例,计算第一特征向量与第二特征向量之间的余弦距离,采用余弦距离作为相似度度量标准。
通过将第一图像输入第一图像识别模型后,得到第一子图像,再将第一子图像输入第二图像识别模型后,提取得到一个512维的第一特征向量X({x1,x2,...,x512})。
采用与目标检索库中的所有第二特征向量计算余弦相似度。
其中,S(余弦距离)值越大,则第一特征向量和第二特征向量之间的相似度越高,从而,通过确定目标检索库中与第一特征向量之间的余弦距离最大的第二特征向量所对应的类别标签为第一子图像中包括的样本最接近的类别标签。
通过本实施例,采用将第一子图像输入第二图像识别模型,得到第一特征向量,获取第一特征向量与第二特征向量之间的余弦距离的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之前,所述方法还包括:获取与所述预定条件关联的预设参数值;将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果;在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象包括:在确定所述目标参数的参数值小于等于所述预设参数值的情况下,确定所述目标参数符合所述预定条件;将所述第一对象确定为所述目标对象。
可选地,在本实施例中,上述预设参数值可以包括但不限于由工作人员根据经验人为设置的相似度阈值,还可以包括但不限于通过神经网络模型得到的相似度阈值等,为了降低误检率,在将目标参数的参数值与预设参数值进行比较时,选取相似度阈值Sthresh,如果与最接近的特征向量之间的相似度小于Sthresh,则认为没有相似的样本,类别标签为与目标对象的类别标签不同。
通过本实施例,采用获取与预定条件关联的预设参数值;将目标参数的参数值与预设参数值进行比较,以得到比较结果,在确定目标参数的参数值小于等于预设参数值的情况下,确定目标参数符合预定条件;将第一对象确定为目标对象的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果之后,所述方法还包括:在确定所述目标参数的参数值大于所述预设参数值的情况下,确定所述目标参数不符合所述预定条件;将所述第一对象确定为其他类别的对象,其中,所述其他类别与所述目标对象的类别不同。
可选地,在本实施例中,上述在确定目标参数的参数值大于预设参数值的情况下,确定目标参数不符合预定条件;将第一对象确定为其他类别的对象可以包括但不限于如下步骤:
S1,获取一个或多个余弦距离;
S2,基于余弦距离确定余弦距离最大的第二特征向量;
S3,比较上述余弦距离最大的第二特征向量所对应的余弦距离和预设余弦距离的大小;
S4,在余弦距离最大的第二特征向量所对应的余弦距离大于预设余弦距离的情况下,确定第一子图像中包含目标对象;
S5,在余弦距离最大的第二特征向量所对应的余弦距离小于等于预设余弦距离的情况下,确定第一子图像中不包含目标对象。
上述仅是一种示例,本实施例不做任何具体的限定。
通过本实施例,采用在确定目标参数的参数值大于预设参数值的情况下,确定目标参数不符合预定条件;将第一对象确定为其他类别的对象的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在获取一组样本图像之前,所述方法还包括:获取已标注第一信息的一组第一样本图像以及已标注第二信息的一组第二样本图像,其中,所述第一信息用于指示所述第一样本图像中包含与所述目标对象类别相同的对象,所述第二信息用于指示所述第二样本图像中包含与所述目标对象类别不同的对象;基于灰度值的图像融合方法将所述一组第一样本图像和所述一组第二样本图像融合,得到所述一组样本图像。
可选地,在本实施例中,上述第一信息包括但不限于指示第一样本图像中包含的类别信息,上述类别信息指示第一样本图像中包含的对象为与目标对象类别相同的对象,上述第二信息包括但不限于指示第二样本图像中包含的类别信息,上述类别信息指示第二样本图像中包含的对象为与目标对象类别不同的对象,上述第一信息和第二信息也可以包括但不限于指示样本图像中包含的类别信息是否与目标对象的类别信息相同或者不同。
例如,图5是根据本发明实施例的又一种可选的目标对象的识别方法的示意图,如图5所示,以目标对象为象牙及象牙制品为例,首先,人工抠取渲染图像中象牙目标小图),同时也抠取易误识为象牙的牙膏,橡胶轮胎及书籍等目标小图,其次,通过对抠取到的象牙目标小图以及其他对象的目标小图进行基于灰度值的图像融合增广,其中,目标小图即为样本图像,由于X光图像存在严重的透视遮挡问题,而人工抠取得数据无法覆盖象牙被各种物品覆盖的场景。为了丰富象牙检索样本库的信息,增加检索样本的多样性及复杂性,通过基于灰度值的X光图像融合方法,也即,包括但不限于如下计算公式:
其中,I1和I2分别表示待融合的象牙及其制品图像(对应于前述的第一样本图像)和常见生活物品图像(对应于前述的第二样本图像),grey(I1)和grey(I2)分别表示两幅图像的灰度图像。融合前后图像如图5所示,其中图5-1为象牙原始图像,包括象牙502,图5-2为生活物品图像,包括生活物品504,图5-3为象牙物品与生活常见品融合图像,包括融合后的象牙和生活物品图像506,也即,上述一组样本图像中包括的样本图像。
上述仅是一种示例,本实施例不做任何具体的限定。
通过本实施例,采用获取已标注第一信息的一组第一样本图像以及已标注第二信息的一组第二样本图像,其中,第一信息用于指示第一样本图像中包含与目标对象类别相同的对象,第二信息用于指示第二样本图像中包含与目标对象类别不同的对象;基于灰度值的图像融合方法将一组第一样本图像和一组第二样本图像融合,得到一组样本图像的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,获取第一图像,包括:获取由图像采集设备采集到的渲染图像;采用颜色域切割的方式处理所述渲染图像,得到所述第一图像。
可选地,在本实施例中,可以通过包括但不限于如下方式采用颜色域切割的方式处理所述渲染图像:
图6是根据本发明实施例的又一种可选的目标对象的识别方法的示意图,以上述目标对象的识别方法应用于安检机为例,如图6所示,可以包括但不限于如下步骤:
S1,对包裹在X光安检机下的渲染图像602进行颜色域分割,截取到包裹区域604。
S2,以包裹区域604作为目标检测区,缩小检测尺寸范围,提升检测效果。
其中,X光安检机得到的渲染图,一般由含时间戳信息的灰白背景和渲染包裹两部分组成,见图6-1。通过颜色阈值,获得前景区域,前景区域如图6-2。再通过最大轮廓提取,过滤掉噪点和时间戳,得到包裹区域的第一图像606。
上述仅是一种示例,本实施例不做任何具体的限定。
通过本实施例,采用获取由图像采集设备采集到的渲染图像;采用颜色域切割的方式处理渲染图像,得到第一图像的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之后,所述方法还包括:将所述第一特征向量添加到所述目标检索库中,以更新所述目标检索库。
可选地,在本实施例,上述将第一特征向量添加到目标检索库中可以包括但不限于由工作人员进行人工添加,也可以包括但不限于根据预设的聚类方法将第一特征向量分类存储在目标检索中。
例如,可以包括但不限于采用交互式更新检索特征库的方法,即检查人员在将第一对象确定为目标对象之后,对检测到的目标对象进行二次审核,打标该对象是否为目标对象,进而,根据结果将对应的第一特征向量及对应的类别标签注册更新至目标检索库中。
上述仅是一种示例,本实施例不做任何具体的限定。
通过本实施例,采用将第一特征向量添加到目标检索库中,以更新目标检索库的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,将所述一组样本图像中每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量,包括:针对所述一组样本图像中包括的每个样本图像分别执行以下操作,以得到一组所述第二特征向量:基于第一特征提取方式从所述样本图像中提取第一样本特征向量,其中,所述第一特征提取方式用于提取所述样本图像的语义特征信息;基于第二特征提取方式从所述样本图像中提取第二样本特征向量,其中,所述第二特征提取方式用于提取所述样本图像中包括的关键特征点的局部特征信息;基于第三特征提取方式从所述样本图像中提取第三样本特征向量,其中,所述第三特征提取方式用于提取所述样本图像的颜色特征信息;将所述第一样本特征向量、所述第二样本特征向量以及所述第三样本特征向量融合为所述第二特征向量。
可选地,在本实施例中,上述基于第一特征提取方式从所述样本图像中提取第一样本特征向量,其中,所述第一特征提取方式用于提取所述样本图像的语义特征信息,可以包括但不限于如下示例性说明:
例如,上述第一特征提取方式可以包括但不限于将样本图像输入预设的神经网络模型,其中,神经网络模型可以包括但不限于选择VGG16,O型,根据预先配置的目标检索库上微调ImageNet预训练模型,得到新的特征提取网络作为上述第一特征提取方式。
将样本图像输入神经网络模型后,输出4096维度特征向量,其计算方式如下:
v1=fVGG(i)
其中,fVGG表示VGG特征提取方法,i为样本图像,v1表示神经网络模型所提取的第一样本特征向量,用于表示高层的语义信息。
可选地,在本实施例中,上述基于第二特征提取方式从所述样本图像中提取第二样本特征向量,其中,所述第二特征提取方式用于提取所述样本图像中包括的关键特征点的局部特征信息,可以包括但不限于如下示例性说明:
例如,上述基于第二特征提取方式可以包括但不限于SIFT局部特征提取方法,主要通过检测象牙小图中的关键特征点,并对特征点进行描述从而生成特征向量。算法首先构建多尺度空间,通过高斯核函数实现尺度变换,高斯核函数定义如下:
构建出高斯差分尺度空间,其计算方式如下:
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)
=L(x,y,kσ)-L(x,y,σ)
之后将每一个采样点与其相邻位置以及相邻尺度26个点比较,寻找尺度空间的极值点,并通过3D二次函数拟合过滤较小的极值、曲率反应过滤边缘噪声。对于每一个关键点,使用位置、尺度以及方向表示,其方向定义为:
其中m(x,y)表示该关键点梯度的幅值,θ(x,y)表示关键点梯度的方向。
然后在关键点的周围选取边长为16的正方形邻域,划分为4×4的子区域,每个子区域统计长度为9个方向直方图,最后每一个特征点得到128维的特征向量,在本实施例中,在样本图像中寻找最佳的32个关键点,得到4096维度的SIFT特征向量v2作为上述第二样本特征向量。
可选地,在本实施例中,上述基于第三特征提取方式从所述样本图像中提取第三样本特征向量,其中,所述第三特征提取方式用于提取所述样本图像的颜色特征信息,可以包括但不限于如下示例性说明:
例如,上述第三特征提取方式包括但不限于主色相似度的差分统计直方图均值的特征提取方法,重点关注样本图像中目标对象的特征。
S1,对样本图像进行颜色聚类,找出样本图像的主色集C,并按主色的频率P排序:
C=(c1,c2,...,ck)
P=(p1,p2,...,pk)
其中,ci(i=1,2,...,k)为图样本像的主色,pi(i=1,2,...,k)为主色的ci的频率,k为主色数目,本方案中k可以包括但不限于等于4。
S2,分别计算样本图像中的像素点的像素值相对C中元素的相似度,形成主色相似度矩阵(S1,S2,...,Sk),设样本图像的像素值pr,l=(hr,l,sr,l,vr,l),主色ci=(hi,si,vi),相似度矩阵的计算方式如下:
S3,将Si中的元素灰度化得到grayi,也即,样本图像主色相对于主色ci的灰度化图像,分别计算grayi的差分图像diffi,计算公式如下:
diff(i)=gray(i)l,r-gray(i)(l+1),(r+1)
分别统计diffi的灰度直方图histi(g),并计算直方图的平均值Ai,并将Ai×histi(g)的值作为主色ci的颜色特征,记为ti,则整幅样本图像的主色特征可以表示为(t1,t2,...tk),将所有主色特征拼接转换为一维特征向量得到第三样本特征向量v3,特征维度为1024。
可选地,在本实施例中,上述将所述第一样本特征向量、所述第二样本特征向量以及所述第三样本特征向量融合为所述第二特征向量可以包括但不限于如下步骤:
S1,对所有的特征向量作归一化处理,其计算公式如下:
x′=(x-X_min)/(X_max-X_min)
其中X_min,X_max表示特征向量的最小值和最大值,x表示归一化前特征向量的值,x'表示归一化后特征向量的值。
通过上述步骤以避免不同特征数量级之间的差异。
S2,通过主成分分析(PCA)方法将特征向量v1、v2和v3分别降到256、128和128维度,最后拼接得到512维特征向量,并将其保存到数据检索库中。
通过上述步骤以降低特征向量的维度,平衡不同特征的权重,减少图像检索的计算量。
上述仅是一种示例,本实施例不做任何具体的限定。
通过本实施例,采用针对一组样本图像中包括的每个样本图像分别执行以下操作,以得到一组第二特征向量:基于第一特征提取方式从样本图像中提取第一样本特征向量,其中,第一特征提取方式用于提取样本图像的语义特征信息;基于第二特征提取方式从样本图像中提取第二样本特征向量,其中,第二特征提取方式用于提取样本图像中包括的关键特征点的局部特征信息;基于第三特征提取方式从样本图像中提取第三样本特征向量,其中,第三特征提取方式用于提取样本图像的颜色特征信息;将第一样本特征向量、第二样本特征向量以及第三样本特征向量融合为第二特征向量的方式,替代了相关技术中仅仅只通过X光机检测目标,导致识别效率较低,还需要人工重新甄别目标对象,进而,可以解决相关技术中存在的目标对象的识别效率较低的技术问题,达到提高目标对象的识别效率、增加目标对象的识别准确率,避免需要过多人工参与的技术效果。
作为一种可选的方案,在所述目标参数符合预定条件的情况下,将所述第一对象确定为所述目标对象之后,所述方法还包括:基于所述第一子图像所对应的对象信息,生成目标渲染图像,其中,所述目标渲染图像中标注了所述目标对象以及所述目标对象的类别信息。
可选地,在本实施例中,在将第一对象确定为目标对象之后,基于第一子图像所对应的对象信息,生成目标渲染图像可以包括但不限于将检测到的目标对象的坐标映射回第一图像中,并根据检测到的坐标画出识别框,并在框上打印类别及置信度,以便于更新目标检索库以及后续处理。
上述仅是一种示例,本实施例不作任何具体的限定。
下面结合具体的示例,对上述目标对象的识别方案进行进一步的解释说明:
图7是根据本发明实施例的又一种可选的目标对象的识别方法的示意图,如图7所示,该流程包括如下步骤:
步骤1,采集象牙制品及其误识对象图片;
步骤2,图像融合增广;
步骤3,运用神经网络、SIFT以及主色相似度颜色特征进行多特征提取并融合,经过PCA降维得到特征向量,构建象牙检索库;
步骤4,对X光渲染图进行颜色域分割;
步骤5,对前景分割图进行全图象牙检测,抠取象牙目标图;
步骤6,按照步骤3所述的特征提取方式得到特征向量,计算特征向量与数据库中特征的相似度值,得到目标类别;
步骤7,将检测到的象牙坐标映射会渲染图中,并根据检测到的坐标画出识别框,并在识别框上打印类别及置信度;
步骤8,根据检测人员二次审核的结果,进行步骤1,即将其认为检测正确的象牙目标图的特征向量保存到特征数据库中。
其中,步骤1至步骤3为建立象牙数据库(目标检索库)模块,步骤4到步骤7为象牙检测(目标对象的识别)模块。
可选地,在本实施例中,现有的X光违禁品检测中主要关注爆炸物以及低透物体等明显区别于生活常见物品物体的检测,还无法检测出与生活常见物品混合的象牙及其制品,目前仍然需要有经验的安检员来人工检测。本方案提取包裹前景区域并通过SSD目标检测算法在X光图像中检测象牙及其制品,基于灰度值的图像融合方法融合象牙数据及生活常见物品扩充象牙数据集并增加了样本的复杂性,针对SSD对于象牙及生活物品混合时误检高的问题,建立象牙及其制品数据检索库对SSD检测的图像进行二次辅助判断,通过神经网络、SIFT和颜色特征融合的方式提取象牙特征,最后计算特征向量与象牙检索库的余弦相似度,根据相似度及阈值判断是否为象牙及其制品,从而降低象牙及其制品的误检。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种目标对象的识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图8是根据本发明实施例的一种可选的目标对象的识别装置的结构框图,如图8所示,该装置包括:
第一获取模块802,用于获取第一图像;
处理模块804,用于将所述第一图像输入第一图像识别模型,得到第一识别结果以及与所述第一识别结果对应的第一子图像,其中,所述第一识别结果中包括从所述第一图像中识别出的第一对象的对象信息,所述对象信息包括所述第一对象在所述第一图像中的位置,所述第一子图像为根据所述第一对象在所述第一图像中的位置确定的图像;
提取模块806,用于从所述第一子图像中提取第一特征向量;
第二获取模块808,用于获取所述第一特征向量与第二特征向量之间的目标参数,其中,所述第二特征向量为目标检索库中包括的特征向量;
确定模块810,用于在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象。
作为一种可选的方案,所述装置还用于:在获取所述第一特征向量与第二特征向量之间的目标参数之前,获取一组样本图像,其中,所述一组样本图像为已标注的存在与所述目标对象类别相同的对象的图像;将所述一组样本图像中包括的每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量;将一组所述第二特征向量保存到所述目标检索库中。
作为一种可选的方案,所述装置用于通过如下方式从所述第一子图像中提取第一特征向量:将所述第一子图像输入所述第二图像识别模型,得到所述第一特征向量;获取所述第一特征向量与第二特征向量之间的目标参数包括:获取所述第一特征向量与所述第二特征向量之间的余弦距离,其中,所述目标参数包括所述余弦距离。
作为一种可选的方案,所述装置还用于:在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之前,获取与所述预定条件关联的预设参数值;将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果;在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象包括:在确定所述目标参数的参数值小于等于所述预设参数值的情况下,确定所述目标参数符合所述预定条件;将所述第一对象确定为所述目标对象。
作为一种可选的方案,所述装置还用于:在将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果之后,在确定所述目标参数的参数值大于所述预设参数值的情况下,确定所述目标参数不符合所述预定条件;将所述第一对象确定为其他类别的对象,其中,所述其他类别与所述目标对象的类别不同。
作为一种可选的方案,所述装置还用于:在获取一组样本图像之前,获取已标注第一信息的一组第一样本图像以及已标注第二信息的一组第二样本图像,其中,所述第一信息用于指示所述第一样本图像中包含与所述目标对象类别相同的对象,所述第二信息用于指示所述第二样本图像中包含与所述目标对象类别不同的对象;基于灰度值的图像融合方法将所述一组第一样本图像和所述一组第二样本图像融合,得到所述一组样本图像。
作为一种可选的方案,所述装置用于通过如下方式获取第一图像:获取由图像采集设备采集到的渲染图像;采用颜色域切割的方式处理所述渲染图像,得到所述第一图像。
作为一种可选的方案,所述装置还用于:在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之后,将所述第一特征向量添加到所述目标检索库中,以更新所述目标检索库。
作为一种可选的方案,所述装置用于通过如下方式将所述一组样本图像中每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量:针对所述一组样本图像中包括的每个样本图像分别执行以下操作,以得到一组所述第二特征向量:基于第一特征提取方式从所述样本图像中提取第一样本特征向量,其中,所述第一特征提取方式用于提取所述样本图像的语义特征信息;基于第二特征提取方式从所述样本图像中提取第二样本特征向量,其中,所述第二特征提取方式用于提取所述样本图像中包括的关键特征点的局部特征信息;基于第三特征提取方式从所述样本图像中提取第三样本特征向量,其中,所述第三特征提取方式用于提取所述样本图像的颜色特征信息;将所述第一样本特征向量、所述第二样本特征向量以及所述第三样本特征向量融合为所述第二特征向量。
作为一种可选的方案,所述装置还用于:在所述目标参数符合预定条件的情况下,将所述第一对象确定为所述目标对象之后,基于所述第一子图像所对应的对象信息,生成目标渲染图像,其中,所述目标渲染图像中标注了所述目标对象以及所述目标对象的类别信息。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在本实施例中,上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,获取第一图像;
S2,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,其中,第一识别结果中包括从第一图像中识别出的第一对象的对象信息,对象信息包括第一对象在第一图像中的位置,第一子图像为根据第一对象在第一图像中的位置确定的图像;
S3,从第一子图像中提取第一特征向量;
S4,获取第一特征向量与第二特征向量之间的目标参数,其中,第二特征向量为目标检索库中包括的特征向量;
S5,在目标参数符合预定条件的情况下,将第一对象确定为目标对象。
计算机可读存储介质还被设置为存储用于执行以下步骤的计算机程序:
S1,获取第一图像;
S2,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,其中,第一识别结果中包括从第一图像中识别出的第一对象的对象信息,对象信息包括第一对象在第一图像中的位置,第一子图像为根据第一对象在第一图像中的位置确定的图像;
S3,从第一子图像中提取第一特征向量;
S4,获取第一特征向量与第二特征向量之间的目标参数,其中,第二特征向量为目标检索库中包括的特征向量;
S5,在目标参数符合预定条件的情况下,将第一对象确定为目标对象。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
在一个示例性实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,获取第一图像;
S2,将第一图像输入第一图像识别模型,得到第一识别结果以及与第一识别结果对应的第一子图像,其中,第一识别结果中包括从第一图像中识别出的第一对象的对象信息,对象信息包括第一对象在第一图像中的位置,第一子图像为根据第一对象在第一图像中的位置确定的图像;
S3,从第一子图像中提取第一特征向量;
S4,获取第一特征向量与第二特征向量之间的目标参数,其中,第二特征向量为目标检索库中包括的特征向量;
S5,在目标参数符合预定条件的情况下,将第一对象确定为目标对象。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种目标对象的识别方法,其特征在于,包括:
获取第一图像;
将所述第一图像输入第一图像识别模型,得到第一识别结果以及与所述第一识别结果对应的第一子图像,其中,所述第一识别结果中包括从所述第一图像中识别出的第一对象的对象信息,所述对象信息包括所述第一对象在所述第一图像中的位置,所述第一子图像为根据所述第一对象在所述第一图像中的位置确定的图像;
从所述第一子图像中提取第一特征向量;
获取所述第一特征向量与第二特征向量之间的目标参数,其中,所述第二特征向量为目标检索库中包括的特征向量;
在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象;
所述在获取所述第一特征向量与第二特征向量之间的目标参数之前,所述方法还包括:
获取已标注第一信息的一组第一样本图像以及已标注第二信息的一组第二样本图像,其中,所述第一信息用于指示所述第一样本图像中包含与所述目标对象类别相同的对象,所述第二信息用于指示所述第二样本图像中包含与所述目标对象类别不同的对象;
基于灰度值的图像融合方法将所述一组第一样本图像和所述一组第二样本图像融合,得到所述一组样本图像。
2.根据权利要求1所述的方法,其特征在于,在获取所述第一特征向量与第二特征向量之间的目标参数之前,所述方法还包括:
获取一组样本图像,其中,所述一组样本图像为已标注的存在与所述目标对象类别相同的对象的图像;
将所述一组样本图像中包括的每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量;
将一组所述第二特征向量保存到所述目标检索库中。
3.根据权利要求2所述的方法,其特征在于,
从所述第一子图像中提取第一特征向量包括:将所述第一子图像输入所述第二图像识别模型,得到所述第一特征向量;
获取所述第一特征向量与第二特征向量之间的目标参数包括:获取所述第一特征向量与所述第二特征向量之间的余弦距离,其中,所述目标参数包括所述余弦距离。
4.根据权利要求1所述的方法,其特征在于,
在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之前,所述方法还包括:获取与所述预定条件关联的预设参数值;将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果;
在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象包括:在确定所述目标参数的参数值小于等于所述预设参数值的情况下,确定所述目标参数符合所述预定条件;将所述第一对象确定为所述目标对象。
5.根据权利要求4所述的方法,其特征在于,在将所述目标参数的参数值与所述预设参数值进行比较,以得到比较结果之后,所述方法还包括:
在确定所述目标参数的参数值大于所述预设参数值的情况下,确定所述目标参数不符合所述预定条件;
将所述第一对象确定为其他类别的对象,其中,所述其他类别与所述目标对象的类别不同。
6.根据权利要求1所述的方法,其特征在于,获取第一图像,包括:
获取由图像采集设备采集到的渲染图像;
采用颜色域切割的方式处理所述渲染图像,得到所述第一图像。
7.根据权利要求1所述的方法,其特征在于,在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象之后,所述方法还包括:
将所述第一特征向量添加到所述目标检索库中,以更新所述目标检索库。
8.根据权利要求2所述的方法,其特征在于,将所述一组样本图像中每个样本图像分别输入第二图像识别模型,得到一组所述第二特征向量,包括:
针对所述一组样本图像中包括的每个样本图像分别执行以下操作,以得到一组所述第二特征向量:
基于第一特征提取方式从所述样本图像中提取第一样本特征向量,其中,所述第一特征提取方式用于提取所述样本图像的语义特征信息;
基于第二特征提取方式从所述样本图像中提取第二样本特征向量,其中,所述第二特征提取方式用于提取所述样本图像中包括的关键特征点的局部特征信息;
基于第三特征提取方式从所述样本图像中提取第三样本特征向量,其中,所述第三特征提取方式用于提取所述样本图像的颜色特征信息;
将所述第一样本特征向量、所述第二样本特征向量以及所述第三样本特征向量融合为所述第二特征向量。
9.根据权利要求1所述的方法,其特征在于,在所述目标参数符合预定条件的情况下,将所述第一对象确定为所述目标对象之后,所述方法还包括:
基于所述第一子图像所对应的对象信息,生成目标渲染图像,其中,所述目标渲染图像中标注了所述目标对象以及所述目标对象的类别信息。
10.一种目标对象的识别装置,其特征在于,包括:
第一获取模块,用于获取第一图像;
处理模块,用于将所述第一图像输入第一图像识别模型,得到第一识别结果以及与所述第一识别结果对应的第一子图像,其中,所述第一识别结果中包括从所述第一图像中识别出的第一对象的对象信息,所述对象信息包括所述第一对象在所述第一图像中的位置,所述第一子图像为根据所述第一对象在所述第一图像中的位置确定的图像;
提取模块,用于从所述第一子图像中提取第一特征向量;
第二获取模块,用于获取所述第一特征向量与第二特征向量之间的目标参数,其中,所述第二特征向量为目标检索库中包括的特征向量;
确定模块,用于在所述目标参数符合预定条件的情况下,将所述第一对象确定为目标对象;
所述装置还用于:
所述在获取所述第一特征向量与第二特征向量之间的目标参数之前,获取已标注第一信息的一组第一样本图像以及已标注第二信息的一组第二样本图像,其中,所述第一信息用于指示所述第一样本图像中包含与所述目标对象类别相同的对象,所述第二信息用于指示所述第二样本图像中包含与所述目标对象类别不同的对象;
基于灰度值的图像融合方法将所述一组第一样本图像和所述一组第二样本图像融合,得到所述一组样本图像。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至9任一项中所述的方法的步骤。
12.一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现所述权利要求1至9任一项中所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011589548.6A CN112633297B (zh) | 2020-12-28 | 2020-12-28 | 目标对象的识别方法、装置、存储介质以及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011589548.6A CN112633297B (zh) | 2020-12-28 | 2020-12-28 | 目标对象的识别方法、装置、存储介质以及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112633297A CN112633297A (zh) | 2021-04-09 |
CN112633297B true CN112633297B (zh) | 2023-04-07 |
Family
ID=75285909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011589548.6A Active CN112633297B (zh) | 2020-12-28 | 2020-12-28 | 目标对象的识别方法、装置、存储介质以及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112633297B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949606A (zh) * | 2021-04-14 | 2021-06-11 | 浙江大华技术股份有限公司 | 工服穿戴状态检测方法、装置、存储介质及电子装置 |
CN113255828B (zh) * | 2021-06-17 | 2021-10-15 | 长沙海信智能系统研究院有限公司 | 特征检索方法、装置、设备及计算机存储介质 |
CN113435515B (zh) * | 2021-06-29 | 2023-12-19 | 青岛海尔科技有限公司 | 图片识别方法和装置、存储介质及电子设备 |
CN117218356A (zh) * | 2022-06-01 | 2023-12-12 | 深圳先进技术研究院 | 图像识别方法及装置 |
CN115061769B (zh) * | 2022-08-08 | 2022-11-11 | 杭州实在智能科技有限公司 | 用于支持跨分辨率的自迭代rpa界面元素匹配方法及系统 |
CN115546536A (zh) * | 2022-09-22 | 2022-12-30 | 南京森林警察学院 | 一种象牙制品识别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241868A (zh) * | 2018-08-16 | 2019-01-18 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
WO2019119505A1 (zh) * | 2017-12-18 | 2019-06-27 | 深圳云天励飞技术有限公司 | 人脸识别的方法和装置、计算机装置及存储介质 |
CN110147710A (zh) * | 2018-12-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 人脸特征的处理方法、装置和存储介质 |
CN111539456A (zh) * | 2020-04-02 | 2020-08-14 | 浙江华睿科技有限公司 | 一种目标识别方法及设备 |
WO2020221177A1 (zh) * | 2019-04-30 | 2020-11-05 | 深圳数字生命研究院 | 图像的识别方法及装置、存储介质和电子装置 |
EP3754548A1 (en) * | 2019-06-17 | 2020-12-23 | Sap Se | A method for recognizing an object in an image using features vectors of an encoding neural network |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019100436A1 (en) * | 2017-11-22 | 2019-05-31 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
-
2020
- 2020-12-28 CN CN202011589548.6A patent/CN112633297B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019119505A1 (zh) * | 2017-12-18 | 2019-06-27 | 深圳云天励飞技术有限公司 | 人脸识别的方法和装置、计算机装置及存储介质 |
CN109241868A (zh) * | 2018-08-16 | 2019-01-18 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
CN110147710A (zh) * | 2018-12-10 | 2019-08-20 | 腾讯科技(深圳)有限公司 | 人脸特征的处理方法、装置和存储介质 |
WO2020221177A1 (zh) * | 2019-04-30 | 2020-11-05 | 深圳数字生命研究院 | 图像的识别方法及装置、存储介质和电子装置 |
EP3754548A1 (en) * | 2019-06-17 | 2020-12-23 | Sap Se | A method for recognizing an object in an image using features vectors of an encoding neural network |
CN111539456A (zh) * | 2020-04-02 | 2020-08-14 | 浙江华睿科技有限公司 | 一种目标识别方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112633297A (zh) | 2021-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112633297B (zh) | 目标对象的识别方法、装置、存储介质以及电子装置 | |
US11681418B2 (en) | Multi-sample whole slide image processing in digital pathology via multi-resolution registration and machine learning | |
US10410353B2 (en) | Multi-label semantic boundary detection system | |
An et al. | Scene learning for cloud detection on remote-sensing images | |
KR20160143494A (ko) | 현저성 정보 취득 장치 및 현저성 정보 취득 방법 | |
CN106203539B (zh) | 识别集装箱箱号的方法和装置 | |
CN113962274B (zh) | 一种异常识别方法、装置、电子设备及存储介质 | |
CN113361495A (zh) | 人脸图像相似度的计算方法、装置、设备及存储介质 | |
CN111553422A (zh) | 手术器械自动识别回收方法及系统 | |
Song et al. | Robust and parallel Uyghur text localization in complex background images | |
CN113792623B (zh) | 安检ct目标物识别方法和装置 | |
CN112712066B (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
CN112257506A (zh) | 果蔬大小识别方法、装置、电子设备以及计算机可读介质 | |
CN109558771B (zh) | 海上船舶的行为状态识别方法、装置、设备及存储介质 | |
CN110610177A (zh) | 字符识别模型的训练方法、字符识别方法及装置 | |
US20230196748A1 (en) | Method and system for training neural network for entity detection | |
CN113780116A (zh) | 发票分类方法、装置、计算机设备和存储介质 | |
CN113420767A (zh) | 一种用于字体分类的特征提取方法、系统和装置 | |
Chica et al. | Standard methods for inexpensive pollen loads authentication by means of computer vision and machine learning | |
CN113837174A (zh) | 目标对象识别方法、装置及计算机设备 | |
CN111339904B (zh) | 动物精子图像识别方法和装置 | |
Qin | Text Spotting in the Wild | |
CN117893756A (zh) | 图像分割模型的训练方法、手持物识别方法、设备及介质 | |
CN114495198A (zh) | 图像处理方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |