CN111144294A - 目标识别方法、装置、计算机设备及可读存储介质 - Google Patents
目标识别方法、装置、计算机设备及可读存储介质 Download PDFInfo
- Publication number
- CN111144294A CN111144294A CN201911365571.4A CN201911365571A CN111144294A CN 111144294 A CN111144294 A CN 111144294A CN 201911365571 A CN201911365571 A CN 201911365571A CN 111144294 A CN111144294 A CN 111144294A
- Authority
- CN
- China
- Prior art keywords
- target
- initial
- neural network
- network model
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提供一种目标识别方法、装置、计算机设备以及可读存储介质,该方法包括对图像数据进行预处理,得到预处理后的图像数据,将预处理后的图像数据输入至目标卷积神经网络模型,通过目标卷积神经网络模型对预处理后的图像数据进行目标识别处理,得到初始特征向量,对初始特征向量与预设特征向量进行运算处理,得到初始特征向量与预设特征向量之间的初始间隔距离,通过初始间隔距离从图像数据中确定目标图像;该方法可以采用目标卷积神经网络模型对完整的图像数据进行目标识别处理,实现目标与背景之间的特征分离,得到准确的初始特征向量,进而根据待识别的目标对应的预设特征向量与初始特征向量,确定目标所在图像,提高目标识别的准确率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种目标识别方法、装置、计算机设备及可读存储介质。
背景技术
随着科学技术的发展,目标重识别任务作为计算机视觉技术中的一个重要分支,在智慧城市、智慧交通等领域存在广泛应用。在这类任务中,一个移动目标可能先后出现在不同的摄像头中,因此,我们需要利用计算机视觉技术中的相关方法来判断不同摄像头中的目标是否属于同一个目标,以实现目标重识别任务。其中,移动目标可以为行人或车辆。
传统技术中,将不同摄像头采集到的包含目标的图像,均分割成多个不同的子图像,然后采用卷积神经网络模型对子图像进行特征提取处理,然后对不同子图像提取到的特征进行对比分析,并将所有目标特征合并处理,以得到每个图像的整体目标特征。但是,传统技术中采用分割方式实现目标重识别任务,会导致目标识别的准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高目标识别准确率的目标识别方法、装置、计算机设备及可读存储介质。
本申请实施例提供一种目标识别方法,所述方法包括:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
在其中一个实施例中,所述将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量,包括:
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量;其中,所述过滤处理表征滤除干扰信息的处理。
在其中一个实施例中,所述通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理,得到融合特征向量图;其中,所述融合特征向量图包括目标特征与背景特征融合的特征向量图;
通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量。
在其中一个实施例中,所述通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理,得到第一目标区域特征图;
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行背景卷积运算处理,得到第一背景区域特征图;
通过所述目标卷积神经网络模型将所述第一背景区域特征图进行第一过滤处理,得到第二目标区域特征图;其中,所述第一过滤处理表征滤除所述第一背景区域特征图中背景区域特征的处理;
通过所述目标卷积神经网络模型对所述第一目标区域特征图与所述第二目标区域特征图进行目标卷积运算处理,得到第三目标区域特征图;
通过所述目标卷积神经网络模型对所述第一背景区域特征图进行背景卷积运算处理,得到第二背景区域特征图;
通过所述目标卷积神经网络模型对第三目标区域特征图进行第二过滤处理,得到第三背景区域特征图;其中,所述第二过滤处理表征滤除所述第三目标区域特征图中目标区域特征的处理;
通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量。
在其中一个实施例中,所述通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型根据所述第三背景区域特征图,分别对第三目标区域特征图以及所述第二背景区域特征图进行目标卷积运算处理和背景卷积运算处理,得到目标区域特征图和背景区域特征图,并对所述目标区域特征图和所述背景区域特征图进行交替过滤处理,继续对过滤后的数据与所述目标区域特征图或所述背景区域特征图进行所述目标卷积运算处理或所述背景卷积运算处理,直到得到所有图像数据对应的初始特征向量为止,输出所述初始特征向量。
在其中一个实施例中,所述对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离,包括:
对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离。
在其中一个实施例中,所述对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离,包括:
采用欧式距离计算每个初始特征向量与所述预设特征向量之间的初始间隔距离。
在其中一个实施例中,所述通过所述初始间隔距离从所述图像数据中确定目标图像,包括:
对所有初始间隔距离进行排序处理,按照所有初始间隔距离的排序大小,选取前列的目标间隔距离,并根据所述目标间隔距离对应的图像数据确定目标图像。
在其中一个实施例中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型,包括:
对所述初始卷积神经网络模型进行训练处理,得到基于双向逆注意力机制的目标卷积神经网络模型。
本申请实施例提供一种目标识别装置,所述目标识别装置包括:
预处理模块,用于对图像数据进行预处理,得到预处理后的图像数据;
目标识别模块,用于将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
运算模块,用于对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
确定模块,用于通过所述初始间隔距离从所述图像数据中确定目标图像。
本申请实施例提供一种计算机设备,包括存储器、处理器,所述存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
本申请实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
本实施例提供的目标识别方法、装置、计算机设备及可读存储介质,该方法可以对图像数据进行预处理,得到预处理后的图像数据,将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量,对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离,通过所述初始间隔距离从所述图像数据中确定目标图像;该方法可以采用目标卷积神经网络模型对完整的图像数据进行目标识别处理,实现目标与背景之间的特征分离,得到准确的初始特征向量,进而根据待识别的目标对应的预设特征向量与初始特征向量,确定目标所在图像,提高目标识别的准确率。
附图说明
图1为一实施例提供的目标识别方法的应用场景图;
图2为一实施例提供一种目标识别方法的流程示意图;
图3为一实施例提供的通过训练得到基于双向逆注意力机制的目标卷积神经网络模型的结构示意图;
图4为一实施例提供的一种目标识别装置的结构示意图;
图5为一实施例提供的计算机设备的内部结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供的目标识别方法可应用于图像目标重识别任务,可以适用于目标识别系统,如图1所示,该系统包括计算机设备以及多个摄像设备,其中,图1中仅示出了四个摄像设备。可选的,计算机设备可以为平板电脑、笔记本电脑、台式电脑,还可以为具有仿真代码功能的电子设备,上述摄像设备可以为摄像头,还可以为其它摄像的电子设备,用于采集图像。其中,多个摄像设备可以设置于不同的位置,不同摄像设备可以采集不同位置背景下的不同图像。可选的,多个摄像设备与计算机设备之间可以通过无线连接或有线连接方式进行通信,实现数据传送。其中,无线连接的方式可以是Wi-Fi,移动网络或蓝牙连接。可选的,多个摄像设备可以将采集到图像,传输至计算机设备,计算机设备可以接收不同摄像设备发送的图像,并读取其中的图像数据,采用基于双向逆注意力机制的目标卷积神经网络模型进行目标识别处理,得到初始特征向量,进而计算机设备对初始特征向量与预先设定的目标对应的预设特征向量进行运算处理,以确定目标图像。在下述实施例中将介绍目标识别方法的具体过程。
需要说明的是,本公开实施例提供的目标识别方法,其执行主体可以是目标识别装置,该目标识别装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图2为一实施例提供的目标识别方法的流程示意图。本实施例涉及的是如何对图像数据进行处理确定目标图像的过程。如图2所示,该方法包括:
步骤S1000、对图像数据进行预处理,得到预处理后的图像数据。
在本实施例中,计算机设备在对图像数据进行处理之前,计算机设备可以将不同摄像设备发送的多张图像的大小调整为统一尺寸的图像后,在读取调整尺寸后的图像数据。然后,计算机设备对调整尺寸后的图像数据进行预处理。可选的,预处理可以表征为对图像数据去除噪声信号的处理,还可以表征为对图像数据进行归一化处理。在本实施例中,上述预处理可以为通道去均值方法。
步骤S2000、将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型。
可选的,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型,可以通过以下过程实现:对所述初始卷积神经网络模型进行训练处理,得到基于双向逆注意力机制的目标卷积神经网络模型。
具体的,初始卷积神经网络模型可以通过三个传统的卷积神经网络模型组合而成的模型,传统的卷积神经网络模型可以通过卷积层、激活层和BN层组成。可选的,计算机设备可以对初始卷积神经网络模型中的节点参数进行初始化,通过训练集和测试集,对初始化后的初始卷积神经网络模型进行训练处理,得到基于双向逆注意力机制的目标卷积神经网络模型。其中,训练集和测试集可以包括多个摄像设备采集到的历史图像数据、历史图像中目标的编号以及不同图像所对应的摄像设备编号;但是,测试集可以为摄像设备实时采集的图像数据。可选的,不同历史图像中,不同目标的编号可以不同,相同目标的编号可以相同,不同摄像设备对应的编号也不相同,编号可以用数值表示。可选的,通过训练得到的基于双向逆注意力机制的目标卷积神经网络模型可以通过图3的结构表示,图3中仅示出了支路B1和B2中4层卷积神经网络模型,标号分别为①、②、③和④,其中,干路A可以为一个传统的卷积神经网络模型,支路B1和B2也分别为一个传统的卷积神经网络模型,支路B1和B2之间可以通过IAi双向传输数据,并通过IAi,用于实现过滤处理,该IAi可以为逆注意力机制模块,矩形方框可以表示数据的卷积运算,G表示池化函数,F_p表示支路B1输出的目标对应的初始特征向量,F_c表示支路B2输出的背景特征向量,P_loss表示目标卷积神经网络模型在训练过程中支路B1的损失函数,C_loss表示目标卷积神经网络模型在训练过程中支路B2的损失函数,T_loss表示目标卷积神经网络模型的损失函数;其中,上述池化函数可以用于对特征图进行空间维度的压缩处理,损失函数可以为网络训练过程中的任意一种损失函数。另外,在训练过程中,历史图像中目标的编号以及不同图像所对应的摄像设备编号分别可以作为B1支路和B2支路中的标签数据。
需要说明的是,计算机设备可以将预处理后的图像数据输入至目标卷积神经网络模型,通过目标卷积神经网络模型对预处理后的图像数据进行目标识别处理,得到初始特征向量。在本实施例中,上述目标可以为图像中的行人、车辆,还可以为图像中的其它物体,且在对图像数据进行处理之前,可以确定图像中的目标对应的预设特征向量。可选的,若目标为行人,则上述初始特征向量可以包括多个图像数据中包含不同行人或相同行人的特征向量。
步骤S3000、对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离。
具体的,计算机设备可以对每个初始特征向量与预设特征向量进行运算处理,得到每个初始特征向量与预设特征向量之间的间隔距离,即初始间隔距离。可选的,运算处理可以为算术运算处理或二进制编码处理,还可以为能够计算距离的计算方式。
步骤S4000、通过所述初始间隔距离从所述图像数据中确定目标图像。
具体的,计算机设备可以对步骤S3000得到的所有间隔距离进行排序处理,然后根据排序的结果从所有图像数据中确定目标图像。可选的,排序处理可以表征为按照间隔距离的大小从小到大进行排序,还可以从大到小进行排序,当然,还可以按照任意标准进行排序。
本实施例提供的目标识别方法,该方法包括对图像数据进行预处理,得到预处理后的图像数据,将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量,对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离,通过所述初始间隔距离从所述图像数据中确定目标图像;该方法可以采用目标卷积神经网络模型对完整的图像数据进行目标识别处理,实现目标与背景之间的特征分离,得到准确的初始特征向量,以降低图像分割方式识别目标导致的识别误差,进而根据待识别的目标对应的预设特征向量与初始特征向量,确定目标所在图像,提高目标识别的准确率。
作为其中一个实施例,在步骤S2000中将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量的过程,可以通过以下步骤实现:
步骤S2100、通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量;其中,所述过滤处理表征滤除干扰信息的处理。
在本实施例中,上述特征提取处理可以包括对边缘特征提取方法、颜色特征提取方法、纹理特征提取方法,还可以包括其它图像浅层特征提取方法。可选的,上述过滤处理可以为滤除对当前处理的特征不重要的干扰特征。可选的,上述卷积运算处理可以包括群卷积处理、分组卷积处理、点卷积处理、可分离卷积处理、深度卷积处理或空洞卷积处理等等。
可选的,上述步骤S2100中通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量的过程,可以通过以下步骤实现:
步骤S2110、通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理,得到融合特征向量图;其中,所述融合特征向量图包括目标特征与背景特征融合的特征向量图。
具体的,计算机设备可以通过基于双向逆注意力机制的目标卷积神经网络模型,对待处理后的图像数据进行特征提取处理,得到融合目标特征与背景特征的融合特征向量图。可选的,目标可以为待识别的任何物体或行人,背景可以为图像中除目标以外的其它图像。
步骤S2120、通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量。
具体的,计算机设备可以通过目标卷积神经网络模型对融合特征向量图不断进行目标卷积运算处理以及过滤处理,得到初始特征向量。可选的,初始特征向量可以为所有包含目标的图像对应的特征向量。
可选的,上述步骤S2120中通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量的过程,具体可以包括以下步骤:
步骤S2121、通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理,得到第一目标区域特征图。
需要说明的是,计算机设备可以通过目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理;其中,目标卷积运算处理均可以通过图3中的B1支路实现。可选的,步骤S2121可以通过B1支路和B2支路这两条支路中的第①层卷积神经网络模型中的B1支路实现。可选的,目标卷积运算处理可以为传统的卷积处理。
步骤S2122、通过所述目标卷积神经网络模型对所述预处理后的图像数据进行背景卷积运算处理,得到第一背景区域特征图。
进一步地,计算机设备可以通过目标卷积神经网络模型对预处理后的图像数据进行背景卷积运算处理;其中,背景卷积运算处理可以通过图3中的B2支路实现。可选的,背景卷积运算处理也可以为传统的卷积处理,但是,B2支路的网络模型节点参数可以与B1支路的网络模型节点参数不相同。其中,图3中的支路B1可以不断提取融合特征向量图中的目标特征向量,因此,支路B1主要关注融合特征向量图中的目标特征。可选的,步骤S2122可以通过B1支路和B2支路这两条支路中的第①层卷积神经网络模型中的B2支路实现。
步骤S2123、通过所述目标卷积神经网络模型将所述第一背景区域特征图进行第一过滤处理,得到第二目标区域特征图;其中,所述第一过滤处理表征滤除所述第一背景区域特征图中背景区域特征的处理。
具体的,计算机设备可以通过目标卷积神经网络模型将第一背景区域特征图进行第一过滤处理,第一过滤处理可以表征为对第一背景区域特征图中的背景特征进行一次过滤的过程。其中,第一过滤处理可以通过图3中的B1支路和B2支路这两条支路中的第①层卷积神经网络模型中的逆注意力机制模块IA1实现,第一过滤处理可以为传统过滤信号的方法。
步骤S2124、通过所述目标卷积神经网络模型对所述第一目标区域特征图与所述第二目标区域特征图进行目标卷积运算处理,得到第三目标区域特征图。
具体的,计算机设备可以继续通过B1支路和B2支路这两条支路中的第②层卷积神经网络模型中的B1支路实现。可选的,计算机设备可以通过第①层卷积神经网络模型中的B1支路输出的第一目标区域特征图,与第①层卷积神经网络模型中的逆注意力机制模块IA1输出的第二目标区域特征图进行目标卷积运算处理,得到第三目标区域特征图。其中,第②层卷积神经网络模型中的B1支路得到的第三目标区域特征图,是在第一目标区域特征图的基础上,滤除掉一部分非关键特征得到的目标区域特征图;此时的非关键特征可以表征为背景特征,也可以表征为B1支路关注度较低的特征。
步骤S2125、通过所述目标卷积神经网络模型对所述第一背景区域特征图进行背景卷积运算处理,得到第二背景区域特征图。
具体的,计算机设备可以通过B1支路和B2支路这两条支路中的第②层卷积神经网络模型中的B2支路实现,计算机设备可以通过第②层卷积神经网络模型中的B2支路,对第①层卷积神经网络模型中的B2支路输出的第一背景区域特征图进行背景卷积运算处理,得到第二背景区域特征图。其中,第②层卷积神经网络模型中的B2支路得到的第二背景区域特征图,是在第一背景区域特征图的基础上,滤除掉一部分非关键特征得到的背景区域特征图;此时的非关键特征可以表征为目标特征,也可以表征为B2支路关注度较低的特征。
步骤S2126、通过所述目标卷积神经网络模型对第三目标区域特征图进行第二过滤处理,得到第三背景区域特征图;其中,所述第二过滤处理表征滤除所述第三目标区域特征图中目标区域特征的处理。
具体的,计算机设备可以通过第②层卷积神经网络模型中的逆注意力机制模块IA2,对第②层卷积神经网络模型中B1支路输出的第三目标区域特征图进行第二过滤处理,第二过滤处理可以表征为对第三目标区域特征图中的目标特征进行一次过滤的过程。其中,第二过滤处理也可以为传统过滤信号的方法。
步骤S2127、通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量。
具体的,计算机设备可以根据第②层卷积神经网络模型中的逆注意力机制模块IA2输出的第三背景区域特征图,采用目标卷积神经网络模型中其它层卷积神经网络模型中的B1支路、B2支路以及逆注意力机制模块IAi(i可以大于等于3),不断交替对第三目标区域特征图以及第二背景区域特征图进行融合处理,以得到最终的初始特征向量。可选的,融合处理可以包括目标卷积运算处理、背景卷积运算处理以及过滤处理。其中,目标卷积神经网络模型中支路部分可以有n层卷积神经网络模型,n可以根据实际训练网络模型时确定具体支路的网络层数。
可选的,上述步骤S2127中通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量的过程,具体可以通过以下步骤实现:通过所述目标卷积神经网络模型根据所述第三背景区域特征图,分别对第三目标区域特征图以及所述第二背景区域特征图进行目标卷积运算处理和背景卷积运算处理,得到目标区域特征图和背景区域特征图,并对所述目标区域特征图和所述背景区域特征图进行交替过滤处理,继续对过滤后的数据与所述目标区域特征图或所述背景区域特征图进行所述目标卷积运算处理或所述背景卷积运算处理,直到得到所有图像数据对应的初始特征向量为止,输出所述初始特征向量。
需要说明的是,计算机设备可以根据第②层卷积神经网络模型中的逆注意力机制模块IA2输出的第三背景区域特征图,采用目标卷积神经网络模型中第三层之后的其它层卷积神经网络模型中的B1支路以及B2支路(i可以大于等于3),不断交替对第三目标区域特征图以及第二背景区域特征图进行目标卷积运算处理和背景卷积运算处理,得到目标区域特征图和背景区域特征图,并根据每层卷积神经网络模型中的逆注意力机制模块IAi,对目标区域特征图和背景区域特征图进行交替过滤处理,直到得到所有图像数据对应的初始特征向量为止,输出所有初始特征向量。
本实施例提供的目标识别方法,该方法包括通过目标卷积神经网络模型对预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到初始特征向量;该方法可以采用目标卷积神经网络模型对完整的图像数据进行目标识别处理,实现目标与背景之间的特征分离,得到准确的初始特征向量,以降低图像分割方式识别目标导致的识别误差,进而根据待识别的目标对应的预设特征向量与初始特征向量,确定目标所在图像,提高目标识别的准确率。
作为其中一个实施例,上述步骤S3000中对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离的过程,可以包括以下步骤:
步骤S3100、对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离。
具体的,初始特征向量可以表征图像中对应目标区域的特征向量。可选的,预设特征向量可以表征为待识别目标的原始图像中目标区域内所有点的特征,该预设特征向量可以在本实施例执行前设定的目标的特征向量。可选的,待识别目标的原始图像可以理解为待识别目标的样本图像。在本实施例中,运算处理可以为距离运算处理,该距离计算处理可以为欧式距离计算方法、曼哈顿距离计算方法、切比雪夫距离计算方法或马氏距离计算方法,还可以为其它距离计算方法。
可选的,上述步骤S3100中对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离的过程,具体可以包括:采用欧式距离计算每个初始特征向量与所述预设特征向量之间的初始间隔距离。
在本实施例中,计算机设备可以采用欧式距离计算方法,对每个初始特征向量与预设特征向量进行距离计算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离。
进一步地,上述步骤S4000中通过所述初始间隔距离从所述图像数据中确定目标图像的过程,具体可以通过以下步骤实现:对所有初始间隔距离进行排序处理,按照所有初始间隔距离的排序大小,选取前列的目标间隔距离,并根据所述目标间隔距离对应的图像数据确定目标图像。
在本实施例中,计算机设备可以对步骤S3100得到的所有初始间隔距离按照从小到大的顺序进行排序处理,或者对所有初始间隔距离按照从大到小的顺序进行排序处理,并将位于排序结果前列的初始间隔距离对应的初始特征向量所对应的图像数据选定为目标图像数据;然后将目标图像数据对应的图像可以确定为目标图像。其中,目标图像中可以包含识别的目标。可选的,计算机设备可以根据实际需求确定,选定排序结果前列的初始间隔距离的数量;该数量可以大于1。
本实施例提供的目标识别方法,该方法可以对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离,进而所有初始间隔距离确定目标图像;该方法可以通过得到的完整准确的初始特征向量,以确定目标图像,降低了图像分割方式识别目标导致的识别误差,进而根据待识别的目标对应的预设特征向量与初始特征向量,确定目标所在图像,提高目标识别的准确率。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
关于目标识别装置的具体限定可以参见上文中对于目标识别方法的限定,在此不再赘述。上述计算机设备的目标识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图4为一实施例提供的目标识别装置的结构示意图。如图4所示,该系统可以包括:预处理模块11、目标识别模块12、运算模块13以及确定模块14。
具体的,所述预处理模块11,用于对图像数据进行预处理,得到预处理后的图像数据;
所述目标识别模块12,用于将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
所述运算模块13,用于对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
所述确定模块14,用于通过所述初始间隔距离从所述图像数据中确定目标图像。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述目标识别模块12包括:处理单元。
其中,所述处理单元,用于通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量;其中,所述过滤处理表征滤除干扰信息的处理。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述处理单元包括:特征提取子单元及处理子单元。
具体的,所述特征提取子单元,用于通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理,得到融合特征向量图;其中,所述融合特征向量图包括目标特征与背景特征融合的特征向量图;
所述处理子单元,用于通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述处理子单元包括:第一目标卷积子单元、第一背景卷积子单元、第一过滤子单元、第二目标卷积子单元、第二背景卷积子单元、第二过滤子单元以及融合子单元。
具体的,所述第一目标卷积子单元,用于通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理,得到第一目标区域特征图;
所述第一背景卷积子单元,用于通过所述目标卷积神经网络模型对所述预处理后的图像数据进行背景卷积运算处理,得到第一背景区域特征图;
所述第一过滤子单元,用于通过所述目标卷积神经网络模型将所述第一背景区域特征图进行第一过滤处理,得到第二目标区域特征图;其中,所述第一过滤处理表征滤除所述第一背景区域特征图中背景区域特征的处理;
所述第二目标卷积子单元,用于通过所述目标卷积神经网络模型对所述第一目标区域特征图与所述第二目标区域特征图进行目标卷积运算处理,得到第三目标区域特征图;
所述第二背景卷积子单元,用于所通过所述目标卷积神经网络模型对所述第一背景区域特征图进行背景卷积运算处理,得到第二背景区域特征图;
所述第二过滤子单元,用于通过所述目标卷积神经网络模型对第三目标区域特征图进行第二过滤处理,得到第三背景区域特征图;其中,所述第二过滤处理表征滤除所述第三目标区域特征图中目标区域特征的处理;
所述融合子单元,用于通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述融合子单元具体用于通过所述目标卷积神经网络模型根据所述第三背景区域特征图,分别对第三目标区域特征图以及所述第二背景区域特征图进行目标卷积运算处理和背景卷积运算处理,得到目标区域特征图和背景区域特征图,并对所述目标区域特征图和所述背景区域特征图进行交替过滤处理,继续对过滤后的数据与所述目标区域特征图或所述背景区域特征图进行所述目标卷积运算处理或所述背景卷积运算处理,直到得到所有图像数据对应的初始特征向量为止,输出所述初始特征向量。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述运算模块13包括计算单元以及排序单元。
其中,所述计算单元,用于对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述计算单元具体用于采用欧式距离计算每个初始特征向量与所述预设特征向量之间的初始间隔距离。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述确定模块14具体用于对所有初始间隔距离进行排序处理,按照所有初始间隔距离的排序大小,选取前列的目标间隔距离,并根据所述目标间隔距离对应的图像数据确定目标图像。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在其中一个实施例中,所述目标识别模块12还包括:训练单元。
具体的,所述训练单元,用于对所述初始卷积神经网络模型进行训练处理,得到基于双向逆注意力机制的目标卷积神经网络模型。
本实施例提供的目标识别装置,可以执行上述方法实施例,其实现原理和技术效果类似,在此不再赘述。
在一个实施例中,提供了一种计算机设备,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的计算机设备通过网络连接通信。该计算机程序被处理器执行时以实现一种目标识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
在一个实施例中,提供了一种可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (11)
1.一种目标识别方法,其特征在于,所述方法包括:
对图像数据进行预处理,得到预处理后的图像数据;
将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
通过所述初始间隔距离从所述图像数据中确定目标图像。
2.根据权利要求1所述的方法,其特征在于,所述将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量,包括:
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量;其中,所述过滤处理表征滤除干扰信息的处理。
3.根据权利要求2所述的方法,其特征在于,所述通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理、卷积运算处理以及过滤处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行特征提取处理,得到融合特征向量图;其中,所述融合特征向量图包括目标特征与背景特征融合的特征向量图;
通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量。
4.根据权利要求3所述的方法,其特征在于,所述通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理以及过滤处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型对融合特征向量图进行目标卷积运算处理,得到第一目标区域特征图;
通过所述目标卷积神经网络模型对所述预处理后的图像数据进行背景卷积运算处理,得到第一背景区域特征图;
通过所述目标卷积神经网络模型将所述第一背景区域特征图进行第一过滤处理,得到第二目标区域特征图;其中,所述第一过滤处理表征滤除所述第一背景区域特征图中背景区域特征的处理;
通过所述目标卷积神经网络模型对所述第一目标区域特征图与所述第二目标区域特征图进行目标卷积运算处理,得到第三目标区域特征图;
通过所述目标卷积神经网络模型对所述第一背景区域特征图进行背景卷积运算处理,得到第二背景区域特征图;
通过所述目标卷积神经网络模型对第三目标区域特征图进行第二过滤处理,得到第三背景区域特征图;其中,所述第二过滤处理表征滤除所述第三目标区域特征图中目标区域特征的处理;
通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量。
5.根据权利要求4所述的方法,其特征在于,所述通过所述目标卷积神经网络模型根据所述第三背景区域特征图,对所述第三目标区域特征图以及所述第二背景区域特征图进行融合处理,得到所述初始特征向量,包括:
通过所述目标卷积神经网络模型根据所述第三背景区域特征图,分别对第三目标区域特征图以及所述第二背景区域特征图进行目标卷积运算处理和背景卷积运算处理,得到目标区域特征图和背景区域特征图,并对所述目标区域特征图和所述背景区域特征图进行交替过滤处理,继续对过滤后的数据与所述目标区域特征图或所述背景区域特征图进行所述目标卷积运算处理或所述背景卷积运算处理,直到得到所有图像数据对应的初始特征向量为止,输出所述初始特征向量。
6.根据权利要求1所述的方法,其特征在于,所述对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离,包括:
对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离;
以及优选地,所述对每个初始特征向量与预设特征向量进行距离运算处理,得到每个初始特征向量与预设特征向量之间的初始间隔距离,包括:
采用欧式距离计算每个初始特征向量与所述预设特征向量之间的初始间隔距离。
7.根据权利要求1所述的方法,其特征在于,所述通过所述初始间隔距离从所述图像数据中确定目标图像,包括:
对所有初始间隔距离进行排序处理,按照所有初始间隔距离的排序大小,选取前列的目标间隔距离,并根据所述目标间隔距离对应的图像数据确定目标图像。
8.根据权利要求1所述的方法,其特征在于,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型,包括:
对所述初始卷积神经网络模型进行训练处理,得到基于双向逆注意力机制的目标卷积神经网络模型。
9.一种目标识别装置,其特征在于,所述装置包括:
预处理模块,用于对图像数据进行预处理,得到预处理后的图像数据;
目标识别模块,用于将所述预处理后的图像数据输入至目标卷积神经网络模型,通过所述目标卷积神经网络模型对所述预处理后的图像数据进行目标识别处理,得到初始特征向量;其中,所述目标卷积神经网络模型为对初始卷积神经网络模型进行训练处理得到的模型;
运算模块,用于对所述初始特征向量与预设特征向量进行运算处理,得到所述初始特征向量与预设特征向量之间的初始间隔距离;
确定模块,用于通过所述初始间隔距离从所述图像数据中确定目标图像。
10.一种计算机设备,包括存储器、处理器,所述存储器上存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述方法的步骤。
11.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911365571.4A CN111144294A (zh) | 2019-12-26 | 2019-12-26 | 目标识别方法、装置、计算机设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911365571.4A CN111144294A (zh) | 2019-12-26 | 2019-12-26 | 目标识别方法、装置、计算机设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111144294A true CN111144294A (zh) | 2020-05-12 |
Family
ID=70520423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911365571.4A Pending CN111144294A (zh) | 2019-12-26 | 2019-12-26 | 目标识别方法、装置、计算机设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111144294A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724133A (zh) * | 2022-04-18 | 2022-07-08 | 北京百度网讯科技有限公司 | 文字检测和模型训练方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203430A (zh) * | 2016-07-07 | 2016-12-07 | 北京航空航天大学 | 一种基于前景聚集度和背景先验的显著性物体检测方法 |
CN107657249A (zh) * | 2017-10-26 | 2018-02-02 | 珠海习悦信息技术有限公司 | 多尺度特征行人重识别的方法、装置、存储介质及处理器 |
CN108776787A (zh) * | 2018-06-04 | 2018-11-09 | 北京京东金融科技控股有限公司 | 图像处理方法及装置、电子设备、存储介质 |
US20190311202A1 (en) * | 2018-04-10 | 2019-10-10 | Adobe Inc. | Video object segmentation by reference-guided mask propagation |
-
2019
- 2019-12-26 CN CN201911365571.4A patent/CN111144294A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106203430A (zh) * | 2016-07-07 | 2016-12-07 | 北京航空航天大学 | 一种基于前景聚集度和背景先验的显著性物体检测方法 |
CN107657249A (zh) * | 2017-10-26 | 2018-02-02 | 珠海习悦信息技术有限公司 | 多尺度特征行人重识别的方法、装置、存储介质及处理器 |
US20190311202A1 (en) * | 2018-04-10 | 2019-10-10 | Adobe Inc. | Video object segmentation by reference-guided mask propagation |
CN108776787A (zh) * | 2018-06-04 | 2018-11-09 | 北京京东金融科技控股有限公司 | 图像处理方法及装置、电子设备、存储介质 |
Non-Patent Citations (2)
Title |
---|
DI CHEN ET AL.: "Person Search via A Mask-guided Two-stream CNN Model" * |
蒋鑫: "基于深度学习的SAR图像目标识别分类研究" * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114724133A (zh) * | 2022-04-18 | 2022-07-08 | 北京百度网讯科技有限公司 | 文字检测和模型训练方法、装置、设备及存储介质 |
CN114724133B (zh) * | 2022-04-18 | 2024-02-02 | 北京百度网讯科技有限公司 | 文字检测和模型训练方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107784282B (zh) | 对象属性的识别方法、装置及系统 | |
CN110852285B (zh) | 对象检测方法、装置、计算机设备和存储介质 | |
CN109961009B (zh) | 基于深度学习的行人检测方法、系统、装置及存储介质 | |
CN107545262B (zh) | 一种在自然场景图像中检测文本的方法及装置 | |
CN107358157B (zh) | 一种人脸活体检测方法、装置以及电子设备 | |
CN112232293B (zh) | 图像处理模型训练、图像处理方法及相关设备 | |
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
CN110674712A (zh) | 交互行为识别方法、装置、计算机设备和存储介质 | |
CN109947967B (zh) | 图像识别方法、装置、存储介质和计算机设备 | |
CN103065134B (zh) | 一种具有提示信息的指纹识别装置和方法 | |
CN107633205B (zh) | 嘴唇动作分析方法、装置及存储介质 | |
CN110490902B (zh) | 应用于智慧城市的目标跟踪方法、装置、计算机设备 | |
CN111626163B (zh) | 一种人脸活体检测方法、装置及计算机设备 | |
CN111626123A (zh) | 视频数据处理方法、装置、计算机设备及存储介质 | |
CN110598687A (zh) | 车辆识别码的检测方法、装置及计算机设备 | |
CN112733767B (zh) | 一种人体关键点检测方法、装置、存储介质及终端设备 | |
CN113343985B (zh) | 车牌识别方法和装置 | |
CN111144398A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN111144372A (zh) | 车辆检测方法、装置、计算机设备和存储介质 | |
CN111709421A (zh) | 鸟类识别方法、装置、计算机设备及存储介质 | |
CN114424258A (zh) | 属性识别方法、装置、存储介质及电子设备 | |
CN111178128A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN111914668A (zh) | 一种基于图像增强技术的行人重识别方法、装置及系统 | |
CN113034514A (zh) | 天空区域分割方法、装置、计算机设备和存储介质 | |
CN115830002A (zh) | 一种红外图像质量评价方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |