CN113283453B - 目标检测方法、装置、计算机设备和存储介质 - Google Patents
目标检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113283453B CN113283453B CN202110659552.3A CN202110659552A CN113283453B CN 113283453 B CN113283453 B CN 113283453B CN 202110659552 A CN202110659552 A CN 202110659552A CN 113283453 B CN113283453 B CN 113283453B
- Authority
- CN
- China
- Prior art keywords
- image
- shape
- fitting
- model
- sample image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标检测方法、装置、计算机设备和存储介质。所述方法包括:获取待检测图像;采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果;目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。目标检测模型的训练过程,包括:获取第一样本图像;获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状;在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,直至达到拟合结束条件,得到目标检测模型。采用本申请实施例方法能够提高图像中的小目标的检测精度。
Description
技术领域
本申请涉及机器学习技术领域,特别是涉及一种目标检测方法、装置、计算机设备和存储介质。
背景技术
目标检测是计算机视觉领域的研究课题之一,主要包括目标识别和目标定位,被广泛应用在飞机序列识别、军事目标检测、机器人导航、人脸识别等领域。其中,占图像的几何面积很小的小目标往往价值更高。小目标是图像中特殊的对象,通常有两种定义方式,一种是相对尺寸的定义,即小目标的尺寸大小占原始图像尺寸大小的0.12%,另一种是绝对尺寸的定义,即小目标的像素大小不超过32像素*32像素。
由于图像中的小目标所占像素点少、特征表示能力弱、受噪声干扰较大等影响,现有的目标检测方法容易造成小目标的误检与漏检,尤其是在卷积神经网络中深层的特征较少甚至丢失,导致图像中的小目标的检测精度不高。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高图像中的小目标的检测精度的目标检测方法、装置、计算机设备和存储介质。
一种目标检测方法,所述方法包括:
获取待检测图像;
采用预先训练的目标检测模型对所述待检测图像进行目标检测,得到所述待检测图像对应的目标检测结果;所述目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。
在其中一个实施例中,所述目标检测模型的训练过程,包括:
获取第一样本图像;
获取初始检测模型,所述初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;
采用所述初始检测模型对所述第一样本图像进行图像检测,得到第一拟合形状;
在基于所述第一拟合形状确定未达到拟合结束条件时,调整所述初始检测模型中的初始抑制信号的强度,返回所述采用所述初始检测模型对第一样本图像进行图像检测的步骤,直至达到所述拟合结束条件,得到目标检测模型。
在其中一个实施例中,所述低秩网络模型的训练过程,包括:
获取第二样本图像;
采用待训练网络模型对所述第二样本图像进行图像检测,得到所述第二样本图像对应的第二拟合形状;
在基于所述第二拟合形状确定未达到模型训练结束条件时,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状,将所述约束后第二拟合形状作为新的第二样本图像,返回所述采用待训练网络模型对所述第二样本图像进行图像检测的步骤,直至达到所述模型训练结束条件,得到低秩网络模型。
在其中一个实施例中,所述采用待训练网络模型对所述第二样本图像进行图像检测,得到所述第二样本图像对应的第二拟合形状,包括:
对所述第二样本图像进行下采样,得到各下采样图像层,提取各所述下采样图像层的下采样图像特征,并建立各所述下采样图像层之间的特征映射关系;
对所述第二样本图像进行上采样,得到各上采样图像层,并根据所述特征映射关系,提取各所述上采样图像层的上采样图像特征;
基于所述下采样图像特征与所述上采样图像特征,得到所述第二样本图像对应的第二拟合形状。
在其中一个实施例中,所述基于所述下采样图像特征与所述上采样图像特征,得到所述第二样本图像对应的第二拟合形状,包括:
基于所述下采样图像特征与所述上采样图像特征,分别得到各所述下采样图像层和各所述上采样图像层对应的子拟合形状;
融合各所述子拟合形状,得到所述第二样本图像对应的第二拟合形状。
在其中一个实施例中,所述对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状,包括:
在所述第二拟合形状为首次对所述第二样本图像进行图像检测得到的形状时,基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,并将所述全局回归映射矩阵作为所述待训练网络模型的约束条件,将所述第二拟合形状作为约束后第二拟合形状;
在所述第二拟合形状为非首次对所述第二样本图像进行图像检测得到的形状时,基于约束条件为所述全局回归映射矩阵的所述待训练网络模型,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状。
在其中一个实施例中,所述基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,包括:
计算所述第二样本图像中预先标定的真实形状,与所述第二拟合形状之间的形状增量;
根据各所述形状增量,构建所述第二样本图像与所述第二拟合形状之间的全局回归映射矩阵。
在其中一个实施例中,所述调整所述初始检测模型中的初始抑制信号的强度,包括:
计算所述第一样本图像与所述第一拟合形状之间的形状误差;
基于所述形状误差,调整所述初始检测模型中的初始抑制信号的强度。
一种目标检测装置,所述装置包括:
图像获取模块,用于获取待检测图像;
目标检测模块,用于采用预先训练的目标检测模型对所述待检测图像进行目标检测,得到所述待检测图像对应的目标检测结果;所述目标检测模型为在低秩网络模型中增加抑制信号后构建的模型;
目标检测模型训练模块,用于训练获得所述目标检测模型,具体包括:获取第一样本图像;获取初始检测模型,所述初始检测模型为在低秩网络模型中增加初始抑制信号或者调整后初始抑制信号后获得的模型;采用所述初始检测模型对所述第一样本图像进行图像检测,得到第一拟合形状;在基于所述第一拟合形状确定未达到拟合结束条件时,调整所述初始抑制信号的强度;在基于所述第一拟合形状确定达到所述拟合结束条件,得到目标检测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的目标检测方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的目标检测方法的步骤。
上述目标检测方法、装置、计算机设备和存储介质,通过获取待检测图像;采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果;目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。目标检测模型的训练过程,包括:获取第一样本图像;获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状;在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,返回采用初始检测模型对第一样本图像进行图像检测的步骤,直至达到拟合结束条件,得到目标检测模型。采用上述实施例方法,通过预先训练得到低秩网络模型,使得后续得到的目标检测模型能够充分提取图像中的小目标的多尺度图像特征,增强对小目标的识别能力,并通过在低秩网络模型中增加抑制信号调整兴奋程度,使得后续得到的目标检测模型能够更好的拟合小目标,从而有效提高图像中的小目标的检测精度,还能够提高鲁棒性。
附图说明
图1为一个实施例中目标检测方法的应用环境图;
图2为一个实施例中目标检测方法的流程示意图;
图3为一个实施例中目标检测模型的训练过程的流程示意图;
图4为一个具体实施例中提取多尺度图像特征的示意图;
图5为一个具体实施例中低秩网络模型的训练过程的示意图;
图6为一个具体实施例中目标检测模型的训练过程的示意图;
图7为一个实施例中目标检测装置的结构框图;
图8为一个实施例中目标检测模型训练模块的结构框图;
图9为一个实施例中计算机设备的内部结构图;
图10为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在其中一个实施例中,本申请提供的目标检测方法,其应用环境可以同时涉及终端102和服务器104,如图1所示,终端102可以通过网络或协议等通信方式与服务器104进行通信。其中,目标检测模型或者低秩网络模型可以由服务器104训练得到,也可以由终端102训练得到。
具体地,以目标检测模型和低秩网络模型均由服务器104训练得到为例,服务器104可以通过终端102获取待检测图像;采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果;目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。其中,目标检测模型的训练过程,包括:获取第一样本图像;获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状;在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,返回采用初始检测模型对第一样本图像进行图像检测的步骤,直至达到拟合结束条件,得到目标检测模型。
在其中一个实施例中,本申请提供的目标检测方法,其应用环境可以只涉及服务器104。具体地,以目标检测模型和低秩网络模型均由服务器104训练得到为例,服务器104可以直接获取待检测图像,并采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果。
在其中一个实施例中,本申请提供的目标检测方法,其应用环境还可以只涉及终端102。具体地,以目标检测模型和低秩网络模型均由终端102训练得到为例,终端102可以获取待检测图像,并采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在其中一个实施例中,如图2所示,提供了一种目标检测方法,以该方法应用于图1中的终端102和/或服务器104为例进行说明,包括以下步骤:
步骤S202,获取待检测图像。
在其中一个实施例中,待检测图像是指用于图像中包含小目标,需要对小目标进行目标检测图像。例如,在飞机序列识别、军事目标检测、机器人导航、人脸识别等领域中进行目标识别、定位和类别检测。其中,小目标包括两种定义方式,一种是相对尺寸的定义,即小目标的尺寸大小占原始图像尺寸大小的0.12%,另一种是绝对尺寸的定义,即小目标的像素大小不超过32像素*32像素。
步骤S204,采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果;目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。
在其中一个实施例中,待检测图像对应的目标检测结果,可以是待检测图像中的小目标的定位结果和分类结果。其中,对待检测图像进行目标检测的网络模型为目标检测模型,目标检测模型通过预先训练得到。具体地,目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。也就是说,先预先训练得到低秩网络模型,根据低秩网络模型,再训练得到目标检测模型。
其中,矩阵的秩为矩阵中不相关的行或列向量的个数。对于图像矩阵而言,矩阵的秩可以表示图像信息的冗余程度、信息量大小以及噪声大小。当图像矩阵为低秩矩阵时,图像的行列相关性大、信息冗余高,因此可以利用低秩矩阵的冗余信息,对图像中的小目标缺失的图像特征进行恢复,训练得到低秩网络模型,提高图像中的小目标的检测精度。
其中,在生物学中,兴奋与抑制是两种相互对立的基本神经过程。兴奋过程表现为有机体某种活动的发动或加强,抑制过程表现为有机体活动的停止或减弱。在卷积神经网络中,卷积层接收输入层的图像,并提取复杂的图像特征。因此,在低秩网络模型的卷积层中增加抑制信号进行训练,并根据输出的拟合形状与真实形状之间的形状误差,从输出层反向传播直至传播到输入层,不断调整输出的拟合形状,精确定位图像中的小目标,最终训练得到目标检测模型,提升图像中的小目标的检测精度。
在其中一个实施例中,如图3所示,提供了一种目标检测方法中的目标检测模型的训练过程,以该训练过程应用于训练得到目标检测模型的终端102和/或服务器104为例进行说明,包括以下步骤:
步骤S302,获取第一样本图像。
其中,将用于训练得到目标检测模型的样本图像称为第一样本图像。具体地,获取第一样本图像。
步骤S304,获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型。
在其中一个实施例中,为了确定目标检测模型中抑制信号的强度,使得到的目标检测模型对小目标的拟合达到最优,第一次训练时,在低秩网络模型中增加初始强度的抑制信号,也称为初始抑制信号,构建得到初始检测模型,并不断调节初始抑制信号的强度,以得到目标检测模型。其中,可以将初始抑制信号的强度设置为1。
在其中一个实施例中,在得到的目标检测模型中,激活函数可以是Sigmoid可微函数。通过简化福岛邦彦设计的作用函数,并利用Sigmoid可微函数实现反向求导,加深卷积神经网络的层级。在每层卷积层的作用函数中引入抑制信号,限制特征输出,提升小目标的定位精度。本申请的目标检测模型的作用函数是兴奋信号和抑制信号共同作用的结果。其中,作用函数所示如下:
y=WlUcl-blVcl
其中,Wl为低秩网络模型的第l级卷积层的权值,即兴奋信号,Ucl表示第l级卷积层的神经元,Vcl为作用在第l级卷积层上的抑制信号,bl为抑制信号系数,在第一次训练时设置为1。抑制信号公式如下:
其中,rl为选择度,用于控制抑制信号的强度。rl的值越大,对于卷积层中指定神经元的响应越具有可选择性。
步骤S306,采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状。
在其中一个实施例中,采用初始检测模型对第一样本图像进行图像检测,将初始检测模型输出的对第一样本图像中的小目标的拟合形状,称为第一拟合形状。以便后续可以通过第一样本图像中小目标的真实形状与输出的第一拟合形状之间的误差,来确定增加了初始抑制信号后的初始检测模型,能否作为最终的目标检测模型。其中,第一样本图像中小目标的真实形状可以在训练之前进行标注,作为模型训练时的监督信息。标注方式可以是语义分割、点云标注、矩形框标注、关键点标注等。
步骤S308,在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,返回采用初始检测模型对第一样本图像进行图像检测的步骤,直至达到拟合结束条件,得到目标检测模型。
在其中一个实施例中,拟合结束条件可以是第一拟合形状与第一样本图像的真实形状之间的误差大小,还可以是第一拟合形状与真实形状之间的相似度。具体地,可以计算第一拟合形状与真实形状之间误差或者相似度,与预先设定的误差阈值或者相似度阈值进行比较,确定是否达到拟合结束条件。
在其中一个实施例中,在基于第一拟合形状确定未达到拟合结束条件时,需要调整初始抑制信号的强度,将调整后的抑制信号作为新的初始抑制信号,获取对应的初始检测模型,并返回步骤S304,直至达到拟合结束条件,将满足拟合结束条件的初始检测模型,作为最终得到的目标检测模型。
上述目标检测方法中,通过获取待检测图像;采用预先训练的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果;目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。目标检测模型的训练过程,包括:获取第一样本图像;获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状;在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,返回采用初始检测模型对第一样本图像进行图像检测的步骤,直至达到拟合结束条件,得到目标检测模型。采用上述实施例方法,通过预先训练得到低秩网络模型,使得后续得到的目标检测模型能够充分提取图像中的小目标的多尺度图像特征,增强对小目标的识别能力,并通过在低秩网络模型中增加抑制信号调整兴奋程度,使得后续得到的目标检测模型能够更好的拟合小目标,从而有效提高图像中的小目标的检测精度,还能够提高鲁棒性。
在其中一个实施例中,低秩网络模型的训练过程,包括:
步骤S402,获取第二样本图像。
其中,将用于训练得到低秩网络模型的样本图像称为第二样本图像,第二样本图像与第一样本图像可以相同,也可以不相同。具体地,获取第二样本图像。
步骤S404,采用待训练网络模型对第二样本图像进行图像检测,得到第二样本图像对应的第二拟合形状。
在其中一个实施例中,采用待训练网络模型对第二样本图像进行图像检测,将待训练网络模型输出的对第二样本图像中的小目标的拟合形状,称为第二拟合形状。以便后续可以通过第二样本图像中小目标的真实形状与输出的第二拟合形状之间的误差,来确定是否训练得到了低秩网络模型。其中,第二样本图像中小目标的真实形状可以在训练之前进行标注,作为模型训练时的监督信息。标注方式可以是语义分割、点云标注、矩形框标注、关键点标注等。
步骤S406,在基于第二拟合形状确定未达到模型训练结束条件时,对第二拟合形状进行低秩约束,得到约束后第二拟合形状,将约束后第二拟合形状作为新的第二样本图像,返回采用待训练网络模型对第二样本图像进行图像检测的步骤,直至达到模型训练结束条件,得到低秩网络模型。
在其中一个实施例中,模型训练结束条件可以是第二拟合形状与第二样本图像的真实形状之间的误差大小,还可以是第二拟合形状与真实形状之间的相似度。具体地,可以计算第二拟合形状与真实形状之间误差或者相似度,与预先设定的误差阈值或者相似度阈值进行比较,确定是否达到模型训练结束条件。
在其中一个实施例中,在基于第二拟合形状确定未达到模型训练结束条件时,需要对第二拟合形状进行低秩约束,得到约束后第二拟合形状。其中,对第二拟合形状进行低秩约束,通过图像矩阵中像素点之间的相关性,恢复训练时小目标缺失的图像特征。并将约束后第二拟合形状作为新的第二样本图像,返回步骤S404进行迭代训练,模型训练结束条件,训练后得到低秩网络模型。
在其中一个实施例中,步骤S404采用待训练网络模型对第二样本图像进行图像检测,得到第二样本图像对应的第二拟合形状,包括:
步骤S502,对第二样本图像进行下采样,得到各下采样图像层,提取各下采样图像层的下采样图像特征,并建立各下采样图像层之间的特征映射关系。
在其中一个实施例中,为了提取图像中的小目标更多的图像特征,构建横向连接的多尺度结构,包括自下而上阶段和自上而下阶段,充分融合多尺度的特征信息。具体地,在自下而上阶段,对第二样本图像进行下采样,得到的各图像层为下采样图像层,提取的各下采样图像层的图像特征称为下采样图像特征。也就是,先提取高分辨率图像层中大尺度的小目标的特征信息,再逐渐压缩图像,减小分辨率,增大感受野,提取低分辨率图像层中小尺度的小目标的特征信息。此时,根据提取的高分辨率、低分辨率图像层的特征信息,得到由大到小尺度之间的特征映射关系,即,得到各下采样图像层之间的特征映射关系。
步骤S504,对第二样本图像进行上采样,得到各上采样图像层,并根据特征映射关系,提取各上采样图像层的上采样图像特征。
在其中一个实施例中,在自上而下阶段,通过横向连接,重复利用高分辨率图像层中大尺度的小目标的特征信息,有利于小目标检测。具体地,对第二样本图像进行上采样,得到的各图像层为上采样图像层,提取的各上采样图像层的图像特征称为上采样图像特征。也就是,根据各下采样图像层之间的特征映射关系,提取各上采样图像层的上采样图像特征。
步骤S506,基于下采样图像特征与上采样图像特征,得到第二样本图像对应的第二拟合形状。
在其中一个实施例中,基于下采样图像特征与上采样图像特征,以及建立的特征映射关系,充分将图像特征进行融合,得到第二样本图像对应的第二拟合形状,并使最终得到的低秩网络模型具有尺度不变性。
在其中一个实施例中,步骤S506基于下采样图像特征与上采样图像特征,得到第二样本图像对应的第二拟合形状,包括:
步骤S602,基于下采样图像特征与上采样图像特征,分别得到各下采样图像层和各上采样图像层对应的子拟合形状。
在其中一个实施例中,对第二样本图像分别进行下采样和上采样后,得到了多层下采样图像层和上采样图像层。训练时,会基于下采样图像特征与上采样图像特征,对于每一层图像层,均输出对应的拟合形状,称为子拟合形状,以增强对尺度变化的鲁棒性,提高检测性能。
步骤S604,融合各子拟合形状,得到第二样本图像对应的第二拟合形状。
在其中一个实施例中,可以对各子拟合形状进行融合,得到第二样本图像对应的第二拟合形状。具体地,可以根据各子拟合形状对应的权重,融合各子拟合形状。
在其中一个实施例中,步骤S406中对第二拟合形状进行低秩约束,得到约束后第二拟合形状。其中,在第二拟合形状为首次对第二样本图像进行图像检测得到的形状时,也就是,第一次运行待训练网络模型后得到的第二拟合形状。此时,为了恢复缺失的图像特征,可以基于第二样本图像和第二拟合形状构建全局回归映射矩阵,并将全局回归映射矩阵作为待训练网络模型的约束条件,将第二拟合形状作为约束后第二拟合形状,将约束后第二拟合形状作为新的第二样本图像,继续运行待训练网络模型进行迭代训练。
在其中一个实施例中,基于第二样本图像和第二拟合形状构建全局回归映射矩阵,包括:
步骤S702,计算第二样本图像中预先标定的真实形状,与第二拟合形状之间的形状增量。
在其中一个实施例中,在第二样本图像中包括对小目标的预先标定的真实形状,作为模型训练时的监督信息。具体地,将第二样本图像中预先标定的真实形状表示为S,将第二拟合图像表示为SL,形状增量表示为ΔS,ΔS=S-SL。
步骤S704,根据各形状增量,构建第二样本图像与第二拟合形状之间的全局回归映射矩阵。
具体地,将第二样本图像与第二拟合形状之间的全局回归映射矩阵表示为T,全局回归映射矩阵还会随着低秩网络模型的训练过程而不断的调整和优化。
在其中一个实施例中,步骤S406中对第二拟合形状进行低秩约束,得到约束后第二拟合形状。其中,在第二拟合形状为非首次对第二样本图像进行图像检测得到的形状时,也就是,第一次运行已经确定了待训练网络模型的约束条件,此时,可以基于约束条件为全局回归映射矩阵的待训练网络模型,对第二拟合形状进行低秩约束,也就是,待训练网络模型可以通过全局回归映射矩阵进行低秩学习,得到约束后第二拟合形状,最终训练得到低秩网络模型。
具体地,将第二样本图像表示为X,则约束后第二拟合形状表示为:
在其中一个实施例中,在对第二拟合形状进行低秩约束时,需要将第二拟合形状,也就是新的第二样本图像,分离为噪声和去噪数据,对去噪数据进行低秩约束。另外,还可以对噪声做稀疏约束。将分离的第二样本图像表示为:
s.t.X=D+E
其中,s.t.X分离的第二样本图像,D表示第二样本图像的去噪数据,E表示第二样本图像的噪声。
在其中一个实施例中,最终确定的低秩网络模型中的损失函数为低秩损失函数,将低秩损失函数表示为:
其中,LRank表示低秩损失函数,Rank表示图像矩阵的秩,T表示全局回归映射矩阵,表示第二样本图像的去噪数据的齐次形式。
在其中一个实施例中,步骤S308中调整初始检测模型中的初始抑制信号的强度,包括:
步骤S802,计算第一样本图像与第一拟合形状之间的形状误差。
在其中一个实施例中,在低秩网络模型的卷积层中增加抑制信号进行训练,并根据输出的拟合形状与真实形状之间的形状误差,从输出层反向传播直至传播到输入层。具体地,可以计算第一样本图像与第一拟合形状之间的形状误差,计算方式与步骤S702中的计算方式相同。
步骤S804,基于形状误差,调整初始检测模型中的初始抑制信号的强度。
在其中一个实施例中,可以基于形状误差,调整初始检测模型中的初始抑制信号的强度,也就是,不断调整输出的拟合形状,使其达到最佳。其中,初始检测模型输出的第一样本图像对应的第一拟合形状,可以表示为:
S′L=[Wl,T]D′Vcl
其中,SL′表示第一拟合形状,T表示全局回归映射矩阵,Wl为低秩网络模型的第l级卷积层的权值,即兴奋信号,D′表示第一样本图像的去噪数据,Vcl为作用在第l级卷积层上的抑制信号。
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及其中一个具体实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在其中一个实施例中,需要先训练得到低秩网络模型,再在低秩网络模型中增加抑制信号,训练得到目标检测模型。目标检测方法的具体步骤如下:
一、低秩网络模型的训练过程
获取第二样本图像X;
如图4所示,构建横向连接的多尺度结构,基于待训练网络模型对第二样本图像分别进行下采样和上采样,提取第二样本图像的图像特征,得到第二样本图像对应的第二拟合形状SL;
如图5所示,计算第二样本图像中预先标定的真实形状S,与第二拟合形状之间的形状增量ΔS,ΔS=S-SL,构建第二样本图像与第二拟合形状之间的全局回归映射矩阵T;
将全局回归映射矩阵T作为待训练网络模型的约束条件,对第二拟合形状进行低秩约束,得到约束后第二拟合形状,表示为
将约束后第二拟合形状作为新的第二样本图像,返回采用待训练网络模型对第二样本图像进行图像检测的步骤,直至达到模型训练结束条件,得到低秩网络模型。
二、目标检测模型的训练过程
如图6所示,获取第一样本图像;
获取初始检测模型,初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型,采用初始检测模型对第一样本图像进行图像检测,得到第一拟合形状;
在基于第一拟合形状确定未达到拟合结束条件时,调整初始检测模型中的初始抑制信号的强度,返回采用初始检测模型对第一样本图像进行图像检测的步骤,直至达到拟合结束条件,得到目标检测模型。
三、目标检测过程
获取待检测图像;
采用上述训练得到的目标检测模型对待检测图像进行目标检测,得到待检测图像对应的目标检测结果。
应该理解的是,虽然图2和图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2和图3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在其中一个实施例中,如图7所示,提供了一种目标检测装置,包括:图像获取模块710、目标检测模块720和目标检测模型训练模块730,其中:
图像获取模块710,用于获取待检测图像。
目标检测模块720,用于采用预先训练的目标检测模型对所述待检测图像进行目标检测,得到所述待检测图像对应的目标检测结果;所述目标检测模型为在低秩网络模型中增加抑制信号后构建的模型。
目标检测模型训练模块730,用于训练获得所述目标检测模型。
在其中一个实施例中,如图8所示,提供了一种目标检测模型训练模块730,包括:第一样本图像获取模块810、初始检测模型获取模块820、第一图像检测模块830、拟合结束判定模块840和参数调整模块850,其中:
第一样本图像获取模块810,用于获取第一样本图像。
初始检测模型获取模块820,用于获取初始检测模型,所述初始检测模型为在低秩网络模型中增加初始抑制信号,或者参数调整模块850确定的初始抑制信号后,获得的模型。
第一图像检测模块830,用于采用所述初始检测模型对所述第一样本图像进行图像检测,得到第一拟合形状。
拟合结束判定模块840,用于基于所述第一拟合形状确定是否达到拟合结束条件,在基于所述第一拟合形状确定达到所述拟合结束条件时,得到目标检测模型。
参数调整模块850,用于所述拟合结束判定模块840在基于所述第一拟合形状确定未达到拟合结束条件时,调整所述初始检测模型中的初始抑制信号的强度。
在其中一个实施例中,提供了一种低秩网络模型训练模块,包括:第二样本图像获取模块、第二图像检测模块、训练结束判定模块和拟合形状约束模块,其中:
第二样本图像获取模块,用于获取第二样本图像。
第二图像检测模块,用于采用待训练网络模型对所述第二样本图像进行图像检测,得到所述第二样本图像对应的第二拟合形状。
训练结束判定模块,用于基于所述第二拟合形状确定是否达到模型训练结束条件,在基于所述第二拟合形状确定达到所述模型训练结束条件时,得到低秩网络模型。
拟合形状约束模块,用于所述训练结束判定模块在基于所述第二拟合形状确定未达到所述模型训练结束条件时,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状,将所述约束后第二拟合形状作为新的第二样本图像。
在其中一个实施例中,第二图像检测模块包括以下单元:
下采样单元,用于对所述第二样本图像进行下采样,得到各下采样图像层,提取各所述下采样图像层的下采样图像特征,并建立各所述下采样图像层之间的特征映射关系。
上采样单元,用于对所述第二样本图像进行上采样,得到各上采样图像层,并根据所述特征映射关系,提取各所述上采样图像层的上采样图像特征。
第二拟合形状确定单元,用于基于所述下采样图像特征与所述上采样图像特征,得到所述第二样本图像对应的第二拟合形状。
在其中一个实施例中,第二拟合形状确定单元包括以下单元:
子拟合形状确定单元,用于基于所述下采样图像特征与所述上采样图像特征,分别得到各所述下采样图像层和各所述上采样图像层对应的子拟合形状。
子拟合形状融合单元,用于融合各所述子拟合形状,得到所述第二样本图像对应的第二拟合形状。
在其中一个实施例中,拟合形状约束模块包括以下单元:
第一约束单元,用于在所述第二拟合形状为首次对所述第二样本图像进行图像检测得到的形状时,基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,并将所述全局回归映射矩阵作为所述待训练网络模型的约束条件,将所述第二拟合形状作为约束后第二拟合形状。
第二约束单元,用于在所述第二拟合形状为非首次对所述第二样本图像进行图像检测得到的形状时,基于约束条件为所述全局回归映射矩阵的所述待训练网络模型,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状。
在其中一个实施例中,第一约束单元包括以下单元:
形状增量计算单元,用于计算所述第二样本图像中预先标定的真实形状,与所述第二拟合形状之间的形状增量。
矩阵确定单元,用于根据各所述形状增量,构建所述第二样本图像与所述第二拟合形状之间的全局回归映射矩阵。
在其中一个实施例中,参数调整模块850包括以下单元:
形状误差计算单元,用于计算所述第一样本图像与所述第一拟合形状之间的形状误差。
参数调整单元,用于基于所述形状误差,调整所述初始检测模型中的初始抑制信号的强度。
关于目标检测装置的具体限定可以参见上文中对于目标检测方法的限定,在此不再赘述。上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标检测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测方法。
在其中一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种目标检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图9和图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述的目标检测方法的步骤。
在其中一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的目标检测方法的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标检测方法,所述方法包括:
获取待检测图像;
采用预先训练的目标检测模型对所述待检测图像进行目标检测,得到所述待检测图像对应的目标检测结果;所述目标检测模型为在低秩网络模型中增加抑制信号后构建的模型;
所述低秩网络模型的训练过程,包括:
获取第二样本图像;
对所述第二样本图像进行下采样,得到各下采样图像层,提取各所述下采样图像层的下采样图像特征,并建立各所述下采样图像层之间的特征映射关系;
对所述第二样本图像进行上采样,得到各上采样图像层,并根据所述特征映射关系,提取各所述上采样图像层的上采样图像特征;
基于所述下采样图像特征与所述上采样图像特征,分别得到各所述下采样图像层和各所述上采样图像层对应的子拟合形状;
融合各所述子拟合形状,得到所述第二样本图像对应的第二拟合形状;
当基于所述第二拟合形状确定未达到模型训练结束条件时,在所述第二拟合形状为首次对所述第二样本图像进行图像检测得到的形状时,基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,并将所述全局回归映射矩阵作为待训练网络模型的约束条件,将所述第二拟合形状作为约束后第二拟合形状;在所述第二拟合形状为非首次对所述第二样本图像进行图像检测得到的形状时,基于约束条件为所述全局回归映射矩阵的待训练网络模型,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状;
将约束后第二拟合形状作为新的第二样本图像,返回采用待训练网络模型对第二样本图像进行图像检测的步骤,直至达到所述模型训练结束条件,得到低秩网络模型;
所述目标检测模型的训练过程,包括:
获取第一样本图像;
获取初始检测模型,所述初始检测模型为在低秩网络模型中增加初始抑制信号后获得的模型;
采用所述初始检测模型对所述第一样本图像进行图像检测,得到第一拟合形状;
在基于所述第一拟合形状确定未达到拟合结束条件时,调整所述初始检测模型中的初始抑制信号的强度,返回所述采用所述初始检测模型对第一样本图像进行图像检测的步骤,直至达到所述拟合结束条件,得到目标检测模型。
2.根据权利要求1所述的目标检测方法,其特征在于,所述待检测图像是指图像中包含小目标,需要对小目标进行目标检测的图像。
3.根据权利要求2所述的目标检测方法,其特征在于,所述小目标的定义方式包括相对尺寸与绝对尺寸两种定义方式;
所述相对尺寸的定义方式为:所述小目标的尺寸大小占原始图像尺寸大小的0.12%;
所述绝对尺寸的定义方式为:所述小目标的像素大小小于或等于32像素×32像素。
4.根据权利要求1所述的目标检测方法,其特征在于,所述基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,包括:
计算所述第二样本图像中预先标定的真实形状,与所述第二拟合形状之间的形状增量;
根据各所述形状增量,构建所述第二样本图像与所述第二拟合形状之间的全局回归映射矩阵。
5.根据权利要求1所述的目标检测方法,其特征在于,所述调整所述初始检测模型中的初始抑制信号的强度,包括:
计算所述第一样本图像与所述第一拟合形状之间的形状误差;
基于所述形状误差,调整所述初始检测模型中的初始抑制信号的强度。
6.一种目标检测装置,其特征在于,所述装置包括:
图像获取模块,用于获取待检测图像;
目标检测模块,用于采用预先训练的目标检测模型对所述待检测图像进行目标检测,得到所述待检测图像对应的目标检测结果;所述目标检测模型为在低秩网络模型中增加抑制信号后构建的模型;所述低秩网络模型的训练过程,包括:获取第二样本图像;对所述第二样本图像进行下采样,得到各下采样图像层,提取各所述下采样图像层的下采样图像特征,并建立各所述下采样图像层之间的特征映射关系;对所述第二样本图像进行上采样,得到各上采样图像层,并根据所述特征映射关系,提取各所述上采样图像层的上采样图像特征;基于所述下采样图像特征与所述上采样图像特征,分别得到各所述下采样图像层和各所述上采样图像层对应的子拟合形状;融合各所述子拟合形状,得到所述第二样本图像对应的第二拟合形状;当基于所述第二拟合形状确定未达到模型训练结束条件时,在所述第二拟合形状为首次对所述第二样本图像进行图像检测得到的形状时,基于所述第二样本图像和所述第二拟合形状构建全局回归映射矩阵,并将所述全局回归映射矩阵作为待训练网络模型的约束条件,将所述第二拟合形状作为约束后第二拟合形状;在所述第二拟合形状为非首次对所述第二样本图像进行图像检测得到的形状时,基于约束条件为所述全局回归映射矩阵的待训练网络模型,对所述第二拟合形状进行低秩约束,得到约束后第二拟合形状;将约束后第二拟合形状作为新的第二样本图像,返回采用待训练网络模型对第二样本图像进行图像检测的步骤,直至达到所述模型训练结束条件,得到低秩网络模型;目标检测模型训练模块,用于训练获得所述目标检测模型,具体包括:获取第一样本图像;获取初始检测模型,所述初始检测模型为在低秩网络模型中增加初始抑制信号或者调整后初始抑制信号后获得的模型;采用所述初始检测模型对所述第一样本图像进行图像检测,得到第一拟合形状;在基于所述第一拟合形状确定未达到拟合结束条件时,调整所述初始抑制信号的强度;在基于所述第一拟合形状确定达到所述拟合结束条件,得到目标检测模型。
7.根据权利要求6所述的目标检测装置,其特征在于,所述待检测图像是指图像中包含小目标,需要对小目标进行目标检测的图像。
8.根据权利要求7所述的目标检测装置,其特征在于,所述小目标的定义方式包括相对尺寸与绝对尺寸两种定义方式;
所述相对尺寸的定义方式为:所述小目标的尺寸大小占原始图像尺寸大小的0.12%;
所述绝对尺寸的定义方式为:所述小目标的像素大小小于或等于32像素×32像素。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的目标检测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的目标检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110659552.3A CN113283453B (zh) | 2021-06-15 | 2021-06-15 | 目标检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110659552.3A CN113283453B (zh) | 2021-06-15 | 2021-06-15 | 目标检测方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113283453A CN113283453A (zh) | 2021-08-20 |
CN113283453B true CN113283453B (zh) | 2023-08-08 |
Family
ID=77284432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110659552.3A Active CN113283453B (zh) | 2021-06-15 | 2021-06-15 | 目标检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113283453B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079632A (zh) * | 2019-12-12 | 2020-04-28 | 上海眼控科技股份有限公司 | 文本检测模型的训练方法、装置、计算机设备和存储介质 |
CN111161166A (zh) * | 2019-12-16 | 2020-05-15 | 西安交通大学 | 一种基于深度多分辨率网络的图像摩尔纹消除方法 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN112446378A (zh) * | 2020-11-30 | 2021-03-05 | 展讯通信(上海)有限公司 | 目标检测方法及装置、存储介质、终端 |
CN112784745A (zh) * | 2021-01-22 | 2021-05-11 | 中山大学 | 基于置信度自适应和差分增强的视频显著物体检测方法 |
-
2021
- 2021-06-15 CN CN202110659552.3A patent/CN113283453B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111079632A (zh) * | 2019-12-12 | 2020-04-28 | 上海眼控科技股份有限公司 | 文本检测模型的训练方法、装置、计算机设备和存储介质 |
CN111161166A (zh) * | 2019-12-16 | 2020-05-15 | 西安交通大学 | 一种基于深度多分辨率网络的图像摩尔纹消除方法 |
CN111210024A (zh) * | 2020-01-14 | 2020-05-29 | 深圳供电局有限公司 | 模型训练方法、装置、计算机设备和存储介质 |
CN112446378A (zh) * | 2020-11-30 | 2021-03-05 | 展讯通信(上海)有限公司 | 目标检测方法及装置、存储介质、终端 |
CN112784745A (zh) * | 2021-01-22 | 2021-05-11 | 中山大学 | 基于置信度自适应和差分增强的视频显著物体检测方法 |
Non-Patent Citations (1)
Title |
---|
联合深度编解码网络和时频掩蔽估计的单通道语音增强;时文华;张雄伟;邹霞;孙蒙;李莉;;声学学报(第03期);第1-4页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113283453A (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhou et al. | GMNet: Graded-feature multilabel-learning network for RGB-thermal urban scene semantic segmentation | |
CN109165660B (zh) | 一种基于卷积神经网络的显著物体检测方法 | |
CN108734210B (zh) | 一种基于跨模态多尺度特征融合的对象检测方法 | |
US20190286953A1 (en) | System and Methods for Efficiently Implementing a Convolutional Neural Network Incorporating Binarized Filter and Convolution Operation for Performing Image Classification | |
US10210418B2 (en) | Object detection system and object detection method | |
US11755889B2 (en) | Method, system and apparatus for pattern recognition | |
US20180005082A1 (en) | Systems and methods for recognizing characters in digitized documents | |
US9373038B2 (en) | Apparatus and methods for temporal proximity detection | |
EP3602397A1 (en) | Neural network systems for action recognition in videos | |
CN110414344B (zh) | 一种基于视频的人物分类方法、智能终端及存储介质 | |
CN110826596A (zh) | 一种基于多尺度可变形卷积的语义分割方法 | |
CN111027576B (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
US20200257902A1 (en) | Extraction of spatial-temporal feature representation | |
Yang et al. | A deep multiscale pyramid network enhanced with spatial–spectral residual attention for hyperspectral image change detection | |
CN114549913B (zh) | 一种语义分割方法、装置、计算机设备和存储介质 | |
Kong et al. | Spatial context-aware network for salient object detection | |
JP2010157118A (ja) | パターン識別装置及びパターン識別装置の学習方法ならびにコンピュータプログラム | |
CN110782430A (zh) | 一种小目标的检测方法、装置、电子设备及存储介质 | |
CN117256014A (zh) | 由精细到粗略细化的对比性点补全系统和方法 | |
CN112115937A (zh) | 目标识别方法、装置、计算机设备和存储介质 | |
Zou et al. | Image classification model based on deep learning in internet of things | |
US11989931B2 (en) | Method and apparatus with object classification | |
EP3671635A1 (en) | Curvilinear object segmentation with noise priors | |
Zhang et al. | Small object detection in UAV image based on improved YOLOv5 | |
US20230039592A1 (en) | Image sensor with integrated efficient multiresolution hierarchical deep neural network (dnn) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |