CN113903075A - 类别估计方法、装置、电子设备及存储介质 - Google Patents

类别估计方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113903075A
CN113903075A CN202111503086.6A CN202111503086A CN113903075A CN 113903075 A CN113903075 A CN 113903075A CN 202111503086 A CN202111503086 A CN 202111503086A CN 113903075 A CN113903075 A CN 113903075A
Authority
CN
China
Prior art keywords
image
feature
frequency domain
characteristic
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111503086.6A
Other languages
English (en)
Inventor
王金桥
赵朝阳
李朝闻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Objecteye Beijing Technology Co Ltd
Original Assignee
Objecteye Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Objecteye Beijing Technology Co Ltd filed Critical Objecteye Beijing Technology Co Ltd
Priority to CN202111503086.6A priority Critical patent/CN113903075A/zh
Publication of CN113903075A publication Critical patent/CN113903075A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种类别估计方法、装置、电子设备及存储介质。其中,类别估计方法包括:获取初始图像;所述初始图像中包括待处理的目标对象;对所述初始图像进行特征提取,得到空间特征图像;对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像;将所述目标特征图像进行降维处理,得到中间特征图像;基于所述中间特征图像,得到所述目标对象的类别估计。采用本方法能够提高类别估计准确度。

Description

类别估计方法、装置、电子设备及存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种类别估计方法、装置、电子设备及存储介质。
背景技术
随着图像处理技术的发展,被广泛应用于各个领域,例如,图像分类或者图像对象检测等。其中,图像对象检测是利用图像处理与模式识别等领域的理论和方法,从图像中定位感兴趣的目标,需要准确地判断每个目标的具体类别。图像对象检测在人脸识别、医学影像、智能视频监控、机器人导航和增强现实等领域都有广泛的应用。
现有技术中,一般采用无监督域自适应方法进行图像对象检测,往往因数据分布对齐有难度,而存在类别估计准确度低的问题。
发明内容
本发明提供一种类别估计方法、装置、电子设备及存储介质,用以解决现有技术中类别估计效果差的缺陷,实现提高类别估计准确度的目的。
本发明提供一种类别估计方法,包括:获取初始图像;所述初始图像中包括待处理的目标对象;对所述初始图像进行特征提取,得到空间特征图像; 对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像;将所述目标特征图像进行降维处理,得到中间特征图像;基于所述中间特征图像,得到所述目标对象的类别估计。
根据本发明提供的一种类别估计方法,所述频域特征图像包括第一频域特征和第二频域特征;所述对所述频域特征图像进行特征滤除,得到目标特征图像包括:根据频率阈值,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像;其中,所述目标特征图像中包括所述第二频域特征。
根据本发明提供的一种类别估计方法,所述对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像包括:获取频域滤波函数;将所述频域滤波函数从频域转换到空间域,得到空间域滤波函数;利用所述空间域滤波函数,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像。
根据本发明提供的一种类别估计方法,所述对所述空间特征图像进行处理,得到频域特征图像包括:对所述空间特征图像进行离散傅里叶变换,得到所述频域特征图像;所述对所述频域特征图像进行特征滤除,得到目标特征图像包括:对所述频域特征图像进行特征滤除,得到过滤特征图像;对所述过滤特征图像进行离散傅里叶逆变换,得到所述目标特征图像。
根据本发明提供的一种类别估计方法,所述对所述初始图像进行特征提取,得到空间特征图像包括:利用神经网络的卷积层对所述初始图像进行特征提取,得到空间特征图像。
根据本发明提供的一种类别估计方法,所述卷积层包括跨步卷积层;所述利用神经网络的卷积层对所述初始图像进行特征提取,得到空间特征图像包括:将所述跨步卷积层替换为频率模块,对所述初始图像进行特征提取,得到空间特征图像;其中,所述频率模块,用于执行步骤对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像。
本发明还提供一种类别估计装置,包括:初始图像获取模块,用于获取初始图像;所述初始图像中包括待处理的目标对象;空间特征图像得到模块,用于对所述初始图像进行特征提取,得到空间特征图像;频域特征图像得到模块,用于对所述空间特征图像进行处理,得到频域特征图像;目标特征图像得到模块,用于对所述频域特征图像进行特征滤除,得到目标特征图像;中间特征图像得到模块,用于将所述目标特征图像进行降维处理,得到中间特征图像;类别估计得到模块,用于基于所述中间特征图像,得到所述目标对象的类别估计。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述类别估计方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述类别估计方法的步骤。
本发明提供的类别估计方法、装置、电子设备及存储介质,通过获取初始图像;该初始图像中包括待处理的目标对象;对该初始图像进行特征提取,得到空间特征图像;对空间特征图像进行处理,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像;将目标特征图像进行降维处理,得到中间特征图像;基于中间特征图像,得到目标对象的类别估计。通过对特征图像从空间特征转换为频域特征,并且对频域特征图像进行特征滤除,以及降维处理,能够准确得到目标对象的类别估计,提高类别估计的准确度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的类别估计方法的流程示意图之一;
图2是本发明提供的类别估计方法的流程示意图之二;
图3是本发明提供的类别估计方法的结构示意图之一;
图4是本发明提供的类别估计方法的结构示意图之二;
图5是本发明提供的类别估计方法的结构示意图之三;
图6是本发明提供的类别估计装置的结构示意图;
图7是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图2描述本发明的类别估计方法。以该方法应用于服务器为例进行说明,包括以下步骤:
步骤102,获取初始图像;该初始图像中包括待处理的目标对象。
其中,目标对象是指在初始对象中存在的待处理的对象。例如,初始图像中包括一人物,并且该人物为需要进行类别估计的对象,则该初始图像的物体为目标对象。
具体地,服务器可以利用直接或者间接方式,获取到初始图像。
在一个实施例中,服务器与图像采集设备连接,可以通过图像采集设备进行初始图像的采集,并将采集到的初始图像,传输给与之连接的服务器;相应的,服务器获取到上述初始图像。
步骤104,对初始图像进行特征提取,得到空间特征图像。
其中,空间特征是指有空间关系的特征。该特征可以加强图像内容的描述区分能力。
具体的,服务器在得到初始图像之后,利用空间特征提取方法对该初始图像进行空间特征提取,得到空间特征图像。
在一个实施例中,服务器在得到初始图像之后,可以利用HOG(Histogram ofOriented Gradient)或者SIFT(Scale-invariant feature transform)等特征提取方法对初始图像进行特征提取,得到空间特征图像。可以理解的,也可以采用SURF(Speeded UpRobust Features)或者ORB(Oriented Fast and Rotated Brief )等特征提取方法对初始图像进行特征提取,得到空间特征图像。
步骤106,对空间特征图像进行处理,得到频域特征图像。
其中,频域特征是指图像在频域中的特征。
具体的,服务器可以通过空间特征到频域特征之间的转换方法,将空间特征图像转换为频域特征图像。
在一个实施例中,服务器可以通过离散傅里叶变换将空间特征图像转换为频域特征图像。
步骤108,对频域特征图像进行特征滤除,得到目标特征图像。
具体的,服务器得到频域特征图像之后,可以通过特征滤除方法,对频域特征图像进行特征滤除,得到目标特征图像。
在一个实施例中,服务器利用存储的,频域的滤波函数,对频域特征图像进行特征滤除,将大于等于频率阈值的频域特征图像滤除掉,得到小于频率阈值的频域特征图像。
在一个实施例中,可以将执行步骤106和步骤108中的方法的模块确定为低频模块,将该低频模块以即插即用的结构插入到神经网络的卷积层和池化层之间,从而在提高神经网络的鲁棒性的同时,可以降低内存成本和计算成本。
步骤110,将目标特征图像进行降维处理,得到中间特征图像。
其中,降维处理是指通过对目标特征图像的高维化,将目标特征图像转化为高维空间中的数据集合。通过目标特征图像进行降维处理,能够将目标特征图像的识别转换为特征表达向量的识别问题,从而降低计算复杂程度,同时,可以获得更好的图像识别效果。
具体的,服务器得到目标特征图像之后,可以通过降维方法对该目标特征图像进行降维处理,得到中间特征图像。
在一个实施例中,服务器可以利用线性降维方法或者非线性降维方法对目标特征图像进行处理,得到中间特征图像。
在一个实施例中,服务器可以将目标特征图像输入到神经网络的池化层进行降维处理,得到中间特征图像。
步骤112,基于中间特征图像,得到目标对象的类别估计。
其中,类别估计是指对目标对象所属类别的估计。例如,目标对象为某个动物,能够正确识别到该目标对象为某种动物所属类别的估计是90%。可以理解的,该类别估计也可以理解为是能够正确识别目标对象的概率。
具体的,服务器在得到中间特征图像之后,对该中间特征图像进行分类,得到目标对象的类别估计。
在一个实施例中,服务器可以将中间特征图像输入到神经网络的全连接层,通过全连接层的处理后,得到目标对象的类别估计。
上述类别估计方法中,通过获取初始图像;该初始图像中包括待处理的目标对象;对该初始图像进行特征提取,得到空间特征图像; 对空间特征图像进行处理,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像;将目标特征图像进行降维处理,得到中间特征图像;基于中间特征图像,得到目标对象的类别估计。通过对特征图像从空间特征转换为频域特征,并且对频域特征图像进行特征滤除,以及降维处理,能够准确得到目标对象的类别估计,提高类别估计的准确度。
在一个实施例中,频域特征图像包括第一频域特征和第二频域特征;对频域特征图像进行特征滤除,得到目标特征图像包括:根据频率阈值,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像;其中,该目标特征图像中包括第二频域特征。
其中,频率阈值是指频率的临界值,大于等于该临界值认为是第一频域特征,低于该临界值认为是第二频域特征。可以理解的,频率为图像的一个分布。
具体的,服务器可以利用低通滤波器对频域特征图像中的第一频域特征即高频特征进行滤除,得到目标特征图像。可以理解的,该目标特征图像为低频特征图像。
本实施例中,通过根据频率阈值,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像,能够达到增强图像整体强度的作用。
在一个实施例中,如图2所示,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像包括:
步骤202,获取频域滤波函数。
具体的,通过频域滤波函数能够使得图像变得平滑,滤除图像中的噪声。
在一个实施例中,服务器利用核为m*m的高斯低通滤波器,并将该高斯低通滤波器从频域转换到空间域,高斯低通滤波器的函数G()可以表示为公式:
Figure 188529DEST_PATH_IMAGE001
其中,x表示图像像素点在空间域中的横坐标,y表示图像像素点在空间域中的纵坐标。
在一个实施例中,服务器可以通过获取内置插件或者内置脚本等,获取到与频域滤波函数功能相同的频域滤波插件或者脚本。
步骤204,将频域滤波函数从频域转换到空间域,得到空间域滤波函数。
具体的,服务器获取到频域滤波函数之后,可以利用频域转换到空间域的方法,对频域滤波函数进行处理。
在一个实施例中,服务器利用离散傅里叶逆变换将上述得到的频域滤波函数转换到空间域,得到空间域滤波函数。
步骤206,利用空间域滤波函数,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像。
具体的,服务器在得到空间域滤波函数之后,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像。
在一个实施例中,利用上述高斯低通滤波器的函数对频域特征图像中的高频特征进行滤除,得到低频特征图像。可以理解的,其中的全频特征包括有低频特征和高频特征,其中的低频特征用来描述图像的平滑变化结构,高频特征用来描述快速变化的精细细节,低频特征比包含全频特征的图像更具有域不变性,高频特征包含与域相关的信息,容易影响数据分布的对齐。
本实施例中,通过获取频域滤波函数,将频域滤波函数从频域转换到空间域,得到空间域滤波函数,利用空间域滤波函数,对频域特征图像中的第一频域特征进行滤除,得到目标特征图像,能够达到准确得到目标特征图像的目的。
在一个实施例中,对空间特征图像进行处理,得到频域特征图像包括:对空间特征图像进行离散傅里叶变换,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像包括:对频域特征图像进行特征滤除,得到过滤特征图像;对过滤特征图像进行离散傅里叶逆变换,得到目标特征图像。
具体的,服务器在得到空间特征图像之后,对该空间特征图像进行离散傅里叶变换,得到频域特征图像;并且将该频域特征图像进行特征滤除之后,利用离散傅里叶逆变换将过滤特征图像转换为目标特征图像。
本实施例中,通过对空间特征图像进行离散傅里叶变换,得到频域特征图像,对频域特征图像进行特征滤除,得到过滤特征图像;对过滤特征图像进行离散傅里叶逆变换,得到目标特征图像,能够达到准确得到滤除特定频率特征的,空间域的目标特征图像的目的。
在一个实施例中,对初始图像进行特征提取,得到空间特征图像包括:利用神经网络的卷积层对初始图像进行特征提取,得到空间特征图像。
具体的,服务器可以通过利用神经网络进行初始图像的特征提取,将初始图像输入到神经网络的输入层,经过输入层矩阵化处理后,在卷积层对初始图像进行特征提取,得到空间特征图像。
本实施例中,通过利用神经网络的卷积层对初始图像进行特征提取,得到空间特征图像,能够达到准确提取空间特征图像的目的。
在一个实施例中,卷积层包括跨步卷积层;利用神经网络的卷积层对初始图像进行特征提取,得到空间特征图像包括:将跨步卷积层替换为频率模块,对初始图像进行特征提取,得到空间特征图像;其中,上述频率模块,用于执行步骤对空间特征图像进行处理,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像。
其中,跨步卷积层是指跨步大于1,并且具有下采样作用的卷积层。例如,在卷积的上一步卷积了(0,0)到(2,2)的3*3的区域,卷积的下一步则是(2,0)到(4,2)或(0,2)到(2,4)的3*3的区域。
具体的,在神经网络的卷积层中包括有跨步卷积层时,可以将该跨步卷积层替换为上述频率模块,该频率模块执行上述步骤106和步骤108中的方法。
在一个实施例中,在服务器识别到神经网络各层中存在有跨步卷积层后,利用上述频率模块替换该跨步卷积层,执行上述步骤106和步骤108中的方法即对空间特征图像进行处理,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像。
本实施例中,通过将跨步卷积层替换为频率模块,对初始图像进行特征提取,得到空间特征图像;其中,上述频率模块,用于执行步骤对空间特征图像进行处理,得到频域特征图像;对频域特征图像进行特征滤除,得到目标特征图像,能够达到使得网络更加关注低频信息,利用频率模块可以对每个输入的特征图进行低通滤波操作,并且在频率模块中的参数是固定的。
在一个实施例中,以上述频率模块为低频模块LFM为例。该LFM由数字高斯低通滤波器构成。它可以通过利用特征图的固有低频信息来增强域适应任务中的模型泛化性能。易于实现,并且没有引入额外的超参数。可以采用以下两种方法进行LFM的域适应。具体的,如图3所示,方法一为在神经网络中,例如,该神经网络尾ResNet或者VGGNet,在该神经网络的卷积层之后,全局池化层之前插入LFM,以提取包含在特征图中的低频信息。该方法能够保证线性分类层处理的特征图是低频信息。如图4所示,方法二为利用LFM替换了3*3的跨步卷积层,为了进一步提取不同阶段特征图的低频信息,本发明在编码器网络中用 LFM 替换了跨步卷积层。通过增加block(卷积块)中的 LFM 限制,使得网络将更加关注低频信息。表示跨步卷积和装备了跨步卷积的block比较结构。与跨步卷积不同的是,LFM是对每个输入的特征图进行低通滤波操作,其参数是固定的。本实施例中的方法,通过在神经网络中插入LFM或者使用LFM代替block中的跨步卷积,可以从频率的角度处理域适应问题,并且LFM可以作为即插即用的单元,可用于与现有的半监督学习与数据增强UDA(Unsupervised DataAugmentation)方法结合以实现更好的泛化性能。可以集成到用于不同任务、图像分类、对象检测和实例分割的各种 CNN 主干中,并且所有集成都以更低的内存和计算成本优于现有技术或基线。
在一个实施例中,在上述插入有LFM的神经网络中,并利用训练图像集对该神经网络进行训练,并且该训练集中图像携带有标签,当训练达到迭代次数或者损失达到预设损失值时,停止训练,得到训练好的神经网络模型。将不具有标签的测试图像集输入到该训练好的神经网络模型中,输出图像中目标对象的分类预测结果。
在一个实施例中,可以利用训练好的神经网络模型对测试集图像进行多次测试,得到每次得到的分类预测结果的统计值,将该统计值作为图像中目标对象的预测结果。
在一个实施例中,上述LFM的设计可以设定核为m。具体的,数字低通滤波器采用核m×m的高斯低通滤波器。并将该高斯低通滤波器从频域转换到空间域,数字空间高斯低通滤波器G()的函数定义如下:
Figure 276571DEST_PATH_IMAGE002
具体的,如图5所示,通过神经网络得到的空间特征图通过离散傅里叶变换DFT(Discrete Fourier Transform)转换为频率特征。当该频率特征输入高斯低通滤波器后,输出的高频信息被滤除。最后通过离散傅里叶逆变换IDFT(Inverse Discrete FourierTransform)得到输出特征图。可以理解的,上述高频信息被滤除是指当频率值超过截止频率时,高频信息被抑制。
下面对本发明提供的类别估计装置进行描述,下文描述的类别估计装置与上文描述的类别估计方法可相互对应参照。
在一个实施例中,提供了一种类别估计装置,包括:初始图像获取模块,用于获取初始图像;所述初始图像中包括待处理的目标对象;空间特征图像得到模块,用于对所述初始图像进行特征提取,得到空间特征图像;频域特征图像得到模块,用于对所述空间特征图像进行处理,得到频域特征图像;目标特征图像得到模块,用于对所述频域特征图像进行特征滤除,得到目标特征图像;中间特征图像得到模块,用于将所述目标特征图像进行降维处理,得到中间特征图像;类别估计得到模块,用于基于所述中间特征图像,得到所述目标对象的类别估计。
在一个实施例中,所述频域特征图像包括第一频域特征和第二频域特征;所述目标特征图像得到模块包括:目标特征图像得到单元,用于根据频率阈值,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像;其中,所述目标特征图像中包括所述第二频域特征。
在一个实施例中,目标特征图像得到单元,用于获取频域滤波函数;将所述频域滤波函数从频域转换到空间域,得到空间域滤波函数;利用所述空间域滤波函数,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像。
在一个实施例中,频域特征图像得到模块,用于对所述空间特征图像进行离散傅里叶变换,得到所述频域特征图像;对所述频域特征图像进行特征滤除,得到过滤特征图像;对所述过滤特征图像进行离散傅里叶逆变换,得到所述目标特征图像。
在一个实施例中,空间特征图像得到模块,用于利用神经网络的卷积层对所述初始图像进行特征提取,得到空间特征图像。
在一个实施例中,空间特征图像得到模块,用于将所述跨步卷积层替换为频率模块,对所述初始图像进行特征提取,得到空间特征图像;其中,所述频率模块,用于执行步骤对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像。
图7示例了一种电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(Communications Interface)720、存储器(memory)730和通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行类别估计方法,该方法包括:获取初始图像;所述初始图像中包括待处理的目标对象;对所述初始图像进行特征提取,得到空间特征图像; 对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像;将所述目标特征图像进行降维处理,得到中间特征图像;基于所述中间特征图像,得到所述目标对象的类别估计。
此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的类别估计方法,该方法包括:获取初始图像;所述初始图像中包括待处理的目标对象;对所述初始图像进行特征提取,得到空间特征图像;对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像;将所述目标特征图像进行降维处理,得到中间特征图像;基于所述中间特征图像,得到所述目标对象的类别估计。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的类别估计方法,该方法包括:获取初始图像;所述初始图像中包括待处理的目标对象;对所述初始图像进行特征提取,得到空间特征图像; 对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像;将所述目标特征图像进行降维处理,得到中间特征图像;基于所述中间特征图像,得到所述目标对象的类别估计。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种类别估计方法,其特征在于,包括:
获取初始图像;所述初始图像中包括待处理的目标对象;
对所述初始图像进行特征提取,得到空间特征图像;
对所述空间特征图像进行处理,得到频域特征图像;
对所述频域特征图像进行特征滤除,得到目标特征图像;
将所述目标特征图像进行降维处理,得到中间特征图像;
基于所述中间特征图像,得到所述目标对象的类别估计。
2.根据权利要求1所述的类别估计方法,其特征在于,所述频域特征图像包括第一频域特征和第二频域特征;所述对所述频域特征图像进行特征滤除,得到目标特征图像包括:
根据频率阈值,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像;其中,所述目标特征图像中包括所述第二频域特征。
3.根据权利要求2所述的类别估计方法,其特征在于,所述对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像包括:
获取频域滤波函数;
将所述频域滤波函数从频域转换到空间域,得到空间域滤波函数;
利用所述空间域滤波函数,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像。
4.根据权利要求1所述的类别估计方法,其特征在于,所述对所述空间特征图像进行处理,得到频域特征图像包括:
对所述空间特征图像进行离散傅里叶变换,得到所述频域特征图像;
所述对所述频域特征图像进行特征滤除,得到目标特征图像包括:
对所述频域特征图像进行特征滤除,得到过滤特征图像;
对所述过滤特征图像进行离散傅里叶逆变换,得到所述目标特征图像。
5.根据权利要求1所述的类别估计方法,其特征在于,所述对所述初始图像进行特征提取,得到空间特征图像包括:
利用神经网络的卷积层对所述初始图像进行特征提取,得到空间特征图像。
6.根据权利要求5所述的类别估计方法,其特征在于,所述卷积层包括跨步卷积层;所述利用神经网络的卷积层对所述初始图像进行特征提取,得到空间特征图像包括:
将所述跨步卷积层替换为频率模块,对所述初始图像进行特征提取,得到空间特征图像;其中,所述频率模块,用于执行步骤对所述空间特征图像进行处理,得到频域特征图像;对所述频域特征图像进行特征滤除,得到目标特征图像。
7.一种类别估计装置,其特征在于,包括:
初始图像获取模块,用于获取初始图像;所述初始图像中包括待处理的目标对象;
空间特征图像得到模块,用于对所述初始图像进行特征提取,得到空间特征图像;
频域特征图像得到模块,用于对所述空间特征图像进行处理,得到频域特征图像;
目标特征图像得到模块,用于对所述频域特征图像进行特征滤除,得到目标特征图像;
中间特征图像得到模块,用于将所述目标特征图像进行降维处理,得到中间特征图像;
类别估计得到模块,用于基于所述中间特征图像,得到所述目标对象的类别估计。
8.根据权利要求7所述的类别估计装置,其特征在于,所述频域特征图像包括第一频域特征和第二频域特征;所述目标特征图像得到模块包括:
目标特征图像得到单元,用于根据频率阈值,对所述频域特征图像中的第一频域特征进行滤除,得到所述目标特征图像;其中,所述目标特征图像中包括所述第二频域特征。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的类别估计方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的类别估计方法的步骤。
CN202111503086.6A 2021-12-10 2021-12-10 类别估计方法、装置、电子设备及存储介质 Pending CN113903075A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111503086.6A CN113903075A (zh) 2021-12-10 2021-12-10 类别估计方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111503086.6A CN113903075A (zh) 2021-12-10 2021-12-10 类别估计方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113903075A true CN113903075A (zh) 2022-01-07

Family

ID=79025483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111503086.6A Pending CN113903075A (zh) 2021-12-10 2021-12-10 类别估计方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113903075A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190378247A1 (en) * 2018-06-07 2019-12-12 Beijing Kuangshi Technology Co., Ltd. Image processing method, electronic device and non-transitory computer-readable recording medium
CN111553877A (zh) * 2020-03-20 2020-08-18 西安交通大学 基于太赫兹陶瓷基复合材料叶片损伤识别和寿命评估方法
CN112651438A (zh) * 2020-12-24 2021-04-13 世纪龙信息网络有限责任公司 多类别图像的分类方法、装置、终端设备和存储介质
CN112926457A (zh) * 2021-02-26 2021-06-08 中国电子科技集团公司第二十八研究所 一种基于融合频域和空间域网络模型的sar图像识别方法
CN113255433A (zh) * 2021-04-06 2021-08-13 北京迈格威科技有限公司 模型训练方法、装置和计算机存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190378247A1 (en) * 2018-06-07 2019-12-12 Beijing Kuangshi Technology Co., Ltd. Image processing method, electronic device and non-transitory computer-readable recording medium
CN111553877A (zh) * 2020-03-20 2020-08-18 西安交通大学 基于太赫兹陶瓷基复合材料叶片损伤识别和寿命评估方法
CN112651438A (zh) * 2020-12-24 2021-04-13 世纪龙信息网络有限责任公司 多类别图像的分类方法、装置、终端设备和存储介质
CN112926457A (zh) * 2021-02-26 2021-06-08 中国电子科技集团公司第二十八研究所 一种基于融合频域和空间域网络模型的sar图像识别方法
CN113255433A (zh) * 2021-04-06 2021-08-13 北京迈格威科技有限公司 模型训练方法、装置和计算机存储介质

Similar Documents

Publication Publication Date Title
CN111915015B (zh) 一种异常值检测方法、装置、终端设备及存储介质
CN111444807B (zh) 目标检测方法、装置、电子设备和计算机可读介质
Mu et al. Salient object detection using a covariance-based CNN model in low-contrast images
CN112257738A (zh) 机器学习模型的训练方法、装置和图像的分类方法、装置
CN110956632A (zh) 钼靶图像中胸大肌区域自动检测方法及装置
CN110852327A (zh) 图像处理方法、装置、电子设备及存储介质
CN109410246B (zh) 基于相关滤波的视觉跟踪的方法及装置
Nizami et al. No-reference image quality assessment using bag-of-features with feature selection
Zaarane et al. Real‐Time Vehicle Detection Using Cross‐Correlation and 2D‐DWT for Feature Extraction
CN112634288A (zh) 设备区域图像分割方法及装置
CN112561074A (zh) 一种机器学习可解释方法、装置及存储介质
CN114444565A (zh) 一种图像篡改检测方法、终端设备及存储介质
Gani et al. Copy move forgery detection using DCT, PatchMatch and cellular automata
CN107423739B (zh) 图像特征提取方法及装置
CN111488811A (zh) 人脸识别方法、装置、终端设备及计算机可读介质
Hamidi et al. Local selected features of dual‐tree complex wavelet transform for single sample face recognition
CN113903075A (zh) 类别估计方法、装置、电子设备及存储介质
CN116258873A (zh) 一种位置信息确定方法、对象识别模型的训练方法及装置
CN111461255B (zh) 一种基于间隔分布的Siamese网络图像识别方法及系统
CN115359296A (zh) 图像识别方法、装置、电子设备及存储介质
CN114283087A (zh) 一种图像去噪方法及相关设备
Ying et al. Simulation of computer image recognition technology based on image feature extraction
CN115424250A (zh) 一种车牌识别方法及装置
CN112861874A (zh) 一种基于多滤波器去噪结果的专家场去噪方法及系统
CN111160353A (zh) 车牌识别方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination