CN114663714A - 图像分类、地物分类方法和装置 - Google Patents

图像分类、地物分类方法和装置 Download PDF

Info

Publication number
CN114663714A
CN114663714A CN202210564406.7A CN202210564406A CN114663714A CN 114663714 A CN114663714 A CN 114663714A CN 202210564406 A CN202210564406 A CN 202210564406A CN 114663714 A CN114663714 A CN 114663714A
Authority
CN
China
Prior art keywords
image
classification model
image classification
model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210564406.7A
Other languages
English (en)
Other versions
CN114663714B (zh
Inventor
袁建龙
王志斌
李�昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210564406.7A priority Critical patent/CN114663714B/zh
Publication of CN114663714A publication Critical patent/CN114663714A/zh
Application granted granted Critical
Publication of CN114663714B publication Critical patent/CN114663714B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

说明书披露一种图像分类、地物分类方法和装置。所述图像分类方法包括:获取待分类的图像;将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果;其中,所述第一图像分类模型通过模拟无穷样本图像进行训练,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界,所述第二图像分类模型是已训练的满足收敛条件的图像分类模型。采用上述方案可在不增加第一图像分类模型大小的情况下,提升第一图像分类模型的分类准确度。

Description

图像分类、地物分类方法和装置
技术领域
本说明书涉及人工智能技术领域,尤其涉及一种图像分类、地物分类方法和装置。
背景技术
随着人工智能技术的发展,图像分类的应用场景越来越广泛。例如,在自动驾驶领域,需要在图像中识别出各种障碍物;在医疗领域,需要在图像中识别出肿瘤等异常组织;在航空领域,需要在图像中识别出土地类型等。
为得到更加准确的图像分类结果,图像分类模型的结构越来越复杂,其本身需要的存储空间和计算资源也越来越多,知识蒸馏技术应运而生。
知识蒸馏是一种模型压缩技术,可采用已训练好的结构复杂的第二图像分类模型训练结构相对简单的第一图像分类模型,进而让结构相对简单的第一图像分类模型的预测效果尽可能贴近结构复杂的第二图像分类模型。其中,结构复杂的第二图像分类模型往往称为教师模型(Teacher Model),结构简单的第一图像分类模型往往称为学生模型(Student Model)。
图1是相关技术中的一种知识蒸馏方法的示意图。其中,第二图像分类模型是已训练完成的结构复杂的模型,第一图像分类模型是待训练的结构相对简单的模型。请参考图1,在知识蒸馏的过程中,可获取用于训练第一图像分类模型的样本图像,然后可将所述样本图像分别输入第二图像分类模型和第一图像分类模型,得到第二图像分类模型输出的预测结果(后续称为第二预测结果),以及第一图像分类模型输出的预测结果(后续称为第一预测结果)。
接着,一方面,可计算所述第二预测结果与所述第一预测结果之间的差距,作知识蒸馏的蒸馏损失。另一方面,可计算所述第一图像分类模型输出的第一预测结果与所述样本图像的图像标签之间的误差,该误差也是监督学习中的误差,称之为分类损失。然后,可综合所述蒸馏损失和所述分类损失来更新第一图像分类模型的模型参数,以实现一轮迭代训练。
采用上述方案可实现对第一图像分类模型的训练,然而第一图像分类模型往往无法准确学习到第二图像分类模型的决策边界。请参考图2,左边是已训练完成的复杂结构的第二图像分类模型的决策边界,右边是第一图像分类模型学习到的决策边界,由图2可以看出,第一图像分类模型学习到的决策边界精准度较差,进而导致第一图像分类模型的泛化能力较差,预测准确度较差。
发明内容
有鉴于此,本说明书提供一种图像分类、地物分类方法和装置。
具体地,本说明书是通过如下技术方案实现的:
一种图像分类方法,包括:
获取待分类的图像;
将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果;
其中,所述第一图像分类模型通过模拟无穷样本图像进行训练,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界,所述第二图像分类模型是已训练的满足收敛条件的图像分类模型。
可选的,通过模拟无穷样本图像训练第一图像分类模型的过程,包括:
将样本图像输入第二图像分类模型,由所述第二图像分类模型对所述样本图像进行特征提取和分类预测,得到第二预测结果;
将所述样本图像输入待训练的第一图像分类模型,由所述第一图像分类模型对所述样本图像进行特征提取,并基于所述第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像;
确定所述无穷样本图像的蒸馏损失,所述蒸馏损失代表所述第一图像分类模型对所述无穷样本图像进行分类预测得到的第一预测结果与所述第二预测结果之间的差距;
基于所述损失函数上界对所述第一图像分类模型进行训练。
可选的,所述无穷样本图像的蒸馏损失函数推导过程包括:
获取预设的蒸馏损失函数;
根据所述蒸馏损失函数确定所述无穷样本图像的蒸馏损失和值函数;
将所述蒸馏损失和值函数转换为第一中间因子的期望函数,所述第一中间因子符合高斯分布;
确定所述期望函数的上界函数;
在所述上界函数中引入类别分布的协方差,通过矩母函数推导出第二中间因子的期望函数作为所述无穷样本图像的蒸馏损失函数,其中,所述第二中间因子也符合高斯分布。
可选的,所述确定所述无穷样本图像的蒸馏损失,包括:
将所述无穷样本图像的图像特征与第二图像分类模型提取出的所述样本图像的图像特征进行特征对齐;
在特征对齐后,确定所述无穷样本图像的蒸馏损失。
可选的,所述基于所述蒸馏损失对所述第一图像分类模型进行训练,包括:
确定所述第一图像分类模型的分类损失,所述分类损失代表所述第一图像分类模型对所述样本图像进行预测得到的第一预测结果与所述样本图像的标签之间的差异;
综合所述蒸馏损失和所述分类损失对所述第一图像分类模型进行训练。
可选的,还包括:
通过可视化界面展示所述第一图像分类模型的模型参数;
获取用户通过所述可视化界面输入的所述模型参数的初始取值;
将所述初始取值赋予所述第一图像分类模型后,对所述第一图像分类模型进行训练。
可选的,还包括:
在所述第一图像分类模型训练完毕后,采用测试样本图像对所述第一图像分类模型进行测试,得到所述第一图像分类模型的测试结果;
通过可视化界面展示所述测试结果;
接收用户通过所述可视化界面发送的继续训练指令,所述继续训练指令由用户在所述测试结果不符合预期时发送;
响应于所述继续训练指令,继续对所述第一图像分类模型进行训练。
一种地物分类方法,包括:
获取目标遥感图像;
将所述目标遥感图像输入已训练的第一地物分类模型,以获得所述第一地物分类模型输出的目标地物分类结果;
其中,所述第一地物分类模型通过模拟无穷样本图像进行训练,以使得所述第一地物分类模型的决策边界逼近第二地物分类模型的决策边界,所述第二地物分类模型是已训练的满足收敛条件的地物分类模型。
可选的,还包括:
获取与所述目标遥感图像采集位置相同的历史遥感图像的历史地物分类结果;
比较所述目标地物分类结果和所述历史地物分类结果,得到地物变化结果。
一种电子设备,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如前述方法的步骤。
一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如前述方法的步骤。
采用上述实施方式,可通过模拟无穷样本图像来训练第一图像分类模型,进而模拟出更加精准的决策边界,以使得第一图像分类模型的决策边界逼近满足收敛条件的第二图像分类模型的决策边界,可在不增加第一图像分类模型大小的情况下,提升第一图像分类模型的分类准确度。
附图说明
图1是相关技术中的一种知识蒸馏方法的示意图。
图2是一种模型决策边界示意图。
图3是本说明书一示例性实施例示出的一种图像分类方法的流程示意图。
图4是本说明书一示例性实施例示出的一种第一图像分类模型的训练方法的流程示意图。
图5是本说明书一示例性实施例示出的另一种第一图像分类模型的训练方法的示意图。
图6是本说明书一示例性实施例示出的采用本说明书提供的图像分类模型训练方法训练的第一图像分类模型的决策边界示意图。
图7是本说明书一示例性实施例示出的一种无穷样本图像的蒸馏损失函数的推导过程示意图。
图8是本说明书一示例性实施例示出的一种第一图像分类模型训练的系统架构图。
图9是本说明书一示例性实施例示出的一种地物分类方法的流程示意图。
图10是本说明书一示例性实施例示出的一种电子设备的硬件结构图。
图11是本说明书一示例性实施例示出的一种图像分类装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书的一些方面相一致的装置和方法的例子。
在本说明书使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书。在本说明书和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
随着人工智能技术的发展,图像分类的应用场景越来越广泛。例如,在自动驾驶领域,需要在图像中识别出各种障碍物;在医疗领域,需要在图像中识别出肿瘤等异常组织;在航空领域,需要在图像中识别出土地类型等。
为得到更加准确的图像分类结果,图像分类模型的结构越来越复杂,其本身需要的存储空间和计算资源也越来越多,难以在模型大小与分类准确度之间取得平衡。
图3是本说明书一示例性实施例示出的一种图像分类方法的流程示意图。
请参考图3,所述图像分类方法可包括以下步骤:
步骤302,获取待分类的图像。
在本说明书中,所述待分类的图像是需要进行分类的图像,在不同应用场景中,待分类的图像可能不同。
例如,在自动驾驶场景中,待分类的图像可以为车辆采集到的环境图像。
再例如,在医疗场景中,待分类的图像可以为患者的X光影像、CT影像等。
又例如,在航空领域,待分类的图像可以为飞机拍摄的遥感图像。
在本说明书中,在进行图像分类时,可从指定的待分类图像库中获取待分类的图像进行分类,也可从指定的接口接收待分类的图像,本说明书对此不作特殊限制。
步骤304,将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果。
基于前述步骤302,可将获取到的待分类的图像输入已训练的第一图像分类模型,进而获得所述第一图像分类模型输出的图像分类结果。
其中,所述第一图像分类模型可以为神经网络模型,例如卷积神经网络模型等。所述第一图像分类模型输出的图像分类结果可以为各个图像类别的概率值,根据所述概率值可确定前述待分类的图像的类别,例如,可在最大概率值大于阈值的情况下,将前述图像的类别确定为最大概率值对应的类别。
举例来说,假设所述第一图像分类模型输出的图像分类结果是猫95%,狗5%,可确定该图像是猫的图像。
在本说明书中,可在知识蒸馏的过程中,通过模拟无穷样本图像来对第一图像分类模型进行训练,进而模拟出更加精准的决策边界,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界。
其中,所述第二图像分类模型是已训练的满足预设收敛条件的图像分类模型,所述第二图像分类模型通常比所述第一图像分类模型大,例如,所述第二图像分类模型的模型参数多于第一图像分类模型的模型参数,所述第二图像分类模型的模型层数多于所述第一图像分类模型的模型层数等。
由以上描述可以看出,本说明书通过模拟无穷样本图像来训练第一图像分类模型,进而模拟出更加精准的决策边界,以使得第一图像分类模型的决策边界逼近满足收敛条件的第二图像分类模型的决策边界,可在不增加第一图像分类模型大小的情况下,提升第一图像分类模型的分类准确度。
下面对第一图像分类模型的训练过程进行详细描述。
本说明书在知识蒸馏过程中,可在特征空间中进行特征增强以为第一图像分类模型模拟无穷样本,帮助第一图像分类模型模拟更加准确的决策边界,在不增加第一图像分类模型大小的情况下,提升第一图像分类模型的预测准确度。
图4是本说明书一示例性实施例示出的一种第一图像分类模型训练方法的流程示意图。
所述第一图像分类模型训练方法可应用在电子设备中,所述电子设备可以是手机等移动终端,也可以是服务器等后台设备,本说明书对此不作特殊限制。
请参考图4,所述第一图像分类模型训练方法可包括以下步骤:
步骤402,将样本图像输入第二图像分类模型,由第二图像分类模型对所述样本图像进行特征提取和分类预测,得到第二预测结果。
在本说明书中,第二图像分类模型和第一图像分类模型可以为任一类型的图像分类模型。例如,第二图像分类模型和第一图像分类模型可以为神经网络模型,也可以为遥感模型等。第二图像分类模型和第一图像分类模型可用于图像分类,例如,语义分割、地物分类等。
在本说明书中,第二图像分类模型和第一图像分类模型均可包括特征提取器和分类器。其中,所述特征提取器可用于提取图像特征,所述分类器可用于基于特征提取器提取出的图像特征进行分类处理,可输出分类预测结果,例如,各类别概率值等。
在本说明书中,所述第二图像分类模型是已训练好的模型,其结构通常较为复杂,例如,参数较多,第二图像分类模型的泛化能力较强。所述第一图像分类模型是待训练的模型,其结构通常比所述教师模型简单,例如,参数少于教师模型等。
在本说明书中,所述样本图像可以是用于训练第二图像分类模型的样本图像,即所述样本图像可取自于所述第二图像分类模型的训练集,是所述第二图像分类模型的训练样本;所述样本图像也可以不是所述第二图像分类模型的训练样本,所述样本图像具有标签即可,本说明书对此不作特殊限制。
在本说明书中,可将所述样本图像输入第二图像分类模型,由第二图像分类模型中的特征提取器提取所述样本图像的图像特征,为便于区分,可将第二图像分类模型提取出的图像特征称为第二图像特征。所述第二图像分类模型中的分类器可基于所述第二图像特征对所述样本图像进行分类预测,得到所述样本图像的预测结果,为便于区别,将该预测结果称为第二预测结果。
步骤404,将所述样本图像输入待训练的第一图像分类模型,由所述第一图像分类模型对所述样本图像进行特征提取,并基于所述第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像。
在本说明书中,还可将前述步骤402中的样本图像输入第一图像分类模型,由第一图像分类模型对所述样本图像进行图像特征提取,可将第一图像分类模型提取出的图像特征称为第一图像特征。
在本说明书中,可基于所述第一图像特征在特征空间中进行特征增强,以模拟出无穷多个样本图像,更多的训练样本有助于第一图像分类模型更好的学习第二图像分类模型的决策边界。
步骤406,确定所述无穷样本图像的蒸馏损失,所述蒸馏损失代表所述第一图像分类模型对所述无穷样本图像进行分类预测得到的第一预测结果与所述第二预测结果之间的差距。
基于前述步骤404,在模拟无穷样本后,相关技术知识蒸馏过程中该样本图像在第一图像分类模型中的第一预测结果与第二图像分类模型中的第二预测结果之间的差距计算(蒸馏损失),转变为无穷样本图像的第一预测结果与所述第二预测结果之间的差距的和值,即蒸馏损失被无穷个损失之和取代,因此可推导蒸馏损失的上限值。所述蒸馏损失的上限值公式将在后续实施例中详细描述。
在本说明书中,在确定无穷样本图像的蒸馏损失时需进行特征对齐操作,将无穷样本图像的图像特征与第二图像特征进行特征对齐,并在特征对齐后确定所述蒸馏损失。
上述特征对齐可包括像素点的特征对齐,例如,无穷样本图像中第i个像素点的特征与第二图像分类模型样本图像中第i个像素点的特征对齐。
上述特征对齐也可包括通道的特征对齐。对于图像特征提取而言,通常可提取出多个通道的图像特征,不同的通道可从不同的维度进行图像特征的提取。例如,有的通道从轮廓维度进行图像特征的提取,有的通道从纹理维度进行图像特征的提取等。通道的特征对齐通常指无穷样本图像中的某一通道下的图像特征与第二图像分类模型样本图像中相同通道下的图像特征进行对齐。
当然,上述特征对齐可以既包括像素点的特征对齐,又包括通道的特征对齐,本说明书对此不作特殊限制。
步骤408,基于所述蒸馏损失对所述第一图像分类模型进行训练。
在本说明书中,在对第一图像分类模型进行训练时,通常还需要确定所述第一图像分类模型的分类损失,然后综合前述步骤406确定出的蒸馏损失和所述分类损失来对第一图像分类模型进行训练。所述分类损失指第一预测结果与样本图像的标签之间的差异,可采用预设的分类损失函数来计算。
在本说明书中,可基于所述蒸馏损失和所述分类损失确定本次迭代的综合损失,然后基于所述综合损失对所述第一图像分类模型进行训练。
例如,可计算所述蒸馏损失和所述分类损失的和值作为所述综合损失。
再例如,可计算所述蒸馏损失和所述分类损失的平均值作为所述综合损失。
当然,也可采用其他算法计算所述综合损失。
在计算出所述综合损失后,可基于所述综合损失采用反向传播算法更新第一图像分类模型的模型参数以完成本轮迭代。所述反向传播算法可包括随机梯度下降法、小批量梯度下降法等。
在本说明书中,在完成一轮迭代训练后,若第一图像分类模型尚未收敛,可继续进行下一轮迭代。其中,第一图像分类模型的收敛条件可包括迭代预设的次数、综合损失收敛等。
由以上描述可以看出,本说明书提供的第一图像分类模型的训练方案,可基于第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像,然后基于无穷样本图像的蒸馏损失对第一图像分类模型进行训练。采用上述训练方案,为第一图像分类模型模拟出无穷样本图像,可帮忙第一图像分类模型更好的学习第二图像分类模型的决策边界,在不增加第一图像分类图像大小的情况下,提升第一图像分类模型的预测准确度。
图5是本说明书一示例性实施例示出的另一种第一图像分类模型的训练方法的示意图。
图5中“t”代表第二图像分类模型,“s”代表第一图像分类模型,例如,特征提取器t代表第二图像分类模型的特征提取器,图像特征t代表第二图像分类模型的特征提取器从样本图像中提取出的图像特征,特征提取器s代表第一图像分类模型的特征提取器,图像特征s代表第一图像分类模型的特征提取器从样本图像中提取出的图像特征。
请参考图5,在进行第一图像分类模型的训练时,可将图5所示房间的样本图像分别输入第一图像分类模型和第二图像分类模型。
第二图像分类模型的特征提取器t可从该样本图像中提取出图像特征t,该图像特征t被传递至第二图像分类模型的分类器t,通过分类器t输出第二图像分类模型对所述样本图像的分类预测结果,即预测结果t。
第一图像分类模型的特征提取器s可从该样本图像中提取出图像特征s。
接着,一方面,该图像特征s被传递至第一图像分类模型的分类器s,通过分类器s输出第一图像分类模型对所述样本图像的分类预测结果,即预测结果s。
另一方面,可对图像特征s进行特征增强,在特征空间中为图像特征s模拟出无穷样本图像特征,即图像特征s1,图像特征s2,…,图像特征s∞,这些模拟出的图像样本特征被第一图像分类模型的分类器s进行分类预测,可得到预测结果s1,预测结果s2,…,预测结果s∞。
在本例中,可基于预测结果t和预测结果s1,预测结果s2,至预测结果s∞确定知识蒸馏的蒸馏损失。还可基于预测结果s与房间样本图像的图像标签确定分类损失。
然后,可基于所述蒸馏损失和所述分类损失计算本次迭代的综合损失,并基于综合损失更新学生第一图像分类模型的参数。
至此,可完成对第一图像分类模型的一次迭代训练。
仍以图3所示的第二图像分类模型决策边界为例,请参考图6,采用本说明书提供的上述知识蒸馏方案,第二图像分类模型可学习到的更加精准的决策边界。
在本说明书中,可采用增强蒸馏损失函数来确定前述无穷样本图像的蒸馏损失。其中,所述增强蒸馏损失函数可在预设的损失函数中引入类别分布的协方差来构建,进而在知识蒸馏的过程中实现对类别分布的考量,进一步提升第一图像分类模型决策边界学习的精确度。
图7是本说明书一示例性实施例示出的一种无穷样本图像的蒸馏损失函数的推导过程示意图。
请参考图7,无穷样本图像的蒸馏损失函数的推导过程,即所述增强蒸馏损失函数的推导过程可包括以下步骤:
步骤702,获取预设的蒸馏损失函数。
在本说明书中,所述预设的损失函数可包括像素蒸馏损失函数和通道蒸馏损失函数。
下面以通道蒸馏损失函数为例,进行增强蒸馏损失函数的推导。通道蒸馏损失函数的公式如下公式(1):
Figure 785076DEST_PATH_IMAGE001
----------- 公式(1)
公式(1)中,
Figure 967796DEST_PATH_IMAGE002
代表通道损失函数,C代表类别数量,
Figure 13112DEST_PATH_IMAGE003
代表温度系数,M代表样 本图像的像素点数量,
Figure 673901DEST_PATH_IMAGE004
代表分类卷积的权值,
Figure 629219DEST_PATH_IMAGE005
代表分类卷积 的偏差,
Figure 451681DEST_PATH_IMAGE006
代表教师模型的特征提取器从样本图像中提取出的第i个像素点的特征,
Figure 984294DEST_PATH_IMAGE007
代 表学生模型的特征提取器从样本图像中提取出的第i个像素点的特征。
步骤704,根据所述蒸馏损失函数确定所述无穷样本图像的蒸馏损失和值函数。
在本说明书中,在进行特征增强时,以像素点
Figure 448773DEST_PATH_IMAGE008
为例,可对该像素点进行N种不同 的特征增强,增强后得到的特征
Figure 383231DEST_PATH_IMAGE009
均需要与
Figure 766808DEST_PATH_IMAGE010
进行对齐,即
Figure 521137DEST_PATH_IMAGE011
。采 用
Figure 523728DEST_PATH_IMAGE012
代表前述公式(1)中的
Figure 312693DEST_PATH_IMAGE013
,可得到N个增强后的特征的总损失公式,该总损 失公式如下公式(2):
Figure 8116DEST_PATH_IMAGE014
----------- 公式(2)
在本说明书中,基于样本图像在特征空间中模拟无穷样本图像,即将公式(2)中的N取值无穷大,可得到如下公式(3):
Figure 390687DEST_PATH_IMAGE015
----------- 公式(3)
步骤706,将所述蒸馏损失和值函数转换为第一中间因子的期望函数,所述第一中间因子符合高斯分布。
步骤708,确定所述期望函数的上界函数。
在本说明书中,继续进行数学公式变化,上述公式(3)相当于下述公式(4)中第一 中间因子
Figure 931390DEST_PATH_IMAGE016
的数学期望:
Figure 840440DEST_PATH_IMAGE017
----------- 公式(4)
上述公式(4)是不可解的,基于杰森不等式(Jason’s inequality)可计算其上限, 如下公式(5),其中,
Figure 441186DEST_PATH_IMAGE018
代表增强蒸馏损失函数。
Figure 560320DEST_PATH_IMAGE019
----------- 公式(5)
步骤710,在所述上界函数中引入类别分布的协方差,通过矩母函数推导出第二中间因子的期望函数作为所述无穷样本图像的蒸馏损失函数,其中,所述第二中间因子也符合高斯分布。
在本说明书中,假设
Figure 639135DEST_PATH_IMAGE016
服从高斯分布,则有
Figure 402691DEST_PATH_IMAGE020
,其中,λ代表超参数,
Figure 439917DEST_PATH_IMAGE021
代表第i类别分布的协方差,该协方差可在训练的过程中更新。因此,第二中间因子
Figure 656135DEST_PATH_IMAGE022
也服从高斯分布:
Figure 538640DEST_PATH_IMAGE023
在本说明书中,假设变量x服从高斯分布,μ是x的均值,Σ为x的协方差,可以采用 矩母函数(Moment Generating Function)
Figure 32070DEST_PATH_IMAGE024
来求解x的期望。基于此,可将 公式(5)变换为如下公式(6):
Figure 240197DEST_PATH_IMAGE025
----------- 公式(6)
上述公式(6)即为基于通道蒸馏损失函数公式推导出的增强蒸馏损失函数公式。在上述推导过程中,类别分布协方差的引入可实现知识蒸馏过程中对类别分布的考量,并且,通道损失函数本身就是基于空间分布的,因此采用上述公式(6)作为本说明书提供的知识蒸馏方案中的增强蒸馏损失函数,可同时实现对空间分布关系以及类别分布关系的考虑,进而提升第一图像分类模型学习的精准度。
与上述推导过程类似,基于下述像素蒸馏损失函数
Figure 943711DEST_PATH_IMAGE026
的公式(7),可推导出增强 蒸馏损失函数公式(8)。
Figure 629907DEST_PATH_IMAGE027
----------- 公式(7)
Figure 207869DEST_PATH_IMAGE028
----公式(8)
图8是本说明书一示例性实施例示出的一种第一图像分类模型训练的系统架构图。
请参考图8,该系统可包括:服务器和终端设备,其中,所述服务器可以部署在云端,通过网络与终端设备交互。所述终端设备可以为PC机、手机等电子设备。
在说明书中,可由终端设备和服务器配合实现第一图像分类模型的训练过程。
在一个例子中,在对第一图像分类模型进行训练之前,服务器可通过终端设备的可视化界面将第一图像分类模型的模型参数展示给技术人员,技术人员可在该可视化界面中输入所述模型参数的初始取值。服务器在获取到该初始取值后,可将所述初始取值赋予所述第一图像分类模型,然后开始对所述第一图像分类模型进行训练。
在另一个例子中,在第一图像分类模型训练完毕后,服务器还可采用预设的测试样本图像对所述第一图像分类模型进行测试,得到测试结果。
服务器可将该测试结果通过终端设备的可视化界面展示给技术人员,例如,通过可视化界面展示第一图像分类模型对测试样本图像分类结果的整体准确率、各个类别出现错误分类结果的准确率等。
技术人员可根据展示的测试结果评估第一图像分类模型的训练效果,若认为第一图像分类模型的训练效果不符合预期,可通过所述可视化界面中相应的控件发送继续训练指令给服务器。
服务器在接收到所述继续训练指令后,可继续对所述第一图像分类模型进行训练,例如,可再获取更多的样本图像对所述第一图像分类模型进行训练。
在说明书中,也可由终端设备和服务器配合实现图像分类。
例如,技术人员可将已训练完毕的第一图像分类模型部署在云端服务器中,用户可通过终端设备上传待分类的图像,终端设备进而可将该待分类的图像发送至服务器。服务器采用已训练的第一图像分类模型对所述待分类的图像进行分类预测,得到该待分类图像的分类结果。然后,服务器可将该分类结果发送给终端设备,由终端设备展示给用户查看。
图9是本说明书一示例性实施例示出的一种地物分类方法的流程示意图。
请参考图9,所述地物分类方法可包括以下步骤:
步骤902,获取目标遥感图像。
目前,遥感技术已广泛应用在诸多领域,例如灾害检测、水质量检测、城市规划布局等。遥感图像通常指记录有各种地理电磁波大小的胶片或照片,可由飞机航拍或由卫星拍摄。
在本说明书中,目标遥感图像是待进行地物分类的遥感图像,可从预设的遥感图像库中获取,也可通过指定的接口接收,本说明书对此不作特殊限制。
步骤904,将所述目标遥感图像输入已训练的第一地物分类模型,以获得所述第一地物分类模型输出的目标地物分类结果。
基于前述步骤902,可将获取到的目标遥感图像输入已训练的第一地物分类模型,进而获得所述第一地物分类模型输出的目标遥感图像的目标地物分类结果。
其中,所述第一地物分类模型可以为神经网络模型,例如卷积神经网络模型等。所述第一地物分类模型输出的分类结果可以为各个类别的概率值,根据所述概率值可确定前述遥感图像中各个区域的地物类别。
在本说明书中,可在知识蒸馏的过程中,通过模拟无穷样本图像来对第一地物分类模型进行训练,进而模拟出更加精准的决策边界,以使得所述第一地物分类模型的决策边界逼近第二地物分类模型的决策边界。
其中,所述第二地物分类模型是已训练的满足预设收敛条件的地物分类模型,所述第二地物分类模型通常比所述第一地物分类模型大,例如,所述第二地物分类模型的模型参数多于第一地物分类模型的模型参数,所述第二地物分类模型的模型层数多于所述第一地物分类模型的模型层数等。
所述第一地物分类模型的训练过程可参考本说明书前述实施例中第一图像分类模型的训练过程,在此不再一一赘述。
本说明书通过模拟无穷样本图像来训练第一地物分类模型,进而模拟出更加精准的决策边界,以使得第一地物分类模型的决策边界逼近满足收敛条件的第二地物分类模型的决策边界,可在不增加第一地物分类模型大小的情况下,提升第一地物分类模型的分类准确度。
在本例中,在得到目标遥感图像的目标地物分类结果后,可基于该目标地物分类结果对遥感图像进行变化检测。
在本例中,可获取与所述目标遥感图像采集位置相同的历史遥感图像的历史地物分类结果,然后通过比对所述目标地物分类结果和所述历史地物分类结果,得到地物变化检测结果。
举例来说,以灾害检测场景为例,当某区域发生地震等自然灾害后,可通过比较灾前和灾后遥感图像的地物分类结果来分析地震造成的影响。
其中,目标遥感图像可以为灾后采集到的遥感图像,通过已训练的第一地物分类模型,可获得地震区域灾后遥感图像的地物分类结果。相应的,历史遥感图像是该地震区域发生地震前的遥感图像,历史地物分类结果是地震发生前该区域的地物分类结果。
假设,目标遥感图像的目标地物分类结果是平原,而历史地物分类结果是高山,则可说明地震的发生使得该区域原来的高山移位平地,变成了平原。
在其他场景中,也可周期性采集遥感图像,并对遥感图像进行地物分类,以得到对应区域的变化。例如,可以月度、季度、年度为周期采集遥感图像并进行地物分类,本说明书对此不作特殊限制。
与前述图像分类方法的实施例相对应,本说明书还提供了图像分类装置的实施例。
本说明书图像分类装置的实施例可以应用在电子设备中。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在电子设备的处理器将非易失性存储器中对应的计算机程序指令读取到内存中运行形成的。从硬件层面而言,如图10所示,为本说明书图像分类装置所在电子设备的一种硬件结构图,除了图10所示的处理器、内存、网络接口、以及非易失性存储器之外,实施例中装置所在的电子设备通常根据该电子设备的实际功能,还可以包括其他硬件,对此不再赘述。
图11是本说明书一示例性实施例示出的一种图像分类装置的框图。
请参考图11,所述图像分类装置可以应用在前述图10所示的电子设备上,包括有:图像获取模块1101和图像分类模块1102。
其中,图像获取模块1101,获取待分类的图像;
图像分类模块1102,将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果;
其中,所述第一图像分类模型通过模拟无穷样本图像进行训练,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界,所述第二图像分类模型是已训练的满足收敛条件的图像分类模型。
可选的,通过模拟无穷样本图像训练第一图像分类模型的过程,包括:
将样本图像输入第二图像分类模型,由所述第二图像分类模型对所述样本图像进行特征提取和分类预测,得到第二预测结果;
将所述样本图像输入待训练的第一图像分类模型,由所述第一图像分类模型对所述样本图像进行特征提取,并基于所述第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像;
确定所述无穷样本图像的蒸馏损失,所述蒸馏损失代表所述第一图像分类模型对所述无穷样本图像进行分类预测得到的第一预测结果与所述第二预测结果之间的差距;
基于所述蒸馏损失对所述第一图像分类模型进行训练。
可选的,所述无穷样本图像的蒸馏损失函数推导过程包括:
获取预设的蒸馏损失函数;
根据所述蒸馏损失函数确定所述无穷样本图像的蒸馏损失和值函数;
将所述蒸馏损失和值函数转换为第一中间因子的期望函数,所述第一中间因子符合高斯分布;
确定所述期望函数的上界函数;
在所述上界函数中引入类别分布的协方差,通过矩母函数推导出第二中间因子的期望函数作为所述无穷样本图像的蒸馏损失函数,其中,所述第二中间因子也符合高斯分布。
可选的,所述确定所述无穷样本图像的蒸馏损失,包括:
将所述无穷样本图像的图像特征与第二图像分类模型提取出的所述样本图像的图像特征进行特征对齐;
在特征对齐后,确定所述无穷样本图像的蒸馏损失。
可选的,所述基于所述蒸馏损失对所述第一图像分类模型进行训练,包括:
确定所述第一图像分类模型的分类损失,所述分类损失代表所述第一图像分类模型对所述样本图像进行预测得到的第一预测结果与所述样本图像的标签之间的差异;
综合所述蒸馏损失和所述分类损失对所述第一图像分类模型进行训练。
可选的,还包括:
通过可视化界面展示所述第一图像分类模型的模型参数;
获取用户通过所述可视化界面输入的所述模型参数的初始取值;
将所述初始取值赋予所述第一图像分类模型后,对所述第一图像分类模型进行训练。
可选的,还包括:
在所述第一图像分类模型训练完毕后,采用测试样本图像对所述第一图像分类模型进行测试,得到所述第一图像分类模型的测试结果;
通过可视化界面展示所述测试结果;
接收用户通过所述可视化界面发送的继续训练指令,所述继续训练指令由用户在所述测试结果不符合预期时发送;
响应于所述继续训练指令,继续对所述第一图像分类模型进行训练。
本说明书还提供一种地物分类装置,所述地物分类装置可包括遥感获取模块和地物分类模块。
其中,遥感获取模块,获取目标遥感图像;
地物分类模块,将所述目标遥感图像输入已训练的第一地物分类模型,以获得所述第一地物分类模型输出的目标地物分类结果;
其中,所述第一地物分类模型通过模拟无穷样本图像进行训练,以使得所述第一地物分类模型的决策边界逼近第二地物分类模型的决策边界,所述第二地物分类模型是已训练的满足收敛条件的地物分类模型。
可选的,还包括:
获取与所述目标遥感图像采集位置相同的历史遥感图像的历史地物分类结果;
比较所述目标地物分类结果和所述历史地物分类结果,得到地物变化结果。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本说明书方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
与前述图像分类方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取待分类的图像;
将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果;
其中,所述第一图像分类模型通过模拟无穷样本图像进行训练,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界,所述第二图像分类模型是已训练的满足收敛条件的图像分类模型。
可选的,通过模拟无穷样本图像训练第一图像分类模型的过程,包括:
将样本图像输入第二图像分类模型,由所述第二图像分类模型对所述样本图像进行特征提取和分类预测,得到第二预测结果;
将所述样本图像输入待训练的第一图像分类模型,由所述第一图像分类模型对所述样本图像进行特征提取,并基于所述第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像;
确定所述无穷样本图像的蒸馏损失,所述蒸馏损失代表所述第一图像分类模型对所述无穷样本图像进行分类预测得到的第一预测结果与所述第二预测结果之间的差距;
基于所述蒸馏损失对所述第一图像分类模型进行训练。
可选的,所述无穷样本图像的蒸馏损失函数推导过程包括:
获取预设的蒸馏损失函数;
根据所述蒸馏损失函数确定所述无穷样本图像的蒸馏损失和值函数;
将所述蒸馏损失和值函数转换为第一中间因子的期望函数,所述第一中间因子符合高斯分布;
确定所述期望函数的上界函数;
在所述上界函数中引入类别分布的协方差,通过矩母函数推导出第二中间因子的期望函数作为所述无穷样本图像的蒸馏损失函数,其中,所述第二中间因子也符合高斯分布。
可选的,所述确定所述无穷样本图像的蒸馏损失,包括:
将所述无穷样本图像的图像特征与第二图像分类模型提取出的所述样本图像的图像特征进行特征对齐;
在特征对齐后,确定所述无穷样本图像的蒸馏损失。
可选的,所述基于所述蒸馏损失对所述第一图像分类模型进行训练,包括:
确定所述第一图像分类模型的分类损失,所述分类损失代表所述第一图像分类模型对所述样本图像进行预测得到的第一预测结果与所述样本图像的标签之间的差异;
综合所述蒸馏损失和所述分类损失对所述第一图像分类模型进行训练。
可选的,还包括:
通过可视化界面展示所述第一图像分类模型的模型参数;
获取用户通过所述可视化界面输入的所述模型参数的初始取值;
将所述初始取值赋予所述第一图像分类模型后,对所述第一图像分类模型进行训练。
可选的,还包括:
在所述第一图像分类模型训练完毕后,采用测试样本图像对所述第一图像分类模型进行测试,得到所述第一图像分类模型的测试结果;
通过可视化界面展示所述测试结果;
接收用户通过所述可视化界面发送的继续训练指令,所述继续训练指令由用户在所述测试结果不符合预期时发送;
响应于所述继续训练指令,继续对所述第一图像分类模型进行训练。
与前述地物分类方法的实施例相对应,本说明书还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该程序被处理器执行时实现以下步骤:
获取目标遥感图像;
将所述目标遥感图像输入已训练的第一地物分类模型,以获得所述第一地物分类模型输出的目标地物分类结果;
其中,所述第一地物分类模型通过模拟无穷样本图像进行训练,以使得所述第一地物分类模型的决策边界逼近第二地物分类模型的决策边界,所述第二地物分类模型是已训练的满足收敛条件的地物分类模型。
可选的,还包括:
获取与所述目标遥感图像采集位置相同的历史遥感图像的历史地物分类结果;
比较所述目标地物分类结果和所述历史地物分类结果,得到地物变化结果。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的较佳实施例而已,并不用以限制本说明书,凡在本说明书的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书保护的范围之内。

Claims (11)

1.一种图像分类方法,包括:
获取待分类的图像;
将所述待分类的图像输入已训练的第一图像分类模型,以获得所述第一图像分类模型输出的图像分类结果;
其中,所述第一图像分类模型通过模拟无穷样本图像进行训练,以使得所述第一图像分类模型的决策边界逼近第二图像分类模型的决策边界,所述第二图像分类模型是已训练的满足收敛条件的图像分类模型。
2.根据权利要求1所述的方法,通过模拟无穷样本图像训练第一图像分类模型的过程,包括:
将样本图像输入第二图像分类模型,由所述第二图像分类模型对所述样本图像进行特征提取和分类预测,得到第二预测结果;
将所述样本图像输入待训练的第一图像分类模型,由所述第一图像分类模型对所述样本图像进行特征提取,并基于所述第一图像分类模型提取出的图像特征在特征空间中进行特征增强以模拟无穷样本图像;
确定所述无穷样本图像的蒸馏损失,所述蒸馏损失代表所述第一图像分类模型对所述无穷样本图像进行分类预测得到的第一预测结果与所述第二预测结果之间的差距;
基于所述蒸馏损失对所述第一图像分类模型进行训练。
3.根据权利要求2所述的方法,所述无穷样本图像的蒸馏损失函数推导过程包括:
获取预设的蒸馏损失函数;
根据所述蒸馏损失函数确定所述无穷样本图像的蒸馏损失和值函数;
将所述蒸馏损失和值函数转换为第一中间因子的期望函数,所述第一中间因子符合高斯分布;
确定所述期望函数的上界函数;
在所述上界函数中引入类别分布的协方差,通过矩母函数推导出第二中间因子的期望函数作为所述无穷样本图像的蒸馏损失函数,其中,所述第二中间因子也符合高斯分布。
4.根据权利要求2所述的方法,所述确定所述无穷样本图像的蒸馏损失,包括:
将所述无穷样本图像的图像特征与第二图像分类模型提取出的所述样本图像的图像特征进行特征对齐;
在特征对齐后,确定所述无穷样本图像的蒸馏损失。
5.根据权利要求2所述的方法,所述基于所述蒸馏损失对所述第一图像分类模型进行训练,包括:
确定所述第一图像分类模型的分类损失,所述分类损失代表所述第一图像分类模型对所述样本图像进行预测得到的第一预测结果与所述样本图像的标签之间的差异;
综合所述蒸馏损失和所述分类损失对所述第一图像分类模型进行训练。
6.根据权利要求2所述的方法,还包括:
通过可视化界面展示所述第一图像分类模型的模型参数;
获取用户通过所述可视化界面输入的所述模型参数的初始取值;
将所述初始取值赋予所述第一图像分类模型后,对所述第一图像分类模型进行训练。
7.根据权利要求6所述的方法,还包括:
在所述第一图像分类模型训练完毕后,采用测试样本图像对所述第一图像分类模型进行测试,得到所述第一图像分类模型的测试结果;
通过可视化界面展示所述测试结果;
接收用户通过所述可视化界面发送的继续训练指令,所述继续训练指令由用户在所述测试结果不符合预期时发送;
响应于所述继续训练指令,继续对所述第一图像分类模型进行训练。
8.一种地物分类方法,包括:
获取目标遥感图像;
将所述目标遥感图像输入已训练的第一地物分类模型,以获得所述第一地物分类模型输出的目标地物分类结果;
其中,所述第一地物分类模型通过模拟无穷样本图像进行训练,以使得所述第一地物分类模型的决策边界逼近第二地物分类模型的决策边界,所述第二地物分类模型是已训练的满足收敛条件的地物分类模型。
9.根据权利要求8所述的方法,还包括:
获取与所述目标遥感图像采集位置相同的历史遥感图像的历史地物分类结果;
比较所述目标地物分类结果和所述历史地物分类结果,得到地物变化结果。
10.一种电子设备,包括:
处理器;
用于存储机器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-9中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1-9中任一项所述方法的步骤。
CN202210564406.7A 2022-05-23 2022-05-23 图像分类、地物分类方法和装置 Active CN114663714B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210564406.7A CN114663714B (zh) 2022-05-23 2022-05-23 图像分类、地物分类方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210564406.7A CN114663714B (zh) 2022-05-23 2022-05-23 图像分类、地物分类方法和装置

Publications (2)

Publication Number Publication Date
CN114663714A true CN114663714A (zh) 2022-06-24
CN114663714B CN114663714B (zh) 2022-11-04

Family

ID=82036624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210564406.7A Active CN114663714B (zh) 2022-05-23 2022-05-23 图像分类、地物分类方法和装置

Country Status (1)

Country Link
CN (1) CN114663714B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452667A (zh) * 2023-06-16 2023-07-18 成都实时技术股份有限公司 一种基于图像处理的目标识别与定位方法

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040042400A1 (en) * 1998-12-18 2004-03-04 Telefonaktiebolaget Lm Ericsson Connection admission control based on bandwidth and buffer usage
WO2018107906A1 (zh) * 2016-12-12 2018-06-21 腾讯科技(深圳)有限公司 一种训练分类模型的方法、数据分类的方法及装置
US20180268292A1 (en) * 2017-03-17 2018-09-20 Nec Laboratories America, Inc. Learning efficient object detection models with knowledge distillation
CN110826344A (zh) * 2019-10-24 2020-02-21 北京小米智能科技有限公司 神经网络模型压缩方法、语料翻译方法及其装置
CN112101526A (zh) * 2020-09-15 2020-12-18 京东方科技集团股份有限公司 基于知识蒸馏的模型训练方法及装置
CN112802032A (zh) * 2021-01-19 2021-05-14 上海商汤智能科技有限公司 图像分割网络的训练和图像处理方法、装置、设备及介质
WO2021166181A1 (ja) * 2020-02-20 2021-08-26 日本電信電話株式会社 被写体別特徴点分離装置、被写体別特徴点分離方法及びコンピュータプログラム
CN113408570A (zh) * 2021-05-08 2021-09-17 浙江智慧视频安防创新中心有限公司 一种基于模型蒸馏的图像类别识别方法、装置、存储介质及终端
CN113515656A (zh) * 2021-07-06 2021-10-19 天津大学 一种基于增量学习的多视角目标识别与检索方法、及装置
CN113610146A (zh) * 2021-08-03 2021-11-05 江西鑫铂瑞科技有限公司 基于中间层特征提取增强的知识蒸馏实现图像分类的方法
CN113808026A (zh) * 2020-06-12 2021-12-17 华为技术有限公司 图像处理方法及装置
CN113869377A (zh) * 2021-09-13 2021-12-31 维沃移动通信有限公司 训练方法、装置及电子设备
CN114170425A (zh) * 2021-11-02 2022-03-11 阿里巴巴(中国)有限公司 模型训练、图像分类方法、服务器及存储介质
CN114202021A (zh) * 2021-12-03 2022-03-18 北京影谱科技股份有限公司 一种基于知识蒸馏的高效图像分类方法及系统
CN114332538A (zh) * 2021-12-30 2022-04-12 中国农业银行股份有限公司 图像分类模型训练方法、图像分类方法、设备及存储介质

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040042400A1 (en) * 1998-12-18 2004-03-04 Telefonaktiebolaget Lm Ericsson Connection admission control based on bandwidth and buffer usage
WO2018107906A1 (zh) * 2016-12-12 2018-06-21 腾讯科技(深圳)有限公司 一种训练分类模型的方法、数据分类的方法及装置
US20180268292A1 (en) * 2017-03-17 2018-09-20 Nec Laboratories America, Inc. Learning efficient object detection models with knowledge distillation
CN110826344A (zh) * 2019-10-24 2020-02-21 北京小米智能科技有限公司 神经网络模型压缩方法、语料翻译方法及其装置
WO2021166181A1 (ja) * 2020-02-20 2021-08-26 日本電信電話株式会社 被写体別特徴点分離装置、被写体別特徴点分離方法及びコンピュータプログラム
CN113808026A (zh) * 2020-06-12 2021-12-17 华为技术有限公司 图像处理方法及装置
CN112101526A (zh) * 2020-09-15 2020-12-18 京东方科技集团股份有限公司 基于知识蒸馏的模型训练方法及装置
CN112802032A (zh) * 2021-01-19 2021-05-14 上海商汤智能科技有限公司 图像分割网络的训练和图像处理方法、装置、设备及介质
CN113408570A (zh) * 2021-05-08 2021-09-17 浙江智慧视频安防创新中心有限公司 一种基于模型蒸馏的图像类别识别方法、装置、存储介质及终端
CN113515656A (zh) * 2021-07-06 2021-10-19 天津大学 一种基于增量学习的多视角目标识别与检索方法、及装置
CN113610146A (zh) * 2021-08-03 2021-11-05 江西鑫铂瑞科技有限公司 基于中间层特征提取增强的知识蒸馏实现图像分类的方法
CN113869377A (zh) * 2021-09-13 2021-12-31 维沃移动通信有限公司 训练方法、装置及电子设备
CN114170425A (zh) * 2021-11-02 2022-03-11 阿里巴巴(中国)有限公司 模型训练、图像分类方法、服务器及存储介质
CN114202021A (zh) * 2021-12-03 2022-03-18 北京影谱科技股份有限公司 一种基于知识蒸馏的高效图像分类方法及系统
CN114332538A (zh) * 2021-12-30 2022-04-12 中国农业银行股份有限公司 图像分类模型训练方法、图像分类方法、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ABDOLMAGED ALKHULAIFI ETAL.: "Knowledge distillation in deep learning and its applications", 《PEERJ COMPUTER SCIENCE》 *
孟宪法等: "卷积神经网络压缩中的知识蒸馏技术综述", 《计算机科学与探索》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452667A (zh) * 2023-06-16 2023-07-18 成都实时技术股份有限公司 一种基于图像处理的目标识别与定位方法
CN116452667B (zh) * 2023-06-16 2023-08-22 成都实时技术股份有限公司 一种基于图像处理的目标识别与定位方法

Also Published As

Publication number Publication date
CN114663714B (zh) 2022-11-04

Similar Documents

Publication Publication Date Title
CN109117731B (zh) 一种课堂教学认知负荷测量系统
CN109643383B (zh) 域分离神经网络
EP3968179A1 (en) Place recognition method and apparatus, model training method and apparatus for place recognition, and electronic device
CN108280477B (zh) 用于聚类图像的方法和装置
CN108389172B (zh) 用于生成信息的方法和装置
CN110765882B (zh) 一种视频标签确定方法、装置、服务器及存储介质
KR20170038622A (ko) 영상으로부터 객체를 분할하는 방법 및 장치
CN108198172B (zh) 图像显著性检测方法和装置
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN113408554A (zh) 数据处理方法、模型训练方法、装置及设备
CN114663714B (zh) 图像分类、地物分类方法和装置
CN112818995A (zh) 图像分类方法、装置、电子设备及存储介质
Kodi Ramanah et al. AI-driven spatio-temporal engine for finding gravitationally lensed type Ia supernovae
Yates et al. Evaluation of synthetic aerial imagery using unconditional generative adversarial networks
Callemein et al. How low can you go? privacy-preserving people detection with an omni-directional camera
KR101334858B1 (ko) 나비종 자동분류 시스템 및 방법, 이를 이용한 나비종 자동분류 기능이 구비된 휴대 단말기
CN112183303A (zh) 变电设备图像分类方法、装置、计算机设备和介质
CN115659221A (zh) 一种教学质量的评估方法、装置及计算机可读存储介质
Chitturi Building detection in deformed satellite images using mask r-cnn
CN114155388B (zh) 一种图像识别方法、装置、计算机设备和存储介质
CN112651351B (zh) 一种数据处理的方法和装置
CN115131291A (zh) 对象计数模型的训练方法、装置、设备以及存储介质
CN114863257A (zh) 图像处理方法、装置、设备及存储介质
CN113255819A (zh) 用于识别信息的方法和装置
US10896333B2 (en) Method and device for aiding the navigation of a vehicle

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant