CN113449718A - 关键点定位模型的训练方法、装置和计算机设备 - Google Patents

关键点定位模型的训练方法、装置和计算机设备 Download PDF

Info

Publication number
CN113449718A
CN113449718A CN202110737218.5A CN202110737218A CN113449718A CN 113449718 A CN113449718 A CN 113449718A CN 202110737218 A CN202110737218 A CN 202110737218A CN 113449718 A CN113449718 A CN 113449718A
Authority
CN
China
Prior art keywords
sample
loss function
model
key point
positioning model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110737218.5A
Other languages
English (en)
Inventor
刘杰
王健宗
瞿晓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110737218.5A priority Critical patent/CN113449718A/zh
Publication of CN113449718A publication Critical patent/CN113449718A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及人工智能技术领域,提供一种关键点定位模型的训练方法、装置、计算机设备和存储介质,方法包括:获取预设的样本数据集;利用已标注样本训练神经网络模型得到第一初始定位模型;利用第一初始定位模型对未标注样本进行预测生成目标预测样本;使用目标预测样本对已标注样本进行扩充得到扩充样本;基于扩充样本与第一初始定位模型,得到与第一初始定位模型对应的总体损失函数;基于总体损失函数对第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型并用作关键点定位模型。本申请能智能快速地生成具有动物关键点定位功能的关键点定位模型。本申请还可以应用于区块链领域,上述关键点定位模型可存储于区块链上。

Description

关键点定位模型的训练方法、装置和计算机设备
技术领域
本申请涉及人工智能技术领域,具体涉及一种关键点定位模型的训练方法、装置和计算机设备。
背景技术
动物关键点检测是计算机视觉中的热门研究课题之一,也是基于视觉的模式识别应用的一个重要方向。它需要将图像数据中动物的所有身体特征点,如脚踝、手腕等关键点检测或定位出来。
对于图像数据中的关键点定位,现有通常是基于大量的有标注的训练数据来训练生成相应的关键点定位模型,再使用生成的关键点定位模型来对输入图像进行关键点预测。然而,对于动物而言,由于动物的物种种类较多,且动物的身体特征点的数量也较多,故对于动物图像的训练数据的标注需要耗费较长的时间以及耗费很大的人力。如果采用现有的训练生成关键点定位模型的方法来生成与用于进行动物关键点定位的模型,则会导致该模型的训练数据的标注成本很高,且该模型的生成效率会比较慢。
发明内容
本申请的主要目的为提供一种关键点定位模型的训练方法、装置、计算机设备和存储介质,旨在解决如果采用现有的训练生成关键点定位模型的方法来生成与用于进行动物关键点定位的模型,则会导致该模型的训练数据的标注成本很高,且该模型的生成效率会比较慢的技术问题。
本申请提出一种关键点定位模型的训练方法,所述方法包括步骤:
获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
可选地,所述利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本的步骤,包括:
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本;
获取与各所述预测样本分别对应的预测概率;
获取预设的概率阈值;
从所有预测概率中筛选出大于所述概率阈值的指定预测概率;
从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本;
将所述指定预测样本作为所述目标预测样本。
可选地,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成,所述基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数的步骤,包括:
将所述扩充样本输入至所述关键点定位网络,通过所述关键点定位网络输出与所述扩充样本对应的多个关键点热图;以及,
通过所述关键点定位网络对所述扩充样本进行特征提取,生成与所述扩充样本对应的第一特征;
将所述第一特征输入至所述卷积层,通过所述卷积层对所述第一特征进行卷积处理,生成与所述第一特征对应的第二特征;
基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理,得到对应的多个第三特征;
将所有所述第三特征输入至所述全局最大池化层,通过所述全局最大池化层输出与所述第三特征对应的矢量;
将所述矢量输入至所述关键点分类网络,确定所述关键点分类网络的交叉熵损失函数;
确定与所述关键点热图对应的变换等差损失函数;
确定与所述矢量对应的变换不变性损失函数;
基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数。
可选地,所述基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数的步骤,包括:
确定与所述扩充样本对应的监督损失函数;
获取与各损失函数分别对应的损失权重;其中,所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数;
基于所述损失权重对各所述损失函数进行加权求和处理,得到处理后的损失函数;
将所述处理后的损失函数作为总体目标损失函数。
可选地,所述基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型的步骤,包括:
获取预设的目标迭代次数;
基于所述扩充样本,使用所述总体损失函数计算出与所述扩充样本对应的总体损失;
基于所述总体损失,采用梯度下降法对所述第一初始定位模型的模型参数进行调整;
更新迭代次数,并判断所述迭代次数是否超过所述目标迭代次数;
若所述迭代次数超过所述目标迭代次数,判定完成对于所述第一初始定位模型的训练,得到与所述第一初始定位模型对应的调整好的第二初始定位模型;
若所述迭代次数未超过所述目标迭代次数,返回步骤“基于所述扩充样本,使用所述总体损失函数计算与所述扩充样本对应的总体损失”继续进行迭代训练。
可选地,所述将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理的步骤之后,包括:
获取用户输入的待处理的动物图像数据;
将所述待处理的动物图像数据输入至所述关键点定位模型,通过所述关键点定位模型对所述待处理的动物图像数据进行关键点预测处理,并生成与所述待处理的动物图像数据对应的关键点定位图像数据;
接收所述模型输出所述关键点定位图像数据;
获取与所述用户对应的终端信息;
将所述关键点定位图像数据发送至与所述终端信息对应的用户终端。
本申请还提供一种关键点定位模型的训练装置,包括:
第一获取模块,用于获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
训练模块,用于利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
处理模块,用于利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
扩充模块,用于使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
第一生成模块,用于基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
调整模块,用于基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
确定模块,用于将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的关键点定位模型的训练方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的关键点定位模型的训练方法、装置、计算机设备和存储介质,获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。本申请只需采用部分已标注样本以及大量的未标注样本便可实现快速地训练生成关键点定位模型,有效地降低了模型的训练数据的标注成本,提高了关键点定位模型的生成效率,且使用该关键点定位模型能够实现对待处理的动物图像数据进行准确的关键点预测处理。
附图说明
图1是本申请一实施例的关键点定位模型的训练方法的流程示意图;
图2是本申请一实施例的关键点定位模型的训练装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
参照图1,本申请一实施例的关键点定位模型的训练方法,包括:
S1:获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
S2:利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
S3:利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
S4:使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
S5:基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
S6:基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整后的第二初始定位模型;
S7:将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
如上述步骤S1至S7所述,本方法实施例的执行主体为一种关键点定位模型的训练装置。在实际应用中,上述关键点定位模型的训练装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的关键点定位模型的训练装置,能够智能快速地基于包括已标注样本与未标注样本的样本数据集来生成关键点定位模型,有利于通过所述关键点定位模型准确地实现对待处理的动物图像数据进行关键点预测处理。具体地,首先获取预设的样本数据集。其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据,动物图像数据也可包括人类图像数据。另外,可按照预设的比例数值随机抽取出样本数据集中的数据子集,并为该部分数据子集提供正确的标注来得到已标注样本,而样本数据集中除该部分数据子集外的其他数据子集则无需进行标注。所述比例数值可根据实际使用需求进行设置,例如可设为10%。
然后利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;其中,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成。另外,所述神经网络模型的模型结构与所述第一初始定位模型的模型结构相同。此外,使用所述已标注样本训练生成训练好的第一初始定位模型的训练过程可参考现有的训练过程,在此不做具体限定。之后利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本。其中,从所述预测样本中筛选出符合预设条件的目标预测样本的过程可包括:先获取与预测样本对应的预测概率,再从所有所述预测样本中筛选出预测概率大于概率阈值的预测样本作为所述目标预测样本。
在得到了所述目标预测样本后,使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本。其中,所述扩充样本包括所述已标注样本与所述目标预测样本。在得到了所述扩充样本后,基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数。其中,所述总体损失函数可基于对与第一初始定位模型对应的多个损失函数进行加权求和生成,所述损失函数包括交叉熵损失函数、变换等差损失函数、变换不变性损失函数与监督损失函数。
后续基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型。其中,可先使用总体损失函数计算出与所述扩充样本对应的总体损失,再使用度下降法对所述第一初始定位模型的模型参数进行调整,并在更新迭代多次后判断所述迭代次数是否超过预设目标迭代次数,如果所述迭代次数超过所述目标迭代次数,则判定完成对于所述第一初始定位模型的训练调整,从而得到与所述第一初始定位模型对应的调整好的第二初始定位模型。最后将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。本实施例只需采用部分已标注样本以及大量的未标注样本便可实现快速地训练生成关键点定位模型,有效地降低了模型的训练数据的标注成本,提高了关键点定位模型的生成效率,且使用该关键点定位模型能够实现对待处理的动物图像数据进行准确的关键点预测处理。
进一步地,本申请一实施例中,上述步骤S3,包括:
S300:利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本;
S301:获取与各所述预测样本分别对应的预测概率;
S302:获取预设的概率阈值;
S303:从所有预测概率中筛选出大于所述概率阈值的指定预测概率;
S304:从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本;
S305:将所述指定预测样本作为所述目标预测样本。
如上述步骤S300至S305所述,所述利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本的步骤,具体可包括:首先利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本。然后获取与各所述预测样本分别对应的预测概率。其中,在使用第一初始定位模型对所述未标注样本进行预测处理,在生成了分配有伪标记的预测样本后,还会对应的生成与每一个预测样本分别对应的预测概率,该预测概率对应着生成的预测概率的置信度。之后获取预设的概率阈值。其中,对于概率阈值的具体取值不作限定,可根据实际情况进行调整,例如该概率阈值可设置为0.7。后续从所有预测概率中筛选出大于所述概率阈值的指定预测概率。最后从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本,并将所述指定预测样本作为所述目标预测样本。本实施例在基于样本数据集中的所述已标注样本生成了训练好的第一初始定位模型后,会利用所述第一初始定位模型对所述未标注样本进行预测处理来生成分配有伪标记的预测样本。并在得到预测样本后,会智能地从所有所述预测样本中筛选出预测概率大于概率阈值的目标预测样本,以使得后续使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本,进而能够基于该扩充样本来快速地训练生成具有关键点预测处理的关键点定位模型。由于会从所有所述预测样本中筛选出部分符合使用需求的目标预测样本来进行样本扩充处理,可以有效地提高后续生成的关键点定位模型的准确性。并且避免了使用得到的所有预测样本来进行关键点定位模型的训练生成过程,有效地保证了关键点定位模型的训练效率。
进一步地,本申请一实施例中,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成,上述步骤S5,包括:
S500:将所述扩充样本输入至所述关键点定位网络,通过所述关键点定位网络输出与所述扩充样本对应的多个关键点热图;以及,
S501:通过所述关键点定位网络对所述扩充样本进行特征提取,生成与所述扩充样本对应的第一特征;
S502:将所述第一特征输入至所述卷积层,通过所述卷积层对所述第一特征进行卷积处理,生成与所述第一特征对应的第二特征;
S503:基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理,得到对应的多个第三特征;
S504:将所有所述第三特征输入至所述全局最大池化层,通过所述全局最大池化层输出与所述第三特征对应的矢量;
S505:将所述矢量输入至所述关键点分类网络,确定所述关键点分类网络的交叉熵损失函数;
S506:确定与所述关键点热图对应的变换等差损失函数;
S507:确定与所述矢量对应的变换不变性损失函数;
S508:基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数。
如上述步骤S500至S508所述,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成,所述基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数的步骤,具体可包括。首先将所述扩充样本输入至所述关键点定位网络,通过所述关键点定位网络输出与所述扩充样本对应的多个关键点热图。其中,通过该关键点定位网络可以对输入的扩充样本进行处理并输出相对应的关键点热图,关键点热图是指将扩充样本中的关键点通过高斯分布转化的64*64的矩阵中的最大激活点。具体的,对于输入至关键点定位网络内的任意一个输入图像x,通过关键点定位网络对输入图像x进行处理后,会输出与输入图像x对应的关键点热图h=f(x,θ),θ为关键点定位网络的可训练参数。以及通过所述关键点定位网络对所述扩充样本进行特征提取,生成与所述扩充样本对应的第一特征。其中,所述关键点定位网络为一个特征提取网络,可基于该关键点定位网络进行中间特征映射的收集,将扩充样本升维到输出的关键点热图的空间维度,得到与所述扩充样本对应的第一特征。在得到了所述第一特征后,将所述第一特征输入至所述卷积层,通过所述卷积层对所述第一特征进行卷积处理,生成与所述第一特征对应的第二特征。其中,可基于通道连接,将第二特征输入至大小为1的C滤波器的卷积层,进而得到具有形状(C,H,W)的特征映射F,C指channel通道,H指图片数据的高height,W指图片数据的宽weight,该特征映射F即为所述第二特征。在得到了所述第二特征后,基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理,得到对应的多个第三特征。其中,基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理是指:使用第二特征按照元素乘以每一个关键点热图hi,i∈{1,K},从而可得到与关键点热图的数量相同的K个特征映射,即所述第三特征。在得到了所述第三特征后,将所有所述第三特征输入至所述全局最大池化层,通过所述全局最大池化层输出与所述第三特征对应的矢量。其中,全局最大池化层(GMP)应用于所述第三特征,用于保持每个通道的最高值。全局最大池化层生成的矢量可为zi=GMP(F⊙hi),F为第二特征,hi为关键点热图。另外,生成的矢量也可称为对于每个关键点的语义关键点表示。然后将所述矢量输入至所述关键点分类网络,确定所述关键点分类网络的交叉熵损失函数。其中,所述关键点分类网络是一个具有输入和输出层的全连接网络,用于进行交叉熵损失的分类。所述交叉熵损失函数具体为
Figure BDA0003142013870000111
Figure BDA0003142013870000112
是关键点的正确分类标签的向量。以及确定与所述关键点热图对应的变换等差损失函数。其中,可基于平方欧氏距离测量出关键点热图的变换等差损失函数Ltc(x,θ)=Ex[||f(g(x,s),θ)-g(f(x,θ),s)||2],x为输入图像,θ为关键点定位网络的可训练参数,g(·,s)为一个增强函数,其增强参数s是不可训练的,每次随机采样。变换等差约束表示为:f·g(x)=g·f(x)。同时确定与所述矢量对应的变换不变性损失函数。其中,可先将矢量连接到一个向量中,得到输入图像x的整体表示m=[m1,m2,...,mK],再将随机空间变换应用于输入图像x以获得图像x′,计算关键点表示m′=[m′1,m′2,...,m′k],并将它们连接起来以获得向量m′。从而通过惩罚原始图像和变换图像的表示之间的距离来强制姿态不变性,并制定一个变换不变性损失Lti(x,x′)=Ex,x′[||m-m′||2]。最后基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数。其中,可先确定与所述扩充样本对应的监督损失函数,再获取与各损失函数分别对应的损失权重,并基于所述损失权重对各所述损失权重进行加权求和处理以构建出所述总体损失函数。所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数。本实施例通过基于所述扩充样本与所述第一初始定位模型,来计算得到与所述第一初始定位模型对应的总体损失函数,有利于后续能够基于该总体损失函数对所述第一初始定位模型的模型参数进行调整,从而可以快速的生成所需的关键点定位模型,进而能够使用所述关键点定位模型来实现对于待处理的动物图像数据进行关键点预测处理的功能。
进一步地,本申请一实施例中,上述步骤S508,包括:
S5080:确定与所述扩充样本对应的监督损失函数;
S5081:获取与各损失函数分别对应的损失权重;其中,所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数;
S5082:基于所述损失权重对各所述损失函数进行加权求和处理,得到处理后的损失函数;
S5083:将所述处理后的损失函数作为总体目标损失函数。
如上述步骤S5080至S5083所述,所述基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数的步骤,具体可包括:首先确定与所述扩充样本对应的监督损失函数。其中,所述监督损失函数是指扩充样本的预测和正确的已标记样本之间的监督均方误差。然后获取与各损失函数分别对应的损失权重。其中,所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数。另外,对于与各损失函数分别对应的损失权重的具体数值不做限定,可根据实际的使用需求,如根据实际的实验数据进行定义生成。之后基于所述损失权重对各所述损失函数进行加权求和处理,得到处理后的损失函数。最后将所述处理后的损失函数作为总体目标损失函数。其中,总体目标损失函数的表达式可为:L=λ1*Lsup2*Lsc3*Ltc4*Lti,L为总体目标损失函数,Lsup为监督损失函数,λ1为监督损失函数的损失权重,Lsc为交叉熵损失函数,λ2为交叉熵损失函数的损失权重,Ltc为变换等差损失函数,λ3为变换等差损失函数的损失权重,Lti为变换不变性损失,λ4为变换不变性损失的损失权重。本实施例通过基于所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数、监督损失函数以及与各损失函数一一对应的损失权重,通过加权求和处理可以快速的生成与所述第一初始定位模型对应的总体损失函数,有利于后续能够基于该总体损失函数对所述第一初始定位模型的模型参数进行调整,从而可以快速的生成所需的关键点定位模型,进而能够使用所述关键点定位模型来实现对于待处理的动物图像数据进行关键点预测处理的功能。
进一步地,本申请一实施例中,上述步骤S6,包括:
S600:获取预设的目标迭代次数;
S601:基于所述扩充样本,使用所述总体损失函数计算出与所述扩充样本对应的总体损失;
S602:基于所述总体损失,采用梯度下降法对所述第一初始定位模型的模型参数进行调整;
S603:更新迭代次数,并判断所述迭代次数是否超过所述目标迭代次数;
S604:若所述迭代次数超过所述目标迭代次数,判定完成对于所述第一初始定位模型的训练,得到与所述第一初始定位模型对应的调整好的第二初始定位模型;
S605:若所述迭代次数未超过所述目标迭代次数,返回步骤“基于所述扩充样本,使用所述总体损失函数计算与所述扩充样本对应的总体损失”继续进行迭代训练。
如上述步骤S600至S605所述,所述基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型的步骤,具体可包括:首先获取预设的目标迭代次数。其中,对于目标迭代次数的具体数值不做限定,可根据实际使用需求进行设置,如根据实际的实验数据进行确定。然后基于所述扩充样本,使用所述总体损失函数计算出与所述扩充样本对应的总体损失。其中,可基于总体损失函数从扩充样本中确定出所需代入的相关数据,再将该相关数据代入总体损失函数中以计算得到相应的总体损失。之后基于所述总体损失,采用梯度下降法对所述第一初始定位模型的模型参数进行调整。其中,采用梯度下降法进行第一初始定位模型的模型参数调优的实现过程可参考现有的使用梯度下降法实现参数调整的过程,在此不作过多阐述。后续更新迭代次数,并判断所述迭代次数是否超过所述目标迭代次数。若所述迭代次数超过所述目标迭代次数,判定完成对于所述第一初始定位模型的训练,得到与所述第一初始定位模型对应的调整好的第二初始定位模型。而若所述迭代次数未超过所述目标迭代次数,返回步骤“基于所述扩充样本,使用所述总体损失函数计算与所述扩充样本对应的总体损失”继续进行迭代训练。本实施例通过基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整来得到调整好的第二初始定位模型,进而可将该第二初始定位模型用作关键点定位模型,以有效实现生成具有关键点定位功能的关键点定位模型,有利于后续通过所述关键点定位模型来快速准确地对待处理的动物图像数据进行关键点预测处理。
进一步地,本申请一实施例中,上述步骤S7之后,包括:
S700:获取用户输入的待处理的动物图像数据;
S701:将所述待处理的动物图像数据输入至所述关键点定位模型,通过所述关键点定位模型对所述待处理的动物图像数据进行关键点预测处理,并生成与所述待处理的动物图像数据对应的关键点定位图像数据;
S702:接收所述模型输出所述关键点定位图像数据;
S703:获取与所述用户对应的终端信息;
S704:将所述关键点定位图像数据发送至与所述终端信息对应的用户终端。
如上述步骤S700至S704所述,在执行完所述将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理的步骤之后,还可包括使用该关键点定位模型对接收待处理的动物图像数据进行关键点预测处理并返回给相应用户的过程。具体地,首先获取用户输入的待处理的动物图像数据。其中,所述待处理的动物图像数据为需要进行关键点定位的动物图像数据,该动物图像数据可为人类的图像数据或动物的图像数据。然后将所述待处理的动物图像数据输入至所述关键点定位模型,通过所述关键点定位模型对所述待处理的动物图像数据进行关键点预测处理,并生成与所述待处理的动物图像数据对应的关键点定位图像数据。其中,通过使用关键点定位模型可以对输入的待处理的动物图像数据进行关键点预测,并生成相应的对待处理的动物图像数据进行了相应的关键点标记的关键点定位图像数据。之后接收所述模型输出所述关键点定位图像数据。后续获取与所述用户对应的终端信息。最后将所述关键点定位图像数据发送至与所述终端信息对应的用户终端。本实施例在训练生成了关键点定位模型后,使得后续能够基于该关键点定位模型来快速准确地生成与当前待处理的动物图像数据对应的关键点定位图像数据,并会智能地将输出的关键点定位图像数据返回给用户,使得用户能够基于该关键点定位动物图像数据清楚的查看出待处理的动物图像数据中的关键点,提高了用户的使用体验。
本申请实施例中的关键点定位模型的训练方法还可以应用于区块链领域,如将上述关键点定位模型存储于区块链上。通过使用区块链来对上述关键点定位模型进行存储和管理,能够有效地保证上述关键点定位模型的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种关键点定位模型的训练装置,包括:
第一获取模块1,用于获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
训练模块2,用于利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
处理模块3,用于利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
扩充模块4,用于使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
第一生成模块5,用于基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
调整模块6,用于基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
确定模块7,用于将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述处理模块3,包括:
处理单元,用于利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本;
第一获取单元,用于获取与各所述预测样本分别对应的预测概率;
第二获取单元,用于获取预设的概率阈值;
筛选单元,用于从所有预测概率中筛选出大于所述概率阈值的指定预测概率;
第三获取单元,用于从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本;
确定单元,用于将所述指定预测样本作为所述目标预测样本。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成,上述第一生成模块5,包括:
输入单元,用于将所述扩充样本输入至所述关键点定位网络,通过所述关键点定位网络输出与所述扩充样本对应的多个关键点热图;以及,
第一生成单元,用于通过所述关键点定位网络对所述扩充样本进行特征提取,生成与所述扩充样本对应的第一特征;
第二生成单元,用于将所述第一特征输入至所述卷积层,通过所述卷积层对所述第一特征进行卷积处理,生成与所述第一特征对应的第二特征;
第一计算单元,用于基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理,得到对应的多个第三特征;
输出单元,用于将所有所述第三特征输入至所述全局最大池化层,通过所述全局最大池化层输出与所述第三特征对应的矢量;
第一确定单元,用于将所述矢量输入至所述关键点分类网络,确定所述关键点分类网络的交叉熵损失函数;
第二确定单元,用于确定与所述关键点热图对应的变换等差损失函数;
第三确定单元,用于确定与所述矢量对应的变换不变性损失函数;
构建单元,用于基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述构建单元,包括:
第一确定子单元,用于确定与所述扩充样本对应的监督损失函数;
获取子单元,用于获取与各损失函数分别对应的损失权重;其中,所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数;
处理子单元,用于基于所述损失权重对各所述损失函数进行加权求和处理,得到处理后的损失函数;
第二确定子单元,用于将所述处理后的损失函数作为总体目标损失函数。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述调整模块6,包括:
第四获取单元,用于获取预设的目标迭代次数;
第二计算单元,用于基于所述扩充样本,使用所述总体损失函数计算出与所述扩充样本对应的总体损失;
调整单元,用于基于所述总体损失,采用梯度下降法对所述第一初始定位模型的模型参数进行调整;
判断单元,用于更新迭代次数,并判断所述迭代次数是否超过所述目标迭代次数;
判定单元,用于若所述迭代次数超过所述目标迭代次数,判定完成对于所述第一初始定位模型的训练,得到与所述第一初始定位模型对应的调整好的第二初始定位模型;
返回单元,用于若所述迭代次数未超过所述目标迭代次数,返回步骤“基于所述扩充样本,使用所述总体损失函数计算与所述扩充样本对应的总体损失”继续进行迭代训练。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述关键点定位模型的训练装置,包括:
第二获取模块,用于获取用户输入的待处理的动物图像数据;
第二生成模块,用于将所述待处理的动物图像数据输入至所述关键点定位模型,通过所述关键点定位模型对所述待处理的动物图像数据进行关键点预测处理,并生成与所述待处理的动物图像数据对应的关键点定位动物图像数据;
接收模块,用于接收所述模型输出所述关键点定位动物图像数据;
第三获取模块,用于获取与所述用户对应的终端信息;
发送模块,用于将所述关键点定位动物图像数据发送至与所述终端信息对应的用户终端。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的关键点定位模型的训练方法的步骤一一对应,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本数据集、第一初始定位模型、目标预测样本、扩充样本、指定附加险信息、总体损失函数以及关键点定位模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种关键点定位模型的训练方法。
上述处理器执行上述关键点定位模型的训练方法的步骤:
获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种关键点定位模型的训练方法,具体为:
获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
综上所述,本申请实施例中提供的关键点定位模型的训练方法、装置、计算机设备和存储介质,获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。本申请只需采用部分已标注样本以及大量的未标注样本便可实现快速地训练生成关键点定位模型,有效地降低了模型的训练数据的标注成本,提高了关键点定位模型的生成效率,且使用该关键点定位模型能够实现对待处理的动物图像数据进行准确的关键点预测处理。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种关键点定位模型的训练方法,其特征在于,包括:
获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
2.根据权利要求1所述的关键点定位模型的训练方法,其特征在于,所述利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本的步骤,包括:
利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本;
获取与各所述预测样本分别对应的预测概率;
获取预设的概率阈值;
从所有预测概率中筛选出大于所述概率阈值的指定预测概率;
从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本;
将所述指定预测样本作为所述目标预测样本。
3.根据权利要求1所述的关键点定位模型的训练方法,其特征在于,所述第一初始定位模型由关键点定位网络、卷积层、全局最大池化层与关键点分类网络构成,所述基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数的步骤,包括:
将所述扩充样本输入至所述关键点定位网络,通过所述关键点定位网络输出与所述扩充样本对应的多个关键点热图;以及,
通过所述关键点定位网络对所述扩充样本进行特征提取,生成与所述扩充样本对应的第一特征;
将所述第一特征输入至所述卷积层,通过所述卷积层对所述第一特征进行卷积处理,生成与所述第一特征对应的第二特征;
基于逐元素乘法对得到的所述第二特征与每一个所述关键点热图进行计算处理,得到对应的多个第三特征;
将所有所述第三特征输入至所述全局最大池化层,通过所述全局最大池化层输出与所述第三特征对应的矢量;
将所述矢量输入至所述关键点分类网络,确定所述关键点分类网络的交叉熵损失函数;
确定与所述关键点热图对应的变换等差损失函数;
确定与所述矢量对应的变换不变性损失函数;
基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数。
4.根据权利要求3所述的关键点定位模型的训练方法,其特征在于,所述基于所述交叉熵损失函数、所述变换等差损失函数以及所述变换不变性损失函数,构建与所述第一初始定位模型对应的所述总体损失函数的步骤,包括:
确定与所述扩充样本对应的监督损失函数;
获取与各损失函数分别对应的损失权重;其中,所述损失函数包括所述交叉熵损失函数、所述变换等差损失函数、所述变换不变性损失函数与所述监督损失函数;
基于所述损失权重对各所述损失函数进行加权求和处理,得到处理后的损失函数;
将所述处理后的损失函数作为总体目标损失函数。
5.根据权利要求1所述的关键点定位模型的训练方法,其特征在于,所述基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型的步骤,包括:
获取预设的目标迭代次数;
基于所述扩充样本,使用所述总体损失函数计算出与所述扩充样本对应的总体损失;
基于所述总体损失,采用梯度下降法对所述第一初始定位模型的模型参数进行调整;
更新迭代次数,并判断所述迭代次数是否超过所述目标迭代次数;
若所述迭代次数超过所述目标迭代次数,判定完成对于所述第一初始定位模型的训练,得到与所述第一初始定位模型对应的调整好的第二初始定位模型;
若所述迭代次数未超过所述目标迭代次数,返回步骤“基于所述扩充样本,使用所述总体损失函数计算与所述扩充样本对应的总体损失”继续进行迭代训练。
6.根据权利要求1所述的关键点定位模型的训练方法,其特征在于,所述将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理的步骤之后,包括:
获取用户输入的待处理的动物图像数据;
将所述待处理的动物图像数据输入至所述关键点定位模型,通过所述关键点定位模型对所述待处理的动物图像数据进行关键点预测处理,并生成与所述待处理的动物图像数据对应的关键点定位图像数据;
接收所述模型输出所述关键点定位图像数据;
获取与所述用户对应的终端信息;
将所述关键点定位图像数据发送至与所述终端信息对应的用户终端。
7.一种关键点定位模型的训练装置,其特征在于,包括:
第一获取模块,用于获取预设的样本数据集;其中,所述样本数据集包括已标注样本与未标注样本,所述已标注样本为标注有多个关键点的动物图像数据;
训练模块,用于利用所述样本数据集中的所述已标注样本对预设的神经网络模型进行训练,得到训练好的第一初始定位模型;
处理模块,用于利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本,并从所述预测样本中筛选出符合预设条件的目标预测样本;
扩充模块,用于使用所述目标预测样本对所述已标注样本进行扩充,得到对应的扩充样本;
第一生成模块,用于基于所述扩充样本与所述第一初始定位模型,得到与所述第一初始定位模型对应的总体损失函数;
调整模块,用于基于所述总体损失函数对所述第一初始定位模型的模型参数进行调整,得到调整好的第二初始定位模型;
确定模块,用于将所述第二初始定位模型作为关键点定位模型,以通过所述关键点定位模型对待处理的动物图像数据进行关键点预测处理。
8.根据权利要求7所述的关键点定位模型的训练装置,其特征在于,所述处理模块,包括:
处理单元,用于利用所述第一初始定位模型对所述未标注样本进行预测处理,生成分配有伪标记的预测样本;
第一获取单元,用于获取与各所述预测样本分别对应的预测概率;
第二获取单元,用于获取预设的概率阈值;
筛选单元,用于从所有预测概率中筛选出大于所述概率阈值的指定预测概率;
第三获取单元,用于从所有所述预测样本中获取与所述指定预测概率对应的指定预测样本;
确定单元,用于将所述指定预测样本作为所述目标预测样本。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110737218.5A 2021-06-30 2021-06-30 关键点定位模型的训练方法、装置和计算机设备 Pending CN113449718A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110737218.5A CN113449718A (zh) 2021-06-30 2021-06-30 关键点定位模型的训练方法、装置和计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110737218.5A CN113449718A (zh) 2021-06-30 2021-06-30 关键点定位模型的训练方法、装置和计算机设备

Publications (1)

Publication Number Publication Date
CN113449718A true CN113449718A (zh) 2021-09-28

Family

ID=77814358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110737218.5A Pending CN113449718A (zh) 2021-06-30 2021-06-30 关键点定位模型的训练方法、装置和计算机设备

Country Status (1)

Country Link
CN (1) CN113449718A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822254A (zh) * 2021-11-24 2021-12-21 腾讯科技(深圳)有限公司 一种模型训练方法及相关装置
CN115527189A (zh) * 2022-11-01 2022-12-27 杭州枕石智能科技有限公司 车位状态的检测方法、终端设备及计算机可读存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133220A (zh) * 2016-11-30 2018-06-08 北京市商汤科技开发有限公司 模型训练、关键点定位及图像处理方法、系统及电子设备
WO2018121737A1 (zh) * 2016-12-30 2018-07-05 北京市商汤科技开发有限公司 关键点预测、网络训练及图像处理方法和装置、电子设备
CN111241887A (zh) * 2018-11-29 2020-06-05 北京市商汤科技开发有限公司 目标对象关键点识别方法及装置、电子设备和存储介质
CN111738080A (zh) * 2020-05-19 2020-10-02 云知声智能科技股份有限公司 一种人脸检测和对齐的方法及装置
CN112750125A (zh) * 2021-01-28 2021-05-04 华南理工大学 一种基于端到端关键点检测的玻璃绝缘子片定位方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133220A (zh) * 2016-11-30 2018-06-08 北京市商汤科技开发有限公司 模型训练、关键点定位及图像处理方法、系统及电子设备
WO2018121737A1 (zh) * 2016-12-30 2018-07-05 北京市商汤科技开发有限公司 关键点预测、网络训练及图像处理方法和装置、电子设备
CN111241887A (zh) * 2018-11-29 2020-06-05 北京市商汤科技开发有限公司 目标对象关键点识别方法及装置、电子设备和存储介质
CN111738080A (zh) * 2020-05-19 2020-10-02 云知声智能科技股份有限公司 一种人脸检测和对齐的方法及装置
CN112750125A (zh) * 2021-01-28 2021-05-04 华南理工大学 一种基于端到端关键点检测的玻璃绝缘子片定位方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822254A (zh) * 2021-11-24 2021-12-21 腾讯科技(深圳)有限公司 一种模型训练方法及相关装置
CN115527189A (zh) * 2022-11-01 2022-12-27 杭州枕石智能科技有限公司 车位状态的检测方法、终端设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN111897673B (zh) 运维故障根因识别方法、装置、计算机设备和存储介质
CN114067160A (zh) 基于嵌入平滑图神经网络的小样本遥感图像场景分类方法
CN114926746B (zh) 基于多尺度差分特征注意力机制的sar图像变化检测方法
CN113449718A (zh) 关键点定位模型的训练方法、装置和计算机设备
CN111651992A (zh) 命名实体标注方法、装置、计算机设备和存储介质
CN115688579B (zh) 一种基于生成对抗网络的流域多点水位预测预警方法
CN112016279A (zh) 电子病历结构化方法、装置、计算机设备和存储介质
CN112949468A (zh) 人脸识别方法、装置、计算机设备和存储介质
CN114781272A (zh) 碳排放量预测方法、装置、设备及存储介质
CN112329865A (zh) 基于自编码器的数据异常识别方法、装置和计算机设备
CN113129338B (zh) 基于多目标跟踪算法的图像处理方法、装置、设备及介质
CN111506710B (zh) 基于谣言预测模型的信息发送方法、装置和计算机设备
CN112950569A (zh) 黑色素瘤图像识别方法、装置、计算机设备及存储介质
CN110704652A (zh) 基于多重注意力机制的车辆图像细粒度检索方法及装置
CN115545334B (zh) 土地利用类型预测方法、装置、电子设备及存储介质
CN113672654A (zh) 数据查询方法、装置、计算机设备和存储介质
CN112966787B (zh) 相似患者的识别方法、装置、计算机设备和存储介质
CN116402828A (zh) 一种基于显著图的电池片缺陷检测方法及系统
CN113627551A (zh) 基于多模型的证件分类方法、装置、设备和存储介质
KR102388215B1 (ko) 자기주의 기반 심층 신경망 모델을 이용한 약물-표적 상호작용 예측 장치 및 그 방법
CN112308150B (zh) 目标检测模型训练方法、装置、计算机设备和存储介质
El-Sebakhy Functional networks training algorithm for statistical pattern recognition
CN113312481A (zh) 基于区块链的文本分类方法、装置、设备以及存储介质
CN113822412A (zh) 一种图节点标注方法、装置、设备及存储介质
CN112052572A (zh) 基于wlan位置感知的数字孪生工业仿真系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210928