CN113569615A - 基于图像处理的目标识别模型的训练方法和装置 - Google Patents
基于图像处理的目标识别模型的训练方法和装置 Download PDFInfo
- Publication number
- CN113569615A CN113569615A CN202110205188.3A CN202110205188A CN113569615A CN 113569615 A CN113569615 A CN 113569615A CN 202110205188 A CN202110205188 A CN 202110205188A CN 113569615 A CN113569615 A CN 113569615A
- Authority
- CN
- China
- Prior art keywords
- sample
- training
- image
- current
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 614
- 238000000034 method Methods 0.000 title claims abstract description 88
- 238000012545 processing Methods 0.000 title claims abstract description 80
- 238000002372 labelling Methods 0.000 claims abstract description 103
- 238000001514 detection method Methods 0.000 claims description 67
- 230000008569 process Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 18
- 230000002779 inactivation Effects 0.000 claims description 10
- 238000005065 mining Methods 0.000 claims description 8
- 238000013473 artificial intelligence Methods 0.000 abstract description 12
- 238000010801 machine learning Methods 0.000 abstract description 8
- 241000282414 Homo sapiens Species 0.000 description 26
- 230000006870 function Effects 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 6
- 239000011521 glass Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003190 augmentative effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000009849 deactivation Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及人工智能领域中的机器学习,具体涉及一种基于图像处理的目标识别模型的训练方法和装置。所述方法包括:获取样本训练集;通过样本训练集中的训练样本是否存在标签冲突,确定第一损失,通过第一损失对初始识别模型进行第一训练,得到中间识别模型;通过中间识别模型对样本训练集进行目标识别,得到预测结果,并基于预测结果对样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;确定更新训练集中的目标负样本所对应的加权信息;通过更新训练集中的更新样本是否存在标签冲突,确定第二损失,通过第二损失对中间识别模型进行第二训练,得到目标识别模型。采用本方法能够提升模型的训练效率。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于图像处理的目标识别模型的训练方法和装置。
背景技术
目前,可通过一个训练完成的识别模型对特定类别的对象进行目标识别,比如,当识别模型是通过标注有人脸的原始图像集训练而得时,即可通过识别模型对人脸进行识别。但是,随着科学技术的发展,在实际运用场景中,可能需要对可识别类别进行扩增,比如,可能期望识别模型不仅能够识对人脸进行识别,还能够对领带进行识别。
传统技术中,一般是通过人工对原始图像集进行新增图像类别的标注,比如,对标注有人脸的原始图像集进行领带标注,并基于新增图像类别的标注的原始图像集对识别模型进行重训练,得到目标识别模型,从而基于目标识别模型实现类别扩增。然而,人工对原始图像集进行新增图像类别的标注会带来很大的人力成本,从而导致目标识别模型的训练效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升训练效率的基于图像处理的目标识别模型的训练方法、装置、计算机设备和存储介质。
一种基于图像处理的目标识别模型的训练方法,所述方法包括:
获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;
对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;
确定所述更新训练集中的各目标负样本所对应的加权信息;
对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
在一个实施例中,所述样本属性包括样本来源和样本正负性,所述样本来源包括来源于所述原始图像集,或者来源于所述新增图像集;所述根据所述样本属性和所述当前训练样本是否存在标签冲突,确定每个所述第一预测概率各自对应的第一概率权重,包括:
根据所述当前训练样本的样本正负性,确定所述当前训练样本是否存在标签冲突;
当确定所述当前训练样本存在标签冲突时,根据所述样本来源,确定所述样本来源中正样本的标签所对应的参考图像类别,所述参考图像类别为原始图像类别或者新增图像类别;
将所述当前训练样本属于所述参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;
将所述当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;所述其余图像类别为所述原始图像类别和所述新增图像类别中的一个类别,且与所述参考图像类别不同。
在一个实施例中,所述方法还包括:
当确定所述当前训练样本不存在标签冲突时,将所述当前训练样本的每个第一预测概率各自对应的第一概率权重均设置为第一目标值。
在一个实施例中,所述确定所述更新训练集中的各目标负样本所对应的加权信息,包括:
基于所述更新训练集中的目标负样本与对应的标签标注实例之间的第一重合度,确定各目标负样本所对应的加权信息。
在一个实施例中,基于所述更新训练集中的目标负样本与对应的标签标注实例之间的第一重合度,确定各目标负样本所对应的加权信息,包括:
对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;
确定所述当前目标负样本与所述目标样本图像所对应的标签标注实例之间的第一重合度;
根据所述第一重合度,确定所述当前目标负样本所对应的加权信息。
一种基于图像处理的目标识别模型的训练装置,所述装置包括:
第一训练模块,用于获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
挖掘模块,用于通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;确定所述更新训练集中的各目标负样本所对应的加权信息;
第二训练模块,用于对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
在一个实施例中,所述第一训练模块还用于获取用于进行原始图像类别识别的初始识别模型;确定所述样本训练集中的待处理的当前训练样本的样本属性;通过初始识别模型对所述当前训练样本进行目标识别,得到所述当前训练样本分别属于所述原始图像类别和所述新增图像类别的第一预测概率;根据所述样本属性和所述当前训练样本是否存在标签冲突,确定每个所述第一预测概率各自对应的第一概率权重;根据所述第一预测概率和对应的第一概率权重构造第一损失,并通过所述第一损失调整所述初始识别模型的模型参数;将所述当前训练样本更新为已完成训练样本,并将下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,返回至所述确定所述样本训练集中的待处理的当前训练样本的样本属性的步骤继续执行,直至达到第一训练停止条件时停止训练,得到中间识别模型。
在一个实施例中,所述样本属性包括样本来源和样本正负性,所述样本来源包括来源于所述原始图像集,或者来源于所述新增图像集;所述第一训练模块还包括概率权重确定模块,用于根据所述当前训练样本的样本正负性,确定所述当前训练样本是否存在标签冲突;当确定所述当前训练样本存在标签冲突时,根据所述样本来源,确定所述样本来源中正样本的标签所对应的参考图像类别,所述参考图像类别为原始图像类别或者新增图像类别;将所述当前训练样本属于所述参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;将所述当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;所述其余图像类别为所述原始图像类别和所述新增图像类别中的一个类别,且与所述参考图像类别不同。
在一个实施例中,所述概率权重确定模块还用于当所述当前训练样本属于负样本时,确定所述当前训练样本存在标签冲突;当所述当前训练样本属于正样本时,确定所述当前训练样本与对应的标签标注实例之间的第二重合度;当所述第二重合度小于或等于预设重合阈值时,确定所述当前训练样本存在标签冲突。
在一个实施例中,所述样本训练集包括至少一张样本图像,所述样本图像包括多于一个的训练样本;所述挖掘模块还包括伪标注模块,用于通过所述中间识别模型对所述样本图像进行预设次数的目标识别,得到预设次数的预测结果;所述预测结果包括预测框、所述预测框所框选的图像区域所属类别的概率值以及所述预测框的位置信息;对框选有同一类别图像区域的预测框进行聚类处理,得到至少一个聚类簇;根据所述预测框所框选的图像区域所属类别的概率值和所述预测框的位置信息,确定每个聚类簇各自对应的检测置信度;根据所述检测置信度对所述聚类簇进行伪标注处理,得到伪标注样本。
在一个实施例中,所述伪标注模块还用于在基于所述中间识别模型在进行预设次数的目标识别中的每次目标识别的过程中,均对所述中间识别模型进行随机失活处理,并通过随机失活处理后的中间识别模型进行相应的目标识别,得到对应的预测结果。
在一个实施例中,所述伪标注模块还用于对于所述至少一个聚类簇中的每个聚类簇,确定当前聚类簇所包括的预测框的预测框数量;基于所述预测框数量、所述预测框所框选的图像区域所属类别的概率值和所述预测框的位置信息,确定所述当前聚类簇所对应的分类置信度和平均位置信息;基于所述平均位置信息确定与所述当前聚类簇对应的定位置信度;基于所述分类置信度和所述定位置信度,确定所述当前聚类簇的检测置信度。
在一个实施例中,所述伪标注模块还用于确定所述当前聚类簇中的每两个预测框之间的第三重合度,并根据所述第三重合度确定所述当前聚类簇的紧凑程度;根据所述紧凑程度、所述当前聚类簇所包括的预测框的预测框数量、以及所述中间识别模型对所述样本图像进行目标识别的预设次数,确定与所述当前聚类簇对应的定位置信度。
在一个实施例中,所述伪标注模块还用于当所述聚类簇的检测置信度高于检测阈值时,判断所述聚类簇所框选的待处理图像区域是否已包含有标签;当所述待处理图像区域未包含有标签时,根据所述聚类簇所属类别对所述待处理图像区域进行伪标注处理,得到伪标注样本。
在一个实施例中,所述挖掘模块还包括加权模块,用于对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;确定所述当前目标负样本与所述目标样本图像所对应的标签标注实例之间的第一重合度;根据所述第一重合度,确定所述当前目标负样本所对应的加权信息。
在一个实施例中,所述第二训练模块还用于确定所述更新训练集中的待处理的当前更新样本;通过所述中间识别模型对所述当前更新样本进行目标识别,得到所述当前更新样本分别属于所述原始图像类别和所述新增图像类别的第二预测概率;当所述当前更新样本属于包括有加权信息的目标负样本时,基于所述加权信息和所述当前更新样本是否存在标签冲突,确定各所述第二预测概率各自对应的第二概率权重;当所述当前更新样本不为包括有加权信息的目标负样本时,根据所述当前更新样本是否存在标签冲突,确定每个所述第二预测概率各自对应的第二概率权重;根据所述第二预测概率和对应的第二概率权重构造第二损失,并通过所述第二损失对调整所述中间识别模型的模型参数;将所述当前更新样本修改为已完成更新样本,并将下一个待处理的更新样本作为下一次迭代训练中的当前更新样本,返回所述通过中间识别模型对所述当前更新样本进行目标识别的步骤继续执行,直至达到第二训练停止条件时停止训练,得到训练好的目标识别模型。
在一个实施例中,所述目标识别模型的训练装置还用于获取待识别图像,并将所述待识别图像输入至训练好的目标识别模型;通过所述训练好的目标识别模型,对所述待识别图像中的对应于原始图像类别或新增图像类别的目标图像区域进行目标识别,得到所述目标图像区域所在位置信息,以及所述目标图像区域所对应的目标图像类别。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;
对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;
确定所述更新训练集中的各目标负样本所对应的加权信息;
对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;
对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;
确定所述更新训练集中的各目标负样本所对应的加权信息;
对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行以下步骤:
获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;
对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;
确定所述更新训练集中的各目标负样本所对应的加权信息;
对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
上述基于图像处理的目标识别模型的训练方法、装置、计算机设备、存储介质和计算机程序,通过获取样本训练集,可以基于样本训练集中的每个训练样本和相应训练样本是否存在标签冲突,对原始识别模型进行无冲突的第一训练,使得原始识别模型可基于所确定的标签冲突,从相应训练样本中提取准确无误的信息,并基于准确无误的信息对应调整模型参数,得到准确性较高的中间识别模型。通过获取中间识别模型,可基于中间识别模型对样本训练集进行伪标注处理,以充分挖掘训练样本中的未标注的对应于原始图像类别或新增图像类别的图像区域,得到包括有伪标注样本的更新训练集。通过获取更新训练集,可以确定更新训练集中的目标负样本各自对应的加权信息,从而对更新训练集中的负样本信息进行充分挖掘。通过获取更新训练集、伪标注样本和包括有加权信息的目标负样本,可基于更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,对中间识别模型进行第二训练,使得中间识别模型可基于充分挖掘的负样本信息和充分挖掘的伪标注信息对应调整模型参数,得到准确性更高的目标识别模型。
由于本申请是基于原始图像集和新增图像集对目标识别模型进行训练的,无需对图像集中的标签进行更新,因此,相比于传统的需要通过人工对原始图像集进行新增图像类别的标注,本申请可以节省人工所耗费的人力成本,从而提升目标识别模型的训练效率。
附图说明
图1为一个实施例中基于图像处理的目标识别模型的训练方法的应用环境图;
图2为一个实施例中基于图像处理的目标识别模型的训练方法的流程示意图;
图3为一个实施例中目标负样本加权曲线图;
图4为一个实施例中基于图像处理的目标识别模型的训练方法的总体框架示意图;
图5为一个实施例中第一概率权重的确定流程示意图;
图6为一个实施例中伪标注处理的流程示意图;
图7为一个具体的实施例中基于图像处理的目标识别模型的训练方法的流程示意图;
图8为另一个具体的实施例中基于图像处理的目标识别模型的训练方法的流程示意图;
图9为一个实施例中基于图像处理的目标识别模型的训练装置的结构框图;
图10为另一个实施例中基于图像处理的目标识别模型的训练装置的结构框图;
图11为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中基于图像处理的目标识别模型的训练方法的应用环境图。参照图1,该基于图像处理的目标识别模型的训练方法应用于基于图像处理的目标识别模型的训练系统100。基于图像处理的目标识别模型的训练系统100包括终端102和服务器104,终端102和服务器104通过网络进行通信。终端102和服务器104可协同用于执行本申请的目标识别模型的训练方法,也可单独用于执行本申请的目标识别模型的训练方法。比如,终端102可将样本训练集发送至服务器104,由服务器104执行目标识别模型的训练方法,得到训练完成的目标识别模型。终端102也可在获取样本训练集后,执行目标识别模型的训练方法。其中,样本训练集具体可包括原始图像集和新增图像集,原始图像集比如是标注有“人脸”类别标识的图像集,而新增图像集具体可以是标注有“领带”类别的图像集,当然,上述的人脸类别和领带类别仅用于进行示意性说明,不用于限定本申请,可以理解的是,对于原始图像类别和新增图像类别还可以是其他的类别标签。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
还需要说明的是,本申请涉及人工智能(Artificial Intelligence,AI)技术领域,其中,人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请具体涉及人工智能领域中的计算机视觉技术(Computer Vision,CV),计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
本申请还涉及人工智能领域中的机器学习(Machine Learning,ML)技术,机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
应该理解的是,本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。除非上下文另外清楚地指出,否则单数形式“一个”、“一”或者“该”等类似词语也不表示数量限制,而是表示存在至少一个。
在一个实施例中,如图2所示,提供了一种基于图像处理的目标识别模型的训练方法,以该方法应用于计算机设备为例进行说明,该计算机设备可以是上述图1中的终端102或服务器104。参照图2,该基于图像处理的目标识别模型的训练方法具体包括如下步骤:
步骤S202,获取由原始图像集和新增图像集构成的样本训练集;原始图像集中正样本的标签为原始图像类别,新增图像集中正样本的标签为新增图像类别。
其中,原始图像集指的是用于对模型进行训练,得到初始识别模型的图像集。原始图像集包括正样本和负样本,其中,原始图像集中的正样本指的是标注有原始图像类别标签的训练样本,原始图像集中的负样本指的是未标注有原始图像类别标签的训练样本。原始图像类别指的是初始识别模型可识别的类别,例如,当原始图像集包括标注有“人脸”的训练样本时,基于原始图像集训练而得的初始识别模型可识别的原始图像类别即为“人脸”。
新增图像集包括正样本和负样本,其中,新增图像集中的正样本指的是标注有新增图像类别的训练样本;对应的,新增图像集中的负样本指的是未标注有新增图像类别的训练样本。新增图像类别指的是识别模型新增加的可识别类别。
训练样本指的是预设检测框在样本图像中所框选的图像区域。当获取得到一张样本图像时,可基于预设检测框对样本图像进行框选处理,从而将预设检测框所框选的图像区域作为训练样本。样本图像指的是包含有至少一个训练样本的图像。标签指的是在模型训练过程中所设置的标准值,其中,原始图像集或新增图像集中正样本的标签包括真实图像类别和真实位置信息,例如,当预设检测框所框选的图像区域中包括人脸时,该预测检测框所对应的标签即可为“人脸”和该预测检测框在对应样本图像中的真实位置坐标。
具体地,计算机设备可从本地或者其他计算机设备中获取原始图像集和新增图像集,并将原始图像集和新增图像集作为样本训练集,从而后续可基于样本训练集对初始识别模型进行训练,得到目标识别模型。
在一个实施例中,计算机设备可直接从网络中获取标注有原始图像类别标签的原始图像集和标注有新增图像类别标签的新增图像集,例如,计算机设备可从MS COCO(Microsoft Common Objects in Context)图像集中获取原始图像集和新增图像集。
在一个实施例中,原始图像集所对应的标注空间C0与新增图像集所对应的标注空间Cn不重叠,也即其中,标注空间指的是图像集中的正样本的标签所对应的图像类别,例如,当原始图像集中正样本的标签为“人脸”和“人体”时,标注空间C0即为“人脸、人体”,当原始图像集中正样本的标签为“领带”和“手表”时,标注空间Cn即为“领带、手表”。
步骤S204,对于样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型。
其中,标签冲突指的是对于样本训练集而言,其在原始图像集中的标签与其在新增图像集中的标签存在冲突。例如,当原始图像集中正样本的标签为“人脸”,新增图像集中正样本的标签为“领带”,当前训练样本为包含有“领带”的图像时,若当前训练样本为原始图像集中的一个训练样本时,由于当前训练样本未包含有“人脸”,因此,当前训练样本不会添加有“人脸”标签,且会被当成负样本;若当前训练样本为新增图像集中的一个训练样本时,由于当前训练样本包含有“领带”,因此,当前训练样本会添加有“领带”标签,且会被当成正样本。如此,当前训练样本在原始图像集中的标签与其在新增图像集中的标签不一致,存在标签冲突。
又例如,当原始图像集中正样本的标签为“人脸”,新增图像集中正样本的标签为“领带”,当前训练样本为包含有“领带”和“人脸”的图像时,若当前训练样本为原始图像集中的一个训练样本时,由于原始图像集仅会对“人脸”进行标注,因此,当前训练样本只会被指定为“人脸”,而不会被指定为“领带”;若当前训练样本为新增图像集中的一个训练样本时,由于新增图像集仅会对“领带”进行标注,当前训练样本只会被指定为“领带”,而不会被指定为“人脸”。如此,当前训练样本在原始图像集中的标签与其在新增图像集中的标签不一致,存在标签冲突。
具体地,当获取得到样本训练集时,计算机设备可确定训练样本是否存在标签冲突,并根据训练样本是否存在标签冲突,提取训练样本中的确定性信息,基于确定性信息构造第一损失。进一步地,计算机设备通过第一损失对初始识别模型进行第一训练,得到中间识别模型。基于相应训练样本是否存在标签冲突对初始识别模型进行第一训练,使得训练样本中可能存在的标签冲突能够被有效避免,从而提升了中间识别模型的准确性。
容易理解地,通过相应训练样本是否存在标签冲突对初始识别模型进行第一训练,使得初始识别模型可以从训练样本中提取确定性信息,从而基于确定性信息对应调整模型参数,得到具有高准确性的中间识别模型。其中,确定性信息指的是准确无误的信息,例如,初始识别模型可基于是否存在标签冲突,提取标注有“人脸”的训练样本中的确定性信息:此训练样本一定包含有人脸;提取标注有“领带”的训练样本中的确定性信息:此训练样本一定包含有领带;提取原始图像集中的负样本中的确定性信息:此训练样本一定不包含有原始图像类别的对象;提取新增图像集中的负样本中的确定性信息:此训练样本一定不包含有新增图像类别的对象。并且初始识别模型还可基于是否存在标签冲突,避免得到不确定性信息,例如,避免提取原始图像集中的负样本中的不确定性信息:此训练样本是否包含有新增图像类别的对象;避免提取新增图像集中的负样本中的不确定性信息:此训练样本是否包含有原始图像类别的对象。
在一个实施例中,在模型训练过程中,对于样本训练集中的每个训练样本,初始识别模型均可对训练样本进行原始图像类别和新增图像类别的目标识别,输出对应的预测结果。更具体地,初始识别模型确定待训练的当前训练样本,以及确定包含有当前训练样本的当前样本图像,并对当前训练样本进行目标识别,输出预测框、预测框所框选的图像区域所属图像类别和预测框在当前样本图像中的位置坐标,并根据预测框所框选的图像所属图像类别、预测框在当前样本图像中的位置坐标以及当前训练样本中的标签,构造对应的第一训练损失函数,基于第一训练损失函数对初始识别模型进行第一训练,得到中间识别模型。其中,第一训练损失函数为:i代表第i个训练样本(也即第i个预设检测框);pi代表预测框所框选的对象所属类别;代表标签中的真实类别;ti代表预测框在当前样本图像中的位置坐标,ti可以用一个4维向量表示;代表标签中的真实位置坐标;Lcls代表分类损失;Lloc代表定位损失。
在一个实施例中,如果预设检测框i所框选的对象的类别为原始图像类别或者新增图像类别时,则会被设置为一个独热向量:若预设检测框i所框选的对象的类别不为原始图像类别以及不为新增图像类别时,会被设置为0。例如,当预设检测框i框选有人脸或者领带时,当预设检测框i未框选有人脸和领带时,
步骤S206,通过中间识别模型对样本训练集进行目标识别,得到预测结果,并基于预测结果对样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集。
其中,伪标注指的是进行模型训练时,给未标注的训练样本加入标签的操作。预测结果指的是识别模型输出的信息,预测结果包括预测框、预测框所框选的图像区域所属类别的概率值和预测框的位置信息。为了便于描述,下述将初始识别模型输出的预测结果称作第一预测结果;将中间识别模型输出的预测结果称作第二预测结果。将第一预测结果中的所属类别的概率值称作第一预测概率,将第一预测结果中的预测框称作第一预测框,第一预测框所属类别的概率值称作第一预测概率,第一预测框的位置信息称作第一预测位置信息;将第二预测结果中的预测框称作第二预测框,第二预测框所属类别的概率值称作第二预测概率,第二预测框的位置信息称作第二预测位置信息。其中,预测位置信息具体可以为预测位置坐标。
虽然在第一训练的过程中,计算机设备尽可能地整合可获得的正确信息来训练得到中间识别模型,但是仍然有大量的未标注训练样本未被充分利用,因此,可大量的未标注训练样本进行充分挖掘,对样本训练集进行伪标注处理,得到伪标注样本,从而基于伪标注样本对中间识别模型进行第二训练,得到更为准确的目标识别模型。
具体地,计算机设备通过中间识别模型对样本训练集中的每个训练样本进行目标识别,得到每个训练样本各自对应的第二预测结果。进一步地,计算机设备通过第二预测结果,确定对应第二预测框的检测置信度,基于检测置信度对第二预测框所框选的图像区域进行伪标注处理,得到伪标注样本。其中,检测置信度指的是第二预测框所框选的图像区域包括原始图像类别或者新增图像类别对象的可信程度。
在一个实施例中,对于多个第二预测框中的当前第二预测框,在当前第二预测框的检测置信度大于检测阈值时,可认为当前第二预测框所框选的图像区域包括原始图像类别或者新增图像类别的对象,比如可认为当前第二预测框所框选的图像区域包括人脸或者领带,此时,计算机设备基于当前第二预测框所框选的图像区域所属图像类别,对当前第二预测框所框选的图像区域进行伪标注处理,得到伪标注样本,比如,在基于第二预测结果,确定当前第二预测框所框选的图像区域包括人脸时,计算机设备将当前第二预测框所框选的图像区域标注为“人脸”。在当前第二预测框的检测置信度小于或等于检测阈值时,可认为当前第二预测框所框选的图像区域不包括原始图像类别或者新增图像类别对象,此时,计算机设备暂停对当前第二预测框的伪标注处理。
在一个实施例中,在对当前第二预测框进行伪标注处理之前,计算机设备可确定当前第二预测框所框选的图像区域中是否已存在标注,若已存在标注,计算机设备判断已存在的标注是否与伪标注相同,若不相同,则计算机设备对当前第二预测框进行伪标注处理。
在一个实施例中,可综合第二预测框所框选的图像区域所属类别的概率值以及第二预测框的位置信息,确定对应的检测置信度,比如,可对概率值和位置信息进行加权求和,以确定对应的检测置信度。
步骤S208,确定更新训练集中的各目标负样本所对应的加权信息。
其中,标签标注实例指的是预先在样本图像中框选的、且包含有新增图像类别或原始图像类别对象的图像区域,例如,开发人员可以预先在样本图像中框选仅包含有人脸的图像区域,从而将仅包含有人脸的图像区域称作标签标注实例。容易理解地,当一个预设检测框所框选的图像区域与标签标注实例之间的重合度达到预设阈值时,可认为预设检测框所框选的图像区域为正样本,反之,当一个预设检测框所框选的图像区域与标签标注实例之间的重合度未达到预设阈值时,可认为预设检测框所框选的图像区域为负样本。例如,当预设检测框所框选的图像区域与标签标注实例之间的交并比大于50%时,即可称预设检测框所框选的图像区域为正样本,其中,预设检测框所框选的图像区域与标签标注实例位于于同一样本图像。
目标负样本指的是更新训练集中的负样本。当对样本训练集进行伪标注处理后,样本训练集中的部分负样本会因伪标签的添加而更新为伪标注样本,从而目标负样本为样本训练集中的除伪标注样本之外的负样本。
具体地,计算机设备可确定更新训练集中的每个目标负样本各自对应的加权信息。例如,计算机设备可将更新训练集中的每个目标负样本所对应的权重,均设置为预设权重值。
在一个实施例中,确定更新训练集中的各目标负样本所对应的加权信息包括:基于更新训练集中的目标负样本与对应的标签标注实例之间的第一重合度,确定各目标负样本所对应的加权信息。
具体地,由于与标签标注实例具有较大重合区域(例如,交并比为0.3或0.4)的目标负样本是一个未标注的标签标注实例的概率较小,例如,当原始图像类别为“人脸”类,新增图像类别为“领带”类,当前目标负样本与当前标签标注实例之间的第一重合度大于预设阈值时,即可认为当前目标负样本包含有“人脸”或者“领带”的概率较小,因此,对于多个目标负样本中的每个目标负样本,计算机设备可确定当前目标负样本以及当前目标负样本所在的目标样本图像,并计算当前目标负样本与目标样本图像中的标签标注实例之间的第一重合度,基于第一重合度确定当前目标负样本所对应的加权信息。
通过增加加权信息,使得在后续的第二训练过程中,更新训练集中的负样本信息可以被充分利用,从而达到平衡正负样本、弥补第二训练过程中负样本信息不足的目的。
在一个实施例中,第一重合度可为当前目标负样本与目标样本图像中的标签标注实例之间的交并比,也即当前目标负样本所对应的图像区域与标签标注实例所对应的图像区域之间的交并比。
在一个实施例中,当目标样本图像中包括多个标签标注实例时,计算机设备将最高交并比作为第一重合度。
在一个实施例中,可基于公式确定目标负样本所对应的加权信息。其中,均为预设参数,x为第一重合度。参考图3,如图所示,与标签标注实例具有较大重合度的目标负样本,对损失函数中不属于参考图像类别的损失做出了较大贡献,而与标签标注实例具有较大重合度的目标负样本,对损失函数中不属于参考图像类别的损失做出了较小贡献。图3为一个实施例中,目标负样本加权曲线图。其中,右侧图像为左侧图像的局部放大图。
步骤S210,对于更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,目标识别模型用于进行原始图像类别和新增图像类别的识别。
具体地,由于更新训练集中包含有来源于原始图像集中的训练样本以及来源于新增图像集中的训练样本,因此,依旧需要基于所存在的标签冲突对中间识别模型进行第二训练。计算机设备确定更新训练集中的更新样本,并基于相应更新样本是否存在标签冲突确定第二损失,通过第二损失对所述中间识别模型进行第二训练,以调整中间识别模型的模型参数。其中,更新样本为更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本中其中一个样本。当确定已达到第二训练停止条件时,计算机设备停止调整中间识别模型的模型参数,得到训练好的目标识别模型。
在一个实施例中,参考图4,上述基于图像处理的目标识别模型的训练包括第一训练、伪标注处理、加权信息的确定和第二训练。通过第一训练,使得初始识别模型可以通过原始图像集和新增图像集学习到原始图像类别特征以及新增图像类别特征,例如可以充分学习到人脸特征和领带特征;通过伪标注处理和确定加权信息,可以充分挖掘训练样本中的有用信息;通过第二训练,使得中间识别模型可以基于额外挖掘到的有用信息进一步提升模型的准确性,从而得到目标识别模型。图4示出了一个实施例中,基于图像处理的目标识别模型的训练方法的总体框架示意图。
上述目标识别模型的训练方法中,通过获取样本训练集,可以基于样本训练集中的每个训练样本和相应训练样本是否存在标签冲突,对原始识别模型进行无冲突的第一训练,使得原始识别模型可基于所确定的标签冲突,从相应训练样本中提取准确无误的信息,并基于准确无误的信息对应调整模型参数,得到准确性较高的中间识别模型。通过获取中间识别模型,可基于中间识别模型对样本训练集进行伪标注处理,以充分挖掘训练样本中的未标注的对应于原始图像类别或新增图像类别的图像区域,得到包括有伪标注样本的更新训练集。通过获取更新训练集,可以确定更新训练集中的目标负样本各自对应的加权信息,从而对更新训练集中的负样本信息进行充分挖掘。通过获取更新训练集、伪标注样本和包括有加权信息的目标负样本,可基于更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,对中间识别模型进行第二训练,使得中间识别模型可基于充分挖掘的负样本信息和充分挖掘的伪标注信息对应调整模型参数,得到准确性更高的目标识别模型。
由于本申请是基于原始图像集和新增图像集对目标识别模型进行训练的,无需对图像集中的标签进行更新,因此,相比于传统的需要通过人工对原始图像集进行新增图像类别的标注,本申请可以节省人工所耗费的人力成本,从而提升目标识别模型的训练效率。
在一个实施例中,对于样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型,包括:获取用于进行原始图像类别识别的初始识别模型;确定样本训练集中的待处理的当前训练样本的样本属性;通过初始识别模型对当前训练样本进行目标识别,得到当前训练样本分别属于原始图像类别和新增图像类别的第一预测概率;根据样本属性和当前训练样本是否存在标签冲突,确定每个第一预测概率各自对应的第一概率权重;根据第一预测概率和对应的第一概率权重构造第一损失,并通过第一损失调整初始识别模型的模型参数;将当前训练样本更新为已完成训练样本,并将下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,返回至确定样本训练集中的待处理的当前训练样本的样本属性的步骤继续执行,直至达到第一训练停止条件时停止训练,得到中间识别模型。
具体地,计算机设备获取初始识别模型,以及获取样本训练集中的待处理的当前训练样本,并确定当前训练样本的样本属性。其中,样本属性包括样本来源和样本正负性。样本来源包括来源于原始图像集,或者来源于新增图像集。样本正负性包括为正样本或者为负样本。进一步地,计算机设备将当前训练样本输入至初始识别模型,通过初始识别模型对当前训练样本进行目标识别,得到当前训练样本属于原始图像类别的第一预测概率、以及属于新增图像类别的第一预测概率。计算机设备根据当前训练样本的样本属性和当前训练样本是否存在标签冲突,确定每个第一预测概率各自对应的第一概率权重,并通过第一预测概率和对应的第一概率权重构造第一损失,通过第一损失调整初始识别模型的模型参数。
进一步地,计算机设备将当前训练样本更新为已完成训练样本,并将样本训练集中的下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,基于重新确认的当前训练样本进行迭代训练,直至达到第一训练停止条件时停止训练,得到中间识别模型。其中,第一训练停止条件可以根据需求自由设定,例如,可在基于样本训练集中的每个训练样本均对初始识别模型进行训练时,认为达到第一训练停止条件。又例如,可在已完成预设次数的迭代训练时,认为达到第一训练停止条件。本实施例在此不作限定。
在其中一个实施例中,当原始图像集对应于“人脸”类别,新增图像集对应于“领带”类别时,原始图像集中包含有“领带”的训练样本由于未标注有标签“人脸”,则会被当成负样本,但是,该训练样本在新增图像集中实际为正样本,应该添加有“领带”标签,因此产生了标签冲突。又例如,当原始图像集中的正样本被指定为“人脸”,但该正样本即包含有“人脸”又包含有“领带”时,由于原始图像集仅对“人脸”进行了标注,因此,该正样本只会被指定为“人脸”,然而,实际上该正样本应该被指定为“人脸和“领带”,应该添加有“人脸”标签和“领带”标签,故而产生了标签冲突。
在其中一个实施例中,第一损失指的是第一训练损失函数中的分类损失函数。当通过初始识别模型对当前训练样本进行目标识别时,可得到对应的第一预测结果。其中,第一预测结果包括第一预测框、第一预测框所框选的图像区域所属类别的概率值(也即第一预测概率)以及第一预测框的位置坐标(也即第一预测位置坐标)。进一步地,计算机设备可基于标签中的真实位置坐标和第一预测位置坐标,构建定位损失函数,可基于第一预测概率、第一概率权重和标签中的真实类别,构建分类损失函数,可基于定位损失函数和分类损失函数构建第一训练损失函数,从而计算机设备通过第一损失函数对初始识别模型进行第一训练。
在其中一个实施例中,计算机设备可基于以下公式确定对应的第一损失Lcls:
其中,i代表第i个训练样本(也即第i个预设检测框);c代表新增图像类别和原始图像类别中的其中一个类别;Ncls代表新增图像类别和原始图像类别的类别总数量;w(i,c)代表第一概率权重;代表标签所对应的图像类别;代表的独热向量;代表第i个训练样本为类别c的第一预测概率。
由于定位损失函数只与正样本相关而不与负样本相关,因此定位损失函数中所存在的潜在标签冲突较少,而分类损失函数不仅与正样本相关而且与负样本相关,因此,存在潜在的标签冲突,而本实施例通过在分类损失函数中增加第一概率权重,可避免潜在的标签冲突,使得训练得到的中间识别模型更为准确。
上述实施例中,通过第一预测概率和第一概率权重构造对应的第一损失,使得初始识别模型在第一训练中,可基于第一损失减少错误监督信息的干扰,从而提升中间识别模型的准确性。
在一个实施例中,样本属性包括样本来源和样本正负性,样本来源包括来源于原始图像集,或者来源于新增图像集;根据样本属性和当前训练样本是否存在标签冲突,确定每个第一预测概率各自对应的第一概率权重,包括:根据当前训练样本的样本正负性,确定当前训练样本是否存在标签冲突;当确定当前训练样本存在标签冲突时,根据样本来源,确定样本来源中正样本的标签所对应的参考图像类别,参考图像类别为原始图像类别或者新增图像类别;将当前训练样本属于参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;将当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;其余图像类别为原始图像类别和新增图像类别中的一个类别,且与参考图像类别不同。
具体地,计算机设备根据当前训练样本的样本正负性,确定当前训练样本是否存在标签冲突,并在确定当前训练样本存在标签冲突时,认为当前训练样本可能向初始识别模型提供错误的训练监督信息。为了避免存在标签冲突的当前训练样本向初始识别模型提供错误的训练监督信息,计算机设备确定当前训练样本的样本来源,并确定样本来源中的正样本所对应的标签类别,也即确定参考图像类别,并将当前训练样本属于参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值,将当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值,以使得基于第一概率权重和第一概率所确定的第一损失,能够避免向初始识别模型提供错误的训练监督信息。其中,参考图像类别和其余图像类别均为原始图像类别和新增图像类别中的一个类别,且原始图像类别与参考图像类别不同。
当计算机设备确定当前训练样本不存在标签冲突时,计算机设备将当前训练样本的每个第一预测概率各自对应的第一概率权重均设置为第一目标值。
在其中一个实施例中,在当前训练样本为负样本时,可认为当前训练样本存在标签冲突;在当前训练样本为正样本时,可认为当前训练样本不存在标签冲突。
在其中一个实施例中,第一目标值具体可以为1,第二目标值具体可以为0。
上述实施例中,通过区分各第一预测概率值所对应的第一概率权重,使得基于第一预测概率和第一概率权重所确定的第一损失能够更为准确,从而提升中间识别模型的准确性。
在一个实施例中,根据当前训练样本的样本正负性,确定当前训练样本是否存在标签冲突,包括:当当前训练样本属于负样本时,确定当前训练样本存在标签冲突;当当前训练样本属于正样本时,确定当前训练样本与对应的标签标注实例之间的第二重合度;当第二重合度小于或等于预设重合阈值时,确定当前训练样本存在标签冲突。
具体地,当基于样本正负性确定当前训练样本为负样本时,计算机设备确定当前训练样本存在标签冲突,并认为当前训练样本可能向初始识别模型提供错误的训练监督信息。例如,当原始图像集对应于“人脸”类别,新增图像集对应于“领带”类别,当前训练样本为原始图像集中的负样本,且当前训练样本包含有“领带”时,由于当前训练样本未添加有任何标签,因此,当前训练样本可能向初始识别模型提供错误训练监督信息“当前训练样本即不包含有人脸又不包含有领带”,此与事实相违背,从而导致初始识别模型朝错误的方向调整模型参数。
当基于样本正负性确定当前训练样本为正样本时,计算机设备确定当前训练样本与同一样本图像中的标签标注实例之间的第二重合度,并在确定第二重合度小于或等于预设重合阈值时,认为当前训练样本存在标签冲突,可能向初始识别模型提供错误训练监督信息。例如,当原始图像集对应于“人脸”类别,新增图像集对应于“领带”类别,当前训练样本为原始图像集中的正样本时,由于当前训练样本与标签标注实例之间的第二重合度小于或等于预设重合阈值,可认为当前训练样本其实与“领带”类具有更高的契合度,即可认为当前训练样本包含有领带又包含有人脸,但又因原始图像集仅标记了“人脸”,因此,当前训练样本可能向初始识别模型提供错误训练监督信息“当前训练样本仅包含有人脸,不包含有领带”,此与实时相违背,从而导致初始识别模型朝错误的方向调整模型参数。
在其中一个实施例中,第二重合度可以为当前训练样本与对应标签标注实例之间的交并比。
在其中一个实施例中,可通过以下公式确定当前训练样本存在标签冲突,以及确定每个第一预测概率各自对应的第一概率权重:
其中,i∈Neg代表第i个训练样本属于负样本;i∈Pos代表第i个训练样本属于正样本;I*代表样本来源;C*代表与I*对应的图像类别;f(i)代表第二重合度;γ代表重合阈值;otherwise代表除 之外的其余情况;&代表“并且”;“|”代表“或者”。
容易理解地,基于上述公式,其中两种可能的标签冲突被有效避免:1.来自一个图像集中的负样本不会参与损失函数中属于其它图像集所对应的图像类别的计算。2.来自一个图像集中的正样本只有当该正样本和标签标注实例的第二重合度达到足够高时,才会参与损失函数中属于其它图像集所对应的图像类别的计算。如果正样本与标签标注实例的第二重合度不够高时,同样不会参与属于其它图像集所对应的图像类别的计算。
为了更好地了解本实施例,下述以举例的方式对上述公式进行进一步描述。参考图5,假设原始图像集I0所对应的原始图像类别C0包括“人脸”类别和“人体”类别,新增图像集In所对应的新增图像类别Cn对应于“领带”类别和“手表”类别。在当前训练样本i属于负样本,且来自于原始图像集(i∈Neg&i∈I0)时,计算机设备可基于如下公式,将当前训练样本属于Cn的第一预测概率所对应的第一概率权重设置为0,将属于C0的第一预测概率所对应的第一概率权重设置为1。也就是将当前训练样本属于“领带”第一预测概率所对应的第一概率权重设置为0;将当前训练样本属于“手表”第一预测概率所对应的第一概率权重设置为0;将当前训练样本属于“人脸”第一预测概率所对应的第一概率权重设置为1;将当前训练样本属于“人体”第一预测概率所对应的第一概率权重设置为1,从而实现来自一个图像集中的负样本不会参与损失函数中属于其它图像集所对应的图像类别的计算,以避免来自原始图像集中的负样本向初始识别模型提供错误训练监督信息“当前训练样本不包含有人脸、领带、人体及手表”。
在当前训练样本i属于原始图像集中的正样本,且第二重合度小于或等于预设重合阈值时,计算机设备可基于如下公式,将当前训练样本属于Cn的第一预测概率所对应的第一概率权重设置为0,将属于C0的第一预测概率所对应的第一概率权重设置为1,从而实现来自一个数据中的正样本只有当该正样本和标签标注实例的第二重合度达到足够高时,才会参与损失函数中属于其它图像集所对应的图像类别的计算,如果正样本与标签标注实例的第二重合度不够高时,同样不会参与属于其它图像集所对应的图像类别的计算。比如,可以避免来自原始图像集中的正样本向初始识别模型提供错误训练监督信息“当前训练样本仅包含有人脸或者人体,不包含有领带和手表”。图5示出了一个实施例中第一概率权重的确定流程示意图。其中,图5中的连线“-”代表所连接的训练样本会参与损失函数中属于所连接图像类别的计算,例如,当“人脸”类别与原始图像集中的负样本相连接时,代表原始图像集中的负样本会参与损失函数中属于“人脸”类别的计算。
上述实施例中,通过当前训练样本的样本正负性和与对应的标签标注实例之间的第二重合度,可以准确确定当前训练样本是否符合标签无冲突条件。
在一个实施例中,样本训练集包括至少一张样本图像,样本图像包括多于一个的训练样本;通过中间识别模型对样本训练集进行目标识别,得到预测结果,并基于预测结果对样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集,包括:通过中间识别模型对样本图像进行预设次数的目标识别,得到预设次数的预测结果;预测结果包括预测框、预测框所框选的图像区域所属类别的概率值以及预测框的位置信息;对框选有同一类别图像区域的预测框进行聚类处理,得到至少一个聚类簇;根据预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定每个聚类簇各自对应的检测置信度;根据检测置信度对聚类簇进行伪标注处理,得到伪标注样本。
具体地,传统方法中是基于分类置信度进行伪标注处理,只有当分类置信度足够高的预测框才会被选择来补充某个图像集中未被标注的图像类别。预测框的标注准确度直接影响中间识别模型的训练,而仅基于分类置信度所确定的伪标注的准确性较低,因此,为了获得更加精准的伪标注,本实施例综合分类置信度和定位置信度对样本训练集进行伪标注处理。
计算机设备通过中间识别模型对样本图像进行预设次数的目标识别,得到预设次数的第二预测结果,并基于第二预测结果,对框选有同一类别图像区域的第二预测框进行聚类处理,得到至少一个聚类簇。其中,同一聚类簇中的第二预测框所框选的图像区域包含有同一图像类别的对象,例如,同一聚类簇中所框选的图像区域均包含有同一人脸。进一步地,对于至少一个聚类簇中的每个聚类簇,计算机设备根据第二预测结果中的第二预测框所框选的图像区域所属类别的概率值以及第二预测框的位置信息,确定当前聚类簇所包括的第二预测框所框选的图像区域所属类别的概率值、以及当前聚类簇所包括的第二预测框的位置信息,并根据当前聚类簇所包括的第二预测框所框选的图像区域所属类别的概率值、以及当前聚类簇所包括的第二预测框的位置信息,确定当前聚类簇的分类置信度和定位置信度,综合分类置信度和定位置信度,得到对应的检测置信度,根据检测置信度对当前聚类簇进行伪标注处理,得到对应的伪标注样本。
在其中一个实施例中,可通过以下公式对预测框进行聚类处理:
Oi={(tij,pij)|j=1,2,3,…,|Oi|≤T
其中,Oi代表第i个聚类簇,tij代表第i个聚类簇中的第j个第二预测框的位置坐标;pij代表第i个聚类簇中的第j个第二预测框所框选的图像区域所属类别的预测值;IoU代表交并比;γnms代表阈值;C0代表原始图像类别;Cn代表新增图像类别;|Oi|代表第i个聚类簇中所包括的第二预测框的预测框数量;T代表对样本图像进行预设次数的目标识别中的预设次数;s.t IoU(tij1,tij2)≥γnms,tij2∈Oi代表同一聚类簇中的任意两个第二预测框之间的交并比大于一个阈值;pij2∈Oi代表同一聚类簇中的任意两个第二预测框所框选的图像区域所属图像类别相同。
容易理解地,中间识别模型可对每个类别均进行预测,从而得到第二预测框所框选的图像区域属于各图像类别的预测概率,并将多个预测概率中具有最高预测值的类别作为第二预测框所框选的图像区域所属类别,例如,当中间识别模型确定当前第二预测框包含有人脸的概率值为0.8,包含有领带的概率值为0.2时,计算机设备确定当前第二预测框所框选的图像区域属于人脸类别。
上述实施例中,通过综合第二预测框所框选的图像区域所属类别的预测概率、和第二预测框的位置信息来确定检测置信度,可以提升所确定的检测置信度的准确性,进而提升伪标注的准确性。
在一个实施例中,通过中间识别模型在进行预设次数的目标识别中的每次目标识别的过程中,均对中间识别模型进行随机失活处理,并通过随机失活处理后的中间识别模型进行相应的目标识别,得到对应的预测结果。
具体地,通过中间识别模型在进行预设次数的目标识别中的每次目标识别的过程中,计算机设备均可基于蒙特卡洛算法对中间识别模型进行随机失活处理,随机将中间识别模型中的部分隐含层中的节点的权重归零,得到随机失活后的中间识别模型,并基于随机失活后的中间识别模型对样本图像进行目标识别,得到第二预测结果。
在其中一个实施例中,中间识别模型包括分类分支和定位分支,其中,分类分支用于输出预测框所框选的图像区域所属类别的概率值,定位分支用于输出述预测框的位置信息。随机失活处理仅作用于分类分支和定位分支的最后一层,其余隐含层中的节点不变,例如,随机失活处理仅将最后一层中的部分节点的权重归零,其余隐含层中的节点保持不变。
上述实施例中,在机器学习的过程中,通过对中间识别模型进行随机失活处理,不仅可以降低节点间的相互依赖性,而且可以得到多个不同的第二预测结果,从而后续可对多个不同的第二预测结果进行聚类处理。
在一个实施例中,根据预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定每个聚类簇各自对应的检测置信度,包括:对于至少一个聚类簇中的每个聚类簇,确定当前聚类簇所包括的预测框的预测框数量;基于预测框数量、预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定当前聚类簇所对应的分类置信度和平均位置信息;基于平均位置信息确定与当前聚类簇对应的定位置信度;基于分类置信度和定位置信度,确定当前聚类簇的检测置信度。
具体地,对于至少一个聚类簇中的每个聚类簇,计算机设备确定当前聚类簇所包括的第二预测框的预测框数量、当前聚类簇所包括的第二预测框所框选图像区域所属分类的概率值、和当前聚类簇所包括的第二预测框的位置信息,并根据预测框数量、所属分类的概率值以及位置信息,确定当前聚类簇的分类置信度和平均位置信息,基于平均位置信息确定对应的定位置信度,综合分类置信度和定位置信度得到当前聚类簇的检测置信度。进一步地,计算机设备根据检测置信度确定是否对当前聚类簇进行伪标注处理,当基于检测置信度确定对当前聚类簇进行伪标注处理时,即可得到对应的伪标注样本。
在其中一个实施例中,计算机设备可基于下述公式确定分类置信度:
其中,代表第i个聚类簇所对应的分类置信度,代表代表第i个聚类簇中的第j个第二预测框所框选的图像区域属于第一类别的概率值;代表从属于|C0∪Cn|中的其中一个类别的预测值中选择最大的概率值;C0代表原始图像类别;Cn代表新增图像类别;|Oi|代表第i个聚类簇中所包括的第二预测框的预测框数量。
在其中一个实施例中,计算机设备可基于下述公式确定平均位置信息:
上述实施例中,由于是综合预测框数量、第二预测框所框选的图像区域所属类别的概率值和第二预测框的位置信息,确定分类置信度和定位置信度,使得所确定的分类置信度和定位置信度的准确性更高。
在一个实施例中,基于平均位置信息确定与当前聚类簇对应的定位置信度,包括:确定当前聚类簇中的每两个预测框之间的第三重合度,并根据第三重合度确定当前聚类簇的紧凑程度;根据紧凑程度、当前聚类簇所包括的预测框的预测框数量、以及中间识别模型对样本图像进行目标识别的预设次数,确定与当前聚类簇对应的定位置信度。
具体地,计算机设备可根据第二预测框在对应样本图像中的位置坐标,确定当前聚类簇中每两个第二预测框之间的第三重合度,并根据第三重合度确定当前聚类簇的紧凑程度。其中,紧凑程度指的是聚类簇中的第二预测框在样本图像中的紧密程度。进一步地,计算机设备可根据当前聚类簇所包括的第二预测框的预测框数量、以及中间识别模型对样本图像进行目标识别的预设次数,确定相应的指示函数,基于指示函数、当前聚类簇的紧凑程度和当前聚类簇所包括的第二预测框的预测框数量,确定对应的定位置信度。
在其中一个实施例中,可基于以下公式确定定位置信度:
其中,代表第i个聚类簇所对应的定位置信度;tij1,tij2代表聚类簇中的任意两个第二预测框的位置坐标;IoU(tij1,tij2)代表第三重合度;代表聚类簇的紧凑程度;T代表对样本图像进行预设次数的目标识别中的预设次数;|Oi|代表第i个聚类簇中所包括的第二预测框的预测框数量;代表指示函数,当满足|Oi|≥T/2时,的值为1,不满足时为0。
在其中一个实施例中,如图6所示,当获取得到样本图像时,计算机设备可将此样本图像输入至中间识别模型,通过中间识别模型中的分类分支输出第二预测框所框选的图像区域所属类别的概率值,以及通过中间识别模型中的定位分支输出第二预测框的位置坐标。进一步地,计算机设备对样本图像中的各第二预测框进行聚类处理,得到聚类簇O1和聚类簇O2,基于聚类簇所包括的第二预测框的位置坐标tij和第二预测款所框选的图像区域所属类别的概率值pij,确定对应的平均位置信息分类置信度和定位置信度基于和对相应聚类簇进行伪标注处理。图6示出了一个实施例中伪标注处理的流程示意图。
上述实施例中,由于是综合紧凑程度、预测框数量和预设次数,确定定位置信度的,使得所确定的定位置信度的准确性更高。
在一个实施例中,根据检测置信度对聚类簇进行伪标注处理,得到伪标注样本,包括:当聚类簇的检测置信度高于检测阈值时,判断聚类簇所框选的待处理图像区域是否已包含有标签;当待处理图像区域未包含有标签时,根据聚类簇所属类别对待处理图像区域进行伪标注处理,得到伪标注样本。
其中,待处理图像区域指的是聚类簇中的第二预测框所框选的图像区域。聚类簇所属类别指的是聚类簇中的第二预测框所框选的图像区域所属类别。
具体地,在当前聚类簇所对应的检测置信度高于预设检测阈值时,计算机设备判断当前聚类簇中所对应的待处理图像区域中是否已存在标签,若已存在标签,计算机设备判断当前聚类簇所属类别与该标签是否一致,并在不一致时,根据当前聚类簇所属类别对待处理图像区域进行伪标注处理,将当前聚类簇所属类别作为待处理图像区域的标签,从而得到伪标注样本。当待处理图像区域中未存在标签时,计算机设备直接基于当前聚类簇所属类别对待处理图像区域进行伪标注处理。
在其中一个实施例中,当获取得到当前聚类簇中的每个第二预测框各自框选的图像区域时,计算机设备可基于每个第二预测框各自框选的图像区域确定对应的待处理图像区域。例如,对每个第二预测框各自对应的位置坐标进行求平均运算,基于平均位置坐标确定对应的待处理图像区域。
上述实施例中,当检测置信度高于检测阈值时,才对相应聚类簇进行伪标注处理,可以大大提升伪标注样本的可信度。
在一个实施例中,确定更新训练集中的各目标负样本所对应的加权信息,包括:对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;确定当前目标负样本与目标样本图像所对应的标签标注实例之间的第一重合度;根据第一重合度,确定当前目标负样本所对应的加权信息。
具体地,计算机设备确定当前目标负样本,以及确定包括有当前目标负样本的目标样本图像。进一步地,计算机设备确定目标样本图像中的标签标注实例,并根据目标负样本在目标样本图像中的位置信息和标签标注实例在目标样本图像中的位置信息,确定当前目标负样本与标签标注实例之间的第一重合度,根据第一重合度,确定当前目标负样本所对应的加权信息。
在其中一个实施例中,在目标样本图像中具有多个标签标注实例时,计算机设备分别确定目标负样本与各标签标注实例之间的重合度,并将最高重合度作为第一重合度。
在其中一个实施例中,在目标样本图像中具有多个标签标注实例时,计算机设备确定与目标负样本距离最近的目标标签标注实例,并确定目标负样本与目标标签标注实例之间的重合度,得到第一重合度。
上述实施例中,由于与标签标注实例具有较大重合区域的目标负样本是一个未标注的标签标注实例的概率较小,因此,可基于第一重合度确定目标负样本的加权信息,从而使得不包含有原始图像类别和新增图像类别对象的目标负样本可以具有较高权重,进而在后续的第二训练过程中,中间识别模型可以倾向从权重较高的目标负样本中学习到更为准确的负样本信息,以达到对负样本信息进行充分利用的目的。
此外,当训练样本添加有伪标注时,其会从负样本转变为正样本,从而降低了更新训练集中的正负样本比例,通过对更新训练集中的目标负样本进行加权处理,可以平衡更新训练集中的正负样本比例,从而提升基于更新训练集训练得到的目标识别模型的准确性。
在一个实施例中,对于更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过第二损失对中间识别模型进行第二训练,得到目标识别模型,包括:确定更新训练集中的待处理的当前更新样本;通过中间识别模型对当前更新样本进行目标识别,得到当前更新样本分别属于原始图像类别和新增图像类别的第二预测概率;当当前更新样本属于包括有加权信息的目标负样本时,基于加权信息和当前更新样本是否存在标签冲突,确定各第二预测概率各自对应的第二概率权重;当当前更新样本不为包括有加权信息的目标负样本时,根据当前更新样本是否存在标签冲突,确定每个第二预测概率各自对应的第二概率权重;根据第二预测概率和对应的第二概率权重构造第二损失,并通过第二损失对调整中间识别模型的模型参数;将当前更新样本修改为已完成更新样本,并将下一个待处理的更新样本作为下一次迭代训练中的当前更新样本,返回通过中间识别模型对当前更新样本进行目标识别的步骤继续执行,直至达到第二训练停止条件时停止训练,得到训练好的目标识别模型。
具体地,计算机设备确定更新训练集中的待处理的当前更新样本,并将当前更新样本输入至中间识别模型,由中间识别模型对当前更新样本进行目标识别,得到当前更新样本属于原始图像类别的第二预测概率、和当前更新样本属于新增图像类别的第二预测概率。进一步地,计算机设备判断当前更新样本书否属于包括有加权信息的目标负样本,并在确定当前更新样本属于包括有加权信息的目标负样本时,确定当前更新样本的样本来源,并确定样本来源中正样本的标签所对应的参考图像类别。
进一步地,计算机设备将当前更新样本属于参考图像类别的第二预测概率所对应的第二概率权重设置为第一目标值,以及根据加权信息设置当前更新样本属于其余图像类别的第二预测概率所对应的第二概率权重。例如,当加权信息为时,即可将当前更新样本属于其余图像类别的第二预测概率所对应的第二概率权重设置为又例如,在当前更新样本为原始图像集中的负样本,且原始图像集对应于“人脸”类别,新增图像集对应于“领带”类别时,可将当前更新样本属于“人脸”类别的第二预测概率所对应的第二概率权重设置为1,将当前更新样本属于“领带”类别的第二预测概率所对应的第二概率权重设置为
在当前更新样本不为包括有加权信息的目标负样本时,也就是,在当前更新样本为正样本或者伪标注样本时,计算机设备确定当前更新样本与对应标签标注实例之间的第四重合度,并在确定第四重合度小于或等于预设重合阈值时,将当前更新样本属于参考图像类别的第二预测概率所对应的第二概率权重设置为第一目标值,将当前更新样本属于其余图像类别的第二预测概率所对应的第二概率权重设置为第二目标值;在确定第四重合度大于预设阈值时,将当前更新样本的每个第二预测概率各自对应的第二概率权重均设置为第一目标值。其中,参考图像类别与其余图像类别为原始图像类别和新增图像类别中的其中一种,且参考图像类别与其余图像类别不同。
在其中一个实施例中,计算机设备可确定更新训练集中的每个更新样本各自对应的加权信息,从而在当前更新样本属于目标负样本时,可将当前更新样本属于参考图像类别的第二预测概率所对应的第二概率权重设置为第一目标值,将当前更新样本属于其余图像类别的第二预测概率所对应的第二概率权重设置为加权信息。在当前更新样本属于正样本或者伪标注样本时,可根据当前更新样本与对应标签标注实例之间的第四重合度,确定将当前更新样本属于参考图像类别的第二预测概率所对应的第二概率权重设置为第一目标值、以及将当前更新样本属于其余图像类别的第二预测概率所对应的第二概率权重设置为加权信息,或者将当前更新样本的每个第二预测概率各自对应的第二概率权重均设置为第一目标值。
其中,i为第i个更新样本;y为更新样本与对应标签标注实例之间的第四重合度。
上述实施例中,通过加权信息对中间识别模型进行第二训练,使得负样本信息可以被充分利用,从而提升目标识别模型的准确性。
在一个实施例中,基于图像处理的目标识别模型的训练方法还包括:获取待识别图像,并将待识别图像输入至训练好的目标识别模型;通过训练好的目标识别模型,对待识别图像中的对应于原始图像类别或新增图像类别的目标图像区域进行目标识别,得到目标图像区域所在位置信息,以及目标图像区域所对应的目标图像类别。
具体地,当得到训练好的目标识别模型时,计算机设备可基于目标识别模型对待识别图像进行原始图像类别和新增图像类别的目标识别。计算机设备获取待识别图像,并将待识别图像输入至目标识别模型中,通过目标识别模型输出包含有原始图像类别或者新增图像类别的目标图像区域所在位置信息,以及目标图像区域所对应的目标图像类别。例如,当原始图像类别为“人脸”类别,新增图像类别为“领带”类别时,目标识别模型不仅可以输出包含有人脸的目标图像区域,并在目标图像区域中显示“人脸”文字,还可以输出包含有领带的目标图像区域,以及在目标图像区域中显示“领带”文字。
本实施例中,通过二重训练而得的目标识别模型对待识别图像进行目标识别,不仅可以输出包含有原始图像类别或者新增图像类别对象的目标图像区域,而且可以使得所输出的目标图像区域更为准确。
在一个具体的实施例中,如图7所示,本申请提供的目标识别模型的训练方法包括以下步骤:
S702,获取由原始图像集和新增图像集构成的样本训练集;原始图像集中正样本的标签为原始图像类别,新增图像集中正样本的标签为新增图像类别。
S704,获取用于进行原始图像类别识别的初始识别模型;确定样本训练集中的待处理的当前训练样本的样本属性;样本属性包括样本来源和样本正负性,样本来源包括来源于原始图像集,或者来源于新增图像集。
S706,通过初始识别模型对当前训练样本进行目标识别,得到当前训练样本分别属于原始图像类别和新增图像类别的第一预测概率。
S708,当当前训练样本属于负样本时,确定当前训练样本存在标签冲突;当当前训练样本属于正样本时,确定当前训练样本与对应的标签标注实例之间的第二重合度;当第二重合度小于或等于预设重合阈值时,确定当前训练样本存在标签冲突。
S710,当确定当前训练样本存在标签冲突时,根据样本来源,确定样本来源中正样本的标签所对应的参考图像类别,参考图像类别为原始图像类别或者新增图像类别。
S712,当当前训练样本存在标签冲突时,将当前训练样本属于参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;将当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;其余图像类别为原始图像类别和新增图像类别中的一个类别,且与参考图像类别不同。
S714,在当前训练样本不存在标签冲突时,将当前训练样本的第一预测概率所对应的第一概率权重均设置为第一目标值。
S716,根据第一预测概率和对应的第一概率权重构造第一损失,并通过第一损失调整初始识别模型的模型参数;将当前训练样本更新为已完成训练样本,并将下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,返回至确定样本训练集中的待处理的当前训练样本的样本属性的步骤继续执行,直至达到第一训练停止条件时停止训练,得到中间识别模型。
S718,样本训练集包括至少一张样本图像,样本图像包括多于一个的训练样本;通过中间识别模型对样本图像进行预设次数的目标识别,得到预设次数的预测结果;预测结果包括预测框、预测框所框选的图像区域所属类别的概率值以及预测框的位置信息。
S720,对框选有同一类别图像区域的预测框进行聚类处理,得到至少一个聚类簇。
S722,对于至少一个聚类簇中的每个聚类簇,确定当前聚类簇所包括的预测框的预测框数量;基于预测框数量、预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定当前聚类簇所对应的分类置信度和平均位置信息。
S724,基于平均位置信息确定与当前聚类簇对应的定位置信度;基于分类置信度和定位置信度,确定当前聚类簇的检测置信度;根据检测置信度对聚类簇进行伪标注处理,得到伪标注样本。
S726,对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;确定当前目标负样本与目标样本图像所对应的标签标注实例之间的第一重合度;根据第一重合度,确定当前目标负样本所对应的加权信息。
S728,对于更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过第二损失对中间识别模型进行第二训练,得到目标识别模型;目标识别模型用于进行原始图像类别和新增图像类别的识别。
上述目标识别模型的训练方法中,由于本申请是基于原始图像集和新增图像集对目标识别模型进行训练的,无需对图像集中的标签进行更新,因此,相比于传统的需要通过人工对原始图像集进行新增图像类别的标注,本申请可以节省人工所耗费的人力成本,从而提升目标识别模型的训练效率。
在另一个具体实施例中,如图8所示,本申请提供的基于图像处理的目标识别模型的训练方法包括以下步骤:
S802,获取由原始图像集和新增图像集构成的样本训练集;原始图像集中正样本的标签为原始图像类别,新增图像集中正样本的标签为新增图像类别。
S804,对于样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型。
S806,通过中间识别模型对样本训练集进行目标识别,得到预测结果,并基于预测结果对样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集。
S808,基于更新训练集中的目标负样本与对应的标签标注实例之间的第一重合度,确定各目标负样本所对应的加权信息。
S810,对于更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过第二损失对中间识别模型进行第二训练,得到目标识别模型。
S812,获取待识别图像,并将待识别图像输入至训练好的目标识别模型。
S814,通过训练好的目标识别模型,对待识别图像中的对应于原始图像类别或新增图像类别的目标图像区域进行目标识别,得到目标图像区域所在位置信息,以及目标图像区域所对应的目标图像类别。
应该理解的是,虽然图2、7-8的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2、7-8中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
本申请还提供一个应用场景,该应用场景应用上述的目标识别模型的训练方法。具体地,该目标识别模型的训练方法在该应用场景的应用如下:
当获取得到经过第一训练以及第二训练得到的目标识别模型时,计算机设备可将待识别图像输入至目标识别模型,由目标识别模型对待识别图像中的新增图像类别对象和原始图像类别对象进行目标识别,例如,当新增图像类别为“手表”类别、“戒指”类别及“手链”类别,原始图像类别为“帽子”类别、“眼镜”类别时,目标识别模型可识别待识别图像中的手表、戒指、手链、帽子以及眼镜,框选待识别图像中可能存在的手表、戒指、手链、帽子及眼镜,并将所框选的对象的位置信息对应输出。本申请还提供一种应用场景,该应用场景应用上述的目标识别模型的训练方法。具体地,该目标识别模型的训练方法在该应用场景的应用如下:
当获取得到训练好的、且用于对原始图像类别和新增图像类别的音频进行目标识别的目标识别模型时,计算机设备可将待识别音频输入至目标识别模型,由目标识别模型对待识别音频进行音频识别,以确定待识别音频中所对应的类别。例如,当原始图像类别对应于A用户的音色,新增图像类别对应于B用户的音色时,目标识别模型即可确定待识别音频来源于A用户或者来源于B用户。
在一个实施例中,如图9所示,提供了一种基于图像处理的目标识别模型的训练装置900,该装置可以采用软件模块或硬件模块,或者是二者的结合成为计算机设备的一部分,该装置具体包括:第一训练模块902、挖掘模块904和第二训练模块906,其中:
第一训练模块902,用于获取由原始图像集和新增图像集构成的样本训练集;原始图像集中正样本的标签为原始图像类别,新增图像集中正样本的标签为新增图像类别;对于样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型。
挖掘模块904,用于通过中间识别模型对样本训练集进行目标识别,得到预测结果,并基于预测结果对样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;确定更新训练集中的各目标负样本所对应的加权信息。
第二训练模块906,用于对于更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过第二损失对中间识别模型进行第二训练,得到目标识别模型;其中,更新样本包括更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,目标识别模型用于进行原始图像类别和新增图像类别的识别。
在一个实施例中,如图10所示,第一训练模块902还用于获取用于进行原始图像类别识别的初始识别模型;确定样本训练集中的待处理的当前训练样本的样本属性;通过初始识别模型对当前训练样本进行目标识别,得到当前训练样本分别属于原始图像类别和新增图像类别的第一预测概率;根据样本属性和当前训练样本是否存在标签冲突,确定每个第一预测概率各自对应的第一概率权重;根据第一预测概率和对应的第一概率权重构造第一损失,并通过第一损失调整初始识别模型的模型参数;将当前训练样本更新为已完成训练样本,并将下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,返回至确定样本训练集中的待处理的当前训练样本的样本属性的步骤继续执行,直至达到第一训练停止条件时停止训练,得到中间识别模型。
在一个实施例中,样本属性包括样本来源和样本正负性,样本来源包括来源于原始图像集,或者来源于新增图像集;第一训练模块902还包括概率权重确定模块9021,用于根据当前训练样本的样本正负性,确定当前训练样本是否存在标签冲突;当确定当前训练样本存在标签冲突时,根据样本来源,确定样本来源中正样本的标签所对应的参考图像类别,参考图像类别为原始图像类别或者新增图像类别;将当前训练样本属于参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;将当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;其余图像类别为原始图像类别和新增图像类别中的一个类别,且与参考图像类别不同。
在一个实施例中,概率权重确定模块9021还用于当当前训练样本属于负样本时,确定当前训练样本存在标签冲突;当当前训练样本属于正样本时,确定当前训练样本与对应的标签标注实例之间的第二重合度;当第二重合度小于或等于预设重合阈值时,确定当前训练样本存在标签冲突。
在一个实施例中,样本训练集包括至少一张样本图像,样本图像包括多于一个的训练样本;挖掘模块904还包括伪标注模块9041,用于通过中间识别模型对样本图像进行预设次数的目标识别,得到预设次数的预测结果;预测结果包括预测框、预测框所框选的图像区域所属类别的概率值以及预测框的位置信息;对框选有同一类别图像区域的预测框进行聚类处理,得到至少一个聚类簇;根据预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定每个聚类簇各自对应的检测置信度;根据检测置信度对聚类簇进行伪标注处理,得到伪标注样本。
在一个实施例中,伪标注模块9041还用于在基于中间识别模型在进行预设次数的目标识别中的每次目标识别的过程中,均对中间识别模型进行随机失活处理,并通过随机失活处理后的中间识别模型进行相应的目标识别,得到对应的预测结果。
在一个实施例中,伪标注模块9041还用于对于至少一个聚类簇中的每个聚类簇,确定当前聚类簇所包括的预测框的预测框数量;基于预测框数量、预测框所框选的图像区域所属类别的概率值和预测框的位置信息,确定当前聚类簇所对应的分类置信度和平均位置信息;基于平均位置信息确定与当前聚类簇对应的定位置信度;基于分类置信度和定位置信度,确定当前聚类簇的检测置信度。
在一个实施例中,伪标注模块9041还用于确定当前聚类簇中的每两个预测框之间的第三重合度,并根据第三重合度确定当前聚类簇的紧凑程度;根据紧凑程度、当前聚类簇所包括的预测框的预测框数量、以及中间识别模型对样本图像进行目标识别的预设次数,确定与当前聚类簇对应的定位置信度。
在一个实施例中,伪标注模块9041还用于当聚类簇的检测置信度高于检测阈值时,判断聚类簇所框选的待处理图像区域是否已包含有标签;当待处理图像区域未包含有标签时,根据聚类簇所属类别对待处理图像区域进行伪标注处理,得到伪标注样本。
在一个实施例中,挖掘模块904还包括加权模块9042,用于对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;确定当前目标负样本与目标样本图像所对应的标签标注实例之间的第一重合度;根据第一重合度,确定当前目标负样本所对应的加权信息。
在一个实施例中,第二训练模块906还用于确定更新训练集中的待处理的当前更新样本;通过中间识别模型对当前更新样本进行目标识别,得到当前更新样本分别属于原始图像类别和新增图像类别的第二预测概率;当当前更新样本属于包括有加权信息的目标负样本时,基于加权信息和当前更新样本是否存在标签冲突,确定各第二预测概率各自对应的第二概率权重;当当前更新样本不为包括有加权信息的目标负样本时,根据当前更新样本是否存在标签冲突,确定每个第二预测概率各自对应的第二概率权重;根据第二预测概率和对应的第二概率权重构造第二损失,并通过第二损失对调整中间识别模型的模型参数;将当前更新样本修改为已完成更新样本,并将下一个待处理的更新样本作为下一次迭代训练中的当前更新样本,返回通过中间识别模型对当前更新样本进行目标识别的步骤继续执行,直至达到第二训练停止条件时停止训练,得到训练好的目标识别模型。
在一个实施例中,目标识别模型的训练装置900还用于获取待识别图像,并将待识别图像输入至训练好的目标识别模型;通过训练好的目标识别模型,对待识别图像中的对应于原始图像类别或新增图像类别的目标图像区域进行目标识别,得到目标图像区域所在位置信息,以及目标图像区域所对应的目标图像类别。
关于基于图像处理的目标识别模型的训练装置的具体限定可以参见上文中对于目标识别模型的训练方法的限定,在此不再赘述。上述目标识别模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标识别模型的训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标识别模型的训练方法。
本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (15)
1.一种基于图像处理的目标识别模型的训练方法,其特征在于,所述方法包括:
获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;
对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;
确定所述更新训练集中的各目标负样本所对应的加权信息;
对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
2.根据权利要求1所述的方法,其特征在于,所述对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型,包括:
获取用于进行原始图像类别识别的初始识别模型;
确定所述样本训练集中的待处理的当前训练样本的样本属性;
通过初始识别模型对所述当前训练样本进行目标识别,得到所述当前训练样本分别属于所述原始图像类别和所述新增图像类别的第一预测概率;
根据所述样本属性和所述当前训练样本是否存在标签冲突,确定每个所述第一预测概率各自对应的第一概率权重;
根据所述第一预测概率和对应的第一概率权重构造第一损失,并通过所述第一损失调整所述初始识别模型的模型参数;
将所述当前训练样本更新为已完成训练样本,并将下一个待处理的训练样本作为下一次迭代训练中的当前训练样本,返回至所述确定所述样本训练集中的待处理的当前训练样本的样本属性的步骤继续执行,直至达到第一训练停止条件时停止训练,得到中间识别模型。
3.根据权利要求2所述的方法,其特征在于,所述样本属性包括样本来源和样本正负性,所述样本来源包括来源于所述原始图像集,或者来源于所述新增图像集;所述根据所述样本属性和所述当前训练样本是否存在标签冲突,确定每个所述第一预测概率各自对应的第一概率权重,包括:
根据所述当前训练样本的样本正负性,确定所述当前训练样本是否存在标签冲突;
当确定所述当前训练样本存在标签冲突时,根据所述样本来源,确定所述样本来源中正样本的标签所对应的参考图像类别,所述参考图像类别为原始图像类别或者新增图像类别;
将所述当前训练样本属于所述参考图像类别的第一预测概率所对应的第一概率权重设置为第一目标值;
将所述当前训练样本属于其余图像类别的第一预测概率所对应的第一概率权重设置为第二目标值;所述其余图像类别为所述原始图像类别和所述新增图像类别中的一个类别,且与所述参考图像类别不同。
4.根据权利要求3所述的方法,其特征在于,所述根据所述当前训练样本的样本正负性,确定所述当前训练样本是否存在标签冲突,包括:
当所述当前训练样本属于负样本时,确定所述当前训练样本存在标签冲突;
当所述当前训练样本属于正样本时,确定所述当前训练样本与对应的标签标注实例之间的第二重合度;
当所述第二重合度小于或等于预设重合阈值时,确定所述当前训练样本存在标签冲突。
5.根据权利要求1所述的方法,其特征在于,所述样本训练集包括至少一张样本图像,所述样本图像包括多于一个的训练样本;所述通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集,包括:
通过所述中间识别模型对所述样本图像进行预设次数的目标识别,得到预设次数的预测结果;所述预测结果包括预测框、所述预测框所框选的图像区域所属类别的概率值以及所述预测框的位置信息;
对框选有同一类别图像区域的预测框进行聚类处理,得到至少一个聚类簇;
根据所述预测框所框选的图像区域所属类别的概率值和所述预测框的位置信息,确定每个聚类簇各自对应的检测置信度;
根据所述检测置信度对所述聚类簇进行伪标注处理,得到伪标注样本。
6.根据权利要求5所述的方法,其特征在于,通过所述中间识别模型在进行预设次数的目标识别中的每次目标识别的过程中,均对所述中间识别模型进行随机失活处理,并通过随机失活处理后的中间识别模型进行相应的目标识别,得到对应的预测结果。
7.根据权利要求5所述的方法,其特征在于,所述根据所述预测框所框选的图像区域所属类别的概率值和所述预测框的位置信息,确定每个聚类簇各自对应的检测置信度,包括:
对于所述至少一个聚类簇中的每个聚类簇,确定当前聚类簇所包括的预测框的预测框数量;
基于所述预测框数量、所述预测框所框选的图像区域所属类别的概率值和所述预测框的位置信息,确定所述当前聚类簇所对应的分类置信度和平均位置信息;
基于所述平均位置信息确定与所述当前聚类簇对应的定位置信度;
基于所述分类置信度和所述定位置信度,确定所述当前聚类簇的检测置信度。
8.根据权利要求7所述的方法,其特征在于,所述基于所述平均位置信息确定与所述当前聚类簇对应的定位置信度,包括:
确定所述当前聚类簇中的每两个预测框之间的第三重合度,并根据所述第三重合度确定所述当前聚类簇的紧凑程度;
根据所述紧凑程度、所述当前聚类簇所包括的预测框的预测框数量、以及所述中间识别模型对所述样本图像进行目标识别的预设次数,确定与所述当前聚类簇对应的定位置信度。
9.根据权利要求5所述的方法,其特征在于,所述根据所述检测置信度对所述聚类簇进行伪标注处理,得到伪标注样本,包括:
当所述聚类簇的检测置信度高于检测阈值时,判断所述聚类簇所框选的待处理图像区域是否已包含有标签;
当所述待处理图像区域未包含有标签时,根据所述聚类簇所属类别对所述待处理图像区域进行伪标注处理,得到伪标注样本。
10.根据权利要求1所述的方法,其特征在于,所述确定所述更新训练集中的各目标负样本所对应的加权信息,包括:
对于每个目标负样本,确定包括有当前目标负样本的目标样本图像;
确定所述当前目标负样本与所述目标样本图像所对应的标签标注实例之间的第一重合度;
根据所述第一重合度,确定所述当前目标负样本所对应的加权信息。
11.根据权利要求1所述的方法,其特征在于,所述对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型,包括:
确定所述更新训练集中的待处理的当前更新样本;
通过所述中间识别模型对所述当前更新样本进行目标识别,得到所述当前更新样本分别属于所述原始图像类别和所述新增图像类别的第二预测概率;
当所述当前更新样本属于包括有加权信息的目标负样本时,基于所述加权信息和所述当前更新样本是否存在标签冲突,确定各所述第二预测概率各自对应的第二概率权重;
当所述当前更新样本不为包括有加权信息的目标负样本时,根据所述当前更新样本是否存在标签冲突,确定每个所述第二预测概率各自对应的第二概率权重;
根据所述第二预测概率和对应的第二概率权重构造第二损失,并通过所述第二损失对调整所述中间识别模型的模型参数;
将所述当前更新样本修改为已完成更新样本,并将下一个待处理的更新样本作为下一次迭代训练中的当前更新样本,返回所述通过中间识别模型对所述当前更新样本进行目标识别的步骤继续执行,直至达到第二训练停止条件时停止训练,得到训练好的目标识别模型。
12.根据权利要求1至11任意一项所述的方法,其特征在于,所述方法还包括:
获取待识别图像,并将所述待识别图像输入至训练好的目标识别模型;
通过所述训练好的目标识别模型,对所述待识别图像中的对应于原始图像类别或新增图像类别的目标图像区域进行目标识别,得到所述目标图像区域所在位置信息,以及所述目标图像区域所对应的目标图像类别。
13.一种基于图像处理的目标识别模型的训练装置,其特征在于,所述装置包括:
第一训练模块,用于获取由原始图像集和新增图像集构成的样本训练集;所述原始图像集中正样本的标签为原始图像类别,所述新增图像集中正样本的标签为新增图像类别;对于所述样本训练集中的每个训练样本,基于相应训练样本是否存在标签冲突确定第一损失,并通过所述第一损失对用于进行原始图像类别识别的初始识别模型进行第一训练,得到中间识别模型;
挖掘模块,用于通过所述中间识别模型对所述样本训练集进行目标识别,得到预测结果,并基于所述预测结果对所述样本训练集进行伪标注处理,得到包括有伪标注样本的更新训练集;确定所述更新训练集中的各目标负样本所对应的加权信息;
第二训练模块,用于对于所述更新训练集中的每个更新样本,基于相应的更新样本是否存在标签冲突确定第二损失,并通过所述第二损失对所述中间识别模型进行第二训练,得到目标识别模型;其中,所述更新样本包括所述更新训练集中的正样本、包括有加权信息的目标负样本、及伪标注样本,所述目标识别模型用于进行原始图像类别和新增图像类别的识别。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110205188.3A CN113569615A (zh) | 2021-02-24 | 2021-02-24 | 基于图像处理的目标识别模型的训练方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110205188.3A CN113569615A (zh) | 2021-02-24 | 2021-02-24 | 基于图像处理的目标识别模型的训练方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113569615A true CN113569615A (zh) | 2021-10-29 |
Family
ID=78161219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110205188.3A Pending CN113569615A (zh) | 2021-02-24 | 2021-02-24 | 基于图像处理的目标识别模型的训练方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113569615A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113792823A (zh) * | 2021-11-17 | 2021-12-14 | 山东力聚机器人科技股份有限公司 | 图像的新类别识别方法及装置 |
CN113936302A (zh) * | 2021-11-03 | 2022-01-14 | 厦门市美亚柏科信息股份有限公司 | 行人重识别模型的训练方法、装置、计算设备及存储介质 |
CN114333022A (zh) * | 2021-12-30 | 2022-04-12 | 北京爱奇艺科技有限公司 | 角色特征提取模型的训练方法、角色识别方法及相关设备 |
CN114462526A (zh) * | 2022-01-28 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 一种分类模型训练方法、装置、计算机设备及存储介质 |
CN114612744A (zh) * | 2022-03-10 | 2022-06-10 | 平安科技(深圳)有限公司 | 一种检测模型训练方法、车辆损伤检测方法及终端设备 |
CN114612717A (zh) * | 2022-03-09 | 2022-06-10 | 四川大学华西医院 | Ai模型训练标签生成方法、训练方法、使用方法及设备 |
CN114724226A (zh) * | 2022-04-25 | 2022-07-08 | 中国平安人寿保险股份有限公司 | 表情识别模型训练方法、电子设备、存储介质 |
CN115265881A (zh) * | 2022-09-28 | 2022-11-01 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN115661615A (zh) * | 2022-12-13 | 2023-01-31 | 浙江莲荷科技有限公司 | 一种图像识别模型的训练方法、装置及电子设备 |
CN116756625A (zh) * | 2022-03-04 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 信号识别模型训练方法、信号识别方法及装置 |
CN117058489A (zh) * | 2023-10-09 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
CN118298251A (zh) * | 2024-06-04 | 2024-07-05 | 杭州宇泛智能科技股份有限公司 | 基于多数据源目标检测模型的图像识别方法及装置 |
-
2021
- 2021-02-24 CN CN202110205188.3A patent/CN113569615A/zh active Pending
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113936302A (zh) * | 2021-11-03 | 2022-01-14 | 厦门市美亚柏科信息股份有限公司 | 行人重识别模型的训练方法、装置、计算设备及存储介质 |
CN113792823B (zh) * | 2021-11-17 | 2022-03-25 | 山东力聚机器人科技股份有限公司 | 图像的新类别识别方法及装置 |
CN113792823A (zh) * | 2021-11-17 | 2021-12-14 | 山东力聚机器人科技股份有限公司 | 图像的新类别识别方法及装置 |
CN114333022A (zh) * | 2021-12-30 | 2022-04-12 | 北京爱奇艺科技有限公司 | 角色特征提取模型的训练方法、角色识别方法及相关设备 |
CN114333022B (zh) * | 2021-12-30 | 2024-05-31 | 北京爱奇艺科技有限公司 | 角色特征提取模型的训练方法、角色识别方法及相关设备 |
CN114462526A (zh) * | 2022-01-28 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 一种分类模型训练方法、装置、计算机设备及存储介质 |
CN116756625A (zh) * | 2022-03-04 | 2023-09-15 | 腾讯科技(深圳)有限公司 | 信号识别模型训练方法、信号识别方法及装置 |
CN114612717A (zh) * | 2022-03-09 | 2022-06-10 | 四川大学华西医院 | Ai模型训练标签生成方法、训练方法、使用方法及设备 |
CN114612744A (zh) * | 2022-03-10 | 2022-06-10 | 平安科技(深圳)有限公司 | 一种检测模型训练方法、车辆损伤检测方法及终端设备 |
CN114724226A (zh) * | 2022-04-25 | 2022-07-08 | 中国平安人寿保险股份有限公司 | 表情识别模型训练方法、电子设备、存储介质 |
CN114724226B (zh) * | 2022-04-25 | 2024-05-21 | 中国平安人寿保险股份有限公司 | 表情识别模型训练方法、电子设备、存储介质 |
CN115265881A (zh) * | 2022-09-28 | 2022-11-01 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN115265881B (zh) * | 2022-09-28 | 2022-12-20 | 宁波普瑞均胜汽车电子有限公司 | 压力检测方法和装置 |
CN115661615A (zh) * | 2022-12-13 | 2023-01-31 | 浙江莲荷科技有限公司 | 一种图像识别模型的训练方法、装置及电子设备 |
CN117058489A (zh) * | 2023-10-09 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
CN117058489B (zh) * | 2023-10-09 | 2023-12-29 | 腾讯科技(深圳)有限公司 | 多标签识别模型的训练方法、装置、设备及存储介质 |
CN118298251A (zh) * | 2024-06-04 | 2024-07-05 | 杭州宇泛智能科技股份有限公司 | 基于多数据源目标检测模型的图像识别方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113569615A (zh) | 基于图像处理的目标识别模型的训练方法和装置 | |
CN112036322B (zh) | 多任务网络跨域行人重识别模型构建方法、系统及装置 | |
CN111754596B (zh) | 编辑模型生成、人脸图像编辑方法、装置、设备及介质 | |
CN111401216B (zh) | 图像处理、模型训练方法、装置、计算机设备和存储介质 | |
CN112766244A (zh) | 目标对象检测方法、装置、计算机设备和存储介质 | |
CN111476806B (zh) | 图像处理方法、装置、计算机设备和存储介质 | |
CN111274994B (zh) | 漫画人脸检测方法、装置、电子设备及计算机可读介质 | |
CN111368672A (zh) | 一种用于遗传病面部识别模型的构建方法及装置 | |
CN112765370B (zh) | 知识图谱的实体对齐方法、装置、计算机设备和存储介质 | |
WO2021243947A1 (zh) | 对象再识别方法及装置、终端和存储介质 | |
CN115223020B (zh) | 图像处理方法、装置、设备、存储介质及计算机程序产品 | |
CN112633424B (zh) | 图像处理方法、装置、图像处理设备及存储介质 | |
CN113569627B (zh) | 人体姿态预测模型训练方法、人体姿态预测方法及装置 | |
CN111652181A (zh) | 目标跟踪方法、装置及电子设备 | |
CN113705596A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN117152459B (zh) | 图像检测方法、装置、计算机可读介质及电子设备 | |
CN114332893A (zh) | 表格结构识别方法、装置、计算机设备和存储介质 | |
CN113641797A (zh) | 数据处理方法、装置、设备、存储介质及计算机程序产品 | |
CN116089645A (zh) | 一种基于层次化风格的条件文本-电商图片检索方法和系统 | |
CN114764870A (zh) | 对象定位模型处理、对象定位方法、装置及计算机设备 | |
CN114677611B (zh) | 数据识别方法、存储介质及设备 | |
CN111914809B (zh) | 目标对象定位方法、图像处理方法、装置和计算机设备 | |
CN112101154B (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
CN113379594A (zh) | 脸型变换模型训练、脸型变换方法及相关装置 | |
CN113705293A (zh) | 图像场景的识别方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40055186 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |