CN114077681B - 一种图像数据处理方法、装置、计算机设备及存储介质 - Google Patents

一种图像数据处理方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114077681B
CN114077681B CN202210060766.3A CN202210060766A CN114077681B CN 114077681 B CN114077681 B CN 114077681B CN 202210060766 A CN202210060766 A CN 202210060766A CN 114077681 B CN114077681 B CN 114077681B
Authority
CN
China
Prior art keywords
sample
image
mirror
target
samples
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210060766.3A
Other languages
English (en)
Other versions
CN114077681A (zh
Inventor
郭卉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202210060766.3A priority Critical patent/CN114077681B/zh
Publication of CN114077681A publication Critical patent/CN114077681A/zh
Application granted granted Critical
Publication of CN114077681B publication Critical patent/CN114077681B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本申请实施例公开了一种图像数据处理方法、装置、计算机设备及存储介质,包括:将批次样本中的样本三元组作为待处理样本三元组;通过初始特征学习模型提取待处理样本三元组的三元组特征,由噪声判决模型根据初始特征学习模型的迭代次数和离群阈值参数,得到待处理样本三元组的噪声判决结果;对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,得到批次样本的联合损失;根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于进行特征度量学习的目标特征学习模型。采用本申请实施例,可以提升模型训练的准确度。

Description

一种图像数据处理方法、装置、计算机设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像数据处理方法、装置、计算机设备及存储介质。
背景技术
目前,在通过初始特征学习模型训练得到用于进行图像识别的目标特征学习模型之前,需要预先训练一个用于进行噪声判决的噪声分类模型,并通过该噪声分类模型对参与训练的全量样本进行二分类处理,以根据二分类处理的结果对参与训练的全量样本进行噪声去除,以确保可以使用去除噪声后的全量样本来对初始特征学习模型进行迭代训练。
显然,在使用预先训练好的噪声分类模型对全量样本进行二分类处理之前,需要在参与训练的全量样本中人工标注出噪声样本,这意味着在训练得到该噪声分类模型的过程中,不仅需要预先学习到与这些噪声样本相关的噪声特征,还需要额外学习到与这些噪声样本无关的其他特征。这意味着对于该噪声分类模型而言,一旦由该噪声分类模型所单次输出的二分类处理结果存在学习错误时,将导致用于对该初始特征学习模型进行迭代训练时的样本存在噪声干扰,从而会降低对该初始特征学习模型进行迭代训练时的训练准确度。
发明内容
本申请实施例提供一种图像数据处理方法、装置、计算机设备及存储介质,可以提升模型训练的准确度。
本申请实施例一方面提供一种图像数据处理方法,包括:
在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
本申请实施例一方面提供一种图像数据处理装置,包括:
样本三元组获取模块,用于在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
噪声判决模块,用于通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
联合损失获取模块,用于对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
目标模型确定模块,用于根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
其中,装置还包括:
子空间构建模块,用于在获取到全量分镜样本时,构建与全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;
样本三元组构建模块,用于基于全量分镜样本中的每个分镜样本组和与每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;
批次划分模块,用于根据负样本挖掘子空间中的总负样本数量,对全量样本三元组中的样本三元组进行批次划分,得到与全量分镜样本相关联的批次样本。
其中,子空间构建模块包括:
分镜处理单元,用于获取用于分镜处理的样本视频,对样本视频进行分镜处理,得到与样本视频相关联的N’个分镜样本组,将N’个分镜样本组作为全量分镜样本;
分镜处理单元,还用于基于N’个分镜样本组的标签信息,对N’个分镜样本组进行聚类处理,得到与全量分镜样本相关联的X个聚类簇;N’为正整数;X为正整数,且一个聚类簇对应一个标签信息;
目标簇确定单元,用于从全量分镜样本中获取分镜样本组i,在X个聚类簇中,将从与分镜样本组i相关联的聚类簇中抽取的K个聚类簇分别作为目标聚类簇;其中,i为小于或者等于N’的正整数;目标聚类簇的数量为K个;
分镜图像抽取单元,用于从K个目标聚类簇所对应的局部子空间中,抽取K*M个分镜图像作为第一分镜图像,基于抽取到的K*M个第一分镜图像,构建与分镜样本组i相关联的第一类负样本空间,并从X个聚类簇所对应的全局子空间中,抽取K*M个分镜图像作为第二分镜图像,基于抽取到的K*M个第二分镜图像构建与分镜样本组i相关联的第二类负样本空间;第一类负样本空间中的第一分镜图像与分镜样本组i中的分镜图像具有相同的标签信息;第二类负样本空间中的分镜图像与分镜样本组i中的分镜图像具有不同的标签信息;
子空间确定单元,用于将第一类负样本空间和第二类负样本空间作为分镜样本组i的负样本挖掘子空间。
其中,分镜处理单元包括:
标签信息预测子单元,用于将全量分镜样本所包含的N’个分镜样本组输入标签预测模型,由标签预测模型预测输出N’个分镜样本组中的每个分镜样本组的标签信息;每个分镜样本组的标签信息是在对应分镜样本组中的分镜图像的标签信息的累计标签量达到累计阈值时所确定的;累计阈值是由对应分镜样本组中的分镜图像的分镜数量所决定的;
聚类簇划分子单元,用于在N’个分镜样本组中,按照每个分镜样本组的标签信息,将具有同一标签信息的分镜样本组划分到同一聚类簇,以得到与全量分镜样本相关联的X个聚类簇。
其中,全量分镜样本包括N’个分镜样本组,一个分镜样本组包含U个分镜图像;N’和U均为正整数;与每个分镜样本组相关联的负样本挖掘子空间均包括第一类负样本空间和第二类负样本空间;
样本三元组获取模块包括:
目标样本获取单元,用于在全量分镜样本中的每个分镜样本组中获取目标分镜样本组;
正样本对确定单元,用于在目标分镜样本组的U个分镜图像中选择一个分镜图像作为目标分镜样本组的锚点样本,并在目标分镜样本组的U个分镜图像中将除锚点样本之外的分镜图像作为目标分镜样本组的正样本,基于目标分镜样本组的锚点样本和目标分镜样本组的正样本,确定目标分镜样本组的正样本对;目标分镜样本组的正样本对的数量为U*(U-1)*1/2个;
负样本抽取单元,用于在与目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为目标分镜样本组的负样本;目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;Nn个难负样本是从与目标分镜样本组相关联的第一类负样本空间中所抽取到的;Nn个易负样本是从与目标分镜样本组相关联的第二类负样本空间中所抽取到的;
三元组构建单元,用于根据目标分镜样本组的正样本对和目标分镜样本组的负样本,构建得到目标分镜样本组的样本三元组,直到全量分镜样本中的每个分镜样本组均被作为目标分镜样本组时,得到每个分镜样本组的样本三元组;每个分镜样本组的样本三元组的数量均为U*(U-1)* Nn个;
样本三元组确定单元,用于将每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组。
其中,与目标分镜样本组相关联的第一类负样本空间包括K*M个第一分镜图像;与目标分镜样本组相关联的第二类负样本空间包括K*M个第二分镜图像;K和M均为正整数;
样本三元组获取模块还包括:
正样本遍历单元,用于在目标分镜样本组的U个分镜图像中遍历选择一个分镜图像作为目标分镜样本组的正样本,并在目标分镜样本组的U个分镜图像中将除遍历到的正样本之外的分镜图像作为目标分镜样本组的锚点样本;
辅助图像确定单元,用于在K*M个第一分镜图像中查找与目标分镜样本组的锚点样本相同的第一分镜图像,将查找到的与目标分镜样本组的锚点样本相同的第一分镜图像作为辅助挖掘图像;
待挖掘图像确定单元,用于在K*M个第一分镜图像中将除辅助挖掘图像之外的第一分镜图像作为待挖掘图像;待挖掘图像的图像数量为(K*M-1)个;
难负样本确定单元,用于确定辅助挖掘图像与(K*M-1)个待挖掘图像之间的第一汉明距离,将确定的最小第一汉明距离所对应的待挖掘图像作为辅助挖掘图像的局部难负样本,并确定辅助挖掘图像与K*M个第二分镜图像之间的第二汉明距离,将确定的最小第二汉明距离所对应的第二分镜图像作为辅助挖掘图像的全局难负样本;
难负样本更新单元,还用于基于辅助挖掘图像的局部难负样本和辅助挖掘图像的全局难负样本,在目标分镜样本组的负样本中更新目标分镜样本组的难负样本。
其中,噪声判决模块包括:
三元组特征输出单元,用于将待处理样本三元组输入初始特征学习模型,由初始特征学习模型对待处理样本三元组进行特征提取和哈希量化处理,将初始特征学习模型所输出的待处理样本三元组的三元组特征作为第一迭代三元组特征;
阈值参数确定单元,用于在初始特征学习模型的迭代次数达到初始迭代阈值时,将第一迭代三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据与批次样本相关联的初始分类数据集,确定噪声判决模型所维护的第一离群阈值参数;
迭代次数递增单元,用于基于初始分类数据集确定批次样本的初始联合损失,基于初始联合损失调整初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对初始特征学习模型的迭代次数进行递增处理;
噪声判决单元,用于将过渡特征学习模型所输出的待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将第二迭代三元组特征输入噪声判决模型,由噪声判决模型根据噪声判决模型所维护的第一离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果。
其中,三元组特征输出单元包括:
基础特征提取子单元,用于将待处理样本三元组输入初始特征学习模型的基础特征网络层,由基础特征网络层提取待处理样本三元组的基础特征;
哈希量化子单元,用于将提取到的基础特征输入初始特征学习模型的哈希量化层,由哈希量化层对基础特征进行哈希量化处理;
特征输出子单元,用于将哈希量化处理所得到的哈希量化特征作为初始特征学习模型所输出的第一迭代三元组特征。
其中,阈值参数确定单元包括:
初始分类集确定子单元,用于在初始特征学习模型的迭代次数达到初始迭代阈值时,将第一迭代三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型将与待处理样本三元组相关联的分类数据集作为与批次样本相关联的初始分类数据集;
阈值比例迭代子单元,用于在初始分类数据集中,迭代记录待处理样本三元组中的负样本的初始离群阈值比例;
阈值参数确定子单元,用于获取噪声判决模型在初始迭代阈值时的可靠性阈值,基于迭代记录的初始离群阈值比例和初始迭代阈值时的可靠性阈值,确定噪声判决模型在初始迭代阈值时的初始可靠性阈值,基于初始可靠性阈值,将噪声判决模型所维护的离群阈值参数作为第一离群阈值参数。
其中,阈值比例迭代子单元,具体用于在初始分类数据集中,确定参与迭代的待处理样本三元组的三元组总数量,从待处理样本三元组中获取第一目标样本三元组的锚点样本和第一目标样本三元组的负样本,将第一目标样本三元组的锚点样本所在的分镜样本组作为待处理分镜样本组;
阈值比例迭代子单元,还具体用于获取待处理分镜样本组中的U1个分镜图像,基于第一迭代三元组特征确定U1个分镜图像中的每个分镜图像的哈希特征向量,并将由每个分镜图像的哈希特征向量所确定的均值向量作为待处理分镜样本组的分镜样本中心;U1为正整数;
阈值比例迭代子单元,还具体用于在待处理分镜样本组中的U1个分镜图像中,将查找到的与第一目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第一候选分镜图像,将第一目标样本三元组中的负样本与第一候选分镜图像之间的汉明距离作为第一待处理距离,并将第一目标样本三元组中的负样本与待处理分镜样本组的分镜样本中心之间的汉明距离作为第二待处理距离;
阈值比例迭代子单元,还具体用于将第一待处理距离和第二待处理距离的比值作为第一目标样本三元组的负样本的待迭代离群阈值比例;
阈值比例迭代子单元,还具体用于基于三元组总数量和第一目标样本三元组的负样本的待迭代离群阈值比例,确定待处理样本三元组中的负样本的初始离群阈值比例。
其中,噪声判决单元包括:
待判决分镜确定子单元,用于将过渡特征学习模型所输出的待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将第二迭代三元组特征输入噪声判决模型,由噪声判决模型从待处理样本三元组中获取第二目标样本三元组的锚点样本和第二目标样本三元组的负样本,将第二目标样本三元组的锚点样本所在的分镜样本组作为待判决分镜样本组;
分镜中心确定子单元,用于获取待判决分镜样本组中的U2个分镜图像,基于第二迭代三元组特征确定U2个分镜图像中的每个分镜图像的哈希特征向量,并将由每个分镜图像的哈希特征向量所确定的均值向量作为待判决分镜样本组的分镜样本中心;U2为正整数;
组内偏差确定子单元,用于根据待判决分镜样本组中的U2个分镜图像分别与待判决分镜样本组的分镜样本中心之间的汉明距离,确定待判决分镜样本组对应的均值距离,将均值距离作为待判决分镜样本组的组内距离偏差;
距离确定子单元,用于在待判决分镜样本组中的U2个分镜图像中,将查找到的与第二目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第二候选分镜图像,将第二目标样本三元组中的负样本与第二候选分镜图像之间的汉明距离作为第三待处理距离,并将第二目标样本三元组中的负样本与待判决分镜样本组的分镜样本中心之间的汉明距离作为第四待处理距离;
偏差比例确定子单元,用于将第三待处理距离和第四待处理距离的比值作为第二目标样本三元组的负样本与待判决分镜样本组之间的偏差比例;
噪声判决子单元,用于基于偏差比例和组内距离偏差以及噪声判决模型所维护的第一离群阈值参数,对第二目标样本三元组进行噪声判决,得到第二目标样本三元组的噪声判决结果,直到待处理样本三元组中的每个样本三元组均作为第二目标样本三元组时,得到待处理样本三元组中的每个样本三元组的噪声判决结果。
其中,与批次样本相关联的初始分类数据集包括第一分类数据集、第二分类数据集和第三分类数据集;第一分类数据集的可靠性优于第二分类数据集的可靠性,且第二分类数据集的可靠性优于第三分类数据集的可靠性;
噪声判决模块还包括:
样本三元组添加单元,用于根据待处理样本三元组中的每个样本三元组的噪声判决结果,在待处理样本三元组中的每个样本三元组中,确定用于添加至第一分类数据集相关联的样本三元组、用于添加至第二分类数据集相关联的样本三元组和用于添加至第三分类数据集相关联的样本三元组;
阈值参数更新单元,用于在与批次样本相关联的初始分类数据集中去除与第三分类数据集相关联的样本三元组,并将去除与第三分类数据集相关联的样本三元组后的初始分类数据集作为目标分类数据集,基于目标分类数据集中的样本三元组更新噪声判决模型所维护的第一离群阈值参数。
其中,待处理样本三元组的噪声判决结果包括与第一分类数据集相关联的样本三元组的第一判决结果、与第二分类数据集相关联的样本三元组的第二判决结果和与第三分类数据集相关联的样本三元组的第三判决结果;第一分类数据集的可靠性优于第二分类数据集的可靠性,且第二分类数据集的可靠性优于第三分类数据集的可靠性;
联合损失获取模块包括:
编码特征确定单元,用于对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,对待处理样本三元组的二值量化特征进行特征编码处理,得到待处理样本三元组的二值编码特征;
迭代权重确定单元,用于根据初始特征学习模型的迭代次数,确定第一分类数据集对应的第一迭代权重、第二分类数据集对应的第二迭代权重和第三分类数据集对应的第三迭代权重;
度量损失确定单元,用于根据与第一分类数据集相关联的样本三元组的第一判决结果,确定与第一分类数据集相关联的样本三元组的第一度量损失,根据与第二分类数据集相关联的样本三元组的第二判决结果,确定与第二分类数据集相关联的样本三元组的第二度量损失,根据与第三分类数据集相关联的样本三元组的第三判决结果,确定与第三分类数据集相关联的样本三元组的第三度量损失;
度量损失确定单元,还用于根据第一度量损失和第一迭代权重的乘积、第二度量损失和第二迭代权重的乘积以及第三度量损失和第三迭代权重的乘积,确定批次样本在迭代次数时的三元组度量损失;
量化损失确定单元,用于基于待处理样本三元组的二值量化特征确定待处理样本三元组中的样本图像在目标量化维度上的量化值,基于待处理样本三元组的二值编码特征确定样本图像在目标量化维度上的编码值,基于样本图像在目标量化维度上的量化值和样本图像在目标量化维度上的编码值,确定样本图像在迭代次数时的量化损失;
联合损失确定单元,用于根据批次样本在迭代次数时的三元组度量损失和样本图像在迭代次数时的量化损失,得到批次样本的联合损失。
其中,装置还包括:
待查询图像获取模块,用于在获取到待查询图像时,通过目标特征学习模型对待查询图像进行特征度量学习,得到待查询图像的哈希特征,对待查询图像的哈希特征进行特征编码处理,将编码得到的待查询图像的二值编码特征作为待查询图像的待查询图像特征;
索引向量查询模块,用于在与目标特征学习模型相关联的索引库中查询与待查询图像特征相匹配的索引向量,将索引向量所对应的量化中心作为目标量化中心,将与目标量化中心相关联的关联图像作为待查询图像对应的候选索引图像;
索引图像确定模块,用于确定待查询图像的待查询图像特征和候选索引图像的哈希图像特征之间的汉明距离,对确定的汉明距离进行排序处理,从排序处理后的汉明距离中确定目标汉明距离,将目标汉明距离所对应的候选索引图像作为待查询图像对应的目标索引图像。
其中,索引库是基于图像库中的库存图像的哈希图像特征所确定的;
装置还包括:
库存图像学习模块,用于通过目标特征学习模型对库存图像进行特征度量学习,得到库存图像的哈希图像特征,对库存图像的哈希图像特征进行聚类处理,得到与库存图像相关联的Z个聚类簇;其中,Z为正整数;一个聚类簇对应一个聚类中心;
索引库构建模块,用于将Z个聚类簇中的每个聚类簇对应的聚类中心作为每个聚类簇的量化中心,基于每个聚类簇的量化中心构建用于进行图像索引的索引库;
索引关系建立模块,用于建立索引库中的量化中心与图像库中的库存图像之间的索引映射关系,基于索引映射关系将每个聚类簇中的库存图像作为与对应聚类簇的量化中心相关联的关联图像。
本申请实施例一方面提供了一种计算机设备,包括:处理器和存储器;
处理器与存储器相连,其中,存储器用于存储计算机程序,计算机程序被处理器执行时,使得该计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例提供的方法。
在本申请实施例中,计算机设备在获取到用于训练初始特征学习模型的批次样本时,可以将批次样本中的样本三元组作为待处理样本三元组;进一步的,计算机设备可以通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;进一步的,计算机设备可以对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;进一步的,计算机设备可以根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。应当理解,在本申请实施例中,计算机设备在用于训练初始特征模型的批次样本的情况下,可以获取批次样本中的样本三元组,进而可以通过该批量性得到的样本三元组对该初始特征学习模型对进行迭代训练,并可以在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以根据噪声判决结果和二值量化特征,对前述批次样本进行联合损失学习,进而可以通过学习得到联合损失反向更新模型参数,以便于可以通过更新模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。换言之,本申请实施例通过在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以在联合训练时有效提升模型训练的准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构的结构示意图;
图2是本申请实施例提供的一种训练初始特征学习模型的技术架构图;
图3是本申请实施例提供的一种图像数据处理方法的流程示意图;
图4是本申请实施例提供的一种通过分镜的方式获取得到分镜样本组的场景示意图;
图5是本申请实施例提供的一种通过多标签预测模型,预测得到对应分镜样本组的标签信息的场景示意图;
图6是本申请实施例提供的一种构建负样本挖掘子空间的场景示意图;
图7是本申请实施例提供的一种产生一个批次的场景示意图;
图8是本申请实施例提供的一种挖掘难负样本的场景示意图;
图9是本申请实施例提供的一种对三元组进行噪声识别的场景示意图;
图10是本申请实施例提供的另一种图像数据处理方法的流程示意图;
图11是本申请实施例提供的一种将目标特征学习模型应用在图像检索中的场景示意图;
图12是本申请实施例提供的一种用于进行相似识别的场景示意图;
图13是本申请实施例提供的一种用户终端的应用显示界面的场景示意图;
图14是本申请实施例提供的一种图像数据处理装置的结构示意图;
图15是本申请实施例提供的另一种图像数据处理装置的结构示意图;
图16是本申请实施例提供的一种计算机设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参见图1,图1是本申请实施例提供的一种网络架构的结构示意图。如图1所示,该网络架构可以包括服务器10和用户终端集群。该用户终端集群可以包括一个或者多个用户终端,这里将不对用户终端的数量进行限制。如图1所示,具体可以包括用户终端100a、用户终端100b、用户终端100c、…、用户终端100n。如图1所示,用户终端100a、用户终端100b、用户终端100c、…、用户终端100n可以分别与上述服务器10进行网络连接,以便于每个用户终端可以通过该网络连接与服务器10进行数据交互。其中,这里不限定该网络连接的具体连接方式,比如,可以通过有线通信方式进行直接或间接地连接,也可以通过无线通信方式进行直接或间接地连接。
其中,该用户终端集群中的每个用户终端均可以包括:智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能电视等具有图像数据处理功能的智能终端。应当理解,如图1所示的用户终端集群中的每个用户终端均可以安装有目标应用(即应用客户端),当该应用客户端运行于各用户终端中时,可以分别与上述图1所示的服务器10之间进行数据交互。其中,该应用客户端可以包括社交客户端、多媒体客户端(例如,视频客户端)、娱乐客户端(例如,游戏客户端)、教育客户端、直播客户端等应用客户端。其中,该应用客户端可以为独立的客户端,也可以为集成在某客户端(例如,社交客户端、教育客户端以及多媒体客户端等)中的小程序,在此不做限定。
如图1所示,本申请实施例中的服务器10可以为该应用客户端对应的服务器。该服务器10可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。
为便于理解,本申请实施例可以在图1所示的多个用户终端中选择一个用户终端作为目标用户终端。例如,本申请实施例可以将图1所示的用户终端100a作为目标用户终端,该目标用户终端中可以集成有目标应用(即应用客户端)。此时,该目标用户终端可以通过该应用客户端对应的业务数据平台与服务器10之间实现数据交互。其中,这里的目标应用可以运行有已经训练完成的目标特征学习模型,通过该目标特征学习模型可以准确学习得到当前所获取到的待查询图像的哈希特征,进而可以通过该待查询图像的哈希特征所对应的二值编码特征,快速在图像数据处理系统中判断是否存在与该待查询图像存在较高相似度的目标索引图像。比如,在图像数据处理系统为图像排重系统时,如果判断存在,则可以进一步确定当前所获取到的待查询图像属于需要进行排重处理的排重图像,此时,目标应用可以进一步生成针对该排重图像的排重提示信息。
应当理解,本申请实施例提出了一种基于目标特征学习模型的图像数据处理方法,该方法可以涉及人工智能领域中的机器学习方向。可以理解的是,所谓人工智能(Artificial Intelligence,简称AI)是利用数字计算机或者数字计算机控制的计算模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
其中,在图像数据处理系统中,为了提升模型训练效率和模型训练的准确度,本申请实施例在对海量图像样本进行三元组挖掘的情况下,可以充分挖掘得到大量的样本三元组,这样,在通过这些样本三元组对初始特征学习模型对进行迭代训练的过程中,可以联合噪声判决模型对这些样本三元组进行实时的可靠性判断,以实现对这些样本三元组自动检测和清洗。
由此可见,本申请实施例通过在模型迭代训练时,引入该噪声判决模型,可以根据自身挖掘所得到的样本三元组,在迭代训练前述初始特征学习模型的过程中,提出一种全新的数据迭代式清洗方法,以提升对初始特征学习模型进行迭代训练时的模型训练的准确度,这样,在该目标应用的实际业务场景(例如,图像去重场景、相似检测场景、图像搜索场景或者图像推荐场景)下,当使用训练好的初始特征学习模型(即前述目标特征学习模型)对当前所获取到的待查询图像进行图像索引时,可以在该图像去重场景对应的图像排重系统中有效地提升图像去重效果,或者在该相似检测场景对应的相似检测系统中有效地提升相似检测效果,或者在该图像搜索场景所对应的搜索系统中有效地提升图像搜索的准确度,或者在该图像推荐场景所对应的推荐场景下有效地提升图像推荐的准确度。
为便于理解,进一步的,请参见图2,图2是本申请实施例提供的一种训练初始特征学习模型的技术架构图。如图2所示,该技术架构图具体可以包含以下多个模块,这里的多个模块具体可以包括图2所示的分镜样本准备模块20a、多标签获取模块21a、三元组挖掘模块22a、模型训练模块23a、噪声判决模块24a和模型损失学习模块25a。
其中,分镜样本准备模块20a可以用于在数据准备阶段通过分镜的方式构建得到待训练的N’个分镜样本组,进而可以将构建得到的这N’个分镜样本组统称为全量分镜样本。
其中,可以理解的是,在构建得到的N’个分镜样本组中,每个分镜样本组均包括U个分镜图像,所以,对于任意一个分镜样本组(例如,分镜样本组i,其中,i为小于或者等于N’的正整数)而言,通过该分镜样本组i所包含的U个分镜图像中的任意两个分镜图像,可以用于构成一个正样本对,即此时,该分镜样本组i所对应的正样本对的数量可以为U*(U-1)*1/2。比如,当U=4时,该分镜样本组i所对应的正样本对的数量可以为U*(U-1)*1/2=1/2*4*3=6个。其中,可以理解的是,对于这6个正样本对而言,每个正样本对中的两个分镜图像可以互为样本三元组的锚点样本和正样本。
其中,多标签获取模块21a可以用于获取每个分镜样本组中的每个分镜图像的标签信息,进而可以根据获取到的每个分镜图像的标签信息,最终确定出对应分镜样本组的标签信息。
其中,应当理解,本申请实施例在获取得到每个分镜样本组的标签信息的情况下,可以进一步通过图2所示的三元组挖掘模块22a,对前述分镜样本准备模块20a所输出的N’个分镜样本组进行聚类处理,以将这N’个分镜样本组分别划分到相应标签信息所对应的聚类簇。比如,本申请实施例可以将具有同一标签信息的分镜样本组划分到同一聚类簇,这样,针对上述N’个分镜样本组而言,可以最终划分得到X个聚类簇。
应当理解,由于一个分镜样本组可以包含U(比如,U=4)个分镜图像,通过多标签获取模块21a可以预测得到每个分镜图像的一个或者多个标签信息,所以,本申请实施例可以在这4个分镜图像的标签信息中,将统计到的出现次数大于或者等于1/2U的标签信息作为对应分镜样本组的标签信息。其中,这里的1/2U为累计阈值,这里所统计到的出现次数用于表征对应分镜样本组中的分镜图像的标签信息的累计标签量。
此时,对于上述分镜样本组i而言,可以在这X个聚类簇中,将从上述分镜样本组i所在聚类簇中随机抽取的K(例如,K=2)个聚类簇分别作为目标聚类簇,进而可以从这K个目标聚类簇的每个目标聚类簇中,抽取M(例如,M=3)个分镜图像,从而可以根据抽取到的K*M个分镜图像构建用于挖掘难负样本的第一类负样本空间。
与此同时,本申请实施例还可以通过图2所示的三元组挖掘模块在这X个聚类簇所对应的全局子空间中,随机抽取K个聚类簇,并从这K个聚类簇的每个目标聚类簇中,抽取M(例如,M=3)个分镜图像,从而可以根据抽取到的K*M个分镜图像构建用于挖掘易负样本的第二类负样本空间。
应当理解,可以理解的是,本申请实施例从上述第一类负样本空间中挖掘到的难负样本的数量(即Nn1)可以等于从上述第二类负样本空间中挖掘到的易负样本的数量(即Nn2)。此时,这里的Nn1可以等于Nn2,比如,Nn1= Nn2=Nn=1(即Nn1: Nn2=1:1),这里的Nn为正整数。
可选的,本申请实施例从上述第一类负样本空间中挖掘到的难负样本的数量(即Nn1)也可以不等于从上述第二类负样本空间中挖掘到的易负样本的数量(即Nn2)。此时,这里的Nn1可以不等于Nn2,比如,Nn1=3Nn2=Nn(即Nn1: Nn2=3:1)。
基于此,为便于理解,本申请实施例将以从上述第一类负样本空间中挖掘的难负样本的数量(即Nn1)等于从上述第二类负样本空间中挖掘的易负样本的数量(即Nn2)为例,以阐述通过前述全量分镜样本中的每个分镜样本组(例如,分镜样本组i)和由图2所示的三元组挖掘模块22a所构建的分镜样本组i的负样本挖掘子空间,来构建得到分镜样本组i的U*(U-1)* Nn个样本三元组,这样,当构建得到前述全量分镜样本中的每个分镜样本组的U*(U-1)* Nn个样本三元组时,可以得到用于训练上述初始特征学习模型的全量样本三元组,进而可以对全量样本三元组中的样本三元组进行批次划分,以得到与上述全量分镜样本相关联的批次样本。其中,每个批次样本中的样本三元组的数量均是由对应分镜样本组的负样本挖掘子空间中的总负样本数量(例如,bs=2*K*M)所确定的。
其中,应当理解,一个标签信息所对应的聚类簇可以视为一个独立的标签子空间。所以,对于上述分镜样本组i而言,用于构建三元组的锚点样本和正样本应当具有同一标签信息(即分镜样本组i的标签信息),那么,为提升在后续模型训练模块23a中进行模型训练的可靠性,本申请实施例提出可以在与锚点样本和正样本具有相同标签信息的同一标签子空间中挖掘得到前述难负样本(此时,在同一三元组中,锚点样本和正样本来自于同一分镜样本组,但锚点样本和难负样本来自于同一聚类簇中的不同分镜样本组)。
其中,可以理解的是,当三元组挖掘模块22a得到一个或者多个批次样本时,可以将每个批次样本批量性地给到图2所示的模型训练模块23a,进而可以通过该模型训练模块23a中的初始特征学习模块进行特征度量学习,以学习得到该初始特征学习模块在当前迭代次数达到初始迭代阈值(例如,对于前述全量样本三元组而言,可以在迭代次数达到3次,即Epoch轮数达到第三轮)时的每个批次样本中的样本三元组的三元组特征。
其中,本申请实施例可以将每个批次样本中的样本三元组统称为待处理样本三元组,从而可以将待处理样本三元组的三元组特征给到图2的噪声判决模块24a,以通过该噪声判决模块24a根据每个批次样本所动态维护的离群阈值参数(例如,这里的离群阈值参数可以为图2所示的判决阈值参数T,该判决阈值参数T会随着前述每个批次样本进行迭代更新)进行噪声判决,进而可以将噪声判决结果给到图2所示的模型损失学习模块25a,以通过该模型损失学习模块25a累计学习到每个批次样本中的样本三元组的度量损失和每个批次样本中的样本三元组的样本图像的量化损失,得到这些批次样本的联合损失,从而可以基于这些批次样本的联合损失反向调整该模型训练模块23a中的初始特征学习模型的模型参数,以便于后续可以在模型训练的过程中,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
其中,本申请实施例通过多标签预测模型预测得到N’个分镜样本组中的每个分镜样本组的标签信息、基于预测得到的每个分镜样本组的标签信息进行可靠且高效的三元组挖掘、以及在模型训练过程中,借助判决阈值参数T对挖掘到的每个批次样本中的样本三元组进行噪声判决的具体实现方式,可以参见图3-图13所对应的实施例。
进一步地,请参见图3,图3是本申请实施例提供的一种图像数据处理方法的流程示意图。如图3所示,该方法可以由具备图像数据处理功能的计算机设备执行,该计算机设备可以为用户终端(例如,上述图1所示的用户终端集群中的任意一个用户终端,例如,上述用户终端100a),也可以为服务器(例如,上述图1所示的服务器10),在此不做限定。为便于理解,本申请实施例以该方法由具备图像数据处理功能的服务器执行为例进行说明,该方法至少可以包括以下步骤S101-步骤S104:
步骤S101,在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
应当理解,计算机设备(比如,服务器)在执行该步骤S101之前,还可以预先执行以下步骤:比如,服务器在获取到全量分镜样本时,可以构建与全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;进一步的,服务器可以基于全量分镜样本中的每个分镜样本组和与每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;进一步的,服务器可以根据负样本挖掘子空间中的总负样本数量,对全量样本三元组中的样本三元组进行批次划分,得到与全量分镜样本相关联的批次样本。
其中,可以理解的是,在本申请实施例中,计算机设备(比如,服务器)所获取到的用于训练初始特征学习模型的批次样本的批次数量可以为N1个,其中,N1为正整数。那么,对于这N1个批次样本而言,可以将这N1个批次样本中的样本图像统称为全量样本图像,从而可以通过初始特征学习模型和噪声判决模型对这N1个批次样本所对应的全量样本图像进行特征度量学习,以对这N1个批次样本进行C(例如,C=20)轮迭代训练。
应当理解,本申请实施例在获取到这N1个批次样本时,可以将这N1个批次样本中的所有样本三元组统称为全量样本三元组,进而可以将该全量样本三元组中的样本三元组一并作为待处理样本三元组,以便于后续可以进一步执行下述步骤S102。
其中,可以理解的是,在联合噪声判决模型训练该初始特征学习模型的过程中,该初始特征学习模型所采用的学习率为lr(比如,lr=0.0005),且每经过10轮迭代后lr将变为原来的0.1倍,即每10轮迭代后学习率将变为0.1lr。本申请实施例可以通过前述C轮迭代过程中所得到的学习率,来反映当前所训练的初始特征学习模型的模型收敛状态。
其中,可以理解的是,本申请实施例还可以将对这N1个批次样本(即N1个批次样本所对应的全量样本图像)所进行的每一次迭代称之为一轮迭代(即一个Epoch),这意味着在本申请实施例中,一个Epoch可以用于处理一次全量样本图像(即一个Epoch可以用于处理一次N1个批次样本),直到某次迭代时的平均迭代损失(即平均Epoch loss,前述全量样本图像在某个Epoch时的联合损失)不再下降,可视为完成对该初始特征学习模型的模型训练,进而可以通过参与训练的这N1个批次样本反映当前所训练好的模型已经具备较好的模型泛化能力。
其中,可以理解的是,这N1个批次样本是计算机设备(例如,服务器)根据构建的负样本挖掘子空间中的总负样本数量,对全量样本三元组中的样本三元组进行批次划分所得到的。应当理解,在本申请实施例中,每个负样本挖掘子空间中的总负样本数量均可以为上述bs(这里的bs=2*K*M)个,且每个批次样本中的样本三元组的数量也可以为bs(即2*K*M)个。
由于一个样本三元组需要包括三个样本图像(即一个锚点样本、一个正样本和一个负样本)。所以,对于每个批次样本而言,与每个批次样本中的样本三元组相关联的样本图像的数量可以为N2个,这里的N2可以为3*bs=3*2*K*M=6*K*M。基于此,对于这N1个批次样本而言,所构建得到的用于训练初始特征学习模型的所有样本三元组的数量(即N3,上述全量样本三元组的数量),这里的N3=N1*bs,且与全量样本三元组对应的全量样本图像的数量N4= N1*N2= N1*3*bs=3*N3。
应当理解,在本申请实施例中,计算机设备(例如,服务器)可以在上述数据准备阶段通过分镜的方式预先准备好待训练的N’个分镜样本组、并可以通过上述多标签预测模型(也可以称之为标签预测模型)预测得到每个分镜样本组的标签信息,从而可以进一步通过该N’个分镜样本组和每个分镜样本组的标签信息,构建得到与每个分镜样本组相关联的负样本挖掘子空间。
其中,可以理解的是,计算机设备(例如,服务器)在从视频数据库获取到与当前业务相关联的一个或者多个视频时,可以对获取到的这些视频进行分镜处理,以从分镜处理所得到的视频镜头中,抽取多个分镜图像组成分镜样本组。其中,可以理解的是,在同一视频镜头中所抽取的多个分镜图像应当具有近似相同的图像内容。其中,应当理解,视频数据库中所存储得到各个视频均是由视频发布者通过上述应用客户端所对应的业务数据平台所授权上传的,且服务器对该视频数据库中的这些视频的处理方式(例如,分镜处理、聚类处理等)均是合法的。
为便于理解,进一步的,请参见图4,图4是本申请实施例提供的一种通过分镜的方式获取得到分镜样本组的场景示意图。如图4所示,服务器在从视频数据库中获取到图4所示的样本视频4a(例如,一个长视频)时,可以通过上述分镜样本准备模块20a中的pyScenedetect(即一种用于进行分镜处理的视频场景检测库)对该样本视频4a进行分镜处理(即进行场景检测),以根据检测到的场景遍历将该样本视频4a进行场景划分,从而可以得到多个连续的视频镜头。其中,一个镜头可以对应一个场景,且每个镜头内可以包含多张具有相似图像内容的分镜图像。
应当理解,服务器在获取到多个连续的视频镜头(例如,镜头J1、镜头J2、…、镜头Jn等视频镜头)的情况下,可以从每个视频镜头中随机抽取U张分镜图像构成一个分镜样本组;其中,U为正整数。比如,可以从镜头J1中随机抽取4(即U=4)张分镜图像构成如图4所示的分镜样本组400a,该分镜样本组400a中的4张分镜图像可以为图4所示的图像41a、图像42a、图像43a和图像44a。以此类推,又比如,可以从镜头Jn中随机抽取4(即U=4)张分镜图像构成如图4所示的分镜样本组400b,该分镜样本组400b中的4张分镜图像可以为图4所示的图像41b、图像42b、图像43b和图像44b。
应当理解,对于从视频数据库中所获取到的其他样本视频而言,该服务器对其他样本视频进行分镜处理,以得到其他样本视频的分镜样本组的具体实现方式,可以参见对上述样本图像4a进行分镜处理,以得到分镜样本组400a和400b的具体过程的描述,这里将不再继续进行赘述。
基于此,当服务器按照上述分镜的方式获取得到每个样本视频的分镜样本组时,可以将得到的这些分镜样本组(例如,N’个分镜样本组)统称为待训练的全量分镜样本。
其中,可以理解的是,对于全量分镜样本中的任意一个分镜样本组而言,考虑到同一个分镜样本组中的各个分镜图像具有相同的标签信息。所以,本申请实施例可以将任意一个分镜样本组中的两两分镜图像构成一个分镜正样本组,这样,在基于视频的先验信息划分得到多个连续镜头的情况下,可以从这些连续镜头中抽取相应数量的分镜图像构成分镜样本组,进而可以借助于视频的同一分镜样本组具有相似图像内容这一先验信息,挖掘得到大量的正样本,从而可以有效地提升挖掘得到的正样本的丰富度。比如,对于上述图4所示的包含4个分镜图像的分镜样本组400a而言,可以得到6个分镜正样本组,并可以将每个分镜正样本组统称为该分镜样本组400a的正样本对,且该分镜样本组400a的正样本对中的任意两两分镜图像均可以互为三元组中的锚点样本和正样本。
比如,对于分镜样本组400a而言,可以将图像41a和图像42a构成一个分镜正样本组、将图像41a和图像43a构成一个分镜正样本组、将图像41a和图像44a构成一个分镜正样本组、将图像42a和图像43a构成一个分镜正样本组、将图像42a和图像44a构成一个分镜正样本组、将图像43a和图像44a构成一个分镜正样本组。
应当理解,服务器可以进一步通过上述多标签预测模型预测得到每个分镜样本组中的分镜图像的标签信息,进而可以根据每个分镜样本组中的分镜图像的标签信息,得到对应分镜样本组的标签信息。这里的多标签预测模型可以为上述图2所对应实施例中的多标签获取模块21a中的深度学习网络模型,比如,这里的多标签预测模型可以为通过开源图像数据集(例如,imagenet 1000)对Resnet101网络进行训练后得到的深度学习网络模型。可以理解的是,在将上述分镜样本准备模块20a所得到的分镜样本组输入上述多标签获取模块21a之后,可以通过上述多标签获取模块21a中的该多标签预测模型推理得到输入的各个分镜样本组中的分镜图像的标签信息,从而可以通过推理得到的各个分镜样本组中的分镜图像的标签信息,最终得到对应分镜样本组的标签信息。此时,服务器可以通过该多标签获取模块21a根据各个分镜样本组的标签信息,对各个分镜样本组中的分镜图像进行聚类处理,以将具有相同标签信息的分镜样本组中的分镜图像添加至同一聚类簇。
应当理解,在本申请实施例中,服务器可以通过前述多标签预测模型智能预测得到各个分镜样本组中的分镜图像的标签信息,这意味着本申请实施例在获取到大量用于训练初始特征学习模型的全量样本三元组时,无需人工标注该全量样本三元组中的各个样本三元组的标签信息,更无需人工标注各个样本三元组中的样本图像的标签信息,这样,可以从根源上解决人工标注方式所带来的耗时耗力等问题。
为便于理解,进一步的,请参见图5,图5是本申请实施例提供的一种通过多标签预测模型,预测得到对应分镜样本组的标签信息的场景示意图。如图5所示的全量分镜样本包括N’个分镜样本组,这N’个分镜样本组具体可以为图5所示的分镜样本组5a、分镜样本组5b、…、分镜样本组5n。如图5所示,服务器可以将这N’个分镜样本组输入图5所示的多标签预测模型,以通过该多标签预测模型获取每个分镜样本组中的分镜图像的标签信息。
其中,可以理解的是,对于这N’个分镜样本组中的任意一个分镜样本组(例如,图5所示的分镜样本组5a)而言,可以通过该图5所示的多标签预测模型预测得到该分镜样本组5a中的4个分镜图像的标签信息。基于此,为确保通过该多标签预测模型所输出的标签信息的可靠性和准确性,本申请实施例可以在预测得到的该分镜样本组5a中的4个分镜图像的标签信息中,累计各个标签信息的出现次数,进而可以将累计到的各个标签信息的出现次数统称为对应分镜图像的标签信息的累计标签量,从而可以将累计标签量达到累计阈值的标签信息作为该分镜样本组5a的标签信息,比如,该分镜样本组5a的标签信息可以为图5所示的标签信息51a。
其中,可以理解的是,为便于理解,这里以该分镜样本组5a中的4个分镜图像为上述图4所示的图像41a、图像42a、图像43a和图像44a为例,以阐述通过该多标签预测模型预测得到这4个分镜图像中的每个分镜图像的标签信息的具体过程。
比如,对于分镜样本组5a中的任意一个分镜图像(例如,上述图像41a)而言,可以得到该图像41a的一个或者多个标签信息,又比如,对于分镜样本组5a中的图像42a而言,可以得到该图像42a的一个或者多个标签信息,以此类推,对于分镜样本组5a中的图像43a和44a而言,可以得到该图像43a的一个或者多个标签信息,还可以得到图像44a的一个或者多个标签信息,此时,该多标签预测模型可以进一步通过前述累计标签量的方式,最终确定得到该分镜样本组5a的标签信息,即本申请实施例通过前述累计标签量的方式,可以从根源上解决因在训练多标签预测模型时所使用的前述开源图像数据集与当前分镜样本组中的分镜图像不同源而引发的以下问题:1)标签信息与分镜图像不一致的问题;2)分镜图像中的标签信息未被识别出来等问题,进而可以有效地提升该多标签预测模型对各分镜样本组中的标签信息进行标签预测的可靠性和准确性。换言之,对于任意一个分镜样本组而言,本申请实施例通过前述累计标签量的方式可以从根源上解决因某个样本图像的标签信息识别错误而导致后续聚类错误的现象。
应当理解,服务器可以进一步通过上述三元组挖掘模块22a挖掘得到大量具有较高可靠性的负样本、进而可以基于挖掘到的这些负样本和上述挖掘得到的正样本对,构建得到用于训练前述初始特征学习模型的全量样本三元组。
可选的,应当理解,本申请实施例还可以在有新增分镜样本组的情况下,将新增的分镜样本组和前述N’个分镜样本组一并作为新的全量分镜样本,以通过新的全量分镜样本更新得到新的用于训练初始特征学习模型的全量样本三元组。应当理解,服务器对新增的分镜样本组进行标签聚类的具体实现方式可以一并参见上述对N’个分镜样本组进行标签聚类的具体实现方式的描述,这里将不再继续进行赘述。
其中,可以理解的是,由于训练哈希特征需要由锚点样本(anchor,简称为a)、正样本(positive,简称为p)和负样本(negative,简称为n)组成的样本三元组(即a,p,n)进行损失函数学习。在这些组成的样本三元组中a和p用于构成正样本对,且在同一样本三元组中,a和p来源于同一分镜样本组,a和n用于构成负样本对,且在同一样本三元组中,a和n来源于不同分镜样本组。基于此,在通过这些组成的样本三元组进行特征度量学习时,学习任务是需要确保正样本对中的样本图像之间的哈希特征足够接近(即正样本对中的样本图像的哈希特征所对应的汉明距离足够小),以便于后续通过训练好的目标特征学习模型进行特定度量学习时,可以确保具有相同语义的正样本对中的样本图像能够被相互检索到,且还需要确保负样本对中的样本图像之间的哈希特征足够远离。
其中,可以理解的是,该服务器在挖掘得到大量负样本的过程中,需要预先构建得到与各个分镜样本组相关联的负样本挖掘子空间。为便于理解,进一步的,请参见图6,图6是本申请实施例提供的一种构建负样本挖掘子空间的场景示意图。为便于理解,这里以图6所示的N’个分镜样本组为上述图5所示的全量分镜样本为例。这N’个分镜样本组中的每个分镜样本组均包括U个分镜图像,这里以U=4为例,当然,可选的,这里的U还可以为其他值,例如,U=10,这里将不对用于构成分镜样本组的样本图像的数量(即U)进行限定。
如图6所示,这N’个分镜样本组具体可以包含分镜样本组6a、分镜样本组6b、分镜样本组6c、…、分镜样本组6n。所以,对于任意一个分镜样本组(例如,分镜样本组i,i为小于或者等于N’的正整数)而言,该分镜样本组i中的U(例如,U=4)个分镜图像均可以提供锚点样本和正样本。
具体的,服务器可以在上述全量分镜样本(即图6所示的N’个分镜样本组)中的每个分镜样本组中获取目标分镜样本组(即该目标分镜样本组可以为分镜样本组i);进一步的,服务器可以在目标分镜样本组的U个分镜图像中选择一个分镜图像作为目标分镜样本组的锚点样本,并在目标分镜样本组的U个分镜图像中将除锚点样本之外的分镜图像作为目标分镜样本组的正样本,从而可以基于目标分镜样本组的锚点样本和目标分镜样本组的正样本,确定目标分镜样本组的正样本对;应当理解,该目标分镜样本组的正样本对的数量为U*(U-1)*1/2个。
其中,为便于理解,这里以分镜样本组i(即目标分镜样本组)为图6所示的分镜样本组6a为例,此时,服务器可以从该分镜样本组6a所包含的4个分镜图像中随机抽取一个分镜图像作为锚点样本,并可以在这4个分镜图像中,进一步将余下3个分镜图像分别作为正样本,从而可以通过抽取得到的该分镜样本组6a的锚点样本和该分镜样本组6a的正样本,构建得到该分镜样本组6a的6(即U*(U-1)*1/2=4*3*1/2=6)个正样本对。
以此类推,对于图6所示的N’个分镜样本组中的每个分镜样本组而言,均可以构建得到对应分镜样本组的6个正样本对。其中,对于N’个分镜样本组中的其他分镜样本组而言,构建得到其他分镜样本组的6个正样本对的具体实现方式,可以一并参见前述对构建得到分镜样本组6a的6个正样本对的具体过程的描述,这里将不再继续进行赘述。
如图6所示的X个聚类簇可以为对这N’个分镜样本组进行标签聚类后所得到的聚类簇。这X个聚类簇具体可以包含聚类簇62a、聚类簇62b、聚类簇62c、…、聚类簇62d、聚类簇62e和聚类簇62f。应当理解,这X个聚类簇中,一个聚类簇可以对应分别对应一个标签信息。所以,当通过上述标签累积量的方式确定某个分镜样本组(分镜样本组6c)的标签信息的标签数量为多个(例如,3个)时,可以将该分镜样本组6c中的分镜图像归类到多个(例如,3个)聚类簇。比如,可以将该分镜样本组6c中的分镜图像分别添加至图6所示的聚类簇62b、聚类簇62c和聚类簇62f。
如图6所示,该服务器可以通过三元组挖掘模块22a按照先验的标签子空间从图6所示的X个聚类簇中随机抽取K个聚类簇,并从每个聚类簇中抽取M个分镜构成图6所示的难负样本挖掘子空间63a。其中,这里的K和M均为正整数,这里将不对K和M的值进行限定。
为便于理解,这里以K=2,M=4为例,此时,这K(即K=2)个聚类簇具体可以为图6所示的聚类簇62b和聚类簇62f。然后,服务器可以从聚类簇62b中随机抽取4个分镜图像,并从聚类簇62f中随机抽取4个分镜图像,以通过抽取到的这8个分镜图像来构建得到图6所示的难负样本挖掘子空间63a。
为便于理解,本申请实施例可以在图6所示的负样本挖掘子空间中将难负样本挖掘子空间63a统称为第一类负样本空间,并可以在图6所示的负样本挖掘子空间中将易负样本挖掘子空间63b统称为第二类负样本空间。
其中,在构建易负样本挖掘子空间63b的过程中,具体可以采用以下两种方式。其中,一种方式为服务器可以从全局剩余未抽取到的分镜图像(即在上述X个聚类簇中将除前述抽取到的8个分镜图像之外所剩余的分镜图像)中随机抽取K*M个分镜图像,以构建得到图6所示的易负样本挖掘子空间63b。另一种方式为服务器可以直接从图6所示的包含N’个分镜样本组的全局分镜样本中直接随机抽取K*M个分镜图像,以构建得到图6所示的易负样本挖掘子空间63b。
其中,应当理解,本申请实施例在构建得到图6所示的负样本挖掘子空间的情况下,可以将图6所示的分镜样本组6c中的第一个分镜图像作为该分镜样本组6c的锚点样本64a,从而可以在图6所示的难负样本挖掘子空间63a中将与该锚点样本属于同一聚类簇(比如,这里的同组为图6所示的聚类簇62b)、但属于不同分镜样本组的分镜图像作为该锚点样本64a的负样本64b。比如,当在聚类簇62b中确定好将第三张包含小女孩的分镜图像作为锚点样本64a的情况下,考虑到该锚点样本64a来源于图6所示的分镜样本组6c,所以,为确保该锚点样本64a与后续在该难负样本挖掘子空间63a中所挖掘到的负样本之间的距离足够远,本申请实施例可以在同一聚类簇(即聚类簇62b)中,将来源于另一分镜样本组(即图6所示的分镜样本组6b)的包含小男孩的分镜图像作为该锚点样本64a的难负样本,比如,这里可以在聚类簇62b中进一步抽取第二张包含小男孩的分镜图像作为挖掘到的锚点样本64a的难负样本64b。可选的,本申请实施例也可以在图6所示的难负样本挖掘子空间63a中,将与该锚点样本64a属于不同聚类簇(比如,这里的同组为图6所示的聚类簇62f)的分镜图像作为该锚点样本64a的负样本64c。其中,图6所示的负样本64b和负样本64c都可以为服务器在难负样本挖掘子空间63a针对该锚点样本64a所挖掘到的难负样本。
其中,应当理解,本申请实施例在构建得到图6所示的负样本挖掘子空间的情况下,还可以将图6所示的分镜样本组6b中的第一个分镜图像作为该分镜样本组6b的锚点样本65a,从而可以在图6所示的难负样本挖掘子空间63a中将与该锚点样本65b属于同一聚类簇(比如,聚类簇62b)、但属于不同分镜样本组的分镜图像作为该锚点样本65a的难负样本65b。比如,当在聚类簇62b中确定好将第一张包含小男孩的分镜图像作为锚点样本65a的情况下,考虑到该锚点样本65a来源于图6所示的分镜样本组6b,所以,为确保该锚点样本65a与后续在该难负样本挖掘子空间63a中所挖掘到的负样本之间的距离足够远,本申请实施例可以在同一聚类簇(即聚类簇62b)中,将来源于另一分镜样本组(即图6所示的分镜样本组6c)的包含小女孩的分镜图像作为该锚点样本65a的难负样本,比如,这里可以在聚类簇62b中进一步抽取第三张包含小女孩的分镜图像作为挖掘到的锚点样本65a的难负样本65b。可选的,本申请实施例也可以在图6所示的易负样本挖掘子空间63b中将与该锚点样本65a属于不同聚类簇(比如,聚类簇62c)的分镜图像作为该锚点样本65a的易负样本65c。其中,图6所示的难负样本65b和易负样本65c都可以为服务器在负样本挖掘子空间中针对该锚点样本65a所挖掘到的负样本。
其中,需要注意的是,本申请实施例在难负样本的挖掘过程中,为确保后续模型训练的准确度,需要尽可能地确保挖掘到的难负样本与锚点样本来自于不同分镜样本组,这样可以尽可能地找到与锚点样本不重复的所有难负样本(即锚点样本与难负样本为非重复图像)。同理,需要注意的是,为确保后续模型训练的准确度,需要尽可能地确保挖掘到的正样本与锚点样本来自于同一分镜样本组,这样可以尽可能地找到与锚点样本重复的所有正样本(即锚点样本与正样本为极度相似图或者重复图像,以便于后续在模型应用阶段,可以尽可能的检索到与待查询图像极度相似的图像)。
其中,可以理解的是,本申请实施例在进行批次划分之前,涉及每个批次的数据抽取方法,以满足多标签学习和哈希特征度量学习的要求。为便于理解,进一步的,请参见图7,图7是本申请实施例提供的一种产生一个批次的场景示意图。如图7所示,服务器可以在将N’个分镜样本组(比如,图7所示的分镜样本组7a、分镜样本组7b、分镜样本组7c、…、分镜样本组7n)聚合到有限个聚类中心(例如,图7所示的6个聚类簇,比如,聚类簇71a、聚类簇71b、聚类簇71c、聚类簇71d、聚类簇71e和聚类簇71f)时,可以从这6个聚类簇(即所有聚类簇)中随机抽取K(比如,K=2)个聚类簇(即图7所示的聚类簇71b和聚类簇71f),进而可以从每个聚类簇中分别抽取M(例如,M=3)个分镜图像,以构建得到图7所示的难负样本挖掘子空间73a,该难负样本挖掘子空间73a即为上述第一类负样本空间,在该第一类负样本空间中,从同一聚类簇71b中所抽取的3个分镜图像来源于不同分镜样本组。与此同时,如图7所示,服务器可以在该N’个分镜样本组所对应的全量分镜样本中随机抽取K*M(图7示例中为6)个分镜图像,以构建得到图7所示的全局负样本挖掘子空间73b,该全局负样本挖掘子空间73b即为上述第二类负样本空间,同理,在该第二类负样本空间中,从全量分镜样本中所抽取的6个分镜图像均来源于不同分镜样本组。然后,服务器可以用抽取到的2K*M(图7中示例为12)个分镜图像组成一个批次,即一个批次所对应的批次抽取数量bs=2K*M。
进一步,服务器可以在与目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为目标分镜样本组的负样本;比如,目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;其中,Nn个难负样本是从与目标分镜样本组相关联的第一类负样本空间中所抽取到的;Nn个易负样本是从与目标分镜样本组相关联的第二类负样本空间中所抽取到的;进一步的,服务器可以根据目标分镜样本组的正样本对和目标分镜样本组的负样本,构建得到目标分镜样本组的样本三元组,直到全量分镜样本中的每个分镜样本组均被作为目标分镜样本组时,可以得到每个分镜样本组的样本三元组;其中,可以理解的是,每个分镜样本组的样本三元组的数量均为U*(U-1)* Nn个;进一步的,服务器可以将每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组,以便于后续可以在进行批次划分之后,进一步执行下述步骤S102。
为便于理解,进一步的,请参见图8,图8是本申请实施例提供的一种挖掘难负样本的场景示意图。如图8所示的第一类负样本空间81a(即与目标分镜样本组相关联的第一类负样本空间)包括6(即K*M=6)个分镜图像,为便于进行区分,本申请实施例可以将第一类负样本空间中的来源于不同分镜样本组的这6个分镜图像统称为第一分镜图像,从而可以在图8所示的第二类负样本空间82a(即与目标分镜样本组相关联的第二类负样本空间)中,将来源于不同分镜样本组的另外6(即K*M=6)个分镜图像统称为第二分镜图像;这样,服务器可以在目标分镜样本组的U个分镜图像中遍历选择一个分镜图像作为目标分镜样本组的正样本(例如,在目标分镜样本组为上述图7所对应实施例中的分镜样本组7c时,可以将该分镜样本组7c中的第一个分镜图像作为目标分镜样本组的正样本,即图8所示的样本三元组84a中的样本图像p1、和图8所示的样本三元组84b中的样本图像p2),进而可以在同一分镜样本组(即目标分镜样本组)的U个分镜图像中将除遍历到的正样本之外的分镜图像作为目标分镜样本组的锚点样本(例如,可以上述分镜样本组7c中的第四个分镜图像作为锚点样本85a,该锚点样本85a可以为图8所示的样本三元组84a中的样本图像a1、和图8所示的样本三元组84b中的样本图像a2);此时,服务器可以在图8所示的第一类负样本空间81a所包含的K*M个第一分镜图像中查找与目标分镜样本组的锚点样本相同的第一分镜图像,以将查找到的与目标分镜样本组的锚点样本相同的第一分镜图像作为辅助挖掘图像(即在图8所示的聚类簇71b中,将第一张包含小男孩的分镜图像作为分镜样本组7c的锚点样本85a);进一步的,服务器可以在图8所示的第一类负样本空间81a所包含的K*M个第一分镜图像中将除辅助挖掘图像之外的第一分镜图像作为待挖掘图像(即待挖掘图像为在该第一类负样本空间81a中选择与锚点样本85a具有相同标签/聚类簇的其他分镜图像);所以,这里的待挖掘图像的图像数量为(K*M-1)个;如图8所示,服务器可以进一步确定辅助挖掘图像与(K*M-1)个待挖掘图像之间的第一汉明距离,进而可以将确定的最小第一汉明距离所对应的待挖掘图像作为辅助挖掘图像的局部难负样本(这里的局部难负样本可以为从图8所示的聚类簇71b中所挖掘到的难负样本83a)。与此同时,如图8所示,服务器还可以确定辅助挖掘图像与图8所示的第二类负样本空间82a所包含的K*M个第二分镜图像之间的第二汉明距离,进而可以将确定的最小第二汉明距离所对应的第二分镜图像作为辅助挖掘图像的全局难负样本(这里的全局难负样本可以为从图8所示的第二类负样本空间82a中所挖掘到的难负样本83b);这样,如图8所示,服务器可以基于辅助挖掘图像的局部难负样本和辅助挖掘图像的全局难负样本,在目标分镜样本组的负样本中更新目标分镜样本组的难负样本,并可以进一步基于辅助挖掘图像的局部难负样本和辅助挖掘图像的全局难负样本,构建得到该目标分镜样本组的难样本三元组(即图8所示的样本三元组84a和样本三元组84b)。
其中,可以理解的是,在样本三元组84a中,样本图像a1为目标分镜样本组的锚点样本85a,样本图像p1为目标分镜样本组的正样本,样本图像n1为目标分镜样本组的难负样本83a。同理,在样本三元组84b中,样本图像a2为目标分镜样本组的锚点样本85a,样本图像p2为目标分镜样本组的正样本,样本图像n2为目标分镜样本组的难负样本83b。
由此可见,服务器在挖掘难负样本的过程中,除了可以随机抽取相同聚类簇中的分镜图像作为锚点样本的难负样本之外,还可以在某个分镜样本组中通过遍历确定正样本,以及该正样本对应的锚点样本的情况下,进一步在对应分镜样本组的难负样本挖掘空间所包含的K*M个第一分镜图像中,确定出(K*M-1)待挖掘图像,进而可以通过比较汉明距离的方式,找到与锚点样本具有最小汉明距离的待挖掘图像作为局部难负样本(即一种难负样本),并可以在对应分镜样本组的易负样本挖掘空间所包含的K*M个第二分镜图像中,通过比较汉明距离的方式,找到与锚点样本具有最小汉明距离的第二分镜图像作为全局难负样本(即另一个难负样本),以通过找到的全局难负样本和局部难负样本,与对应分镜样本组的U*(U-1)*1/2=6个正样本对,最终构成用于训练初始特征学习模型的难样本三元组。
步骤S102,通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
具体的,计算机设备(例如,服务器)可以将待处理样本三元组输入初始特征学习模型,由初始特征学习模型对待处理样本三元组进行特征提取和哈希量化处理,将初始特征学习模型所输出的待处理样本三元组的三元组特征作为第一迭代三元组特征;进一步的,计算机设备(例如,服务器)可以在初始特征学习模型的迭代次数达到初始迭代阈值时,将第一迭代三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据与批次样本相关联的初始分类数据集,确定噪声判决模型所维护的第一离群阈值参数;进一步的,计算机设备(例如,服务器)可以基于初始分类数据集确定批次样本的初始联合损失,基于初始联合损失调整初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对初始特征学习模型的迭代次数进行递增处理;进一步的,计算机设备(例如,服务器)可以将过渡特征学习模型所输出的待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将第二迭代三元组特征输入噪声判决模型,由噪声判决模型根据噪声判决模型所维护的第一离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果。
其中,可以理解的是,在模型训练阶段,即服务器通过上述数据准备阶段所得到大量的待处理样本三元组对该初始特征学习模型进行模型训练的过程中,可以通过该初始特征学习模型的基础特征网络层提取得到这些待处理样本三元组的基础特征(即提取得到这些待处理样本三元组的深度图像特征),进而可以将提取到的基础特征输入至该初始特征学习模型的哈希量化层,并由哈希量化层对基础特征进行哈希量化处理,此时,服务器可以将哈希量化处理所得到的哈希量化特征作为初始特征学习模型所输出的第一迭代三元组特征。
其中,可以理解的是,这里的初始特征学习模型具体可以包含基础特征网络层和哈希量化层。其中,基础特征网络层所使用的用于提取深度图像特征的神经网络可以为Resnet101网络,该Resnet101网络的网络参数可以参见下述表1:
表1
Figure 179114DEST_PATH_IMAGE001
如上述表1所示,该Resnet101网络可以包括5个卷积层(Layer name)和一个池化层,这5个卷积层可以为上述表1中的Conv1~Conv5,比如,这5个卷积层具体可以包括卷积网络层1(例如,Conv1)、卷积网络层2(例如,Conv2_x)、卷积网络层3(例如,Conv3_x)、卷积网络层4(例如,Conv4_x)和卷积网络层5(例如,Conv5_x)。此外,表1还给出了每个卷积层的输出图像尺寸(Output size)以及每一个卷积层中的卷积块信息(比如,残差块的数量、每个残差块中的卷积单元的卷积尺寸和卷积特征维度)。
如表1所示,卷积网络层1中具有一个通道数为64维的7x7的卷积,且步幅为2。而卷积网络层2、卷积网络层3、卷积网络层4以及卷积网络层5均包含多个残差块(blocks),例如,卷积网络层2中包括一个最大池化层(步幅为2的3x3的池化层)以及3个残差块,且每个残差块均包括3层卷积单元,具体可以包括通道数为64维的1x1的卷积单元、通道数为64维的3x3的卷积单元、通道数为256维的1x1的卷积单元。
如上述表1所示,卷积网络层3中包括4个残差块,且每个残差块均包括3层卷积单元,具体可以包括通道数为128维的1x1的卷积单元、通道数为128维的3x3的卷积单元、通道数为512维的1x1的卷积单元。同理,如上述表1所示,卷积网络层4中包括23个残差块,且每个残差块均包括3层卷积单元,具体可以包括通道数为256维的1x1的卷积单元、通道数为256维的3x3的卷积单元、通道数为1024维的1x1的卷积单元。同理,如上述表1所示,卷积网络层4中包括3个残差块,且每个残差块均包括3层卷积单元,具体可以包括通道数为512维的1x1的卷积单元、通道数为512维的3x3的卷积单元、通道数为2048维的1x1的卷积单元。
可选的,上述基础特征网络层所使用的用于提取深度图像特征的神经网络还可以为Resnet18网络,这里将不对用于提取深度图像特征的神经网络的网络类型进行限定。为便于提取更加丰富的深度图像特征,本申请实施例以上述基础特征网络层为Resnet101网络为例。所以,本申请实施例在对上述初始特征学习网络进行模型训练之前,可以对该初始特征学习网络的模型参数进行初始化处理。即本申请实施例可以采用上述开源图像数据集(比如,ImageNet数据集)预训练该ResNet101网络的各个网络参数(比如,上述表1所示的所有参数信息)。此外,级联在该ResNet101网络之后的哈希量化层则采用方差为0.01,均值为0的高斯分布进行初始化。
其中,该哈希量化层所使用的一个或者多个全连接层(即Fc级联层),这里以采用一个全连接层(即Full connetction,简称Fc)为例,该Fc级联层的网络参数可以参见下述表2:
表2
Layer name Output size Layer
哈希量化层 1x256 Full connetction
如上述表2所示,当服务器通过上述Resnet101网络对每个样本三元组中的样本图像的图像特征进行深度特征提取之后,可以提取得到用于表征对应样本图像的深度图像特征(即上述特征维度为2048维的基础特征),这样,服务器可以通过级联在该Resnet101网络之后的哈希量化层对提取得到的各样本图像的基础特征进行哈希量化处理,可以将前述2048维的基础特征转化为特征维度为256维的哈希特征。
其中,可以理解的是,这里的哈希特征在哈希量化学习时均用取值范围为-1~1的浮点数表示。可以理解的是,本申请实施例可以用浮点数表示前述由哈希量化层所输出的哈希特征(比如,可以记为Q),这样,在后续汉明距离的计算过程中,可以通过哈希量化处理(即特征量化处理)的方式,比如,可以通过sign函数编码映射为二值量化特征,该二值量化特征为一种可以用0或者1表示的二值编码向量(比如,可以记为B)。
其中,可以理解的是,在本申请实施例中,对包含上述基础特征网络层和哈希量化层的初始特征学习模型的学习率为上述lr(比如,lr=0.0005)。这样,每经过上述10轮迭代后lr将变为原来的0.1倍。由此可见,对于用于训练该初始特征学习模型的上述全量样本三元组而言,可以进行上述C轮(即epoch轮)迭代,且每轮迭代均会处理一次全量样本三元组,直到某轮迭代所得到的epoch loss不再下降,则可以视为完成对该初始特征学习模型的模型训练。
其中,可以理解的是,对于上述步骤S101所得到的批次样本而言,批次样本中的样本三元组可能存储噪声样本三元组。因为对于从上述负样本挖掘子空间中所挖掘的任意一个三元组而言,其噪声来源于:1)分镜过于敏感,以至于在采用上述分镜的方式对某个视频进行分镜处理时,可能使某些存在轻微变化的图像被切分至不同的镜头,如同一个人在剧烈低头、抬头时会认为是两个镜头,此时这两个不同镜头中的分镜图像容易成为难负样本,然而实质依然为极度相似图像,故而需要在模型训练的过程中剔除因噪声干扰所挖掘到的样本三元组;2)分镜图像之间存在相似,如具有全局分布动态点状覆盖物攻击的分镜图像,可能会在两次动态点状覆盖物攻击下会被认为来源于不同镜头,而本质比较相似。基于此,本申请实施例提出需要在对上述初始特征学习模型进行模型训练的过程中,借助上述噪声判决模型对这些挖掘到的样本三元组进行实时地可靠性识别,以根据该噪声判决模型所输出的可靠性识别结果(也可以称之为噪声判决结果)为进一步处理提供准确、可靠地的指导。
对于上述全量样本三元组而言,每轮迭代中的具体操作如下:把全量样本图像,根据上述步骤所产生每个批次(batch)的样本图像及挖掘到的样本三元组,进行以下步骤:
(0)当epoch<4时,不对全量样本三元组进行三元组的可靠性识别,即全量样本三元组默认属于S1、S2、S3所构成的初始分类数据库,此时,服务器可以将计算得到的全量样本三元组中的所有三元组的损失直接求和作为参与训练的上述全量样本三元组的总三元组度量损失(即Loss1),此时,Loss1的计算公式参见下述公式(1):
Loss1=a*Loss(S1)+b*Loss(S2)+c*Loss(S3)=Loss(S1)+Loss(S2)+Loss(S3)公式(1);
其中,S1为该初始分类数据库中的第一分类数据集,比如,S1为可靠数据集;S2为该初始分类数据库中的第二分类数据集,比如,S2为相对可靠数据集;S3为该初始分类数据库中的第三分类数据集,比如,S3为不可靠数据集。当epoch<4时,在公式(1)中,S1的权重a、S2的权重b和S3权重c均配置为1。
(1)当epoch=3时,服务器可以在不对上述全量样本三元组做可靠性判断的情况下,直接通过上述图2所示的噪声判决模块24a动态计算上述判决阈值参数T(例如,T1)。比如,服务器可以在与全量分镜样本相关联的批次样本(即上述N1个批次样本)中,根据划分得到的每个batch样本来迭代计算该判决阈值参数T(例如,T0),以根据下述公式(2)动态更新得到前述判决阈值参数T(例如,T1),从而可以收集得到全量三元组样本在当前迭代次数(例如,epoch=3)时的离群阈值参数(即epoch=3时的这N1个批次样本的中的最后一个batch样本的判决阈值参数T1),应当理解,本申请实施例可以将收集得到全量三元组样本在当前迭代次数(例如,epoch=3)时的离群阈值参数统称为噪声判决模型所维护的第一离群阈值参数,从而可以将该噪声判决模型所维护的第一离群阈值参数作为下一迭代次数(例如,epoch=4)时的N1个批次样本的初始离群阈值参数(即epoch=4时的这N1个批次样本的中的第一个batch样本的判决阈值参数T0)。其中:
Figure 864173DEST_PATH_IMAGE002
公式 (2);
应当理解,在本申请实施例中,在初始特征学习模型的迭代次数未达到初始迭代阈值(即epoch=1和epoch=2)时,无需计算噪声判决阈值参数T1(即此时,T1=0)。所以,当初始特征学习模型的迭代次数达到初始迭代阈值(即epoch=3)时,对于前述N1个批次样本中的第一个batch样本而言,可以将上述公式(2)中的判决阈值参数T0配置为前述0。
在上述公式(2)中,在epoch=3(或者epoch=epoch3)时,对于批次样本中的每个batch样本而言,可以根据公式(2)中当前batch样本(即目标batch样本)的判决阈值参数T0计算得到当前batch样本的判决阈值参数T1;这样,在将下一个batch样本作为新的当前batch样本(即新的目标batch样本)时,则可以进一步将前述已经计算得到的当前batch样本的判决阈值参数T1,迭代作为该新的当前batch样本(即下一个batch样本)的判决阈值参数T0,依次类推,直到将这N1个批次样本中的每个batch样本遍历作为当前batch样本(即目标batch样本)时,可以迭代计算得到批次样本中的最后一个batch样本的判决阈值参数T1。这里将不对划分得到的批次样本的批次数量(即上述N1的值)进行限定。
其中,应当理解,在epoch=3时,对于N1个批次样本中的第一个batch样本而言,在将该第一个batch样本作为前述目标batch样本时,可以根据上述公式(2)中的判决阈值参数T0(此时,T0的值为0),计算得到第一个batch样本的判决阈值参数T1。同理,其中,Nepoch为每个batch样本在初始分类数据集(S1+S2+S3)中的所有样本三元组的个数(例如,Nepoch=bs)。
其中,在初始分类数据集(即S1+S2+S3)中,Vj=Vj-neg,Vj(或者Vj-neg)用于表示目标batch样本中的第j个样本三元组中的负样本的离群阈值比例。其中,第j个样本三元组为目标batch样本所包含的所有样本三元组中的任意一个。此外,这里的Vj-neg可以用下述公式(3)表示:
Figure 340154DEST_PATH_IMAGE003
公式(3)
应当理解,在epoch=3时,服务器可以通过噪声判决模型在初始分类数据集中,将迭代记录到的目标batch样本中的各个样本三元组中的负样本的离群阈值比例统称为待处理样本三元组中的负样本的初始离群阈值比例。在上述公式(3)中,Dneg-image用于描述第j个样本三元组中的负样本到对应分镜样本组(例如,上述分镜样本组i)内最近图像的距离(即第一待处理距离)。比如,Dneg-image是由计算到的第j个样本三元组中的负样本与分镜样本组i(即该第j个样本三元组中锚点样本和/或正样本所在的分镜样本组)内的U个分镜图像之间的汉明距离中的最小汉明距离所确定的。其中,Dneg-center用于描述第j个样本三元组中的负样本到对应分镜样本中心的距离(即第二待处理距离)。比如,Dneg-center是由计算到的第j个样本三元组中的负样本与分镜样本组i(即该第j个样本三元组中锚点样本和/或正样本所在的分镜样本组)的分镜样本中心之间的汉明距离所确定的。其中,分镜样本中心是由分镜样本组i中的所有分镜图像的哈希特征向量的均值所确定的。
由此可见,服务器在迭代次数达到初始迭代阈值(例如,epoch=3)时,在初始分类数据集中,迭代记录待处理样本三元组中的负样本的初始离群阈值比例的具体过程,可以描述如下:
服务器可以在初始分类数据集中,确定参与迭代的待处理样本三元组的三元组总 数量(比如,对于每个batch样本而言,待处理样本三元组的三元组总数量为上述公式(2)中 的Nepoch),从待处理样本三元组中获取第一目标样本三元组(例如,上述第j个样本三元组) 的锚点样本和第一目标样本三元组的负样本,将第一目标样本三元组的锚点样本所在的分 镜样本组(例如,上述分镜样本组i)作为待处理分镜样本组;进一步的,服务器可以获取待 处理分镜样本组中的U1个分镜图像,基于第一迭代三元组特征确定U1个分镜图像中的每个 分镜图像的哈希特征向量,并将由每个分镜图像的哈希特征向量所确定的均值向量作为待 处理分镜样本组的分镜样本中心;U1为正整数,且这里的U1即为上述U。进一步的,服务器可 以在待处理分镜样本组中的U1个分镜图像中,将查找到的与第一目标样本三元组中的负样 本具有最小汉明距离的分镜图像作为第一候选分镜图像,将第一目标样本三元组中的负样 本与第一候选分镜图像之间的汉明距离作为第一待处理距离,并将第一目标样本三元组中 的负样本与待处理分镜样本组的分镜样本中心之间的汉明距离作为第二待处理距离;进一 步的,服务器可以按照上述公式(3)将第一待处理距离和第二待处理距离的比值作为第一 目标样本三元组中的负样本的待迭代离群阈值比例(即Vj);然后,服务器可以按照上述公 式(2)基于三元组总数量(比如,Nepoch)和第一目标样本三元组的负样本的待迭代离群阈值 比例,确定出这些待处理样本三元组中的负样本的初始离群阈值比例(即初始离群阈值比 例可以为
Figure 427059DEST_PATH_IMAGE004
)。
进一步的,服务器可以获取噪声判决模型在初始迭代阈值(即epoch=3)时的可靠性阈值,基于迭代记录的初始离群阈值比例和初始迭代阈值时的可靠性阈值(例如,在epoch=3时针对最后一个批次样本所得到的T0),确定噪声判决模型在初始迭代阈值时的初始可靠性阈值(例如,在epoch=3时针对最后一个批次样本所得到的T1),基于初始可靠性阈值,将噪声判决模型所动态维护的离群阈值参数作为第一离群阈值参数。
其中,服务器在epoch=3时基于初始分类数据集确定批次样本的初始联合损失(即Loss)的损失计算公式如下:
Loss=Loss1+Loss2 公式(4);
其中,在上述公式(4)中,对于上述N1个批次样本而言,Loss为这N1个批次样本的初始联合损失,Loss1为每个批次样本中的样本三元组的度量损失之和;Loss2为对应批次样本中的样本三元组的各个样本图像的量化损失。由此可见,当epoch<4,服务器可以对批次样本(即每个batch样本)中的每个三元组计算度量损失,并对批次样本(即每个batch样本)中的每张样本图像的Q(即上述以浮点数表示的哈希特征,也可以称之为哈希特征向量)计算量化损失,以将两者求和得到该初始特征学习模型的总loss(即前述初始联合损失)。
进一步的,服务器可以在完成第三轮迭代时,基于初始联合损失调整初始特征学习模型的模型参数,以将调整参数后的初始特征学习模型作为过渡特征学习模型,且可以对初始特征学习模型的迭代次数进行递增处理,即递增处理后的迭代次数将达到目标迭代阈值,比如,此时epoch=4。
当epoch>=4时,可以使用下述公式(5)计算三元组度量损失:
Loss1’=a*Loss(S1)+b*Loss(S2)+c*Loss(S3)公式(5);
在公式(5)中,S1的权重a为1、S2的权重b为0.8和S3权重c为0.3。此时,这些三元组中的样本图像的量化损失保持不变(即为上述Loss2)。由于epoch=3时已经初始化了该噪声判决模型所维护的离群阈值参数(即前述计算得到的第一离群阈值参数)。那么,对于上述N1个批次样本而言,在epoch=4时,会让这N1个批次样本中的第一个batch样本采用上述epoch=3所计算得到的第一离群阈值参数作为当前迭代次数(即epoch=4)时的T0,以计算得到该第一个batch样本在当前迭代次数(即epoch=4)时的T1,这样,对于该epoch=4时的第二个batch样本而言,可以继续用上一步所计算得到的第一个batch样本的T1作为该第二个batch样本的T0,以计算得到该第二个batch样本在当前迭代次数(即epoch=4)时的T1,依此类推,直到计算得到这N1个批次样本中的最后一个批次样本在当前迭代次数(即epoch=4)时的T1,进而可以用最后一个批次样本在当前迭代次数(即epoch=4)时的T1更新噪声判决模型所维护的第一离群阈值参数,以将更新后的第一离群阈值参数作为该噪声判决模型所维护的第二离群阈值参数,以进一步开展下一轮的迭代。
其中,可以理解的是,对于每个batch样本而言,在得到每个batch样本的T0时,可以通过以下公式(6)和公式(7)判断每个样本三元组的可靠性:
Figure 838449DEST_PATH_IMAGE005
公式(6);
Figure 135438DEST_PATH_IMAGE006
公式(7);
在公式(6)中,Rj-group用于衡量第j个样本三元组(比如,在epoch=4时,第j个样本三元组可以称之为第二目标样本三元组)中锚点样本和正样本所属分镜样本组(例如,上述分镜样本组i,在epoch=4时,该分镜样本组i可以称之为待判决分镜样本组)的组内距离偏差,如上述公式(6)所示,Rj-group为该分镜样本组i中所有分镜图像与分镜样本中心的距离之和的均值。其中,U为该分镜样本组i(即待判决分镜样本组)内的分镜图像的数量(例如,U2个),Du-center用于描述该分镜样本组i内的某个分镜图像(例如,分镜图像u)与该分镜样本组i的分镜样本中心的距离。
在公式(7)中,辅助判决系数q=0.2,p=0.2;Dneg-image为第j个样本三元组(即第二目标样本三元组)中的负样本到分镜样本组i最近图像距离。此时,Dneg-image的计算方式可以参见上述公式(3)。在公式(7)中,Vj为第j个样本三元组(即第二目标样本三元组)中的负样本的待迭代离群阈值比例,Vj的计算方式可以参见上述公式(3)。
应当理解,当服务器对每个样本三元组计算得到可靠性指标Vj后,可以根据上述公式(7)判别Dneg-image与 Rj-group,Vj与T0(即上述第一离群阈值参数)之间的关系,进而可以根据判别得到的关系确定对应样本三元组属于何种数据集,比如,是否属于噪声集(该噪声集可以为上述S3)。
应当理解,在本申请实施例中,上述公式(7)所涉及的三元组判决条件具体可以包含以下几个条件:
其中,条件1,用于指示服务器在根据负样本到分镜样本组中最近的图像的距离(即Dneg-image)小于分镜样本组i内的组内距离偏差(Rj-group)时,可以判断出上述第j个样本三元组(即第二目标样本三元组)为不可靠样本三元组,进而可以将该第j个样本三元组添加至上述第三分类数据集(即S3)。
条件2:用于指示服务器在三元组可靠性指标(即Vj)低于第一阈值(即
Figure 24896DEST_PATH_IMAGE007
),可以 判断出上述第j个样本三元组(即第二目标样本三元组)为不可靠样本三元组,进而可以将 该第j个样本三元组添加至上述第三分类数据集(即S3)。
条件3:用于指示服务器在三元组可靠性指标处于临界阈值范围(即介于
Figure 231887DEST_PATH_IMAGE007
(即 第一阈值)到
Figure 204391DEST_PATH_IMAGE008
(即第二阈值)之间时,可以判断出上述第j个样本三元组(即第二目标样 本三元组)为相对可靠样本三元组,进而可以将该第j个样本三元组添加至上述第二分类数 据集(即S2);其中,这里的第二阈值为3倍第一阈值。
条件4:用于指示服务器在三元组可靠性指标大于第二阈值时,可以直接判断出上述第j个样本三元组(即第二目标样本三元组)为可靠样本三元组,进而可以将该第j个样本三元组添加至上述第一分类数据集(即S1)。
为便于理解,进一步的,请参见图9,图9是本申请实施例提供的一种对三元组进行噪声识别的场景示意图。如图9所示,这里以某个批次样本中的三个样本三元组中的负样本为例,这三个样本三元组中的负样本分别为图9所示的负样本91a,负样本92a和负样本93a,其中,该负样本91a所在的样本三元组为三元组A1,该负样本92a所在的样本三元组为三元组A2,该负样本93a所在的样本三元组为三元组A3。
如图9所示,三元组A1中的锚点样本和正样本所在的分镜样本组为图9所示的分镜样本组9a(即该三元组A1中的锚点样本和正样本来自同一分镜样本组),此时,三元组A1中的负样本91a来自另一分镜样本组(例如,上述图7所示的分镜样本组7a)。同理,三元组A2中的锚点样本和正样本所在的分镜样本组为图9所示的分镜样本组9b,此时,三元组A2中的负样本92a来自不同于分镜样本组9b的另一分镜样本组。以此类推,三元组A3中的锚点样本和正样本所在的分镜样本组为图9所示的分镜样本组9c,此时,三元组A3中的负样本93a来自不同于分镜样本组9c的另一分镜样本组。如图9所示,分镜样本组9a、分镜样本组9b和分镜样本组9c均包含4(即上述U2=4)个分镜图像。
如图9所示,分镜样本组9a的分镜样本中心为图9所示的分镜样本中心C1,分镜样本组9c的分镜样本中心为图9所示的分镜样本中心C3。同理,分镜样本组9b的分镜样本中心为分镜样本中心C2(暂未在图上示出)。
应当理解,在epoch=4时,服务器可以通过上述公式(6)和公式(7)对这三个三元组进行噪声识别。比如,如图9所示,对于第二目标样本三元组为三元组A1而言,该三元组A1中的负样本可以为图9所示的负样本91a,此时,服务器可以计算该负样本91a到分镜样本组9a最近图像的距离(即图9所示的Dneg-image),即服务器可以计算该负样本91a与分镜样本组9a中的所有分镜图像之间的汉明距离,故而可以将与该负样本91a具有最小汉明距离的分镜图像(例如,图9所示的分镜图像91b)作为第二候选分镜图像,进而可以将负样本91a与该第二候选分镜图像之间的汉明距离作为第三待处理距离。与此同时,服务器可以将计算得到的该负样本91a到该分镜样本组9a的分镜样本中心C1的距离作为第四待处理距离(即Dneg-center),此外,服务器还可以根据上述公式(6)计算该分镜样本组9a的组内距离偏差,故而可以根据上述公式(7)所涉及的四个条件对该三元组A1进行可靠性识别。
同理,如图9所示,对于第二目标样本三元组为三元组A3而言,该三元组A3中的负样本可以为图9所示的负样本93a,此时,服务器可以计算该负样本93a到分镜样本组9c最近图像的距离(即图9所示的Dneg-image),即服务器可以计算该负样本93a与分镜样本组9c中的所有分镜图像之间的汉明距离,故而可以将与该负样本93a具有最小汉明距离的分镜图像(例如,图9所示的分镜图像93b)作为另一个第二候选分镜图像,进而可以将负样本93a与该第二候选分镜图像之间的汉明距离作为另一个第三待处理距离。与此同时,服务器可以将计算得到的该负样本93a到该分镜样本组9c的分镜样本中心C3的距离作为第四待处理距离(即Dneg-center),此外,服务器还可以根据上述公式(6)计算该分镜样本组9c的组内距离偏差,故而可以根据上述公式(7)所涉及的四个条件对该三元组A3进行可靠性识别。
应当理解,计算机设备在对每个batch样本中的样本三元组进行可靠性识别(即进行噪声判决)之后,可以得到每个样本三元组的噪声判决结果,进而可以根据每个样本三元组的噪声判决结果,将对应的样本三元组添加到相应的分类数据集,比如,可以确定用于添加至第一分类数据集相关联的样本三元组、还可以确定用于添加至第二分类数据集相关联的样本三元组以及用于添加至第三分类数据集相关联的样本三元组。这样,服务器可以在与批次样本相关联的初始分类数据集中,去除与第三分类数据集相关联的样本三元组,并将去除与第三分类数据集相关联的样本三元组后的初始分类数据集作为目标分类数据集(即该目标分类数据集包含第一分类数据集和第二分类数据集),从而可以基于目标分类数据集中的样本三元组进一步按照下述公式(8)更新噪声判决模型所维护的第一离群阈值参数:
Figure 598463DEST_PATH_IMAGE009
公式 (8);
在公式 (8)中,当epoch=4时,在目标分类数据集(即S1+S2)中,
Figure 557192DEST_PATH_IMAGE010
为某个 batch样本中(例如,第一个batch样本)的样本三元组的数量。此时,T0可以为噪声判决模型 在epoch=3时所维护的第一离群阈值参数。T1可以为第一个batch样本根据上述上一轮(即 在epoch=3时)所维护的第一离群阈值参数,所更新得到的第一个batch样本在epoch=4时的 离群阈值参数。
(2)模型前向:把模型的所有参数都设为需要学习状态,训练时神经网络对输入的一张图片(即前述全量样本图像中的任意一张样本图像)进行前向计算,并可以将得到哈希层预测结果,用Q表示,其中Q可以用1x256维的浮点向量表示对应样本图像的哈希特征。
(3)当epoch>=4时执行本步骤,否则跳过——根据下述可靠性识别步骤计算每个三元组的可靠性指标(例如,上述Vj),进而可以根据可靠性指标与训练维护的T阈值(即前述T0)关系,决定对应样本三元组是否属于S1、S2或S3的任意一者。
(4)loss计算:当epoch<4,按照上述公式(4),对batch样本中的每个三元组计算度量损失,对batch样本中的每张样本图像的Q计算量化损失,两者求和得到总Loss。当epoch>=4,三元组损失替换成上述公式(5)的Loss式子(其中权重a、b、c分别为1、0.8、0.3),量化损失保持不变。
(5)模型参数更新:采用SGD随机梯度下降法,把步骤(4)中通过下述公式(9)所计算得到的总Loss进行梯度后向计算得到全部模型参数的更新值,并更新网路。
步骤S103,对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
具体的,服务器可以对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,对待处理样本三元组的二值量化特征进行特征编码处理,得到待处理样本三元组的二值编码特征;进一步的,服务器可以根据初始特征学习模型的迭代次数,确定第一分类数据集对应的第一迭代权重、第二分类数据集对应的第二迭代权重和第三分类数据集对应的第三迭代权重;进一步的,服务器可以根据与第一分类数据集相关联的样本三元组的第一判决结果,确定与第一分类数据集相关联的样本三元组的第一度量损失,根据与第二分类数据集相关联的样本三元组的第二判决结果,确定与第二分类数据集相关联的样本三元组的第二度量损失,根据与第三分类数据集相关联的样本三元组的第三判决结果,确定与第三分类数据集相关联的样本三元组的第三度量损失;进一步的,服务器可以根据第一度量损失和第一迭代权重的乘积、第二度量损失和第二迭代权重的乘积以及第三度量损失和第三迭代权重的乘积,确定批次样本在迭代次数时的三元组度量损失;进一步的,服务器可以基于待处理样本三元组的二值量化特征确定待处理样本三元组中的样本图像在目标量化维度上的量化值,基于待处理样本三元组的二值编码特征确定样本图像在目标量化维度上的编码值,基于样本图像在目标量化维度上的量化值和样本图像在目标量化维度上的编码值,确定样本图像在迭代次数时的量化损失;进一步的,服务器可以根据批次样本在迭代次数时的三元组度量损失和样本图像在迭代次数时的量化损失,得到批次样本的联合损失。
其中,可以理解的是,对每个batch样本所包含的bs个样本三元组而言,可以按照下述公式(9)计算所有样本三元组的三元组损失、所有样本三元组中的样本图像的量化损失。其中,wj为由对第j个样本三元组进行可靠性判决时所产生的权重,即wj可以视模型训练过程中迭代次数的变更而发生变化,比如,在上述epoch=3时,wj的值可以为上述公式(1)中的1,但是,在epoch>=4时,wj的值可能为上述公式(5)中的a、b或者c,具体的,请参见下述公式(9):
Figure 212164DEST_PATH_IMAGE011
公式(9);
1) 在公式(9)中,
Figure 230936DEST_PATH_IMAGE012
为某个批次样本中的第j个样本三元组的三元组损失: 在采用上述batch抽取的方式挖掘到上述样本三元组(apn)时,需要确保样本三元组中的an 样本之间的距离需要足够大,才能保证该样本三元组在量化空间可区分,故margin需要设 置更大,考虑到256维量化向量中的每位最终会接近-1或1的值,故预设参考margin0=160, 第j个样本三元组的三元组损失公式如下:
Figure 377883DEST_PATH_IMAGE013
公式(10);
在公式(10)中,
Figure 999357DEST_PATH_IMAGE014
为margin,设为160,
Figure 915361DEST_PATH_IMAGE015
表示第j个样本三元组中a与p两个 样本图像的量化输出哈希特征向量(即Q)的汉明距离。
Figure 695579DEST_PATH_IMAGE016
表示第j个样本三元组中a 与n两个样本图像的量化输出哈希特征向量的汉明距离。计算该第j个样本三元组的三元组 度量损失的目的是使得anchor样本与negative样本的距离,比anchor样本与positive样本 的距离大于margin。
)在公式(9)中,
Figure 329823DEST_PATH_IMAGE017
为第k个样本图像的编码量化损失:对该量化分支输出的 向量计算量化效果(是否足够接近-1或1)的损失,由于量化输出后最终应用需要映射到-1/ 1二值,若Q输出的每一位都足够接近1或-1,则上述triplet度量损失则足够可以描述量化 特征的应用情况,否则triplet度量效果即使再好也不代表应用中量化的表征足够好,故希 望Q 输出的每一位都足够接近1或-1。
对于每个图像的量化结果,满足这一目标的损失函数如下:1)其中,Qi为该图像的 哈希特征向量Q在第i位的值(对于本申请实施例所涉及的256维的哈希特征向量而言,哈希 特征向量Q的位数共为256位),Bi为第i位的量化目标,Bi由Qi经过sign函数产生。比如,可以 采用符号函数(例如,sign函数)产生量化学习任务的目标编码(如下式sign函数,对待编码 的哈希特征向量Q的每一位Qi分别通过符号函数计算其目标编码Bi,最终Q的目标编码向量 为B)。然后采用回归损失regression loss(即
Figure 630354DEST_PATH_IMAGE017
)使coding输出哈希特征向量Q与目 标编码向量B的L2距离变小。
Figure 666444DEST_PATH_IMAGE018
公式(11);
Figure 886072DEST_PATH_IMAGE019
公式(12);
权重:由于coding(即编码)的regression loss收敛比triplet-loss(即三元组度量损失)快,并且coding的重要性比特征度量能力低,为了保证triplet-loss在整体loss中处于主导地位,从而保证embedding始终具有相似度度量的能力,故在上述公式(9)中,将w2设为0.01(或小于1的其他值,可视情况调整)。
步骤S104,根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
在本申请实施例中,计算机设备在获取到用于训练初始特征学习模型的批次样本时,可以将批次样本中的样本三元组作为待处理样本三元组;进一步的,计算机设备可以通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;进一步的,计算机设备可以对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;进一步的,计算机设备可以根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。应当理解,在本申请实施例中,计算机设备在用于训练初始特征模型的批次样本的情况下,可以获取批次样本中的样本三元组,进而可以通过该批量性得到的样本三元组对该初始特征学习模型对进行迭代训练,并可以在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以根据噪声判决结果和二值量化特征,对前述批次样本进行联合损失学习,进而可以通过学习得到联合损失反向更新模型参数,以便于可以通过更新模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。换言之,本申请实施例通过在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以在联合训练时有效提升模型训练的准确度。
进一步地,请参见图10,图10是本申请实施例提供的一种图像数据处理方法的流程示意图。如图10所示,该方法可以由具备图像数据处理功能的计算机设备执行,该计算机设备可以为用户终端(例如,上述图1所示的用户终端集群中的任意一个用户终端,例如,上述用户终端100a),也可以为服务器(例如,上述图1所示的服务器10),在此不做限定。为便于理解,本申请实施例以该方法由具备图像数据处理功能的服务器执行为例进行说明,该方法至少可以包括以下步骤S201-步骤S210:
步骤S201,在获取到全量分镜样本时,构建与全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;
具体的,计算机设备(例如,服务器)可以获取用于分镜处理的样本视频,并可以对样本视频进行分镜处理,以得到与样本视频相关联的N’个分镜样本组,将N’个分镜样本组作为全量分镜样本,基于N’个分镜样本组的标签信息,对N’个分镜样本组进行聚类处理,得到与全量分镜样本相关联的X个聚类簇;N’为正整数;X为正整数,且一个聚类簇对应一个标签信息;进一步的,计算机设备(例如,服务器)可以从全量分镜样本中获取分镜样本组i,在X个聚类簇中,将从分镜样本组i所在的聚类簇中抽取的K个聚类簇作为目标聚类簇;其中,i为小于或者等于N’的正整数;目标聚类簇的数量为K个;进一步的,计算机设备(例如,服务器)可以从K个目标聚类簇所对应的局部子空间中,抽取K*M个分镜图像作为第一分镜图像,基于抽取到的K*M个第一分镜图像,构建与分镜样本组i相关联的第一类负样本空间,并从X个聚类簇所对应的全局子空间中,抽取K*M个分镜图像作为第二分镜图像,基于抽取到的K*M个第二分镜图像构建与分镜样本组i相关联的第二类负样本空间;第一类负样本空间中的第一分镜图像与分镜样本组i中的分镜图像具有相同的标签信息;第二类负样本空间中的分镜图像与分镜样本组i中的分镜图像具有不同的标签信息;进一步的,计算机设备(例如,服务器)可以将第一类负样本空间和第二类负样本空间作为分镜样本组i的负样本挖掘子空间。
其中,本申请实施例构建得到分镜样本组i的负样本挖掘子空间的具体实现方式,可以参见上述图3所对应实施例对构建负样本挖掘子空间的描述,这里将不再继续进行赘述。
步骤S202,基于全量分镜样本中的每个分镜样本组和与每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;
具体的,全量分镜样本包括N’个分镜样本组,一个分镜样本组包含U个分镜图像;N’和U均为正整数;与每个分镜样本组相关联的负样本挖掘子空间均包括第一类负样本空间和第二类负样本空间;此时,服务器可以在全量分镜样本中的每个分镜样本组中获取目标分镜样本组;进一步的,服务器可以在目标分镜样本组的U个分镜图像中选择一个分镜图像作为目标分镜样本组的锚点样本,并在目标分镜样本组的U个分镜图像中将除锚点样本之外的分镜图像作为目标分镜样本组的正样本,基于目标分镜样本组的锚点样本和目标分镜样本组的正样本,确定目标分镜样本组的正样本对;目标分镜样本组的正样本对的数量为U*(U-1)*1/2个;进一步的,服务器可以在与目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为目标分镜样本组的负样本;目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;Nn个难负样本是从与目标分镜样本组相关联的第一类负样本空间中所抽取到的;Nn个易负样本是从与目标分镜样本组相关联的第二类负样本空间中所抽取到的;进一步的,服务器可以根据目标分镜样本组的正样本对和目标分镜样本组的负样本,构建得到目标分镜样本组的样本三元组,直到全量分镜样本中的每个分镜样本组均被作为目标分镜样本组时,得到每个分镜样本组的样本三元组;每个分镜样本组的样本三元组的数量均为U*(U-1)* Nn个;进一步的,服务器可以将每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组。
其中,服务器构建用于训练初始特征学习模型的全量样本三元组的具体实现方式,可以参见上述图3所对应实施例中对全量样本三元组的描述,这里将不再继续进行赘述。
步骤S203,根据负样本挖掘子空间中的总负样本数量,对全量样本三元组中的样本三元组进行批次划分,得到与全量分镜样本相关联的批次样本。
步骤S204,在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
步骤S205,通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
步骤S206,对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
步骤S207,根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
其中,步骤S204-步骤S207的具体实现方式,可以参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再继续进行赘述。
步骤S208,在获取到待查询图像时,通过目标特征学习模型对待查询图像进行特征度量学习,得到待查询图像的哈希特征,对待查询图像的哈希特征进行特征编码处理,将编码得到的待查询图像的二值编码特征作为待查询图像的待查询图像特征;
步骤S209,在与目标特征学习模型相关联的索引库中查询与待查询图像特征相匹配的索引向量,将索引向量所对应的量化中心作为目标量化中心,将与目标量化中心相关联的关联图像作为待查询图像对应的候选索引图像;
步骤S210,确定待查询图像的待查询图像特征和候选索引图像的哈希图像特征之间的汉明距离,对确定的汉明距离进行排序处理,从排序处理后的汉明距离中确定目标汉明距离,将目标汉明距离所对应的候选索引图像作为待查询图像对应的目标索引图像。
其中,可以理解的是,服务器在执行步骤S208之前,还可以执行以下步骤:服务器可以通过目标特征学习模型对库存图像进行特征度量学习,得到库存图像的哈希图像特征,对库存图像的哈希图像特征进行聚类处理,得到与库存图像相关联的Z个聚类簇;其中,Z为正整数;一个聚类簇对应一个聚类中心;进一步的,服务器还可以将Z个聚类簇中的每个聚类簇对应的聚类中心作为每个聚类簇的量化中心,基于每个聚类簇的量化中心构建用于进行图像索引的索引库;进一步的,服务器可以建立索引库中的量化中心与图像库中的库存图像之间的索引映射关系,基于索引映射关系将每个聚类簇中的库存图像作为与对应聚类簇的量化中心相关联的关联图像。
为便于理解,进一步的,请参见图11,图11是本申请实施例提供的一种将目标特征学习模型应用在图像检索中的场景示意图。如图11所示,服务器可以通过训练好的目标特征学习模型学习得到,图11所示的图像库中的每个库存图像的哈希特征,并可以将通过目标特征学习模型所学习到的每个库存图像的哈希特征统称为哈希图像特征。如图11所示,服务器可以进一步根据获取到的每个库存图像的哈希特征(即每个库存图像的哈希图像特征),对这些库存图像进行聚类处理,以得到图11所示的Z个聚类簇,每个聚类簇可以等效为一个聚类中心(例如,服务器可以通过kmeans聚类算法对图像库中的这些库存图像进行聚类处理,以根据kmeans聚类算法把所有库存图像的量化特征聚类到有限个(例如,8192)个聚类中心,每个聚类中心可视为一个量化中心)。此外,服务器可以进一步在图11所示的索引库中把每个量化中心所对应的索引向量(例如,图11所示的索引向量[0001]、索引向量[0010]、索引向量[0100]等)作为用于进行检索的索引(用于分桶检索),以建立这些索引与图像库(量化中心与库存中的哈希特征)中对应库存图像之间的索引映射关系(具体的,请参见图11所示的索引库中用于描述对应所以映射关系的索引箭头),其中,应当理解,本申请实施例可以在图11所示的索引库中,将与对应索引向量具有索引映射关系的库存图像统称为关联图像;这样,当服务器获取到图11所示的待查询图像时,可以通过该目标特征学习模型学习得到该待查询图像的哈希特征,从而可以在图11所示的索引库中根据待查询图像的哈希特征找到最近的索引,即可以查询到与该待查询图像特征相匹配的索引向量(例如,图11所示的索引向量[0100])。然后,服务器可以进一步从索引库中根据该查询到的索引向量(即索引向量[0100]),定位到与该索引向量[0100]所表征的量化中心相关联的关联图像,以将这些索引到的关联图像作为候选索引图像进行检索召回,具体的可以参见图11所示召回的4个候选索引图像。进一步的,服务器可以根据召回的这4个候选索引图像的哈希特征与待查询图像的哈希特征,计算待查询图像与各个候选索引图像之间的汉明距离,并可以将计算得到的这些汉明距离按照从小到大进行排序处理(应当理解,汉明距离越小,则表示越相似),以从排序处理后的这些汉明距离中取前H(例如,H=2)个汉明距离作为目标汉明距离;进一步的,如图11所示,服务器可以将目标汉明距离所对应的候选索引图像作为最后的召回结果,以得到图11所示的两个目标索引图像。
其中,应当理解,在图像排重系统中,服务器可以对所有库存图像根据目标特征学习模型所提取到所有的Q经过sign函数激活得到相应的二值编码向量,并可以将这些二值编码向量写入图11所示的索引库。这样,在query图像(即上述待查询图像)经过上述目标特征学习模型所提取到的Q经过二值化处理,得到二值编码特征(即待查询图像的待查询图像特征)时,可以跟索引库中的二值编码向量进行一一对比,以找到对应的量化中心。应当理解,本申请实施例通过采用二值化后的二值编码特征的汉明距离进行相似计算,可以加速计算效率(相比于以浮点形式表征的哈希特征),这样,在计算得到各个汉明距离后,根据从小到大的训练进行排序处理后,可以取排序在前的H个汉明距离所对应的图像作为最相似图像,从而可以检索到跟输入的待查询图像具有较高相似度的库存图像。
此外,应当理解,本申请实施例所涉及的图像排重方法还可扩展用于图像创作过程中的相似图像的相似识别,为便于理解,进一步的,请参见图12,图12是本申请实施例提供的一种用于进行相似识别的场景示意图。如图12所示,当用户在应用客户端的应用显示界面中通过“上传图片”控件提交图像12a时,可以在图12所示的用户终端的查询图像输入区域显示该图像12a,进而可以通过触发“确认查询”控件,对显示在该查询图像输入区域中的图像12a进行查询,比如,如图12所示,用户终端可以将携带该图像12a的查询请求发送给图12所示的服务器,这样,服务器在接收到该查询请求后,1)服务器中的服务响应系统可以从接收到的查询请求中获取图像12a,2)服务器中的服务响应系统可以把该图像12a发送到用于提供特征提取服务的子服务模块,从而可以通过图12所示的特征学习模型121a获取该图像12a的图像特征;3)服务器中的服务响应系统在接收到用于提供特征提取服务的子服务模块返回的图像12a的图像特征的情况下,可以进一步把该图像12a的图像特征发送到用于提供检索服务的另一子服务模块,以获取检索结果;4)服务器中的服务响应系统可以根据检索结果向用户终端返回针对该图像12a的召回结果,并在图12所示的用户终端的结构展示区域中展示与该图像12a相似的目标索引图像(例如,图像12b和图像12e)。其中,应当理解,这里的目标索引图像为服务器在查询到的候选索引图像(例如,图12所示的图像12b、图像12c、图像12d和图像12e)中,所选取的与该图像12具有较小距离的前H(例如,H=2)个图像。
进一步的,请参见图13,图13是本申请实施例提供的一种用户终端的应用显示界面的场景示意图。其中,为便于理解,这里以图13所示的应用显示界面所对应的用户终端为上述图12所示的用户终端为例。如图13所示,对于使用该用户终端的业务对象(例如,用户)而言,第一步:用户终端可以在图13所示的应用显示界面(简称界面)上展示主要包含需要查询的“输入图片”所对应的图片输入区域(该图片输入区域可以为上述图12所示的查询图像输入区域)、以及以“相似列表”形式展示查询结果的相似列表展示区域(该相似列表展示区域可以为上述图12所示的结果展示区域);其中,如图13所示,该应用显示界面中的功能键(即应用显示界面中控件)包括“上传图片”键、“确认查询”键。如图13所示,在用户未确认查询时,图片输入区域和相似列表展示区域中均为空白显示,此时,用户终端中的“上传图片”键可用,“确认查询”键不可用。第二步:当用户需要对某张图片查询是否存在相似的库存图像时,可以点击“上传图片”键,以从本地图像库中选择一张图作为输入图片上传至图12所示的图片输入区域,并在上传完毕后使该“上传图片”键不可用。第三步:如图13所示,用户可以在上传完毕后,进一步点击“确认查询”键,以使得该用户终端所对应的服务器(例如,上述图12所示的服务器)可以在后台进行提取特征、查询等操作。第四步:用户终端可以接收服务器返回的查询结果(例如,上述图12所示的2个与当前输入图片极其相似的库存图像),并将查询结果返回展示在相似列表展示区域内的“相似列表”中,此后用户可以在该用户终端中进行下一次输入图像及确认查询。
在本申请实施例中,计算机设备在用于训练初始特征模型的批次样本的情况下,可以获取批次样本中的样本三元组,进而可以通过该批量性得到的样本三元组对该初始特征学习模型对进行迭代训练,并可以在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以根据噪声判决结果和二值量化特征,对前述批次样本进行联合损失学习,进而可以通过学习得到联合损失反向更新模型参数,以便于可以通过更新模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。换言之,本申请实施例通过在迭代训练该初始特征学习模型的过程中,对样本三元组进行实时的可靠性判决(即进行噪声判决),以在联合训练时有效提升模型训练的准确度,这样,在使用训练好的目标特征学习模型可以在上述图像数据处理系统(例如,图像排重系统或者图像相似系统)中快速且准确的查询到与待查询图像具有较高相似度的目标索引图像,进而可以提升图像索引的准确性。
进一步地,请参见图14,图14是本申请实施例提供的一种图像数据处理装置的结构示意图。如图14所示,该图像数据处理装置1可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如,该图像数据处理装置1为一个应用软件;该图像数据处理装置1可以用于执行本申请实施例提供的方法中的相应步骤。如图14所示,该图像数据处理装置1可以运行于具有图像数据处理功能的计算机设备,该计算机设备可以为上述图1所对应实施例中的服务器10,也可以为上述图1所对应实施例中的用户终端集群中的任意一个运行有目标特征学习模型的用户终端,例如,用户终端100a。该图像数据处理装置1可以包括:样本三元组获取模块100、噪声判决模块200、联合损失获取模块300和目标模型确定模块400;
样本三元组获取模块100,用于在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
噪声判决模块200,用于通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
联合损失获取模块300,用于对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
目标模型确定模块400,用于根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
其中,样本三元组获取模块100、噪声判决模块200、联合损失获取模块300和目标模型确定模块400的具体实现方式,可以参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图15,图15是本申请实施例提供的另一种图像数据处理装置的结构示意图。该图像数据处理装置2可以是运行于计算机设备中的一个计算机程序(包括程序代码),例如,该图像数据处理装置2为一个应用软件;该图像数据处理装置2可以用于执行本申请实施例提供的方法中的相应步骤。如图15所示,该图像数据处理装置2可以包括:样本三元组获取模块11、噪声判决模块12、联合损失获取模块13和目标模型确定模块14。可选的,该图像数据处理装置2还可以包括:子空间构建模块15,样本三元组构建模块16,批次划分模块17,待查询图像获取模块18,索引向量查询模块19,索引图像确定模块20,库存图像学习模块21,索引库构建模块22和索引关系建立模块23;
样本三元组获取模块11,用于在获取到用于训练初始特征学习模型的批次样本时,将批次样本中的样本三元组作为待处理样本三元组;
其中,全量分镜样本包括N’个分镜样本组,一个分镜样本组包含U个分镜图像;N’和U均为正整数;与每个分镜样本组相关联的负样本挖掘子空间均包括第一类负样本空间和第二类负样本空间;
样本三元组获取模块11包括:目标样本获取单元111,正样本对确定单元112,负样本抽取单元113,三元组构建单元114和样本三元组确定单元115;可选的,样本三元组获取模块11还包括:正样本遍历单元116,辅助图像确定单元117,待挖掘图像确定单元118,难负样本确定单元119,难负样本更新单元120;
目标样本获取单元111,用于在全量分镜样本中的每个分镜样本组中获取目标分镜样本组;
正样本对确定单元112,用于在目标分镜样本组的U个分镜图像中选择一个分镜图像作为目标分镜样本组的锚点样本,并在目标分镜样本组的U个分镜图像中将除锚点样本之外的分镜图像作为目标分镜样本组的正样本,基于目标分镜样本组的锚点样本和目标分镜样本组的正样本,确定目标分镜样本组的正样本对;目标分镜样本组的正样本对的数量为U*(U-1)*1/2个;
负样本抽取单元113,用于在与目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为目标分镜样本组的负样本;目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;Nn个难负样本是从与目标分镜样本组相关联的第一类负样本空间中所抽取到的;Nn个易负样本是从与目标分镜样本组相关联的第二类负样本空间中所抽取到的;
三元组构建单元114,用于根据目标分镜样本组的正样本对和目标分镜样本组的负样本,构建得到目标分镜样本组的样本三元组,直到全量分镜样本中的每个分镜样本组均被作为目标分镜样本组时,得到每个分镜样本组的样本三元组;每个分镜样本组的样本三元组的数量均为U*(U-1)* Nn个;
样本三元组确定单元115,用于将每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组。
可选的,正样本遍历单元116,用于在目标分镜样本组的U个分镜图像中遍历选择一个分镜图像作为目标分镜样本组的正样本,并在目标分镜样本组的U个分镜图像中将除遍历到的正样本之外的分镜图像作为目标分镜样本组的锚点样本;
辅助图像确定单元117,用于在K*M个第一分镜图像中查找与目标分镜样本组的锚点样本相同的第一分镜图像,将查找到的与目标分镜样本组的锚点样本相同的第一分镜图像作为辅助挖掘图像;
待挖掘图像确定单元118,用于在K*M个第一分镜图像中将除辅助挖掘图像之外的第一分镜图像作为待挖掘图像;待挖掘图像的图像数量为(K*M-1)个;
难负样本确定单元119,用于确定辅助挖掘图像与(K*M-1)个待挖掘图像之间的第一汉明距离,将确定的最小第一汉明距离所对应的待挖掘图像作为辅助挖掘图像的局部难负样本,并确定辅助挖掘图像与K*M个第二分镜图像之间的第二汉明距离,将确定的最小第二汉明距离所对应的第二分镜图像作为辅助挖掘图像的全局难负样本;
难负样本更新单元120,还用于基于辅助挖掘图像的局部难负样本和辅助挖掘图像的全局难负样本,在目标分镜样本组的负样本中更新目标分镜样本组的难负样本。
其中,目标样本获取单元111,正样本对确定单元112,负样本抽取单元113,三元组构建单元114和样本三元组确定单元115的具体实现方式和正样本遍历单元116,辅助图像确定单元117,待挖掘图像确定单元118,难负样本确定单元119,难负样本更新单元120的具体实现方式,均可以参见上述图3所对应实施例中的全量样本三元组的描述,这里将不再继续进行赘述。
噪声判决模块12,用于通过初始特征学习模型提取得到待处理样本三元组的三元组特征,将待处理样本三元组的三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据初始特征学习模型的迭代次数和噪声判决模型所维护的离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果;
其中,噪声判决模块12包括:三元组特征输出单元121,阈值参数确定单元122,迭代次数递增单元123和噪声判决单元124;可选的,噪声判决模块还包括:样本三元组添加单元125,阈值参数更新单元126;
三元组特征输出单元121,用于将待处理样本三元组输入初始特征学习模型,由初始特征学习模型对待处理样本三元组进行特征提取和哈希量化处理,将初始特征学习模型所输出的待处理样本三元组的三元组特征作为第一迭代三元组特征;
其中,三元组特征输出单元121包括:基础特征提取子单元1211,哈希量化子单元1212和特征输出子单元1213;
基础特征提取子单元1211,用于将待处理样本三元组输入初始特征学习模型的基础特征网络层,由基础特征网络层提取待处理样本三元组的基础特征;
哈希量化子单元1212,用于将提取到的基础特征输入初始特征学习模型的哈希量化层,由哈希量化层对基础特征进行哈希量化处理;
特征输出子单元1213,用于将哈希量化处理所得到的哈希量化特征作为初始特征学习模型所输出的第一迭代三元组特征。
其中,基础特征提取子单元1211,哈希量化子单元1212和特征输出子单元1213的具体实现方式,可以参见上述图3所对应实施例中对初始特征学习模型所输出的第一迭代三元组特征的具体过程的描述,这里将不再继续进行赘述。
阈值参数确定单元122,用于在初始特征学习模型的迭代次数达到初始迭代阈值时,将第一迭代三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型根据与批次样本相关联的初始分类数据集,确定噪声判决模型所维护的第一离群阈值参数;
其中,阈值参数确定单元122包括:初始分类集确定子单元1221,阈值比例迭代子单元1222,阈值参数确定子单元1223;
初始分类集确定子单元1221,用于在初始特征学习模型的迭代次数达到初始迭代阈值时,将第一迭代三元组特征输入与初始特征学习模型相关联的噪声判决模型,由噪声判决模型将与待处理样本三元组相关联的分类数据集作为与批次样本相关联的初始分类数据集;
阈值比例迭代子单元1222,用于在初始分类数据集中,迭代记录待处理样本三元组中的负样本的初始离群阈值比例;
其中,阈值比例迭代子单元1222,具体用于在初始分类数据集中,确定参与迭代的待处理样本三元组的三元组总数量,从待处理样本三元组中获取第一目标样本三元组的锚点样本和第一目标样本三元组的负样本,将第一目标样本三元组的锚点样本所在的分镜样本组作为待处理分镜样本组;
阈值比例迭代子单元1222,还具体用于获取待处理分镜样本组中的U1个分镜图像,基于第一迭代三元组特征确定U1个分镜图像中的每个分镜图像的哈希特征向量,并将由每个分镜图像的哈希特征向量所确定的均值向量作为待处理分镜样本组的分镜样本中心;U1为正整数;
阈值比例迭代子单元1222,还具体用于在待处理分镜样本组中的U1个分镜图像中,将查找到的与第一目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第一候选分镜图像,将第一目标样本三元组中的负样本与第一候选分镜图像之间的汉明距离作为第一待处理距离,并将第一目标样本三元组中的负样本与待处理分镜样本组的分镜样本中心之间的汉明距离作为第二待处理距离;
阈值比例迭代子单元1222,还具体用于将第一待处理距离和第二待处理距离的比值作为第一目标样本三元组的负样本的待迭代离群阈值比例;
阈值比例迭代子单元1222,还具体用于基于三元组总数量和第一目标样本三元组的负样本的待迭代离群阈值比例,确定待处理样本三元组中的负样本的初始离群阈值比例。
阈值参数确定子单元1223,用于获取噪声判决模型在初始迭代阈值时的可靠性阈值,基于迭代记录的初始离群阈值比例和初始迭代阈值时的可靠性阈值,确定噪声判决模型在初始迭代阈值时的初始可靠性阈值,基于初始可靠性阈值,将噪声判决模型所维护的离群阈值参数作为第一离群阈值参数。
其中,初始分类集确定子单元1221,阈值比例迭代子单元1222,阈值参数确定子单元1223的具体实现方式,可以参见上述图3所对应实施例中对第一离群阈值参数的描述,这里将不再继续进行赘述。
迭代次数递增单元123,用于基于初始分类数据集确定批次样本的初始联合损失,基于初始联合损失调整初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对初始特征学习模型的迭代次数进行递增处理;
噪声判决单元124,用于将过渡特征学习模型所输出的待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将第二迭代三元组特征输入噪声判决模型,由噪声判决模型根据噪声判决模型所维护的第一离群阈值参数,对待处理样本三元组进行噪声判决,得到待处理样本三元组的噪声判决结果。
其中,噪声判决单元124包括:待判决分镜确定子单元1241,分镜中心确定子单元1242,组内偏差确定子单元1243,距离确定子单元1244,偏差比例确定子单元1245和噪声判决子单元1246;
待判决分镜确定子单元1241,用于将过渡特征学习模型所输出的待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将第二迭代三元组特征输入噪声判决模型,由噪声判决模型从待处理样本三元组中获取第二目标样本三元组的锚点样本和第二目标样本三元组的负样本,将第二目标样本三元组的锚点样本所在的分镜样本组作为待判决分镜样本组;
分镜中心确定子单元1242,用于获取待判决分镜样本组中的U2个分镜图像,基于第二迭代三元组特征确定U2个分镜图像中的每个分镜图像的哈希特征向量,并将由每个分镜图像的哈希特征向量所确定的均值向量作为待判决分镜样本组的分镜样本中心;U2为正整数;
组内偏差确定子单元1243,用于根据待判决分镜样本组中的U2个分镜图像分别与待判决分镜样本组的分镜样本中心之间的汉明距离,确定待判决分镜样本组对应的均值距离,将均值距离作为待判决分镜样本组的组内距离偏差;
距离确定子单元1244,用于在待判决分镜样本组中的U2个分镜图像中,将查找到的与第二目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第二候选分镜图像,将第二目标样本三元组中的负样本与第二候选分镜图像之间的汉明距离作为第三待处理距离,并将第二目标样本三元组中的负样本与待判决分镜样本组的分镜样本中心之间的汉明距离作为第四待处理距离;
偏差比例确定子单元1245,用于将第三待处理距离和第四待处理距离的比值作为第二目标样本三元组的负样本与待判决分镜样本组之间的偏差比例;
噪声判决子单元1246,用于基于偏差比例和组内距离偏差以及噪声判决模型所维护的第一离群阈值参数,对第二目标样本三元组进行噪声判决,得到第二目标样本三元组的噪声判决结果,直到待处理样本三元组中的每个样本三元组均作为第二目标样本三元组时,得到待处理样本三元组中的每个样本三元组的噪声判决结果。
其中,待判决分镜确定子单元1241,分镜中心确定子单元1242,组内偏差确定子单元1243,距离确定子单元1244,偏差比例确定子单元1245和噪声判决子单元1246的具体实现方式,可以参见上述图3所对应实施例中对得到第二目标样本三元组的噪声判决结果的具体过程的描述,这里将不再继续进行赘述。
可选的,其中,与批次样本相关联的初始分类数据集包括第一分类数据集、第二分类数据集和第三分类数据集;第一分类数据集的可靠性优于第二分类数据集的可靠性,且第二分类数据集的可靠性优于第三分类数据集的可靠性;
样本三元组添加单元125,用于根据待处理样本三元组中的每个样本三元组的噪声判决结果,在待处理样本三元组中的每个样本三元组中,确定用于添加至第一分类数据集相关联的样本三元组、用于添加至第二分类数据集相关联的样本三元组和用于添加至第三分类数据集相关联的样本三元组;
阈值参数更新单元126,用于在与批次样本相关联的初始分类数据集中去除与第三分类数据集相关联的样本三元组,并将去除与第三分类数据集相关联的样本三元组后的初始分类数据集作为目标分类数据集,基于目标分类数据集中的样本三元组更新噪声判决模型所维护的第一离群阈值参数。
其中,三元组特征输出单元121,阈值参数确定单元122,迭代次数递增单元123和噪声判决单元124的具体实现方式,可以参见上述图3所对应实施例中对得到待处理样本三元组的噪声判决结果的具体过程的描述,这里将不再继续进行赘述。其中,样本三元组添加单元125和阈值参数更新单元126的具体实现方式,可以上述图3所对应实施例中对更新第一离群阈值参数的具体过程的描述,这里将不再继续进行赘述。
联合损失获取模块13,用于对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,根据待处理样本三元组的二值量化特征和噪声判决结果,对批次样本进行联合损失学习,以得到批次样本的联合损失;
联合损失获取模块13包括:编码特征确定单元131,迭代权重确定单元132,度量损失确定单元133,量化损失确定单元134和联合损失确定单元135;
编码特征确定单元131,用于对待处理样本三元组的三元组特征进行特征量化处理,得到待处理样本三元组的二值量化特征,对待处理样本三元组的二值量化特征进行特征编码处理,得到待处理样本三元组的二值编码特征;
迭代权重确定单元132,用于根据初始特征学习模型的迭代次数,确定第一分类数据集对应的第一迭代权重、第二分类数据集对应的第二迭代权重和第三分类数据集对应的第三迭代权重;
度量损失确定单元133,用于根据与第一分类数据集相关联的样本三元组的第一判决结果,确定与第一分类数据集相关联的样本三元组的第一度量损失,根据与第二分类数据集相关联的样本三元组的第二判决结果,确定与第二分类数据集相关联的样本三元组的第二度量损失,根据与第三分类数据集相关联的样本三元组的第三判决结果,确定与第三分类数据集相关联的样本三元组的第三度量损失;
度量损失确定单元133,还用于根据第一度量损失和第一迭代权重的乘积、第二度量损失和第二迭代权重的乘积以及第三度量损失和第三迭代权重的乘积,确定批次样本在迭代次数时的三元组度量损失;
量化损失确定单元134,用于基于待处理样本三元组的二值量化特征确定待处理样本三元组中的样本图像在目标量化维度上的量化值,基于待处理样本三元组的二值编码特征确定样本图像在目标量化维度上的编码值,基于样本图像在目标量化维度上的量化值和样本图像在目标量化维度上的编码值,确定样本图像在迭代次数时的量化损失;
联合损失确定单元135,用于根据批次样本在迭代次数时的三元组度量损失和样本图像在迭代次数时的量化损失,得到批次样本的联合损失。
其中,编码特征确定单元131,迭代权重确定单元132,度量损失确定单元133,量化损失确定单元134和联合损失确定单元135的具体实现方式,可以参见上述图3所对应实施例中对确定联合损失的具体过程的描述,这里将不再继续进行赘述。
目标模型确定模块14,用于根据联合损失调整初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
可选的,子空间构建模块15,用于在获取到全量分镜样本时,构建与全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;
其中,子空间构建模块15包括:分镜处理单元151,目标簇确定单元152,分镜图像抽取单元153和子空间确定单元154;
分镜处理单元151,用于获取用于分镜处理的样本视频,对样本视频进行分镜处理,得到与样本视频相关联的N’个分镜样本组,将N’个分镜样本组作为全量分镜样本;
分镜处理单元151,还用于基于N’个分镜样本组的标签信息,对N’个分镜样本组进行聚类处理,得到与全量分镜样本相关联的X个聚类簇;N’为正整数;X为正整数,且一个聚类簇对应一个标签信息;
其中,分镜处理单元151包括:标签信息预测子单元1511和聚类簇划分子单元1512;
标签信息预测子单元1511,用于将全量分镜样本所包含的N’个分镜样本组输入标签预测模型,由标签预测模型预测输出N’个分镜样本组中的每个分镜样本组的标签信息;每个分镜样本组的标签信息是在对应分镜样本组中的分镜图像的标签信息的累计标签量达到累计阈值时所确定的;累计阈值是由对应分镜样本组中的分镜图像的分镜数量所决定的;
聚类簇划分子单元1512,用于在N’个分镜样本组中,按照每个分镜样本组的标签信息,将具有同一标签信息的分镜样本组划分到同一聚类簇,以得到与全量分镜样本相关联的X个聚类簇。
其中,标签信息预测子单元1511和聚类簇划分子单元1512的具体实现方式,可以参见上述图3所对应实施例中对X个聚类簇额描述,这里将不再继续进行赘述。
目标簇确定单元152,用于从全量分镜样本中获取分镜样本组i,在X个聚类簇中,将从与分镜样本组i相关联的聚类簇中抽取的K个聚类簇分别作为目标聚类簇;其中,i为小于或者等于N’的正整数;目标聚类簇的数量为K个;
分镜图像抽取单元153,用于从K个目标聚类簇所对应的局部子空间中,抽取K*M个分镜图像作为第一分镜图像,基于抽取到的K*M个第一分镜图像,构建与分镜样本组i相关联的第一类负样本空间,并从X个聚类簇所对应的全局子空间中,抽取K*M个分镜图像作为第二分镜图像,基于抽取到的K*M个第二分镜图像构建与分镜样本组i相关联的第二类负样本空间;第一类负样本空间中的第一分镜图像与分镜样本组i中的分镜图像具有相同的标签信息;第二类负样本空间中的分镜图像与分镜样本组i中的分镜图像具有不同的标签信息;
子空间确定单元154,用于将第一类负样本空间和第二类负样本空间作为分镜样本组i的负样本挖掘子空间。
其中,分镜处理单元151,目标簇确定单元152,分镜图像抽取单元153和子空间确定单元154的具体实现方式,可以参见上述图3所对应实施例中对负样本挖掘子空间的描述,这里将不再继续进行赘述。
样本三元组构建模块16,用于基于全量分镜样本中的每个分镜样本组和与每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;
批次划分模块17,用于根据负样本挖掘子空间中的总负样本数量,对全量样本三元组中的样本三元组进行批次划分,得到与全量分镜样本相关联的批次样本。
可选的,待查询图像获取模块18,用于在获取到待查询图像时,通过目标特征学习模型对待查询图像进行特征度量学习,得到待查询图像的哈希特征,对待查询图像的哈希特征进行特征编码处理,将编码得到的待查询图像的二值编码特征作为待查询图像的待查询图像特征;
索引向量查询模块19,用于在与目标特征学习模型相关联的索引库中查询与待查询图像特征相匹配的索引向量,将索引向量所对应的量化中心作为目标量化中心,将与目标量化中心相关联的关联图像作为待查询图像对应的候选索引图像;
索引图像确定模块20,用于确定待查询图像的待查询图像特征和候选索引图像的哈希图像特征之间的汉明距离,对确定的汉明距离进行排序处理,从排序处理后的汉明距离中确定目标汉明距离,将目标汉明距离所对应的候选索引图像作为待查询图像对应的目标索引图像。
可选的,库存图像学习模块21,用于通过目标特征学习模型对库存图像进行特征度量学习,得到库存图像的哈希图像特征,对库存图像的哈希图像特征进行聚类处理,得到与库存图像相关联的Z个聚类簇;其中,Z为正整数;一个聚类簇对应一个聚类中心;
索引库构建模块22,用于将Z个聚类簇中的每个聚类簇对应的聚类中心作为每个聚类簇的量化中心,基于每个聚类簇的量化中心构建用于进行图像索引的索引库;
索引关系建立模块23,用于建立索引库中的量化中心与图像库中的库存图像之间的索引映射关系,基于索引映射关系将每个聚类簇中的库存图像作为与对应聚类簇的量化中心相关联的关联图像。
其中,样本三元组获取模块11、噪声判决模块12、联合损失获取模块13和目标模型确定模块14的具体实现方式,可以参见上述图3所对应实施例中对步骤S101-步骤S104的描述。此外,子空间构建模块15,样本三元组构建模块16,批次划分模块17,待查询图像获取模块18,索引向量查询模块19,索引图像确定模块20,库存图像学习模块21,索引库构建模块22和索引关系建立模块23的具体实现方式,可以参见上述图10所对应实施例中对步骤S201-步骤S210的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图16,图16是本申请实施例提供的一种计算机设备的示意图。如图16所示,该计算机设备1000可以为具备图像数据处理功能的计算机设备(如上述图1所示的服务器10或者用户终端100a),该计算机设备1000可以包括:至少一个处理器1001,例如,CPU,至少一个网络接口1004,用户接口1003,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,在一些可选实施例中,比如,计算机设备为用户终端时,用户接口1003可以包括显示屏(Display)、键盘(Keyboard),网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选地还可以是至少一个位于远离前述处理器1001的存储装置。如图16所示,作为一种计算机存储介质的存储器1005可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
在图16所示的计算机设备1000中,网络接口1004主要用于进行网络通信;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以执行上述图3和图10所对应实施例中对该图像数据处理方法的描述,也可执行前文图14所对应实施例中对该图像数据处理装置1的描述,还可以也可执行前文图15所对应实施例中对该图像数据处理装置2的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时实现图3和图10中各个步骤所提供的图像数据处理方法,具体可参见图3以及图10各个步骤所提供的实现方式,在此不再赘述。
计算机可读存储介质可以是前述任一实施例提供的数据传输装置或者计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmedia card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请一方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备可执行前文图3或者图10所对应实施例中对图像数据处理方法的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包括。例如包括了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程视频循环识别设备的处理器以产生一个机器,使得通过计算机或其他可编程视频循环识别设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程视频循环识别设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程视频循环识别设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (17)

1.一种图像数据处理方法,其特征在于,包括:
在获取到用于训练初始特征学习模型的批次样本时,将所述批次样本中的样本三元组作为待处理样本三元组;所述批次样本是通过对全量分镜样本中的每个分镜样本组的样本三元组进行批次划分所得到的;所述全量分镜样本是通过对样本视频进行分镜处理得到的,一个分镜样本组包括一个镜头内多张具有相似图像内容的分镜图像;所述待处理样本三元组包括锚点样本、正样本以及负样本,所述锚点样本和正样本属于同一分镜样本组中的分镜图像;所述锚点样本和所述负样本分别属于不同的分镜样本组;
将所述待处理样本三元组输入所述初始特征学习模型,由所述初始特征学习模型对所述待处理样本三元组进行特征提取和哈希量化处理,将所述初始特征学习模型所输出的所述待处理样本三元组的三元组特征作为第一迭代三元组特征;
在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据与所述批次样本相关联的初始分类数据集,确定所述噪声判决模型所维护的第一离群阈值参数;
基于所述初始分类数据集确定所述批次样本的初始联合损失,基于所述初始联合损失调整所述初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对所述初始特征学习模型的迭代次数进行递增处理;
将所述过渡特征学习模型所输出的所述待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将所述第二迭代三元组特征输入所述噪声判决模型,由所述噪声判决模型根据所述噪声判决模型所维护的第一离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果;
对所述待处理样本三元组的三元组特征进行特征量化处理,得到所述待处理样本三元组的二值量化特征,根据所述待处理样本三元组的二值量化特征和所述噪声判决结果,对所述批次样本进行联合损失学习,以得到所述批次样本的联合损失;
根据所述联合损失调整所述初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获取到全量分镜样本时,构建与所述全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间;
基于所述全量分镜样本中的每个分镜样本组和与所述每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组;
根据所述负样本挖掘子空间中的总负样本数量,对所述全量样本三元组中的样本三元组进行批次划分,得到与所述全量分镜样本相关联的批次样本。
3.根据权利要求2所述的方法,其特征在于,所述在获取到全量分镜样本时,构建与所述全量分镜样本中的每个分镜样本组相关联的负样本挖掘子空间,包括:
获取用于分镜处理的样本视频,对所述样本视频进行分镜处理,得到与所述样本视频相关联的N’个分镜样本组,将所述N’个分镜样本组作为所述全量分镜样本,基于所述N’个分镜样本组的标签信息,对所述N’个分镜样本组进行聚类处理,得到与所述全量分镜样本相关联的X个聚类簇;N’为正整数;X为正整数,且一个聚类簇对应一个标签信息;
从所述全量分镜样本中获取分镜样本组i,在所述X个聚类簇中,将从与所述分镜样本组i相关联的聚类簇中抽取的K个聚类簇分别作为目标聚类簇;其中,i为小于或者等于N’的正整数;所述目标聚类簇的数量为K个;
从K个所述目标聚类簇所对应的局部子空间中,抽取K*M个分镜图像作为第一分镜图像,基于抽取到的K*M个第一分镜图像,构建与分镜样本组i相关联的第一类负样本空间,并从所述X个聚类簇所对应的全局子空间中,抽取K*M个分镜图像作为第二分镜图像,基于抽取到的K*M个第二分镜图像构建与分镜样本组i相关联的第二类负样本空间;所述第一类负样本空间中的第一分镜图像与所述分镜样本组i中的分镜图像具有相同的标签信息;所述第二类负样本空间中的分镜图像与所述分镜样本组i中的分镜图像具有不同的标签信息;
将所述第一类负样本空间和所述第二类负样本空间作为所述分镜样本组i的负样本挖掘子空间。
4.根据权利要求3所述的方法,其特征在于,所述基于所述N’个分镜样本组的标签信息,对所述N’个分镜样本组进行聚类处理,得到与所述全量分镜样本相关联的X个聚类簇,包括:
将所述全量分镜样本所包含的所述N’个分镜样本组输入标签预测模型,由所述标签预测模型预测输出所述N’个分镜样本组中的每个分镜样本组的标签信息;所述每个分镜样本组的标签信息是在对应分镜样本组中的分镜图像的标签信息的累计标签量达到累计阈值时所确定的;所述累计阈值是由所述对应分镜样本组中的分镜图像的分镜数量所决定的;
在所述N’个分镜样本组中,按照所述每个分镜样本组的标签信息,将具有同一标签信息的分镜样本组划分到同一聚类簇,以得到与所述全量分镜样本相关联的X个聚类簇。
5.根据权利要求2所述的方法,其特征在于,所述全量分镜样本包括N’个分镜样本组,一个分镜样本组包含U个分镜图像;N’和U均为正整数;与所述每个分镜样本组相关联的负样本挖掘子空间均包括第一类负样本空间和第二类负样本空间;
所述基于所述全量分镜样本中的每个分镜样本组和与所述每个分镜样本组相关联的负样本挖掘子空间,构建用于训练初始特征学习模型的全量样本三元组,包括:
在所述全量分镜样本中的每个分镜样本组中获取目标分镜样本组;
在所述目标分镜样本组的U个分镜图像中选择一个分镜图像作为所述目标分镜样本组的锚点样本,并在所述目标分镜样本组的U个分镜图像中将除所述锚点样本之外的分镜图像作为所述目标分镜样本组的正样本,基于所述目标分镜样本组的锚点样本和所述目标分镜样本组的正样本,确定所述目标分镜样本组的正样本对;所述目标分镜样本组的正样本对的数量为U*(U-1)*1/2个;
在与所述目标分镜样本组相关联的负样本挖掘子空间中,抽取2*Nn个分镜图像作为所述目标分镜样本组的负样本;所述目标分镜样本组的负样本中包括Nn个难负样本和Nn个易负样本;所述Nn个难负样本是从与所述目标分镜样本组相关联的第一类负样本空间中所抽取到的;所述Nn个易负样本是从与所述目标分镜样本组相关联的第二类负样本空间中所抽取到的;
根据所述目标分镜样本组的正样本对和所述目标分镜样本组的负样本,构建得到所述目标分镜样本组的样本三元组,直到所述全量分镜样本中的每个分镜样本组均被作为所述目标分镜样本组时,得到所述每个分镜样本组的样本三元组;所述每个分镜样本组的样本三元组的数量均为U*(U-1)* Nn个;
将所述每个分镜样本组的样本三元组作为用于训练初始特征学习模型的全量样本三元组。
6.根据权利要求5所述的方法,其特征在于,与所述目标分镜样本组相关联的第一类负样本空间包括K*M个第一分镜图像;与所述目标分镜样本组相关联的第二类负样本空间包括K*M个第二分镜图像;K和M均为正整数;
所述方法还包括:
在所述目标分镜样本组的U个分镜图像中遍历选择一个分镜图像作为所述目标分镜样本组的正样本,并在所述目标分镜样本组的U个分镜图像中将除遍历到的所述正样本之外的分镜图像作为所述目标分镜样本组的锚点样本;
在所述K*M个第一分镜图像中查找与所述目标分镜样本组的锚点样本相同的第一分镜图像,将查找到的与所述目标分镜样本组的锚点样本相同的第一分镜图像作为辅助挖掘图像;
在所述K*M个第一分镜图像中将除所述辅助挖掘图像之外的第一分镜图像作为待挖掘图像;所述待挖掘图像的图像数量为(K*M-1)个;
确定所述辅助挖掘图像与(K*M-1)个所述待挖掘图像之间的第一汉明距离,将确定的最小第一汉明距离所对应的待挖掘图像作为所述辅助挖掘图像的局部难负样本,并确定所述辅助挖掘图像与K*M个第二分镜图像之间的第二汉明距离,将确定的最小第二汉明距离所对应的第二分镜图像作为所述辅助挖掘图像的全局难负样本;
基于所述辅助挖掘图像的局部难负样本和所述辅助挖掘图像的全局难负样本,在所述目标分镜样本组的负样本中更新所述目标分镜样本组的难负样本。
7.根据权利要求1所述的方法,其特征在于,所述将所述待处理样本三元组输入所述初始特征学习模型,由所述初始特征学习模型对所述待处理样本三元组进行特征提取和哈希量化处理,将所述初始特征学习模型所输出的所述待处理样本三元组的三元组特征作为第一迭代三元组特征,包括:
将所述待处理样本三元组输入所述初始特征学习模型的基础特征网络层,由所述基础特征网络层提取所述待处理样本三元组的基础特征;
将提取到的基础特征输入所述初始特征学习模型的哈希量化层,由所述哈希量化层对所述基础特征进行哈希量化处理;
将哈希量化处理所得到的哈希量化特征作为所述初始特征学习模型所输出的第一迭代三元组特征。
8.根据权利要求1所述的方法,其特征在于,所述在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据与所述批次样本相关联的初始分类数据集,确定所述噪声判决模型所维护的第一离群阈值参数,包括:
在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型将与所述待处理样本三元组相关联的分类数据集作为与所述批次样本相关联的初始分类数据集;
在所述初始分类数据集中,迭代记录所述待处理样本三元组中的负样本的初始离群阈值比例;
获取所述噪声判决模型在所述初始迭代阈值时的可靠性阈值,基于迭代记录的初始离群阈值比例和所述初始迭代阈值时的可靠性阈值,确定所述噪声判决模型在所述初始迭代阈值时的初始可靠性阈值,基于所述初始可靠性阈值,将所述噪声判决模型所维护的离群阈值参数作为第一离群阈值参数。
9.根据权利要求8所述的方法,其特征在于,所述在所述初始分类数据集中,迭代记录所述待处理样本三元组中的负样本的初始离群阈值比例,包括:
在所述初始分类数据集中,确定参与迭代的所述待处理样本三元组的三元组总数量,从所述待处理样本三元组中获取第一目标样本三元组的锚点样本和所述第一目标样本三元组的负样本,将所述第一目标样本三元组的锚点样本所在的分镜样本组作为待处理分镜样本组;
获取所述待处理分镜样本组中的U1个分镜图像,基于所述第一迭代三元组特征确定所述U1个分镜图像中的每个分镜图像的哈希特征向量,并将由所述每个分镜图像的哈希特征向量所确定的均值向量作为所述待处理分镜样本组的分镜样本中心;U1为正整数;
在所述待处理分镜样本组中的U1个分镜图像中,将查找到的与所述第一目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第一候选分镜图像,将所述第一目标样本三元组中的负样本与所述第一候选分镜图像之间的汉明距离作为第一待处理距离,并将所述第一目标样本三元组中的负样本与所述待处理分镜样本组的分镜样本中心之间的汉明距离作为第二待处理距离;
将所述第一待处理距离和所述第二待处理距离的比值作为所述第一目标样本三元组的负样本的待迭代离群阈值比例;
基于所述三元组总数量和所述第一目标样本三元组的负样本的待迭代离群阈值比例,确定所述待处理样本三元组中的负样本的初始离群阈值比例。
10.根据权利要求1所述的方法,其特征在于,所述将所述过渡特征学习模型所输出的所述待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将所述第二迭代三元组特征输入所述噪声判决模型,由所述噪声判决模型根据所述噪声判决模型所维护的第一离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果,包括:
将所述过渡特征学习模型所输出的所述待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将所述第二迭代三元组特征输入所述噪声判决模型,由所述噪声判决模型从所述待处理样本三元组中获取第二目标样本三元组的锚点样本和所述第二目标样本三元组的负样本,将所述第二目标样本三元组的锚点样本所在的分镜样本组作为待判决分镜样本组;
获取所述待判决分镜样本组中的U2个分镜图像,基于所述第二迭代三元组特征确定所述U2个分镜图像中的每个分镜图像的哈希特征向量,并将由所述每个分镜图像的哈希特征向量所确定的均值向量作为所述待判决分镜样本组的分镜样本中心;U2为正整数;
根据所述待判决分镜样本组中的U2个分镜图像分别与所述待判决分镜样本组的分镜样本中心之间的汉明距离,确定所述待判决分镜样本组对应的均值距离,将所述均值距离作为所述待判决分镜样本组的组内距离偏差;
在所述待判决分镜样本组中的U2个分镜图像中,将查找到的与所述第二目标样本三元组中的负样本具有最小汉明距离的分镜图像作为第二候选分镜图像,将所述第二目标样本三元组中的负样本与所述第二候选分镜图像之间的汉明距离作为第三待处理距离,并将所述第二目标样本三元组中的负样本与所述待判决分镜样本组的分镜样本中心之间的汉明距离作为第四待处理距离;
将所述第三待处理距离和所述第四待处理距离的比值作为所述第二目标样本三元组的负样本与所述待判决分镜样本组之间的偏差比例;
基于所述偏差比例和所述组内距离偏差以及所述噪声判决模型所维护的第一离群阈值参数,对所述第二目标样本三元组进行噪声判决,得到所述第二目标样本三元组的噪声判决结果,直到所述待处理样本三元组中的每个样本三元组均作为所述第二目标样本三元组时,得到所述待处理样本三元组中的每个样本三元组的噪声判决结果。
11.根据权利要求10所述的方法,其特征在于,与所述批次样本相关联的初始分类数据集包括第一分类数据集、第二分类数据集和第三分类数据集;所述第一分类数据集的可靠性优于所述第二分类数据集的可靠性,且所述第二分类数据集的可靠性优于所述第三分类数据集的可靠性;
所述方法还包括:
根据所述待处理样本三元组中的每个样本三元组的噪声判决结果,在所述待处理样本三元组中的每个样本三元组中,确定用于添加至所述第一分类数据集相关联的样本三元组、用于添加至所述第二分类数据集相关联的样本三元组和用于添加至所述第三分类数据集相关联的样本三元组;
在与所述批次样本相关联的初始分类数据集中去除与所述第三分类数据集相关联的样本三元组,并将去除与所述第三分类数据集相关联的样本三元组后的初始分类数据集作为目标分类数据集,基于所述目标分类数据集中的样本三元组更新所述噪声判决模型所维护的第一离群阈值参数。
12.根据权利要求1所述的方法,其特征在于,所述待处理样本三元组的噪声判决结果包括与第一分类数据集相关联的样本三元组的第一判决结果、与第二分类数据集相关联的样本三元组的第二判决结果和与第三分类数据集相关联的样本三元组的第三判决结果;所述第一分类数据集的可靠性优于所述第二分类数据集的可靠性,且所述第二分类数据集的可靠性优于所述第三分类数据集的可靠性;
所述对所述待处理样本三元组的三元组特征进行特征量化处理,得到所述待处理样本三元组的二值量化特征,根据所述待处理样本三元组的二值量化特征和所述噪声判决结果,对所述批次样本进行联合损失学习,以得到所述批次样本的联合损失,包括:
对所述待处理样本三元组的三元组特征进行特征量化处理,得到所述待处理样本三元组的二值量化特征,对所述待处理样本三元组的二值量化特征进行特征编码处理,得到所述待处理样本三元组的二值编码特征;
根据所述初始特征学习模型的迭代次数,确定所述第一分类数据集对应的第一迭代权重、所述第二分类数据集对应的第二迭代权重和所述第三分类数据集对应的第三迭代权重;
根据与所述第一分类数据集相关联的样本三元组的第一判决结果,确定与所述第一分类数据集相关联的样本三元组的第一度量损失,根据与所述第二分类数据集相关联的样本三元组的第二判决结果,确定与所述第二分类数据集相关联的样本三元组的第二度量损失,根据与所述第三分类数据集相关联的样本三元组的第三判决结果,确定与所述第三分类数据集相关联的样本三元组的第三度量损失;
根据所述第一度量损失和所述第一迭代权重的乘积、所述第二度量损失和所述第二迭代权重的乘积以及所述第三度量损失和所述第三迭代权重的乘积,确定所述批次样本在所述迭代次数时的三元组度量损失;
基于所述待处理样本三元组的二值量化特征确定所述待处理样本三元组中的样本图像在目标量化维度上的量化值,基于所述待处理样本三元组的二值编码特征确定所述样本图像在目标量化维度上的编码值,基于所述样本图像在目标量化维度上的量化值和所述样本图像在目标量化维度上的编码值,确定所述样本图像在所述迭代次数时的量化损失;
根据所述批次样本在所述迭代次数时的三元组度量损失和所述样本图像在所述迭代次数时的量化损失,得到所述批次样本的联合损失。
13.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获取到待查询图像时,通过所述目标特征学习模型对所述待查询图像进行特征度量学习,得到所述待查询图像的哈希特征,对所述待查询图像的哈希特征进行特征编码处理,将编码得到的所述待查询图像的二值编码特征作为所述待查询图像的待查询图像特征;
在与所述目标特征学习模型相关联的索引库中查询与所述待查询图像特征相匹配的索引向量,将所述索引向量所对应的量化中心作为目标量化中心,将与所述目标量化中心相关联的关联图像作为所述待查询图像对应的候选索引图像;
确定所述待查询图像的待查询图像特征和所述候选索引图像的哈希图像特征之间的汉明距离,对确定的汉明距离进行排序处理,从排序处理后的汉明距离中确定目标汉明距离,将所述目标汉明距离所对应的候选索引图像作为所述待查询图像对应的目标索引图像。
14.根据权利要求13所述的方法,其特征在于,所述索引库是基于图像库中的库存图像的哈希图像特征所确定的;
所述方法还包括:
通过所述目标特征学习模型对所述库存图像进行特征度量学习,得到所述库存图像的哈希图像特征,对所述库存图像的哈希图像特征进行聚类处理,得到与所述库存图像相关联的Z个聚类簇;其中,Z为正整数;一个聚类簇对应一个聚类中心;
将所述Z个聚类簇中的每个聚类簇对应的聚类中心作为所述每个聚类簇的量化中心,基于所述每个聚类簇的量化中心构建用于进行图像索引的所述索引库;
建立所述索引库中的量化中心与所述图像库中的库存图像之间的索引映射关系,基于所述索引映射关系将所述每个聚类簇中的库存图像作为与对应聚类簇的量化中心相关联的关联图像。
15.一种图像数据处理装置,其特征在于,包括:
样本三元组获取模块,用于在获取到用于训练初始特征学习模型的批次样本时,将所述批次样本中的样本三元组作为待处理样本三元组;所述批次样本是通过对全量分镜样本中的每个分镜样本组的样本三元组进行批次划分所得到的;所述全量分镜样本是通过对样本视频进行分镜处理得到的,一个分镜样本组包括一个镜头内多张具有相似图像内容的分镜图像;所述待处理样本三元组包括锚点样本、正样本以及负样本,所述锚点样本和正样本属于同一分镜样本组中的分镜图像;所述锚点样本和所述负样本分别属于不同的分镜样本组;
噪声判决模块,用于将所述待处理样本三元组输入所述初始特征学习模型,由所述初始特征学习模型对所述待处理样本三元组进行特征提取和哈希量化处理,将所述初始特征学习模型所输出的所述待处理样本三元组的三元组特征作为第一迭代三元组特征;
所述噪声判决模块,还用于在所述初始特征学习模型的迭代次数达到初始迭代阈值时,将所述第一迭代三元组特征输入与所述初始特征学习模型相关联的噪声判决模型,由所述噪声判决模型根据与所述批次样本相关联的初始分类数据集,确定所述噪声判决模型所维护的第一离群阈值参数;
所述噪声判决模块,还用于基于所述初始分类数据集确定所述批次样本的初始联合损失,基于所述初始联合损失调整所述初始特征学习模型的模型参数,将调整参数后的初始特征学习模型作为过渡特征学习模型,且对所述初始特征学习模型的迭代次数进行递增处理;
所述噪声判决模块,还用于将所述过渡特征学习模型所输出的所述待处理样本三元组的三元组特征作为第二迭代三元组特征,且在递增处理后的迭代次数达到目标迭代阈值时,将所述第二迭代三元组特征输入所述噪声判决模型,由所述噪声判决模型根据所述噪声判决模型所维护的第一离群阈值参数,对所述待处理样本三元组进行噪声判决,得到所述待处理样本三元组的噪声判决结果;
联合损失获取模块,用于对所述待处理样本三元组的三元组特征进行特征量化处理,得到所述待处理样本三元组的二值量化特征,根据所述待处理样本三元组的二值量化特征和所述噪声判决结果,对所述批次样本进行联合损失学习,以得到所述批次样本的联合损失;
目标模型确定模块,用于根据所述联合损失调整所述初始特征学习模型的模型参数,基于调整模型参数后的初始特征学习模型,得到用于对待查询图像进行特征度量学习的目标特征学习模型。
16.一种计算机设备,其特征在于,包括:处理器和存储器;
所述处理器与存储器相连,其中,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1-14任一项所述的方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-14任一项所述的方法。
CN202210060766.3A 2022-01-19 2022-01-19 一种图像数据处理方法、装置、计算机设备及存储介质 Active CN114077681B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210060766.3A CN114077681B (zh) 2022-01-19 2022-01-19 一种图像数据处理方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210060766.3A CN114077681B (zh) 2022-01-19 2022-01-19 一种图像数据处理方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114077681A CN114077681A (zh) 2022-02-22
CN114077681B true CN114077681B (zh) 2022-04-12

Family

ID=80284726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210060766.3A Active CN114077681B (zh) 2022-01-19 2022-01-19 一种图像数据处理方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114077681B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090117A (zh) * 2017-11-06 2018-05-29 北京三快在线科技有限公司 一种图像检索方法及装置,电子设备
CN110472067A (zh) * 2019-08-19 2019-11-19 腾讯科技(深圳)有限公司 知识图谱表示学习方法、装置、计算机设备及存储介质
WO2021114688A1 (zh) * 2019-12-10 2021-06-17 苏宁云计算有限公司 基于深度学习的视频处理方法及装置
CN113705811A (zh) * 2021-10-29 2021-11-26 腾讯科技(深圳)有限公司 模型训练方法、装置、计算机程序产品及设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11232328B2 (en) * 2020-01-31 2022-01-25 Element Ai Inc. Method of and system for joint data augmentation and classification learning
CN113392867A (zh) * 2020-12-09 2021-09-14 腾讯科技(深圳)有限公司 一种图像识别方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090117A (zh) * 2017-11-06 2018-05-29 北京三快在线科技有限公司 一种图像检索方法及装置,电子设备
CN110472067A (zh) * 2019-08-19 2019-11-19 腾讯科技(深圳)有限公司 知识图谱表示学习方法、装置、计算机设备及存储介质
WO2021114688A1 (zh) * 2019-12-10 2021-06-17 苏宁云计算有限公司 基于深度学习的视频处理方法及装置
CN113705811A (zh) * 2021-10-29 2021-11-26 腾讯科技(深圳)有限公司 模型训练方法、装置、计算机程序产品及设备

Also Published As

Publication number Publication date
CN114077681A (zh) 2022-02-22

Similar Documents

Publication Publication Date Title
CN107545889B (zh) 适用于模式识别的模型的优化方法、装置及终端设备
CN105912611B (zh) 一种基于cnn的快速图像检索方法
CN110728317A (zh) 决策树模型的训练方法、系统、存储介质及预测方法
CN110489507B (zh) 确定兴趣点相似度的方法、装置、计算机设备和存储介质
CN113298197B (zh) 数据聚类方法、装置、设备及可读存储介质
CN104573130A (zh) 基于群体计算的实体解析方法及装置
US20230401833A1 (en) Method, computer device, and storage medium, for feature fusion model training and sample retrieval
CN111639230B (zh) 一种相似视频的筛选方法、装置、设备和存储介质
CN113326377A (zh) 一种基于企业关联关系的人名消歧方法及系统
CN112214677B (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN116596095B (zh) 基于机器学习的碳排放量预测模型的训练方法及装置
CN113761219A (zh) 基于知识图谱的检索方法、装置、电子设备及存储介质
CN110751191A (zh) 一种图像的分类方法及系统
CN111241850B (zh) 提供业务模型的方法及装置
CN111310918B (zh) 一种数据处理方法、装置、计算机设备及存储介质
CN112069338A (zh) 图片处理方法、装置、电子设备及存储介质
CN114077681B (zh) 一种图像数据处理方法、装置、计算机设备及存储介质
CN114003648B (zh) 风险交易团伙的识别方法、装置、电子设备与存储介质
CN115102868A (zh) 一种基于SOM聚类与深度自编码器的web服务QoS预测方法
CN113822291A (zh) 一种图像处理方法、装置、设备及存储介质
CN116738009B (zh) 一种对数据进行归档回溯的方法
US11615345B2 (en) Systems and methods for optimizing a machine learning model
US11775871B1 (en) Optimizing machine learning based on embedding smart data drift
CN117058432B (zh) 图像查重方法、装置、电子设备及可读存储介质
CN116912627A (zh) 图神经网络模型的训练方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40065969

Country of ref document: HK