CN114863224A - 训练方法、图像质量检测方法、装置和介质 - Google Patents
训练方法、图像质量检测方法、装置和介质 Download PDFInfo
- Publication number
- CN114863224A CN114863224A CN202210783367.XA CN202210783367A CN114863224A CN 114863224 A CN114863224 A CN 114863224A CN 202210783367 A CN202210783367 A CN 202210783367A CN 114863224 A CN114863224 A CN 114863224A
- Authority
- CN
- China
- Prior art keywords
- image
- determining
- quality detection
- test image
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种训练方法、图像质量检测方法、装置和介质,其中的训练方法具体包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。本申请实施例可以节省测试图像的标注成本,且能够提高质量检测模型的准确度等性能。
Description
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种训练方法、图像质量检测方法、装置和介质。
背景技术
在计算机视觉技术领域中,目标识别模型可用于对图像中包含的人、动物、交通工具、字符等目标进行识别。在实际应用中,目标距离摄像头较远、光照条件恶劣以及图像采集装置的成像效果较差等原因,容易导致图像的清晰度较差且分辨率较低,从而影响目标识别效果。为了提升目标识别结果,可以在目标识别之前对图像进行质量检测,并阻挡质量较差的图像进入目标识别模型。
目前的图像质量检测方法,通常首先采用人工方式对图像样本进行标注,以得到带标签图像样本;再利用带标签图像样本,训练质量检测模型;接着利用质量检测模型进行图像质量检测。
在实际应用中,带标签图像样本的标注通常耗费大量的人力成本和时间成本。并且,对于同一个图像样本,不同的人往往给出不同的标签,这导致图像样本的标签的准确度较低;而质量检测模型的性能与标签的准确度密切相关,故标签的低准确度也降低了质量检测模型的性能。
发明内容
本申请实施例提供了一种训练方法,可以节省测试图像的标注成本,且能够提高质量检测模型的准确度等性能。
相应的,本申请实施例还提供了一种图像质量检测方法、一种训练装置、一种图像质量检测装置、一种电子设备和一种机器可读介质,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种训练方法,所述方法包括:
确定包含目标的标准图像;
确定所述标准图像对应的测试图像;
利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;
根据所述匹配度,确定所述测试图像的标签;
根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
为了解决上述问题,本申请实施例公开了一种图像质量检测方法,所述方法包括:
接收待识别图像;
利用质量检测模型,确定所述待识别图像对应的质量得分;
其中,所述质量检测模型的训练过程包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
为了解决上述问题,本申请实施例公开了一种训练装置,所述装置包括:
标准图像确定模块,用于确定包含目标的标准图像;
测试图像确定模块,用于确定所述标准图像对应的测试图像;
匹配度确定模块,用于利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;
标签确定模块,用于根据所述匹配度,确定所述测试图像的标签;
训练模块,用于根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
可选地,所述测试图像确定模块包括:
预设处理模块,用于对所述标准图像进行预设处理,以得到所述标准图像对应的测试图像;或者
获取模块,用于根据目标图像库中的图像标签,从目标图像库中获取所述标准图像对应的测试图像;
其中,所述预设处理包括如下处理中的至少一种:姿态处理、表情处理、亮度处理、清晰度处理和完整性处理。
可选地,所述标准图像确定模块包括:
选择模块,用于根据选择特征,从目标图像库中选择标准图像;
所述选择特征包括如下特征中的至少一种:场景特征、亮度特征、对比度特征、清晰度特征、完整性特征、阴影特征、曝光特征、眼镜特征、化妆特征、遮挡特征、变换特征、图像类型特征和编辑特征。
可选地,所述质量检测模型包括:特征提取单元和质量得分确定单元;所述特征提取单元用于对测试图像进行特征提取;所述质量得分确定单元用于根据所述特征提取单元输出的图像特征,确定所述测试图像的质量得分。
可选地,所述装置还包括:
预训练模块,用于在训练模块根据所述测试图像及测试图像的标签,对质量检测模型进行训练之前,根据目标识别的训练图像集,对所述特征提取单元进行预训练;在完成所述预训练后,得到所述特征提取单元的第一参数的第一目标值。
可选地,所述特征提取单元之后连接有目标识别单元;所述目标识别单元用于根据所述特征提取单元输出的图像特征,确定对应的目标识别结果;在预训练过程中,根据所述训练图像集的标签与所述目标识别结果确定误差信息,并根据所述误差信息对所述特征提取单元的第一参数进行更新。
为了解决上述问题,本申请实施例公开了一种图像质量检测装置,所述装置包括:
接收模块,用于接收待识别图像;
质量检测模块,用于利用质量检测模型,确定所述待识别图像对应的质量得分;
其中,所述质量检测模型的训练过程包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
可选地,所述装置还包括:
发送模块,用于在所述待识别图像对应的质量得分超过得分阈值的情况下,向目标识别模型发送所述待识别图像,以使所述目标识别模型对所述待识别图像进行目标识别。
本申请实施例还公开了一种电子设备,包括:处理器;和存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如本申请实施例所述的方法。
本申请实施例还公开了一种机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如本申请实施例所述的方法。
本申请实施例包括以下优点:
在本申请实施例的技术方案中,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。其中,目标识别模型可以为质量检测模型的下游模型,目标识别模型对于测试图像的识别结果具体为:标准图像与测试图像之间的匹配度;故目标识别模型对于测试图像的识别结果与测试图像的质量相关。通常来说,识别结果表征的、测试图像与表征图像之间的匹配度越高,则测试图像的质量越高;或者,识别结果表征的、测试图像与标准图像之间的匹配度越低,则测试图像的质量越低。
附图说明
图1是本申请一个实施例的图像处理系统的结构示意图;
图2是本申请一个实施例的训练方法的步骤流程示意图;
图3是本申请一个实施例的质量检测模型的结构示意图;
图4是本申请一个实施例的目标识别模型的结构示意图;
图5是本申请一个实施例的训练方法的流程示意图;
图6是本申请一个实施例的训练方法的步骤流程示意图;
图7是本申请一个实施例的图像质量检测方法的步骤流程示意图;
图8是本申请一个实施例的训练装置的结构示意图;
图9是本申请一个实施例的图像质量检测装置的结构示意图;
图10是本申请一个实施例提供的装置的结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
本申请实施例可以应用于目标识别场景。在目标识别场景中,可由目标识别模型对图像中包含的人、动物、交通工具、字符等目标进行识别。
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。通常采用摄像机或摄像头采集含有人脸的图像,并自动在图像中识别人脸,可广泛应用于身份识别、活体检测、唇语识别、创意相机、人脸美化、社交平台等场景中。
人脸识别的准确率,会受到拍照姿势(正面或侧面)、光线(白天或夜晚)、遮挡物(头发、眼镜、胡须)等多种因素特征的影响。为了提升人脸识别结果,可以在人脸识别之前对图像进行质量检测,并阻挡质量较差的图像进入人脸识别模型。
目前的图像质量检测方法,通常利用带标签图像样本,训练质量检测模型,并利用质量检测模型进行图像质量检测。
在实际应用中,带标签图像样本的标注通常耗费大量的人力成本和时间成本。并且,图像质量所关心的姿态、表情、亮度、清晰度等因素特征,则没有明确的标准规范;对于同一个图像样本,不同的人往往给出不同的标签,这导致图像样本的标签的准确度较低;而质量检测模型的性能与标签的准确度密切相关,故标签的低准确度也降低了质量检测模型的性能。
针对带标签图像样本的标注成本高、以及标签的低准确度降低质量检测模型的性能的技术问题,本申请实施例提供了一种训练方法,该方法具体可以包括:
确定包含目标的标准图像;
确定该标准图像对应的测试图像;
利用目标识别模型,确定该标准图像与该测试图像之间的匹配度,其中,目标识别模型对于测试图像的识别结果与测试图像的质量相关;
根据该匹配度,确定该测试图像的标签;
根据该测试图像及测试图像的标签,对质量检测模型进行训练;该质量检测模型用于确定该测试图像对应的质量得分;在该质量检测模型的训练过程中,根据该标签与该质量得分确定损失信息,并根据该损失信息对该质量检测模型的参数进行更新。
本申请实施例中,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。其中,目标识别模型为质量检测模型的下游模型,目标识别模型对于测试图像的识别结果具体为:标准图像与测试图像之间的匹配度;故目标识别模型对于测试图像的识别结果与测试图像的质量相关。通常来说,识别结果表征的、测试图像与表征图像之间的匹配度越高,则测试图像的质量越高;或者,识别结果表征的、测试图像与标准图像之间的匹配度越低,则测试图像的质量越低。
参照图1,示出了本申请一个实施例的图像处理系统的结构示意图,该图像处理系统可以包括:质量检测模型101和目标识别模型102。
其中,质量检测模型101可以接收待识别图像,确定待识别图像对应的质量得分,并在待识别图像对应的质量得分超过得分阈值的情况下,向目标识别模型102发送所述待识别图像。在待识别图像对应的质量得分不超过得分阈值的情况下,可以对待识别图像进行丢弃、或者提示等处理。
目标识别模型102可以对质量得分超过得分阈值的待识别图像进行目标识别,以得到对应的目标识别结果。
本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。
因此,本申请实施例的质量检测模型可以在目标识别之前对图像进行质量检测,并有效阻挡质量较差的图像进入目标识别模型,进而能够提高目标识别模型的准确度。
方法实施例一
参考图2,示出了本申请一个实施例的训练方法的步骤流程示意图,该方法具体可以包括如下步骤:
步骤201、确定包含目标的标准图像;
步骤202、确定该标准图像对应的测试图像;
步骤203、利用目标识别模型,确定该标准图像与该测试图像之间的匹配度;
步骤204、根据该匹配度,确定该测试图像的标签;
步骤205、根据该测试图像及测试图像的标签,对质量检测模型进行训练;该质量检测模型用于确定该测试图像对应的质量得分;在该质量检测模型的训练过程中,根据该标签与该质量得分确定损失信息,并根据该损失信息对该质量检测模型的参数进行更新。
图2所示方法实施例一用于对质量检测模型的训练过程进行说明。
本申请实施例的质量检测模型可用于根据输入的图像,输出对应的质量得分。在训练过程中,输入的图像可以是测试图像。在质量检测过程中,输入的图像可以是待识别图像,可以理解,本申请实施例对于输入的具体图像不加以限制。
本申请实施例中,对于质量检测模型而言,输入的图像可以是经过尺寸归一化的图像,输入的图像的尺寸可以为预设尺寸。该预设尺寸可以与目标相匹配。以目标为人脸为例,预设尺寸可以为112×112,也即,输入的图像可以为长112宽112的图像。
本申请实施例可以对数学模型进行训练,以得到质量检测模型。可采用机器学习、深度学习方法等方法进行数学模型的训练,机器学习方法可包括:线性回归、决策树、随机森林等,深度学习方法可包括:CNN(卷积神经网络,Convolutional Neural Networks)、LSTM(长短期记忆网络,Long Short-Term Memory)、GRU(门控循环单元,Gated RecurrentUnit)等。
参照图3,示出了本申请一个实施例的质量检测模型的结构示意图,该质量检测模型具体可以包括:特征提取单元301和质量得分确定单元302。
其中,特征提取单元301用于对输入的图像(如测试图像、或待识别图像)进行特征提取;质量得分确定单元302用于根据特征提取单元301输出的图像特征,确定输入的图像的质量得分。
特征提取单元301得到的图像特征可以是深层次的图像特征。特征提取单元301可以是主干(backbone)网络,可以包括:VGG(视觉几何群网络,Visual Geometry GroupNetwork)、ResNet(残差网络,Residual Network)、轻量级网络等。可以理解,本申请实施例对于第一特征提取单元101对应的具体网络不加以限制。
其中,残差网络可以为卷积网络。卷积网络可以是一种深度前馈人工神经网络,在图像识别中具有较好的性能表现。卷积网络具体可以包括卷积层(convolutional layer)和池化层(pooling layer)。卷积层用于从输入的图像中自动抽取特征,得到特征图(feature map)。池化层用于对特征图进行池化处理,以减少特征图中的特征数量。池化层的池化处理可以包括:最大池化、或者平均池化、或者随机池化等方式,其可根据实际需求选择合适的方式。
轻量级网络可以采用深度可分离卷积(depthwise separable convolution),其具体可以包括:DW(深层,depthwise)卷积和PW (逐点,pointwise)卷积,用来提取特征feature map。其中,深层卷积改变特征图的大小,不改变通道数;逐点卷积不改变featuremap的大小,改变通道数。因此,相比常规的卷积操作,深度可分离卷积能够降低参数数量和运算成本。
质量得分确定单元302可以是FC(全连接层,Fully connected layers)。FC可以对特征提取单元301输出的图像特征进行融合,以得到输入的图像的质量得分。
可以理解,特征提取单元301和质量得分确定单元302只是作为质量检测模型的结构的示例,实际上,任意结构的质量检测模型均可以适用于本申请实施例的训练方法。本申请实施例的改进在于输入到质量检测模型的测试图像的自动标注,而对质量检测模型的具体结构不加以限制。自动标注可以指,自动确定测试图像的标签。自动标注可以由计算机系统执行,可以不借助于人工干预。
在步骤201中,标准图像可以是图像质量符合预设高质量条件的图像。预设高质量条件可以包括:质量得分为得分上限值等。本领域技术人员可以根据实际应用需求,确定质量得分的范围,例如,质量得分的范围为[得分下限值,得分上限值],通常,质量得分的数值越大,则对应的图像质量越高,其中,得分上限值对应的图像质量可以高于得分下限值对应的图像质量。例如,得分上限值可以为1,得分下限值可以为0或-1。
本申请实施例可以根据选择特征,从目标图像库中选择标准图像。目标图像库中可以保存有包含目标的图像。目标图像库中的图像可以对应有目标ID(标识,Identity)。
上述选择特征可以包括如下特征中的至少一种:场景特征、亮度特征、对比度特征、清晰度特征、完整性特征、阴影特征、曝光特征、眼镜特征、化妆特征、遮挡特征、变换特征、图像类型特征和编辑特征。
本申请实施例可以根据选择特征,从目标图像库中选择图像质量符合预设高质量条件的标准图像。
本申请实施例可以针对选择特征,分别设置对应的选择条件。
标准图像标准对应的场景特征可以与目标识别模型对应的场景特征相匹配。例如,目标识别模型可以对应的场景特征集合,则标准图像标准对应的场景特征可以位于场景特征集合中。场景特征集合可以包括:闸机、考勤、监控等,可以理解,本申请实施例对于具体的场景特征不加以限制。
例如,亮度特征对应的选择条件可以包括:亮度均匀,也即,亮度上限值与亮度下限值之间的差值小于差值阈值。
又如,对比度特征对应的选择条件可以包括:对比度适中,也即对比度值在预设范围内。
再如,清晰度特征对应的选择条件可以包括:五官轮廓清晰等。
又如,完整性特征对应的选择条件可以包括:图像中包含完整的目标。
或者,阴影特征对应的选择条件可以包括:无阴影。
或者,曝光特征对应的选择条件可以包括:无逆光、无过曝光和无欠曝光等。
或者,眼镜特征对应的选择条件可以包括:眼镜框不遮挡眼睛,镜片无反光等。
或者,化妆特征对应的选择条件可以包括:无化妆。
或者,遮挡特征对应的选择条件可以包括:目标部位(如脸部)无遮挡。
或者,变换特征对应的选择条件可以包括:目标(如人脸)的水平转动角、俯仰角和倾斜角均在5度以内、或者无变形扭曲。
或者,图像类型特征对应的选择条件可以包括:证件照图像。
或者,编辑特征对应的选择条件可以包括:无编辑修改等。
在实际应用中,可以根据上述选择特征中的一种或多种,从目标图像库中选择多个标准图像。例如,可以从目标图像库中读取图像,并判断读取的图像是否与一种或多种选择特征相匹配,若是,则将读取的图像作为标准图像。又如,可以从目标图像库中读取图像,并判断所读取图像的图像标签是否与一种或多种选择特征相匹配,若是,则将读取的图像作为标准图像。
除了从目标图像库中选择标准图像之外,还可以根据选择特征或预设高质量条件,基于图像采集得到标准图像。假设步骤201中得到了M个标准图像,M可以为正整数,例如,M的数量级可以为千。
在步骤202中,标准图像与测试图像可以具有相关特征。相关特征可以包括:目标标识相同或场景特征相同。并且,测试图像的质量得分可以低于标准图像的质量得分。因此,测试图像可以是与标准图像相关且质量得分低于标准图像的图像。当然,测试图像也可以与标准图像无关,此种情况下,测试图像可以是质量得分低于标准图像的图像。
本申请实施例可以提供确定所述标准图像对应的测试图像的如下确定方式:
确定方式1、对该标准图像进行预设处理,以得到该标准图像对应的测试图像;或者
确定方式2、根据目标图像库中的图像标签,从目标图像库中获取该标准图像对应的测试图像;
其中,该预设处理可以包括如下处理中的至少一种:姿态处理、表情处理、亮度处理、清晰度处理和完整性处理。
在实际应用中,姿态、表情、亮度、清晰度、完整性等因素特征,容易使图像质量下降。因此,确定方式1可以根据上述因素特征,对标准图像进行相应的预设处理,以得到质量下降的测试图像。换言之,可以根据上述因素特征,对标准图像进行姿态变换、表情变换、亮度改变、清晰度改变和完整性下调中的一种或多种,以得到测试图像。
对于确定方式2、目标图像库中的图像标签可以包含图像的特征信息。参照表1,示出了本申请实施例的一种目标图像库的示例,该目标图像库可以包括:图像ID、目标ID和图像标签等信息。其中,图像0001至图像0006对应了相同的目标1,但由于图像0001的图像标签为“高清证件照”,故图像0001可以作为标准图像。而图像0002的图像标签“模糊”对应了因素特征“清晰度”,图像0003的图像标签“亮度低”对应了因素特征“亮度”,图像0004的图像标签“眼镜遮挡”对应了因素特征“完整性”,图像0005的图像标签“目标不完整”对应了因素特征“完整性”,图像0006的图像标签“侧脸”对应了因素特征“姿态”。
表1
在实际应用中,目标图像库中可以保存有一个目标对应的多个图像,多个图像可以分别对应有图像标签。根据图像标签,可以确定标准图像或测试图像。因此,确定方式2可以对目标图像库中图像的图像标签与因素特征进行匹配,并将匹配成功的图像作为该标准图像对应的测试图像。
测试图像与标准图像可以对应相同的目标ID。因此,在对目标图像库中图像的图像标签与因素特征进行匹配之前,可以首先从目标图像库中获取与标准图像属于相同的目标ID的备选测试图像,然后,对备选测试图像的图像标签与因素特征进行匹配,并将匹配成功的目标备选测试图像作为该标准图像对应的测试图像。假设步骤202中针对1个标准图像得到了N个测试图像,N可以为正整数,例如,N的数量级可以为千;则M个标准图像对应的测试图像的数量可以为M*N。
在步骤203中,可以利用目标识别模型,确定该标准图像与该测试图像之间的匹配度。一个标准图像及一个测试图像可以对应一个图像对,则本申请实施例的图像对的数量可以为M*N。换言之,本申请实施例可以利用目标识别模型,确定M*N个图像对分别对应的匹配度。
目标识别模型可用于对输入的待识别图像进行目标识别,得到的目标识别结果中可以包括:待识别图像包含的目标信息、或者待识别图像不包含任何目标。以目标为人脸为例,人脸识别模型可以判断待识别图像包含的人脸属于人脸数据集中的哪一个人。
参照图4,示出了本申请一个实施例的目标识别模型的结构示意图,该目标识别模型可以包括:图像特征提取单元401和目标识别单元402。
其中,图像特征提取单元401可用于提取待识别图像的第一特征向量。图像特征提取单元与特征提取单元301的结构类似,也可以采用卷积网络的结构,在此不作赘述,可以参照特征提取单元301的结构。
目标识别单元402可用于确定第一特征向量与目标数据集(如人脸数据集)的第二特征向量之间的匹配度,该匹配度可用于判断待识别图像与目标数据集中的哪个目标相匹配,进而可以确定待识别图像包含的目标。例如,目标识别单元402可以确定第一特征向量与第二特征向量之间的欧氏距离或余弦距离。以欧式距离为例,对于同一个目标的两个图像,对应的两个特征向量之间的欧氏距离应该比较小;反之,对于不同目标的两个图像,对应的两个特征向量之间的欧氏距离应该比较大。
目标识别单元402可以包括:归一化模块和映射模块。其中,映射模块可以将第一特征向量与第二特征向量映射到向量空间中,例如将第一特征向量与第二特征向量分别的特征值映射到一个球面上,球面上两个点的距离大小就可以用来表示匹配度。
可以理解,图像特征提取单元401和目标识别单元402只是作为目标识别模型的结构的示例,实际上,任意结构的目标识别模型均可以适用于本申请实施例的训练方法。本申请实施例的改进在于质量检测模型的测试图像的自动标注,而对目标识别模型的具体结构不加以限制。
本申请实施例对于目标识别模型的训练集不加以限制。例如,为了提高目标识别模型的泛化能力,可以增加目标识别模型的场景特征集合的范围。又如,目标识别模型与质量检测模型可以使用相同的目标图像库。
本申请实施例可以将测试图像及标准图像输入目标识别模型,目标识别模型可以确定测试图像对应的第三特征向量,以及确定标准图像对应的第四特征向量,并确定第三特征向量与第四特征向量之间的匹配度。该匹配度可以表征该标准图像与该测试图像之间的匹配程度或相似程度,进而可用于确定该测试图像的标签。通常,该匹配度对应的数值越大,则该标准图像与该测试图像之间的匹配程度或相似程度越高;反之,该匹配度对应的数值越小,则该标准图像与该测试图像之间的匹配程度或相似程度越低。
在步骤204中,该测试图像的标签可以表征测试图像的图像质量,该测试图像的标签可以起到测试图像的质量得分的作用。传统技术中,通常由人工利用肉眼来确定一个图像的标签。而本申请实施例构造了测试图像,并利用目标识别模型自动确定测试图像的标签。
本申请实施例可以直接将该匹配度,作为该测试图像的标签。假设匹配度的数值范围与质量得分的数值范围相同,则可以直接将该匹配度,作为该测试图像的标签。假设匹配度的数值范围与质量得分的数值范围相同,均为[0,1],则可以将匹配度作为该测试图像的标签。
或者,在匹配度的数值范围与质量得分的数值范围相同的情况下,可以将匹配度从匹配度的数值范围映射到质量得分的数值范围,以得到该测试图像的标签。
本申请实施例可以采用归一化方法,将匹配度从匹配度的数值范围映射到质量得分的数值范围。假设质量得分的数值范围为[0,1],匹配度的数值范围为[Xmin,Xmax],则归一化过程如公式(1)所示:
其中,X表示一个测试图像对应的匹配度,Xnorm一个测试图像对应的归一化结果,该归一化结果可以作为这个测试图像的标签。
在步骤205中,可以根据该测试图像及测试图像的标签,对质量检测模型进行训练;该质量检测模型用于确定该测试图像对应的质量得分;在该质量检测模型的训练过程中,根据该标签与该质量得分确定损失信息,并根据该损失信息对该质量检测模型的参数进行更新。由于该测试图像的标签可以起到测试图像的质量得分的作用;而在该质量检测模型的训练过程中,会根据该标签与该质量检测模型确定的质量得分,确定损失信息(该损失信息可以为标签与确定的质量得分的差异信息);并且,根据该损失信息对该质量检测模型的参数进行更新,会将质量检测模型的参数朝着损失信息减小的方向更新。因此,随着质量检测模型的参数的更新,损失信息会逐渐降低,以达到需求;此种情况下,质量检测模型确定的质量得分与标签是相接近的,这样,质量检测模型具备了准备确定质量得分的能力,可以在目标识别过程中对待识别图像进行准确的质量检测。
本申请实施例可以在质量检测模型的训练过程中,更新质量检测模型的参数。质量检测模型的参数可以包括:特征提取单元的第一参数和质量得分确定单元的第二参数等。
质量检测模型的训练数据可以包括:训练图像及其对应的标签。其中训练图像可以包括:测试图像。当然,训练图像还可以包括:标准图像。标准图像的标签可以根据标准图像的质量得分得到,标准图像的质量得分可以为得分上限值。
质量检测模型的训练过程可以包括:前向传播和反向传播。
其中,前向传播(Forward Propagation)可以根据质量检测模型的参数,按照从输入层到输出层的顺序,依次计算最后得到输出信息(测试图像对应的质量得分)。其中,输出信息可用于确定损失信息。
反向传播(Backward Propagation)可以根据损失信息,按照从输出层到输入层的顺序,依次计算并对质量检测模型的参数进行更新。质量检测模型通常采用神经网络的结构,质量检测模型的参数可以包括:神经网络的权重等参数。其中,反向传播过程中,可以确定质量检测模型的参数的梯度信息,并利用该梯度信息,对质量检测模型的参数进行更新。例如,反向传播可以依据微积分中的链式法则,沿着从输出层到输入层的顺序,依次计算并存储质量检测模型的处理层(包括输入层、中间层和输出层)的参数的梯度信息。
本申请实施例可以经由损失函数表征损失信息与质量检测模型的参数之间的映射关系。在实际应用中,可以对质量检测模型的参数求偏导数,把求得的参数的偏导数以向量的形式写出来,偏导数对应的向量可以称为参数对应的梯度信息。可以根据梯度信息及步长信息,得到参数对应的更新量。
公式(2)示出了损失函数的一种示例:
其中,L表示损失信息,xi表示第i个训练图像,n表示训练图像的数量,yi表示第i个训练图像的标签,f(xi)表示质量检测模型针对第i个训练图像输出的质量得分,表示质量检测模型的参数,是正则项的参数。正则项的引入可以在一定程度上防止质量检测模型的参数的过拟合问题。可以理解,公式(2)只是损失函数的示例,本领域技术人员可以根据实际应用需求,采用其他损失函数。
质量检测模型的参数的更新方法可以包括:梯度下降法、或牛顿法、或拟牛顿法、或共轭梯度法等,可以理解,本申请实施例对于具体的更新方法不加以限制。
在采用梯度下降法的情况下,可以采用批量梯度下降法、随机梯度下降法、或者小批量梯度下降法等。在具体实现中,可以根据训练图像进行迭代。上述迭代的收敛条件可以为:损失信息符合第一预设条件。第一预设条件可以为:损失信息与第一预设值之间的差值绝对值小于差值阈值,或者,迭代次数超过第一次数阈值等。换言之,在损失信息符合第一预设条件的情况下,可以结束迭代;此种情况下,可以得到质量检测模型的目标参数值。
综上,本申请实施例的质量检测模型的训练方法,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。
方法实施例二
为了提升质量检测模型的收敛(损失信息符合第一预设条件)速度,本申请实施例可以首先利用目标识别任务,对质量检测模型的特征提取单元进行预训练;在目标识别任务收敛后,再利用质量检测任务,对质量检测模型的特征提取单元和质量得分确定单元进行训练,直至质量检测任务收敛(损失信息符合第一预设条件)。
参照图5,示出了本申请一个实施例的训练方法的流程示意图,其中,在预训练阶段,可以在特征提取单元后连接目标识别单元。特征提取单元和目标识别单元可用于执行目标识别任务。目标识别任务的训练数据可以包括:目标识别的训练图像集。该训练图像集可以源自上述目标图像库,且可以覆盖对应的场景特征集合。
在预训练过程中,特征提取单元可以对训练图像集进行特征提取;该目标识别单元用于根据特征提取单元输出的图像特征,确定对应的目标识别结果。在预训练过程中,根据训练图像集的标签与目标识别结果确定误差信息,并根据该误差信息进行反向传播,对应的反向传播可以包括:对目标识别单元的参数进行更新、以及对特征提取单元的第一参数进行更新等。对于目标识别任务而言,训练图像集的标签可以包括:训练图像所对应的目标ID,而目标图像库中可以记录有图像对应的目标ID,因此,可以根据目标图像库中记录的目标ID,确定训练图像集的标签,所以训练图像集的标签的标注成本较低。
在完成预训练后,可以得到特征提取单元的第一参数的第一目标值。完成预训练可以等同于:目标识别任务收敛,目标识别任务的收敛条件可以包括:误差信息符合第二预设条件。第二预设条件可以为:误差信息与第二预设值之间的差值绝对值小于差值阈值,或者,迭代次数超过第二次数阈值等。换言之,在误差信息符合第二预设条件的情况下,目标识别任务收敛,完成预训练。由于目标识别任务对应的预训练过程与步骤205中图像检测任务的训练过程类似,故在此不作赘述,相互参照即可。
在质量检测任务对应的训练阶段,第一目标值可以作为特征提取单元的第一参数的初始值,故可以在第一目标值的基础上进行质量检测任务对应的训练,具体参照图2所示方法,在此不作赘述。
本申请实施例利用目标识别任务进行特征提取单元的预训练,可以让特征提取单元更好更快地提取与目标相关的特征,这样,在进行质量检测任务对应的训练过程中,特征提取单元所在的质量检测模型能够更快地完成收敛,因此,本申请实施例的预训练能够提升质量检测模型的收敛速度。
参考图6,示出了本申请一个实施例的训练方法的步骤流程示意图,该方法具体可以包括如下步骤:
步骤601、根据目标识别的训练图像集,对质量检测模型的特征提取单元进行预训练;在完成该预训练后,得到该特征提取单元的第一参数的第一目标值;
步骤602、确定包含目标的标准图像;
步骤603、确定该标准图像对应的测试图像;
步骤604、利用目标识别模型,确定该标准图像与该测试图像之间的匹配度;
步骤605、根据该匹配度,确定该测试图像的标签;
步骤606、根据该测试图像及测试图像的标签,对质量检测模型进行训练;该质量检测模型用于确定该测试图像对应的质量得分;在该质量检测模型的训练过程中,该特征提取单元的第一参数的初始值为第一目标值,根据该标签与该质量得分确定损失信息,并根据该损失信息对该质量检测模型的参数进行更新。
综上,本申请实施例的训练方法,利用目标识别任务进行特征提取单元的预训练,可以让特征提取单元更好更快地提取与目标相关的特征,这样,在进行质量检测任务对应的训练过程中,特征提取单元所在的质量检测模型能够更快地完成收敛,因此,本申请实施例的预训练能够提升质量检测模型的收敛速度。
方法实施例三
本实施例对质量检测模型的质量检测过程进行说明,质量检测模型可以对待识别图像进行质量检测,以得到对应的质量得分。
参考图7,示出了本申请一个实施例的质量检测方法的步骤流程示意图,该方法具体可以包括如下步骤:
步骤701、接收待识别图像;
步骤702、利用质量检测模型,确定该待识别图像对应的质量得分;
其中,该质量检测模型的训练过程具体可以包括:确定包含目标的标准图像;确定该标准图像对应的测试图像;利用目标识别模型,确定该标准图像与该测试图像之间的匹配度;根据该匹配度,确定该测试图像的标签;根据该测试图像及测试图像的标签,对质量检测模型进行训练;该质量检测模型用于确定该测试图像对应的质量得分;在该质量检测模型的训练过程中,根据该标签与该质量得分确定损失信息,并根据该损失信息对该质量检测模型的参数进行更新。
步骤701中的待识别图像可以源自图像采集装置。其中,图像装置可以采集视频,此种情况下可以从视频中提取视频帧,作为待识别图像。或者,图像装置可以采集图像,此种情况下,采集装置采集的图像可以作为待识别图像。
在步骤702中,质量检测模型可以按照图3所示的流程,对待识别图像进行质量检测。具体而言,质量检测模型中的特征提取单元可以对待识别图像进行特征提取;质量检测模型中的质量得分确定单元可以根据特征提取单元输出的图像特征,确定输入的图像的质量得分。
可选地,该方法还可以包括:在该待识别图像对应的质量得分超过得分阈值的情况下,向目标识别模型发送该待识别图像,以使该目标识别模型对该待识别图像进行目标识别。
综上,本申请实施例的质量检测方法,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
在上述实施例的基础上,本实施例还提供了一种训练装置,参照图8,该训练装置具体可以包括:标准图像确定模块801、测试图像确定模块802、匹配度确定模块803、标签确定模块804和训练模块805。
其中,标准图像确定模块801,用于确定包含目标的标准图像;
测试图像确定模块802,用于确定所述标准图像对应的测试图像;
匹配度确定模块803,用于利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;
标签确定模块804,用于根据所述匹配度,确定所述测试图像的标签;
训练模块805,用于根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
可选地,所述测试图像确定模块802包括:
预设处理模块,用于对所述标准图像进行预设处理,以得到所述标准图像对应的测试图像;或者
获取模块,用于根据目标图像库中的图像标签,从目标图像库中获取所述标准图像对应的测试图像;
其中,所述预设处理包括如下处理中的至少一种:姿态处理、表情处理、亮度处理、清晰度处理和完整性处理。
可选地,所述标准图像确定模块801包括:
选择模块,用于根据选择特征,从目标图像库中选择标准图像;
所述选择特征可以包括如下特征中的至少一种:场景特征、亮度特征、对比度特征、清晰度特征、完整性特征、阴影特征、曝光特征、眼镜特征、化妆特征、遮挡特征、变换特征、图像类型特征和编辑特征。
可选地,所述质量检测模型可以包括:特征提取单元和质量得分确定单元;所述特征提取单元用于对测试图像进行特征提取;所述质量得分确定单元用于根据所述特征提取单元输出的图像特征,确定所述测试图像的质量得分。
可选地,所述装置还可以包括:
预训练模块,用于在训练模块根据所述测试图像及测试图像的标签,对质量检测模型进行训练之前,根据目标识别的训练图像集,对所述特征提取单元进行预训练;在完成所述预训练后,得到所述特征提取单元的第一参数的第一目标值。
可选地,所述特征提取单元之后连接有目标识别单元;所述目标识别单元用于根据所述特征提取单元输出的图像特征,确定对应的目标识别结果;在预训练过程中,根据所述训练图像集的标签与所述目标识别结果确定误差信息,并根据所述误差信息对所述特征提取单元的第一参数进行更新。
综上,本申请实施例的训练装置,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。
在上述实施例的基础上,本实施例还提供了一种图像质量检测装置,参照图9,该检测装置具体可以包括:接收模块901和质量检测模块902。
其中,接收模块901,用于接收待识别图像;
质量检测模块902,用于利用质量检测模型,确定所述待识别图像对应的质量得分;
其中,所述质量检测模型的训练过程包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
可选地,所述装置还可以包括:
发送模块,用于在所述待识别图像对应的质量得分超过得分阈值的情况下,向目标识别模型发送所述待识别图像,以使所述目标识别模型对所述待识别图像进行目标识别。
综上,本申请实施例的图像质量检测装置,质量检测模型的训练数据可以包括:测试图像及测试图像的标签。由于测试图像的标签是根据目标识别模型输出的匹配度得到的,这样,本申请实施例可以利用目标识别模型实现测试图像的自动标注;因此,本申请实施例可以节省测试图像的标注成本。
并且,本申请实施例利用“目标识别模型对于测试图像的识别结果与测试图像的质量相关”的规律,进行测试图像的自动标注;不仅可以在一定程度上避免人工标注的不确定性导致标签的准确度较低和降低质量检测模型的性能的技术问题;而且,能够提高测试图像的标签的准确度,进而能够提高质量检测模型的准确度等性能。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在设备时,可以使得该设备执行本申请实施例中各方法步骤的指令(instructions)。
本申请实施例提供了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得电子设备执行如上述实施例中一个或多个所述的方法。本申请实施例中,所述电子设备包括终端设备、服务器(集群)等各类型的设备。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的装置,该装置可包括:终端设备、服务器(集群)等电子设备。图10示意性地示出了可被用于实现本申请中所述的各个实施例的示例性装置1100 。
对于一个实施例,图10示出了示例性装置1100,该装置具有一个或多个处理器1102、被耦合到(一个或多个)处理器1102中的至少一个的控制模块(芯片组)1104、被耦合到控制模块1104的存储器1106、被耦合到控制模块1104的非易失性存储器(NVM)/存储设备1108、被耦合到控制模块1104的一个或多个输入/输出设备1110,以及被耦合到控制模块1104的网络接口1112。
处理器1102可包括一个或多个单核或多核处理器,处理器1102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,装置1100 能够作为本申请实施例中所述终端设备、服务器(集群)等设备。
在一些实施例中,装置1100 可包括具有指令1114的一个或多个计算机可读介质(例如,存储器1106或NVM/存储设备1108) 以及与该一个或多个计算机可读介质相合并被配置为执行指令1114以实现模块从而执行本公开中所述的动作的一个或多个处理器1102。
对于一个实施例,控制模块1104可包括任意适当的接口控制器,以向(一个或多个)处理器1102中的至少一个和/或与控制模块1104通信的任意适当的设备或组件提供任意适当的接口。
控制模块1104可包括存储器控制器模块,以向存储器1106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器1106可被用于例如为装置1100加载和存储数据和/或指令1114。对于一个实施例,存储器1106可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,存储器1106可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM) 。
对于一个实施例,控制模块1104可包括一个或多个输入/输出控制器,以向NVM/存储设备1108及(一个或多个)输入/输出设备1110 提供接口。
例如,NVM/存储设备1108可被用于存储数据和/或指令1114。NVM/存储设备1108可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD) 、一个或多个光盘(CD) 驱动器和/或一个或多个数字通用光盘(DVD) 驱动器)。
NVM/存储设备1108可包括在物理上作为装置1100 被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备1108可通过网络经由(一个或多个)输入/输出设备1110 进行访问。
(一个或多个)输入/输出设备1110 可为装置1100 提供接口以与任意其他适当的设备通信,输入/输出设备1110可以包括通信组件、音频组件、传感器组件等。网络接口1112可为装置1100 提供接口以通过一个或多个网络通信,装置1100 可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器(例如,存储器控制器模块) 的逻辑封装在一起。对于一个实施例,(一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP) 。对于一个实施例, (一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例, (一个或多个)处理器1102中的至少一个可与控制模块1104的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC) 。
在各个实施例中,装置1100可以但不限于是:服务器、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,装置1100 可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,装置1100包括一个或多个摄像机、键盘、液晶显示器(LCD) 屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC) 和扬声器。
其中,检测装置中可采用主控芯片作为处理器或控制模块,传感器数据、位置信息等存储到存储器或NVM/存储设备中,传感器组可作为输入/输出设备,通信接口可包括网络接口。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种训练方法和装置、一种图像质量检测方法和装置,一种电子设备和一种机器可读介质,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (12)
1.一种训练方法,其特征在于,所述方法包括:
确定包含目标的标准图像;
确定所述标准图像对应的测试图像;
利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;
根据所述匹配度,确定所述测试图像的标签;
根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
2.根据权利要求1所述的方法,其特征在于,所述确定所述标准图像对应的测试图像,包括:
对所述标准图像进行预设处理,以得到所述标准图像对应的测试图像;或者
根据目标图像库中的图像标签,从目标图像库中获取所述标准图像对应的测试图像;
其中,所述预设处理包括如下处理中的至少一种:姿态处理、表情处理、亮度处理、清晰度处理和完整性处理。
3.根据权利要求1所述的方法,其特征在于,所述确定包含目标的标准图像,包括:
根据选择特征,从目标图像库中选择标准图像;
所述选择特征包括如下特征中的至少一种:场景特征、亮度特征、对比度特征、清晰度特征、完整性特征、阴影特征、曝光特征、眼镜特征、化妆特征、遮挡特征、变换特征、图像类型特征和编辑特征。
4.根据权利要求1至3中任一所述的方法,其特征在于,所述质量检测模型包括:特征提取单元和质量得分确定单元;所述特征提取单元用于对测试图像进行特征提取;所述质量得分确定单元用于根据所述特征提取单元输出的图像特征,确定所述测试图像的质量得分。
5.根据权利要求4所述的方法,其特征在于,在根据所述测试图像及测试图像的标签,对质量检测模型进行训练之前,所述方法还包括:
根据目标识别的训练图像集,对所述特征提取单元进行预训练;在完成所述预训练后,得到所述特征提取单元的第一参数的第一目标值。
6.根据权利要求5所述的方法,其特征在于,所述特征提取单元之后连接有目标识别单元;所述目标识别单元用于根据所述特征提取单元输出的图像特征,确定对应的目标识别结果;在预训练过程中,根据所述训练图像集的标签与所述目标识别结果确定误差信息,并根据所述误差信息对所述特征提取单元的第一参数进行更新。
7.一种图像质量检测方法,其特征在于,所述方法包括:
接收待识别图像;
利用质量检测模型,确定所述待识别图像对应的质量得分;
其中,所述质量检测模型的训练过程包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述待识别图像对应的质量得分超过得分阈值的情况下,向目标识别模型发送所述待识别图像,以使所述目标识别模型对所述待识别图像进行目标识别。
9.一种训练装置,其特征在于,所述装置包括:
标准图像确定模块,用于确定包含目标的标准图像;
测试图像确定模块,用于确定所述标准图像对应的测试图像;
匹配度确定模块,用于利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;
标签确定模块,用于根据所述匹配度,确定所述测试图像的标签;
训练模块,用于根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
10.一种图像质量检测装置,其特征在于,所述装置包括:
接收模块,用于接收待识别图像;
质量检测模块,用于利用质量检测模型,确定所述待识别图像对应的质量得分;
其中,所述质量检测模型的训练过程包括:确定包含目标的标准图像;确定所述标准图像对应的测试图像;利用目标识别模型,确定所述标准图像与所述测试图像之间的匹配度;根据所述匹配度,确定所述测试图像的标签;根据所述测试图像及测试图像的标签,对质量检测模型进行训练;所述质量检测模型用于确定所述测试图像对应的质量得分;在所述质量检测模型的训练过程中,根据所述标签与所述质量得分确定损失信息,并根据所述损失信息对所述质量检测模型的参数进行更新。
11.一种电子设备,其特征在于,包括:处理器;和
存储器,其上存储有可执行代码,当所述可执行代码被执行时,使得所述处理器执行如权利要求1-8中任一项所述的方法。
12.一种机器可读介质,其上存储有可执行代码,当所述可执行代码被执行时,使得处理器执行如权利要求1-8中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210783367.XA CN114863224B (zh) | 2022-07-05 | 2022-07-05 | 训练方法、图像质量检测方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210783367.XA CN114863224B (zh) | 2022-07-05 | 2022-07-05 | 训练方法、图像质量检测方法、装置和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114863224A true CN114863224A (zh) | 2022-08-05 |
CN114863224B CN114863224B (zh) | 2022-10-11 |
Family
ID=82626114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210783367.XA Active CN114863224B (zh) | 2022-07-05 | 2022-07-05 | 训练方法、图像质量检测方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114863224B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116909169A (zh) * | 2023-09-14 | 2023-10-20 | 光轮智能(北京)科技有限公司 | 运行控制模型的训练方法、运行控制方法、设备及介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107909566A (zh) * | 2017-10-28 | 2018-04-13 | 杭州电子科技大学 | 一种基于深度学习的皮肤癌黑色素瘤的图像识别方法 |
DE102018126664A1 (de) * | 2017-10-27 | 2019-05-02 | GM Global Technology Operations LLC | Domänenanpassung durch klassenausgeglichenes selbsttraining mit räumlichen prioren |
US20190147305A1 (en) * | 2017-11-14 | 2019-05-16 | Adobe Inc. | Automatically selecting images using multicontext aware ratings |
CN110942072A (zh) * | 2019-12-31 | 2020-03-31 | 北京迈格威科技有限公司 | 基于质量评估的质量分、检测模型训练、检测方法及装置 |
CN111539404A (zh) * | 2020-04-16 | 2020-08-14 | 华北电力大学 | 一种基于结构线索的全参考图像质量评估方法 |
US20210042580A1 (en) * | 2018-10-10 | 2021-02-11 | Tencent Technology (Shenzhen) Company Limited | Model training method and apparatus for image recognition, network device, and storage medium |
WO2021082118A1 (zh) * | 2019-11-01 | 2021-05-06 | 深圳大学 | 行人重识别的方法、装置、终端及存储介质 |
CN112861659A (zh) * | 2021-01-22 | 2021-05-28 | 平安科技(深圳)有限公司 | 一种图像模型训练方法、装置及电子设备、存储介质 |
CN112989869A (zh) * | 2019-12-02 | 2021-06-18 | 深圳云天励飞技术有限公司 | 人脸质量检测模型的优化方法、装置、设备及存储介质 |
CN113192028A (zh) * | 2021-04-29 | 2021-07-30 | 北京的卢深视科技有限公司 | 人脸图像的质量评价方法、装置、电子设备及存储介质 |
CN113591767A (zh) * | 2021-08-09 | 2021-11-02 | 浙江大华技术股份有限公司 | 图像识别评估值的确定方法及装置、存储介质、电子装置 |
CN113642479A (zh) * | 2021-08-17 | 2021-11-12 | 北京的卢深视科技有限公司 | 人脸图像的评价方法、装置、电子设备及存储介质 |
-
2022
- 2022-07-05 CN CN202210783367.XA patent/CN114863224B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102018126664A1 (de) * | 2017-10-27 | 2019-05-02 | GM Global Technology Operations LLC | Domänenanpassung durch klassenausgeglichenes selbsttraining mit räumlichen prioren |
CN107909566A (zh) * | 2017-10-28 | 2018-04-13 | 杭州电子科技大学 | 一种基于深度学习的皮肤癌黑色素瘤的图像识别方法 |
US20190147305A1 (en) * | 2017-11-14 | 2019-05-16 | Adobe Inc. | Automatically selecting images using multicontext aware ratings |
US20210042580A1 (en) * | 2018-10-10 | 2021-02-11 | Tencent Technology (Shenzhen) Company Limited | Model training method and apparatus for image recognition, network device, and storage medium |
WO2021082118A1 (zh) * | 2019-11-01 | 2021-05-06 | 深圳大学 | 行人重识别的方法、装置、终端及存储介质 |
CN112989869A (zh) * | 2019-12-02 | 2021-06-18 | 深圳云天励飞技术有限公司 | 人脸质量检测模型的优化方法、装置、设备及存储介质 |
CN110942072A (zh) * | 2019-12-31 | 2020-03-31 | 北京迈格威科技有限公司 | 基于质量评估的质量分、检测模型训练、检测方法及装置 |
CN111539404A (zh) * | 2020-04-16 | 2020-08-14 | 华北电力大学 | 一种基于结构线索的全参考图像质量评估方法 |
CN112861659A (zh) * | 2021-01-22 | 2021-05-28 | 平安科技(深圳)有限公司 | 一种图像模型训练方法、装置及电子设备、存储介质 |
CN113192028A (zh) * | 2021-04-29 | 2021-07-30 | 北京的卢深视科技有限公司 | 人脸图像的质量评价方法、装置、电子设备及存储介质 |
CN113591767A (zh) * | 2021-08-09 | 2021-11-02 | 浙江大华技术股份有限公司 | 图像识别评估值的确定方法及装置、存储介质、电子装置 |
CN113642479A (zh) * | 2021-08-17 | 2021-11-12 | 北京的卢深视科技有限公司 | 人脸图像的评价方法、装置、电子设备及存储介质 |
Non-Patent Citations (5)
Title |
---|
QINGBO WU等: "Blind image quality assessment based on multichannel feature fusion and label transfer", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》 * |
YIN CHEN等: "Image Quality Measures for Predicting Automatic Target Recognition Performance", 《2008 IEEE AEROSPACE CONFERENCE》 * |
周丽珍: "手指静脉图像质量评估及其识别算法研究", 《中国优秀硕士学位论文全文数据库》 * |
杜媛: "基于图像质量分析与分割算子的图像特征点匹配算法", 《电子测量技术》 * |
王雪玮: "基于特征学习的模糊图像质量评价与检测分割研究", 《中国博士学位论文全文数据库》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116909169A (zh) * | 2023-09-14 | 2023-10-20 | 光轮智能(北京)科技有限公司 | 运行控制模型的训练方法、运行控制方法、设备及介质 |
CN116909169B (zh) * | 2023-09-14 | 2023-12-19 | 光轮智能(北京)科技有限公司 | 运行控制模型的训练方法、运行控制方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114863224B (zh) | 2022-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200160040A1 (en) | Three-dimensional living-body face detection method, face authentication recognition method, and apparatuses | |
CN109543714B (zh) | 数据特征的获取方法、装置、电子设备及存储介质 | |
CN109614910B (zh) | 一种人脸识别方法和装置 | |
CN111738243B (zh) | 人脸图像的选择方法、装置、设备及存储介质 | |
CN109344727B (zh) | 身份证文本信息检测方法及装置、可读存储介质和终端 | |
CN111445459B (zh) | 一种基于深度孪生网络的图像缺陷检测方法及系统 | |
CN112329702B (zh) | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 | |
CN110598638A (zh) | 模型训练方法、人脸性别预测方法、设备及存储介质 | |
CN113496208B (zh) | 视频的场景分类方法及装置、存储介质、终端 | |
CN114863224B (zh) | 训练方法、图像质量检测方法、装置和介质 | |
JP2023526899A (ja) | 画像修復モデルを生成するための方法、デバイス、媒体及びプログラム製品 | |
TWI803243B (zh) | 圖像擴增方法、電腦設備及儲存介質 | |
CN112417947A (zh) | 关键点检测模型的优化及面部关键点的检测方法及装置 | |
WO2020103462A1 (zh) | 视觉搜索方法、装置、计算机设备及存储介质 | |
WO2021047453A1 (zh) | 图像质量确定方法、装置及设备 | |
CN113706550A (zh) | 图像场景识别和模型训练方法、装置和计算机设备 | |
CN112580581A (zh) | 目标检测方法、装置及电子设备 | |
CN115115552B (zh) | 图像矫正模型训练及图像矫正方法、装置和计算机设备 | |
CN114898447A (zh) | 一种基于自注意力机制的个性化注视点检测方法及装置 | |
KR102213445B1 (ko) | 학습된 신경망을 이용한 신분 인증 방법 및 이를 수행하는 시스템 | |
Yang et al. | An end‐to‐end perceptual enhancement method for UHD portrait images | |
CN117274761B (zh) | 图像生成方法、装置、电子设备和存储介质 | |
CN110210306B (zh) | 一种人脸跟踪方法和相机 | |
US10614608B2 (en) | Electronic device for implementing method for producing animated face | |
CN115482594A (zh) | 一种活体检测模型的生成方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |