CN112700408B - 模型训练方法、图像质量评估方法及装置 - Google Patents
模型训练方法、图像质量评估方法及装置 Download PDFInfo
- Publication number
- CN112700408B CN112700408B CN202011578791.8A CN202011578791A CN112700408B CN 112700408 B CN112700408 B CN 112700408B CN 202011578791 A CN202011578791 A CN 202011578791A CN 112700408 B CN112700408 B CN 112700408B
- Authority
- CN
- China
- Prior art keywords
- image
- training
- evaluated
- image quality
- real
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 228
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 94
- 238000000034 method Methods 0.000 title claims abstract description 92
- 238000002372 labelling Methods 0.000 claims abstract description 62
- 230000006870 function Effects 0.000 claims description 75
- 238000001914 filtration Methods 0.000 claims description 62
- 238000004422 calculation algorithm Methods 0.000 claims description 51
- 238000001514 detection method Methods 0.000 claims description 40
- 238000010606 normalization Methods 0.000 claims description 32
- 230000004913 activation Effects 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 30
- 238000011156 evaluation Methods 0.000 claims description 19
- 238000003860 storage Methods 0.000 claims description 15
- 238000001303 quality assessment method Methods 0.000 claims description 11
- 238000011176 pooling Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000005520 cutting process Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 6
- 230000008485 antagonism Effects 0.000 claims description 4
- 239000000758 substrate Substances 0.000 claims 1
- 230000002829 reductive effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了模型训练方法、图像质量评估方法及装置,该训练方法包括:获取真实图像样本集;利用真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集生成网络在多个迭代轮次中分别生成的多个伪图像样本集;生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对第一训练样本库的每个第一训练样本进行自动分级标注;利用带标签的第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。利用上述方法,仅需采集少量清晰的真实图像样本,即可生成大量不同质量等级的伪图像样本,自动标注减少人工成本的同时提升数据标注的质量,进而能够以更小成本完成该图像质量评估模型的训练。
Description
技术领域
本发明属于计算机领域,具体涉及模型训练方法、图像质量评估方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着诸如人脸识别的对象识别技术的应用普及,人们对于对象识别的精度要求越来越高,然而采集的对象图像质量直接影响对象识别精度,质量差的对象图像在进行对象识别时会导致误识或漏识,因此在进行对象识别之前进行质量评估就显得十分重要。
图像的质量评估主要分为全参考质量评估、半参考质量评估、无参考质量评估。例如,人脸图像质量评估由于受到个体的面部特征差异,包括但不限于发型、佩戴眼镜、化妆等会导致内容变化较大,属于无参考质量评估。在无参考质量评估方法中,目前大多数方法仍然需要利用主观质量分数来训练质量评价模型。
现有图像质量评估模型训练过程主要包括,图像数据采集,人工对采集数据进行数据清洗与标注,然后通过检测模型检测到感兴趣区域,并进行边界余量扩张以保留内容完整的对象区域,将对象区域与人工标注质量标签输入到深度学习网络进行训练学习。
图像质量评估模型训练需要采集大量的图像数据,标注图像数据对应的质量分数标签,这是一项工作量巨大的工程。同时,由于进行标注工作的人员存在个体主观性以及图像本身包含的内容丰富程度差异,因此很难制定一套统一的标准来执行标注工作。不同的人在观察同一张图像,由于认知的区别,会导致对同一张图像的质量等级标注存在差异,因此质量评估的数据采集与标注一直是人脸图像质量评估的难题。
发明内容
针对上述现有技术中存在的问题,提出了一种模型训练方法、图像质量评估方法及装置,利用这种方法、装置,能够解决上述问题。
本发明提供了以下方案。
第一方面,提供一种图像质量评估模型训练方法,包括:获取真实图像样本集,其中,真实图像样本集包括多个真实图像样本;利用真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集;生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的第一训练样本库;利用第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
在一些实施方式中,对第一训练样本库的每个第一训练样本进行自动分级标注,包括:将真实图像样本集包含的真实图像样本标注为最高的图像质量级别;根据每个伪图像样本集对应的迭代轮次数将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别。
在一些实施方式中,对第一训练样本库的每个第一训练样本进行自动分级标注,包括:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本集与真实图像样本集的弗雷歇距离,根据计算结果将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别。
在一些实施方式中,对第一训练样本库的每个第一训练样本进行自动分级标注,包括:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本与真实图像样本的均方误差(MSE)值,根据均方误差(MSE)值将每个伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别。
在一些实施方式中,获取真实图像样本集还包括:采集多个真实图像,对多个真实图像进行以下预处理操作:利用对象检测算法确定每个真实图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对每个真实图像进行裁剪处理;以及,对多个真实图像进行尺寸归一化,以得到真实图像样本集。
在一些实施方式中,真实图像样本为人脸图像,对象检测算法为人脸检测算法。
在一些实施方式中,获取真实图像样本集之后,方法还包括:利用关键点检测算法和/或姿态估计算法去除真实图像样本集中的非正脸图片。
在一些实施方式中,利用第一训练样本库对预设多分类网络进行分类训练,获得图像质量评估模型,包括:获取第一训练样本库中的每个带标签的第一训练样本,标签用于指示第一训练样本的图像质量级别;对每个第一训练样本进行行方向滤波处理,得到第一滤波图像;对每个第一训练样本进行列方向滤波处理,得到第二滤波图像;将每个第一训练样本和对应的第一滤波图像和第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;分别获取多个第一训练样本对应的多个第二训练样本,并将多个第二训练样本输入预设多分类网络进行迭代训练,以获取图像质量评估模型。
在一些实施方式中,预设多分类网络为ResNet网络,预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。
在一些实施方式中,方法还包括:预先构建生成对抗网络,生成对抗网络包括生成网络和判别网络;其中,生成网络包括线性映射层、多个卷积层以及位于多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,生成网络用于接收随机噪音并生成伪图像样本;判别网络包括多个卷积层和位于多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,判别网络用于对真实图像样本和伪图像样本进行真伪判定。
在一些实施方式中,方法还包括:生成网络的损失函数采用交叉熵函数。
第二方面,提供一种图像质量评估方法,包括:接收待评估图像;利用如第一方面的方法训练得到的图像质量评估模型对待评估图像进行图像质量评估,以确认待评估图像为多个预设的图像质量级别之一。
在一些实施方式中,待评估图像为待评估人脸图像,图像质量评估模型用于对人脸图像进行质量评估,方法还包括:接收待评估图像之后,利用人脸检测算法确定待评估人脸图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对待评估人脸图像进行裁剪处理;根据第一训练样本的尺寸对裁剪处理后的待评估人脸图像进行尺寸归一化;利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的待评估人脸图像是否为正脸图像;其中,若待评估人脸图像不是正脸图像则停止评估,若待评估人脸图像是正脸图像则利用图像质量评估模型对尺寸归一化之后的待评估图像进行图像质量评估。
在一些实施方式中,利用图像质量评估模型对待评估图像进行图像质量评估,包括:对待评估图像进行行方向滤波处理,得到第一滤波待评估图像;对待评估图像进行列方向滤波处理,得到第二滤波待评估图像;将待评估图像、第一滤波待评估图像和第二滤波待评估图像的合并图像输入图像质量评估模型进行评估,以确定待评估图像为预设的多个图像质量级别之一。
第三方面,提供一种模型训练装置,包括:获取模块,用于获取真实图像样本集,其中,真实图像样本集包括多个真实图像样本;生成对抗网络模块,用于利用真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集;自动标注模块,用于生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的第一训练样本库;模型训练模块,用于利用第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的真实图像样本标注为最高的图像质量级别;根据每个伪图像样本集对应的迭代轮次数将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本集与真实图像样本集的弗雷歇距离,根据计算结果将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本与真实图像样本的均方误差(MSE)值,根据均方误差(MSE)值将每个伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别。
在一些实施方式中,获取模块还用于:采集多个真实图像,对多个真实图像进行以下预处理操作:利用对象检测算法确定每个真实图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对每个真实图像进行裁剪处理;以及,对多个真实图像进行尺寸归一化,以得到真实图像样本集。
在一些实施方式中,真实图像样本为人脸图像,对象检测算法为人脸检测算法。
在一些实施方式中,获取真实图像样本集之后,获取模块还用于:利用关键点检测算法和/或姿态估计算法去除真实图像样本集中的非正脸图片。
在一些实施方式中,模型训练模块还用于:获取第一训练样本库中的每个带标签的第一训练样本,标签用于指示第一训练样本的图像质量级别;对每个第一训练样本进行行方向滤波处理,得到第一滤波图像;对每个第一训练样本进行列方向滤波处理,得到第二滤波图像;将每个第一训练样本和对应的第一滤波图像和第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;分别获取多个第一训练样本对应的多个第二训练样本,并将多个第二训练样本输入预设多分类网络进行迭代训练,以获取图像质量评估模型。
在一些实施方式中,预设多分类网络为ResNet网络,预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。
在一些实施方式中,生成对抗网络模块还用于:预先构建生成对抗网络,生成对抗网络包括生成网络和判别网络;其中,生成网络包括线性映射层、多个卷积层以及位于多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,生成网络用于接收随机噪音并生成伪图像样本;判别网络包括多个卷积层和位于多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,判别网络用于对真实图像样本和伪图像样本进行真伪判定。
在一些实施方式中,生成网络的损失函数采用交叉熵函数。
第四方面,提供一种图像质量评估装置,包括:接收模块,用于接收待评估图像;评估模块,用于利用如权第一方面的方法训练得到的图像质量评估模型对待评估图像进行图像质量评估,以确认待评估图像为多个预设的图像质量级别之一。
在一些实施方式中,待评估图像为待评估人脸图像,图像质量评估模型用于对人脸图像进行质量评估,评估模块还用于:接收待评估图像之后,利用人脸检测算法确定待评估人脸图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对待评估人脸图像进行裁剪处理;根据第一训练样本的尺寸对裁剪处理后的待评估人脸图像进行尺寸归一化;利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的待评估人脸图像是否为正脸图像;其中,若待评估人脸图像不是正脸图像则停止评估,若待评估人脸图像是正脸图像则利用图像质量评估模型对尺寸归一化之后的待评估图像进行图像质量评估。
在一些实施方式中,评估模块还用于:对待评估图像进行行方向滤波处理,得到第一滤波待评估图像;对待评估图像进行列方向滤波处理,得到第二滤波待评估图像;将待评估图像、第一滤波待评估图像和第二滤波待评估图像的合并图像输入图像质量评估模型进行评估,以确定待评估图像为预设的多个图像质量级别之一。
第五方面,提供一种模型训练装置,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第一方面的方法。
第六方面,提供一种图像质量评估方法,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如第二方面的方法。
第七方面,提供一种计算机可读存储介质,计算机可读存储介质存储有程序,当程序被多核处理器执行时,使得多核处理器执行如第一方面和/或第二方面的方法。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:本实施例中,。
应当理解,上述说明仅是本发明技术方案的概述,以便能够更清楚地了解本发明的技术手段,从而可依照说明书的内容予以实施。为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举例说明本发明的具体实施方式。
附图说明
通过阅读下文的示例性实施例的详细描述,本领域普通技术人员将明白本文所述的优点和益处以及其他优点和益处。附图仅用于示出示例性实施例的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的标号表示相同的部件。在附图中:
图1为根据本发明一实施例的模型训练方法的流程示意图;
图2为根据本发明一实施例的生成对抗网络的示意图;
图3为根据本发明一实施例的生成网络的示意图;
图4为根据本发明一实施例的判别网络的示意图;
图5为根据本发明一实施例的将第一训练样本和对应的第一滤波图像和第二滤波图像进行拼接合的示意图;
图6为根据本发明一实施例的模型训练装置的结构示意图;
图7为根据本发明又一实施例的模型训练装置的结构示意图;
图8为根据本发明一实施例的图像质量评估装置的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
在本发明中,应理解,诸如“包括”或“具有”等术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不旨在排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在的可能性。
另外还需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
本发明实施例提供一种模型训练方法、图像质量评估方法及装置,下面,首先对模型训练方法的发明构思进行介绍。
本发明实施例提供一种模型训练方法,用于训练得到图像质量评估模型,具体来说,首先获取包括多个真实图像样本的真实图像样本集,预先构建的生成对抗网络,利用该真实图像样本集对生成对抗网络进行迭代训练,并收集其中生成网络在多个迭代轮次中分别生成的多个伪图像样本集,生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,由于生成网络在多个迭代轮次逐渐生成质量更高的伪图像样本,因此可以根据多个预设的图像质量级别对该第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的第一训练样本库,进一步可以利用该第一训练样本库对预设多分类网络进行训练以获得图像质量评估模型,最后利用经训练的图像质量评估模型对待评估图像进行图像质量评估,确定该待评估图像为多个预设的图像质量级别之一。本实施例仅需采集少量清晰的真实图像样本,即可生成大量不同质量等级的伪图像样本,在生成过程中完成标注,避免人工干预,减少人工成本的同时提升数据标注的质量,进而能够以更小成本完成该图像质量评估模型的训练。
本领域技术人员可以理解,所描述的应用场景仅是本发明的实施方式可以在其中得以实现的一个示例。本发明实施方式的适用范围不受任何限制。在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
图1为根据本申请一实施例的模型训练方法100的流程示意图,用于评估图像的质量,在该流程中,从设备角度而言,执行主体可以是一个或者多个电子设备;从程序角度而言,执行主体相应地可以是搭载于这些电子设备上的程序。
如图1所示,该方法100可以包括:
步骤101、获取真实图像样本集,其中,真实图像样本集包括多个真实图像样本。
在一实施例中,为了获取便于后续训练的真实图像样本集,步骤101还可以包括:采集多个真实图像,对多个真实图像进行以下预处理操作:利用对象检测算法确定每个真实图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对每个真实图像进行裁剪处理;以及,对多个真实图像进行尺寸归一化,以得到真实图像样本集。
其中,真实图像可以是针对某一特定对象的图像数据,比如可以是人脸图像、动物图像车辆图像等等。对象检测算法用于从真实图像检测到目标对象,从而获得感兴趣区域(ROI)。
在一实施例中,真实图像样本为人脸图像,对象检测算法为人脸检测算法。
在一实施例中,获取真实图像样本集之后,该方法还可以包括:利用关键点检测算法和/或姿态估计算法去除真实图像样本集中的非正脸图片。由此可以避免非正脸图片对于后续的训练带来不利影响。
例如,可以采用可见光摄像机采集包含清晰的人脸图片数据库A,对人脸图片数据库A中的每一张图片采用开源的人脸检测算法进行人脸区域检测,得到对应图片的感兴趣区域(ROI),对原图进行裁剪得到对应的清晰人脸图片数据库B,对清晰人脸图片数据库B中的每一张图片进行尺寸归一化,得到一组尺寸为H*W人脸图片,比如其中H=120,W=160,最后可以使用关键点检测及姿态估计算法去除侧脸、俯仰等非正脸图片。最后,存储剩余的人脸图片数据,得到质量为1级(最高)的人脸图片数据库作为真实图像样本集D1。
步骤102、利用真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集。
参考图2,示出了对预先构建的生成对抗网络进行迭代训练的过程。在训练过程中,生成网络和判别网络有相反的目标:判别网络试图从真实图像中分辨出虚假图像,而生成网络则试图产生看起来足够真实的图像来欺骗判别网络。由于生成对抗网络由不同目标的两个网络组成,因此每个训练迭代可以分为两个阶段:在第一阶段,训练判别网络,从真实图像样本集D1中采样一批真实图像,生成网络接收随机噪音R并生成伪图像样本R’,真实图像样本集D1和伪图像样本R’组成训练批次,其中将伪图像样本的标签设置为0(伪),真实图像样本的标签设置为1(真),并使用二元交叉熵损失在该被标签的批次上对判别网络进行训练。在这个阶段反向传播只能优化判别网络的权重。在第二阶段,训练生成网络,首先使用生成网络生成另一批伪图像样本,然后再次使用判别网络来判断图像是伪图像样本还是真实图像样本,在这个阶段中所有标签都设置为1(真)。换言之,希望判别网络会错误地判定生成网络产生的伪图像样本为真。至关重要的是,在此步骤中,判别网络的权重会被固定,因此反向传播只会影响生成网络的权重。
可以理解,通过上述生成对抗网络的迭代训练过程,生成网络实际上从未生成任何真实的图像,但是随着训练迭代的推进,生成网络生成的伪图像样本逐渐和真实图像样本的质量差距越来越小。
在一实施例中,步骤102还包:预先构建生成对抗网络,生成对抗网络包括生成网络和判别网络;其中,生成网络包括线性映射层、多个卷积层以及位于多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,生成网络用于根据随机噪音并生成伪图像样本。判别网络包括多个卷积层和位于多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,判别网络用于对真实图像样本和伪图像样本进行真伪判定。
例如,参见图3,生成网络的输入为20维长度为3*H*2*W*2的随机噪声,第一层为线性映射,将输入映射为1*3*(H*2)*(W*2)的四维数据;第二层为卷积运算,将第一层输出结果与50*3*3的Kernel进行卷积,其中步长为1,padding为1;第三层为卷积运算,将第二层输出结果与25*3*3的Kernel进行卷积,其中步长为1,padding为1;第四层为卷积运算,将第三层输出结果与16*3*3的Kernel进行卷积,其中步长为2,padding为1;第五层为卷积运算,将第四层输出结果与16*3*3的Kernel进行卷积,其中步长为1,padding为1;第六层为卷积运算,将第五层输出结果与16*3*3的Kernel进行卷积,其中步长为1,padding为1;第七层为卷积运算,将第六层输出结果与8*3*3的Kernel进行卷积,其中步长为1,padding为1;第七层为卷积运算,将第六层输出结果与3*3*3的Kernel进行卷积,其中步长为1,padding为1。对以上每一层网络的输出均添加批标准化(BatchNormlization)层和ReLU激活函数层。在一实施例中,该生成网络的损失函数采用交叉熵函数。具体来说,该损失函数的计算使用的是对抗网络对伪图像样本的预测结果与真实标签的交叉熵函数。
例如,参见图4,判别网络的输入为真实图像样本集D1和伪图像样本集R’,将真实图像样本集D1的标签设置为1(真),将伪图像样本集R’的标签设置为0(伪)使用单目标二分类交叉熵函数作为损失函数,其中,判别网络中第一层为卷积运算,将输入的1*3*H*W的图像数据与32*7*7的Kernel进行卷积,其中步长为1,padding为3,通过LeakyRelu激活函数对卷积结果进行处理,紧接着是步长为2的2*2的平均池化处理;第二层为卷积运算,将第一层的输出结果与32*3*3的Kernel进行卷积,其中步长为1,padding为1,通过LeakyRelu激活函数对卷积结果进行处理,紧接着是步长为2的2*2的平均池化处理;第三层为卷积运算,将第二层的输出结果与16*3*3的Kernel进行卷积,其中步长为1,padding为1,通过LeakyRelu激活函数对卷积结果进行处理,紧接着是步长为2的2*2的平均池化处理;第四层为2个全连接层,将第三层的输出映射为1*1024维,通过LeakyRelu激活函数对卷积结果进行处理,将1*1024维映射为1*1维,最后接sigmoid激活函数得到一个0-1之前的概率,从而进行二分类。
步骤103、生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的第一训练样本库。
在一实施例中,步骤103中对第一训练样本库的每个第一训练样本进行自动分级标注,包括:根据每个伪图像样本集对应的迭代轮次数将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别;将真实图像样本集包含的真实图像样本标注为最高的图像质量级别。
例如,预设的图像质量级别从高到低可以分为6种,包括“Ⅰ级”、“Ⅱ级”、…、“Ⅵ级”。可以通过保存训练中间过程的伪图像样本,来对伪图像样本和真实图像样板按照质量进行分级存储,如迭代500次时,生成网络生成的伪图像样本集的图像质量等级为“Ⅵ级”,迭代1000次时,成网络生成的伪图像样本集的图像质量等级为“Ⅴ级”,……随着迭代次数增加,生成网络生成的伪图像样本与采集的真实图像样本之前的区分度更低,也即成网络生成的伪图像样本集的图像质量等级更高,质量更好,此处可以生成多级不同质量的伪图像样本集。换言之,可以根据每个伪图像样本集对应的迭代轮次数(如上述500次、1000次等等)将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别;将真实图像样本集包含的真实图像样本标注为最高的图像质量级别“Ⅰ级”。
在另外一实施例中,步骤103中的基于图像质量对第一训练样本库的每个第一训练样本进行自动分级标注,包括:计算每个伪图像样本集与真实图像样本集的弗雷歇距离;根据计算结果将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别;以及,将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别。
例如,预设的图像质量级别从高到低可以分为6种,包括“Ⅰ级”、“Ⅱ级”、…、“Ⅵ级”。训练过程中不同迭代次数时对应的伪图像样本可以分文件夹保存,比如文件夹F1存储训练到第10个轮次时对应的伪图像样本,文件夹F2存储训练到第20个轮次时对应的伪图像样本……以此类推;可以使用弗雷歇距离(Frech Inception Distance)计算多个文件夹中的数据与真实图像样本集D1的弗雷歇距离来衡量生成的伪图像样本与清晰的真实图像样本图片的质量差异,并按照计算结果,根据弗雷歇距离的分布情况将第二步生成文件夹归并为5类,分别按照距离从小到大排列得到质量为“Ⅰ级”的真实图像样本集D1、质量为“Ⅱ级”的伪图像样本集,…,质量为“Ⅵ级”的伪图像样本集。
可选地,也可以采用诸如余弦相似度、KL散度等用于评价相似度程度的参数代替上述弗雷歇距离。比如,可以计算多个文件夹中的数据与真实图像样本集D1的余弦相似度来衡量生成的伪图像样本与清晰的真实图像样本图片的质量差异,并按照相似度从大到小排列得到质量为“Ⅰ级”的真实图像样本集D1、质量为“Ⅱ级”的伪图像样本集,…,质量为“Ⅵ级”的伪图像样本集。
可选地,可以基于多个文件夹中的数据与真实图像样本集D1的部分图像信息进行上述相似度程度的评价,或者也可以基于多个文件夹中的数据与真实图像样本集D1的全部图像信息进行上述相似度程度的评价,本申请对此不作具体限定。
完成以上步骤之后,即可得到自动标注的第一训练样本库D,其中第一训练样本库D包含6个子文件夹,分别可以对应质量为“Ⅰ级”的真实图像样本D1,质量为“Ⅱ级”的伪图像样本集D2,质量为“Ⅲ级”的伪图像样本集D3,质量为“Ⅳ级”的伪图像样本集数据库D4,质量为“Ⅴ级”的人脸图片数据库D5;质量为“Ⅵ级”的人脸图片数据库D6;
在又一实施例中,步骤103中的基于图像质量对第一训练样本库的每个第一训练样本进行自动分级标注,包括:计算每个伪图像样本与真实图像样本的均方误差(MSE)值;根据均方误差(MSE)值将每个伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别;以及,将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别。
步骤104、利用第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
第一训练样本库由真实图像样本集和多个伪图像样本集组成,且其中的每个第一训练样本都携带用于指示图像质量的标签,比如,假设图像质量从高到低分为6种,包括“Ⅰ级”、“Ⅱ级”、…、“Ⅵ级”,其中作为真实图像样本的第一训练样本的标签为“Ⅰ级”,作为伪图像样本的第一训练样本依据其图像质量从好到坏依次为“Ⅱ级”、…、“Ⅵ级”。因此,可以利用该第一训练样本库对预设多分类网络进行训练直至收敛,所获得的图像质量评估模型能够依据输入图像确定其图像质量为“Ⅰ级”、“Ⅱ级”、…、“Ⅵ级”中的其中一种。
在一实施例中,步骤104具体可以包括:获取第一训练样本库中的每个带标签的第一训练样本,标签用于指示第一训练样本的图像质量级别;对每个第一训练样本进行行方向滤波处理,得到第一滤波图像;对每个第一训练样本进行列方向滤波处理,得到第二滤波图像;将每个第一训练样本和对应的第一滤波图像和第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;分别获取多个第一训练样本对应的多个第二训练样本,并将多个第二训练样本输入预设多分类网络进行迭代训练,以获取图像质量评估模型。
参考图5,针对第一训练样本库的多个带标签的第一训练样本Img,分别对其进行行方向滤波和列方向滤波,也即将第一训练样本Img与1*N的卷积核进行卷积得到行方向上的滤波后图像Img1(第一滤波图像),将第一训练样本Img与N*1的另一卷积核进行卷积得到列方向上的滤波后的图像Img2(第二滤波图像)。将上述Img,Img1,Img2合并成一张H*(3*W)的图片(也即第二训练样本),如图5所示,在该第二训练样本中,第一训练样本Img在左边、第一滤波图像Img1在中间、第二滤波图像Img2在右边。对应于多个第一训练样本的多个第二训练样本组成第二训练样本库。将该多个第二训练样本输入预设多分类网络进行迭代训练,可以获取图像质量评估模型。
可以理解,利用本实施例所训练得到的图像质量评估模型,在完成数据标注后进行深度学习训练图像质量评估模型时,对于训练质量评估的模型输入进行传统数字图像的预处理,增加模型输入的特征信息,提升模型的稳定性和泛化能力
在一实施例中,上述预设多分类网络为ResNet网络,预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。可选的,该预设多分类网络也可以采用ResNet以外的网络。
基于相同的技术构思,本发明实施例还提供一种图像质量评估方法,其利用上述实施例的模型训练方法执行图像质量评估方法,具体包括:接收待评估图像;利用如上述实施例所描述的训练方法训练得到的图像质量评估模型对待评估图像进行图像质量评估,以确认待评估图像为多个预设的图像质量级别之一。
在一些实施方式中,待评估图像为待评估人脸图像,图像质量评估模型用于对人脸图像进行质量评估,方法还包括:接收待评估图像之后,利用人脸检测算法确定待评估人脸图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对待评估人脸图像进行裁剪处理;根据第一训练样本的尺寸对裁剪处理后的待评估人脸图像进行尺寸归一化;利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的待评估人脸图像是否为正脸图像;其中,若待评估人脸图像不是正脸图像则停止评估,若待评估人脸图像是正脸图像则利用图像质量评估模型对尺寸归一化之后的待评估图像进行图像质量评估。
在一些实施方式中,利用图像质量评估模型对待评估图像进行图像质量评估,包括:对待评估图像进行行方向滤波处理,得到第一滤波待评估图像;对待评估图像进行列方向滤波处理,得到第二滤波待评估图像;将待评估图像、第一滤波待评估图像和第二滤波待评估图像的合并图像输入图像质量评估模型进行评估,以确定待评估图像为预设的多个图像质量级别之一。
基于相同的技术构思,本发明实施例还提供一种模型训练装置,用于执行上述图1所提供的图像质量评估模型训练方法。图6为本发明实施例提供的一种模型训练装置结构示意图。
如图6所示,模型训练装置包括:
获取模块601,用于获取真实图像样本集,其中,真实图像样本集包括多个真实图像样本。
生成对抗网络模块602,用于利用真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集;
自动标注模块603,用于生成由真实图像样本集和多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的第一训练样本库;
模型训练模块604,用于利用第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的真实图像样本标注为最高的图像质量级别;根据每个伪图像样本集对应的迭代轮次数将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本集与真实图像样本集的弗雷歇距离,根据计算结果将每个伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别。
在一些实施方式中,自动标注模块还用于:将真实图像样本集包含的多个真实图像样本标注为最高的图像质量级别;计算每个伪图像样本与真实图像样本的均方误差(MSE)值,根据均方误差(MSE)值将每个伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别。
在一些实施方式中,获取模块还用于:采集多个真实图像,对多个真实图像进行以下预处理操作:利用对象检测算法确定每个真实图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对每个真实图像进行裁剪处理;以及,对多个真实图像进行尺寸归一化,以得到真实图像样本集。
在一些实施方式中,真实图像样本为人脸图像,对象检测算法为人脸检测算法。
在一些实施方式中,获取真实图像样本集之后,获取模块还用于:利用关键点检测算法和/或姿态估计算法去除真实图像样本集中的非正脸图片。
在一些实施方式中,模型训练模块还用于:获取第一训练样本库中的每个带标签的第一训练样本,标签用于指示第一训练样本的图像质量级别;对每个第一训练样本进行行方向滤波处理,得到第一滤波图像;对每个第一训练样本进行列方向滤波处理,得到第二滤波图像;将每个第一训练样本和对应的第一滤波图像和第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;分别获取多个第一训练样本对应的多个第二训练样本,并将多个第二训练样本输入预设多分类网络进行迭代训练,以获取图像质量评估模型。
在一些实施方式中,预设多分类网络为ResNet网络,预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。
在一些实施方式中,生成对抗网络模块还用于:预先构建生成对抗网络,生成对抗网络包括生成网络和判别网络;其中,生成网络包括线性映射层、多个卷积层以及位于多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,生成网络用于接收随机噪音并生成伪图像样本;判别网络包括多个卷积层和位于多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,判别网络用于对真实图像样本和伪图像样本进行真伪判定。
在一些实施方式中,生成网络的损失函数采用交叉熵函数。
需要说明的是,本申请实施例中的模型训练装置可以实现前述模型训练方法的实施例的各个过程,并达到相同的效果和功能,这里不再赘述。
基于相同的技术构思,本发明实施例还提供一种图像质量评估装置,用于执行上述实施例提供的图像质量评估方法。具体包括:接收模块,用于接收待评估图像;评估模块,用于利用如权第一方面的方法训练得到的图像质量评估模型对待评估图像进行图像质量评估,以确认待评估图像为多个预设的图像质量级别之一。
在一些实施方式中,待评估图像为待评估人脸图像,图像质量评估模型用于对人脸图像进行质量评估,评估模块还用于:接收待评估图像之后,利用人脸检测算法确定待评估人脸图像中的感兴趣区域(ROI),并根据确定的感兴趣区域(ROI)对待评估人脸图像进行裁剪处理;根据第一训练样本的尺寸对裁剪处理后的待评估人脸图像进行尺寸归一化;利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的待评估人脸图像是否为正脸图像;其中,若待评估人脸图像不是正脸图像则停止评估,若待评估人脸图像是正脸图像则利用图像质量评估模型对尺寸归一化之后的待评估图像进行图像质量评估。
在一些实施方式中,评估模块还用于:对待评估图像进行行方向滤波处理,得到第一滤波待评估图像;对待评估图像进行列方向滤波处理,得到第二滤波待评估图像;将待评估图像、第一滤波待评估图像和第二滤波待评估图像的合并图像输入图像质量评估模型进行评估,以确定待评估图像为预设的多个图像质量级别之一。
图7为根据本申请一实施例的模型训练装置,用于执行图1所示出的模型训练方法,该装置包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例所述的模型训练方法。
图8为根据本申请一实施例的图像质量评估装置,用于执行上述实施例所示出的图像质量评估方法,该装置包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例所述的图像质量评估方法。
根据本申请的一些实施例,提供了模型训练方法和图像质量评估方法的非易失性计算机存储介质,其上存储有计算机可执行指令,该计算机可执行指令设置为在由处理器运行时执行:上述实施例所述的方法。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以其描述进行了简化,相关之处可参见方法实施例的部分说明即可。
本申请实施例提供的装置、设备和计算机可读存储介质与方法是一一对应的,因此,装置、设备和计算机可读存储介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述装置、设备和计算机可读存储介质的有益技术效果。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (31)
1.一种模型训练方法,其特征在于,包括:
获取真实图像样本集,其中,所述真实图像样本集包括多个真实图像样本;
利用所述真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集所述生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集;
生成由所述真实图像样本集和所述多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对所述第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的所述第一训练样本库,其中,所述伪图像样本集包含的伪图像样本的图像质量级别与所述伪图像样本集的迭代轮次数成正比;
利用所述第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
2.根据权利要求1所述的方法,其特征在于,对所述第一训练样本库的每个第一训练样本进行自动分级标注,包括:
将所述真实图像样本集包含的所述真实图像样本标注为最高的图像质量级别;
根据每个所述伪图像样本集对应的迭代轮次数将每个所述伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别。
3.根据权利要求1所述的方法,其特征在于,对所述第一训练样本库的每个第一训练样本进行自动分级标注,包括:
将所述真实图像样本集包含的多个所述真实图像样本标注为最高的图像质量级别;
计算每个所述伪图像样本集与所述真实图像样本集的弗雷歇距离,根据计算结果将每个所述伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别。
4.根据权利要求1所述的方法,其特征在于,对所述第一训练样本库的每个第一训练样本进行自动分级标注,包括:
将所述真实图像样本集包含的多个所述真实图像样本标注为最高的图像质量级别;
计算每个伪图像样本与所述真实图像样本的均方误差(MSE)值,根据所述均方误差(MSE)值将每个所述伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别。
5.根据权利要求1所述的方法,其特征在于,所述获取真实图像样本集还包括:
采集多个真实图像,对多个所述真实图像进行以下预处理操作:
利用对象检测算法确定每个所述真实图像中的感兴趣区域(ROI),并根据确定的所述感兴趣区域(ROI)对每个所述真实图像进行裁剪处理;以及,对多个所述真实图像进行尺寸归一化,以得到所述真实图像样本集。
6.根据权利要求5所述的方法,其特征在于,所述真实图像样本为人脸图像,所述对象检测算法为人脸检测算法。
7.根据权利要求6所述的方法,其特征在于,所述获取真实图像样本集之后,所述方法还包括:
利用关键点检测算法和/或姿态估计算法去除所述真实图像样本集中的非正脸图片。
8.根据权利要求1所述的方法,其特征在于,利用所述第一训练样本库对预设多分类网络进行分类训练,获得图像质量评估模型,包括:
获取所述第一训练样本库中的每个带标签的所述第一训练样本,所述标签用于指示所述第一训练样本的图像质量级别;
对每个所述第一训练样本进行行方向滤波处理,得到第一滤波图像;
对每个所述第一训练样本进行列方向滤波处理,得到第二滤波图像;
将每个所述第一训练样本和对应的所述第一滤波图像和所述第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;
分别获取多个所述第一训练样本对应的多个所述第二训练样本,并将多个所述第二训练样本输入所述预设多分类网络进行迭代训练,以获取所述图像质量评估模型。
9.根据权利要求1所述的方法,其特征在于,
所述预设多分类网络为ResNet网络,所述预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
预先构建所述生成对抗网络,所述生成对抗网络包括所述生成网络和判别网络;其中,
所述生成网络包括线性映射层、多个卷积层以及位于所述多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,所述生成网络用于接收随机噪音并生成所述伪图像样本;
所述判别网络包括多个卷积层和位于所述多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于所述多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,所述判别网络用于对所述真实图像样本和所述伪图像样本进行真伪判定。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
所述生成网络的损失函数采用交叉熵函数。
12.一种图像质量评估方法,其特征在于,包括:
接收待评估图像;
利用如权利要求1-11任意一项所述的方法训练得到的所述图像质量评估模型对所述待评估图像进行图像质量评估,以确认所述待评估图像为多个预设的图像质量级别之一。
13.根据权利要求12所述的方法,其特征在于,所述待评估图像为待评估人脸图像,所述图像质量评估模型用于对人脸图像进行质量评估,所述方法还包括:
接收所述待评估图像之后,利用人脸检测算法确定所述待评估人脸图像中的感兴趣区域(ROI),并根据确定的所述感兴趣区域(ROI)对所述待评估人脸图像进行裁剪处理;
根据所述第一训练样本的尺寸对裁剪处理后的所述待评估人脸图像进行尺寸归一化;
利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的所述待评估人脸图像是否为正脸图像;
其中,若所述待评估人脸图像不是正脸图像则停止所述评估,若所述待评估人脸图像是正脸图像则利用所述图像质量评估模型对尺寸归一化之后的所述待评估图像进行图像质量评估。
14.根据权利要求12所述的方法,其特征在于,利用所述图像质量评估模型对所述待评估图像进行图像质量评估,包括:
对所述待评估图像进行行方向滤波处理,得到第一滤波待评估图像;
对所述待评估图像进行列方向滤波处理,得到第二滤波待评估图像;
将所述待评估图像、所述第一滤波待评估图像和所述第二滤波待评估图像的合并图像输入所述图像质量评估模型进行评估,以确定所述待评估图像为预设的多个所述图像质量级别之一。
15.一种模型训练装置,其特征在于,包括:
获取模块,用于获取真实图像样本集,其中,所述真实图像样本集包括多个真实图像样本;
生成对抗网络模块,用于利用所述真实图像样本集对预先构建的生成对抗网络进行迭代训练,收集所述生成对抗网络中的生成网络在多个迭代轮次中分别生成的多个伪图像样本集;
自动标注模块,用于生成由所述真实图像样本集和所述多个伪图像样本集组成的第一训练样本库,根据多个预设的图像质量级别对所述第一训练样本库的每个第一训练样本进行自动分级标注,得到带标签的所述第一训练样本库,其中,所述伪图像样本集包含的伪图像样本的图像质量级别与所述伪图像样本集的迭代轮次数成正比;
模型训练模块,用于利用所述第一训练样本库对预设多分类网络进行训练,获得图像质量评估模型。
16.根据权利要求15所述的装置,其特征在于,所述自动标注模块还用于:
将所述真实图像样本集包含的所述真实图像样本标注为最高的图像质量级别;
根据每个所述伪图像样本集对应的迭代轮次数将每个所述伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更高的迭代次数对应于更高的图像质量级别。
17.根据权利要求15所述的装置,其特征在于,所述自动标注模块还用于:
将所述真实图像样本集包含的多个所述真实图像样本标注为最高的图像质量级别;
计算每个所述伪图像样本集与所述真实图像样本集的弗雷歇距离,根据计算结果将每个所述伪图像样本集包含的多个伪图像样本标注为对应的图像质量级别,其中,更小的弗雷歇距离对应于更高的图像质量级别。
18.根据权利要求15所述的装置,其特征在于,所述自动标注模块还用于:
将所述真实图像样本集包含的多个所述真实图像样本标注为最高的图像质量级别;
计算每个伪图像样本与所述真实图像样本的均方误差(MSE)值,根据所述均方误差(MSE)值将每个所述伪图像样本标注为对应的图像质量级别,其中,更低的均方误差(MSE)值对应于更高的图像质量级别。
19.根据权利要求15所述的装置,其特征在于,所述获取模块还用于:
采集多个真实图像,对多个所述真实图像进行以下预处理操作:
利用对象检测算法确定每个所述真实图像中的感兴趣区域(ROI),并根据确定的所述感兴趣区域(ROI)对每个所述真实图像进行裁剪处理;以及,对多个所述真实图像进行尺寸归一化,以得到所述真实图像样本集。
20.根据权利要求19所述的装置,其特征在于,所述真实图像样本为人脸图像,所述对象检测算法为人脸检测算法。
21.根据权利要求20所述的装置,其特征在于,所述获取真实图像样本集之后,所述获取模块还用于:
利用关键点检测算法和/或姿态估计算法去除所述真实图像样本集中的非正脸图片。
22.根据权利要求15所述的装置,其特征在于,所述模型训练模块还用于:
获取所述第一训练样本库中的每个带标签的所述第一训练样本,所述标签用于指示所述第一训练样本的图像质量级别;
对每个所述第一训练样本进行行方向滤波处理,得到第一滤波图像;
对每个所述第一训练样本进行列方向滤波处理,得到第二滤波图像;
将每个所述第一训练样本和对应的所述第一滤波图像和所述第二滤波图像进行拼接合并,分别生成带标签的第二训练样本;
分别获取多个所述第一训练样本对应的多个所述第二训练样本,并将多个所述第二训练样本输入所述预设多分类网络进行迭代训练,以获取所述图像质量评估模型。
23.根据权利要求15所述的装置,其特征在于,
所述预设多分类网络为ResNet网络,所述预设多分类网络使用二分类交叉熵函数作为损失函数且利用softmax函数进行二分类。
24.根据权利要求15所述的装置,其特征在于,所述生成对抗网络模块还用于:
预先构建所述生成对抗网络,所述生成对抗网络包括所述生成网络和判别网络;其中,
所述生成网络包括线性映射层、多个卷积层以及位于所述多个卷积层的每个卷积层之后的批标准化函数和ReLU激活函数,所述生成网络用于接收随机噪音并生成所述伪图像样本;
所述判别网络包括多个卷积层和位于所述多个卷积层的每个卷积层之后的LeakyRelu激活函数层和池化层,以及位于所述多个卷积层之后的全连接层、LeakyRelu激活函数层和sigmoid激活函数层,所述判别网络用于对所述真实图像样本和所述伪图像样本进行真伪判定。
25.根据权利要求24所述的装置,其特征在于,所述生成网络的损失函数采用交叉熵函数。
26.一种图像质量评估装置,其特征在于,包括:
接收模块,用于接收待评估图像;
评估模块,用于利用如权利要求1-11任意一项所述的方法训练得到的所述图像质量评估模型对所述待评估图像进行图像质量评估,以确认所述待评估图像为多个预设的图像质量级别之一。
27.根据权利要求26所述的装置,其特征在于,所述待评估图像为待评估人脸图像,所述图像质量评估模型用于对人脸图像进行质量评估,所述评估模块还用于:
接收所述待评估图像之后,利用人脸检测算法确定所述待评估人脸图像中的感兴趣区域(ROI),并根据确定的所述感兴趣区域(ROI)对所述待评估人脸图像进行裁剪处理;
根据所述第一训练样本的尺寸对裁剪处理后的所述待评估人脸图像进行尺寸归一化;
利用关键点检测算法和/或姿态估计算法确定尺寸归一化之后的所述待评估人脸图像是否为正脸图像;
其中,若所述待评估人脸图像不是正脸图像则停止所述评估,若所述待评估人脸图像是正脸图像则利用所述图像质量评估模型对尺寸归一化之后的所述待评估图像进行图像质量评估。
28.根据权利要求26所述的装置,其特征在于,所述评估模块还用于:
对所述待评估图像进行行方向滤波处理,得到第一滤波待评估图像;
对所述待评估图像进行列方向滤波处理,得到第二滤波待评估图像;
将所述待评估图像、所述第一滤波待评估图像和所述第二滤波待评估图像的合并图像输入所述图像质量评估模型进行评估,以确定所述待评估图像为预设的多个所述图像质量级别之一。
29.一种模型训练装置,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如权利要求1-11任一项所述的方法。
30.一种图像质量评估方法,其特征在于,包括:
至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行:如权利要求12-14任一项所述的方法。
31.一种计算机可读存储介质,所述计算机可读存储介质存储有程序,当所述程序被多核处理器执行时,使得所述多核处理器执行如权利要求1-11中任一项所述的方法,或执行如权利要求12-14中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011578791.8A CN112700408B (zh) | 2020-12-28 | 2020-12-28 | 模型训练方法、图像质量评估方法及装置 |
PCT/CN2021/116766 WO2022142445A1 (zh) | 2020-12-28 | 2021-09-06 | 模型训练方法、图像质量评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011578791.8A CN112700408B (zh) | 2020-12-28 | 2020-12-28 | 模型训练方法、图像质量评估方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112700408A CN112700408A (zh) | 2021-04-23 |
CN112700408B true CN112700408B (zh) | 2023-09-08 |
Family
ID=75512748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011578791.8A Active CN112700408B (zh) | 2020-12-28 | 2020-12-28 | 模型训练方法、图像质量评估方法及装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112700408B (zh) |
WO (1) | WO2022142445A1 (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112700408B (zh) * | 2020-12-28 | 2023-09-08 | 中国银联股份有限公司 | 模型训练方法、图像质量评估方法及装置 |
CN113569627B (zh) * | 2021-06-11 | 2024-06-14 | 北京旷视科技有限公司 | 人体姿态预测模型训练方法、人体姿态预测方法及装置 |
CN113780101B (zh) * | 2021-08-20 | 2024-08-20 | 京东鲲鹏(江苏)科技有限公司 | 避障模型的训练方法、装置、电子设备及存储介质 |
CN114970670A (zh) * | 2022-04-12 | 2022-08-30 | 阿里巴巴(中国)有限公司 | 模型公平性评估方法及装置 |
CN115620079A (zh) * | 2022-09-19 | 2023-01-17 | 虹软科技股份有限公司 | 样本标签的获取方法和镜头失效检测模型的训练方法 |
CN115661619A (zh) * | 2022-11-03 | 2023-01-31 | 北京安德医智科技有限公司 | 网络模型训练、超声图像质量评估方法及装置、电子设备 |
CN116630465B (zh) * | 2023-07-24 | 2023-10-24 | 海信集团控股股份有限公司 | 一种模型训练、图像生成方法及设备 |
CN116958122B (zh) * | 2023-08-24 | 2024-06-21 | 北京东远润兴科技有限公司 | Sar图像评估方法、装置、设备及可读存储介质 |
CN117218485A (zh) * | 2023-09-05 | 2023-12-12 | 安徽省第二测绘院 | 基于深度学习模型的多源遥感影像解译样本库创建方法 |
CN117877219B (zh) * | 2023-12-20 | 2024-10-18 | 山东方垠智能制造有限公司 | 一种违规行为警报方法、系统、存储介质及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874763A (zh) * | 2018-06-08 | 2018-11-23 | 深圳勇艺达机器人有限公司 | 一种基于群智的语料库数据标注方法及系统 |
CN110110745A (zh) * | 2019-03-29 | 2019-08-09 | 上海海事大学 | 基于生成对抗网络的半监督x光图像自动标注 |
CN110634108A (zh) * | 2019-08-30 | 2019-12-31 | 北京工业大学 | 一种基于元-循环一致性对抗网络的复合降质网络直播视频增强方法 |
EP3611699A1 (en) * | 2018-08-14 | 2020-02-19 | Siemens Healthcare GmbH | Image segmentation using deep learning techniques |
WO2020143309A1 (zh) * | 2019-01-09 | 2020-07-16 | 平安科技(深圳)有限公司 | 分割模型训练方法、oct图像分割方法、装置、设备及介质 |
CN111814875A (zh) * | 2020-07-08 | 2020-10-23 | 西安电子科技大学 | 基于样式生成对抗网络的红外图像中舰船样本扩充方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10885383B2 (en) * | 2018-05-16 | 2021-01-05 | Nec Corporation | Unsupervised cross-domain distance metric adaptation with feature transfer network |
CN109102029B (zh) * | 2018-08-23 | 2023-04-07 | 重庆科技学院 | 信息最大化生成对抗网络模型合成人脸样本质量评估方法 |
CN111971686A (zh) * | 2018-12-12 | 2020-11-20 | 微软技术许可有限责任公司 | 自动生成用于对象识别的训练数据集 |
CN111027439B (zh) * | 2019-12-03 | 2022-07-29 | 西北工业大学 | 基于辅助分类生成对抗网络的sar目标识别方法 |
CN111476294B (zh) * | 2020-04-07 | 2022-03-22 | 南昌航空大学 | 一种基于生成对抗网络的零样本图像识别方法及系统 |
CN112700408B (zh) * | 2020-12-28 | 2023-09-08 | 中国银联股份有限公司 | 模型训练方法、图像质量评估方法及装置 |
-
2020
- 2020-12-28 CN CN202011578791.8A patent/CN112700408B/zh active Active
-
2021
- 2021-09-06 WO PCT/CN2021/116766 patent/WO2022142445A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874763A (zh) * | 2018-06-08 | 2018-11-23 | 深圳勇艺达机器人有限公司 | 一种基于群智的语料库数据标注方法及系统 |
EP3611699A1 (en) * | 2018-08-14 | 2020-02-19 | Siemens Healthcare GmbH | Image segmentation using deep learning techniques |
WO2020143309A1 (zh) * | 2019-01-09 | 2020-07-16 | 平安科技(深圳)有限公司 | 分割模型训练方法、oct图像分割方法、装置、设备及介质 |
CN110110745A (zh) * | 2019-03-29 | 2019-08-09 | 上海海事大学 | 基于生成对抗网络的半监督x光图像自动标注 |
CN110634108A (zh) * | 2019-08-30 | 2019-12-31 | 北京工业大学 | 一种基于元-循环一致性对抗网络的复合降质网络直播视频增强方法 |
CN111814875A (zh) * | 2020-07-08 | 2020-10-23 | 西安电子科技大学 | 基于样式生成对抗网络的红外图像中舰船样本扩充方法 |
Non-Patent Citations (1)
Title |
---|
基于生成式对抗网络的图像自动标注;税留成等;《计算机应用》;第39卷(第7期);第2129-2133页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112700408A (zh) | 2021-04-23 |
WO2022142445A1 (zh) | 2022-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112700408B (zh) | 模型训练方法、图像质量评估方法及装置 | |
US11640714B2 (en) | Video panoptic segmentation | |
CN112381098A (zh) | 基于目标分割领域自学习的半监督学习方法和系统 | |
CN113688665B (zh) | 一种基于半监督迭代学习的遥感影像目标检测方法及系统 | |
CN112148955A (zh) | 一种物联网时序数据异常检测方法及系统 | |
CN113920370A (zh) | 模型训练方法、目标检测方法、装置、设备及存储介质 | |
CN107577687A (zh) | 图像检索方法及装置 | |
CN112819110B (zh) | 基于权重生成的增量式小样本目标检测方法及系统 | |
CN111046910A (zh) | 图像分类、关系网络模型训练、图像标注方法及装置 | |
Alahmadi et al. | Code localization in programming screencasts | |
KR20190113680A (ko) | 웹 페이지의 테스트 케이스 생성 방법 및 장치 | |
Chen et al. | Adversarial learning of object-aware activation map for weakly-supervised semantic segmentation | |
CN112597997A (zh) | 感兴趣区域确定方法、图像内容识别方法及装置 | |
CN113361646A (zh) | 基于语义信息保留的广义零样本图像识别方法及模型 | |
CN115546831A (zh) | 一种多粒度注意力机制跨模态行人搜索方法和系统 | |
CN117671704A (zh) | 一种手写体数字识别方法、装置及计算机存储介质 | |
Nugroho et al. | Comparison of deep learning-based object classification methods for detecting tomato ripeness | |
Varadarajan et al. | Weakly Supervised Object Localization on grocery shelves using simple FCN and Synthetic Dataset | |
CN117218478A (zh) | 目标检测模型的训练方法、装置、设备、介质和程序产品 | |
CN116524520A (zh) | 文本的识别方法及装置、存储介质和电子设备 | |
CN106776654B (zh) | 一种数据搜索方法及装置 | |
CN115713621A (zh) | 一种利用文本信息的跨模态图像目标检测方法和装置 | |
CN116958720A (zh) | 目标检测模型的训练方法、目标检测方法、装置及设备 | |
Xia et al. | Automatic tag-to-region assignment via multiple instance learning | |
Yang et al. | Boundary-guided DCNN for building extraction from high-resolution remote sensing images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |