CN112733743B - 模型训练方法、数据、图像质量评估方法及相关装置 - Google Patents
模型训练方法、数据、图像质量评估方法及相关装置 Download PDFInfo
- Publication number
- CN112733743B CN112733743B CN202110048324.2A CN202110048324A CN112733743B CN 112733743 B CN112733743 B CN 112733743B CN 202110048324 A CN202110048324 A CN 202110048324A CN 112733743 B CN112733743 B CN 112733743B
- Authority
- CN
- China
- Prior art keywords
- image
- processing model
- image processing
- training
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 414
- 238000000034 method Methods 0.000 title claims abstract description 148
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 372
- 239000013598 vector Substances 0.000 claims abstract description 287
- 238000011156 evaluation Methods 0.000 claims abstract description 81
- 230000007423 decrease Effects 0.000 claims abstract description 27
- 230000008569 process Effects 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims description 190
- 230000000875 corresponding effect Effects 0.000 claims description 49
- 238000000605 extraction Methods 0.000 claims description 22
- 230000009467 reduction Effects 0.000 claims description 14
- 230000002596 correlated effect Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 230000003247 decreasing effect Effects 0.000 claims description 6
- 238000004891 communication Methods 0.000 claims description 3
- 239000000523 sample Substances 0.000 claims 41
- 230000008859 change Effects 0.000 abstract description 10
- 238000012854 evaluation process Methods 0.000 abstract description 9
- 239000000284 extract Substances 0.000 description 21
- 238000005192 partition Methods 0.000 description 14
- 238000001303 quality assessment method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000001514 detection method Methods 0.000 description 9
- 230000009471 action Effects 0.000 description 8
- 230000005284 excitation Effects 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000000611 regression analysis Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了模型训练方法、数据、图像质量评估方法及相关装置,可以获得图像处理模型的训练样本,训练样本未携带图像质量标签,使用训练样本对图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并基于差距更新图像处理模型。本发明可以利用训练出的图像处理模型对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,避免评估准确率在图像数量较多而人力不足时的下降,且图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种模型训练方法、数据、图像质量评估方法及相关装置。
背景技术
随着人工智能科学的发展,机器学习技术不断提高。
人脸识别模型可以是一种机器学习模型,能自动检测出某张图像中的人脸,对检测出的人脸进行脸部识别,确定人脸的身份信息。
人脸识别模型对于低质量的人脸图像(即包含人脸的图像)的脸部识别效果差。因此,在使用人脸识别模型对人脸图像进行脸部识别前,需由技术人员人为的对人脸图像进行质量评估,筛选出低质量的人脸图像,禁止机器对低质量的人脸图像进行脸部识别,减少对运算资源的无谓消耗。
但是,当图像数量较多而人力不足时,人为进行的人脸质量评估的准确率可能会下降,导致低质量的人脸图像进入到机器进行的脸部识别环节,从而导致对机器的资源利用率的降低。
发明内容
鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的模型训练方法、数据、图像质量评估方法及相关装置,技术方案如下:
一种图像处理模型的训练方法,包括:
获得所述图像处理模型的训练样本,所述训练样本未携带图像质量标签;
使用所述训练样本对所述图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型。
一种图像质量评估方法,包括:
将待评估图像输入至由上述任一图像处理模型的训练方法训练好的图像处理模型中,其中,所述待评估图像未携带图像质量标签;
获得由训练好的所述图像处理模型提取的所述待评估图像的目标图像特征向量;
根据所述目标图像特征向量的模长,评估所述待评估图像的质量。
一种数据处理模型的训练方法,包括:
获得所述数据处理模型的训练样本,所述训练样本未携带数据质量标签;
使用所述训练样本对所述数据处理模型进行训练,在训练过程中:至少从限制数据特征向量的可行区域和鼓励数据特征向量的大模长的角度,衡量所述数据处理模型的输出结果与真实值的差距,并基于所述差距更新所述数据处理模型。
一种数据质量评估方法,包括:
将待评估数据输入至由上述数据处理模型的训练方法训练好的数据处理模型中,其中,所述待评估数据未携带数据质量标签;
获得由训练好的所述数据处理模型提取的所述待评估数据的目标数据特征向量;
根据所述目标数据特征向量的模长,评估所述待评估数据的质量。
一种图像处理模型,所述图像处理模型由上述任一图像处理模型的训练方法训练得到。
一种图像处理模型的训练装置,包括:第一获得单元和第一训练单元,其中:
所述第一获得单元,被配置为执行:获得所述图像处理模型的训练样本,所述训练样本未携带图像质量标签;
所述第一训练单元,被配置为执行:使用所述训练样本对所述图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型。
一种图像质量评估装置,包括:第一输入单元、第二获得单元和第一评估单元,其中:
所述第一输入单元,被配置为执行:将待评估图像输入至由上述任一图像处理模型的训练方法训练好的图像处理模型中,其中,所述待评估图像未携带图像质量标签;
所述第二获得单元,被配置为执行:获得由训练好的所述图像处理模型提取的所述待评估图像的目标图像特征向量;
所述第一评估单元,被配置为执行:根据所述目标图像特征向量的模长,评估所述待评估图像的质量。
一种数据处理模型的训练装置,包括:第三获得单元和第二训练单元,其中:
所述第三获得单元,被配置为执行:获得所述数据处理模型的训练样本,所述训练样本未携带数据质量标签;
所述第二训练单元,被配置为执行:使用所述训练样本对所述数据处理模型进行训练,在训练过程中:至少从限制数据特征向量的可行区域和鼓励数据特征向量的大模长的角度,衡量所述数据处理模型的输出结果与真实值的差距,并基于所述差距更新所述数据处理模型。
一种数据质量评估装置,包括:第二输入单元、第四获得单元和第二评估单元,其中:
所述第二输入单元,被配置为执行:将待评估数据输入至由上述任一数据处理模型的训练方法训练好的数据处理模型中,其中,所述待评估数据未携带数据质量标签;
所述第四获得单元,被配置为执行:获得由训练好的所述数据处理模型提取的所述待评估数据的目标数据特征向量;
所述第二评估单元,被配置为执行:根据所述目标数据特征向量的模长,评估所述待评估数据的质量。
一种电子设备,包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。
一种计算机可读存储介质,其上存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。
一种计算机程序产品,包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。
本发明提供的图像处理模型的训练方法及装置,可以获得图像处理模型的训练样本,训练样本未携带图像质量标签,使用训练样本对图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并基于差距更新图像处理模型。本发明可以使得训练出的图像处理模型对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本发明提供的数据处理模型的训练方法及装置,可以对对象数据的质量进行评估,可以避免采用人工评估的方式对对象数据进行质量评估,提高评估效率,从而可以避免评估准确率在对象数据的数据量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的对象数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本发明提供的图像质量评估方法及装置,对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本发明提供的数据质量评估方法及装置,对待评估数据进行质量评估,避免采用人工评估的方式对待评估数据进行质量评估,提高评估效率,从而可以避免评估准确率在数据数量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本发明提供的图像处理模型,可以根据输入的图像,输出相应的图像处理结果,同时可以从输入的图像中提取出相应的图像特征向量,并可以根据提取出的图像特征向量的模长来评估输入的图像的图像质量。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本发明实施例提出的一种图像处理模型的训练方法的流程图;
图2示出了本发明实施例提出的一种可行区域的示意图;
图3示出了本发明实施例提出的一种由类间间隔函数限制后的可行区域的示意图;
图4示出了本发明实施例提出的一种类间间隔函数和模长损失函数作用于特征向量分布过程的示意图;
图5示出了本发明实施例提出的特征向量在类间间隔函数和模长损失函数共同作用后的分布示意图;
图6示出了本发明实施例提出的一种图像处理模型的训练装置的结构示意图;
图7示出了本发明实施例提出的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本实施例提出了一种图像处理模型的训练方法,该方法可以包括以下步骤:
S101、获得图像处理模型的训练样本,训练样本未携带图像质量标签;
需要说明的是,本发明可以应用于电子设备,如手机、平板电脑和台式电脑,本发明对此不做限定。
其中,图像处理模型为可以对图像进行相关处理的机器学习模型。
需要说明的是,本发明对于图像处理模型的具体处理方式不做限定。可选的,图像处理模型可以是比如图像识别模型和图像检测模型等用于对图像进行分类的图像处理模型。其中,图像识别模型可以是如人脸识别和猫脸识别等模型,图像检测模型可以是人脸检测和商品检测等模型。可选的,图像处理模型也可以是用于对图像进行回归分析的图像处理模型。
其中,本发明对于图像处理模型所处的训练阶段不做限定。比如,图像处理模型可以是未经训练过的模型;再比如,图像处理模型可以是开始训练的模型;再比如,图像处理模型可以是已使用某种训练方式训练好的模型。
可选的,训练样本可以是标注有标签的训练样本,也可以是未标注有标签的训练样本。需要说明的是,训练样本的标签与图像处理模型的模型类别相对应,比如,当图像处理模型为人脸识别模型时,训练样本可以为人脸图像(即包含人脸的图像),训练样本的标签可以为人脸所归属的人的姓名;再比如,当图像处理模型为商品检测模型时,训练样本可以为商品图像,训练样本的标签可以为商品名称。
其中,当训练样本标注有标签时,训练样本的标签中未携带有图像质量标签,即未对训练样本标注其图像质量。
需要说明的是,训练样本的数量可以是一个,也可以是多个,本发明对此不做限定。
具体的,当训练样本标注有标签时,本发明可以使用训练样本对图像处理模型进行有监督训练;当训练样本未标注有标签时,本发明可以使用训练样本对图像处理模型进行无监督训练;当部分训练样本标注有标签,部分训练样本未标注有标签时,本发明可以使用训练样本对图像处理模型进行半监督训练。
S102、使用训练样本对图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并基于该差距更新图像处理模型。
具体的,本发明可以使用获得的训练样本对图像处理模型进行训练。其中,在训练过程中,本发明可以至少从限制图像特征向量(即图像处理模型从训练样本中提取出的图像特征向量)的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并可以基于差距来更新图像处理模型的相关参数,以使得图像处理模型从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关。
其中,本发明还可以其它角度来衡量图像处理模型的输出结果与真实值的差距,比如训练样本的拍摄场景、获得训练样本后所采取的图像预处理方式和训练样本的图像格式等。
其中,可行区域可以为一个类别的训练样本的图像特征向量的分布空间的允许分布区域。需要说明的是,在确定第一训练样本的类别是否为第一类别时,可以判断第一训练样本的图像特征向量的分布空间是否分布在第一类别的训练样本的可行区域中,如果是,则可以确定第一训练样本的类别为第一类别,否则可以确定第一训练样本的类别不是第一类别。
其中,可行区域可以由训练样本的类中心和边界确定,不同类别的训练样本的可行区域可以是不同的。为更好的对可行区域进行解释,本发明提出如图2所示的一种可行区域。在图2中,O为原点,W和B分别为第一类别的训练样本的类中心和边界,W'和B'分别为隔壁类别的训练样本的类中心和边界,其中,由W和B确定的扇形区域即可以为第一类别的训练样本的可行区域,而由W'和B'确定的扇形区域即可以为隔壁类别的训练样本的可行区域,m为第一类别的训练样本与隔壁类别的训练样本的类别间隔。
需要说明的是,当训练样本的图像质量较高时,训练样本的图像特征向量的分布空间较集中,当训练样本的图像质量较低时,训练样本的图像特征向量的分布空间较分散。为更好的对训练样本的图像质量和图像特征向量的分布空间的关系进行解释,本发明提出如图2中所示的一种图像特征向量的分布空间。
在图2中,第一训练样本、第二训练样本和第三训练样本为均为第一类别的训练样本,第一训练样本、第二训练样本和第三训练样本图像质量依次减少,第一训练样本的图像特征向量的分布空间为椭圆1所在区域,第二训练样本的图像特征向量的分布空间为椭圆2所在区域,第三训练样本的图像特征向量的分布空间为椭圆3所在区域,椭圆1、椭圆2和椭圆3所占空间区域的大小依次减小。
其中,图像特征向量的模长可以为图像特征向量的分布空间距离原点的距离。
需要说明的是,现有技术在使用训练样本对图像处理模型进行训练时,从训练样本中提取出的图像特征向量的分布空间的分布位置与训练样本的图像质量无关,进一步的,现有技术从训练样本中提取出的图像特征向量的模长与训练样本的图像质量未呈正比关系。如图2中,现有技术从图像质量低的第三训练样本和第二训练样本中提取出的图像特征向量的模长,均大于从图像质量最高的第一训练样本中提取出的图像特征向量(椭圆3和椭圆2距离原点的距离均比椭圆1距离原点的距离大)。因此,现有技术训练出的图像处理模型无法从目标图像中提取出模长与目标图像的图像质量呈正相关的图像特征向量。
其中,图像处理模型的输出结果可以为图像处理模型所采取的处理方式对图像进行处理的结果。比如,当图像处理模型为用于对图像进行分类的图像处理模型时,图像处理模型的输出结果即可以为对图像的分类结果;进一步的,当图像处理模型为人脸识别模型时,图像处理模型的输出结果即可以为输入图像处理模型的人脸图像所归属的人的姓名。
其中,真实值可以为训练样本的与图像处理模型所采取的处理方式对应的真实属性值。比如,当图像处理模型为用于对图像进行分类的图像处理模型时,真实值可以为训练样本的真实图像类别;进一步的,当图像处理模型为人脸识别模型时,真实值可以为训练样本的人脸图像所归属的真实的人的姓名。
具体的,本发明在使用训练样本对图像处理模型进行训练的过程中,可以从将训练样本的图像特征向量限制在可行区域内的同时,鼓励训练样本的图像特征向量的模长为大模长的角度,来衡量图像处理模型的输出结果与真实值的差距。
其中,如果图像处理模型从训练样本中提取出的图像特征向量的分布空间的当前分布位置为可行区域内且离原点某一距离的位置,但图像特征向量的分布空间的分布位置可以在处于可行区域内的情况下还可以往距离原点更远的位置分布,则本发明可以确定图像处理模型的输出结果与真实值存在一定的差距;此时,本发明可以基于存在的差距对图像处理模型的相关参数进行更新,使得图像处理模型从训练样本中提取出的图像特征向量的分布空间的分布位置可以在处于可行区域内的情况下还可以往距离原点更远的位置进行分布。
其中,如果图像处理模型从训练样本中提取的图像特征向量的分布空间的当前分布位置为离原点某一距离但未处于可行区域内的位置,则本发明可以确定图像处理模型的输出结果与真实值存在较大的差距;此时,本发明可以基于存在的差距对图像处理模型的相关参数进行更新,使得图像处理模型从训练样本中提取出的图像特征向量的分布空间的分布位置,可以在远离原点的同时可以分布在可行区域内。
其中,如果图像处理模型从训练样本中提取的图像特征向量的分布空间的当前分布位置未分布在可行区域内且距离原点的位置较近,则本发明可以确定图像处理模型的输出结果与真实值存在较大的差距;此时,本发明可以基于存在的差距对图像处理模型的相关参数进行更新,使得图像处理模型从训练样本中提取出的图像特征向量的分布空间的分布位置,可以在远离原点的同时可以分布在可行区域内。
需要说明的是,本发明可以基于输出结果与真实值存在的差距对图像处理模型的相关参数进行更新,以使得图像处理模型从训练样本中提取的图像特征向量的分布空间的分布位置可以分布在可行区域内且尽量远离原点的位置,以使得图像处理模型从训练样本中提取的图像特征向量的模长尽可能的大。因此,采用图1所示方法训练出的图像处理模型,可以从训练样本中提取出模长与目标图像的图像质量呈正相关的图像特征向量,此时本发明可以根据从目标图像中提取出的图像特征向量的模长,来评估目标图像的图像质量,进而可以筛选出低质量的目标图像。
具体的,图1所示方法训练出的图像处理模型,可以在对目标图像进行处理时,从目标图像中提取出图像特征向量,根据图像特征向量的模长评估目标图像的图像质量,根据目标图像的图像质量确定是否继续对目标图像进行图像处理。比如,当图像处理模型为人脸识别模型时,可以在对目标图像进行人脸识别时,从目标图像中提取出图像特征向量,根据图像特征向量的模长评估目标图像的图像质量,根据目标图像的图像质量确定是否继续对目标图像进行人脸识别。
可以理解的是,图1所示方法训练出的图像处理模型可以为其它图像处理模型的待输入图像进行图像质量的评估,以确定是否继续使用上述其它图像处理模型对待输入图像进行相关处理。具体的,图1所示方法训练出的图像处理模型可以从其它图像处理模型的待输入图像中提取出图像特征向量,根据提取出的图像特征向量的模长对待输入图像的图像质量进行评估,以确定是否继续使用上述其它图像处理模型对待输入图像进行相关处理。比如,当图1所示方法训练出的图像处理模型为人脸检测模型,上述其它图像处理模型为人脸识别模型时,人脸检测模型可以从人脸识别模型的待输入图像中提取出图像特征向量,根据提取出的图像特征向量的模长对待输入图像的图像质量进行评估,以确定是否继续使用人脸识别模型对待输入图像进行人脸识别。
需要说明的是,本发明可以采用损失函数的方式来衡量图像处理模型的输出结果与真实值的差距,即采用损失函数的方式,来至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距。
可选的,步骤S102可以为:
根据预先设置的损失函数,使用训练样本对图像处理模型进行训练,在训练过程中:利用预先设置的损失函数衡量图像处理模型的输出结果与真实值的差距,并基于该差距更新图像处理模型;预先设置的损失函数的自变量可以包括:用于限制图像特征向量的可行区域的类间间隔函数及用于鼓励大模长的模长损失函数,类间间隔函数及模长损失函数的自变量均为图像特征向量的模长。
其中,在上述预先设置的损失函数中,本发明可以根据类间间隔函数,量化计算从限制图像特征向量的可行区域的角度,衡量图像处理模型的输出结果与真实值的差距,类间间隔函数对应的损失值可以为分类损失;
其中,在上述预先设置的损失函数中,本发明可以根据模长损失函数可以用于量化计算从限制图像特征向量的可行区域的角度,衡量图像处理模型的输出结果与真实值的差距,模长损失函数对应的损失值可以为模长损失。
具体的,当图像特征向量的模长增大时,类间间隔函数的函数值可以增大,分类损失可以增大,增大的分类损失可以使得损失函数的整体损失增大;当图像特征向量的模长增大时,模长损失函数的函数值可以减小,模长损失可以减小,减小的模长损失可以使得损失函数的整体损失减小。
具体的,图像处理模型在对图像质量高的某个训练样本进行分类时,分类正确的概率大,类间间隔函数对应的分类损失较小,模长损失函数对应的模长损失较大,模长损失函数对应的模长损失在该训练样本的整体损失中的占比较大,模长损失函数对于增大该训练样本的图像特征向量的模长的激励作用占主导作用。此时,可以通过降低该训练样本的模长损失来有效降低该训练样本的整体损失。具体的,可以使得该训练样本的图像特征向量的分布空间往更加远离原点的区域进行分布,使得该训练样本的图像特征向量的模长增大,使得模长损失函数的函数值减小,使得模长损失减小,实现对该训练样本的模长损失的降低;
具体的,图像处理模型在对图像质量低的某个训练样本进行分类时,分类正确的概率小,类间间隔函数对应的分类损失较大,模长损失函数对应的模长损失较小,类间间隔函数对应的分类损失在该训练样本的整体损失中的占比较大,类间间隔函数对于将该训练样本的图像特征向量限制在可行区域中的作用占主导作用。此时,可以通过降低该训练样本的分类损失来有效降低该训练样本的整体损失。具体的,可以使得该训练样本的图像特征向量的分布空间可以往靠近原点的区域进行分布,使得该训练样本的图像特征向量的模长减小,使得类间间隔函数的函数值减小,使得分类损失减小,实现对该训练样本的分类损失的降低。
具体的,使用上述预先设置的损失函数进行训练的图像处理模型,在使用训练样本进行训练时,当训练样本的图像质量较高时,图像处理模型可以从训练样本中提取出模长较大的图像特征向量,当训练样本的图像质量较低时,图像处理模型可以从训练样本中提取出模长较小的图像特征向量,即图像处理模型从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关。
可选的,在本实施例提出的其它图像处理模型的训练方法中,图1所示方法还可以包括步骤S103,其中:
S103、图像处理模型在使用预先设置的损失函数进行训练时,在类间间隔函数及模长损失函数的影响下,学习到图像特征向量提取方式,图像特征向量提取方式使得:图像处理模型从目标训练样本中提取到的图像特征向量的模长与目标训练样本的图像质量正相关。
其中,类间间隔函数可以使得某个类别的训练样本与隔壁类别的训练样本的类别间隔在远离原点的方向上不断增大,从而对可行区域进行限制。需要说明的是,在现有技术中,不同类别训练样本间的类别间隔可以是不变的,如图2中第一类别的训练样本与隔壁类别的训练样本的类别间隔保持m不变。
其中,模长损失函数可以用于对训练样本的图像特征向量的模长进行激励,使得训练样本的图像特征向量的分布空间可以在可行区域内往远离原点的位置进行分布。
为更好的对类间间隔函数的作用进行解释,本发明在图2所示的可行区域的基础上,在图3中提出由类间间隔限制后的可行区域。
在图3中,m1、m2和m3均可以为第一类别的训练样本与隔壁类别的类间间隔,B1、B2和B3分别为m1、m2和m3时对应的第一类别的训练样本的边界,a1、a2和a3分别为第一类别的类中心上远离原点方向的不同距离,m1、m2和m3的数值依次增大,a1、a2和a3的数值依次增大。其中,m1是第一类别中图像特征向量模长为a1的训练样本与隔壁类别的训练样本的类间间隔,m2是第一类别中图像特征向量模长为a2的训练样本与隔壁类别的训练样本的类间间隔,m3是第一类别中图像特征向量模长为a3的训练样本与隔壁类别的训练样本的类间间隔。具体的,类间间隔函数可以使得第一类别的训练样本与隔壁类别的训练样本的类间间隔,与第一类别的训练样本的图像特征向量模长可以呈正相关关系,从而可以将第一类别在图2中所示的扇形可行区域限制为图3中所示的类似于三角形的可行区域。
具体的,在类间间隔函数和模长损失函数的共同作用下,本发明可以在图像处理模型提取某个类别的训练样本的图像特征向量时,激励该类别的训练样本的图像特征向量远离原点的区域进行分布,从而激励该类别的训练样本的图像特征向量的模长增大,同时由于该类别的训练样本的图像特征向量不能离开其对应的经类间间隔函数限制后的可行区域的范围。
因此,在类间间隔函数和模长损失函数的作用下,图像处理模型在提取某个类别的训练样本的图像特征向量时,该类别中分布较集中的图像特征向量的分布空间可以分布至距离原点更远的区域,分布较分散的图像特征向量的分布空间可以分布至距离原点相对近的区域,即图像质量高的训练样本的图像特征向量的分布空间可以分布至距离原点更远的区域,图像质量低的训练样本的图像特征向量的分布空间可以分布至距离原点更近的区域,即图像质量越低的训练样本,图像特征向量的模长越小,图像质量越高的训练样本,图像特征向量的模长越大,从而使得图像处理模型可以学习到图像特征向量提取方式,图像处理模型在图像特征向量提取方式中,从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关关系。
可选的,步骤S103可以包括:
图像处理模型在使用损失函数进行训练时,在类间间隔函数及模长损失函数的影响下,学习到所提取的图像特征向量的分布空间在可行区域中的所在位置,进而学习到分布空间在可行区域中的所在位置对应的图像特征向量提取方式,其中,不同分布空间所在位置与不同的图像特征向量的模长对应,图像特征向量提取方式使得:图像处理模型从目标训练样本中提取到的图像特征向量的模长与目标训练样本的图像质量正相关。
具体的,在类间间隔函数和模长损失函数的共同作用下,图像处理模型可以根据训练样本的特征向量的分布空间的集中度,将训练样本的特征向量的分布空间分布至可行区域中的相应位置,使即将分布空间较集中的训练样本的特征向量分布至可行区域中距离原点较远的区域,将分布空间较分散的训练样本的特征向量分布至可行区域中距离原点较近的区域,使得图像处理模型学习到相应的图像特征向量提取方式,即可以从特征向量的分布空间集中度较高的训练样本中提取出模长较大的特征向量,从特征向量的分布空间集中度较低的训练样本中提取出模长较小的特征向量。
为更好的对类间间隔函数和模长损失函数的共同作用进行说明,本发明基于图2和图3,提出图4所示的一种特征向量分布过程的示意图。
在图4中,一个箭头表示模长损失函数的激励作用,另一个箭头表示类间间隔函数的限制作用,模长损失函数可以分别激励属于第一类别的第一训练样本、第二训练样本和第三训练样本的图像特征向量的分布空间往远离原点的方向进行分布,而第一类别的训练样本的图像特征向量的分布空间均不能离开经类间间隔函数限制后的可行区域的范围。
具体的,在模长损失函数的激励作用下,训练样本的图像特征向量的分布空间可以一直往远离原点O的方向分布,在即将超出可行区域时,类间间隔函数将对其进行限制,将分布空间限制在可行区域内;此后,当分布空间处于可行区域内时,模长损失函数的激励作用又可以继续激励分布空间往远离原点O的方向分布,在即将超出可行区域时,类间间隔函数又将对其进行限制……如此反复至分布空间在可行区域内的位置处于稳定。
可以理解的是,如图5所示,在模长损失函数和类间间隔函数的共同作用后,在第一训练样本、第二训练样本和第三训练样本的图像特征向量中,分布最集中的第一训练样本的图像特征向量的分布空间(椭圆1)可以分布至距离原点最远的区域,分布较分散的第二训练样本的图像特征向量的分布空间(椭圆2)可以分布至距离原点较远的区域,分布最分散的第三训练样本的图像特征向量的分布空间(椭圆3)可以分布至距离原点最近的区域,即图像质量最高的训练样本的图像特征向量的分布空间(椭圆1)可以分布至距离原点最远的区域,图像质量较低的训练样本的图像特征向量的分布空间(椭圆2)可以分布至距离原点较远的区域,图像质量最低的训练样本的图像特征向量的分布空间(椭圆3)可以分布至距离原点最近的区域,即图像质量最高的第一训练样本的图像特征向量的模长最大,图像质量较低的第二训练样本的图像特征向量的模长较小,图像质量最低的第三训练样本的图像特征向量的模长最小。
可以理解的是,本发明通过图1所示方法可以使得图像处理模型具备从目标图像中,提取出模长与目标图像的图像质量呈正相关关系的特征向量,即目标图像的图像质量越高,图像处理模型从目标图像中提取出的特征向量的模长越大,目标图像的图像质量越低,图像处理模型从目标图像中提取出的特征向量的模长越小。比如,当图像处理模型为人脸识别模型时,图像处理模型可以具备从人脸图像中,提取出模长与人脸图像的图像质量呈正相关关系的特征向量,即人脸图像的图像质量越高,图像处理模型从人脸图像中提取出的特征向量的模长越大,人脸图像的图像质量越低,图像处理模型从人脸图像中提取出的特征向量的模长越小。
具体的,本发明可以采用图1所示方法训练出的图像处理模型进行图像质量评估。
比如:当图像处理模型为人脸识别模型时,图像处理模型可以先行从图像质量合格或者良好的人脸图像中提取出相应的特征向量,将该特征向量的模长作为标准阈值;之后,图像处理模型可以从待评估的人脸图像中提取出特征向量,根据提取出的特征向量的模长和标准阈值的关系,对待评估的人脸图像的图像质量进行评估;其中,当待评估的人脸图像的特征向量的模长小于标准阈值时,本发明可以确定待评估的人脸图像的图像质量不合格,或者为低质量;当待评估的人脸图像的特征向量的模长不小于标准阈值时,本发明可以确定待评估的人脸图像的图像质量合格,或者为高质量。
还需要说明的是,本发明可以采用图1所示方法训练出的图像处理模型对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本实施例提出的图像处理模型的训练方法,获得图像处理模型的训练样本,训练样本未携带图像质量标签,使用训练样本对图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并基于差距更新图像处理模型。本发明可以使得训练出的图像处理模型对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
基于图1所示的步骤,本实施例提出另一种图像处理模型的训练方法。在该方法中,上述预先设置的损失函数可以为:
Li=f(m(ai),g(ai));
其中,LMag为上述预先设置的损失函数的整体损失值,N为样本总数,i为样本的序号,Li是序号为i的样本的样本损失值;ai是序号为i的样本的特征向量的模长,m(ai)为类间间隔函数,g(ai)为模长损失函数;
其中,ai的取值范围为[la,ua];m(ai)是在区间[la,ua]上单调递增的凸函数,当ai增大时,m(ai)增大,m(ai)的增大使得Li增大;g(ai)是在区间[la,ua]上单调递减的严格凸函数,在g(ai)的导函数g'(ai)中,g'(ua)=0;当ai增大时,g(ai)减小,g(ai)的减小使得Li减小;其中,la为预设的模长下界值,ua为预设的模长上界值。
其中,上述预先设置的损失函数的整体损失值可以包括各训练样本的整体损失。
其中,某个训练样本的整体损失可以包括该训练样本的分类损失和模长损失。分类损失可以为类间间隔函数对应的损失,模长损失可以为模长损失函数对应的损失。
其中,当模长ai增大时,m(ai)可以增大,m(ai)对应的分类损失可以增大,从而可以使得Li增大;当模长ai增大时,g(ai)减小,g(ai)对应的模长损失减小,从而可以使得Li减小。
需要说明的是,本发明可以通过对la和ua的设置,使得本发明训练的图像处理模型从图像中提取出的特征向量的模长均位于[la,ua]中,即对各图像的特征向量的模长进行归一化处理,可以使得在根据模长对图像质量进行评估时,有效提高评估便利性和评估效率。
其中,la和ua可以由技术人员根据实际情况设置,本发明对此不做限定。
进一步的,本发明可以通过保持对la和ua的设定值不变,使得在训练样本的数据集发生变化时,图像处理模型提取出的模长可以保持在一个相对一致的范围,从而使得用于质量评估的标准阈值也可以保持在一个相对一致的水平,有效提高图像处理模型的适用性。
可选的,Li=f1(m(ai))+f2(g(ai))。
其中,当ai增大时,m(ai)增大,f1(m(ai))增大;当ai增大时,g(ai)减小,f2(g(ai))减小。
具体的,f1(m(ai))的值可以为m(ai)对应的分类损失;f2(g(ai))的值可以为g(ai)对应的模长损失。
可选的,
/>
其中,s为用于调节余弦函数的缩放系数,yi是序号为i的样本数据所属的样本类别的编号,是序号为i的样本数据的特征向量与/>间的夹角,/>是编号为yi的样本类别的类别中心,j为样本类别的编号,n为样本类别的总数,θj是序号为i的样本数据的特征向量与wj间的夹角,wj是编号为j的样本类别的类别中心;λg为平衡系数;m'(ai)为m(ai)的导函数;k为第一预设阈值。
需要说明的是,本发明损失函数可以是在现有的ArcFace函数的基础上,根据m(ai)和g(ai)进行相关改进获得的。
其中,λg为平衡系数,可以用于调整g(ai)在损失函数中的损失占比,平衡m(ai)对应的分类损失和g(ai)对应的模长损失在损失函数中的比重。
具体的,m(ai)的导函数m'(ai)的取值范围包含于(0,k]。
其中,k可以为正数,具体数值可以由技术人员根据实际情况和m'(ai)的取值进行设置。
可选的,
m(ai)=k·ai+b,b为实数;
可选的,
g(ai)=(ai-ua)2;
本实施例提出的图像处理模型的训练方法,可以根据损失函数的特征对损失函数进行具体设计,并可以使用设计出的损失函数对图像处理模型进行训练,使得图像处理模型具备从图像中提取出的图像特征向量的模长与图像质量呈正相关关系。
基于上述图像处理模型的训练方法,本实施例提出一种图像质量评估方法,该方法可以包括以下步骤:
将待评估图像输入至上述图像处理模型的训练方法训练好的图像处理模型中,其中,待评估图像未携带图像质量标签;
获得由训练好的图像处理模型提取的待评估图像的目标图像特征向量;
根据目标图像特征向量的模长,评估待评估图像的质量。
可以理解的是,通过上述图像处理模型的训练方法训练出的图像处理模型,可以从待评估图像中,提取出模长与待评估图像的图像质量呈正相关关系的特征向量,即待评估图像的图像质量越高,图像处理模型从待评估图像中提取出的特征向量的模长越大,待评估图像的图像质量越低,图像处理模型从待评估图像中提取出的特征向量的模长越小。比如,当图像处理模型为人脸识别模型时,图像处理模型可以具备从待评估人脸图像中,提取出模长与待评估人脸图像的图像质量呈正相关关系的特征向量,即待评估人脸图像的图像质量越高,图像处理模型从待评估人脸图像中提取出的特征向量的模长越大,待评估人脸图像的图像质量越低,图像处理模型从待评估人脸图像中提取出的特征向量的模长越小。
本实施例提出的图像质量评估方法,对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本实施例提出一种数据处理模型的训练方法,可以包括以下步骤:
获得数据处理模型的训练样本,训练样本未携带数据质量标签;
使用训练样本对数据处理模型进行训练,在训练过程中:至少从限制数据特征向量的可行区域和鼓励数据特征向量的大模长的角度,衡量数据处理模型的输出结果与真实值的差距,并基于差距更新数据处理模型。
其中,数据处理模型可以为对对象数据进行处理的机器学习模型,本发明对于数据处理模型的具体模型类型不做限定,如图像处理模型、视频处理模型、文本处理模型和音频处理模型等。
可以理解的是,本发明对于对象数据的具体数据类型不做限定,如图像数据、视频数据、文本数据及音频数据等。具体的,对象数据的数据类型可以与数据处理模型的具体模型类型相对应,当数据处理模型为图像处理模型时,对象数据的数据类型即为图像数据;当数据处理模型为文本处理模型时,对象数据的数据类型即为文本数据。
具体的,经上述数据处理模型的训练方法训练出的数据处理模型,可以从对象数据中提取出模长与对象数据的质量呈正相关的特征向量,从而使得可以根据对对象数据所提取出的特征向量的模长,来对对象数据的质量进行评估。
本发明提出的数据处理模型的训练方法,可以对对象数据的质量进行评估,可以避免采用人工评估的方式对对象数据进行质量评估,提高评估效率,从而可以避免评估准确率在对象数据的数据量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的对象数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本实施例提出一种数据质量评估方法,可以包括以下步骤:
将待评估数据输入至由上述数据处理模型的训练方法训练好的数据处理模型中,其中,待评估数据未携带数据质量标签;
获得由训练好的数据处理模型提取的待评估数据的目标数据特征向量;
根据目标数据特征向量的模长,评估待评估数据的质量。
可以理解的是,通过上述数据处理模型的训练方法训练出的数据处理模型,可以从待评估数据中,提取出模长与待评估数据的数据质量呈正相关关系的特征向量,即待评估数据的数据质量越高,数据处理模型从待评估数据中提取出的特征向量的模长越大,待评估数据的数据质量越低,数据处理模型从待评估数据中提取出的特征向量的模长越小。比如,当数据处理模型为图像处理模型时,数据处理模型可以从待评估数据,即待评估图像中,提取出模长与待评估图像的图像质量呈正相关关系的特征向量,即待评估图像的图像质量越高,图像处理模型从待评估图像中提取出的特征向量的模长越大,待评估图像的图像质量越低,图像处理模型从待评估图像中提取出的特征向量的模长越小。进一步的,当图像处理模型为人脸识别模型时,图像处理模型可以具备从待评估人脸图像中,提取出模长与待评估人脸图像的图像质量呈正相关关系的特征向量,即待评估人脸图像的图像质量越高,图像处理模型从待评估人脸图像中提取出的特征向量的模长越大,待评估人脸图像的图像质量越低,图像处理模型从待评估人脸图像中提取出的特征向量的模长越小。
本实施例提出的数据质量评估方法,对待评估数据进行质量评估,避免采用人工评估的方式对待评估数据进行质量评估,提高评估效率,从而可以避免评估准确率在数据数量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
本实施例提出一种图像处理模型,该图像处理模型可以由上述任一图像处理模型的训练方法训练得到。可选的,图像处理模型的输入为待评估图像,图像处理模型的输出为根据待评估图像的目标图像特征向量获得的输出,且图像处理模型根据目标图像特征向量的模长评估待评估图像的质量。
其中,目标图像特征向量可以为图像处理模型从待评估图像中提取出的图像特征向量。
其中,图像处理模型的输出可以为根据待评估图像的目标图像特征向量获得的输出。比如,当图像处理模型为用于对图像进行分类的图像处理模型时,图像处理模型的输出可以为根据待评估图像的目标图像特征向量所输出的图像分类结果。进一步的,当图像处理模型为用于对人脸进行识别的人脸识别模型时,图像处理模型的输出可以为根据待评估人脸图像的目标图像特征向量所进行的人脸识别结果,即输出待评估人脸图像所属的人的姓名。
其中,图像处理模型可以根据目标图像特征向量的模长评估待评估图像的质量。具体的,由上述任一图像处理模型的训练方法训练得到的图像处理模型,可以从待评估图像中提取出模长与待评估图像的图像质量呈正相关的图像特征向量。因此,图像处理模型可以根据从待评估图像中提取出的图像特征向量的模长的大小,来对待评估图像的图像质量进行评估。
本实施例提出的图像处理模型,可以根据输入的图像,输出相应的图像处理结果,同时可以从输入的图像中提取出相应的图像特征向量,并可以根据提取出的图像特征向量的模长来评估输入的图像的图像质量。
与图1所示方法相对应,本实施例提出一种图像处理模型的训练装置,如图6所示,该装置可以包括:第一获得单元101和第一训练单元102,其中:
第一获得单元101,被配置为执行:获得图像处理模型的训练样本,训练样本未携带图像质量标签;
其中,图像处理模型为可以对图像进行相关处理的机器学习模型。
需要说明的是,本发明对于图像处理模型的具体处理方式不做限定。可选的,图像处理模型可以是比如图像识别模型和图像检测模型等用于对图像进行分类的图像处理模型。可选的,图像处理模型也可以是用于对图像进行回归分析的图像处理模型。
可选的,训练样本可以是标注有标签的训练样本,也可以是未标注有标签的训练样本。需要说明的是,训练样本的标签与图像处理模型的模型类别相对应,比如,当图像处理模型为人脸识别模型时,训练样本可以为人脸图像(即包含人脸的图像),训练样本的标签可以为人脸所归属的人的姓名;再比如,当图像处理模型为商品检测模型时,训练样本可以为商品图像,训练样本的标签可以为商品名称。
其中,当训练样本标注有标签时,训练样本的标签中未携带有图像质量标签,即未对训练样本标注其图像质量。
第一训练单元102,被配置为执行:使用训练样本对图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并基于该差距更新图像处理模型。
具体的,本发明可以使用获得的训练样本对图像处理模型进行训练。其中,在训练过程中,本发明可以至少从限制图像特征向量(即图像处理模型从训练样本中提取出的图像特征向量)的可行区域和鼓励图像特征向量的大模长的角度,衡量图像处理模型的输出结果与真实值的差距,并可以基于差距来更新图像处理模型的相关参数,以使得图像处理模型从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关。
其中,可行区域可以为一个类别的训练样本的图像特征向量的分布空间的允许分布区域。可行区域可以由训练样本的类中心和边界确定,不同类别的训练样本的可行区域可以是不同的。
其中,图像处理模型的输出结果可以为图像处理模型所采取的处理方式对图像进行处理的结果。真实值可以为训练样本的与图像处理模型所采取的处理方式对应的真实属性值。
具体的,本发明在使用训练样本对图像处理模型进行训练的过程中,可以从将训练样本的图像特征向量限制在可行区域内的同时,鼓励训练样本的图像特征向量的模长为大模长的角度,来衡量图像处理模型的输出结果与真实值的差距。
需要说明的是,本发明可以基于输出结果与真实值存在的差距对图像处理模型的相关参数进行更新,以使得图像处理模型从训练样本中提取的图像特征向量的分布空间的分布位置可以分布在可行区域内且尽量远离原点的位置,以使得图像处理模型从训练样本中提取的图像特征向量的模长尽可能的大。因此,采用图6所示装置训练出的图像处理模型,可以从训练样本中提取出模长与目标图像的图像质量呈正相关的图像特征向量,此时本发明可以根据从目标图像中提取出的图像特征向量的模长,来评估目标图像的图像质量,进而可以筛选出低质量的目标图像。
可选的,第一训练单元102,可以被配置为执行:根据预先设置的损失函数,使用训练样本对图像处理模型进行训练,在训练过程中:利用损失函数衡量图像处理模型的输出结果与真实值的差距,并基于该差距更新图像处理模型;预先设置的损失函数的自变量可以包括:用于限制图像特征向量的可行区域的类间间隔函数及用于鼓励大模长的模长损失函数,类间间隔函数及模长损失函数的自变量均为图像特征向量的模长。
其中,在上述预先设置的损失函数中,本发明可以根据类间间隔函数,量化计算从限制图像特征向量的可行区域的角度,衡量图像处理模型的输出结果与真实值的差距,类间间隔函数对应的损失值可以为分类损失;
其中,在上述预先设置的损失函数中,本发明可以根据模长损失函数可以用于量化计算从限制图像特征向量的可行区域的角度,衡量图像处理模型的输出结果与真实值的差距,模长损失函数对应的损失值可以为模长损失。
具体的,当图像特征向量的模长增大时,类间间隔函数的函数值可以增大,分类损失可以增大,增大的分类损失可以使得损失函数的整体损失增大;当图像特征向量的模长增大时,模长损失函数的函数值可以减小,模长损失可以减小,减小的模长损失可以使得损失函数的整体损失减小。
具体的,图像处理模型在对图像质量高的某个训练样本进行分类时,分类正确的概率大,类间间隔函数对应的分类损失较小,模长损失函数对应的模长损失较大,模长损失函数对应的模长损失在该训练样本的整体损失中的占比较大,模长损失函数对于增大该训练样本的图像特征向量的模长的激励作用占主导作用。此时,可以通过降低该训练样本的模长损失来有效降低该训练样本的整体损失。具体的,可以使得该训练样本的图像特征向量的分布空间往更加远离原点的区域进行分布,使得该训练样本的图像特征向量的模长增大,使得模长损失函数的函数值减小,使得模长损失减小,实现对该训练样本的模长损失的降低;
具体的,图像处理模型在对图像质量低的某个训练样本进行分类时,分类正确的概率小,类间间隔函数对应的分类损失较大,模长损失函数对应的模长损失较小,类间间隔函数对应的分类损失在该训练样本的整体损失中的占比较大,类间间隔函数对于将该训练样本的图像特征向量限制在可行区域中的作用占主导作用。此时,可以通过降低该训练样本的分类损失来有效降低该训练样本的整体损失。具体的,可以使得该训练样本的图像特征向量的分布空间可以往靠近原点的区域进行分布,使得该训练样本的图像特征向量的模长减小,使得类间间隔函数的函数值减小,使得分类损失减小,实现对该训练样本的分类损失的降低。
具体的,使用上述预先设置的损失函数进行训练的图像处理模型,在使用训练样本进行训练时,当训练样本的图像质量较高时,图像处理模型可以从训练样本中提取出模长较大的图像特征向量,当训练样本的图像质量较低时,图像处理模型可以从训练样本中提取出模长较小的图像特征向量,即图像处理模型从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关。
可选的,在本实施例提出的其它图像处理模型的训练装置中,图6所示装置还可以包括学习单元,学习单元被配置为执行:图像处理模型在使用损失函数进行训练时,在类间间隔函数及模长损失函数的影响下,学习到图像特征向量提取方式,图像特征向量提取方式使得:图像处理模型从目标训练样本中提取到的图像特征向量的模长与目标训练样本的图像质量正相关。
其中,类间间隔函数可以使得某个类别的训练样本与隔壁类别的训练样本的类别间隔在远离原点的方向上不断增大,从而对可行区域进行限制。
其中,模长损失函数可以用于对训练样本的图像特征向量的模长进行激励,使得训练样本的图像特征向量的分布空间可以在可行区域内往远离原点的位置进行分布。
具体的,在类间间隔函数和模长损失函数的共同作用下,本发明可以在图像处理模型提取某个类别的训练样本的图像特征向量时,激励该类别的训练样本的图像特征向量远离原点的区域进行分布,从而激励该类别的训练样本的图像特征向量的模长增大,同时由于该类别的训练样本的图像特征向量不能离开其对应的经类间间隔函数限制后的可行区域的范围。
因此,在类间间隔函数和模长损失函数的作用下,图像处理模型在提取某个类别的训练样本的图像特征向量时,该类别中分布较集中的图像特征向量的分布空间可以分布至距离原点更远的区域,分布较分散的图像特征向量的分布空间可以分布至距离原点相对近的区域,即图像质量高的训练样本的图像特征向量的分布空间可以分布至距离原点更远的区域,图像质量低的训练样本的图像特征向量的分布空间可以分布至距离原点更近的区域,即图像质量越低的训练样本,图像特征向量的模长越小,图像质量越高的训练样本,图像特征向量的模长越大,从而使得图像处理模型可以学习到图像特征向量提取方式,图像处理模型在图像特征向量提取方式中,从训练样本中提取出的图像特征向量的模长可以与训练样本的图像质量呈正相关关系。
可选的,学习单元被配置为执行:图像处理模型在使用损失函数进行训练时,在类间间隔函数及模长损失函数的影响下,学习到所提取的图像特征向量的分布空间在可行区域中的所在位置,进而学习到分布空间在可行区域中的所在位置对应的图像特征向量提取方式,其中,不同分布空间所在位置与不同的图像特征向量的模长对应,图像特征向量提取方式使得:图像处理模型从目标训练样本中提取到的图像特征向量的模长与目标训练样本的图像质量正相关。
具体的,在类间间隔函数和模长损失函数的共同作用下,图像处理模型可以根据训练样本的特征向量的分布空间的集中度,将训练样本的特征向量的分布空间分布至可行区域中的相应位置,使即将分布空间较集中的训练样本的特征向量分布至可行区域中距离原点较远的区域,将分布空间较分散的训练样本的特征向量分布至可行区域中距离原点较近的区域,使得图像处理模型学习到相应的图像特征向量提取方式,即可以从特征向量的分布空间集中度较高的训练样本中提取出模长较大的特征向量,从特征向量的分布空间集中度较低的训练样本中提取出模长较小的特征向量。
本实施例提出的图像处理模型的训练装置,可以使得训练出的图像处理模型对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
基于图1所示的步骤,本实施例提出另一种图像处理模型的训练装置。在该装置中,上述预先设置的损失函数可以为:
Li=f(m(ai),g(ai));
其中,LMag为上述预先设置的损失函数的整体损失值,N为样本总数,i为样本的序号,Li是序号为i的样本的样本损失值;ai是序号为i的样本的特征向量的模长,m(ai)为类间间隔函数,g(ai)为模长损失函数;
其中,ai的取值范围为[la,ua];m(ai)是在区间[la,ua]上单调递增的凸函数,当ai增大时,m(ai)增大,m(ai)的增大使得Li增大;g(ai)是在区间[la,ua]上单调递减的严格凸函数,在g(ai)的导函数g'(ai)中,g'(ua)=0;当ai增大时,g(ai)减小,g(ai)的减小使得Li减小;其中,la为预设的模长下界值,ua为预设的模长上界值。
可选的,Li=f1(m(ai))+f2(g(ai))。
其中,当ai增大时,m(ai)增大,f1(m(ai))增大;当ai增大时,g(ai)减小,f2(g(ai))减小。
具体的,f1(m(ai))的值可以为m(ai)对应的分类损失;f2(g(ai))的值可以为g(ai)对应的模长损失。
可选的,
其中,s为用于调节余弦函数的缩放系数,yi是序号为i的样本数据所属的样本类别的编号,是序号为i的样本数据的特征向量与/>间的夹角,/>是编号为yi的样本类别的类别中心,j为样本类别的编号,n为样本类别的总数,θj是序号为i的样本数据的特征向量与wj间的夹角,wj是编号为j的样本类别的类别中心;λg为平衡系数;m'(ai)为m(ai)的导函数;k为第一预设阈值。
可选的,
m(ai)=k·ai+b,b为实数;
可选的,
g(ai)=(ai-ua)2;
本实施例提出的图像处理模型的训练装置,可以根据损失函数的特征对损失函数进行具体设计,并可以使用设计出的损失函数对图像处理模型进行训练,使得图像处理模型具备从图像中提取出的图像特征向量的模长与图像质量呈正相关关系。
与上述图像质量评估方法相对应,本实施例提出一种图像质量评估装置,该装置可以包括:第一输入单元、第二获得单元和第一评估单元,其中:
第一输入单元,被配置为执行:将待评估图像输入至上述图像处理模型的训练方法训练好的图像处理模型中,其中,待评估图像未携带图像质量标签;
第二获得单元,被配置为执行:获得由训练好的图像处理模型提取的待评估图像的目标图像特征向量;
第一评估单元,被配置为执行:根据目标图像特征向量的模长,评估待评估图像的质量。
本实施例提出的图像质量评估装置,对图像进行质量评估,避免采用人工评估的方式对图像进行质量评估,提高评估效率,从而可以避免评估准确率在图像数量较多而人力不足时的下降,同时,图像处理模型可以使用同一套客观的评估方式对所有的图像进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
与上述数据处理模型的训练方法相对应,本实施例提出一种数据处理模型的训练装置,可以包括:第三获得单元和第二训练单元,其中:
第三获得单元,被配置为执行:获得数据处理模型的训练样本,训练样本未携带数据质量标签;
第二训练单元,被配置为执行:使用训练样本对数据处理模型进行训练,在训练过程中:至少从限制数据特征向量的可行区域和鼓励数据特征向量的大模长的角度,衡量数据处理模型的输出结果与真实值的差距,并基于该差距更新数据处理模型。
本发明提出的数据处理模型的训练装置,可以对对象数据的质量进行评估,可以避免采用人工评估的方式对对象数据进行质量评估,提高评估效率,从而可以避免评估准确率在对象数据的数据量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的对象数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
与上述数据质量评估方法相对应,本实施例提出一种数据质量评估装置,可以包括:第二输入单元、第四获得单元和第二评估单元,其中:
第二输入单元,被配置为执行:将待评估数据输入至由上述数据处理模型的训练方法训练好的数据处理模型中,其中,待评估数据未携带数据质量标签;
第四获得单元,被配置为执行:获得由训练好的数据处理模型提取的待评估数据的目标数据特征向量;
第二评估单元,被配置为执行:根据目标数据特征向量的模长,评估待评估数据的质量。
本实施例提出的数据质量评估装置,对待评估数据进行质量评估,避免采用人工评估的方式对待评估数据进行质量评估,提高评估效率,从而可以避免评估准确率在数据数量较多而人力不足时的下降,同时,数据处理模型可以使用同一套客观的评估方式对所有的数据进行质量评估,可以避免人工评估过程中主观评估或评估原则的变化导致的评估错误。
上述图像处理模型的训练装置可以包括处理器和存储器,上述第一获得单元101和第一训练单元102等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来减少客户端与电子设备即服务端间的交互次数,减少客户端与服务端进行交互所产生的网络延时,有效提高服务效率。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序/指令,计算机程序/指令被处理器执行时可以实现:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时可以执行上述图像处理模型的训练方法。
如图7所示,本实施例提供了一种电子设备200,该电子设备200可以包括至少一个处理器201、以及与处理器201连接的至少一个存储器202、总线203;其中,处理器201、存储器202通过总线203完成相互间的通信;处理器201用于调用存储器203中的程序指令,以执行:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。其中,本文中的电子设备可以是服务器、PC、PAD、手机等。
本发明还提供了一种计算机程序产品,可以包括计算机程序/指令,计算机程序/指令被处理器执行时实现:上述任一图像处理模型的训练方法,和/或,上述图像质量评估方法的训练方法,和/或,上述数据处理模型的训练方法,和/或,上述数据质量评估方法。
本发明是参照根据本发明实施例的方法、装置、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
在一个典型的配置中,电子设备包括一个或多个处理器(CPU)、存储器和总线。电子设备还可以包括输入/输出接口、网络接口等。
存储器可能包括计算机可读存储介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。存储器是计算机可读存储介质的示例。
计算机可读存储介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读存储介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (18)
1.一种图像处理模型的训练方法,其特征在于,包括:
获得所述图像处理模型的训练样本,所述训练样本未携带图像质量标签;
使用所述训练样本对所述图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型,包括:
根据预先设置的损失函数,使用所述训练样本对所述图像处理模型进行训练,在训练过程中:利用所述损失函数衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型;所述预先设置的损失函数的自变量包括:用于限制图像特征向量的可行区域的类间间隔函数及用于鼓励大模长的模长损失函数,所述类间间隔函数及所述模长损失函数的自变量均为图像特征向量的模长;所述类间间隔函数和所述模长损失函数共同激励所述训练样本在所述样本对应的可行区域中,向远离原点的区域进行分布。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述图像处理模型在使用所述损失函数进行训练时,在所述类间间隔函数及所述模长损失函数的影响下,学习到图像特征向量提取方式,所述图像特征向量提取方式使得:所述图像处理模型从目标训练样本中提取到的图像特征向量的模长与所述目标训练样本的图像质量正相关。
3.根据权利要求2所述的方法,其特征在于,所述图像处理模型在使用所述损失函数进行训练时,在所述类间间隔函数及所述模长损失函数的影响下,学习到图像特征向量提取方式,包括:
所述图像处理模型在使用所述损失函数进行训练时,在所述类间间隔函数及所述模长损失函数的影响下,学习到所提取的图像特征向量的分布空间在可行区域中的所在位置,进而学习到所述分布空间在所述可行区域中的所在位置对应的图像特征向量提取方式,其中,不同分布空间所在位置与不同的图像特征向量的模长对应。
4.根据权利要求1所述的方法,其特征在于,所述损失函数为:
Li=f(m(ai),g(ai));
其中,LMag为所述损失函数的整体损失值,N为样本总数,i为样本的序号,Li是序号为i的样本的样本损失值;ai是序号为i的样本的特征向量的模长,m(ai)为所述类间间隔函数,g(ai)为所述模长损失函数;
其中,ai的取值范围为[la,ua];m(ai)是在区间[la,ua]上单调递增的凸函数;g(ai)是在区间[la,ua]上单调递减的严格凸函数,在g(ai)的导函数g'(ai)中,g'(ua)=0;当ai增大时,m(ai)增大,m(ai)的增大使得Li增大;当ai增大时,g(ai)减小,g(ai)的减小使得Li减小;
其中,la为预设的模长下界值,ua为预设的模长上界值。
5.根据权利要求4所述的方法,其特征在于,
Li=f1(m(ai))+f2(g(ai)),
其中,当ai增大时,m(ai)增大,f1(m(ai))增大;当ai增大时,g(ai)减小,f2(g(ai))减小。
6.根据权利要求5所述的方法,其特征在于,
其中,s为用于调节余弦函数的缩放系数,yi是序号为i的样本数据所属的样本类别的编号,θyi是序号为i的样本数据的特征向量与间的夹角,/>是编号为yi的样本类别的类别中心,j为样本类别的编号,n为样本类别的总数,θj是序号为i的样本数据的特征向量与wj间的夹角,wj是编号为j的样本类别的类别中心;λg为平衡系数;m'(ai)为m(ai)的导函数;k为第一预设阈值。
7.根据权利要求6所述的方法,其特征在于,
m(ai)=k·ai+b,b为实数;
8.一种图像质量评估方法,其特征在于,包括:
将待评估图像输入至由权利要求1至7中任一项所述的图像处理模型的训练方法训练好的图像处理模型中,其中,所述待评估图像未携带图像质量标签;
获得由训练好的所述图像处理模型提取的所述待评估图像的目标图像特征向量;
根据所述目标图像特征向量的模长,评估所述待评估图像的质量。
9.一种图像处理模型的训练装置,其特征在于,包括:第一获得单元和第一训练单元,其中:
所述第一获得单元,被配置为执行:获得所述图像处理模型的训练样本,所述训练样本未携带图像质量标签;
所述第一训练单元,被配置为执行:使用所述训练样本对所述图像处理模型进行训练,在训练过程中:至少从限制图像特征向量的可行区域和鼓励图像特征向量的大模长的角度,衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型;
所述第一训练单元,被配置为执行:根据预先设置的损失函数,使用所述训练样本对所述图像处理模型进行训练,在训练过程中:利用所述损失函数衡量所述图像处理模型的输出结果与真实值的差距,并基于所述差距更新所述图像处理模型;所述预先设置的损失函数的自变量包括:用于限制图像特征向量的可行区域的类间间隔函数及用于鼓励大模长的模长损失函数,所述类间间隔函数及所述模长损失函数的自变量均为图像特征向量的模长;所述类间间隔函数和所述模长损失函数共同激励所述训练样本在所述样本对应的可行区域中,向远离原点的区域进行分布。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:学习单元,所述学习单元被配置为执行:所述图像处理模型在使用所述损失函数进行训练时,在所述类间间隔函数及所述模长损失函数的影响下,学习到图像特征向量提取方式,所述图像特征向量提取方式使得:所述图像处理模型从目标训练样本中提取到的图像特征向量的模长与所述目标训练样本的图像质量正相关。
11.根据权利要求10所述的装置,其特征在于,所述学习单元被配置为执行:所述图像处理模型在使用所述损失函数进行训练时,在所述类间间隔函数及所述模长损失函数的影响下,学习到所提取的图像特征向量的分布空间在可行区域中的所在位置,进而学习到所述分布空间在所述可行区域中的所在位置对应的图像特征向量提取方式,其中,不同分布空间所在位置与不同的图像特征向量的模长对应,所述图像特征向量提取方式使得:所述图像处理模型从目标训练样本中提取到的图像特征向量的模长与所述目标训练样本的图像质量正相关。
12.根据权利要求9所述的装置,其特征在于,所述损失函数为:
Li=f(m(ai),g(ai));
其中,LMag为所述损失函数的整体损失值,N为样本总数,i为样本的序号,Li是序号为i的样本的样本损失值;ai是序号为i的样本的特征向量的模长,m(ai)为所述类间间隔函数,g(ai)为所述模长损失函数;
其中,ai的取值范围为[la,ua];m(ai)是在区间[la,ua]上单调递增的凸函数;g(ai)是在区间[la,ua]上单调递减的严格凸函数,在g(ai)的导函数g'(ai)中,g'(ua)=0;当ai增大时,m(ai)增大,m(ai)的增大使得Li增大;当ai增大时,g(ai)减小,g(ai)的减小使得Li减小;
其中,la为预设的模长下界值,ua为预设的模长上界值。
13.根据权利要求12所述的装置,其特征在于,
Li=f1(m(ai))+f2(g(ai)),
其中,当ai增大时,m(ai)增大,f1(m(ai))增大;当ai增大时,g(ai)减小,f2(g(ai))减小。
14.根据权利要求13所述的装置,其特征在于,
其中,s为用于调节余弦函数的缩放系数,yi是序号为i的样本数据所属的样本类别的编号,θyi是序号为i的样本数据的特征向量与间的夹角,/>是编号为yi的样本类别的类别中心,j为样本类别的编号,n为样本类别的总数,θj是序号为i的样本数据的特征向量与wj间的夹角,wj是编号为j的样本类别的类别中心;λg为平衡系数;m'(ai)为m(ai)的导函数;k为第一预设阈值。
15.根据权利要求14所述的装置,其特征在于,
m(ai)=k·ai+b,b为实数;
16.一种图像质量评估装置,其特征在于,包括:第一输入单元、第二获得单元和第一评估单元,其中:
所述第一输入单元,被配置为执行:将待评估图像输入至由权利要求1至8中任一项所述的图像处理模型的训练方法训练好的图像处理模型中,其中,所述待评估图像未携带图像质量标签;
所述第二获得单元,被配置为执行:获得由训练好的所述图像处理模型提取的所述待评估图像的目标图像特征向量;
所述第一评估单元,被配置为执行:根据所述目标图像特征向量的模长,评估所述待评估图像的质量。
17.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行:如权利要求1至7中任一项所述的图像处理模型的训练方法,和/或,如权利要求8所述的图像质量评估方法的训练方法。
18.一种计算机可读存储介质,其特征在于,其上存储有计算机程序/指令,所述计算机程序/指令被处理器执行时实现:如权利要求1至7中任一项所述的图像处理模型的训练方法,和/或,如权利要求8所述的图像质量评估方法的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110048324.2A CN112733743B (zh) | 2021-01-14 | 2021-01-14 | 模型训练方法、数据、图像质量评估方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110048324.2A CN112733743B (zh) | 2021-01-14 | 2021-01-14 | 模型训练方法、数据、图像质量评估方法及相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112733743A CN112733743A (zh) | 2021-04-30 |
CN112733743B true CN112733743B (zh) | 2024-03-15 |
Family
ID=75592996
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110048324.2A Active CN112733743B (zh) | 2021-01-14 | 2021-01-14 | 模型训练方法、数据、图像质量评估方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112733743B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378695A (zh) * | 2021-06-08 | 2021-09-10 | 杭州萤石软件有限公司 | 一种图像质量确定方法、装置及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679490A (zh) * | 2017-09-29 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 用于检测图像质量的方法和装置 |
CN111368683A (zh) * | 2020-02-27 | 2020-07-03 | 南京邮电大学 | 基于模约束CentreFace的人脸图像特征提取方法及人脸识别方法 |
CN111598190A (zh) * | 2020-07-21 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 图像目标识别模型的训练方法、图像识别方法及装置 |
CN111738083A (zh) * | 2020-05-20 | 2020-10-02 | 云知声智能科技股份有限公司 | 一种人脸识别模型的训练方法和装置 |
-
2021
- 2021-01-14 CN CN202110048324.2A patent/CN112733743B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679490A (zh) * | 2017-09-29 | 2018-02-09 | 百度在线网络技术(北京)有限公司 | 用于检测图像质量的方法和装置 |
CN111368683A (zh) * | 2020-02-27 | 2020-07-03 | 南京邮电大学 | 基于模约束CentreFace的人脸图像特征提取方法及人脸识别方法 |
CN111738083A (zh) * | 2020-05-20 | 2020-10-02 | 云知声智能科技股份有限公司 | 一种人脸识别模型的训练方法和装置 |
CN111598190A (zh) * | 2020-07-21 | 2020-08-28 | 腾讯科技(深圳)有限公司 | 图像目标识别模型的训练方法、图像识别方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112733743A (zh) | 2021-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI689871B (zh) | 梯度提升決策樹(gbdt)模型的特徵解釋方法和裝置 | |
CN110348580B (zh) | 构建gbdt模型的方法、装置及预测方法、装置 | |
WO2019114523A1 (zh) | 分类训练方法、服务器及存储介质 | |
Gopalakrishnan et al. | Random walks on graphs for salient object detection in images | |
CN108550065B (zh) | 评论数据处理方法、装置及设备 | |
CN111914908B (zh) | 一种图像识别模型训练方法、图像识别方法及相关设备 | |
CN111052128B (zh) | 用于检测和定位视频中的对象的描述符学习方法 | |
CN111046910A (zh) | 图像分类、关系网络模型训练、图像标注方法及装置 | |
CN116681957B (zh) | 一种基于人工智能的图像识别方法及计算机设备 | |
CN112733743B (zh) | 模型训练方法、数据、图像质量评估方法及相关装置 | |
CN111401343B (zh) | 识别图像中人的属性的方法、识别模型的训练方法和装置 | |
WO2023123869A1 (zh) | 能见度值检测方法、装置、设备及存储介质 | |
CN116263785A (zh) | 跨领域文本分类模型的训练方法、分类方法和装置 | |
CN117520645A (zh) | 基于金融产品的用户确定方法、装置以及电子设备 | |
CN115617998A (zh) | 一种基于智能营销场景的文本分类方法及装置 | |
CN108985350B (zh) | 一种基于梯度幅值稀疏特征信息识别模糊图像的方法和装置、计算设备及存储介质 | |
CN109657710B (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN111784053A (zh) | 交易风险检测方法、设备及可读存储介质 | |
CN116977271A (zh) | 缺陷检测方法、模型训练方法、装置及电子设备 | |
CN114254588B (zh) | 数据标签处理方法和装置 | |
CN114254264A (zh) | 模型评估方法、模型评估系统、数据处理设备及存储介质 | |
CN112508130A (zh) | 聚类方法及装置、电子设备和存储介质 | |
US20210004671A1 (en) | Automated data slicing based on an artificial neural network | |
Lin et al. | Fabric Defect Detection with Fusion of Convolutional Attention Module and YOLOv5 | |
CN116823069B (zh) | 基于文本分析的智能客服服务质检方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |