CN111626409B - 一种图像质量检测的数据生成方法 - Google Patents
一种图像质量检测的数据生成方法 Download PDFInfo
- Publication number
- CN111626409B CN111626409B CN202010750951.6A CN202010750951A CN111626409B CN 111626409 B CN111626409 B CN 111626409B CN 202010750951 A CN202010750951 A CN 202010750951A CN 111626409 B CN111626409 B CN 111626409B
- Authority
- CN
- China
- Prior art keywords
- image
- data
- warping
- neural network
- convolutional neural
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
Description
技术领域
本发明涉及图像处理领域,更具体地,涉及一种图像质量检测的数据生成方法。
背景技术
深度卷积神经网络(Deep Convolution Neural Network),目前应用于各种计算机视觉(CV)任务,如:图像分割,图像分类,图像语义分析等等,其中图像质量分析也是一个非常重要的应用分支。这个任务相较于其他的人物场景,有更大的挑战:数据来源较为困难,数据组成方式复杂,数据标注有极大的主观性。这使得这个任务在实现上有着非常的大的困难和局限性。但实际上这个使用场景又有非常大的潜力和需求:所有采集到的图片数据,并非都有被使用的价值,很多数据在一些应用场景下,都是需要达到一定的图片呈现能力的,低于某个图像呈现的效果的,这个数据将不适合使用并应该予以放弃筛选。
现在流行的,可靠的机器学习方法,主流是监督学习。这种学习方法,需要对算法提供大量的数据样本,才能实现机器学习的目标。然而,对于图像质量分析这个领域,有着相对于其他类型的数据更加复杂的采集情况:1、数据标注上,图像数据界限非常模糊,标注人员对同一个图像,图像质量的界定也会产生非常大的分歧。2、数据增强是一种通用的应用于提高监督学习泛化能力的方法,在很多的应用到机器学习的计算机视觉任务都有使用,然而这个方法也比较难以应用到图像质量分析的任务上,标注本身任务无法给与明确的评价,也使得增强产生的数据的尺度受到影响,从而使数据增强无法直接应用到监督学习的任务上。
发明内容
为了克服上述现有技术的不足,本发明提供一种图像质量检测的数据生成方法,是一种在监督学习场景下,监控相机场景的图像质量问题的数据解决方案,该方法在数据标注、数据增强方面提供了可行性,实现通过深度卷积神经网络,结合监督学习的方案,进而实现图像质量评估的方法。
为了实现上述目的,本发明的技术方案为:
一种图像质量检测的数据生成方法,包括模型训练及图像检测;
其中模型训练是:
其中图形检测是将需要检测的图像输入到目标函数,获取得到最终的图像质量输出结果。
通过数据处理方法生成的数据集;在最简单的形式上,给定图像I 1和I 2对应的图像质量Q1和Q2,设图像质量为Q1>Q2,则深度学习网络G(Ii)能够实现某个映射:
G(Ii)=Qi
设每个图有S个标注,一共有M个图片,则对一个输入图像I 1,给定一组标注L={l 1,l 2,l 3,…,l s}通过深度卷积神经网络,将深度卷积神经网络对图像I的输出作为输入,得到模型F(I)的输出为Y={y 1,y 2,y 3,…,y s},这个过程映射表示为:;
则在这个过程里面,机器学习的优化目标为:
优选的,对于深度卷积神经网络,由于是无监督模型,因此数据的展现形式为:对于任何给定的一个图像I,采用图像扭曲算法对图像进行扭曲,具体是基于这种图像扭曲算法采用不同程度的参数进行扭曲,得到针对这个图像的无监督训练图像集;接下来,扩展这个思路,定义M个扭曲算法,则所有的扭曲算法表示为;得到所有的扭曲Distortion排列;并且,根据图像扭曲后的质量,按照从高到低的顺序设计参数d,进而对深度卷积神经网络产生大量的非监督数据;这些非监督数据将帮助深度卷积神经网络捕捉到不同扭曲对图像的影响。
优选的,图像检测具体为:
(1)对监控相机的图像进行分析,得到监控相机的主要集中扭曲形式:
(2)对图像数据参数进行调整,直接对图像每一种不同的扭曲方法进行建模;
其中G:表示之前的神经网络映射;D:表示扭曲方法;M:扭曲方法的具体个数;I:表示输入图像;P:表示对应到每一个扭曲方法的参数集合;K:扭曲参数的个数;:表示对应到特定的扭曲方法的扭曲参数集合P,选择第k个特定的扭曲参数;
(3)对于模型,需要对图像数据进行合理的标注进行描述;因此,在标注训练图像数据的时候,首先根据图像数据的呈现形式,对图像数据分成C个类别,然后让标注团队的成员,对这C个类别的数据进行打分;选择了2k+1个标注人员,因此得到打分结果S’={s1,s2,…,s2k+1},对所有的打分结果,去掉最高的m个分数和最低的m个分数,对剩下的2k+1-2m个分数进行统计,当S=C时,得到这个图像的实际标注;其中,l表示为在这个样本的标注的结果里,展示的每一个分类中的概率:
举个例子来说:一个图,给13个人标注,一共3个等级,去掉一个最高分,去掉一个最低分,还剩下11个人。这11个人打分分别为 1个1分,5个2分,5分3分,那么,这个特定图片的标签就是 ,分别代表类别1,类别2和类别3个概率;
(5)采用标量来描述一个图像的质量,具体是将之前的类别C进行量化,然后对类别C对应的预测y,进行如下公式计算:
得到最终的IQA数值输出结果q,基于输出结果q确定图形的质量等级。
优选的,所述扭曲形式主要包括:JPEG压缩噪声,相机高感光度噪声,运动模糊,过度锐化,过高对比度,白化。
优选的,所述损失函数为回归法或KL散度法。
与现有技术相比,本发明的有益效果是:
(1)本发明打破了传统方法非常依赖训练数据集的限制,可最大程度上的解压模型训练时,数据不足导致模型过拟合、数据评估不准确,过于主观的问题。
(2)在数据增强方面,本发明有效的打破了数据增强和模型分数的强关联,使得特征提取更具有针对性。
(3)本发明解决了同质化数据的生成,传统的数据增强方式,大多采取一种数据增强方案,反复使用,使得数据在构成中具有大量的同质化信息,这些信息在作为训练数据进行学习,会导致模型的不准确性,不确定性增加,非常依赖于训练数据。
(4)本发明解决了图像质量评估场景中,评分单一的问题。一般公开的图像质量分数都为一个标量数据,但其分数来来源非常不明确,分数也有失公允。本方案可以很好的规避这类问题,同时兼顾质量表现时的便利性。
附图说明
图1为本发明流程示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步描述。
如图1,一种图像质量检测的数据生成方法,包括模型训练及图像检测;
其中模型训练是:
其中图形检测是将需要检测的图像输入到目标函数,获取得到最终的图像质量输出结果。
通过数据处理方法生成的数据集;在最简单的形式上,给定图像I 1和I 2对应的图像质量Q1和Q2,设图像质量为Q1>Q2,则深度学习网络G(Ii)能够实现某个映射:
G(Ii)=Qi
设每个图有S个标注,一共有M个图片,则对一个输入图像I 1,给定一组标注L={l 1,l 2,l 3,…,l s}通过深度卷积神经网络,将深度卷积神经网络对图像I的输出作为输入,得到模型F(I)的输出为Y={y 1,y 2,y 3,…,y s},这个过程映射表示为:;
则在这个过程里面,机器学习的优化目标为:
对于深度卷积神经网络,由于是无监督模型,因此数据的展现形式为:对于任何给定的一个图像I,采用图像扭曲算法对图像进行扭曲,具体是基于这种图像扭曲算法采用不同程度的参数进行扭曲,得到针对这个图像的无监督训练图像集;接下来,扩展这个思路,定义M个扭曲算法,则所有的扭曲算法表示为;得到所有的扭曲Distortion排列;并且,根据图像扭曲后的质量,按照从高到低的顺序设计参数d,进而对深度卷积神经网络产生大量的非监督数据;这些非监督数据将帮助深度卷积神经网络捕捉到不同扭曲对图像的影响。
图像检测具体为:
(1)对监控相机的图像进行分析,得到监控相机的主要集中扭曲形式:
(2)对图像数据参数进行调整,直接对图像每一种不同的扭曲方法进行建模;
其中G:表示之前的神经网络映射;D:表示扭曲方法;M:扭曲方法的具体个数;I:表示输入图像;P:表示对应到每一个扭曲方法的参数集合;K:扭曲参数的个数;:表示对应到特定的扭曲方法的扭曲参数集合P,选择第k个特定的扭曲参数;
(3)对于模型,需要对图像数据进行合理的标注进行描述;因此,在标注训练图像数据的时候,首先根据图像数据的呈现形式,对图像数据分成C个类别,然后让标注团队的成员,对这C个类别的数据进行打分;选择了2k+1个标注人员,因此得到打分结果S’={s1,s2,…,s2k+1},对所有的打分结果,去掉最高的m个分数和最低的m个分数,对剩下的2k+1-2m个分数进行统计,当S=C时,得到这个图像的实际标注;其中,l表示为在这个样本的标注的结果里,展示的每一个分类中的概率:
举个例子来说:一个图,给13个人标注,一共3个等级,去掉一个最高分,去掉一个最低分,还剩下11个人。这11个人打分分别为 1个1分,5个2分,5分3分,那么,这个特定图片的标签就是 ,分别代表类别1,类别2和类别3个概率;
回归法:
KL散度法:
这两种方法,目前都测试过可以正常达到算法训练的优化目的。并没有横向的对这两个函数产生的结果进行比较,但从实际使用上来看,都能达到使用要求。
目前的算法部署上,采用KL散度的算法更为普遍,因为产生的数值更加具有连续性,数值更加合理,不会出现异常数值。
(5)最后,通常会给出一个标量,来描述一个图像的质量,而不是像之前回归的目标一样,存在一个向量的方式进行回归。为此将之前的类别C进行量化,然后对类别c对应的预测y,进行如下计算,得到最终的输出结果q:
得到最终的IQA数值输出结果q,基于输出结果q确定图形的质量等级。
在实际的应用场景下,采用了将5个类别,划分成{0,25,50,75,100},5个不同的分值,模型完成推理后,会得到基于这5个类别的概率值,如{0.1,0.25,0.55,0.08,0.02},则可以最终按照上面的计算法则,得到一个固定的IQA数值输出:41.75。可以知道这个图片大概是一个第三等级的图片。
通过本发明所述的方法最终量化的质量分数q=0.03*0+0.1*25+0.02*50+0.25*75+0.6*100=82.25,再基于该数值确定图形的质量等级。
以上所述的本发明的实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神原则之内所作出的修改、等同替换和改进等,均应包含在本发明的权利要求保护范围之内。
Claims (7)
1.一种图像质量检测的数据生成方法,其特征在于,包括模型训练及图像检测;
其中模型训练是:
其中图形检测是将需要检测的图像输入到目标函数,获取得到最终的图像质量输出结果;
通过数据处理方法生成的数据集;在最简单的形式上,给定图像I 1和I 2对应的图像质量Q1和Q2,设图像质量为Q1>Q2,则深度学习网络G(Ii)能够实现某个映射:
G(Ii)=Qi
4.根据权利要求3所述的图像质量检测的数据生成方法,其特征在于,图像检测具体为:
(1)对监控相机的图像进行分析,得到监控相机的主要集中扭曲形式:
(2)对图像数据参数进行调整,直接对图像每一种不同的扭曲方法进行建模;
其中G:表示之前的神经网络映射;D:表示扭曲方法;M:扭曲方法的具体个数;I:表示输入图像;P:表示对应到每一个扭曲方法的参数集合;K:扭曲参数的个数;:表示对应到特定的扭曲方法的扭曲参数集合P,选择第k个特定的扭曲参数;
(3)对于模型,需要对图像数据进行合理的标注进行描述;因此,在标注训练图像数据的时候,首先根据图像数据的呈现形式,对图像数据分成C个类别,然后让标注团队的成员,对这C个类别的数据进行打分;选择了2k+1个标注人员,因此得到打分结果S’={s1,s2,…,s2k+1},对所有的打分结果,去掉最高的m个分数和最低的m个分数,对剩下的2k+1-2m个分数进行统计,当S=C时,到这个图像的实际标注;其中,l表示为在这个样本的标注的结果里,展示的每一个分类中的概率:
(5)采用标量来描述一个图像的质量,具体是将之前的类别C进行量化,然后对类别C对应的预测y,进行如下公式计算:
得到最终的IQA数值输出结果q,基于输出结果q确定图形的质量等级。
5.根据权利要求4所述的图像质量检测的数据生成方法,其特征在于,所述扭曲形式主要包括:JPEG压缩噪声,相机高感光度噪声,运动模糊,过度锐化,过高对比度,白化。
6.根据权利要求5所述的图像质量检测的数据生成方法,其特征在于,所述损失函数为回归法或KL散度法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010750951.6A CN111626409B (zh) | 2020-07-30 | 2020-07-30 | 一种图像质量检测的数据生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010750951.6A CN111626409B (zh) | 2020-07-30 | 2020-07-30 | 一种图像质量检测的数据生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111626409A CN111626409A (zh) | 2020-09-04 |
CN111626409B true CN111626409B (zh) | 2020-11-24 |
Family
ID=72272247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010750951.6A Active CN111626409B (zh) | 2020-07-30 | 2020-07-30 | 一种图像质量检测的数据生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111626409B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461209A (zh) * | 2020-03-30 | 2020-07-28 | 深圳市凯立德科技股份有限公司 | 一种模型训练装置和方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229646A (zh) * | 2017-08-08 | 2018-06-29 | 北京市商汤科技开发有限公司 | 神经网络模型压缩方法、装置、存储介质和电子设备 |
US11676296B2 (en) * | 2017-08-11 | 2023-06-13 | Sri International | Augmenting reality using semantic segmentation |
US10776662B2 (en) * | 2017-11-09 | 2020-09-15 | Disney Enterprises, Inc. | Weakly-supervised spatial context networks to recognize features within an image |
CN109558806B (zh) * | 2018-11-07 | 2021-09-14 | 北京科技大学 | 高分遥感图像变化的检测方法 |
CN109800781A (zh) * | 2018-12-07 | 2019-05-24 | 北京奇艺世纪科技有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN110738127B (zh) * | 2019-09-19 | 2023-04-18 | 福建技术师范学院 | 基于无监督深度学习神经网络算法的安全帽识别方法 |
CN111275092B (zh) * | 2020-01-17 | 2022-05-13 | 电子科技大学 | 一种基于无监督域适应的图像分类方法 |
CN111444364B (zh) * | 2020-03-04 | 2024-01-30 | 中国建设银行股份有限公司 | 一种图像检测方法和装置 |
-
2020
- 2020-07-30 CN CN202010750951.6A patent/CN111626409B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111461209A (zh) * | 2020-03-30 | 2020-07-28 | 深圳市凯立德科技股份有限公司 | 一种模型训练装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111626409A (zh) | 2020-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gu et al. | Deep dual-channel neural network for image-based smoke detection | |
CN107316307B (zh) | 一种基于深度卷积神经网络的中医舌图像自动分割方法 | |
CN111126386B (zh) | 场景文本识别中基于对抗学习的序列领域适应方法 | |
CN110880019B (zh) | 通过无监督域适应训练目标域分类模型的方法 | |
CN112766334B (zh) | 一种基于伪标签域适应的跨域图像分类方法 | |
CN104063713B (zh) | 一种基于随机蕨分类器的半自主在线学习方法 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN113761259A (zh) | 一种图像处理方法、装置以及计算机设备 | |
CN112528058B (zh) | 基于图像属性主动学习的细粒度图像分类方法 | |
CN111488911A (zh) | 基于Mask R-CNN与GAN的图像实体抽取方法 | |
Su et al. | Going the extra mile in face image quality assessment: A novel database and model | |
CN116704208B (zh) | 基于特征关系的局部可解释方法 | |
KR102178238B1 (ko) | 회전 커널을 이용한 머신러닝 기반 결함 분류 장치 및 방법 | |
CN112417974A (zh) | 一种公共卫生监控方法 | |
CN112766419A (zh) | 一种基于多任务学习的图像质量评估方法及装置 | |
CN112560668A (zh) | 一种基于场景先验知识的人体行为识别方法 | |
CN112085164A (zh) | 一种基于无锚框网络的区域推荐网络提取方法 | |
CN111626409B (zh) | 一种图像质量检测的数据生成方法 | |
CN114821174B (zh) | 一种基于内容感知的输电线路航拍图像数据清洗方法 | |
CN115457620A (zh) | 用户表情识别方法、装置、计算机设备及存储介质 | |
CN114818945A (zh) | 融入类别自适应度量学习的小样本图像分类方法及装置 | |
CN114596433A (zh) | 一种绝缘子识别方法 | |
CN114022698A (zh) | 一种基于二叉树结构的多标签行为识别方法及装置 | |
CN111126364A (zh) | 一种基于分组卷积神经网络的表情识别方法 | |
Huang et al. | Quality control on manufacturing computer keyboards using multilevel deep neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |