CN106295682A - 一种判断图片质量因子的方法、装置和计算设备 - Google Patents
一种判断图片质量因子的方法、装置和计算设备 Download PDFInfo
- Publication number
- CN106295682A CN106295682A CN201610622575.6A CN201610622575A CN106295682A CN 106295682 A CN106295682 A CN 106295682A CN 201610622575 A CN201610622575 A CN 201610622575A CN 106295682 A CN106295682 A CN 106295682A
- Authority
- CN
- China
- Prior art keywords
- convolutional neural
- layer
- neural networks
- training
- picture
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种判断图片质量因子的方法,包括:创建用于判断图片质量因子的卷积神经网络;选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;选取多张已知质量因子的压缩图片构造用于检验所述卷积神经网络的验证图片集;根据所述训练图片集对所述卷积神经网络进行模型训练,并根据训练结果对所述卷积神经网络进行初次调整;根据所述验证图片集对所述训练后的卷积神经网络进行精度检验,并根据检验结果对所述训练后的卷积神经网络进行二次调整;以及将待判断质量因子的测试图片集输入到二次调整后的卷积神经网络中,得到其图片质量因子。本发明还公开了一种判断图片质量因子的装置和计算设备。
Description
技术领域
本发明涉及图像处理领域,尤其涉及一种判断图片质量因子的方法、装置和计算设备。
背景技术
当前互联网中的彩色图片都经过不同程度的压缩处理,以JPEG图片为例,这种类型图片的压缩主要包括四个步骤,分别为颜色转换、DCT变换(Discrete CosineTransform,离散余弦变换)、量化和编码。在量化步骤中会选取压缩质量因子,该压缩质量因子指示了彩色图片的压缩率,压缩质量是表征彩色图片图像质量的一个因素。
图片经过JPEG压缩后可以显著减小所占的磁盘空间,但是图片质量不可避免的会降低。对于JPEG格式的图片,图片质量受压缩时所用的质量因子(quality factor)所控制。质量因子的取值从1到100,质量因子越大,压缩后图片质量越高。对于文件头中存在量化表(quantization table)的JPEG图片,质量因子可以从量化表推出。
Dan对于头文件中不存在量化表的JPEG图片或者被解压为其他格式的JPEG图片,质量因子无法简单得出。在很多图像处理任务中,图片质量直接决定采取的处理方式。所以判断JPEG压缩图片的质量(质量因子)非常重要。
在现有的一些技术中,可以从压缩后的图片中提取人工设计的特征(feature)(例如JPEG压缩图片的DCT系数直方图),然后采用训练一个分类器(classifier)的方法来判断质量因子。但是人工设计的特征表征能力较弱,所以通常需要提取非常高维度的特征来增强特征的能力。这导致训练的分类器速度非常慢,而且精度也不高。
发明内容
为此,本发明提供一种判断图片质量因子的方法、装置和计算设备,以力图解决或至少解决上面存在的问题。
根据本发明的一个方面,提供一种判断图片质量因子的方法,该方法包括:创建用于判断图片质量因子的卷积神经网络;选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;选取多张已知质量因子的压缩图片构造用于检验所述卷积神经网络的验证图片集;根据训练图片集对卷积神经网络进行模型训练,并根据训练结果对卷积神经网络进行初次调整;根据验证图片集对训练后的卷积神经网络进行精度检验,并根据检验结果对该训练后的卷积神经网络进行二次调整;以及将待判断质量因子的测试图片集输入到二次调整后的卷积神经网络中,得到其图片质量因子。
可选地,在根据本发明的方法中,卷积神经网络包括:至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层,其中所述卷积神经网络中输入的是所述训练图片集、验证图片集和待判断质量因子的测试图片集,从分类器层输出的是所述输入图片的质量因子。
可选地,在根据本发明的方法中,卷积神经网络包括重复三次的卷积层、非线性激活层和下采样层,以及两层全连接层和一层分类器层,其中,第一层的卷积层采用32个特征图,卷积核大小为7*7*3;第二层的卷积层采用64个特征图,卷积核大小为5*5*32;第三层的卷积层采用96个特征图,卷积核大小为3*3*64;所述下采样层均采用2*2的池化区间;所述两层全连接层的维度分别为256和10;所述分类器层的维度为10。
可选地,在根据本发明的方法中,分类器采用SoftMax分类器。
可选地,在根据本发明的方法中,根据模型训练结果对卷积神经网络中进行调整的步骤包括:采用随机梯度下降方法计算分类器的分类算法的损失函数J(θ),以及该损失函数中参数θ的梯度σ(θ),并根据所述梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制所述梯度更新的幅度。
可选地,在根据本发明的方法中,对卷积神经网络中进行调整的步骤包括:调整所述卷积神经网络的网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
可选地,在根据本发明的方法中,分类算法的损失函数J(θ)的公式为:
其中,m是图片集的样本数目,x(i)是图片i输入的特征,y(i)是图片i输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
根据本发明的另一方面,提供一种判断图片质量因子的装置,该装置包括:CNN创建单元,适于创建用于判断图片质量因子的卷积神经网络(CNN);训练图片集单元,适于选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;验证图片集单元,适于选取多张已知质量因子的压缩图片构造用于检验所述卷积神经网络的验证图片集;CNN训练单元,适于根据训练图片集对卷积神经网络进行模型训练,并根据训练结果对卷积神经网络进行初次调整;CNN检验单元,适于根据所验证图片集对训练后的卷积神经网络进行精度检验,并根据检验结果对训练后的卷积神经网络进行二次调整;以及结果输出单元,适于将待判断质量因子的测试图片集输入到所述二次调整后的卷积神经网络中,得到其图片质量因子。
可选地,在根据本发明的装置中,卷积神经网络包括:至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层,其中所述卷积神经网络中输入的是训练图片集、验证图片集和待判断质量因子的测试图片集,从分类器层输出的是输入图片的质量因子。
可选地,在根据本发明的装置中,卷积神经网络包括重复三次的卷积层+非线性激活层+下采样层,以及两层全连接层和一层分类器层,其中,第一层的卷积层采用32个特征图,卷积核大小为7*7*3;第二层的卷积层采用64个特征图,卷积核大小为5*5*32;第三层的卷积层采用96个特征图,卷积核大小为3*3*64;所述下采样层均采用2*2的池化区间;所述两层全连接层的维度分别为256和10;所述分类器层的维度为10。
可选地,在根据本发明的装置中,分类器采用SoftMax分类器。
可选地,在根据本发明的装置中,CNN训练单元适于根据以下方法对所述卷积神经网络进行调整的步骤包括:采用随机梯度下降方法计算分类器的分类算法的损失函数J(θ),以及该损失函数中参数θ的梯度σ(θ),并根据所述梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制梯度更新的幅度。
可选地,在根据本发明的装置中,CNN训练单元和CNN检验单元适于调整卷积神经网络的网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
可选地,在根据本发明的装置中,分类算法的损失函数J(θ)的公式为:
其中,m是图片集的样本数目,x(i)是图片i所输入的特征,y(i)是图片i所输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
根据本发明的又一个方面,提供一种计算设备,包括如上所述的判断图片质量因子的装置。
根据本发明的技术方案,通过设计一个卷积神经网络来判断JPEG图片的质量因子。具体地,采集多张已知质量因子的压缩图片分别构造训练图片集和验证图片集;采用训练图片集来训练卷积神经网络,并根据训练结果更新卷积神经网络的参数;采用验证图片集对训练后的网络进行精度检验,并根据检验结果更新卷积神经网络的结构。卷积神经网络可以自动从训练数据当中学习特征,从而省去了人工设计特征的步骤。自动学习到的特征比人工设计的特征能力更强,鲁棒性也更强。本方案中特征提取和分类器训练同时进行,是一个端到端(end-to-end)的学习过程,从而可以最大程度的提升整个系统的分类精度。通过对大量训练图片的学习,本方案所训练的卷积神经网络系统有极高的分类精度。
附图说明
为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
图1示出了根据本发明一个实施例的计算设备100的结构框图;
图2示出了根据本发明一个实施例的判断图片质量因子的方法200的流程图;
图3示出了根据本发明一个实施例的判断图片质量因子的装置300的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出的根据本发明的一个实施例的计算设备100的结构图。图1布置为实现根据本发明的判断图片质量因子的装置300的示例计算设备100的框图。在基本的配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
取决于期望的配置,处理器104可以是任何类型的处理,包括但不限于:微处理器((μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元(ALU)、浮点数单元(FPU)、数字信号处理核心(DSP核心)或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用,或者在一些实现中,存储器控制器118可以是处理器104的一个内部部分。
取决于期望的配置,系统存储器106可以是任意类型的存储器,包括但不限于:易失性存储器(诸如RAM)、非易失性存储器(诸如ROM、闪存等)或者它们的任何组合。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中,应用122可以布置为在操作系统上利用程序数据124进行操作。
计算设备100还可以包括有助于从各种接口设备(例如,输出设备142、外设接口144和通信设备146)到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156,它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备(例如,键盘、鼠标、笔、语音输入设备、触摸输入设备)或者其他外设(例如打印机、扫描仪等)之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160,其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。
网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块,并且可以包括任何信息递送介质。“调制数据信号”可以这样的信号,它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例,通信介质可以包括诸如有线网络或者专线网络之类的有线介质,以及诸如声音、射频(RF)、微波、红外(IR)或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。
计算设备100可以实现为小尺寸便携(或者移动)电子设备的一部分。计算设备100还可以实现为包括桌面计算机和笔记本计算机配置的个人计算机。在一些实施例中,计算设备100被配置为执行根据本发明的判断图片质量因子的方法200,其中应用122包括根据本发明的判断图片质量因子的装置300。
现有技术中,通常是从压缩图片中提取人工设计的特征,如DCT量化系数的直方图以及图片域像素值残差的联合概率分布,然后训练一个分类器来判断质量因子。但是人工设计的特征表征能力较弱,所以通常需要提取非常高维度的特征来增强特征的能力,这明显降低了训练的分类器的速度和精度。
比如使用图片像素值残差的联合概率密度分布作为特征,通常先用低通滤波器预处理图片,然后提取低通图片与原图的残差,之后提取相邻残差的联合概率分布。因为需要用多种不同的低通滤波器处理图片,最后提取的特征可以高达30000维。分类器首先需要用大量的训练样例来训练,每个训练样例是一个图片的特征和该图片的质量因子,训练完成后,分类器对于新输入的图片输出一个质量因子。在这些过程中,高维度的特征提取对分类器的运算速度和精度都必然会有很大影响。
为此,本发明设计了卷积神经网络(Convolutional Neural Network,CNN)自动从训练图片当中学习需要提取的特征,然后SoftMax分类器判断JPEG图片的质量因子。另外,SoftMax分类器与基于卷积神经网络的特征提取器同时训练,这样既保证精度又能快速的实现分类器训练。
图2示出了根据本发明一个实施例的判断图片质量因子的方法200,适于在计算设备中执行,该方法始于步骤S210。
在步骤S210中,创建用于判断图片质量因子的卷积神经网络。该卷积神经网络包括:至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层。其中卷积神经网络的输入是待分类的JPEG图片,其通常有RGB三个通道。卷积层用不同数目的卷积核对上一层进行卷积,卷积后得到特征图(feature maps),非线性激活层对特征图进行非线性变化(采用RELU非线性函数),之后池化层对特征图进行下采样操作(采用MaxPooling),得到长和宽更小的特征图。通常卷基层、非线性激活层和池化层可以重复多次。之后,全连接层对特征图进行非线性特征变换,该全连接层也可以重复多次。最后,SoftMax分类器给出质量因子的分类。
具体地,本发明的卷积神经网络包括重复三次的卷积层+非线性激活层+下采样层,以及两层全连接层和一层分类器层,其中,
第一层的卷积层采用32个特征图,卷积核大小为7*7*3;
第二层的卷积层采用64个特征图,卷积核大小为5*5*32;
第三层的卷积层采用96个特征图,卷积核大小为3*3*64;
所述下采样层均采用2*2的池化区间;
所述两层全连接层的维度分别为256和10;
所述分类器层的维度为10。
根据一个实施例,分类器可以采用SoftMax分类器。SoftMax分类器的作用是把卷积神经网络的激活值转换为概率值,对应最大概率值的输出即为该图片质量因子所属的类别,其逻辑回归的损失函数为:
其中,m是图片集的样本数目,x(i)是图片i输入的特征,y(i)是图片i输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
如果加上权重衰减项(正则化项),则为:
其中,λ权重衰减系数,最小化损失函数一般采用梯度下降算法,迭代计算梯度并更新θ。
随后,在步骤S220中,选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;并在步骤S230中选取多张已知质量因子的压缩图片构造所述卷积神经网络的验证图片集。其中,图片集的每个例子都由用特定质量因子压缩过的JPEG图片与该质量因子所组成;训练图片集用于训练卷积神经网络,验证图片集用于检验训练后的卷积神经网络,根据训练和检验结果可以对卷积神经网络进行调整。
随后,在步骤S240中,根据所述训练图片集对所述卷积神经网络进行模型训练,并根据训练结果对所述卷积神经网络进行初次调整。具体地,采用随机梯度下降(SGD)方法计算损失函数J(θ)对于卷积神经网络中的参数θ的梯度σ(θ),该梯度σ(θ)被用来更新卷积神经网络中的参数。另外,还根据该梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制所述梯度更新的幅度。
随后,在步骤S250中,根据所述已知质量因子的验证图片集对训练后的卷积神经网络进行精度检验,并根据检验结果对该卷积神经网络进行二次调整,如调整网络结构(网络层数,特征图数量),学习率等超参数(hyper parameter)。已知验证图片集的质量因子,则可以将该验证图片集输入到训练的卷积神经网络中得到其质量因子,并与图片集本身的质量因子作比较。根据在验证图片集上的精度偏差对训练后的卷积神经网络进行调整,重新训练调整后的模型以得到更好的网络模型。
在上述根据训练结果和检验结果对卷积神经网络所做的调整中,具体调整的包括其网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
随后,在步骤S260中,将待判断质量因子的测试图片集输入到所述二次调整后的卷积神经网络中,得到其图片质量因子。
图3示出了根据本发明的一个实施例的自拍图像的优化装置300,适于驻留在计算设备中,该装置包括CNN创建单元310、训练图片集单元320、验证图片集单元330、CNN训练单元340、CNN检验单元350和结果输出单元360。
CNN创建单元310适于创建用于判断图片质量因子的卷积神经网络(CNN)。其中,卷积神经网络包括:至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层,其中所述卷积神经网络中输入的是训练图片集、验证图片集和待判断质量因子的测试图片集,从分类器层输出的是输入图片的质量因子。
根据一个实施例,卷积神经网络包括重复三次的卷积层+非线性激活层+下采样层,以及两层全连接层和一层分类器层,其中,
第一层的卷积层采用32个特征图,卷积核大小为7*7*3;
第二层的卷积层采用64个特征图,卷积核大小为5*5*32;
第三层的卷积层采用96个特征图,卷积核大小为3*3*64;
所述下采样层均采用2*2的池化区间;
所述两层全连接层的维度分别为256和10;
所述分类器层的维度为10。
根据一个实施例,分类器可以采用SoftMax分类器,SoftMax回归算法的损失函数J(θ)的公式为:
其中,m是训练图片集的样本数目,x(i)是图片i所输入的特征,y(i)是图片i所输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
训练图片集单元320选取多张已知质量因子的压缩图片构造用于训练上述卷积神经网络的训练图片集。验证图片集330选取多张已知质量因子的压缩图片构造用于检验上述训练后的卷积神经网络的验证图片集。
CNN训练单元340根据所述已知质量因子的训练图片集对卷积神经网络进行模型训练,并根据训练结果对所述卷积神经网络进行初次调整。具体地,采用随机梯度下降方法计算分类器的分类算法的损失函数J(θ),以及该损失函数中参数θ的梯度σ(θ),并根据所述梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制所述梯度更新的幅度。
CNN检验单元350根据所述已知质量因子的验证图片集对训练后的卷积神经网络进行精度检验,并根据检验结果对所述卷积神经网络进行二次调整。
具体地,CNN训练单元和CNN检验单元可以调整卷积神经网络的网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
结果输出单元360将待判断质量因子的测试图片集输入到所述二次调整后的卷积神经网络中,得到其图片质量因子。
根据本发明的判断图片质量因子的装置300,其具体细节已在基于图1和图2的描述中详细公开,在此不再赘述。
根据本发明的技术方案,构造了训练图片集和验证图片集以训练并检验卷积神经网络,该卷积神经网络可以自动从训练数据当中学习特征,从而省去了人工设计特征的步骤,且自动学习到的特征比人工设计的特征能力更强,鲁棒性也更好。另外,通过对大量训练图片的学习,本方案所训练的卷积神经网络系统有极高的分类精度。而且,本方案中特征提取和分类器训练同时进行,实现端到端的学习过程,从而可以最大程度的提升整个系统的分类精度,方便用户快速速并准确的获取图片的质量因子。
B10、如B8或B9所述的装置,其中所述卷积神经网络包括重复三次的卷积层+非线性激活层+下采样层,以及两层全连接层和一层分类器层,其中,
第一层的卷积层采用32个特征图,卷积核大小为7*7*3;
第二层的卷积层采用64个特征图,卷积核大小为5*5*32;
第三层的卷积层采用96个特征图,卷积核大小为3*3*64;
所述下采样层均采用2*2的池化区间;
所述两层全连接层的维度分别为256和10;
所述分类器层的维度为10。
B11、如B9所述的装置,其中所述分类器采用SoftMax分类器。
B12、如B8所述的装置,其中所述CNN训练单元适于根据以下方法对所述卷积神经网络进行调整的步骤包括:采用随机梯度下降方法计算所述分类器的分类算法的损失函数J(θ),以及该损失函数中参数θ的梯度σ(θ),并根据所述梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制所述梯度更新的幅度。
B13、如B8或B12所述的装置,其中所述CNN训练单元和CNN检验单元适于调整所述卷积神经网络的网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
B14、如B12所述的装置,所述分类算法的损失函数J(θ)的公式为:
其中,m是图片集的样本数目,x(i)是图片i所输入的特征,y(i)是图片i所输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。
如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。
尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的,而非限制性的,本发明的范围由所附权利要求书限定。
Claims (10)
1.一种判断图片质量因子的方法,该方法包括:
创建用于判断图片质量因子的卷积神经网络;
选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;
选取多张已知质量因子的压缩图片构造用于检验所述卷积神经网络的验证图片集;
根据所述训练图片集对所述卷积神经网络进行模型训练,并根据训练结果对所述卷积神经网络进行初次调整;
根据所述验证图片集对所述训练后的卷积神经网络进行精度检验,并根据检验结果对所述训练后的卷积神经网络进行二次调整;以及
将待判断质量因子的测试图片集输入到所述二次调整后的卷积神经网络中,得到其图片质量因子。
2.如权利要求1所述的方法,其中所述卷积神经网络包括:
至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层,其中所述卷积神经网络中输入的是所述训练图片集、验证图片集和待判断质量因子的测试图片集,从分类器层输出的是所述输入图片的质量因子。
3.如权利要求1或2所述的方法,其中所述卷积神经网络包括重复三次的卷积层+非线性激活层+下采样层,以及两层全连接层和一层分类器层,其中,
第一层的卷积层采用32个特征图,卷积核大小为7*7*3;
第二层的卷积层采用64个特征图,卷积核大小为5*5*32;
第三层的卷积层采用96个特征图,卷积核大小为3*3*64;
所述下采样层均采用2*2的池化区间;
所述两层全连接层的维度分别为256和10;
所述分类器层的维度为10。
4.如权利要求2所述的方法,其中所述分类器采用SoftMax分类器。
5.如权利要求1所述的方法,其中所述根据模型训练结果对卷积神经网络中进行调整的步骤包括:
采用随机梯度下降方法计算所述分类器的分类算法的损失函数J(θ),以及该损失函数中参数θ的梯度σ(θ),并根据所述梯度σ(θ)更新参数θ的值θ'=θ-η×σ(θ),其中,η为学习率,用于控制所述梯度更新的幅度。
6.如权利要求1或5所述的方法,其中所述对卷积神经网络中进行调整的步骤包括:
调整所述卷积神经网络的网络层数、网络层顺序、特征图数量、卷积核大小、下采样层大小、全连接层和分类器层的维度,以及损失函数的学习率等超参数。
7.如权利要求5所述的方法,所述分类算法的损失函数J(θ)的公式为:
其中,m是图片集的样本数目,x(i)是图片i输入的特征,y(i)是图片i输出的类标记,其值为0,1……k,θ是训练的模型参数,对数函数中的真数项部分所代表的是把x(i)分类为类别j的概率。
8.一种判断图片质量因子的装置,该装置包括:
CNN创建单元,适于创建用于判断图片质量因子的卷积神经网络(CNN);
训练图片集单元,适于选取多张已知质量因子的压缩图片构造用于训练所述卷积神经网络的训练图片集;
验证图片集单元,适于选取多张已知质量因子的压缩图片构造用于检验所述卷积神经网络的验证图片集;
CNN训练单元,适于根据所述训练图片集对所述卷积神经网络进行模型训练,并根据训练结果对所述卷积神经网络进行初次调整;
CNN检验单元,适于根据所述验证图片集对所述训练后的卷积神经网络进行精度检验,并根据检验结果对所述训练后的卷积神经网络进行二次调整;以及
结果输出单元,适于将待判断质量因子的测试图片集输入到所述二次调整后的卷积神经网络中,得到其图片质量因子。
9.如权利要求8所述的装置,其中所述卷积神经网络包括:
至少重复一次的卷积层、非线性激活层和下采样层,以及全连接层和分类器层,其中所述卷积神经网络中输入的是训练图片集、验证图片集和待判断质量因子的测试图片集,从分类器层输出的是输入图片的质量因子。
10.一种计算设备,包括如权利要求8或9所述的判断图片质量因子的装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610622575.6A CN106295682A (zh) | 2016-08-02 | 2016-08-02 | 一种判断图片质量因子的方法、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610622575.6A CN106295682A (zh) | 2016-08-02 | 2016-08-02 | 一种判断图片质量因子的方法、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106295682A true CN106295682A (zh) | 2017-01-04 |
Family
ID=57664042
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610622575.6A Pending CN106295682A (zh) | 2016-08-02 | 2016-08-02 | 一种判断图片质量因子的方法、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106295682A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874898A (zh) * | 2017-04-08 | 2017-06-20 | 复旦大学 | 基于深度卷积神经网络模型的大规模人脸识别方法 |
CN107330715A (zh) * | 2017-05-31 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 选择图片广告素材的方法和装置 |
CN107483891A (zh) * | 2017-09-07 | 2017-12-15 | 四川智慧鹰航空科技有限公司 | 一种携带可视化系统的微型直升机 |
CN107529014A (zh) * | 2017-09-07 | 2017-12-29 | 四川智慧鹰航空科技有限公司 | 一种大载重超长航时的旋翼无人机 |
CN107564054A (zh) * | 2017-09-07 | 2018-01-09 | 四川智慧鹰航空科技有限公司 | 一种低噪音微型无人机‑侦察设备监控方法 |
CN107607089A (zh) * | 2017-09-07 | 2018-01-19 | 四川智慧鹰航空科技有限公司 | 一种节能型gps和北斗导航飞行控制设备 |
CN107687839A (zh) * | 2017-09-07 | 2018-02-13 | 四川智慧鹰航空科技有限公司 | 一种利用太阳能光伏电池和锂电混合动力的微型无人机的功耗监控方法 |
CN107729078A (zh) * | 2017-09-30 | 2018-02-23 | 广东欧珀移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
CN108446741A (zh) * | 2018-03-29 | 2018-08-24 | 中国石油大学(华东) | 机器学习超参数重要性评估方法、系统及存储介质 |
CN108681480A (zh) * | 2017-09-30 | 2018-10-19 | 广东欧珀移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
CN108880568A (zh) * | 2018-07-06 | 2018-11-23 | 中国石油大学(华东) | 一种基于卷积神经网络的串行抵消列表译码参数优化方法 |
CN109272499A (zh) * | 2018-09-25 | 2019-01-25 | 西安电子科技大学 | 基于卷积自编码网络的无参考图像质量评价方法 |
CN110119750A (zh) * | 2018-02-05 | 2019-08-13 | 浙江宇视科技有限公司 | 数据处理方法、装置及电子设备 |
CN110188285A (zh) * | 2019-04-26 | 2019-08-30 | 中德(珠海)人工智能研究院有限公司 | 图像专业性的深度卷积神经网络预测 |
CN111326167A (zh) * | 2020-03-09 | 2020-06-23 | 广州深声科技有限公司 | 一种基于神经网络的声学特征转换方法 |
CN111476760A (zh) * | 2020-03-17 | 2020-07-31 | 平安科技(深圳)有限公司 | 医学图像的生成方法、装置、电子设备及介质 |
US11153575B2 (en) | 2018-03-06 | 2021-10-19 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
CN109522950B (zh) * | 2018-11-09 | 2022-04-22 | 网易传媒科技(北京)有限公司 | 图像评分模型训练方法及装置和图像评分方法及装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040008883A1 (en) * | 2002-07-12 | 2004-01-15 | Bingxue Shi | VLSI neural fuzzy classifier for handwriting recognition |
CN103544705A (zh) * | 2013-10-25 | 2014-01-29 | 华南理工大学 | 一种基于深度卷积神经网络的图像质量测试方法 |
CN105160678A (zh) * | 2015-09-02 | 2015-12-16 | 山东大学 | 基于卷积神经网络的无参考立体图像质量评估方法 |
CN105208374A (zh) * | 2015-08-24 | 2015-12-30 | 宁波大学 | 一种基于深度学习的无参考图像质量客观评价方法 |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
-
2016
- 2016-08-02 CN CN201610622575.6A patent/CN106295682A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040008883A1 (en) * | 2002-07-12 | 2004-01-15 | Bingxue Shi | VLSI neural fuzzy classifier for handwriting recognition |
CN103544705A (zh) * | 2013-10-25 | 2014-01-29 | 华南理工大学 | 一种基于深度卷积神经网络的图像质量测试方法 |
CN105208374A (zh) * | 2015-08-24 | 2015-12-30 | 宁波大学 | 一种基于深度学习的无参考图像质量客观评价方法 |
CN105160678A (zh) * | 2015-09-02 | 2015-12-16 | 山东大学 | 基于卷积神经网络的无参考立体图像质量评估方法 |
CN105426963A (zh) * | 2015-12-01 | 2016-03-23 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
Non-Patent Citations (1)
Title |
---|
陈铎 等: ""基于神经网络的压缩后医学图像的质量评估"", 《航天医学与医学工程》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874898A (zh) * | 2017-04-08 | 2017-06-20 | 复旦大学 | 基于深度卷积神经网络模型的大规模人脸识别方法 |
CN106874898B (zh) * | 2017-04-08 | 2021-03-30 | 复旦大学 | 基于深度卷积神经网络模型的大规模人脸识别方法 |
CN107330715B (zh) * | 2017-05-31 | 2020-12-22 | 北京京东尚科信息技术有限公司 | 选择图片广告素材的方法和装置 |
CN107330715A (zh) * | 2017-05-31 | 2017-11-07 | 北京京东尚科信息技术有限公司 | 选择图片广告素材的方法和装置 |
CN107483891A (zh) * | 2017-09-07 | 2017-12-15 | 四川智慧鹰航空科技有限公司 | 一种携带可视化系统的微型直升机 |
CN107529014A (zh) * | 2017-09-07 | 2017-12-29 | 四川智慧鹰航空科技有限公司 | 一种大载重超长航时的旋翼无人机 |
CN107564054A (zh) * | 2017-09-07 | 2018-01-09 | 四川智慧鹰航空科技有限公司 | 一种低噪音微型无人机‑侦察设备监控方法 |
CN107607089A (zh) * | 2017-09-07 | 2018-01-19 | 四川智慧鹰航空科技有限公司 | 一种节能型gps和北斗导航飞行控制设备 |
CN107687839A (zh) * | 2017-09-07 | 2018-02-13 | 四川智慧鹰航空科技有限公司 | 一种利用太阳能光伏电池和锂电混合动力的微型无人机的功耗监控方法 |
CN107729078A (zh) * | 2017-09-30 | 2018-02-23 | 广东欧珀移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
WO2019062411A1 (zh) * | 2017-09-30 | 2019-04-04 | Oppo广东移动通信有限公司 | 后台应用程序管控方法、存储介质及电子设备 |
CN107729078B (zh) * | 2017-09-30 | 2019-12-03 | Oppo广东移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
CN108681480B (zh) * | 2017-09-30 | 2020-02-11 | Oppo广东移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
CN108681480A (zh) * | 2017-09-30 | 2018-10-19 | 广东欧珀移动通信有限公司 | 后台应用程序管控方法、装置、存储介质及电子设备 |
CN110119750A (zh) * | 2018-02-05 | 2019-08-13 | 浙江宇视科技有限公司 | 数据处理方法、装置及电子设备 |
US11153575B2 (en) | 2018-03-06 | 2021-10-19 | Samsung Electronics Co., Ltd. | Electronic apparatus and control method thereof |
CN108446741A (zh) * | 2018-03-29 | 2018-08-24 | 中国石油大学(华东) | 机器学习超参数重要性评估方法、系统及存储介质 |
CN108446741B (zh) * | 2018-03-29 | 2020-01-07 | 中国石油大学(华东) | 机器学习超参数重要性评估方法、系统及存储介质 |
CN108880568A (zh) * | 2018-07-06 | 2018-11-23 | 中国石油大学(华东) | 一种基于卷积神经网络的串行抵消列表译码参数优化方法 |
CN109272499A (zh) * | 2018-09-25 | 2019-01-25 | 西安电子科技大学 | 基于卷积自编码网络的无参考图像质量评价方法 |
CN109272499B (zh) * | 2018-09-25 | 2020-10-09 | 西安电子科技大学 | 基于卷积自编码网络的无参考图像质量评价方法 |
CN109522950B (zh) * | 2018-11-09 | 2022-04-22 | 网易传媒科技(北京)有限公司 | 图像评分模型训练方法及装置和图像评分方法及装置 |
CN110188285A (zh) * | 2019-04-26 | 2019-08-30 | 中德(珠海)人工智能研究院有限公司 | 图像专业性的深度卷积神经网络预测 |
CN111326167A (zh) * | 2020-03-09 | 2020-06-23 | 广州深声科技有限公司 | 一种基于神经网络的声学特征转换方法 |
CN111326167B (zh) * | 2020-03-09 | 2022-05-13 | 广州深声科技有限公司 | 一种基于神经网络的声学特征转换方法 |
WO2021184576A1 (zh) * | 2020-03-17 | 2021-09-23 | 平安科技(深圳)有限公司 | 医学图像的生成方法、装置、电子设备及介质 |
CN111476760A (zh) * | 2020-03-17 | 2020-07-31 | 平安科技(深圳)有限公司 | 医学图像的生成方法、装置、电子设备及介质 |
CN111476760B (zh) * | 2020-03-17 | 2024-05-10 | 平安科技(深圳)有限公司 | 医学图像的生成方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106295682A (zh) | 一种判断图片质量因子的方法、装置和计算设备 | |
CN110880036B (zh) | 神经网络压缩方法、装置、计算机设备及存储介质 | |
WO2022083536A1 (zh) | 一种神经网络构建方法以及装置 | |
Wang et al. | Multi-scale dilated convolution of convolutional neural network for image denoising | |
US10460231B2 (en) | Method and apparatus of neural network based image signal processor | |
KR102545128B1 (ko) | 뉴럴 네트워크를 수반한 클라이언트 장치 및 그것을 포함하는 시스템 | |
CN106780512A (zh) | 分割图像的方法、应用及计算设备 | |
CN113240580A (zh) | 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法 | |
CN103927531B (zh) | 一种基于局部二值和粒子群优化bp神经网络的人脸识别方法 | |
CN109754078A (zh) | 用于优化神经网络的方法 | |
CN107247949A (zh) | 基于深度学习的人脸识别方法、装置和电子设备 | |
Chen et al. | Remote sensing image quality evaluation based on deep support value learning networks | |
Ou et al. | A novel rank learning based no-reference image quality assessment method | |
CN109635939A (zh) | 一种基于裁剪的卷积神经网络的确定方法及装置 | |
CN110738235A (zh) | 肺结核判定方法、装置、计算机设备及存储介质 | |
CN111814804B (zh) | 基于ga-bp-mc神经网络的人体三维尺寸信息预测方法及装置 | |
Li et al. | No-reference image quality assessment based on hybrid model | |
CN115631396A (zh) | 一种基于知识蒸馏的YOLOv5目标检测方法 | |
WO2018228399A1 (zh) | 运算装置和方法 | |
CN110516734A (zh) | 一种图像匹配方法、装置、设备及存储介质 | |
CN110363072A (zh) | 舌象识别方法、装置、计算机设备及计算机可读存储介质 | |
CN116362325A (zh) | 一种基于模型压缩的电力图像识别模型轻量化应用方法 | |
CN114566277B (zh) | 一种基于联邦元学习的罕见疾病分类方法 | |
CN112416293A (zh) | 一种神经网络增强方法、系统及其应用 | |
Cao et al. | Acceleration of histogram‐based contrast enhancement via selective downsampling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170104 |