CN108257095B

CN108257095B - 用于处理图像的系统

Info

Publication number: CN108257095B
Application number: CN201711284807.2A
Authority: CN
Inventors: 莎拉·拉奈斯; 文森特·德斯皮格尔; 扬·拉斐尔·里夫奇兹; 史蒂芬·基恩特里克
Original assignee: French Ademia Identity And Security Co
Current assignee: French Ademia Identity And Security Co
Priority date: 2016-12-07
Filing date: 2017-12-07
Publication date: 2023-11-28
Anticipated expiration: 2037-12-07
Also published as: KR20180065950A; CA2987846A1; FR3059804B1; AU2017272164A1; BR102017026341A8; EP3333765A1; BR102017026341A2; FR3059804A1; AU2017272164B2; US20180158177A1; CN108257095A

Abstract

本发明公开了一种用于处理图像(4)的系统(1)，系统(1)包括主神经网络(2)、优选基于卷积的主神经网络(CNN)，和至少一个在主神经网络(2)的上游的预处理神经网络(6)、优选基于卷积的预处理神经网络，预处理神经网络(6)用于在通过主神经网络(2)进行处理之前进行至少一种关于其参数是可微分的参数变换f，所述变换被应用于所述图像的像素的至少一部分并且具有形式p′＝f(V(p)，Θ)，式中，p为原始图像的处理后的像素或所述图像的分解的处理后的像素，p'为变换后的图像的像素或变换后的图像的分解的像素，V(p)为像素p的邻域，Θ为参数的向量，预处理神经网络(6)使其学习的至少一部分与主神经网络(2)的学习同时地进行。

Description

用于处理图像的系统

技术领域

本发明涉及利用神经网络处理图像的系统，更特别地但不仅仅涉及用于生物计量学、尤其面部识别的系统。

背景技术

针对面部或其它目标的识别已提出使用所谓的卷积神经网络(convolutionneural networks，CNN)。Yann Le Cun等人的文章Deep Learning(436NATURE，第521卷，2015年5月28日)包括对这些神经网络的介绍。

另外，设法例如通过伽玛校正或局部对比度校正来进行图像的预处理以便纠正图像的缺陷(例如缺乏对比度)是司空见惯的。

面部的生物识别假定多种多样的图像采集和照明条件，这引起对待被进行的纠正的选择上的困难。而且，由于卷积神经网络的性能上的改进与完全学习到的隐藏层相关，故这引起在理解图像处理(在这种网络的上游应用该图像处理将是有用的)上的困难。

因此，受越来越强大的处理器的快速发展的支持，当前趋势是加强卷积神经网络的能力，并拓宽它们对多方面变化的图像的学习，以便独立于任何预处理来改进这些网络的性能。

然而，尽管这些系统是更加有效的，但这些系统对于伪影的存在以及对于图像质量的下降是不完全鲁棒的。而且，增加计算资源的计算能力是相当昂贵的不总是适合的解决方案。

因此，对于图像质量的问题的现有解决方案(与寻求学习的问题无关，该现有解决方案因此要么在于利用有问题的图像的示例来丰富学习库，要么在于在上游进行图像处理)不是完全令人满意的。

因此，仍需要进一步加强基于卷积神经网络的生物识别链，尤其以便使得生物识别链对于各种噪音更加鲁棒从而因此改进关于具有较低质量的图像的识别性能。

Peng Xi等人的文章“Learning face recognition from limited trainingdata using deep neural networks”(第23届图案识别国际会议，2016年12月4日，第1442-1447页)描述了利用对图像应用仿射变换的第一神经网络和用于识别由此变换的图像的第二神经网络来识别面部的方案。

Svoboda Pavel等人的文章“CNN for license plate motion deblurring”(图像处理国际会议，2016年9月25日，第3832-3836页)描述了利用CNN网络使号牌去燥的方法。

Chakrabarti Ayan的文章“A Neural Approach to Blind Motion Deblurring”(ECCV 2016，第9907卷，第221-235页)描述了在通过神经网络学习这些数据之前将图像变换到频域，以便出于去燥目的评估卷积参数。

文章Spatial Transformer Networks，Max Jaderberg,Karen Simonyan,AndrewZisserman,Koray Kavukcuoglu,NIPS2015，描述了设计用于字符识别的处理系统，其中，卷积的预处理神经网络被用于进行空间变换，例如旋转和缩放。与生物计量学相关的问题在该文章中未被解决。应用于像素的变换被应用于整个图像。

发明内容

根据本发明的一个方面，本发明通过用于处理图像的系统满足上文所述的需求，该系统包括主神经网络(优选基于卷积的主神经网络(CNN))和至少一个在主神经网络的上游的预处理神经网络(优选基于卷积的预处理神经网络)，所述预处理神经网络用于在通过主神经网络进行处理之前进行至少一种关于其参数是可微分的参数变换，该变换被应用于图像的像素的至少一部分，该预处理神经网络使其学习的至少一部分与主神经网络的学习同时地进行。

根据本发明的该第一方面的变换f具有下面的形式：

p′＝f(V(p),Θ)

式中，p为原始图像的像素或该图像的分解的像素，p'为变换后的图像的像素或变换后的图像的分解的像素，V(p)为像素p的邻域(在数学意义上)，Θ为一组参数。邻域V(p)不包含整个图像。

预处理网络因此可以通过应用变换f，利用Θ＝{Θ₁,Θ₂,…,Θ_n}，评估参数的至少一个向量Θ的一个或多个映射。

“映射”指的是其分辨率可以等于或可以不等于图像的分辨率的矩阵。

图像的分解被理解为例如借助通过分离相位和模数的傅立叶变换将图像分离成多个分量。

应用于一个像素的变换可不依赖应用于图像的其它像素的变换。因此，通过预处理网络进行的变换可仅仅应用于图像的像素的仅一部分。

所应用的变换不同于如在上文的文章Spatial Transformer Networks中的应用于整个图像的空间变换，因此不同于裁切、平移、旋转、相似扩大、在平面上的投影、或对称。

所应用的变换可以是空间上不变的，即该变换不会引起图像上的像素的任何位移。

与主神经网络一起训练预处理网络可以具有完美地适于诸如通过受训的主神经网络所确定的描述符的分析的需要的校正。

图像处理系统的性能因此被改进，同时与已知的基于学习数据的丰富的解决方案对比，可以维持用于描述符的学习的主网络的深层的能力，同时避免必须将其致力于补偿图像质量问题。

在其它示例中，预处理神经网络可被配置成对图像压缩伪影和/或图像的清晰度起作用。

神经网络还可被配置成向起始图像应用比色变换。

一般地说，所进行的图像预处理可以由下面的图像处理操作符中的一者或多者构成：

-逐像素的(或逐点的)修正操作符。这涉及例如色彩校正、色度校正或伽玛校正，或噪音阈值化操作；

-局部操作符，尤其是用于管理局部模糊或局部对比度的那些局部操作符、依赖于像素的邻域(即，多于一个像素但小于整个图像)的局部操作符；基于输入像素的邻域，局部操作符可以获得输出像素；

-频率空间中(在图像变换之后的)的操作符，和

-一般地说，对从原始图像中导出的多图像表示的任何操作。

通过包括频率空间中的一个或多个操作符，为用于降低模拟噪音或数字噪音(例如降低压缩伪影)、改善图像的清晰度、清楚度或对比度的各种可能性铺平了道路。

这些操作符也允许各种滤波，例如直方图均衡化、图像的动态摆动的校正、图案(例如数字水印或“水印”类型的图案)的删除、或频率校正和通过设置用于恢复图像中的相关信息的系统的图像的清洁。

例如，预处理神经网络包括一个或多个卷积层(CONV)和/或一个或多个完全连接层(FC)。

处理系统可包括输入操作符，该输入操作符使得可以向起始图像应用输入变换，以基于起始图像在预处理神经网络的上游生成在不同于起始图像的空间的空间中的数据，该预处理神经网络被配置成对这些数据起作用，该系统包括输出操作符，该输出操作符被设计成通过与输入变换相反的输出变换来恢复在起始图像的处理空间中由预处理神经网络处理的数据，从而生成通过主神经网络处理的校正的图像。

例如，该输入操作符被配置成应用小波变换，该输出操作符被配置成应用逆变换。

在本发明的实现方式的示例中，预处理神经网络被配置成生成对应于低分辨率映射的一组向量，系统包括被配置成通过插值、尤其双线性插值生成对应于较高分辨率映射(该较高分辨率映射优选具有与起始图像相同的分辨率)的一组向量的操作符。

主神经网络和预处理神经网络可被训练以进行尤其面部的识别、分类或检测。

根据本发明的另一方面，本发明的主题还为一种如上文所限定的根据本发明的系统的主神经网络和预处理神经网络的学习的方法，其中，与主神经网络的训练同时地进行预处理神经网络的学习的至少一部分。

可以尤其借助于改变的图像的库、尤其噪声图像的库进行该学习。可以对该学习以寻求最小化代表通过预处理神经网络进行的校正的成本函数的方式发展的方向施加约束。

根据本发明的另一方面，本发明的主题还为一种用于处理图像的方法，其中，通过如上文所限定的根据本发明的系统对图像进行处理。

根据本发明的另一方面，本发明的主题还为一种生物识别的方法，包括以下步骤：利用如上文所限定的根据本发明的系统的主神经网络，生成关于通过系统的个体识别的信息项。

独立地或与前述内容组合，本发明的主题还为一种用于处理图像的系统，该系统包括主神经网络(优选基于卷积的主神经网络(CNN))和至少一个在主神经网络的上游的预处理神经网络(优选基于卷积的预处理神经网络)，所述预处理神经网络用于在通过主神经网络进行处理之前进行至少一种关于其参数是可微分的参数变换，该变换被应用于图像的像素的至少一部分且使像素在空间上是不变的，该预处理神经网络使其学习的至少一部分与主神经网络的学习同时地进行。

附图说明

通过阅读以下的本发明的实现方式的非限制性示例的描述以及通过审阅附图，将能够更好地理解本发明，其中：

图1为根据本发明的示例性处理系统的框图，

图2示出进行伽马校正的示例性图像预处理，

图3示出在预处理神经网络的上游应用空间变化的处理，

图4示出用于图像的比色预处理的神经网络的示例性结构，和

图5表示在预处理网络的学习之后进行的比色预处理之前和之后的图像。

具体实施方式

图1中所示的是根据本发明的用于处理图像的示例性系统1。

在所考虑的示例中，该系统包括生物识别卷积神经网络2和图像预处理模块3，该图像预处理模块3还包括神经网络6、优选卷积神经网络并学习在生物识别网络2的上游对起始图像4应用处理。

根据本发明，这种在生物识别神经网络的上游进行的处理属于至少一种关于其参数可微分的参数变换。根据本发明，预处理神经网络6与生物识别神经网络2一起接受训练。因此，与生物识别网络2同时地学习预处理网络6的图像变换参数。在神经网络2的学习期间可进行预处理神经网络6的全部学习。作为变型，最初独立于网络2进行网络6的学习，然后通过网络2和网络6的同时学习来完成学习，从而可以使得就如同使网络“同步”一样。

质量变化的图像被用于该学习。优选地，借助于改变后的图像、尤其噪声图像的库进行该学习，并且可以对学习以寻求最小化代表通过预处理神经网络进行的校正的成本函数的方式发展的方向施加约束。

通过预处理网络6进行的一个变换或多个变换是可微分的，它们不会阻碍对于这些网络的学习而言必需的向后传播过程。

预处理神经网络可被配置成进行非线性变换，尤其是选自以下的非线性变换：像素的伽玛校正、局部对比度校正、色彩校正、图像的伽玛校正、局部对比度的改变、噪音的降低和/或压缩伪影的减少。

该变换可写成下面的形式：

p′＝f(V(p),Θ)

式中，p为原始图像的像素或该图像的分解的像素，p'为变换后的图像的像素或该变换后的图像的分解的像素，V(p)为像素p的邻域，Θ为一组参数。

神经网络2可以为任何类型。

现将参照图2描述根据本发明的用于处理图像的示例性系统，在该系统中，预处理模块3应用伽玛校正，即根据输入文件的像素的亮度提供输出文件的像素的亮度的曲线的校正。

在该示例中，预处理神经网络6具有应用于整个图像的单个输出，即伽玛校正参数。

因此，在根据本发明的处理系统的学习期间，学习用于图像的单个变换参数。

预处理神经网络6包括例如基于卷积的模块Conv1和完全连接的模块FC1。

网络6生成向量11，该向量11使得可以估计用于伽玛校正系数，该校正系数在12被应用于图像以变换图像，如图2所示。

在学习期间，预处理网络6将学习根据起始图像4进行伽玛校正，对于该伽玛校正，生物识别网络2证明是有效的；所进行的校正未必是操作员为了改善图像的质量而凭直觉对图像所做的校正。

可以相继地设置多个将学习图像变换参数的预处理网络。在每个预处理网络之后，根据学到的参数变换图像，所产生的图像可充当用于接下来的网络的输入，直到其作为用于主网络的输入为止。

预处理网络可应用于来源于图像变换(例如傅立叶变换或小波变换)的分量。于是在逆变换被应用以进入整个网络之前，其为这些充当子网络的输入的变换的产物。

图3示出处理系统的实例，在该处理系统中，通过从变换后的原始图像推断出的多图像表示进行通过网络6的预处理。这可以生成子图像28₁至子图像28_n，这些子图像被变换成校正的子图像29₁至校正的子图像29_n，该变换例如是小波变换。

乘积因子的系数和阈值的映射在22被应用于子图像28₁至子图像28_n。

该处理对于任何图像分解是可适用的，对于该图像分解，重建步骤是可微分的(例如余弦变换、通过分离相位和模数的傅立叶变换、将输入图像表示为多个个图像的总和，等等)。

现将参照图4和图5描述适合于校正起始图像中的颜色以便校正色度的问题和对于该学习的剩余部分利用更加适合的颜色库的示例性处理系统。

预处理网络6的参数的向量在该示例中对应于3×3交换矩阵(P)和对于每个颜色通道R、G和B的恒定偏移(D)的添加(仿射变换)，即12个参数。

在图4中示出能用于进行这种处理的示例性网络6。该网络6包括两个卷积层，两个最大池化层、和完全连接层。

对于初始图像的每个像素我们具有：

其对于图像的所有像素给出：

示例

应用参照图4和图5描述的色彩校正处理。图5给出示例性结果。注意到，该结果并不是凭直觉预期的结果，这是因为网络6具有扩大颜色的饱和度的趋势，因此具有整套网络的组合学习、而非单独学习的好处。

在不特别具有任何色缺陷的面部的内在基础上，对于1％的误接受率，观察到3.21％的误拒绝的相对下降。

本发明不受限于图像分类应用，还适用于面部生物计量学上的鉴定和验证。

根据本发明的处理系统还可适用于利用不同于面部的生物计量学的生物计量学(例如虹膜的生物计量学)的检测，以及适用于行人和车辆的识别、图像的位置和合成上的应用，更一般地说适用于图像的检测、分类或自动分析上的所有应用。

因此，本发明可适用于例如语义切分、自动医疗诊断(例如乳房X线照相术或回波描记术中的自动医疗诊断)、场景的分析(例如无人驾驶汽车)、或视频的语义分析。

处理系统还可以增补有如在背景技术中提到的文章Spatial Transformer中描述的将空间变换应用于像素的卷积预处理神经网络。

本发明可以在任何类型的硬件(例如个人计算机、智能手机、专用卡、巨型计算机)上进行实施。

多个图像的处理可以通过并行的预处理网络而并行进行。

Claims

1.一种用于处理图像(4)的系统(1)，所述系统(1)包括主神经网络(2)，和至少一个在所述主神经网络(2)的上游的预处理神经网络(6)，所述预处理神经网络(6)用于在通过所述主神经网络(2)进行处理之前进行至少一种非线性参数变换f，所述参数变换被应用于图像的像素的仅一部分并且具有形式p′=f(V(p),Θ)，式中，p为原始图像的像素，p'为变换后的图像的像素，或者，p为原始图像的分解的像素，p'为变换后的图像的分解的像素，V(p)为所述像素p的邻域，Θ为参数的向量，其中，f相对于所述参数是能够微分的，其中，所述预处理神经网络(6)的学习的至少一部分与所述主神经网络(2)的训练同时地进行。

2.根据权利要求1所述的系统，其中，所述变换f使所述像素在所述图像上是空间不变的。

3.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被设计成进行逐像素的修正，进行色彩校正、色调补偿或伽玛校正，或噪音阈值化操作。

4.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被配置成应用用于管理局部模糊或局部对比度的局部操作符。

5.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被配置成在所述图像的变换之后应用频率空间中的操作符，被配置成降低模拟噪音或数字噪音，或者被配置成进行滤波。

6.根据权利要求1所述的系统，其中，所述预处理神经网络(6)包括一个或多个卷积层CONV和/或一个或多个完全连接层FC。

7.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被配置成进行像素的伽玛校正和/或局部对比度校正。

8.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被配置成应用比色变换。

9.根据权利要求1所述的系统，包括输入操作符，所述输入操作符使得能够向起始图像应用输入变换，以基于所述起始图像在所述预处理神经网络(6)的上游生成与所述起始图像的空间不同的空间中的数据，所述预处理神经网络被配置成对这些数据起作用，所述系统包括输出操作符，所述输出操作符被设计成通过与所述输入变换相反的输出变换来恢复在所述起始图像的处理空间中由所述预处理神经网络处理的数据，从而生成通过所述主神经网络处理的校正的图像。

10.根据权利要求9所述的系统，其中，所述输入操作符被配置成应用小波变换，所述输出操作符被配置成应用逆变换。

11.根据权利要求9所述的系统，其中，所述预处理神经网络被配置成对图像压缩伪影和/或图像的清晰度起作用。

12.根据权利要求1所述的系统，其中，所述预处理神经网络(6)被配置成生成对应于低分辨率映射(7)的一组向量(9)，所述系统包括被配置成通过插值生成对应于较高分辨率映射(8)的一组向量的操作符。

13.根据权利要求1所述的系统，其中，所述主神经网络和所述预处理神经网络被训练以进行面部的生物计量学的分类、识别或检测。

14.一种根据权利要求1所述的系统的学习的方法，其中，所述预处理神经网络的学习的至少一部分与所述主神经网络的训练同时地进行。

15.根据权利要求14所述的方法，其中，借助于改变的图像的库，并且通过对所述学习以寻求最小化成本函数的方式发展的方向施加约束，来进行所述学习，其中，所述成本函数代表通过所述预处理神经网络进行的校正。

16.根据权利要求15所述的方法，其中，借助于噪声图像的库，并且通过对所述学习以寻求最小化成本函数的方式发展的方向施加约束，来进行所述学习。

17.一种用于处理图像的方法，其中，通过根据权利要求1所述的系统处理所述图像。

18.一种生物识别的方法，包括以下步骤：利用如权利要求1中所限定的系统，生成与通过所述系统的个体识别相关的信息项。