CN114238904B - 身份识别方法、双通道超分模型的训练方法及装置 - Google Patents
身份识别方法、双通道超分模型的训练方法及装置 Download PDFInfo
- Publication number
- CN114238904B CN114238904B CN202111492178.9A CN202111492178A CN114238904B CN 114238904 B CN114238904 B CN 114238904B CN 202111492178 A CN202111492178 A CN 202111492178A CN 114238904 B CN114238904 B CN 114238904B
- Authority
- CN
- China
- Prior art keywords
- image
- processing
- channel
- face
- resolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 143
- 238000000034 method Methods 0.000 title claims abstract description 106
- 238000012545 processing Methods 0.000 claims abstract description 300
- 238000000605 extraction Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 26
- 238000001514 detection method Methods 0.000 claims description 24
- 238000003860 storage Methods 0.000 claims description 22
- 238000012805 post-processing Methods 0.000 claims description 17
- 238000009877 rendering Methods 0.000 claims description 15
- 238000007670 refining Methods 0.000 claims description 14
- 238000012986 modification Methods 0.000 claims description 13
- 230000004048 modification Effects 0.000 claims description 13
- 238000007499 fusion processing Methods 0.000 claims description 12
- 230000001537 neural effect Effects 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000009499 grossing Methods 0.000 claims description 4
- 238000002372 labelling Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 18
- 230000006872 improvement Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 230000001815 facial effect Effects 0.000 description 7
- 238000000926 separation method Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 210000004209 hair Anatomy 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 210000000887 face Anatomy 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000004080 punching Methods 0.000 description 2
- 241001156002 Anthonomus pomorum Species 0.000 description 1
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000007730 finishing process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种身份识别方法、双通道超分模型的训练方法及装置;其中,身份识别方法包括:获取待识别用户的人脸图像;将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;其中,重构处理用于对人脸图像进行多重图像处理;基于预设图像精修方式对超分辨率图像进行精修处理,得到精修图像;基于精修图像对待识别用户进行身份识别处理。通过本申请实施例,提升了人脸图像的质量,进而提升了身份识别的准确性。
Description
技术领域
本申请涉及身份认证技术领域,尤其涉及一种身份识别方法、双通道超分模型的训练方法及装置。
背景技术
随着计算机技术的迅速发展,基于面部特征的身份识别在众多场景中得以广泛应用,例如支付、门禁等场景。当前基于面部特征的身份识别过程通常是通过采集设备采集到用户的人脸图像后,直接基于该人脸图像进行身份识别处理。然而,由于受到光线、采集设备性能等多方面因素的影响,采集设备采集到的人脸图像可能存在质量不佳等问题,而基于该质量不佳的人脸图像进行身份识别处理,往往存在识别准确性低等问题。因此,如何提升身份识别的准确性是亟待解决的技术问题。
发明内容
本申请提供一种身份识别方法、双通道超分模型的训练方法及装置,以提升身份识别的准确性。
第一方面,本申请实施例提供了一种身份识别方法,包括:
获取待识别用户的人脸图像;
将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;
基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
基于所述精修图像对所述待识别用户进行身份识别处理。
可以看出,本申请实施例中,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
第二方面,本申请实施例提供了一种双通道超分模型的训练方法,包括:
获取多个人脸图像;
根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理。
可以看出,本申请实施例中,通过进行训练处理得到双通道超分模型,从而可基于该双通道超分模型对输入的人脸图像进行多重图像处理,由于经多重图像处理后的人脸图像能够体现出更多的图像细节,因此提升了人脸图像的质量。对于身份识别场景而言,基于多重图像处理后的人脸图像进行身份识别处理,能够极大的提升身份识别的准确性。
第三方面,本申请实施例提供了一种身份识别装置,包括:
获取模块,用于获取待识别用户的人脸图像;
生成模块,用于将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;
精修模块,用于基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
识别模块,用于基于所述精修图像对所述待识别用户进行身份识别处理。
第四方面,本申请实施例提供了一种双通道超分模型的训练装置,包括:
获取模块,用于获取多个人脸图像;
生成模块,用于根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
训练模块,用于将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理。
第五方面,本申请实施例提供了一种电子设备,包括:处理器;以及,被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令包括用于执行上述身份识别方法中的步骤,或者所述可执行指令包括用于执行上述双通道超分模型的训练方法中的步骤。
第六方面,本申请实施例提供了一种存储介质。所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行上述身份识别方法,或者所述可执行指令使得计算机执行上述双通道超分模型的训练方法。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的现有RDN网络的结构示意图;
图2为本申请提供的现有RDB的结构示意图;
图3为本申请实施例提供的一种身份识别方法的场景示意图;
图4为本申请实施例提供的一种身份识别方法的第一种流程示意图;
图5为本申请实施例提供的一种身份识别方法的第二种流程示意图;
图6为本申请实施例提供的一种双通道超分模型的结构示意图;
图7为本申请实施例提供的一种身份识别方法的第三种流程示意图;
图8为本申请实施例提供的一种身份识别方法的第四种流程示意图;
图9为本申请实施例提供的一种Dense模块的结构示意图;
图10为本申请实施例提供的一种身份识别方法的第五种流程示意图;
图11为本申请实施例提供的一种双通道超分模型的训练方法的流程示意图;
图12为本申请实施例提供的一种待训练的双通道超分网络的结构示意图;
图13为本申请实施例提供的一种身份识别装置的模块组成示意图;
图14为本申请实施例提供的一种双通道超分模型的训练装置的模块组成示意图;
图15为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请的保护范围。
近年来,机器学习技术以其强大的数据分析能力和数据处理能力,被广泛的应用于各个领域,典型的应用之一即基于人脸图像的身份识别。为了提升身份识别的准确性,当前普遍使用RDN(Residual Dense Network)网络对低分辨率(LR)的人脸图像进行图像处理生成高分辨率(HR)的人脸图像,并基于该高分辨率的人脸图像进行身份识别处理。如图1所示,RDN网络主要包括SFENet(Shallow Feature Extraction Net,浅层特征提取网络)、RDBs(Residual Dense Blocks,残差稠密块)、DFF(Dense Feature Fusion,稠密特征块)和Up-Sampling Net(上采样网络)四个部分;其中,RDB=Residual block(残缺块)+Denseblock(稠密块),RDB的结构示意图如图2所示。虽然RDN网络在一定程度上提升了人脸图像的分辨率,但是由于RDN网络完全是利用网络自身进行学习,没有如残差图等已知信息作为参考,并且RDN网络是基于像素级的图像处理,因此基于RDN网络生成的高分辨率图像可能会产生虚假纹理,依然存在图像质量不佳等问题。基于此,本申请实施例提供了一种身份识别方法,通过预先训练双通道超分模型,并基于该双通道超分模型对获取的待识别用户的人脸图像进行重构处理,生成人脸图像的超分辨率图像,以及根据预设的图像精修方式对该超分辨率图像进行精修处理,得到精修图像;并基于该精修图像对待识别用户进行身份识别处理。其中,双通道超分模型包括字典,该字典是预先基于高清图像进行训练所得,因此字典中包括了较为标准的特定特征(如发型特征等),相应的,在基于双通道超分模型对人脸图像进行重构处理的过程中有了较为标准的特定特征进行参考学习,因此生成的超分辨率图像具有较高的图像质量;而对超分辨率图像进行精修处理则进一步提升了图像质量,避免了虚假纹理等现象的出现;由此极大的提升了图像质量,进而提升了身份识别的准确性。
图3为本申请实施例提供的一种身份识别方法的应用场景示意图,如图3所示,该场景可以包括:服务端和具有录制功能的终端设备,服务端与终端设备通过网络通讯连接。其中,终端设备可以是独立的摄像设备,例如摄像头设备等;终端设备还可以是安装有如摄像头等摄像模块的手机、平板电脑、台式计算机、便携笔记本式计算机等移动设备。服务端可以是独立的服务器,也可以是由多个服务器组成的服务器集群;服务端中部署有身份识别装置,该身份识别装置用于执行本申请提供的身份识别方法。
在一种实施方式中,服务端可以具有身份识别功能,例如在门禁认证、考勤打卡等场景中。相应的,终端设备可以是独立的摄像设备,该摄像设备可以录制待识别用户的视频数据(该视频数据中包括待识别用户的人脸)或者采集待识别用户的人脸图像,并根据录制的视频数据或采集的人脸图像向服务端发送身份识别请求;服务端接收到身份识别请求时,基于自身部署的身份识别装置从身份识别请求中获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理,将身份识别结果发送给摄像设备;摄像设备在根据身份识别结果确定待识别用户的身份后,执行门禁放行或者考勤打卡等相关处理。
在另一种实施方式中,服务端可以具有身份识别功能和业务处理功能,例如在线上支付、线上开户等业务的办理场景中。相应的,终端设备可以是待识别用户的移动设备。待识别用户的移动设备可以基于待识别用户的支付操作或业务办理操作等,录制待识别用户的视频数据(该视频数据中包括待识别用户的人脸)或者采集待识别用户的人脸图像,并根据录制的视频数据或采集的人脸图像,以及确定的支付信息或业务办理信息等向服务端发送业务处理请求。服务端接收到业务处理请求后,基于自身部署的身份识别装置从业务处理请求中获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理,得到身份识别结果。服务端若根据身份识别结果确定待识别用户的身份有效,则根据业务处理请求中的支付信息进行支付处理,或者根据业务处理请求中的业务办理信息进行相应的业务处理,并向待识别用户的移动设备发送处理结果。
需要指出的是,本申请实施例提供的身份识别方法的应用场景不限为上述应用场景,其可以在实际应用中根据需要自行设定。例如,还可以将身份识别装置部署于终端设备中,终端设备在录制待识别用户的视频数据(该视频数据中包括待识别用户的人脸)或者采集待识别用户的人脸图像之后,基于自身部署的身份识别装置将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理;根据身份识别结果进行相应操作,或者将身份识别结果发送给服务端,以使服务端进行后续处理等。对于申请实施例提供的身份识别方法的应用场景,这里不再一一列举。
基于上述应用场景架构,本申请一个或多个实施例提供了一种身份识别方法。图4为本申请一个或多个实施例提供的一种身份识别方法的流程示意图,图4中的方法能够由图3中的身份识别装置执行,如图4所示,该方法包括以下步骤:
步骤S102,获取待识别用户的人脸图像。
其中,待识别用户可以是任意需要进行身份识别的用户,例如门禁场景中待放行的用户、支付场景中请求进行支付的用户、购票场景中票务的购买用户、考勤打卡场景中待打卡的用户等。可以理解的是,本申请实施例提供的身份识别方法,可以应用于任意的需要进行身份识别的场景中,相应的,待识别用户的人脸图像的获取方式可以在不同的场景中根据需要自行设定,对此本申请中不做具体限定。
步骤S104,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;重构处理用于对人脸图像进行多重图像处理。
具体的,在获取到待识别用户的人脸图像后,将该人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像。由于重构处理用于对人脸图像进行多重图像处理,而经该多重图像处理后得到的超分辨率图像相较于获取的人脸图像而言,极大的提升了图像质量,因此为后续身份识别处理的准确性提供了保障。
步骤S106,基于预设图像精修方式对超分辨率图像进行精修处理,得到精修图像。
本申请实施例中将三维建模技术与神经渲染技术相结合对超分辨率图像进行精修处理,得到精修图像。不仅实现了神经渲染在超分辨率图像领域的应用,而且进一步提升了的图像质量,进而提升了后续身份识别处理的准确性。其中,精修处理的过程可参见后文的相关描述。
步骤S108,基于精修图像对待识别用户进行身份识别处理。
具体的,根据预设的人脸比对算法,对精修图像和指定人脸图像库中的各人脸图像进行比对处理;若比对成功,则根据比对成功的指定人脸图像库中的人脸图像获取待识别用户的身份信息。其中,指定人脸图像库可以是权威的人脸图像库,其中包括多个用户的真实有效的人脸图像,且每个人脸图像关联相应用户的真实有效的身份信息;当精修图像与指定人脸图像库中的某个人脸图像比对成功时,即可根据该比对成功的人脸图像获取关联的身份信息,并将获取的该身份信息确定为待识别用户的身份信息。
本申请实施例中,获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及,根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理。由此,在获取到待识别用户的人脸图像后,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
为了能够获取到待识别用户的较清晰的人脸图像,本申请一个或多个实施例中,可以录制待识别用户的包括人脸的视频数据,并从该视频数据中获取待识别用户的人脸图像。具体的,如图5所示,步骤S102可以包括以下步骤S102-2至步骤S102-6:
步骤S102-2,按照预设帧间隔,从待识别用户的视频数据中抽取多帧原始图像。
其中,预设帧间隔以及视频数据的长度,均可以在实际应用中根据需要自行设定,例如预设帧间隔为3帧,即每隔3个视频帧抽取一帧并作为原始图像;视频数据的长度例如为2秒等。
步骤S102-4,根据预设模糊检测方式确定每帧原始图像的清晰度。
其中,预设模糊检测方式可以是基于拉普拉斯算子的检测方式、基于Brenner梯度函数的检测方式、基于Tenengrad梯度函数的检测方式等,其在实际应用中可以根据需要自行设定,对此本申请中不做具体限定。
步骤S102-6,基于确定的清晰度获取人脸图像,清晰度最高的原始图像包括人脸图像。
具体的,对清晰度进行排序处理,得到清晰度最高的原始图像;采用人脸检测模型对该清晰度最高的原始图像进行人脸检测处理,得到人脸坐标;基于人脸坐标从清晰度最高的原始图像中截取得到待识别用户的人脸图像。更加具体的,按照从小到大的顺序对确定的各原始图像的清晰度进行排序处理,或者按照从大到小的顺序对确定的各原始图像的清晰度进行排序处理,得到清晰度最高的原始图像。将清晰度最高的原始图像输入预先训练的人脸检测模型中,以通过该人脸检测模型对清晰度最高的原始图像进行人脸检测处理,输出四边形的人脸框的四个顶点的坐标信息;将该坐标信息确定为人脸坐标,并根据该人脸坐标对应的人脸框,从清晰度最高的原始图像中截取得到人脸图像。
在一种实施方式中,上述人脸检测模型可以是yolov5模型,为了能够检测到不同角度的人脸,本申请实施例中,在构建yolov5模型的训练集时,可以对获取到的多个待训练的人脸图像中的每张人脸图像均按照90度、180度和270度分别进行旋转,由此不仅扩展了训练样本的数量,而且使得训练所得的yolov5模型能够对不同角度的人脸进行检测。需要指出的是,yolov5模型的具体训练过程可参考现有的人脸检测模型的训练过程,对此本申请中不再赘述;另外,人脸检测模型也不限为上述yolov5模型,其可以在实际应用中根据需要自行设定。
由此,通过录制待识别用户的视频数据,并在视频数据中抽取多张原始图像,以及从清晰度最高的原始图像中获取待识别用户的人脸图像,提升了人脸图像的质量。
需要指出的是,人脸图像的获取方式不限为上述方式。在实际应用中,对于不同的应用场景而言,人脸图像的获取方式可以根据需求自行设定。例如,在门禁认证、支付、考勤打卡等场景中,还可以仅拍摄一张待识别用户的人脸图像。又如,对于公共场所的安防监控场景而言,可以从录制的视频数据中获取人脸图像,此时视频数据的每一帧原始图像中可能包括多个人脸,当需要对到访过该公共场所的每个用户进行身份识别时,可以提取视频数据的每一帧原始图像,采用人脸检测模型对提取的每一帧原始图像进行人脸检测处理,得到人脸坐标;判断该人脸坐标对应的用户的身份是否已识别,若否,则将该用户确定为待识别用户,根据该人脸坐标从相应的原始图像中截取待识别用户的人脸图像。或者,可以提取视频数据的每一帧原始图像,采用预先训练的人脸检测模型对提取的每一帧原始图像进行人脸检测处理,得到人脸坐标;根据人脸坐标从相应的原始图像中截取对应的人脸图像;根据预设方式确定各人脸图像之间的相似度,将大于相似度阈值的相似度所对应的各人脸图像确定为同一待识别用户的人脸图像集;针对每个人脸图像集中的各人脸图像,根据预设的模糊检测方式确定每个人脸图像的清晰度,并对清晰度进行排序处理得到最高清晰度,将该最高清晰度对应的人脸图像确定为待识别用户的用于进行身份识别的人脸图像。当需对到访过该公共场所的某一个用户进行身份识别时,可以根据预设的人脸追踪方式,基于录制的视频数据进行人脸追踪处理,得到待识别用户的至少一个人脸图像,并按照前述方式确定最高清晰度的人脸图像,将该最高清晰度的人脸图像确定为待识别用户的用户进行身份识别的人脸图像。对于包括多用户的身份识别场景,以上仅仅是几种可行的实施方式,对于其他的可行的实施方式,本申请中不再一一列举,其可以在实际应用中根据需要自行设定。
为了进一步提升人脸图像的质量,从而提升身份识别的准确性,本申请实施例中预先训练了双通道超分模型,该双通道超分模型的网络结构如图6所示,其包括双通道模块、特征处理模块和后处理模块;在重构处理中,双通道模块,用于对人脸图像进行第一图像处理,得到第一目标图像;特征处理模块,用于对第一目标图像进行第二图像处理,得到第二目标图像;后处理模块,用于对第二目标图像进行第三图像处理,得到超分辨率图像。与之对应的,如图7所示,步骤S104可以包括以下步骤S104-2至步骤S104-6:
步骤S104-2,通过双通道超分模型的双通道模块对人脸图像进行第一图像处理,得到第一目标图像。
考虑到用户的发型对用户整体的外观影响很大,为了提升图像质量,进而提升身份识别的准确性,本申请实施例中,预先训练包括发型特征的字典,双通道模块包括该字典。其中,字典的训练集为高清图像集,该高清图像集可以包括发型数据集Figaro-1k,并使用KSVD算法进行字典的训练。使用KSVD算法进行字典的训练过程,可参考现有技术,对此本申请中不再赘述。需要指出的是,字典中可以包括但不限于发型特征,字典中还可以包括如眉毛、嘴巴等任意面部结构的特征。由于字典是基于高清图像进行训练所得,因此字典中包括了较为标准的特定特征,在第一图像处理过程中有了该较为标准的特定特征进行参考学习,为最终得到超分辨率图像提供了有利保障。如图6所示,双通道模块可以包括上通道和下通道,其中,上通道包括第一卷积层、第一Reshape层、字典、全连接层(fully connectedlayers,简称FC层)和第二Reshape层,下通道包括第二卷积层;第一卷积层包括两层1*1的卷积Conv,第二卷积层包括两层3*3的卷积Conv。相应的,第一图像处理可以包括通道数增加处理、图像维度变换处理、特征提取处理和第一图像融合处理。具体的,如图8所示,步骤S104-2可以包括以下步骤S104-2-2至步骤S104-2-14:
步骤S104-2-2,将人脸图像输入双通道超分模型中双通道模块的上通道,通过上通道的第一卷积层对人脸图像进行通道数增加处理,得到第一特征图。
在一种实施方式中,以人脸图像是R、G、B三通道且大小是64*64的图像,第一卷积层中每个卷积的卷积核的个数是64个为例进行说明。相应的,通过第一卷积层对人脸图像进行通道数增加处理后,得到64通道的大小为64*64的第一特征图。
步骤S104-2-4,通过上通道的第一Reshape层对第一特征图进行维度变换处理,得到第二特征图。
为了使第二特征图与字典的高度相适应,从而可输入字典进行特征提取处理,本申请实施例中,将第一特征图输入上通道的第一Reshape层中,通过第一Reshape层对第一特征图进行维度变换处理,输出1*n2大小的第二特征图,其中,n为输入图像的边长。
以字典的高度为4096为例进行说明,序接上述示例,将64通道的大小为64*64的第一特征图输入至上通道的第一Reshape层,输出64通道的大小为1*4096的第二特征图。
步骤S104-2-6,通过上通道的字典对第二特征图进行特征提取处理,得到第三特征图。
具体的,将第二特征图输入字典中,通过字典对第二特征图进行特征提取处理,输出第三特征图。序接上述示例,将64通道的大小为1*4096的第二特征图输入字典中进行发型等特征的特征提取处理,输出64通道的大小为6144*1的第三特征图。
步骤S104-2-8,通过上通道的全连接层对第三特征图进行特征提取处理,得到第四特征图。
具体的,将第三特征图输入上通道的全连接层中进行进一步的特征提取处理,输出第四特征图。为了与后续的第二Reshape层保持一致,全连接层可以包括4096个神经元;相应的,序接上述示例,将64通道的大小为6144*1的第三特征图输入全连接层中进行特征提取处理,输出64通道的大小为1*4096的第四特征图。
步骤S104-2-10,通过上通道的第二Reshape层对第四特征图进行维度变换处理,得到第一目标子图像。
具体的,将第四特征图输入上通道的第二Reshape层中,以通过第二Reshape层对第四特征图进行维度变换处理,输出第一目标子图像。序接上述示例,将64通道的大小为1*4096的第四特征图输入上通道的第二Reshape层中进行维度变换处理,输出64通道的大小为64*64的第一目标子图像。
步骤S104-2-12,将人脸图像输入双通道模块的下通道,通过下通道的第二卷积层对人脸图像进行特征提取处理,得到第二目标子图像。
其中,下通道的第二卷积层主要用于对人脸图像进行浅层特征提取,得到人脸图像的纹理特征,该纹理特征中可以包括中高频信息。序接上述示例,将64通道的大小为64*64的人脸图像输入下通道的第二卷积层进行特征提取处理,输出64通道的64*64的第二目标子图像。
需要指出的是,步骤S104-2-12与步骤S102-2-2可以同时执行,即同时分别将人脸图像输入至双通道模块的上通道和下通道。
步骤S104-2-14,对第一目标子图像和第二目标子图像进行第一图像融合处理,得到第一目标图像。
具体的,对第一目标子图像和第二目标子图像的同一通道的像素进行融合处理,得到第一目标图像。由于第一目标子图像和第二目标子图像均为64通道的图像,因此,可以对第一目标子图像与第二目标子图像的相同通道的像素相加,得到64个加和结果,将该64个加和结果对应的图像确定为第一目标图像。第一目标图像仍为64通道的64*64的图像。
为了生成更好的图像细节,在得到第一目标图像之后,基于双通道超分模型的特征处理模块对第一目标图像进行进一步的特征提取等处理。
步骤S104-4,通过双通道超分模型的特征处理模块对第一目标图像进行第二图像处理,得到第二目标图像。
如图6所示,特征处理模块可以包括第三卷积层、N个Dense模块、Concat层和第四卷积层;其中,第三卷积层是一层的3*3卷积,第四卷积层是一层的1*1卷积,N为大于1的整数。相应的,第二图像处理可以包括特征提取处理、第二图像融合处理、降维处理等。具体的,如图8所示,步骤S104-4可以包括以下步骤S104-4-2至步骤S104-4-10:
步骤S104-4-2,通过双通道超分模型中特征处理模块的第三卷积层对第一目标图像进行特征提取处理,得到第五特征图。
具体的,在得到第一目标图像后,将第一目标图像输入特征处理模块的第三卷积层,通过第三卷积层对第一目标图像进行特征提取处理,输出第五特征图。序接上述示例,将64通道的64*64的第一目标图像输入特征处理模块的第三卷积层,输出64通道的64*64第五特征图。
步骤S104-4-4,通过N个Dense模块进行特征提取处理,得到N个第六特征图;Dense模块用于对输入的特征图进行特征提取处理,得到一个第六特征图;N个Dense模块对应N个排列序号,排列序号最小的Dense模块的输入图像为第五特征图像,排列序号不是最小的Dense模块的输入图像为上一Dense模块输出的第六特征图。
步骤S104-4-6,通过特征处理模块的Concat层对第一数量的第六特征图进行第二图像融合处理,得到第七特征图。
本申请实施例中,以N为3为例进行说明,按照从前至后的排列顺序,3个Dense模块的排列序号可以为1、2、3,为便于描述,将排列序号为1的Dense模块记为Dense模块1,将排列序号为2的Dense模块记为Dense模块2,将排列序号为3的Dense模块记为Dense模块3。首先将第五特征图确定为Dense模块1的输入图像并输入Dense模块1中进行特征提取处理,输出第一个第六特征图。然后将该第一个第六特征图输入Dense模块2中进行特征提取处理,输出第二个第六特征图。之后将该第二个第六特征图输入Dense模块3中进行特征提取处理,输出第三个第六特征图。将输出的三个第六特征图输入特征处理模块的Concat层中进行通道数的相加处理,得到第七特征图。需要指出的是,可以在输出最后一个第六特征图之后,将各第六特征图同时输入Concat层中;也可以在每输出一个第六特征图之后,将输出的该一个第六特征图输入Concat层中。
序接前述示例,将64通道的64*64的第五特征图输入Dense模块1中进行特征提取处理,输出64通道的64*64的第一个第六特征图;将该64通道的64*64的第一个第六特征图输入Dense模块2中进行特征提取处理,输出64通道的64*64的第二个第六特征图;将该64通道的64*64的第二个第六特征图输入Dense模块3中进行特征提取处理,输出64通道的64*64的第三个第六特征图;将三个64通道的64*64的第六特征图输入Concat层进行第二图像融合处理,输出192通道的64*64的第七特征图。
本申请中,为了更好的进行特征提取,Dense模块可以包括多个依次相连的卷积层和Concat层,其中,卷积层可以包括多个3*3的卷积和一个1*1的卷积。以Dense模块包括4个3*3的卷积、一个1*1的卷积以及4个Concat层为例,Dense模块的结构示意图如图9所示,按照从左至右的顺序,每一层的输出图像作为相邻的下一层的输入图像,依次进行特征提取处理。需要指出的是,Dense模块的结构不限为图9所示的结果,其卷积层及Concat层的具体数量可以在实际应用中根据需要自行设定。
步骤S104-4-8,通过特征处理模块的第四卷积层对第七特征图进行通道数缩减处理,得到第八特征图。
具体的,将第七特征图输入特征处理模块的第四卷积层中,通过第四卷积层对第七特征图进行通道数缩减处理,输出第八特征图。序接上述示例,将192通道的64*64的第七特征图输入至特征处理模块的第四卷积层,输出64通道的64*64的第八特征图。
步骤S104-4-10,对第五特征图和第八特征图进行残差学习处理,得到第二目标图像。
由于在深度网络学习中,高频特征可能会丢失,为保障图像质量,对第五特征图和第八特征图进行残差学习处理,以补充丢失的高频特征,得到第二目标图像。序接上述示例,对64通道的64*64第五特征图与64通道的64*64的第八特征图进行残差学习处理,得到64通道的64*64的第二目标图像。
考虑到经第一图像处理和第二图像处理后得到的第二目标图像可能存在整体看起来不平滑等问题,基于此,本说明实施例中,对得到的第二目标图像进行第三图像处理,以得到超分辨率图像。
步骤S104-6,通过双通道超分模型的后处理模块对第二目标图像进行第三图像处理,得到超分辨率图像。
如图6所示,双通道超分模型的后处理模块包括第二卷积层和亚像素卷积层,其中,第二卷积层包括两个3*3的卷积。相应的,第三图像处理可以包括平滑处理和上采样处理。具体的,如图8所示,步骤S104-6可以包括以下步骤S104-6-2和步骤S104-6-4:
步骤S104-6-2,通过双通道超分模型中后处理模块的第二卷积层对第二目标图像进行平滑处理,得到第九特征图。
具体的,将第二目标图像输入至后处理模块的第二卷积层,通过第二卷积层对第二目标图像进行平滑处理,输出第九特征图。其中,第九特征图是具有R、G、B三个通道的3通道图像。序接上述示例,将64通道的64*64的第二目标图像输入至后处理模块的第二卷积层,输出3通道的64*64的第九特征图。
步骤S104-6-4,将第九特征图输入后处理模块的亚像素卷积层中进行上采样处理,得到超分辨率图像。
其中,亚像素卷积是一种排列组合,能够在不增加计算量的基础上,得到超分辨率图像。序接上述示例,将3通道的64*64的第九特征图输入后处理模块的亚像素卷积层中进行上采样处理,得到3通道的64*64超分辨率图像。
由此,通过双通道超分模型对人脸图像进行第一图像处理、第二图像处理以及第三图像处理,得到超分辨图像,极大的提升了图像质量。为了进一步提升图像质量,从而为后续身份识别的准确性提供有效保障,本申请实施例中,在得到超分辨率图像之后,还根据预设的三维人脸重建方式和神经渲染方式对超分辨率图像进行精修处理,以生成具有更高图像质量的精修图像。具体的,如图10所示,步骤S106可以包括以下步骤S106-2至步骤S106-6:
步骤S106-2,采用三维构建模型构建超分辨率图像的初始三维人脸模型。
具体的,将超分辨率图像输入预先训练的三维构建模型中,通过三维构建模型构建超分辨率图像的初始三维人脸模型,得到该初始三维人脸模型中每个像素点的三维坐标。在一种实施方式中,三维构建模型可以是3DDFA_V2模型。需要指出的是,三维构建模型不限为前述的3DDFA_V2模型,其可以在实际应用中根据需要自行设定,对于三维构建模型的训练方式也可参考现有的三维构建模型的训练方式,对此本申请中不做具体限定。
步骤S106-4,采用精修模型对初始三维人脸模型进行精修,得到目标三维人脸模型。
具体的,将初始三维人脸模型中各像素点的三维坐标输入预先训练的精修模型中,通过该精修模型对初始三维人脸模型进行精修处理,得到目标三维人脸模型。在一种实施方式中,精修模型可以是NeuTex模型,该NeuTex模型基于输入的各三维坐标生成对应的二维坐标,然后基于生成的二维坐标重新反向生成对应的三维坐标,得到目标三维人脸模型。
由于NeuTex模型的训练需要三维坐标,而包括三维坐标的训练集在实际应用中是难以获取的,基于此,本申请实施例中将3DDFA_V2模型与NeuTex模型相结合,以通过3DDFA_V2模型获取图像的三维坐标,从而作为NeuTex模型的训练数据,不仅解决了NeuTex模型的训练集难以获取的问题,而且实现了高纬度的图像精修。此外,现有的二维人脸重建往往会导致一些退化问题,例如多个像素点的坐标映射到同一UV坐标,导致的纹理空间高度扭曲问题等。而最理想的映射方式是将二维上的纹理均匀的映射倒三维纹理空间并占据整个纹理空间。而NeuTex模型可以在三维空间上进一步修饰纹理,确保发现的纹理空间能够合理地解释场景表面。并且,由于高维度上包含的信息更为全面,因此可以改善现有的超分算法会造成虚假纹理的问题。
需要指出的是,精修模型不限为前述的NeuTex模型,其可以在实际应用中根据需要自行设定,对于精修模型的训练方式也可参考现有的精修模型的训练方式,对此本申请中不做具体限定。
步骤S106-6,将目标三维人脸模型输入神经渲染网络进行渲染处理,得到精修图像。
具体的,将目标三维人脸模型输入预先训练的神经渲染网络中,通过神经网络对目标三维人脸模型进行渲染处理,输出二维的精修图像。其中,神经渲染网络可以采用现有的任意一种深度神经渲染网络,例如,Unet2网络等,对此本申请中不做具体限定。
由此,通过三维构建模型构建超分辨率图像的初始三维人脸模型,并通过精修模型对初始三维人脸模型进行精修,得到目标三维人脸模型;以及采用神经渲染网络对目标三维人脸模型进行渲染处理,得到精修图像。不仅实现了高纬度上的人脸精修,而且实现了神经渲染在超分辨率图像领域中的应用。
本申请实施例中,获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及,根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理。由此,在获取到待识别用户的人脸图像后,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
对应上述描述的身份识别方法,基于相同的技术构思,本申请实施例还提供了一种双通道超分模型的训练方法,图11为本申请实施例提供的一种双通道超分模型的训练方法的流程示意图,如图11所示,该方法包括以下步骤:
步骤S202,获取多个人脸图像。
其中,人脸图像可以是从预先录制的视频数据中截取所得,还可以是从网络中获取所得,还可以是从指定的图像库中获取所得。对于多个人脸图像的获取方式,本申请中不做具体限定,可以在实际应用中根据需要自行设定。
步骤S204,根据多个人脸图像生成训练样本集;其中,训练样本集中的每个训练样本标注有标签,标签包括高分辨率标签或低分辨率标签。
具体的,对每个人脸图像进行切分处理,得到多个预设大小的图像块;对每个图像块进行标注处理,得到每个图像块的标签;将标注有标签的图像块确定为训练样本,并按照预设划分规则将训练样本划分为多个训练样本集。
更加具体的,按照预设方式将获取的多个人脸图像划分为训练图像和测试图像;对每个训练图像进行切分处理,得到多个预设大小的图像块;对每个图像块进行标注处理,得到每个图像块的标签;将标注有标签的图像块确定为训练样本,并按照预设划分规则将训练样本划分为多个训练样本集。其中,按照预设方式将获取的多个人脸图像划分为训练图像和测试图像,可以是按照比例将获取的多个人脸图像划分为训练图像和测试图像,或者随机将获取的多个人脸图像划分为训练图像和测试图像。预设大小可以为64*64;预设的划分规则可以是按照预设数量将训练样本划分为多个训练样本集;预设数量例如为32,即将每32个训练样本划分为一个训练样本集。
步骤S206,将训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;其中,双通道超分模型用于对输入的人脸图像进行重构处理,重构处理用于对人脸图像进行多重图像处理。
具体的,依次将每个训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型。
其中,双通道超分模型包括双通道模块、特征处理模块和后处理模块;双通道模块,用于对输入的人脸图像进行第一图像处理,得到第一目标图像;特征处理模块,用于对第一目标图像进行第二图像处理,得到第二目标图像;后处理模块,用于对第二目标图像进行第三图像处理,得到超分辨率图像。其中,第一图像处理、第二图像处理和第三图像处理的具体过程可参见前文的相关描述,重复之处这里不再赘述。
需要指出的是,待训练的双通道网络与得到的双通道模型在结构上略有不同,待训练的双通道网络的结构示意图如图12所示,其相较于双通道模型而言,每个Dense模块之后还连接有一个1*1的卷积以及亚像素卷积层,其用于提供损失函数并确保训练方向的准确性。相应的,当迭代训练的次数到达预设迭代次数或者各损失函数的结果均到达预设结果时,停止训练得到初始的双通道模型。以及,将测试图像输入该初始的双通道模型中进行测试处理,若确定输出图像符合预设条件,则将该初始的双通道模型确定为最终的双通道模型;若确定输出图像不符合预设条件,则基于训练样本集重新进行训练处理。其中,预设条件例如为图像分辨率大于预设分辨率等。
本申请实施例中,获取多个人脸图像,根据该多个人脸图像生成训练样本集,并将训练样本集输入待训练的双通道网络中进行迭代训练处理,得到双通道超分模型,其中,双通道超分模型用于对输入的人脸图像进行重构处理,重构处理用于对人脸图像进行多重图像处理。由此,通过进行训练处理得到双通道超分模型,从而可基于该双通道超分模型对输入的人脸图像进行多重图像处理,由于经多重图像处理后的人脸图像能够体现出更多的图像细节,因此提升了人脸图像的质量。对于身份识别场景而言,基于多重图像处理后的人脸图像进行身份识别处理,能够极大的提升身份识别的准确性。
对应上述描述的身份识别方法,基于相同的技术构思,本申请实施例还提供了一种身份识别装置。图13为本申请实施例提供的一种身份识别装置的模块组成示意图,如图13所示,该装置包括:
获取模块301,用于获取待识别用户的人脸图像;
生成模块302,用于将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;
精修模块303,用于基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
识别模块304,用于基于所述精修图像对所述待识别用户进行身份识别处理。
可选地,所述获取模块301具体用于:
按照预设帧间隔,从所述待识别用户的视频数据中抽取多帧原始图像;
基于预设模糊检测方式确定每帧所述原始图像的清晰度;
基于确定的所述清晰度获取所述人脸图像,清晰度最高的原始图像包括所述人脸图像。
可选地,所述获取模块301进一步具体用于:
采用人脸检测模型对清晰度最高的原始图像进行人脸检测处理,得到人脸坐标;
基于所述人脸坐标从所述清晰度最高的原始图像中截取得到所述人脸图像。
可选地,所述双通道超分模型包括双通道模块、特征处理模块和后处理模块;所述生成模块302具体用于:
在所述重构处理中,通过所述双通道模块对所述人脸图像进行第一图像处理,得到第一目标图像;通过特征处理模块对所述第一目标图像进行第二图像处理,得到第二目标图像;通过后处理模块对所述第二目标图像进行第三图像处理,得到所述超分辨率图像。
可选地,所述双通道模块包括上通道、下通道和字典,所述上通道包括第一卷积层、第一Reshape层、第二Reshape层和全连接层,所述下通道包括第二卷积层;相应的,所述生成模块302进一步具体用于:
通过所述第一卷积层对所述人脸图像进行通道数增加处理,得到第一特征图;
通过所述第一Reshape层对所述第一特征图进行维度变换处理,得到第二特征图;
通过所述字典对所述第二特征图进行特征提取处理,得到第三特征图;
通过所述全连接层对所述第三特征图进行特征提取处理,得到第四特征图;
通过所述第二Reshape层对所述第四特征图进行维度变换处理,得到第一目标子图像;以及通过所述第二卷积层对所述人脸图像进行特征提取处理,得到第二目标子图像;
对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到所述第一目标图像。
可选地,所述特征处理模块包括N个Dense模块、第三卷积层、Concat层和第四卷积层,所述N为大于1的整数;相应的,所述生成模块302进一步具体用于:
通过所述第三卷积层对所述第一目标图像进行特征提取处理,得到第五特征图;
通过所述N个Dense模块进行特征提取处理,得到所述N个第六特征图;所述Dense模块,用于对输入的特征图进行特征提取处理,得到一个第六特征图;所述N个Dense模块对应N个排列序号,排列序号最小的Dense模块的输入图像为所述第五特征图像,排列序号不是最小的Dense模块的输入图像为上一Dense模块输出的第六特征图;
通过所述Concat层对所述N个第六特征图进行第二图像融合处理,得到第七特征图;
通过所述第四卷积层对所述第七特征图进行通道数缩减处理,得到第八特征图;
对所述第五特征图和所述第八特征图进行残差学习处理,得到所述第二目标图像。
可选地,所述后处理模块包括第五卷积层和亚像素卷积层;相应的,所述生成模块302进一步具体用于:
通过所述第二卷积层对所述第二目标图像进行平滑处理,得到第九特征图;
将所述第九特征图输入所述亚像素卷积层进行上采样处理,得到所述超分辨率图像。
可选地,所述精修模块303具体用于:
采用三维构建模型构建所述超分辨率图像的初始三维人脸模型;
采用精修模型对所述初始三维人脸模型进行精修,得到目标三维人脸模型;
将所述目标三维人脸模型输入神经渲染网络进行渲染处理,得到所述精修图像。
本申请实施例提供的身份识别装置,获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及,根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理。由此,在获取到待识别用户的人脸图像后,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
需要说明的是,本申请中关于身份识别装置的实施例与本申请中关于身份识别方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的身份识别方法的实施,重复之处不再赘述。
进一步的,对应上述描述的双通道超分模型的训练方法,基于相同的技术构思,本申请实施例还提供了一种双通道超分模型的训练装置。图14为本申请实施例提供的一种双通道超分模型的训练装置的模块组成示意图,如图14所示,该装置包括:
获取模块401,用于获取多个人脸图像;
生成模块402,用于根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
训练模块403,用于将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理。
可选地,所述生成模块402具体用于:
对每个所述人脸图像进行切分处理,得到多个预设大小的图像块;
对每个所述图像块进行标注处理,得到每个所述图像块的标签;
将标注有所述标签的图像块确定为训练样本,按照预设划分规则将所述训练样本划分为多个训练样本集;
相应地,所述训练模块403具体用于:
依次将每个所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型。
本申请实施例提供的双通道超分模型的训练装置,获取多个人脸图像,根据该多个人脸图像生成训练样本集,并将训练样本集输入待训练的双通道网络中进行迭代训练处理,得到双通道超分模型,其中,双通道超分模型用于对输入的人脸图像进行重构处理,重构处理用于对人脸图像进行多重图像处理。由此,通过进行训练处理得到双通道超分模型,从而可基于该双通道超分模型对输入的人脸图像进行多重图像处理,由于经多重图像处理后的人脸图像能够体现出更多的图像细节,因此提升了人脸图像的质量。对于身份识别场景而言,基于多重图像处理后的人脸图像进行身份识别处理,能够极大的提升身份识别的准确性。
需要说明的是,本申请中关于双通道超分模型的训练装置的实施例与本申请中关于双通道超分模型的训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的双通道超分模型的训练方法的实施,重复之处不再赘述。
进一步地,对应上述描述的方法,基于相同的技术构思,本申请实施例还提供一种电子设备。图15为本申请实施例提供的一种电子设备的结构示意图。
如图15所示,电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器501和存储器502,存储器502中可以存储有一个或一个以上存储应用程序或数据。其中,存储器502可以是短暂存储或持久存储。存储在存储器502的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括电子设备中的一系列计算机可执行指令。更进一步地,处理器501可以设置为与存储器502通信,在电子设备上执行存储器502中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源503,一个或一个以上有线或无线网络接口504,一个或一个以上输入输出接口505,一个或一个以上键盘506等。
在一个具体的实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取待识别用户的人脸图像;
将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;
基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
基于所述精修图像对所述待识别用户进行身份识别处理。
本申请实施例提供的电子设备,获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及,根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理。由此,在获取到待识别用户的人脸图像后,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
在另一个具体的实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取多个人脸图像;
根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理。
本申请实施例提供的电子设备,获取多个人脸图像,根据该多个人脸图像生成训练样本集,并将训练样本集输入待训练的双通道网络中进行迭代训练处理,得到双通道超分模型,其中,双通道超分模型用于对输入的人脸图像进行重构处理,重构处理用于对人脸图像进行多重图像处理。由此,通过进行训练处理得到双通道超分模型,从而可基于该双通道超分模型对输入的人脸图像进行多重图像处理,由于经多重图像处理后的人脸图像能够体现出更多的图像细节,因此提升了人脸图像的质量。对于身份识别场景而言,基于多重图像处理后的人脸图像进行身份识别处理,能够极大的提升身份识别的准确性。
需要说明的是,本申请中关于电子设备的实施例与本申请中关于身份识别方法的实施例及双通道超分模型的训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的实施例,重复之处不再赘述。
进一步地,对应上述描述的方法,基于相同的技术构思,本申请实施例还提供了一种存储介质,用于存储计算机可执行指令,在一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取待识别用户的人脸图像;
将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;
基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
基于所述精修图像对所述待识别用户进行身份识别处理。
本申请实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,获取待识别用户的人脸图像,将人脸图像输入双通道超分模型中进行重构处理,输出人脸图像的超分辨率图像;以及,根据预设的图像精修方式对超分辨率图像进行精修处理,得到精修图像;并基于精修图像对待识别用户进行身份识别处理。由此,在获取到待识别用户的人脸图像后,先对获取到的人脸图像进行重构处理生成超分辨率图像,并对超分辨率图像进行精修处理得到精修图像,由于该精修图像相较于获取到的人脸图像而言,极大的提升了图像质量,因此基于该精修图像进行身份识别处理,能够极大的提升身份识别的准确性。
在另一个具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取多个人脸图像;
根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理。
本申请实施例提供的存储介质存储的计算机可执行指令在被处理器执行时,获取多个人脸图像,根据该多个人脸图像生成训练样本集,并将训练样本集输入待训练的双通道网络中进行迭代训练处理,得到双通道超分模型,其中,双通道超分模型用于对输入的人脸图像进行重构处理,重构处理用于对人脸图像进行多重图像处理。由此,通过进行训练处理得到双通道超分模型,从而可基于该双通道超分模型对输入的人脸图像进行多重图像处理,由于经多重图像处理后的人脸图像能够体现出更多的图像细节,因此提升了人脸图像的质量。对于身份识别场景而言,基于多重图像处理后的人脸图像进行身份识别处理,能够极大的提升身份识别的准确性。
需要说明的是,本申请中关于存储介质的实施例与本申请中关于身份识别方法的实施例及双通道超分模型的训练方法的实施例基于同一发明构思,因此该实施例的具体实施可以参见前述对应的实施,重复之处不再赘述。
上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请实施例可提供为方法、系统或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (14)
1.一种身份识别方法,其特征在于,包括:
获取待识别用户的人脸图像;
将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;所述双通道超分模型包括双通道模块,所述双通道模块包括上通道和下通道;所述上通道用于通过对所述人脸图像进行通道数增加处理、图像维度变换处理以及特征提取处理,得到第一目标子图像;所述下通道用于对所述人脸图像进行特征提取处理,得到第二目标子图像;所述双通道模块还用于对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到第一目标图像;所述第一目标图像用于生成所述超分辨率图像;
基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
基于所述精修图像对所述待识别用户进行身份识别处理。
2.根据权利要求1所述的方法,其特征在于,所述获取待识别用户的人脸图像,包括:
按照预设帧间隔,从所述待识别用户的视频数据中抽取多帧原始图像;
基于预设模糊检测方式确定每帧所述原始图像的清晰度;
基于确定的所述清晰度获取所述人脸图像,清晰度最高的原始图像包括所述人脸图像。
3.根据权利要求2所述的方法,其特征在于,所述基于确定的所述清晰度获取所述人脸图像,包括:
采用人脸检测模型对清晰度最高的原始图像进行人脸检测处理,得到人脸坐标;
基于所述人脸坐标从所述清晰度最高的原始图像中截取得到所述人脸图像。
4.根据权利要求1所述的方法,其特征在于,所述双通道超分模型还包括特征处理模块和后处理模块。
5.根据权利要求4所述的方法,其特征在于,在所述重构处理中,所述双通道模块,用于对所述人脸图像进行第一图像处理,得到第一目标图像;所述双通道模块还包括字典,所述上通道包括第一卷积层、第一Reshape层、第二Reshape层和全连接层,所述下通道包括第二卷积层;
所述对所述人脸图像进行第一图像处理,得到第一目标图像,包括:
通过所述第一卷积层对所述人脸图像进行通道数增加处理,得到第一特征图;
通过所述第一Reshape层对所述第一特征图进行维度变换处理,得到第二特征图;
通过所述字典对所述第二特征图进行特征提取处理,得到第三特征图;
通过所述全连接层对所述第三特征图进行特征提取处理,得到第四特征图;
通过所述第二Reshape层对所述第四特征图进行维度变换处理,得到第一目标子图像;以及通过所述第二卷积层对所述人脸图像进行特征提取处理,得到第二目标子图像;
对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到所述第一目标图像。
6.根据权利要求5所述的方法,其特征在于,在所述重构处理中,所述特征处理模块,用于对所述第一目标图像进行第二图像处理,得到第二目标图像;所述特征处理模块包括N个Dense模块、第三卷积层、Concat层和第四卷积层,所述N为大于1的整数;
所述对所述第一目标图像进行第二图像处理,得到第二目标图像,包括:
通过所述第三卷积层对所述第一目标图像进行特征提取处理,得到第五特征图;
通过所述N个Dense模块进行特征提取处理,得到所述N个第六特征图;所述Dense模块,用于对输入的特征图进行特征提取处理,得到一个第六特征图;所述N个Dense模块对应N个排列序号,排列序号最小的Dense模块的输入图像为所述第五特征图,排列序号不是最小的Dense模块的输入图像为上一Dense模块输出的第六特征图;
通过所述Concat层对所述N个第六特征图进行第二图像融合处理,得到第七特征图;
通过所述第四卷积层对所述第七特征图进行通道数缩减处理,得到第八特征图;
对所述第五特征图和所述第八特征图进行残差学习处理,得到所述第二目标图像。
7.根据权利要求6所述的方法,其特征在于,在所述重构处理中,所述后处理模块,用于对所述第二目标图像进行第三图像处理,得到所述超分辨率图像;所述后处理模块包括第五卷积层和亚像素卷积层;
所述对所述第二目标图像进行第三图像处理,得到所述超分辨率图像,包括:
通过所述第五卷积层对所述第二目标图像进行平滑处理,得到第九特征图;
将所述第九特征图输入所述亚像素卷积层进行上采样处理,得到所述超分辨率图像。
8.根据权利要求1所述的方法,其特征在于,所述基于预设的图像精修方式对所述超分辨率图像进行精修处理,得到精修图像,包括:
采用三维构建模型构建所述超分辨率图像的初始三维人脸模型;
采用精修模型对所述初始三维人脸模型进行精修,得到目标三维人脸模型;
将所述目标三维人脸模型输入神经渲染网络进行渲染处理,得到所述精修图像。
9.一种双通道超分模型的训练方法,其特征在于,包括:
获取多个人脸图像;
根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理;所述双通道超分模型包括双通道模块,所述双通道模块包括上通道和下通道;所述上通道用于通过对所述人脸图像进行通道数增加处理、图像维度变换处理以及特征提取处理,得到第一目标子图像;所述下通道用于对所述人脸图像进行特征提取处理,得到第二目标子图像;所述双通道模块还用于对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到第一目标图像;所述第一目标图像用于生成所述超分辨率图像。
10.根据权利要求9所述的方法,其特征在于,
所述根据所述多个人脸图像生成训练样本集,包括:对每个所述人脸图像进行切分处理,得到多个预设大小的图像块;对每个所述图像块进行标注处理,得到每个所述图像块的标签;将标注有所述标签的图像块确定为训练样本,以及按照预设划分规则将所述训练样本划分为多个训练样本集;
所述将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型,包括:依次将每个所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型。
11.一种身份识别装置,其特征在于,包括:
获取模块,用于获取待识别用户的人脸图像;
生成模块,用于将所述人脸图像输入双通道超分模型中进行重构处理,输出所述人脸图像的超分辨率图像;所述重构处理用于对所述人脸图像进行多重图像处理;所述双通道超分模型包括双通道模块,所述双通道模块包括上通道和下通道;所述上通道用于通过对所述人脸图像进行通道数增加处理、图像维度变换处理以及特征提取处理,得到第一目标子图像;所述下通道用于对所述人脸图像进行特征提取处理,得到第二目标子图像;所述双通道模块还用于对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到第一目标图像;所述第一目标图像用于生成所述超分辨率图像;
精修模块,用于基于预设图像精修方式对所述超分辨率图像进行精修处理,得到精修图像;
识别模块,用于基于所述精修图像对所述待识别用户进行身份识别处理。
12.一种双通道超分模型的训练装置,其特征在于,包括:
获取模块,用于获取多个人脸图像;
生成模块,用于根据所述多个人脸图像生成训练样本集;其中,所述训练样本集中的每个训练样本标注有标签,所述标签包括高分辨率标签或低分辨率标签;
训练模块,用于将所述训练样本集输入待训练的双通道网络进行迭代训练处理,得到双通道超分模型;
其中,所述双通道超分模型用于对输入的人脸图像进行重构处理,所述重构处理用于对所述人脸图像进行多重图像处理;所述双通道超分模型包括双通道模块,所述双通道模块包括上通道和下通道;所述上通道用于通过对所述人脸图像进行通道数增加处理、图像维度变换处理以及特征提取处理,得到第一目标子图像;所述下通道用于对所述人脸图像进行特征提取处理,得到第二目标子图像;所述双通道模块还用于对所述第一目标子图像和所述第二目标子图像进行第一图像融合处理,得到第一目标图像;所述第一目标图像用于生成所述超分辨率图像。
13.一种电子设备,其特征在于,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述可执行指令被配置由所述处理器执行,所述可执行指令用于执行如权利要求1-8任一项所述的方法中的步骤,或者所述可执行指令用于执行如权利要求9-10任一项所述的方法中的步骤。
14.一种存储介质,其特征在于,所述存储介质用于存储计算机可执行指令,所述可执行指令使得计算机执行如权利要求1-8任一项所述的方法,或者所述可执行指令使得计算机执行如权利要求9-10任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111492178.9A CN114238904B (zh) | 2021-12-08 | 2021-12-08 | 身份识别方法、双通道超分模型的训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111492178.9A CN114238904B (zh) | 2021-12-08 | 2021-12-08 | 身份识别方法、双通道超分模型的训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114238904A CN114238904A (zh) | 2022-03-25 |
CN114238904B true CN114238904B (zh) | 2023-02-07 |
Family
ID=80753968
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111492178.9A Active CN114238904B (zh) | 2021-12-08 | 2021-12-08 | 身份识别方法、双通道超分模型的训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114238904B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114821404B (zh) * | 2022-04-08 | 2023-07-25 | 马上消费金融股份有限公司 | 一种信息处理方法、装置、计算机设备及存储介质 |
CN114897700B (zh) * | 2022-05-25 | 2024-09-06 | 马上消费金融股份有限公司 | 图像优化方法、校正模型的训练方法及装置 |
CN115131570B (zh) * | 2022-05-27 | 2023-08-22 | 马上消费金融股份有限公司 | 图像特征提取模型的训练方法、图像检索方法及相关设备 |
CN115115843B (zh) * | 2022-06-02 | 2023-08-22 | 马上消费金融股份有限公司 | 数据处理方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596833A (zh) * | 2018-04-26 | 2018-09-28 | 广东工业大学 | 超分辨率图像重构方法、装置、设备及可读存储介质 |
CN111582136B (zh) * | 2020-04-30 | 2024-04-16 | 京东方科技集团股份有限公司 | 表情识别方法及装置、电子设备、存储介质 |
CN113191495A (zh) * | 2021-03-26 | 2021-07-30 | 网易(杭州)网络有限公司 | 超分模型的训练及人脸识别方法、装置、介质及电子设备 |
CN113269862B (zh) * | 2021-05-31 | 2024-06-21 | 中国科学院自动化研究所 | 场景自适应的精细三维人脸重建方法、系统、电子设备 |
CN113554058A (zh) * | 2021-06-23 | 2021-10-26 | 广东奥普特科技股份有限公司 | 视觉目标图像分辨率增强的方法、系统、装置及存储介质 |
-
2021
- 2021-12-08 CN CN202111492178.9A patent/CN114238904B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114238904A (zh) | 2022-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114238904B (zh) | 身份识别方法、双通道超分模型的训练方法及装置 | |
CN108010031B (zh) | 一种人像分割方法及移动终端 | |
US9239948B2 (en) | Feature descriptor for robust facial expression recognition | |
CN112329702B (zh) | 一种快速人脸密度预测和人脸检测方法、装置、电子设备及存储介质 | |
CN109978077B (zh) | 视觉识别方法、装置和系统及存储介质 | |
WO2024041235A1 (zh) | 图像处理方法、装置、设备、存储介质及程序产品 | |
CN114298971A (zh) | 一种冠状动脉分割方法、系统、终端以及存储介质 | |
CN114972016A (zh) | 图像处理方法、装置、计算机设备、存储介质及程序产品 | |
CN113554655B (zh) | 基于多特征增强的光学遥感图像分割方法及装置 | |
CN114332484A (zh) | 关键点检测方法、装置、计算机设备和存储介质 | |
CN113642359B (zh) | 人脸图像生成方法、装置、电子设备及存储介质 | |
CN117612269A (zh) | 一种生物攻击检测方法、装置及设备 | |
CN116798041A (zh) | 图像识别方法、装置和电子设备 | |
KR102706746B1 (ko) | 이미지 처리 방법 및 장치, 컴퓨터 기기, 저장 매체 그리고 프로그램 제품 | |
Yu et al. | Multi-view Aggregation Network for Dichotomous Image Segmentation | |
CN115546908A (zh) | 一种活体检测方法、装置及设备 | |
CN116048763A (zh) | 一种基于bev多任务模型框架的任务处理方法、装置 | |
Majumder et al. | Multi-stage fusion for one-click segmentation | |
CN115830633A (zh) | 基于多任务学习残差神经网络的行人重识别方法和系统 | |
CN114663937A (zh) | 模型训练及图像处理方法、介质、装置和计算设备 | |
CN114897700B (zh) | 图像优化方法、校正模型的训练方法及装置 | |
CN113191401A (zh) | 基于视觉显著性共享的用于三维模型识别的方法及装置 | |
CN112487943A (zh) | 关键帧去重的方法、装置和电子设备 | |
CN112927219B (zh) | 一种图像的检测方法、装置及设备 | |
CN114445918B (zh) | 一种活体检测方法、装置及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |