CN117894083B - 一种基于深度学习的图像识别方法和系统 - Google Patents

一种基于深度学习的图像识别方法和系统 Download PDF

Info

Publication number
CN117894083B
CN117894083B CN202410288970.XA CN202410288970A CN117894083B CN 117894083 B CN117894083 B CN 117894083B CN 202410288970 A CN202410288970 A CN 202410288970A CN 117894083 B CN117894083 B CN 117894083B
Authority
CN
China
Prior art keywords
image
feature
generate
true
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410288970.XA
Other languages
English (en)
Other versions
CN117894083A (zh
Inventor
余楷
梁正华
余正涛
黄于欣
秦舒浩
肖书芹
申林
武晓
赵林畅
夏道勋
冯夫健
苑建坤
谢真强
代杨
董厚泽
吴越
石睿
张燕
涂永高
韦克苏
李德仑
赵宇航
武圣江
王庄仆
郭宗余
郭宗智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC Big Data Research Institute Co Ltd
Original Assignee
CETC Big Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC Big Data Research Institute Co Ltd filed Critical CETC Big Data Research Institute Co Ltd
Priority to CN202410288970.XA priority Critical patent/CN117894083B/zh
Publication of CN117894083A publication Critical patent/CN117894083A/zh
Application granted granted Critical
Publication of CN117894083B publication Critical patent/CN117894083B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种基于深度学习的图像识别方法和系统,用于提高深度学习真假判别模型对AI模拟图像的识别的准确性。本申请包括:获取对抗神经网络模型和真实图像集;将真实图像输入AI生成模型中,生成AI模拟图像;将AI模拟图像输入对称特征检测器,生成模拟对称标签集合;将模拟对称标签集合和AI模拟图像进行融合,生成模拟增强图像;将真实图像和模拟增强图像输入真假判别器中,生成第一真假判别值和第二真假判别值;根据第一真假判别值、第二真假判别值以及损失函数计算损失;当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;当损失符合预设条件,则更换下一个AI生成模型,重新训练,直到全部训练完成。

Description

一种基于深度学习的图像识别方法和系统
技术领域
本申请实施例涉及深度学习领域,尤其涉及一种基于深度学习的图像识别方法和系统。
背景技术
随着AI技术的不断发展,现如今越来越多的人使用AI技术处理生活与工作上的事务,AI技术的便利性和可靠性越来越得到体现。
现如今,人们可以使用AI技术进行问答,可以使用AI进行视频画面,甚至可以用AI技术对一张现有的真实图像进行重新绘制,生成不同风格的图像。甚至不需要真实图像,仅仅凭借用户的需求,AI模型都可以通过用户需求寻找真实素材进行图像绘制,通过AI生成的图像往往令普通人都无法识别出真伪。并且这类技术已经逐渐成熟,并且逐渐被更多的人所掌握。
但是,随着越来越多的人掌握AI绘制技术,不法分子也开始利用AI生成模型生成图像来进行电子诈骗或者加以文字来欺骗公众。尤其是通过AI生成模型绘制带有特定人脸的照片,使得人们误信图像为真实,基于错误的认识而将自身的财产转移给他人。这就使得针对经过AI生成模型处理后的图像的有效检测成为了当前需要迫切解决的问题。目前,针对如何识别AI生成模型所生成的模拟图像,最有效的方法就是通过另一个深度学习模型去进行检测,即将AI生成模型与一个真假鉴别模型进行组合使用,生成一个对抗网络,将AI生成模型生成模拟图像,而真假鉴别模型对真实图像和模拟图像进行训练,不断调整AI生成模型和真假判别模型的权值等参数,或者是使用一个现有的AI生成模型对真假判别模型进行训练,使得最终获取到一个准确率达到预设条件的真假判别模型。
但是,这类真假判别模型同样需要采集模拟图像的各种特征进行分析检测,这就使得真假判别模型无法有针对性的分析,而是需要对模拟图像内部所有能够提取到的特征进行检测分析,极大程度的增加了真假判别模型的计算量,而且对容易检测出破绽的特征的识别效果降低了,进而降低了真假判别模型的准确性。
发明内容
本申请公开了一种基于深度学习的图像识别方法和系统,用于提高深度学习真假判别模型对AI模拟图像的识别的准确性。
本申请第一方面公开了一种基于深度学习的图像识别方法:
获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合;
将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像;
将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
根据第一真假判别值、第二真假判别值以及损失函数计算损失;
当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
可选的,模拟对称标签包括人脸对称特征标签和非人脸对称特征标签;
将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合,包括:
将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合。
可选的,模拟增强图像包括模拟人脸增强图像和模拟非人脸增强图像;
将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像,包括:
对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理;
对AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
将第一处理特征进行1*1卷积处理,生成卷积数据;
将卷积数据和第一处理特征进行通道叠加,生成第二处理特征;
对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征;
对第三处理特征行残差提取和残差融合处理,生成融合残差;
将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征;
对第四处理特征进行边缘重构,生成第五处理特征;
为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
对第六处理特征进行边缘重构,生成增强参数;
将增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像。
可选的,在获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、人脸真假判别器和背景真假判别器之后,将真实图像输入AI生成器组中其中一种AI生成模型中,生成AI模拟图像之前,图像识别方法还包括:
设定标签融合生成器的初始参数;
从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签;
将检测对称标签和真实图像输入标签融合生成器中,生成检测图像;
将检测图像输入真假判别器中,生成检测判别值;
当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
当检测判别值不大于预设阈值时,确定标签融合生成器完成调整。
可选的,根据第一真假判别值、第二真假判别值以及损失函数计算损失,包括:
构建融合生成器的多标签分类损失函数;
构建真假判别器的分类损失函数;
通过第一真假判别值、第二真假判别值和多标签分类损失函数计算第一损失值;
通过第一真假判别值、第二真假判别值和分类损失函数计算第二损失值。
可选的,在更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成之后,基于深度学习的图像识别方法还包括:
获取待检测图像,待检测图像中存在至少一张人脸;
将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签;
将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像;
将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析。
本申请第二方面公开了一种基于深度学习的图像识别系统:
第一获取单元,用于获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
第一生成单元,用于从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
第二生成单元,用于将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合;
第三生成单元,用于将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像;
第四生成单元,用于将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
计算单元,用于根据第一真假判别值、第二真假判别值以及损失函数计算损失;
更新单元,用于当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
更换单元,用于当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
可选的,模拟对称标签包括人脸对称特征标签和非人脸对称特征标签;
第二生成单元,包括:
将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合。
可选的,模拟增强图像包括模拟人脸增强图像和模拟非人脸增强图像;
第三生成单元,包括:
对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理;
对AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
将第一处理特征进行1*1卷积处理,生成卷积数据;
将卷积数据和第一处理特征进行通道叠加,生成第二处理特征;
对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征;
对第三处理特征行残差提取和残差融合处理,生成融合残差;
将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征;
对第四处理特征进行边缘重构,生成第五处理特征;
为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
对第六处理特征进行边缘重构,生成增强参数;
将增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像。
可选的,在获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、人脸真假判别器和背景真假判别器之后,将真实图像输入AI生成器组中其中一种AI生成模型中,生成AI模拟图像之前,训练系统还包括:
设定单元,用于设定标签融合生成器的初始参数;
第五生成单元,用于从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签;
第六生成单元,用于将检测对称标签和真实图像输入标签融合生成器中,生成检测图像;
第七生成单元,用于将检测图像输入真假判别器中,生成检测判别值;
调整单元,用于当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
确定单元,用于当检测判别值不大于预设阈值时,确定标签融合生成器完成调整。
可选的,计算单元,包括:
构建融合生成器的多标签分类损失函数;
构建真假判别器的分类损失函数;
通过第一真假判别值、第二真假判别值和多标签分类损失函数计算第一损失值;
通过第一真假判别值、第二真假判别值和分类损失函数计算第二损失值。
可选的,在更换单元之后,基于深度学习的图像识别系统还包括:
第二获取单元,用于获取待检测图像,待检测图像中存在至少一张人脸;
第八生成单元,用于将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签;
第九生成单元,用于将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像;
第十生成单元,用于将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,首先获取对抗神经网络模型和真实图像集,其中,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像。AI生成器组包括了市面上能够收集到的至少两个已经具备图像生成能力的AI生成模型,再后续的训练中,无需进行参数调整。对称特征检测器的作用是识别图像中的目标特征。标签融合生成器则是用来增强模拟图像中的目标特征。
终端从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像,即选取一个AI生成模型进行图像模拟。然后终端将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合,即确定符合对称特性的特征。该类特征是众多AI生成模型的破绽区,因为AI生成模型在将真实图像中的各种特征进行模拟时,通常会选择将这一特征进行细微变化,但是如果这个真实图像中具有多个相同的特征,并且这相同特征在真实图像中存在些许差异(角度差异、形态差异和光线差异等),这时AI生成模型很有可能往不同的方向对这类相同特征进行变化,在一次次变化过程中,很大程度产生更大的差异,这类差异往往也需要真假判别器进行判断,但是这更容易成为真假判别器的突破点。故针对图像中的对称特征进行重点训练,能够有效的让真假判别器提高分析准确率。终端将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像,这类训练图像增强了图像中所有的对称特征,使得后续步骤中真假判别器在分析训练过程中能够提高对这类对称特征的分析能力。终端将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值。根据第一真假判别值、第二真假判别值以及损失函数计算损失。当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值。当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
训练完成的真假判别器能够针对图像中对称特征进行更高效的分析检测,从而提高真假判别模型在手机运用中的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于深度学习的图像识别方法的一个实施例示意图;
图2为本申请基于深度学习的图像识别方法的第一阶段的一个实施例示意图;
图3为本申请基于深度学习的图像识别方法的第二阶段的一个实施例示意图;
图4为本申请基于深度学习的图像识别方法的第三阶段的一个实施例示意图;
图5为本申请基于深度学习的图像识别方法的第一阶段的另一个实施例示意图;
图6为本申请基于深度学习的图像识别系统的一个实施例示意图;
图7为本申请基于深度学习的图像识别系统的另一个实施例示意图;
图8为本申请电子设备的一个实施例示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本申请说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本申请说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
另外,在本申请说明书和所附权利要求书的描述中,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
下面将结合本申请实施例中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的方法可以应用于服务器、设备、终端或者其它具备逻辑处理能力的设备,对此,本申请不作限定。为方便描述,下面以执行主体为终端为例进行描述。
请参阅图1,本申请提供了一种基于深度学习的图像识别方法的一个实施例,包括:
101、获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
本实施例中,终端首先需要获取具有众多人脸图像的真实图像集,并且这类真实图像集还包括背景区域。
本实施例中,AI生成器组是由众多已经训练好的AI生成模型组成,每一个AI生成模型都可以根据自身的生成机制,对一张真实图像进行调整。本实施例中的AI生成模型可以直接从网络上获取,不需要拿到整个AI生成模型,只需要该AI生成模型能够为真实图像进行调整,生成对应的虚拟图像即可。
本实施例中,对称特征检测器的作用是搜寻对称而独立的特定特征,例如在人脸上,两个眼睛属于对称的特征,耳朵是对称的特征,门牙也是对称的特征。在人脸之外,例如一副耳环、一副眼镜、项链等装饰物属于对称特征,甚至,一副窗帘上的两块相同的图案也属于对称的特征。这些对称特征每一次通过AI生成模型的调整之后,都会产生细小的差别,在多次调整之后,这些差异有可能会被放大,也有可能被消除,因为AI生成模型会将他认为的独立特征往一个方向先调整,但是对于对称特征来说,如果调整方向一旦不一致,就会产生极大的破绽,例如一张AI生成模拟图像,眼睛的大小存在差异,一个眼睛被放大,另一个被缩小,或者是瞳孔颜色出现不同,甚至镜框有一半是款式1另一半为款式2。这就使得真假判别模型能够针对对称特征进行有效的分析,从而判断出哪一张图像为AI生成模型的虚拟特征。但是上述差异属于效果较差的AI生成模型会产生的情况,现今的市场上存在的AI生成模型对于对称特征还是产生差异变化,但是会相对细微,人为通常很难观测到。
标签融合生成器主要是用于将检测到的对称特征进行图像增强。
真假判别器主要用于判别图像的真假分布概率,并且不断训练,最终成为能够很好在实际场景中应用的深度学习模型。
102、从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
终端从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像。
103、将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合;
接下来,终端将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合。模拟对称标签是指图像中属于对称物的缺陷类型,通过对称特征检测器检测到眼睛、耳朵、镜框和手掌这四种常见的对称特征,对三种对称特征可以进行手动设置标签,比如眼睛和耳朵属于人脸特征,眼睛设置为为1,耳朵设置为为2,镜框和手掌为人脸外的特征,手掌设置为为20,镜框设置为21。这样设计是因为人脸特征属于训练样本超多的特征,大部分的AI生成模型对于这类人脸特征的训练成熟度高,即出现破绽的概率相对较低。而镜框和手掌这类的样本相对来说较少,AI生成模型找不到足够的训练样本训练时,在对称图像进行调整过程中,就越容易出现调整错误,而这类又属于对称特征,在对称轴两侧的调整变化就更有可能出现差错,故对于非人脸的样本的标签设置需要更突出。
104、将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像;
终端将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像,即将对应的对称特征在AI模拟图像中进行增强。使得后续训练过程中,真假判别模型能够更好地对对称特征进行训练。
105、将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
终端将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值,即需要同时训练真实样本和模拟样本。
106、根据第一真假判别值、第二真假判别值以及损失函数计算损失;
终端根据第一真假判别值、第二真假判别值以及损失函数计算损失,这里的损失函数可以是真假判别器原本自身携带的损失函数。本实施例中真假判别器可以选择刚刚构建的模型,设置初始参数的,也可以选择已经完成训练,并且进入识别工作的模型,此处不作限定。
107、当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
108、当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
当终端确定损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值,这时需要重新将模拟对称标签集合和所述AI模拟图像输入标签融合生成器中,生成模拟增强图像,并且再次将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值。
如果损失符合预设条件,则表示当前AI生成模型已经突破,可以更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
本实施例中,首先获取对抗神经网络模型和真实图像集,其中,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像。AI生成器组包括了市面上能够收集到的至少两个已经具备图像生成能力的AI生成模型,再后续的训练中,无需进行参数调整。对称特征检测器的作用是识别图像中的目标特征。标签融合生成器则是用来增强模拟图像中的目标特征。
终端从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像,即选取一个AI生成模型进行图像模拟。然后终端将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合,即确定符合对称特性的特征。该类特征是众多AI生成模型的破绽区,因为AI生成模型在将真实图像中的各种特征进行模拟时,通常会选择将这一特征进行细微变化,但是如果这个真实图像中具有多个相同的特征,并且这相同特征在真实图像中存在些许差异(角度差异、形态差异和光线差异等),这时AI生成模型很有可能往不同的方向对这类相同特征进行变化,在一次次变化过程中,很大程度产生更大的差异,这类差异往往也需要真假判别器进行判断,但是这更容易成为真假判别器的突破点。故针对图像中的对称特征进行重点训练,能够有效的让真假判别器提高分析准确率。终端将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像,这类训练图像增强了图像中所有的对称特征,使得后续步骤中真假判别器在分析训练过程中能够提高对这类对称特征的分析能力。终端将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值。根据第一真假判别值、第二真假判别值以及损失函数计算损失。当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值。当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
训练完成的真假判别器能够针对图像中对称特征进行更高效的分析检测,从而提高真假判别模型在手机运用中的准确性。
请参阅图2、图3、图4和图5,本申请提供了一种基于深度学习的图像识别方法的一个实施例,包括:
201、获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
本实施例中的步骤201与前述实施例中步骤101类似,此处不再赘述。
202、设定标签融合生成器的初始参数;
203、从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签;
204、将检测对称标签和真实图像输入标签融合生成器中,生成检测图像;
205、将检测图像输入真假判别器中,生成检测判别值;
206、当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
207、当检测判别值不大于预设阈值时,确定标签融合生成器完成调整;
本实施例中,由于真假判别器是用于判别图像是否属于AI生成模型的产物,本实施例中将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像,在一定程度上属于调整了图像,虽然很难被真假判别器判定为AI生成模型的产物,但是在实际训练中,不排除有这类可能,所以需要事先进行预防。具体的,终端可以首先设定标签融合生成器的初始参数。从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签。将检测对称标签和真实图像输入标签融合生成器中,生成检测图像。将检测图像输入真假判别器中,生成检测判别值。当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别。当检测判别值不大于预设阈值时,确定标签融合生成器完成调整。即通过真假判别器来检验真实图像在进行了特征融合之后,是否会被判别为AI生成模型产物,如果不会,则表示可以照此处理,如果产生的偏差大,则可以通过调整参数来继续判断。
除了上述方式,还可以直接更换真假判别器,因为在市场上经过实战的真假判别器,通常能够检测出AI生成和标签融合的区别,只需要选择另一个真假判别器即可完成训练。
208、从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
本实施例中的步骤208与前述实施例中步骤102类似,此处不再赘述。
209、将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
210、对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
211、将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合;
本实施例中,终端将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率。上述对于人脸对称特征和非人脸对称特征的分类,能够有效的区分出重点标签。终端对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分,尽可能多的对图像上存在的对称特征进行加强。终端将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合。
212、对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理;
213、对AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
214、对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
215、将第一处理特征进行1*1卷积处理,生成卷积数据;
216、将卷积数据和第一处理特征进行通道叠加,生成第二处理特征;
217、对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
218、根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征;
219、对第三处理特征行残差提取和残差融合处理,生成融合残差;
220、将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征;
221、对第四处理特征进行边缘重构,生成第五处理特征;
222、为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
223、对第六处理特征进行边缘重构,生成增强参数;
224、将增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
225、根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像;
本实施例中,终端首先对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理。对AI模拟图像进行1*1卷积操作,生成模拟卷积特征。
终端对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征,具体的,终端可以使用区域像素注意力模块RPA对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,本步骤的区域像素注意力模块RPA,包含一个BatchNorm-DefConv-ReLU、一个BatchNorm-DefConv、一个SigMoid函数模块和一个双线性插值模块。BatchNorm-DefConv-ReLU、BatchNorm-DefConv、SigMoid函数模块和双线性插值模块依次串联。这里的BatchNorm-DefConv-ReLU层和BatchNorm-DefConv层都属于卷积神经网络中常用的特征处理层,SigMoid函数为已知函数,双线性插值运算方法也是已知算法。区域像素注意力模块RPA作为第一重注意力机制,由于给第一采样特征的每块区域像素分配一个权重,使得神经网络对于第一采样特征明显的区域更加关注。
终端将第一处理特征进行1*1卷积处理,生成卷积数据。将卷积数据和第一处理特征进行通道叠加,生成第二处理特征。
本实施例中,终端可以通过通道注意力模块Attention对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量。根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征。具体的,通道注意力模块Attention包括一个全局平均池化层、一个1*1Conv-ReLU和一个Conv-Sigmoid,下面详细描述通道注意力模块的运行原理。经过第一通道注意力模块Attention的全局平均池化层(Global Pooling) 生成通道向量集合,再经过1×1卷积核、ReLU激活函数进行通道压缩,再经过1×1卷积核以及Sigmoid激活函数,输出一个维度等于输入特征通道数的一维通道向量,这就是各个特征通道的注意力权重,将其输入特征各个通道相乘。
然后,终端根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征。
终端对第三处理特征行残差提取和残差融合处理,生成融合残差,具体的,终端对第三处理特征进行残差提取,生成第一残差,然后对第一残差进行残差提取,生成第二残差,然后对第二残差进行残差提取,生成第三残差,最后将三个残差按照预设叠加系数进行融合,生成最后的融合残差,这个步骤能够减少对原图的变化。
终端将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征。对第四处理特征进行边缘重构,生成第五处理特征。为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征。对第六处理特征进行边缘重构,生成增强参数。将增强参数进行还原输出(具体通过输出模块Conv_out进行还原输出),将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像。根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像
226、将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
本实施例中的步骤226与前述实施例中步骤105类似,此处不再赘述。
227、构建融合生成器的多标签分类损失函数;
228、构建真假判别器的分类损失函数;
229、通过第一真假判别值、第二真假判别值和多标签分类损失函数计算第一损失值;
230、通过第一真假判别值、第二真假判别值和分类损失函数计算第二损失值;
本实施例中,损失函数可以是如下设计,终端可以构建融合生成器的多标签分类损失函数,再构建真假判别器的分类损失函数。
融合生成器利用二分类的BCELoss损失和多分类的CELoss损失,融合生成器的多标签分类损失函数L1如下:
L1=BCELoss(P1,1)+&1*CELoss(P2,Z1)+&2*CELoss(P2,Z2)+...+&i*CELoss(P2,Zi)
Z1至Zi为第一个至第i个对称特征标签,&1至&i为各自的多类别系数。
真假判别器的分类损失函数L2使用二分类的BCELoss损失。
L2=BCELoss(P1,1)+BCELoss(P2,0)
P1为第一真假判别值,P2为第二真假判别值。
231、当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
232、当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成;
本实施例中的步骤231和步骤232与前述实施例中步骤107和步骤108类似,此处不再赘述。
233、获取待检测图像,待检测图像中存在至少一张人脸;
234、将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签;
235、将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像;
236、将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析。
本实施例中,在实际运用中真假判别器时,也需要结合对称特征检测器以及标签融合生成器,生成能够被本实施例中真假判别单元识别的图像。
终端首先获取待检测图像,待检测图像中存在至少一张人脸,接下来终端将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签。将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像。本实施例中,可以只生成一张非人脸对称特征标签与原图融合的待检测增强图像,也可以生成一张非人脸对称特征标签与原图融合的待检测增强图像以及一张人脸对称特征标签与原图融合的待检测增强图像。至生成单张目的是减少计算量,让更容易检测的非人脸对称特征的图像进行检测分析。
最后,终端将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析。
本实施例中,首先获取对抗神经网络模型和真实图像集,其中,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像。AI生成器组包括了市面上能够收集到的至少两个已经具备图像生成能力的AI生成模型,再后续的训练中,无需进行参数调整。对称特征检测器的作用是识别图像中的目标特征。标签融合生成器则是用来增强模拟图像中的目标特征。
设定标签融合生成器的初始参数。从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签。将检测对称标签和真实图像输入标签融合生成器中,生成检测图像。将检测图像输入真假判别器中,生成检测判别值。当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别。当检测判别值不大于预设阈值时,确定标签融合生成器完成调整。
终端从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像,即选取一个AI生成模型进行图像模拟。然后终端将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率。对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分。将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合,即确定符合对称特性的特征。该类特征是众多AI生成模型的破绽区,因为AI生成模型在将真实图像中的各种特征进行模拟时,通常会选择将这一特征进行细微变化,但是如果这个真实图像中具有多个相同的特征,并且这相同特征在真实图像中存在些许差异(角度差异、形态差异和光线差异等),这时AI生成模型很有可能往不同的方向对这类相同特征进行变化,在一次次变化过程中,很大程度产生更大的差异,这类差异往往也需要真假判别器进行判断,但是这更容易成为真假判别器的突破点。故针对图像中的对称特征进行重点训练,能够有效的让真假判别器提高分析准确率。终端对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理。对AI模拟图像进行1*1卷积操作,生成模拟卷积特征。对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征。将第一处理特征进行1*1卷积处理,生成卷积数据。将卷积数据和第一处理特征进行通道叠加,生成第二处理特征。对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量。根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征。对第三处理特征行残差提取和残差融合处理,生成融合残差。将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征。对第四处理特征进行边缘重构,生成第五处理特征。为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征。对第六处理特征进行边缘重构,生成增强参数。将增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像。根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像,这类训练图像增强了图像中所有的对称特征,使得后续步骤中真假判别器在分析训练过程中能够提高对这类对称特征的分析能力。终端将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值。构建融合生成器的多标签分类损失函数。构建真假判别器的分类损失函数。通过第一真假判别值、第二真假判别值和多标签分类损失函数计算第一损失值。通过第一真假判别值、第二真假判别值和分类损失函数计算第二损失值。当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值。当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
训练完成的真假判别器能够针对图像中对称特征进行更高效的分析检测,从而提高真假判别模型在手机运用中的准确性。
获取待检测图像,待检测图像中存在至少一张人脸。将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签。将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像。将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析
请参阅图6,本申请提供了一种基于深度学习的图像识别方法的一个实施例,包括:
第一获取单元601,用于获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
第一生成单元602,用于从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
第二生成单元603,用于将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合;
第三生成单元604,用于将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像;
第四生成单元605,用于将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
计算单元606,用于根据第一真假判别值、第二真假判别值以及损失函数计算损失;
更新单元607,用于当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
更换单元608,用于当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
请参阅图7,本申请提供了一种基于深度学习的图像识别方法的一个实施例,包括:
第一获取单元701,用于获取对抗神经网络模型和真实图像集,对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,AI生成器组中包括至少两种AI生成模型,真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
设定单元702,用于设定标签融合生成器的初始参数;
第五生成单元703,用于从真实图像集选取一张真实图像输入对称特征检测器检测对称特征,生成检测对称标签;
第六生成单元704,用于将检测对称标签和真实图像输入标签融合生成器中,生成检测图像;
第七生成单元705,用于将检测图像输入真假判别器中,生成检测判别值;
调整单元706,用于当检测判别值大于预设阈值时,通过检测判别值和预设阈值的差值调整标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
确定单元707,用于当检测判别值不大于预设阈值时,确定标签融合生成器完成调整;
第一生成单元708,用于从真实图像集选取一张真实图像输入AI生成器组其中一种AI生成模型中,生成AI模拟图像;
第二生成单元709,用于将AI模拟图像输入对称特征检测器检测对称特征,生成模拟对称标签集合;
第二生成单元709,包括:
将AI模拟图像输入对称特征检测器,生成对称特征分布概率,对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
对人脸对称特征分布概率和非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,人脸对称特征标签和非人脸对称特征标签为模拟对称标签集合。
第三生成单元710,用于将模拟对称标签集合和AI模拟图像输入标签融合生成器中,生成模拟增强图像;
第三生成单元711,包括:
对第一个人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将人脸对称特征标签和标签卷积特征进行通道叠加处理;
对AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
对标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
将第一处理特征进行1*1卷积处理,生成卷积数据;
将卷积数据和第一处理特征进行通道叠加,生成第二处理特征;
对第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
根据一维通道向量将第二处理特征按通道对应相乘,生成第三处理特征;
对第三处理特征行残差提取和残差融合处理,生成融合残差;
将融合残差、模拟卷积特征和标签卷积特征进行通道叠加,生成第四处理特征;
对第四处理特征进行边缘重构,生成第五处理特征;
为第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
对第六处理特征进行边缘重构,生成增强参数;
将增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
根据上述方式使用非人脸对称特征标签与AI模拟图像进行融合,生成模拟非人脸增强图像,模拟人脸增强图像和模拟非人脸增强图像为模拟增强图像。
第四生成单元712,用于将真实图像和模拟增强图像输入真假判别器中,生成真实图像的第一真假判别值和模拟增强图像的第二真假判别值;
计算单元713,用于根据第一真假判别值、第二真假判别值以及损失函数计算损失;
可选的,计算单元713,包括:
构建融合生成器的多标签分类损失函数;
构建真假判别器的分类损失函数;
通过第一真假判别值、第二真假判别值和多标签分类损失函数计算第一损失值;
通过第一真假判别值、第二真假判别值和分类损失函数计算第二损失值。
更新单元714,用于当损失不符合预设条件,则通过损失更新标签融合生成器和真假判别器的权值;
更换单元715,用于当损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对标签融合生成器和真假判别器训练,直到AI生成器组的AI生成模型全部训练完成;
第二获取单元716,用于获取待检测图像,待检测图像中存在至少一张人脸;
第八生成单元717,用于将待检测图像输入对称特征检测器检测对称特征,生成增强对称标签;
第九生成单元718,用于将增强对称标签和待检测图像输入标签融合生成器中,生成至少一张待检测增强图像;
第十生成单元719,用于将至少一张待检测增强图像输入真假判别器中,生成实时真假判别值,并通过实时真假判别值对待检测增强图像进行结果分析。
请参阅图8,本申请提供了一种电子设备,包括:
处理器801、存储器803、输入输出单元802以及总线804。
处理器801与存储器803、输入输出单元802以及总线804相连。
存储器803保存有程序,处理器801调用程序以执行如图1、图2、图3、图4和图5中的图像识别方法。
本申请提供了一种计算机可读存储介质,计算机可读存储介质上保存有程序,程序在计算机上执行时执行如图1、图2、图3、图4和图5中的图像识别方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种基于深度学习的图像识别方法,其特征在于,包括:
获取对抗神经网络模型和真实图像集,所述对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,所述AI生成器组中包括至少两种AI生成模型,所述真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
从所述真实图像集选取一张真实图像输入所述AI生成器组其中一种AI生成模型中,生成AI模拟图像;
将所述AI模拟图像输入所述对称特征检测器,生成对称特征分布概率,所述对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
对所述人脸对称特征分布概率和所述非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,所述人脸对称特征标签和所述非人脸对称特征标签为模拟对称标签集合;
将所述模拟对称标签集合和所述AI模拟图像输入所述标签融合生成器中,生成模拟增强图像;
将所述真实图像和所述模拟增强图像输入所述真假判别器中,生成所述真实图像的第一真假判别值和所述模拟增强图像的第二真假判别值;
根据所述第一真假判别值、所述第二真假判别值以及损失函数计算损失;
当所述损失不符合预设条件,则通过所述损失更新所述标签融合生成器和所述真假判别器的权值;
当所述损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对所述标签融合生成器和所述真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
2.根据权利要求1所述基于深度学习的图像识别方法,其特征在于,所述模拟增强图像包括模拟人脸增强图像和模拟非人脸增强图像;
将所述模拟对称标签集合和所述AI模拟图像输入所述标签融合生成器中,生成模拟增强图像,包括:
对第一个所述人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将所述人脸对称特征标签和所述标签卷积特征进行通道叠加处理;
对所述AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
对所述标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
将所述第一处理特征进行1*1卷积处理,生成卷积数据;
将所述卷积数据和所述第一处理特征进行通道叠加,生成第二处理特征;
对所述第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
根据一维通道向量将所述第二处理特征按通道对应相乘,生成第三处理特征;
对所述第三处理特征行残差提取和残差融合处理,生成融合残差;
将所述融合残差、所述模拟卷积特征和所述标签卷积特征进行通道叠加,生成第四处理特征;
对所述第四处理特征进行边缘重构,生成第五处理特征;
为所述第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
对所述第六处理特征进行边缘重构,生成增强参数;
将所述增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
根据上述方式使用所述非人脸对称特征标签与所述AI模拟图像进行融合,生成模拟非人脸增强图像,所述模拟人脸增强图像和所述模拟非人脸增强图像为模拟增强图像。
3.根据权利要求2所述基于深度学习的图像识别方法,其特征在于,在获取对抗神经网络模型和真实图像集,所述对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、人脸真假判别器和背景真假判别器之后,将所述真实图像输入所述AI生成器组中其中一种AI生成模型中,生成AI模拟图像之前,所述图像识别方法还包括:
设定所述标签融合生成器的初始参数;
从所述真实图像集选取一张真实图像输入所述对称特征检测器检测对称特征,生成检测对称标签;
将所述检测对称标签和真实图像输入所述标签融合生成器中,生成检测图像;
将所述检测图像输入所述真假判别器中,生成检测判别值;
当所述检测判别值大于预设阈值时,通过所述检测判别值和所述预设阈值的差值调整所述标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
当所述检测判别值不大于预设阈值时,确定标签融合生成器完成调整。
4.根据权利要求1至3中任一项所述基于深度学习的图像识别方法,其特征在于,根据所述第一真假判别值、所述第二真假判别值以及损失函数计算损失,包括:
构建所述融合生成器的多标签分类损失函数;
构建所述真假判别器的分类损失函数;
通过所述第一真假判别值、所述第二真假判别值和所述多标签分类损失函数计算第一损失值;
通过所述第一真假判别值、所述第二真假判别值和所述分类损失函数计算第二损失值。
5.根据权利要求1所述基于深度学习的图像识别方法,其特征在于,在所述更换下一个AI生成模型生成模拟图像,对所述标签融合生成器和所述真假判别器训练,直到AI生成器组的AI生成模型全部训练完成之后,所述基于深度学习的图像识别方法还包括:
获取待检测图像,所述待检测图像中存在至少一张人脸;
将所述待检测图像输入所述对称特征检测器检测对称特征,生成增强对称标签;
将所述增强对称标签和所述待检测图像输入所述标签融合生成器中,生成至少一张待检测增强图像;
将所述至少一张待检测增强图像输入所述真假判别器中,生成实时真假判别值,并通过所述实时真假判别值对所述待检测增强图像进行结果分析。
6.一种基于深度学习的图像识别系统,其特征在于,包括:
第一获取单元,用于获取对抗神经网络模型和真实图像集,所述对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、真假判别器,所述AI生成器组中包括至少两种AI生成模型,所述真实图像集中包括至少两张包含人脸区域和背景区域的真实拍摄图像;
第一生成单元,用于从所述真实图像集选取一张真实图像输入所述AI生成器组其中一种AI生成模型中,生成AI模拟图像;
第二生成单元,用于将所述AI模拟图像输入所述对称特征检测器检测对称特征,生成模拟对称标签集合;
第二生成单元,包括:
将所述AI模拟图像输入所述对称特征检测器,生成对称特征分布概率,所述对称特征分布概率包括人脸对称特征分布概率和非人脸对称特征分布概率;
对所述人脸对称特征分布概率和所述非人脸对称特征分布概率中大于预设分布概率阈值的对称特征进行种类细分;
将细分后的人脸对称特征和非人脸对称特征生成对应的人脸对称特征标签和非人脸对称特征标签,所述人脸对称特征标签和所述非人脸对称特征标签为模拟对称标签集合;
第三生成单元,用于将所述模拟对称标签集合和所述AI模拟图像输入所述标签融合生成器中,生成模拟增强图像;
第四生成单元,用于将所述真实图像和所述模拟增强图像输入所述真假判别器中,生成所述真实图像的第一真假判别值和所述模拟增强图像的第二真假判别值;
计算单元,用于根据所述第一真假判别值、所述第二真假判别值以及损失函数计算损失;
更新单元,用于当所述损失不符合预设条件,则通过所述损失更新所述标签融合生成器和所述真假判别器的权值;
更换单元,用于当所述损失符合预设条件,则更换下一个AI生成模型生成模拟图像,对所述标签融合生成器和所述真假判别器训练,直到AI生成器组的AI生成模型全部训练完成。
7.根据权利要求6所述基于深度学习的图像识别系统,其特征在于,所述模拟增强图像包括模拟人脸增强图像和模拟非人脸增强图像;
第三生成单元,包括:
对第一个所述人脸对称特征标签进行1*1卷积处理,生成标签卷积特征,将所述人脸对称特征标签和所述标签卷积特征进行通道叠加处理;
对所述AI模拟图像进行1*1卷积操作,生成模拟卷积特征;
对所述标签卷积特征进行区域像素注意力生成处理和通道相乘处理,生成第一处理特征;
将所述第一处理特征进行1*1卷积处理,生成卷积数据;
将所述卷积数据和所述第一处理特征进行通道叠加,生成第二处理特征;
对所述第二处理特征的特征通道进行向量计算,生成通道向量集合,并根据通道向量集合输出一维通道向量;
根据一维通道向量将所述第二处理特征按通道对应相乘,生成第三处理特征;
对所述第三处理特征行残差提取和残差融合处理,生成融合残差;
将所述融合残差、所述模拟卷积特征和所述标签卷积特征进行通道叠加,生成第四处理特征;
对所述第四处理特征进行边缘重构,生成第五处理特征;
为所述第五处理特征对应的每个神经元分配注意力,并将注意力小于第一预设阈值的神经元进行筛除处理,生成第六处理特征;
对所述第六处理特征进行边缘重构,生成增强参数;
将所述增强参数进行还原输出,将还原输出的图像与下一个人脸对称特征标签进行融合,直到生成模拟人脸增强图像;
根据上述方式使用所述非人脸对称特征标签与所述AI模拟图像进行融合,生成模拟非人脸增强图像,所述模拟人脸增强图像和所述模拟非人脸增强图像为模拟增强图像。
8.根据权利要求7所述基于深度学习的图像识别系统,其特征在于,在获取对抗神经网络模型和真实图像集,所述对抗神经网络模型中包括AI生成器组、对称特征检测器、标签融合生成器、人脸真假判别器和背景真假判别器之后,将所述真实图像输入所述AI生成器组中其中一种AI生成模型中,生成AI模拟图像之前,所述基于深度学习的图像识别系统还包括:
设定单元,用于设定所述标签融合生成器的初始参数;
第五生成单元,用于从所述真实图像集选取一张真实图像输入所述对称特征检测器检测对称特征,生成检测对称标签;
第六生成单元,用于将所述检测对称标签和真实图像输入所述标签融合生成器中,生成检测图像;
第七生成单元,用于将所述检测图像输入所述真假判别器中,生成检测判别值;
调整单元,用于当所述检测判别值大于预设阈值时,通过所述检测判别值和所述预设阈值的差值调整所述标签融合生成器的初始参数,并重新进行标签融合以及真假判别;
确定单元,用于当所述检测判别值不大于预设阈值时,确定标签融合生成器完成调整。
CN202410288970.XA 2024-03-14 2024-03-14 一种基于深度学习的图像识别方法和系统 Active CN117894083B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410288970.XA CN117894083B (zh) 2024-03-14 2024-03-14 一种基于深度学习的图像识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410288970.XA CN117894083B (zh) 2024-03-14 2024-03-14 一种基于深度学习的图像识别方法和系统

Publications (2)

Publication Number Publication Date
CN117894083A CN117894083A (zh) 2024-04-16
CN117894083B true CN117894083B (zh) 2024-06-28

Family

ID=90642742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410288970.XA Active CN117894083B (zh) 2024-03-14 2024-03-14 一种基于深度学习的图像识别方法和系统

Country Status (1)

Country Link
CN (1) CN117894083B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766850A (zh) * 2017-11-30 2018-03-06 电子科技大学 基于结合人脸属性信息的人脸识别方法
CN111932661A (zh) * 2020-08-19 2020-11-13 上海交通大学 一种人脸表情编辑系统及方法、终端

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110414378A (zh) * 2019-07-10 2019-11-05 南京信息工程大学 一种基于异质人脸图像融合特征的人脸识别方法
CN113486688A (zh) * 2020-05-27 2021-10-08 海信集团有限公司 一种人脸识别方法及智能设备
CN111709408B (zh) * 2020-08-18 2020-11-20 腾讯科技(深圳)有限公司 图像真伪检测方法和装置
CN113221655B (zh) * 2021-04-12 2022-09-30 重庆邮电大学 基于特征空间约束的人脸欺骗检测方法
CN114005154A (zh) * 2021-06-23 2022-02-01 中山大学 一种基于ViT和StarGAN的驾驶员表情识别方法
CN114120401A (zh) * 2021-11-12 2022-03-01 重庆邮电大学 一种基于跨域特征对齐网络的人脸反欺诈方法
CN114677722A (zh) * 2021-12-31 2022-06-28 无锡致同知新科技有限公司 一种融合多尺度特征的多监督人脸活体检测方法
CN117523626A (zh) * 2022-08-04 2024-02-06 金波 伪rgb-d人脸识别法
CN115546461A (zh) * 2022-10-28 2022-12-30 河北工业大学 一种基于掩膜去噪和特征选择的人脸属性编辑方法
CN115526891B (zh) * 2022-11-28 2023-04-07 深圳精智达技术股份有限公司 一种缺陷数据集的生成模型的训练方法及相关装置
CN116206375B (zh) * 2023-04-28 2023-07-25 南京信息工程大学 基于双层孪生网络和可持续学习的人脸伪造检测方法
CN117437522B (zh) * 2023-12-19 2024-05-03 福建拓尔通软件有限公司 一种人脸识别模型训练方法、人脸识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107766850A (zh) * 2017-11-30 2018-03-06 电子科技大学 基于结合人脸属性信息的人脸识别方法
CN111932661A (zh) * 2020-08-19 2020-11-13 上海交通大学 一种人脸表情编辑系统及方法、终端

Also Published As

Publication number Publication date
CN117894083A (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
CN111814902A (zh) 目标检测模型训练方法、目标识别方法、装置和介质
CN112801057B (zh) 图像处理方法、装置、计算机设备和存储介质
CN113762138B (zh) 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN114187311A (zh) 一种图像语义分割方法、装置、设备及存储介质
CN113011357A (zh) 基于时空融合的深度伪造人脸视频定位方法
CN113221655A (zh) 基于特征空间约束的人脸欺骗检测方法
CN116958637A (zh) 图像检测模型的训练方法、装置、设备及存储介质
CN114331946A (zh) 一种图像数据处理方法、设备以及介质
Fang et al. Fairness in face presentation attack detection
CN111860056B (zh) 基于眨眼的活体检测方法、装置、可读存储介质及设备
CN113609944A (zh) 一种静默活体检测方法
CN111582057B (zh) 一种基于局部感受野的人脸验证方法
CN112800923A (zh) 人体图像质量检测方法及装置、电子设备、存储介质
KR20160080483A (ko) 랜덤 포레스트를 이용한 성별인식 방법
CN117894083B (zh) 一种基于深度学习的图像识别方法和系统
CN116543437A (zh) 一种基于遮挡-特征映射关系的遮挡人脸识别方法
CN110826396A (zh) 一种视频中眼睛状态检测方法及装置
Morshed et al. Customer’s spontaneous facial expression recognition
CN114663953A (zh) 一种基于面部关键点和深度神经网络的人脸表情识别方法
CN114462491A (zh) 一种行为分析模型训练方法、行为分析方法及其设备
Rahmon et al. Evaluation of Different Decision Fusion Mechanisms for Robust Moving Object Detection
Abdulhamid et al. Enhanced Preprocessing Stage For Feature Extraction of Deepfake Detection Based on Deep Learning Methods
CN117351579B (zh) 基于多源信息融合的虹膜活体检测方法及装置
CN118135496B (zh) 一种基于双流卷积神经网络的课堂行为识别方法
Woo Vision-based Detection of Mobile Device Use While Driving

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant