CN114882556B - 一种基于改进的YoloX的戏曲角色妆容脸部检测方法 - Google Patents

一种基于改进的YoloX的戏曲角色妆容脸部检测方法 Download PDF

Info

Publication number
CN114882556B
CN114882556B CN202210445376.8A CN202210445376A CN114882556B CN 114882556 B CN114882556 B CN 114882556B CN 202210445376 A CN202210445376 A CN 202210445376A CN 114882556 B CN114882556 B CN 114882556B
Authority
CN
China
Prior art keywords
feature
yolox
face
drama
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210445376.8A
Other languages
English (en)
Other versions
CN114882556A (zh
Inventor
王小凤
乔相茹
周明全
李康
田蓉蓉
赵卓屹
余帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NORTHWEST UNIVERSITY
Original Assignee
NORTHWEST UNIVERSITY
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NORTHWEST UNIVERSITY filed Critical NORTHWEST UNIVERSITY
Priority to CN202210445376.8A priority Critical patent/CN114882556B/zh
Publication of CN114882556A publication Critical patent/CN114882556A/zh
Application granted granted Critical
Publication of CN114882556B publication Critical patent/CN114882556B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Abstract

本发明公开了一种基于改进的YoloX的戏曲角色妆容脸部检测方法,包括如下步骤:步骤1、改进YoloX;步骤2、数据预处理;步骤3、特征提取;步骤4、特征融合;步骤5、目标标注;步骤6、对预测结果进行解码;步骤7、对得到的预测框进行得分排序与非极大值抑制,找出得分满足置信度的预测框并筛选出一定区域内属于同一种类且得分最大的预测框,即为最终的检测结果。本发明在YoloX上进行了模块替换、调整池化核大小并引入关键点检测的改进,在提高了人脸检测精度和速率的同时有效地解决了带有戏曲特定妆容的人脸因具有虚拟性、夸张性等特点无法准确检测的问题。

Description

一种基于改进的YoloX的戏曲角色妆容脸部检测方法
技术领域
本发明涉及计算机图形学处理,具体涉及一种基于改进的YoloX的戏曲角色妆容脸部检测方法。
背景技术
戏曲艺术作为中华非物质文化遗产,是中华文明传承的重要载体。传播、传承、推广戏曲艺术,对增强民族自信和自豪,弘扬民族文化,意义重大。戏曲表演绘声绘色、眉目传情,妆容精致,蕴含着丰富的文化信息。戏曲中妆容丰富,代表着对人物的形象创造,使得观众对戏剧中人物的角色、性格,在登场的一刹那,不需道出身份,即有鲜明的基本认识。戏曲化妆从一勾一抹的化妆中彰显人物的性格化,朝着“写意”方向发展,具有虚拟性、象征性、夸张性的特点,如戏曲中的生、旦角色为了将人物烘托得更鲜明,将眼睛和眉毛故意吊高;净、丑角色常将眉、鼻窝、嘴唇等夸张地拉大、变形,以便能吸引观众的注意及突显人物角色的性格化。目前,计算机在图像、视频领域都有一定的研究进展,但对具有脸谱妆容的戏曲角色方面研究还很少。人脸检测是人脸识别、人脸老化、人脸表情识别等任务的前提条件,同样,戏曲角色妆容脸部检测也是戏曲角色识别、身份识别、情感识别等任务的首要工作,因为只有将具有戏曲特定妆容的脸部检测出来,才能更好地研究这些独特特点背后的含义。
由于戏曲有自己的特点,有特定的脸谱妆容,与人们平时化妆或演出的妆容存在较大差异。目前,不论是采用现有的探索人脸独特特征的人脸检测器,还是采用通用目标检测器都无法准确检测出戏曲角色化妆后的脸部。因此,迫切需要研究实现能够检测出戏曲特定妆容的脸部检测器,以支撑对戏曲文化传承保护和对戏曲文化艺术风格的研究。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于改进的YoloX的戏曲角色妆容脸部检测方法,以解决现有技术无法准确检测戏曲角色带妆脸部的问题。
为了实现上述目的,本发明采用以下技术方案予以实现:
一种基于改进的YoloX的戏曲角色妆容脸部检测方法,包括如下步骤:
步骤1、对通用目标检测算法YoloX进行改进:将主干网络CSPdarknet中的Focus模块替换为Stem模块,调整加强特征提取网络FPN中的SPP模块池化核为更小的核,在分类器与回归器Yolo Head中引入5个人脸关键点进行回归;
步骤2、数据预处理:收集秦腔戏曲妆容人脸数据,对其进行标注,并添加到公共人脸数据集中,然后使用Mosaic方法通过随机缩放、随机裁剪和随机排布的方式对数据集进行增强,并将增强后的数据传入改进后的YoloX的输入端进行特征层堆叠,扩充通道;
步骤3、特征提取:将经输入端处理过的数据传入主干网络CSPdarknet中进行特征提取,获取到三个特征层;
步骤4、特征融合:将步骤3获得的三个特征层传入加强特征提取网络FPN,分别使用上采样和下采样的方式实现特征融合,得到三个加强过的有效特征层;
步骤5、目标标注:将三个加强过的有效特征层传入YoloX的分类器与回归器YoloHead中得到特征图,并将其转化为特征点的集合,判断特征点是否有物体与其对应,获得最终的预测结果;
步骤6、对预测结果进行解码:预测结果分为Reg预测结果、Obj预测结果和Cls预测结果三个部分,将三者结合绘制出相应的预测框;
步骤7、对得到的预测框进行得分排序与非极大值抑制,找出得分满足置信度的预测框并筛选出一定区域内属于同一种类且得分最大的预测框,即为最终的检测结果。
进一步地,所述步骤5在分类器与回归器Yolo Head中,采用更适用于人脸检测的Loss函数,损失函数为:
该损失函数的作用是对于小误差,表现为具有偏移量的对数函数,而对于大误差,则表现为L1损失函数:L1(x)=|x|;其中,正数ω将非线性部分的范围限制在[-ω,ω]区间内,e代表约束非线性区域的曲率,并且为一个常数,平滑地连接了分段定义的线性和非线性部分。
本发明与现有技术相比,具有如下技术效果:
本发明首先对通用目标检测算法YoloX进行改进:将主干网络CSPdarknet中的Focus模块替换为Stem模块,调整加强特征提取网络FPN中的SPP模块池化核为更小的核,在分类器与回归器Yolo Head中引入5个人脸关键点进行回归。然后收集含戏曲妆容的人脸数据,对其进行标注,添加到公共人脸数据集中,使用Mosaic方法通过随机缩放、随机裁剪、随机排布的方式进行数据增强,并将增强后的数据传入输入端进行特征层堆叠,通道扩充。经过输入端处理过的数据传入主干网络CSPdarknet中进行特征提取,获取到三个特征层。在主干部分获得的三个特征层传入加强特征提取网络FPN,分别使用上采样和下采样的方式实现特征融合,得到三个加强过的有效特征层。将三个加强过的有效特征层传入YoloX的分类器与回归器Yolo Head中得到特征图,并将其转化为特征点的集合,判断特征点是否有物体与其对应,获得最终的预测结果。最后对得到的预测结果进行解码,绘制出相应的预测框,并利用置信度与非极大值抑制筛选出最终的检测结果。
本发明将主干网络中的Focus模块替换为Stem模块后进行特征提取,提高了网络的泛化能力,在不降低性能的同时降低了计算复杂度,提升了检测速率;调整加强特征提取网络FPN中的SPP模块池化核为更小的核使得yolox更适用于人脸检测,提高了检测精度;引入人脸关键点进行回归,提高了检测精度。本方法实现了基于改进的YoloX的戏曲角色妆容脸部检测,操作简便,使得训练出的人脸检测器可以准确检测出戏曲角色具有特定妆容的脸部,并提高了一般人脸检测的速率和精度。
附图说明
图1为本发明实施例经步骤2预处理后的数据图像示意图;
图2为本发明实施例中改进后的通用目标检测算法YoloX的结构示意图;
图3为本发明实施例改进后的SPP结构示意图;
图4为本发明实施例所涉及的改进后的YoloX的分类器与回归器Yolo Head的工作流程图;
图5为采用通用目标检测器YoloX对戏曲人物检测的效果图;
图6为采用本发明实施例所述方法对戏曲人物检测的效果图。
具体实施方式
以下结合实施例对本发明的具体内容做进一步详细解释说明。
参照图1-6,本实施例提供一种基于改进的YoloX的戏曲角色妆容脸部检测方法,包括如下步骤:
步骤1、对通用目标检测算法YoloX进行改进:将主干网络CSPdarknet中的Focus模块替换为Stem模块;调整加强特征提取网络FPN中的SPP模块池化核为更小的核;在分类器与回归器Yolo Head中引入5个人脸关键点进行回归;
步骤2、数据预处理:收集秦腔戏曲妆容人脸数据,对其进行标注,并添加到公共人脸数据集中,然后使用Mosaic方法通过随机缩放、随机裁剪和随机排布的方式对数据集进行增强,增强前后的数据图像示例见图1所示;然后将增强后的数据传入改进后的YoloX的输入端进行特征层堆叠,扩充通道;
步骤3、特征提取:将经YoloX输入端处理过的数据传入主干网络CSPdarknet中进行特征提取,获取到三个特征层;
其中,主干网络CSPdarknet主要包括残差网络Residual、CSPnet、Stem、SPP网络结构和SiLU激活函数,利用残差网络和残差块,使用跳跃连接缓解深度神经网络中增加深度带来的梯度消失问题,并通过SPP模块不同池化核大小的最大池化进行特征提取,得到输入图片的特征集合,改进后的SPP结构如图3所示;
步骤4、将在主干网络CSPdarknet部分获得的三个特征层传入加强特征提取网络FPN,分别使用上采样和下采样的方式实现特征融合,得到三个加强过的有效特征层;
其中,在主干网络中提取出的三个特征层分别位于主干网络的中间层、中下层、底层;当输入为(640,640,3)的时候,三个特征层的shape分别为feat1=(80,80,256)、feat2=(40,40,512)、feat3=(20,20,1024);将三个特征层传入FPN后,feat3=(20,20,1024)的特征层进行1次1X1卷积调整通道后获得P5,P5进行上采样UmSampling2d后与feat2=(40,40,512)特征层进行结合,然后使用CSPLayer进行特征提取获得P5_upsample,此时获得的特征层为(40,40,512);P5_upsample=(40,40,512)的特征层进行1次1X1卷积调整通道后获得P4,P4进行上采样UmSampling2d后与feat1=(80,80,256)特征层进行结合,然后使用CSPLayer进行特征提取P3_out,此时获得的特征层为(80,80,256);P3_out=(80,80,256)的特征层进行一次3x3卷积,并下采样后与P4堆叠,然后使用CSPLayer进行特征提取P4_out,此时获得的特征层为(40,40,512);P4_out=(40,40,512)的特征层进行一次3x3卷积,并下采样后与P5堆叠,然后使用CSPLayer进行特征提取P5_out,此时获得的特征层为(20,20,1024);最终获得三个加强过的有效特征层,如图2所示。
步骤5、将三个加强过的有效特征层传入YoloX的分类器与回归器Yolo Head中得到特征图,并将其转化为特征点的集合,判断特征点是否有物体与其对应,获得最终的预测结果;
其中,经过FPN特征金字塔后,获得的三个加强过的有效特征层维度分别为(20,20,1024)、(40,40,512)、(80,80,256),将这三个加强过的有效特征层传入Yolo Head中获取预测结果;
对于每一个特征层,获得三个预测结果,分别是1、Reg(h,w,4)用于判断每一个特征点的回归参数,回归参数调整后可以获得预测框;2、Obj(h,w,1)用于判断每一个特征点是否包含物体;3、Cls(h,w,num_classes)用于判断每一个特征点所包含的物体种类;将三个预测结果进行堆叠,每个特征层获得的结果为:Out(h,w,4+1+num_classses)前四个参数用于判断每一个特征点的回归参数,回归参数调整后可以获得预测框;第五个参数用于判断每一个特征点是否包含物体;最后num_classes个参数用于判断每一个特征点所包含的物体种类。
本发明通过在分类器与回归器Yolo Head中引入5个人脸关键点进行回归,引用更适用于人脸检测的Wing-Loss函数,来提升人脸检测的精度,该损失函数为:
该损失函数的作用是对于小误差,表现为具有偏移量的对数函数,而对于大误差,则表现为L1损失函数:L1(x)=|x|;其中,正数ω将非线性部分的范围限制在[-ω,ω]区间内,e代表约束非线性区域的曲率,并且为一个常数,平滑地连接了分段定义的线性和非线性部分。
步骤6、对预测结果进行解码:预测结果分为三个部分,Reg预测结果、Obj预测结果和Cls预测结果;Reg代表预测框的中心点相较于该特征点的偏移情况和预测框的宽高相较于对数指数的参数,Obj代表每一个特征点预测框内部包含物体的概率,Cls代表每一个特征点对应某类物体的概率,将Reg、Obj、Cls三者结合绘制出相应的预测框,详情见图4所示。
步骤7:对得到的最终预测框进行得分排序与非极大值抑制,找出得分满足置信度的预测框并筛选出一定区域内属于同一种类且得分最大的预测框,即为最终的检测结果。
图5为采用原始通用目标检测器YoloX对戏曲人物检测的效果图,可以看到,带有净角大花脸妆容的戏曲角色无法检测出。
图6为采用本发明所述方法对戏曲人物检测的效果图,由图可以看出,本发明所述方法可以成功检测出戏曲净角带有特定妆容的脸部。
综上所述,本发明在通用目标检测器YoloX上进行了模块替换、调整池化核大小并引入关键点检测的改进,在提高了人脸检测精度和速率的同时有效地解决了带有戏曲特定妆容的人脸因具有虚拟性、夸张性等特点无法准确检测的问题,为实现戏曲面部情感识别、戏曲角色身份识别等后续方向奠定了基础,对发扬戏曲传统文化具有重要意义。

Claims (2)

1.一种基于改进的YoloX的戏曲角色妆容脸部检测方法,其特征在于,包括如下步骤:
步骤1、对通用目标检测算法YoloX进行改进:将主干网络CSPdarknet中的Focus模块替换为Stem模块,调整加强特征提取网络FPN中的SPP模块池化核为更小的核,在分类器与回归器Yolo Head中引入5个人脸关键点进行回归;
步骤2、数据预处理:收集秦腔戏曲妆容人脸数据,对其进行标注,并添加到公共人脸数据集中,然后使用Mosaic方法通过随机缩放、随机裁剪和随机排布的方式对数据集进行增强,并将增强后的数据传入改进后的YoloX的输入端进行特征层堆叠,扩充通道;
步骤3、特征提取:将经输入端处理过的数据传入主干网络CSPdarknet中进行特征提取,获取到三个特征层;
步骤4、特征融合:将步骤3获得的三个特征层传入加强特征提取网络FPN,分别使用上采样和下采样的方式实现特征融合,得到三个加强过的有效特征层;
步骤5、目标标注:将三个加强过的有效特征层传入YoloX的分类器与回归器Yolo Head中得到特征图,并将其转化为特征点的集合,判断特征点是否有物体与其对应,获得最终的预测结果;
步骤6、对预测结果进行解码:预测结果分为Reg预测结果、Obj预测结果和Cls预测结果三个部分,将三者结合绘制出相应的预测框;
步骤7、对得到的预测框进行得分排序与非极大值抑制,找出得分满足置信度的预测框并筛选出一定区域内属于同一种类且得分最大的预测框,即为最终的检测结果。
2.如权利要求1所述的基于改进的YoloX的戏曲角色妆容脸部检测方法,其特征在于,所述步骤5在分类器与回归器Yolo Head中,采用更适用于人脸检测的Loss函数,损失函数为:
该损失函数的作用是对于小误差,表现为具有偏移量的对数函数,而对于大误差,则表现为L1损失函数:L1(x)=|x|;其中,正数ω将非线性部分的范围限制在[-ω,ω]区间内,e代表约束非线性区域的曲率,并且为一个常数,平滑地连接了分段定义的线性和非线性部分。
CN202210445376.8A 2022-04-26 2022-04-26 一种基于改进的YoloX的戏曲角色妆容脸部检测方法 Active CN114882556B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210445376.8A CN114882556B (zh) 2022-04-26 2022-04-26 一种基于改进的YoloX的戏曲角色妆容脸部检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210445376.8A CN114882556B (zh) 2022-04-26 2022-04-26 一种基于改进的YoloX的戏曲角色妆容脸部检测方法

Publications (2)

Publication Number Publication Date
CN114882556A CN114882556A (zh) 2022-08-09
CN114882556B true CN114882556B (zh) 2024-03-15

Family

ID=82671314

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210445376.8A Active CN114882556B (zh) 2022-04-26 2022-04-26 一种基于改进的YoloX的戏曲角色妆容脸部检测方法

Country Status (1)

Country Link
CN (1) CN114882556B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112257693A (zh) * 2020-12-22 2021-01-22 湖北亿咖通科技有限公司 一种身份识别方法及设备
CN112364734A (zh) * 2020-10-30 2021-02-12 福州大学 基于yolov4和CenterNet的异常着装检测方法
CN112686129A (zh) * 2020-12-28 2021-04-20 湖北亿咖通科技有限公司 一种人脸识别系统及方法
CN113705521A (zh) * 2021-09-05 2021-11-26 吉林大学第一医院 一种结合YOLO-MobilenetV3人脸检测的头部姿态估计方法
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN114241377A (zh) * 2021-12-16 2022-03-25 海南大学 基于改进yolox的船舶目标检测方法、装置、设备及介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021244079A1 (zh) * 2020-06-02 2021-12-09 苏州科技大学 智能家居环境中图像目标检测方法
CN112364734A (zh) * 2020-10-30 2021-02-12 福州大学 基于yolov4和CenterNet的异常着装检测方法
CN112257693A (zh) * 2020-12-22 2021-01-22 湖北亿咖通科技有限公司 一种身份识别方法及设备
CN112686129A (zh) * 2020-12-28 2021-04-20 湖北亿咖通科技有限公司 一种人脸识别系统及方法
CN113705521A (zh) * 2021-09-05 2021-11-26 吉林大学第一医院 一种结合YOLO-MobilenetV3人脸检测的头部姿态估计方法
CN114241377A (zh) * 2021-12-16 2022-03-25 海南大学 基于改进yolox的船舶目标检测方法、装置、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的实时场景小脸检测方法;叶锋;赵兴文;宫恩来;杭丽君;;计算机工程与应用;20181119(12);167-173 *

Also Published As

Publication number Publication date
CN114882556A (zh) 2022-08-09

Similar Documents

Publication Publication Date Title
CN109919830B (zh) 一种基于美学评价的带参考人眼图像修复方法
Sun et al. Faster R-CNN based table detection combining corner locating
CN112950477B (zh) 一种基于双路径处理的高分辨率显著性目标检测方法
CN112950661A (zh) 一种基于注意力生成对抗网络人脸卡通画生成方法
CN114444558A (zh) 用于对象识别的神经网络的训练方法及训练装置
CN110766020A (zh) 一种面向多语种自然场景文本检测与识别的系统及方法
WO2017197593A1 (en) Apparatus, method and computer program product for recovering editable slide
Yanagisawa et al. Face detection for comic images with deformable part model
CN106203448A (zh) 一种基于非线性尺度空间的场景分类方法
Liu et al. Texture filtering based physically plausible image dehazing
CN115272306A (zh) 利用梯度运算的太阳能电池板栅线增强方法
CN114882556B (zh) 一种基于改进的YoloX的戏曲角色妆容脸部检测方法
CN113537187A (zh) 文本识别方法、装置、电子设备及可读存储介质
CN109165551B (zh) 一种自适应加权融合显著性结构张量和lbp特征的表情识别方法
Salunkhe et al. Recognition of multilingual text from signage boards
Sreedevi et al. Ngfica based digitization of historic inscription images
CN109800758A (zh) 一种极大值区域检测的自然场景文字检测方法
CN111597864A (zh) 基于累积光流加权特征的微表情识别方法
Long et al. Research on text detection on building surfaces in smart cities based on deep learning
Kumar et al. ResUNet: an automated deep learning model for image splicing localization
CN114698398A (zh) 图像处理方法、图像处理装置、电子设备及可读存储介质
Kuang et al. Detecting for bronze inscriptions
Lin et al. Domain adaptation with foreground/background cues and gated discriminators
Zhao et al. Retracted chapter: Image colorization using convolutional neural network
Yin et al. Headdress Detection Based on Saliency Map for Thangka Portrait Image.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant