CN111079581A - 一种人体皮肤识别的方法与装置 - Google Patents
一种人体皮肤识别的方法与装置 Download PDFInfo
- Publication number
- CN111079581A CN111079581A CN201911216984.6A CN201911216984A CN111079581A CN 111079581 A CN111079581 A CN 111079581A CN 201911216984 A CN201911216984 A CN 201911216984A CN 111079581 A CN111079581 A CN 111079581A
- Authority
- CN
- China
- Prior art keywords
- decoder
- skin
- encoder
- human skin
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 17
- 238000012549 training Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 17
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 6
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000003709 image segmentation Methods 0.000 description 2
- 230000036544 posture Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Image Processing (AREA)
Abstract
本发明主要是提供一种人体皮肤识别的方法和装置,通过预设训练数据集,以及构建皮肤识别模块,通过编码器和解码器的结构,识别检测出人体皮肤区域并标记,实现了该轻量级的模型结构,可以在离线的状态下,进行人体皮肤识别,操作性强,识别检测的精度高且完整,鲁棒性较强。
Description
技术领域
本发明涉及时深度学习领域,具体为计算机视觉中图像识别处理,涉及一种人体皮肤识别的方法与装置。
背景技术
随着深度学习技术的发展,人像皮肤识别最主要的步骤是提取图像语义信息,准确的识别皮肤区域并进行分离。语义分割是计算机视觉中的一个重要研究领域。人像皮肤实际上是一个二分类的问题,需要判断每一个像素点是否属于皮肤区域或者非皮肤区域。目前,在同类技术当中,传统的人像皮肤识别主要是根据灰度、颜色等特征将图像进行划分区域,让区域显示差异性,区域内呈现相似性。深度学习领域,基于深层卷积网络提取图像的语义信息和空间结构实现图像分割。然而,人像千姿百态,北京复杂多变,人种肤色多样性,而且在实际应用中,人像拍摄容易受到拍摄角度、光照强度、方位的影响。其技术终端的使用,以移动终端的娱乐软件为主,其次,移动终端的计算能力,资源相对比较缺乏,如果通过数据网络传输,依赖于云端方式运行的胡啊,会占用网络资源以及需要较长的时间,因而,寻找一种对计算资源需求较低,能够利用客户端资源进行运算的方法变得更加迫切。在皮肤识别领域,如何能够自动准确的进行人像皮肤识别并提高精确度,实时提供人像皮肤识别的服务,成为技术难题。
皮肤分割也是图像分割中一个重要的分支,具有重要的意义。皮肤分割(SkinRegion Segmentation)在人脸和手势识别与跟踪、Web图像内容过滤、人物检索和医疗诊断等方面有广泛应用,由于不同种族、年龄、性别、光线、亮度、饱和度、对比度等影响因子,会导致人体肤色呈现多样化。在当前技术,主要使用颜色空间模型(如RGB、HSV等颜色模型)和基于椭圆皮肤模型的皮肤检测技术来进行皮肤识别。基于颜色空间模型实现皮肤识别技术主要是根据颜色模型找出定义好的肤色范围内的像素点,范围外的像素点则判断为非皮肤区域,该方法皮肤检测的完整性并不高,一些稍微光线不好的区域也没有办法检测出皮肤来,鲁棒性不好。基于椭圆皮肤模型的皮肤检测技术来进行皮肤识别,经过前人学者大量的皮肤统计信息可以知道,如果将皮肤信息映射到YCrCb空间,则在CrCb二维空间中这些皮肤像素点近似成一个椭圆分布。因此如果我们得到了一个CrCb的椭圆,下次一个坐标(Cr,Cb)我们只需判断它是否在椭圆内(包括边界),如果是,则可以判断其为皮肤,否则就是非皮肤像素点,相比方法一,基于肤色椭圆模型的算法的皮肤检测在效果上有着较大的提升,基本上能够检测到皮肤区域,对光线的抗干扰能力也是比较强的,但是皮肤检测的精度不高且不完整,基于深度学习的皮肤识别技术能够有效提高识别的准确性,且鲁棒性较强。
发明内容
本发明提供如下技术方案,一种人体皮肤识别的方法,包括以下内容:
步骤S100:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
步骤S200:通过编译器和解码器皮肤识别,输出人体皮肤标记的效果图;
步骤S300:返回人体皮肤识别的结果,输出所述带人体皮肤标记的效果图,用于后续的处理,例如磨皮,美颜等皮肤区域图像处理;
进一步的,所述步骤S200是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
为实现上述目的,本发明还提供一种人体皮肤识别的装置,其中包括:
训练数据集预处理模块:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
皮肤识别处理模块:通过编译器和解码器皮肤识别,标记人体皮肤区域;
输出返回模块:输出人体皮肤识别的标记效果图,用于后续的处理,例如磨皮,美颜等皮肤区域图像处理;
进一步的,皮肤识别处理模块是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
本发明主要是通过一种人体皮肤识别的方法和装置,通过一个轻量级的模型结构,实现了在离线的状态下,能够实时实现人体皮肤的识别,有效提高了识别的准确性和完整性。
附图说明
为了更清楚地说明本发明的实施例的技术方案,下面将对本发明的实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明的一种人体皮肤识别的方法流程图;
图2示出了本发明的一种人体皮肤识别的装置流程图。
具体实施方式
为了使本发明的目的,技术方案和有点更加清楚,下面结合附图对本发明作进一步的阐述解释。显然,所描述的实施例是本发明的实施例的一部分,而不是全部的实施例,基于本发明的实施方式中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的实施例保护范围。
参照图1,其示出了本发明的一种人体皮肤识别的方法,具体如下;
训练数据集的准备,为了提供模型的鲁棒性,需要提前准备大量的训练数据集,且该数据集必须具有多样性,如包含了不同肤色、年龄、人种、背景、姿态的人像图片及其对应的标注数据集;人工标注了12000多张的皮肤数据,使用数据增强的方式增加训练集的容量,如加入了光照,亮度,角度等影响因子对图像进行增强;
步骤S100:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
步骤S200:通过编译器和解码器皮肤识别,输出人体皮肤标记的效果图;
步骤S300:返回人体皮肤识别的结果,输出所述带人体皮肤标记的效果图,用于后续的处理,例如磨皮,美颜等皮肤区域图像处理;
进一步的,所述步骤S200是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
为实现上述目的,本发明还提供一种人体皮肤识别的装置,其中包括:
训练数据集预处理模块:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
皮肤识别处理模块:通过编译器和解码器皮肤识别,标记人体皮肤区域;
输出返回模块:输出人体皮肤识别的标记效果图,用于后续的处理,例如磨皮,美颜等皮肤区域图像处理;
进一步的,皮肤识别处理模块是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (4)
1.一种人体皮肤识别的方法,包括以下内容:
步骤S100:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
步骤S200:通过编译器和解码器皮肤识别,输出人体皮肤标记的效果图;
步骤S300:返回人体皮肤识别的结果,输出所述带人体皮肤标记的效果图。
2.根据权利要求1所述一种人像卡通化的方法,其特征在于,所述步骤S200是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
3.一种人体皮肤识别的装置,其中包括:
训练数据集预处理模块:待识别处理图像,通过预设人像皮肤训练数据集,对数据进行剪裁,旋转以及调整图片的尺寸,使所有的图片都是一样的尺寸大小,并对图片进行归一化处理,使图片的值域处于-1~1之间;
皮肤识别处理模块:通过编译器和解码器皮肤识别,标记人体皮肤区域;
输出返回模块:输出人体皮肤识别的标记效果图,用于后续的处理,例如磨皮,美颜等皮肤区域图像处理。
4.根据权利要求3所述一种人体皮肤识别的装置,其特征在于,所述皮肤识别处理模块是一个encoder-decoder的结构,由两部分组成:编码器(encoder)和解码器(decoder);所述编码器由多个编码模块级联而成,用于卷积运算和残差块运算,从而提取不同层次的图像特征;所述解码器由多个解码模块级联组成,解码器的第一个输入为编码器最后一个编码模块的输出,编码模块输入用于上采样运算并作为下一个解码器的输入,以此类推,直到最后的解码器的输出与输入图像的大小一致;网络输出了一个与输入尺寸一样的mask矩阵,每个像素点代表了该像素属于人体皮肤的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911216984.6A CN111079581A (zh) | 2019-12-03 | 2019-12-03 | 一种人体皮肤识别的方法与装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911216984.6A CN111079581A (zh) | 2019-12-03 | 2019-12-03 | 一种人体皮肤识别的方法与装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111079581A true CN111079581A (zh) | 2020-04-28 |
Family
ID=70312477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911216984.6A Pending CN111079581A (zh) | 2019-12-03 | 2019-12-03 | 一种人体皮肤识别的方法与装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111079581A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052112A (zh) * | 2021-04-02 | 2021-06-29 | 北方工业大学 | 基于混合神经网络的手势动作识别互动系统及方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120288168A1 (en) * | 2011-05-09 | 2012-11-15 | Telibrahma Convergent Communications Pvt. Ltd. | System and a method for enhancing appeareance of a face |
CN109785333A (zh) * | 2018-12-11 | 2019-05-21 | 华北水利水电大学 | 用于并联机器人视觉系统的目标检测方法及装置 |
CN110276766A (zh) * | 2019-06-27 | 2019-09-24 | 广州久邦世纪科技有限公司 | 一种人像分割的方法及装置 |
-
2019
- 2019-12-03 CN CN201911216984.6A patent/CN111079581A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120288168A1 (en) * | 2011-05-09 | 2012-11-15 | Telibrahma Convergent Communications Pvt. Ltd. | System and a method for enhancing appeareance of a face |
CN109785333A (zh) * | 2018-12-11 | 2019-05-21 | 华北水利水电大学 | 用于并联机器人视觉系统的目标检测方法及装置 |
CN110276766A (zh) * | 2019-06-27 | 2019-09-24 | 广州久邦世纪科技有限公司 | 一种人像分割的方法及装置 |
Non-Patent Citations (1)
Title |
---|
杨帆: "《数字图像处理与分析(第4版)》", vol. 4, 31 January 2019, 北京航空航天大学出版社, pages: 308 - 310 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113052112A (zh) * | 2021-04-02 | 2021-06-29 | 北方工业大学 | 基于混合神经网络的手势动作识别互动系统及方法 |
CN113052112B (zh) * | 2021-04-02 | 2023-06-02 | 北方工业大学 | 基于混合神经网络的手势动作识别互动系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109558832B (zh) | 一种人体姿态检测方法、装置、设备及存储介质 | |
CN108304765B (zh) | 用于人脸关键点定位与语义分割的多任务检测装置 | |
CN108171701B (zh) | 基于u网络和对抗学习的显著性检测方法 | |
CN109344701A (zh) | 一种基于Kinect的动态手势识别方法 | |
CN108875602A (zh) | 监控环境下基于深度学习的人脸识别方法 | |
TW201732651A (zh) | 一種單詞的分割方法和裝置 | |
CN111178355B (zh) | 印章识别方法、装置和存储介质 | |
CN111832568A (zh) | 车牌识别方法、车牌识别模型的训练方法和装置 | |
CN110689658A (zh) | 一种基于深度学习的出租车票据识别方法和系统 | |
CN112419326B (zh) | 图像分割数据处理方法、装置、设备及存储介质 | |
CN103839042A (zh) | 人脸识别方法和人脸识别系统 | |
CN114758249B (zh) | 基于野外夜间环境的目标物监测方法、装置、设备及介质 | |
US20230334893A1 (en) | Method for optimizing human body posture recognition model, device and computer-readable storage medium | |
CN111639704A (zh) | 目标识别方法、装置及计算机可读存储介质 | |
CN105335760A (zh) | 一种图像数字字符识别方法 | |
CN109920018A (zh) | 基于神经网络的黑白照片色彩恢复方法、装置及存储介质 | |
CN115577768A (zh) | 半监督模型训练方法和装置 | |
CN112990213B (zh) | 一种基于深度学习的数字万用表字符识别系统和方法 | |
CN110826534A (zh) | 一种基于局部主成分分析的人脸关键点检测方法及系统 | |
CN111079581A (zh) | 一种人体皮肤识别的方法与装置 | |
CN104915641A (zh) | 基于android平台获取人脸图像光源方位的方法 | |
CN110633666A (zh) | 一种基于手指颜色贴片的手势轨迹识别方法 | |
CN113052194A (zh) | 一种基于深度学习的服装色彩认知系统及其认知方法 | |
CN112084874B (zh) | 一种物体检测方法、装置及终端设备 | |
CN114964628A (zh) | 一种氨气泄漏混洗自注意力轻量化红外检测方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |