CN112183603A - 痘痘类型识别模型训练方法及相关装置 - Google Patents
痘痘类型识别模型训练方法及相关装置 Download PDFInfo
- Publication number
- CN112183603A CN112183603A CN202011004325.9A CN202011004325A CN112183603A CN 112183603 A CN112183603 A CN 112183603A CN 202011004325 A CN202011004325 A CN 202011004325A CN 112183603 A CN112183603 A CN 112183603A
- Authority
- CN
- China
- Prior art keywords
- pox
- image
- sample
- probability
- label
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 48
- 238000000034 method Methods 0.000 title claims abstract description 42
- 206010046865 Vaccinia virus infection Diseases 0.000 claims abstract description 52
- 208000007089 vaccinia Diseases 0.000 claims abstract description 52
- 238000011156 evaluation Methods 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 8
- 238000009826 distribution Methods 0.000 description 7
- 206010033733 Papule Diseases 0.000 description 6
- 230000002757 inflammatory effect Effects 0.000 description 6
- 208000002874 Acne Vulgaris Diseases 0.000 description 5
- 206010000496 acne Diseases 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 5
- 206010015150 Erythema Diseases 0.000 description 4
- 206010037888 Rash pustular Diseases 0.000 description 4
- 208000031513 cyst Diseases 0.000 description 4
- 231100000321 erythema Toxicity 0.000 description 4
- 208000029561 pustule Diseases 0.000 description 4
- 206010011732 Cyst Diseases 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 241000700647 Variola virus Species 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010054107 Nodule Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003925 brain function Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004379 similarity theory Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种痘痘类型识别模型训练方法及相关装置。其中方法包括:获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度信息;基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
Description
技术领域
本发明涉及计算机视觉技术领域,尤其是涉及一种痘痘类型识别模型训练方法及相关装置。
背景技术
随着移动通信技术的快速发展以及人民生活水平的提升,各种智能终端已广泛应用于人民的日常工作和生活,使得人们越来越习惯于使用终端应用程序,使得美颜自拍、拍照测肤此类功能的APP需求也变得越来越多,对脸部痘痘情况的分析也有很大的需求,可以根据痘痘类型,针对性地提出或查询皮肤改善方案。
然而痘痘面积小,不同类别之间可区分的特征不明显,导致目前对痘痘类型识别的准确度较低。
发明内容
本申请提供了一种痘痘类型识别模型训练方法及相关装置。
第一方面,提供了一种痘痘类型识别模型训练方法,包括:
获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;
获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;
计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度概率;
基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
第二方面,提供了一种痘痘类型识别模型训练装置,包括:
获取模块,用于获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;
所述获取模块还用于,获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;
计算模块,用于计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度信息;
训练模块,用于基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
第三方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。
本申请实施例通过获取样本数据集,上述样本数据集包括多个属于不同痘痘类型的样本图像,获取每个痘痘类型所对应的一个标准图像,上述一个标准图像用于代表一个痘痘类型的痘痘样式,计算各个上述样本图像的类别概率标签,上述类别概率标签包括上述样本图像与每个上述标准图像之间的相似度信息,再基于上述各个样本图像和上述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型,可以对痘痘类型进行较准确识别。传统的分类标签方式,分类的准确度不高,而本申请中在模型训练时采用样本图像与每个所述标准图像之间的相似度信息进行标注,可以从标签上体现出类别之间的相似程度,将痘痘类型标签概率化,使得模型能够学习痘痘类型之间的相似特征,从而提升痘痘类型识别的准确度。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种痘痘类型识别模型训练方法的流程示意图;
图2为本申请实施例提供的一种痘痘类型识别模型训练方法的流程示意图;
图3为本申请实施例提供的一种痘痘类型识别模型训练装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例中涉及的神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种痘痘类型识别模型训练方法的流程示意图。该方法可包括:
101、获取样本数据集,上述样本数据集包括多个属于不同痘痘类型的样本图像。
本申请实施例的执行主体可以为一种痘痘类型识别模型训练装置,可以为电子设备,具体实现中,上述电子设备可以为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
具体的,可以先构建样本数据集。上述样本数据集可以包括不同的应用场景、不同的拍摄质量以及不同痘痘类型的样本图像。其中痘痘类型可包括粉刺、逗后红斑、炎症性丘疹、脓包、结节和囊肿等。
在一种实施方式中,该方法包括:
获取多个包含痘痘的图像数据,上述痘痘属于不同类别;
对上述多个图像数据进行归一化处理,获得预设大小的多个上述样本图像,获得上述样本数据集。
由于痘痘图像较小,因此可以先对图像数据进行归一化操作,将图像大小设置为预设大小,以便准确进行后续处理。
102、获取每个痘痘类型所对应的一个标准图像,上述一个标准图像用于代表一个痘痘类型的痘痘样式。
具体的,可以预先设置每个痘痘类型对应的一个标准图像。可选的,可以从收集的痘痘类型数据集中,选择出上述标准图像,该标准图像可以作为对应痘痘类型的代表样式图像,作为其他处理图像分类时的对比参考图像。
举例来讲,痘痘类型可包括粉刺、逗后红斑、炎症性丘疹、脓包、结节和囊肿六类样本,则选择出标准的六种痘痘类型图像,可对应表示为:
[y1T,y2T,y3T,y4T,y5T,y6T]。
103、计算各个上述样本图像的类别概率标签,上述类别概率标签包括上述样本图像与每个上述标准图像之间的相似度信息。
具体的,对任一样本图像,可以与标准图像进行相似度衡量,来生成样本图像的类别概率标签,其中的相似度信息可以考虑图像亮度、对比度、结构等特征的相似度,可以根据预设的计算规则计算各方面的相似度评价值,并整合为一个概率值,可以反映一个样本图像属于一个标准图像对应的痘痘类型的概率。
在一种实施方式中,上述步骤103可包括:
对任意一个上述样本图像,计算上述样本图像与上述每个标准图像之间的相似度概率;
获取上述样本图像的人工标签,上述人工标签用于标注上述样本图像所属的痘痘类型;
根据上述样本图像的人工标签和上述相似度概率,生成上述样本图像的上述类别概率标签。
上述样本图像的人工标签可以是人工标定的结果,人工标签中的概率值为1或0,表示是否属于某个痘痘类型:1表示属于,0表示不属于。比如,痘痘类型包括粉刺、逗后红斑、炎症性丘疹、脓包、结节和囊肿六类,在人工标签中的类别也按照如上顺序排列,假设样本图像x人工标签判定为炎症性丘疹,则人工标签可表示为Ta=[0,0,1,0,0,0]。
本申请实施例中,由于痘痘类型之间存在许多相同的特征,因而在设定标签时,可以将上述人工标签和上述相似度概率进行结合,设定样本图像新的类别概率标签。
104、基于上述各个样本图像和上述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
在确定上述各个样本图像的类别概率标签之后,可以根据上述类别概率标签标注的样本数据集对构建的分类网络模型进行训练,直到预设的损失函数收敛,获得上述痘痘类型识别模型。
在一种可选的实施方式中,上述分类网络模型的构建可以如下所示:
模型中特征提取结构主要由卷积层、上采样层和一个全连接层和softmax层所构成,其网络结构如表1所示:
Layer | Input | Operator | c | s |
1 | 56*56*3 | Conv2d(3*3) | 32 | 2 |
2 | 28*28*32 | Conv2d(3*3) | 32 | 1 |
3 | 28*28*32 | Up_downing | 32 | 1 |
4 | 56*56*32 | Conv2d(3*3) | 64 | 1 |
5 | 56*56*64 | Conv2d(3*3) | 128 | 2 |
7 | 28*28*128 | Conv2d(3*3) | 256 | 2 |
9 | 14*14*256 | Conv2d(3*3) | 256 | 2 |
10 | 7*7*256 | Conv2d(1*1) | 512 | 1 |
11 | 7*7*512 | FC | - | - |
13 | 1*1*n | softmax | - | _ |
表1
上述表1中c表示输出的通道数,s表示步长,n表示为痘痘类型的数量。
上述网络结构1、2和4-10层的卷积层的作用都是提取特征;而其中第3层为上采样层,主要是扩展特征的大小,从而能够加深网络结构,使得网络能够进一步提取深层次的语义特征;第11层为全连接层,主要是将经过多个卷积层和池化层的图像特征图中的特征进行整合,获取图像特征具有的高层含义,之后用于图像分类。在卷积神经网络中,全连接层将卷积层产生的特征图映射成一个固定长度(一般为输入图像数据集中的图像类别数)的特征向量,这个特征向量包含了输入图像所有特征的组合信息,虽然丢失了图像的位置信息,但是该向量将图像中含有最具有特点的图像特征保留了下来,以此完成图像分类任务。通过上述卷积层、上采样层以及全连接层的组合,能够在训练过程和识别过程可以对图像特征进行充分且合理地提取,从而有助于得到准确识别痘痘的模型,有助于提升痘痘识别的精准度。
可选的,上述分类网络模型结构,可以采用已提出的特征提取结构进行替代,比如Mobilinet,VGG等结构,可以根据需要进行设置,本申请实施例对此不做限制。
进一步可选的,该方法还包括:
获取待处理痘痘图像;
采用上述痘痘类型识别模型对上述待处理痘痘图像进行处理,获得上述待处理痘痘图像属于上述不同痘痘类型的概率;根据上述概率确定上述待处理痘痘图像对应的痘痘类型;
输出上述待处理痘痘图像对应的痘痘类型。
其中,上述步骤可以在步骤104之后执行,通过前述步骤101-步骤104可以获得训练好的痘痘类型识别模型,再应用于上述处理步骤。即训练后获得的模型也可以在其他设备中执行上述处理步骤,此处不做限制。
上述待处理痘痘图像可以是拍摄的包含痘痘的图像,可以是包含痘痘的任意皮肤图像比如有痘痘的人脸图像。可以先对获取的图像进行裁剪等预处理,获得标准化的上述待处理痘痘图像,以识别痘痘类型。
本申请实施例中,可以采用前述获得的痘痘类型识别模型对待处理痘痘图像进行处理。具体的,可以预测获得待处理痘痘图像属于不同痘痘类型的概率,确定概率最大的痘痘类型为该待处理痘痘图像对应的痘痘类型,再输出上述待处理痘痘图像对应的痘痘类型。
本申请实施例通过获取样本数据集,上述样本数据集包括多个属于不同痘痘类型的样本图像,获取每个痘痘类型所对应的一个标准图像,上述一个标准图像用于代表一个痘痘类型的痘痘样式,计算各个上述样本图像的类别概率标签,上述类别概率标签包括上述样本图像与每个上述标准图像之间的相似度概率,再基于上述各个样本图像和上述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型,可以对痘痘类型进行较准确识别。传统的分类标签方式,分类的准确度不高,而本申请中在模型训练时采用样本图像与每个所述标准图像之间的相似度概率进行标注,可以从标签上体现出类别之间的相似程度,将痘痘类型标签概率化,使得模型能够学习痘痘类型之间的相似特征,从而提升痘痘类型识别的准确度。
请参阅图2,图2是本申请实施例提供的另一种痘痘类型识别模型训练方法的流程示意图。如图2所示,该方法可具体包括:
201、获取样本数据集,上述样本数据集包括多个属于不同痘痘类型的样本图像。
202、获取每个痘痘类型所对应的一个标准图像,上述一个标准图像用于代表一个痘痘类型的痘痘样式。
其中,上述步骤201和步骤202可以分别参见图1所示实施例中的步骤101和步骤102,此处不再赘述。
203、获取上述样本图像与任意一个上述标准图像之间的亮度评价值、对比度评价值和结构评价值。
具体的,对于任一样本图像x,可以分别计算出样本图像x与每个标准图像y之间的亮度评价值、对比度评价值和结构评价值,以获得一个表征两个图像间结构相似性的结构相似值。
本申请实施例中涉及的结构相似性(Structural SIMilarity,SSIM),是一种衡量两幅图像相似度的指标。结构相似性的范围为0到1,当两张图像一模一样时,SSIM的值等于1。
作为结构相似性理论的实现,结构相似度指数从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性,并将失真建模为亮度、对比度和结构三个不同因素的组合。可用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。
具体的,可以根据以下公式获得样本图像x与任意一个标准图像y之间的亮度评价值r、对比度评价值c和结构评价值s:
其中,μx为上述样本图像x各像素点的像素值的均值,μy为上述标准图像y各像素点的像素值的均值,σx为上述样本图像x各像素点的像素值的方差值,σy为上述标准图像y各像素点的像素值的方差值,σxy为上述样本图像x和上述标准图像y的像素值的协方差值;c1=(k1·L)2,c2=(k2·L)2,上述L为样本图像中像素值的范围,上述k1和上述k2为预设常数。
上述SSIM中涉及的亮度评价值、对比度评价值、结构评价值分别指示的是两个图像的亮度、对比度和纹理结构的差异,这些评价值越大对应的相似度越接近,SSIM越大相似度越接近。
204、根据上述亮度评价值、上述对比度评价值和上述结构评价值,获得上述样本图像与上述任意一个标准图像之间的结构相似值,以获得上述样本图像与上述每个标准图像之间的结构相似值。
在一种实施方式中,样本图像x与标准图像y之间的结构相似值SSIM可表示为:
SSIM(x,y)=r(x,y)×c(x,y)×s(x,y);
结构相似值可以在一定程度上表示样本图像x与标准图像之间的相似度。当SSIM值越大,图像x、y之间差异越小。
205、获取上述样本图像与上述每个标准图像之间的结构相似值在总结构相似值中的占比,作为上述样本图像与上述每个标准图像之间的相似度概率。
在分别计算出样本图片x与每个标准图像的结构相似值之后,可以计算出每一个类别对应的结构相似值在总结构相似值中的占比Tbi。
具体可以表示为:
其中n表示上述痘痘类型的数量。
可以将每个类别的占比Tbi作为类别概率标签中的概率分布,获得该样本图像对应的类别概率标签,比如有6个痘痘类型的情况下,n=6,则可获得的类别概率标签Tb=[Tb1,Tb2,Tb3,Tb4,Tb5,Tb6]。
由于传统的分类标签方式,不足以体现出不同痘痘类型的图像之间的相似程度,使得模型训练更多关注特征明显的信息,导致模型识别的准确度不高,因此本申请中通过上述SSIM结构相似度算法,将痘痘类别标签概率化,可以从标签上体现出图像与各类别之间的相似程度,再采用损失函数进行训练,则可以使得模型在训练的过程中能够更好的学习不同类别之间的相似特征,从而达到提升痘痘类别识别的准确度的目的。
206、获取上述样本图像的人工标签,上述人工标签用于标注上述样本图像所属的痘痘类型。
其中,上述样本图像的人工标签为人工标定的结果,可以是已有的样本数据集中携带的标签。上述人工标签中的概率值为1或0,表示是否属于某个痘痘类型:1表示属于,0表示不属于。比如,痘痘类型包括粉刺、逗后红斑、炎症性丘疹、脓包、结节和囊肿六类,在人工标签中的类别也按照如上顺序排列,假设样本图像x人工标签判定为炎症性丘疹,则人工标签可表示为Ta=[0,0,1,0,0,0]。
207、根据上述样本图像的人工标签和上述相似度概率,生成上述样本图像的上述类别概率标签。
在一种可选的实施方式中,可以根据预设权重对上述样本图像的人工标签和上述相似度概率进行加权处理,获得上述样本图像的上述类别概率标签。
具体的,可以采用概率分布的方式设置样本图像的类别概率标签。其类别概率标签的概率分布可由两部分组成,一部分是人工标定的结果人工标签Ta,另一部则是采用结构相似值的相似度概率Tb,上述预设权重则可设置该两部分的权重分别为a和b(a、b均大于0小于1,可以相同),则样本图像的类别概率标签中的概率分布为T=a*Ta+b*Tb。比如设置Ta、Tb两部分的权重值均为0.5,则T=0.5Ta+0.5Tb。假设Ta=[0,0,1,0,0,0],Tb=[0.12,0.2,0.48,0.1,0.1,0.1],则:
T=0.5*[0,0,1,0,0,0]+0.5*[0.12,0.2,0.48,0.1,0.1,0.1]
=[0.06,0.1,0.74,0.05,0.05]。
通过上述步骤可以获得每个样本图像对应的类别概率标签。
208、基于上述各个样本图像和上述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
其中,上述步骤208可以分别参见图1所示实施例中的步骤104,此处不再赘述。
本申请实施例中,针对标签概率化,采用SSIM结构相似算法进行计算获得,在可选的实施方式中,可以采用能达到相同目的的其他计算方式,即上述相似度信息可以根据需要设置计算规则,本申请实施例对此不作限制。
具体的,上述步骤208包括:
将上述各个样本图像和上述各个样本图像对应的类别概率标签输入上述分类网络模型,输出上述样本图像的预测分类结果;
采用损失函数计算上述各个样本图像的预测分类结果和上述类别概率标签的损失值,根据上述损失值调整上述分类网络模型的网络参数,直到上述分类网络模型收敛,获得上述痘痘类型识别模型。
在一种实施方式中,可以上述损失函数可以采用KL散度损失函数。
本申请实施例中涉及的KL散度(Kullback-Leibler divergence)即相对熵(relative entropy),又被称为信息散度(information divergence),是两个概率分布间差异的非对称性度量。
具体的,本申请实施例中采用的上述KL散度损失函数可以为:
其中,上述T为上述类别概率标签,上述P为上述分类网络模型的softmax层的预测分类结果;上述Z表示上述样本图像的数量,上述n表示上述痘痘类型的数量。比如假设n=6,softmax层输出的预测分类结果中概率分布可为表示为P=[P1,P2,P3,P4,P5,P6],而真实类别概率标签的概率分布表示为T=[T1,T2,T3,T4,T5,T6],可以将P和T代入上述KL散度损失函数计算损失值,根据损失值调整网络参数,重复执行以上步骤直到模型收敛,完成训练。
进一步可选的,上述分类网络模型可以根据需要选择模型的优化算法,比如采用Adam算法优化模型参数。可以设置迭代次数限制收敛条件,即可以根据预设的迭代次数、学习率、权重衰减等参数进行迭代训练,使损失函数收敛,训练完成后获得训练好的痘痘类型识别模型。比如,上述迭代次数设置可为500次,初始化学习率可设置为0.001,权重衰减可设置为0.0005,每50次迭代,学习率衰减为原来的1/10。
通过采用上述KL散度损失函数,能够更好利用标签概率化优势,使得模型能够更好的学习不同类别之间的相似特征。
本申请实施例中的痘痘类型识别模型训练方法,使用的痘痘类型识别模型结合了样本图像的类别概率标签和人工标注的信息作为标签,而类别概率标签是根据样本图像与每个标准图像的相似度概率生成的,可以从标签上体现出类别之间的相似程度,将痘痘类型标签概率化,而不是简单的判断是或不是哪个类别,使得模型能够学习痘痘类型之间的相似特征,在应用中能够更准确地识别图像对应的痘痘类型。
基于上述痘痘类型识别模型训练方法实施例的描述,本申请实施例还公开了一种痘痘类型识别模型训练装置。请参见图3,痘痘类型识别模型训练装置300包括:
获取模块310,用于获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;
所述获取模块310还用于,获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;
计算模块320,用于计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度信息;
训练模块330,用于基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
可选地,所述获取装置310还用于,获取待处理痘痘图像;
所述计算模块320还用于,采用所述痘痘类型识别模型对所述待处理痘痘图像进行处理,获得所述待处理痘痘图像属于所述不同痘痘类型的概率;根据所述概率确定所述待处理痘痘图像对应的痘痘类型;输出所述待处理痘痘图像对应的痘痘类型。
根据本申请的一个实施例,图1和图2所示的方法所涉及的各个步骤均可以是由图3所示的痘痘类型识别模型训练装置300中的各个模块执行的,此处不再赘述。
本申请实施例中的痘痘类型识别模型训练装置300,可以获取样本数据集,上述样本数据集包括多个属于不同痘痘类型的样本图像,获取每个痘痘类型所对应的一个标准图像,上述一个标准图像用于代表一个痘痘类型的痘痘样式,计算各个上述样本图像的类别概率标签,上述类别概率标签包括上述样本图像与每个上述标准图像之间的相似度概率,再基于上述各个样本图像和上述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型,可以对痘痘类型进行较准确识别。传统的分类标签方式,分类的准确度不高,而本申请中在模型训练时采用样本图像与每个所述标准图像之间的相似度概率进行标注,可以从标签上体现出类别之间的相似程度,将痘痘类型标签概率化,使得模型能够学习痘痘类型之间的相似特征,从而提升痘痘类型识别的准确度。
本申请实施例还提供了一种计算机存储介质(Memory),上述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括电子设备中的内置存储介质,当然也可以包括电子设备所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了电子设备的操作系统。并且,在该存储空间中还存放了适于被处理器401加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
在一个实施例中,可由处理器加载并执行计算机存储介质中存放的一条或多条指令,以实现上述实施例中的相应步骤;具体实现中,计算机存储介质中的一条或多条指令可以由处理器加载并执行图1和/或图2中方法的任意步骤,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。
Claims (10)
1.一种痘痘类型识别模型训练方法,其特征在于,包括:
获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;
获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;
计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度信息;
基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
2.根据权利要求1所述的痘痘类型识别模型训练方法,其特征在于,所述计算各个所述样本图像的类别概率标签,包括:
对任意一个所述样本图像,计算所述样本图像与所述每个标准图像之间的相似度概率;
获取所述样本图像的人工标签,所述人工标签用于标注所述样本图像所属的痘痘类型;
根据所述样本图像的人工标签和所述相似度概率,生成所述样本图像的所述类别概率标签。
3.根据权利要求2所述的痘痘类型识别模型训练方法,其特征在于,所述计算所述样本图像与所述每个标准图像之间的相似度概率,包括:
获取所述样本图像与任意一个所述标准图像之间的亮度评价值、对比度评价值和结构评价值;
根据所述亮度评价值、所述对比度评价值和所述结构评价值,获得所述样本图像与所述任意一个标准图像之间的结构相似值,以获得所述样本图像与所述每个标准图像之间的结构相似值;
获取所述样本图像与所述每个标准图像之间的结构相似值在总结构相似值中的占比,作为所述样本图像与所述每个标准图像之间的相似度概率。
4.根据权利要求2所述的痘痘类型识别模型训练方法,其特征在于,所述根据所述样本图像的人工标签和所述相似度概率,生成所述样本图像的所述类别概率标签,包括:
根据预设权重对所述样本图像的人工标签和所述相似度概率进行加权处理,获得所述样本图像的所述类别概率标签。
5.根据权利要求1-4任一项所述的痘痘类型识别模型训练方法,其特征在于,所述基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型,包括:
将所述各个样本图像和所述各个样本图像对应的类别概率标签输入所述分类网络模型,输出所述样本图像的预测分类结果;
采用损失函数计算所述各个样本图像的预测分类结果和所述类别概率标签的损失值,根据所述损失值调整所述分类网络模型的网络参数,直到所述分类网络模型收敛,获得所述痘痘类型识别模型。
6.根据权利要求1-4任一项所述的痘痘类型识别模型训练方法,其特征在于,所述获取样本数据集包括:
获取多个包含痘痘的图像数据,所述痘痘属于不同类别;
对所述多个图像数据进行归一化处理,获得预设大小的多个所述样本图像,获得所述样本数据集。
7.根据权利要求1所述的痘痘类型识别模型训练方法,其特征在于,所述方法还包括:
获取待处理痘痘图像;
采用所述痘痘类型识别模型对所述待处理痘痘图像进行处理,获得所述待处理痘痘图像属于所述不同痘痘类型的概率;根据所述概率确定所述待处理痘痘图像对应的痘痘类型;
输出所述待处理痘痘图像对应的痘痘类型。
8.一种痘痘类型识别模型训练装置,其特征在于,包括:
获取模块,用于获取样本数据集,所述样本数据集包括多个属于不同痘痘类型的样本图像;
所述获取模块还用于,获取每个痘痘类型所对应的一个标准图像,所述一个标准图像用于代表一个痘痘类型的痘痘样式;
计算模块,用于计算各个所述样本图像的类别概率标签,所述类别概率标签包括所述样本图像与每个所述标准图像之间的相似度信息;
训练模块,用于基于所述各个样本图像和所述各个样本图像对应的类别概率标签训练分类网络模型,获得痘痘类型识别模型。
9.根据权利要求8所述的装置,其特征在于,
所述获取装置还用于,获取待处理痘痘图像;
所述计算模块还用于,采用所述痘痘类型识别模型对所述待处理痘痘图像进行处理,获得所述待处理痘痘图像属于所述不同痘痘类型的概率;根据所述概率确定所述待处理痘痘图像对应的痘痘类型;输出所述待处理痘痘图像对应的痘痘类型。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的痘痘类型识别模型训练方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011004325.9A CN112183603A (zh) | 2020-09-22 | 2020-09-22 | 痘痘类型识别模型训练方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011004325.9A CN112183603A (zh) | 2020-09-22 | 2020-09-22 | 痘痘类型识别模型训练方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112183603A true CN112183603A (zh) | 2021-01-05 |
Family
ID=73955761
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011004325.9A Pending CN112183603A (zh) | 2020-09-22 | 2020-09-22 | 痘痘类型识别模型训练方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112183603A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117274266A (zh) * | 2023-11-22 | 2023-12-22 | 深圳市宗匠科技有限公司 | 痘痘严重程度的分级方法、装置、设备及存储介质 |
CN117893840A (zh) * | 2024-03-15 | 2024-04-16 | 深圳市宗匠科技有限公司 | 一种痘痘严重程度分级方法、装置、电子设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104794489A (zh) * | 2015-04-23 | 2015-07-22 | 苏州大学 | 一种基于深度标签预测的诱导式图像分类方法及系统 |
CN107679509A (zh) * | 2017-10-19 | 2018-02-09 | 广东工业大学 | 一种小环藻识别方法及装置 |
US20180225552A1 (en) * | 2015-04-02 | 2018-08-09 | Tencent Technology (Shenzhen) Company Limited | Training method and apparatus for convolutional neural network model |
CN109359517A (zh) * | 2018-08-31 | 2019-02-19 | 深圳市商汤科技有限公司 | 图像识别方法和装置、电子设备、存储介质、程序产品 |
WO2019095118A1 (zh) * | 2017-11-14 | 2019-05-23 | 深圳和而泰智能控制股份有限公司 | 一种皮肤瑕疵点分类方法及电子设备 |
CN110163301A (zh) * | 2019-05-31 | 2019-08-23 | 北京金山云网络技术有限公司 | 一种图像的分类方法及装置 |
CN111353542A (zh) * | 2020-03-03 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法、装置、计算机设备和存储介质 |
CN111429416A (zh) * | 2020-03-19 | 2020-07-17 | 深圳数联天下智能科技有限公司 | 一种人脸色素斑识别方法、装置及电子设备 |
CN111652315A (zh) * | 2020-06-04 | 2020-09-11 | 广州虎牙科技有限公司 | 模型训练、对象分类方法和装置、电子设备及存储介质 |
-
2020
- 2020-09-22 CN CN202011004325.9A patent/CN112183603A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180225552A1 (en) * | 2015-04-02 | 2018-08-09 | Tencent Technology (Shenzhen) Company Limited | Training method and apparatus for convolutional neural network model |
CN104794489A (zh) * | 2015-04-23 | 2015-07-22 | 苏州大学 | 一种基于深度标签预测的诱导式图像分类方法及系统 |
CN107679509A (zh) * | 2017-10-19 | 2018-02-09 | 广东工业大学 | 一种小环藻识别方法及装置 |
WO2019095118A1 (zh) * | 2017-11-14 | 2019-05-23 | 深圳和而泰智能控制股份有限公司 | 一种皮肤瑕疵点分类方法及电子设备 |
CN109359517A (zh) * | 2018-08-31 | 2019-02-19 | 深圳市商汤科技有限公司 | 图像识别方法和装置、电子设备、存储介质、程序产品 |
CN110163301A (zh) * | 2019-05-31 | 2019-08-23 | 北京金山云网络技术有限公司 | 一种图像的分类方法及装置 |
CN111353542A (zh) * | 2020-03-03 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 图像分类模型的训练方法、装置、计算机设备和存储介质 |
CN111429416A (zh) * | 2020-03-19 | 2020-07-17 | 深圳数联天下智能科技有限公司 | 一种人脸色素斑识别方法、装置及电子设备 |
CN111652315A (zh) * | 2020-06-04 | 2020-09-11 | 广州虎牙科技有限公司 | 模型训练、对象分类方法和装置、电子设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117274266A (zh) * | 2023-11-22 | 2023-12-22 | 深圳市宗匠科技有限公司 | 痘痘严重程度的分级方法、装置、设备及存储介质 |
CN117274266B (zh) * | 2023-11-22 | 2024-03-12 | 深圳市宗匠科技有限公司 | 痘痘严重程度的分级方法、装置、设备及存储介质 |
CN117893840A (zh) * | 2024-03-15 | 2024-04-16 | 深圳市宗匠科技有限公司 | 一种痘痘严重程度分级方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280477B (zh) | 用于聚类图像的方法和装置 | |
CN108416324B (zh) | 用于检测活体的方法和装置 | |
CN108960090B (zh) | 视频图像处理方法及装置、计算机可读介质和电子设备 | |
CN111860573A (zh) | 模型训练方法、图像类别检测方法、装置和电子设备 | |
CN107679466B (zh) | 信息输出方法和装置 | |
CN110660484B (zh) | 骨龄预测方法、装置、介质及电子设备 | |
CN112949704B (zh) | 一种基于图像分析的烟叶成熟度状态识别方法及装置 | |
CN112784778B (zh) | 生成模型并识别年龄和性别的方法、装置、设备和介质 | |
CN112766279B (zh) | 一种基于联合注意力机制的图像特征提取方法 | |
CN108564102A (zh) | 图像聚类结果评价方法和装置 | |
CN111126481A (zh) | 一种神经网络模型的训练方法及装置 | |
CN110705489B (zh) | 目标识别网络的训练方法、装置、计算机设备和存储介质 | |
CN111340213B (zh) | 神经网络的训练方法、电子设备、存储介质 | |
CN112287957A (zh) | 目标匹配方法与装置 | |
CN112183603A (zh) | 痘痘类型识别模型训练方法及相关装置 | |
CN107590460A (zh) | 人脸分类方法、装置及智能终端 | |
CN112052730A (zh) | 一种3d动态人像识别监控设备及方法 | |
CN114255381A (zh) | 图像识别模型的训练方法、图像识别方法、装置及介质 | |
CN112200222A (zh) | 模型训练设备 | |
CN113763315A (zh) | 玻片图像的信息获取方法、装置、设备及介质 | |
CN117197479A (zh) | 一种应用玉米果穗外表面的图像分析方法、装置、计算机设备及存储介质 | |
CN110633630B (zh) | 一种行为识别方法、装置及终端设备 | |
CN112101109A (zh) | 人脸关键点检测模型训练方法、装置、电子设备和介质 | |
CN111798376A (zh) | 图像识别方法、装置、电子设备及存储介质 | |
CN115761360A (zh) | 一种肿瘤基因突变分类方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |