CN111126175A - 一种基于深度卷积神经网络的面部图像识别算法 - Google Patents
一种基于深度卷积神经网络的面部图像识别算法 Download PDFInfo
- Publication number
- CN111126175A CN111126175A CN201911231906.3A CN201911231906A CN111126175A CN 111126175 A CN111126175 A CN 111126175A CN 201911231906 A CN201911231906 A CN 201911231906A CN 111126175 A CN111126175 A CN 111126175A
- Authority
- CN
- China
- Prior art keywords
- image
- neural network
- probability
- malignant
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 15
- 230000001815 facial effect Effects 0.000 title claims abstract description 14
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 11
- 238000000034 method Methods 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims abstract description 27
- 230000003211 malignant effect Effects 0.000 claims abstract description 18
- 238000012549 training Methods 0.000 claims abstract description 18
- 230000004927 fusion Effects 0.000 claims abstract description 11
- 238000013528 artificial neural network Methods 0.000 claims abstract description 7
- 238000012545 processing Methods 0.000 claims abstract description 5
- 230000000877 morphologic effect Effects 0.000 claims abstract description 4
- 230000008447 perception Effects 0.000 claims abstract description 3
- 230000036541 health Effects 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 238000007477 logistic regression Methods 0.000 claims description 5
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 230000006872 improvement Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000007635 classification algorithm Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 235000015872 dietary supplement Nutrition 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
一种基于深度卷积神经网络的面部图像识别算法,采用阈值法和形态学法对面部图像进行预切割处理;采用全卷积神经网络结合多示例学习方法构建基础系统结构,将多语义上下文特征融合与空洞残差操作块结合,嵌入基础系统结构中,保留系统对图像空间信息的感知,同时实现面部图像分类和怀疑区域定位;模型训练阶段的损失函数分为两方面,其一是利用图像级标签计算图像的良恶性二分类交叉熵损失,其二是利用少量定位框标签计算示例的良恶性二分类交叉熵损失,两者进行加权和,得到总损失函数,用于训练模型参数。对输入的面部图像进行预切割处理后,输入系统模型中得到示例概率回归图和图像概率回归值,得出该输入面部图像的分类和判定区域结果。
Description
技术领域
本发明涉及图像处理算法领域,尤其是一种融合图像级标签和少量定位框标签的基于深度卷积神经网络的人脸面部图像的特征或异常分类和对应的身体健康状况的算法。
背景技术
随着移动通讯的不断发展和人们生活水平的不断提高,各种移动终端如手机的使用越来越普及,手机已经成为人们生活中不可缺少的通信工具。现有技术的手机功能越来越多,但是基本都不具有:通过面部拍照识别身体健康状况的功能。而现在人类生活工作压力越来越大,随之带来的身体上的小毛病,小问题等也越来越多。但是这些潜在的小疾病很少被大家关注或很少会因为一点小问题就去医院。实际上,很多疾病在初期是会在人体上有很多外在表现的,如果我们及时关注身体传递给我们的这些告警信息,及时调理或治疗,是很容易将很多疾病扼杀在萌芽状态。让我们的身体更加健康。
传统人体体质健康分类器采用了k近邻、逻辑斯特回归、支持向量机、决策树以及朴素贝叶斯等分类算法,针对人工设计特征进行癌症分类。随后出现了基于深度学习的分类算法,在目前的人脸面部图像人脸图像的特征或异常分类和对应的身体健康状况检测识别任务中,深度卷积神经网络甚至表现出超越人类的性能。然而,在已有的方法中,都需要有大量的定位框或分割标签来训练模型,但这些标注数据需要有丰富的专家领域经验才能获得,成本代价很高。所以只需要利用图像级的分类标注和少量的定位、分割标注就能实现人脸分类和定位具有十分重大的意义。
发明内容
本发明目的在于提供一种融合图像级标签和少量定位框标签的基于深度卷积神经网络的面部图像识别算法。
为实现上述目的,采用了以下技术方案:本发明所述方法包括以下步骤:
S1,采用阈值法和形态学法对面部图像进行预切割处理,剔除水印信息和大量无信息的黑色区域,放大怀疑区域的占图比例,识别出人脸各部分的细化特征;
S2,采用全卷积神经网络结合多示例学习方法构建基础系统结构,将多语义上下文特征融合与空洞残差操作块结合,嵌入基础系统结构中,在保证系统对图像语义信息有效提取的前提下,保留系统对图像空间信息的感知,同时实现面部图像分类和怀疑区域定位;从而同时实现人脸细化特征对应的身体健康状况信息,并提供对应的食补方案或健康建议;
S3,模型训练阶段的损失函数分为两方面,其一是利用图像级标签计算图像的良恶性二分类交叉熵损失;其二是利用少量定位框标签计算示例的良恶性二分类交叉熵损失,两者进行加权和,得到总损失函数;
S4,利用S2中构建的系统和S3设计的总损失函数,以S1获得的人脸图像为输入,利用反向传导过程训练S2构建系统的模型参数;
S5,对输入的人脸图像进行S1的预切割处理后,输入训练得到的系统模型中,得到示例概率回归图和图像概率回归值,得出该输入人脸面部图像的分类和判定区域结果。
进一步的,在S2中,全卷积神经网络结合多示例学习方法构建的基础系统结构抛弃了传统分类网络最后的全连接层,采用全卷积神经网络进行图像特征提取,获得通道维度为C,空间维度为W×h的语义特征图;再经过个3x3的C维卷积核,得到个W×h的语义特征图,经过ReLU激活函数进行非线性激活,再经过1个1x1的维卷积核,得到1个W×h的语义特征图;接着经过逐示例的逻辑斯特回归,得到1个W×h的概率回归图;逐示例的逻辑斯特回归公式如下所示:
其中,n代表第n张输入图片,ij代表第i列第j行,代表第n张输入图片的语义特征图在第i列第j行的概率回归值;经过逻辑斯特回归后每个示例的值被回归至[0,1],代表各示例点为人脸细化特征对应的身体健康状况信息的概率,将概率回归图每个示例点按照空间位置对应关系还原至对应的原始图像块,概率值大于0.5的图像块即模型判定的异常区域,实现人脸细化特征对应的身体健康状况定位;
对概率回归图进行最大值滤波,得到全图的人脸细化特征对应的身体健康状况分类概率结果,实现图像的特征或异常分类;最大值滤波公式如下所示:
其中pn代表第n张输入图片的特征或异常概率值;
为获得高语义特征和高空间信息,本算法在基础系统结构上,引入了多语义上下文特征融合与空洞残差模块。空洞残差模块通过在模型的第四个基础残差块中引入空洞卷积操作,将基础残差块的移窗步长设置为1,除第一个卷积层外,设置剩余的卷积层为空洞为1的空洞卷积;多语义上下文特征融合将原始图像经过四个残差块获得的四个多维特征,通过多维特征映射到语义特征得到4个包含不同语义信息的上下文特征,其中不同尺寸的上下文特征通过最大值滤波统一尺寸,最后经过逐像素点相加得到融合语义特征图。
多语义上下文特征融合与空洞残差模块相结合,在增加输出特征空间分辨率的同时,保留了神经元的原始感受野,将空间信息和语义信息进行有效结合,使得模型同时具有良好的空间细节信息保留能力和高维语义理解能力,从而同时实现人脸图像的特征或异常分类和对应的身体健康状况。
进一步的,在S3中,损失函数分为两方面,其一利用图像级标签计算图像的良恶性二分类交叉熵损失,公式如下所示:
其中yn代表第n张图片的图像级分类标签,yn∈(0,1),当yn=0时,表示良性,当yn=1时,表示恶性;
进一步的,在S3中,损失函数分为两方面,其二利用少量定位框标签计算示例的正常异常性二分类交叉熵损失,公式如下所示:
最终总损失函数为上述两者的加权和,公式如下所示:
其中,an=1表示第n个样本带有定位标注,反之则αn=0;β是平衡因子,β∈[0,1];
通过反向传导过程实现模型参数训练,迭代更新直至损失值足够小时,认为模型收敛,停止训练。
与现有技术相比,本发明具有如下优点:
1、将预分割处理后的人脸图像输入系统,利用图像级标签和少量定位框标签训练得到相应的参数,得到一个可用于人脸细化特征对应的身体健康状况信息,并提供对应的食补方案或健康建议。
2、通过结合多语义上下文特征融合和空洞残差操作,保留了模型的空间细节信息和语义理解信息,通过结合基于图像的分类损失函数和基于示例的分类损失函数,同时引入图像级标签和少量定位框标签来训练模型参数,克服了先前仅利用图像级标签的方法异常区域定位效果差的问题,同时在模型训练迭代过程中不需要大量定位框标签,从而降低了数据获取成本,加速模型更新速度。
附图说明
图1是本发明中融合图像级标签和少量定位框标签的基于深度卷积神经网络的人脸细化特征对应的身体健康状况信息定位系统的模型框架图。
图2是本发明基于示例的分类损失函数使用的定位标注图。
图3是六种方法在不同IOR阈值条件下的定位准确率变化趋势以及对比图。
图4是不使用带定位标注样本、加入10张带定位标注样本和加入20张带定位标注样本参与训练情况下,本发明的算法在IOR为0.1、0.2和0.3条件下的定位准确率变化趋势图。
具体实施方式
下面结合附图对本发明做进一步说明:
本发明算法结合图1,包括以下步骤:
步骤1:采用阈值法和形态学法对人脸图像进行预切割处理,剔除水印信息和大量无信息的黑色区域,放大人脸异常区域的占图比例。
由于人脸图像成像特性,图像除了异常部分外还有很大的黑色区域,其中带有成像信息,这部分区域是无用的,预处理过程将采用形态学法和阈值法剔除掉这部分,保证异常区域部分充盈整副图像。在训练阶段,模型需统一图像尺度大小,本发明在训练时统一图像尺度为672x448。
步骤2:搭建整体网络系统结构,输入预分割处理后的人脸图像进行模型参数训练。
网络主体是四级卷积残差模块,其中最后一级卷积残差模块为空洞残差模块,每级卷积残差模块输出不同语义不同尺度的多维特征,前三级输出的特征空间大小是逐级递减的,前级为后级的四倍,最后一级特征大小与第三级相同。
将获得的四份不同语义不同尺度的多维特征通过多维特征映射到语义特征,得到四个包含不同语义信息的上下文特征,不同尺度的上下文特征通过最大值滤波操作统一尺寸,最后经过逐像素点相加输出融合语义特征。
融合语义特征经过逐示例逻辑斯特回归输出概率回归图,对概率回归图进行最大值滤波获得图像的分类概率回归值。
针对概率回归图,采用基于示例的分类损失函数,公式如下所示:
图2示出了该损失函数使用的标签样例。
针对概率回归值,采用基于图像的分类损失函数,公式如下所示:
最后将两个损失函数加权求和得到总损失函数,公式如下所示:
其中αn=1表示第n个样本带有定位标注,反之则αn=0。β是可选损失的平衡因子,β∈[0,1]。
利用总损失函数的反向传导实现模型参数更新,直至损失值降至足够小时,认为网络收敛,停止训练。
步骤3:输入人脸图像进行正常异常分类。
首先对输入测试图像进行步骤1的预分割处理,由于系统是全卷积神经网络,测试时不需要固定输入尺度,本发明在测试时将输入图像大小按照如下公式进行变换:
所得测试图像的长和宽均为16的倍数。再将变换大小后的图像输入训练好的模型中获得概率回归图和概率回归值。将概率回归图上的每个示例点的概率值对应回原图上的图像块,概率值大于0.5的为肿瘤,小于0.5的为正常,从而获得肿瘤的定位输出;概率回归值大小代表输入测试图像的良恶性概率,概率值大于0.5表示图像预测为恶性,小于0.5表示图像预测为良性。
图3显示了六种方法在不同IOR阈值条件下的定位准确率变化趋势以及对比。如图所示,当IOR阈值增大时,所有方法的定位准确率都降低了。
当T(IOR)=0.1时,包括最基础的‘FC’方法都能达到较高的定位准确率,当T(IOR)升高时,有些方法准确率开始急剧下降,可以看出,‘MIL+MS’和‘MIL+Dilated’的下降趋势比‘MIL’和‘FC’更加平缓,说明引入多语义上下文特征融合和空洞残差模块带来了定位性能的提升。‘MIL+ODL’变化曲线反映出引入少量带定位标注样本参与训练也可以很大程度提高定位准确率。
图4显示了不使用带定位标注样本、加入10张带定位标注样本和加入20张带定位标注样本参与训练情况下,本发明的算法在IOR阈值为0.1、0.2和0.3条件下的定位准确率变化趋势。可以看出,仅加入10张带定位标注的样本就可以将定位准确率提高将近10%,在T(IOR)越大的情况下,提升的越明显。但在加入20张带定位标注样本后,定位准确率变化变缓,说明再多加入定位标注样本已经无法带来更大的性能提升。
以上所述的实施例仅仅是对本发明的优选实施方式进行描述,并非对本发明的范围进行限定,在不脱离本发明设计精神的前提下,本领域普通技术人员对本发明的技术方案做出的各种变形和改进,均应落入本发明权利要求书确定的保护范围内。
Claims (4)
1.一种基于深度卷积神经网络的面部图像识别算法,其特征在于,所述方法包括以下步骤:
S1,采用阈值法和形态学法对面部图像进行预切割处理,剔除水印信息和大量无信息的黑色区域,放大怀疑区域的占图比例,识别出人脸各部分的细化特征;
S2,采用全卷积神经网络结合多示例学习方法构建基础系统结构,将多语义上下文特征融合与空洞残差操作块结合,嵌入基础系统结构中,在保证系统对图像语义信息有效提取的前提下,保留系统对图像空间信息的感知,同时实现面部图像分类和怀疑区域定位;
S3,模型训练阶段的损失函数分为两方面,其一是利用图像级标签计算图像的良恶性二分类交叉熵损失;其二是利用少量定位框标签计算示例的良恶性二分类交叉熵损失,两者进行加权和,得到总损失函数;
S4,利用S2中构建的系统和S3设计的总损失函数,以S1获得的人脸图像为输入,利用反向传导过程训练S2构建系统的模型参数;
S5,对输入的人脸图像进行S1的预切割处理后,输入训练得到的系统模型中,得到示例概率回归图和图像概率回归值,得出该输入人脸面部图像的分类和判定区域结果。
2.根据权利要求1所述的一种基于深度卷积神经网络的面部图像识别算法,其特征在于:在S2中,采用全卷积神经网络进行图像特征提取,获得通道维度为C,空间维度为W×h的语义特征图;再经过个3x3的C维卷积核,得到个W×h的语义特征图,经过ReLU激活函数进行非线性激活,再经过1个1x1的维卷积核,得到1个W×h的语义特征图;接着经过逐示例的逻辑斯特回归,得到1个W×h的概率回归图;逐示例的逻辑斯特回归公式如下所示:
其中,n代表第n张输入图片,ij代表第i列第j行,代表第n张输入图片的语义特征图在第i列第j行的概率回归值;经过逻辑斯特回归后每个示例的值被回归至[0,1],代表各示例点为人脸细化特征对应的身体健康状况信息的概率,将概率回归图每个示例点按照空间位置对应关系还原至对应的原始图像块,概率值大于0.5的图像块即模型判定的异常区域,实现人脸细化特征对应的身体健康状况定位;
对概率回归图进行最大值滤波,得到全图的人脸细化特征对应的身体健康状况分类概率结果,实现图像的特征或异常分类;最大值滤波公式如下所示:
其中pn代表第n张输入图片的特征或异常概率值;
空洞残差模块通过在模型的第四个基础残差块中引入空洞卷积操作,将基础残差块的移窗步长设置为1,除第一个卷积层外,设置剩余的卷积层为空洞为1的空洞卷积;多语义上下文特征融合将原始图像经过四个残差块获得的四个多维特征,通过多维特征映射到语义特征得到4个包含不同语义信息的上下文特征,其中不同尺寸的上下文特征通过最大值滤波统一尺寸,最后经过逐像素点相加得到融合语义特征图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911231906.3A CN111126175A (zh) | 2019-12-05 | 2019-12-05 | 一种基于深度卷积神经网络的面部图像识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911231906.3A CN111126175A (zh) | 2019-12-05 | 2019-12-05 | 一种基于深度卷积神经网络的面部图像识别算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111126175A true CN111126175A (zh) | 2020-05-08 |
Family
ID=70497481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911231906.3A Pending CN111126175A (zh) | 2019-12-05 | 2019-12-05 | 一种基于深度卷积神经网络的面部图像识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111126175A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783475A (zh) * | 2020-07-28 | 2020-10-16 | 北京深睿博联科技有限责任公司 | 一种基于短语关系传播的语义视觉定位方法及装置 |
CN112233776A (zh) * | 2020-11-09 | 2021-01-15 | 江苏科技大学 | 基于视觉渐近式空洞网络的皮肤病自学习辅助判定系统 |
CN113343770A (zh) * | 2021-05-12 | 2021-09-03 | 武汉大学 | 一种基于特征筛选的人脸防伪方法 |
CN113537026A (zh) * | 2021-07-09 | 2021-10-22 | 上海智臻智能网络科技股份有限公司 | 建筑平面图中的图元检测方法、装置、设备及介质 |
CN113723474A (zh) * | 2021-08-12 | 2021-11-30 | 浙江云澎科技有限公司 | 一种跨通道聚合相似性网络系统 |
CN114646563A (zh) * | 2022-05-23 | 2022-06-21 | 河南银金达新材料股份有限公司 | 一种具有金属涂层的聚酯膜表面耐磨度检测方法 |
CN117235665A (zh) * | 2023-09-18 | 2023-12-15 | 北京大学 | 自适应隐私数据合成方法、装置、计算机设备和存储介质 |
CN117611753A (zh) * | 2024-01-23 | 2024-02-27 | 吉林大学 | 基于人工智能重建技术的面部整形修复辅助系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680678A (zh) * | 2017-10-18 | 2018-02-09 | 北京航空航天大学 | 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统 |
CN107886514A (zh) * | 2017-11-22 | 2018-04-06 | 浙江中医药大学 | 基于深度残差网络的乳腺钼靶图像肿块语义分割方法 |
US20180204111A1 (en) * | 2013-02-28 | 2018-07-19 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
CN108898175A (zh) * | 2018-06-26 | 2018-11-27 | 北京工业大学 | 基于深度学习胃癌病理切片的计算机辅助模型构建方法 |
CN108985269A (zh) * | 2018-08-16 | 2018-12-11 | 东南大学 | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 |
CN109658412A (zh) * | 2018-11-30 | 2019-04-19 | 湖南视比特机器人有限公司 | 一种面向拆垛分拣的包装箱快速识别分割方法 |
CN110363134A (zh) * | 2019-07-10 | 2019-10-22 | 电子科技大学 | 一种基于语义分割的人脸遮挡区定位方法 |
-
2019
- 2019-12-05 CN CN201911231906.3A patent/CN111126175A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180204111A1 (en) * | 2013-02-28 | 2018-07-19 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
CN107680678A (zh) * | 2017-10-18 | 2018-02-09 | 北京航空航天大学 | 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统 |
CN107886514A (zh) * | 2017-11-22 | 2018-04-06 | 浙江中医药大学 | 基于深度残差网络的乳腺钼靶图像肿块语义分割方法 |
CN108898175A (zh) * | 2018-06-26 | 2018-11-27 | 北京工业大学 | 基于深度学习胃癌病理切片的计算机辅助模型构建方法 |
CN108985269A (zh) * | 2018-08-16 | 2018-12-11 | 东南大学 | 基于卷积和空洞卷积结构的融合网络驾驶环境感知模型 |
CN109658412A (zh) * | 2018-11-30 | 2019-04-19 | 湖南视比特机器人有限公司 | 一种面向拆垛分拣的包装箱快速识别分割方法 |
CN110363134A (zh) * | 2019-07-10 | 2019-10-22 | 电子科技大学 | 一种基于语义分割的人脸遮挡区定位方法 |
Non-Patent Citations (4)
Title |
---|
WENTAO ZHU ET AL.: "Deep Multi-instance Networks with Sparse Label Assignment for Whole Mammogram Classification" * |
景晨凯;宋涛;庄雷;刘刚;王乐;刘凯伦;: "基于深度卷积神经网络的人脸识别技术综述" * |
蔡雨;黄学功;张志安;朱新年;马祥;: "基于特征融合的实时语义分割算法" * |
陈珊: "基于钳靴图像的乳腺肿瘤诊断若干关键性技术研究" * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783475A (zh) * | 2020-07-28 | 2020-10-16 | 北京深睿博联科技有限责任公司 | 一种基于短语关系传播的语义视觉定位方法及装置 |
CN111783475B (zh) * | 2020-07-28 | 2021-05-11 | 北京深睿博联科技有限责任公司 | 一种基于短语关系传播的语义视觉定位方法及装置 |
CN112233776A (zh) * | 2020-11-09 | 2021-01-15 | 江苏科技大学 | 基于视觉渐近式空洞网络的皮肤病自学习辅助判定系统 |
CN113343770A (zh) * | 2021-05-12 | 2021-09-03 | 武汉大学 | 一种基于特征筛选的人脸防伪方法 |
CN113343770B (zh) * | 2021-05-12 | 2022-04-29 | 武汉大学 | 一种基于特征筛选的人脸防伪方法 |
CN113537026A (zh) * | 2021-07-09 | 2021-10-22 | 上海智臻智能网络科技股份有限公司 | 建筑平面图中的图元检测方法、装置、设备及介质 |
CN113723474A (zh) * | 2021-08-12 | 2021-11-30 | 浙江云澎科技有限公司 | 一种跨通道聚合相似性网络系统 |
CN114646563A (zh) * | 2022-05-23 | 2022-06-21 | 河南银金达新材料股份有限公司 | 一种具有金属涂层的聚酯膜表面耐磨度检测方法 |
CN117235665A (zh) * | 2023-09-18 | 2023-12-15 | 北京大学 | 自适应隐私数据合成方法、装置、计算机设备和存储介质 |
CN117611753A (zh) * | 2024-01-23 | 2024-02-27 | 吉林大学 | 基于人工智能重建技术的面部整形修复辅助系统及方法 |
CN117611753B (zh) * | 2024-01-23 | 2024-03-22 | 吉林大学 | 基于人工智能重建技术的面部整形修复辅助系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111126175A (zh) | 一种基于深度卷积神经网络的面部图像识别算法 | |
Yu et al. | Deep-learning-empowered breast cancer auxiliary diagnosis for 5GB remote E-health | |
CN109886986B (zh) | 一种基于多分支卷积神经网络的皮肤镜图像分割方法 | |
WO2022000426A1 (zh) | 基于孪生深度神经网络的动目标分割方法及系统 | |
JP7026826B2 (ja) | 画像処理方法、電子機器および記憶媒体 | |
CN111738244B (zh) | 图像检测方法、装置、计算机设备和存储介质 | |
CN111369565B (zh) | 一种基于图卷积网络的数字病理图像的分割与分类方法 | |
TW202014984A (zh) | 一種圖像處理方法、電子設備及存儲介質 | |
CN110766670A (zh) | 一种基于深度卷积神经网络的乳腺钼靶图像肿瘤定位算法 | |
CN111368672A (zh) | 一种用于遗传病面部识别模型的构建方法及装置 | |
US20240054760A1 (en) | Image detection method and apparatus | |
CN111611849A (zh) | 一种用于门禁设备的人脸识别系统 | |
CN110837777A (zh) | 基于改进VGG-Net的部分遮挡的人脸表情识别方法 | |
CN113269010B (zh) | 一种人脸活体检测模型的训练方法和相关装置 | |
Rehman | Light microscopic iris classification using ensemble multi‐class support vector machine | |
CN114399465A (zh) | 良恶性溃疡识别方法及系统 | |
CN114140465B (zh) | 基于宫颈细胞切片图像的自适应的学习方法和学习系统 | |
CN114037699B (zh) | 一种病理图像分类方法、设备、系统及存储介质 | |
CN113506274A (zh) | 基于视觉显著性差异图的用于人体认知状况的检测系统 | |
CN115471901B (zh) | 基于生成对抗网络的多姿态人脸正面化方法及系统 | |
CN113139930B (zh) | 甲状腺切片图像分类方法、装置、计算机设备和存储介质 | |
CN115424293A (zh) | 活体检测方法、活体检测模型的训练方法及装置 | |
CN111898473B (zh) | 一种基于深度学习的司机状态实时监测方法 | |
CN114882282A (zh) | 基于mri和ct图像的结直肠癌治疗效果的神经网络预测方法 | |
KR20210129850A (ko) | 조직 병리학 분류를 위한 다중 인스턴스 학습 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20200508 |