CN110210391A - 基于多尺度卷积神经网络的舌象纹理定量分析方法 - Google Patents
基于多尺度卷积神经网络的舌象纹理定量分析方法 Download PDFInfo
- Publication number
- CN110210391A CN110210391A CN201910470107.5A CN201910470107A CN110210391A CN 110210391 A CN110210391 A CN 110210391A CN 201910470107 A CN201910470107 A CN 201910470107A CN 110210391 A CN110210391 A CN 110210391A
- Authority
- CN
- China
- Prior art keywords
- network
- multiple dimensioned
- tongue picture
- neural networks
- tongue
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 35
- 238000004445 quantitative analysis Methods 0.000 title claims abstract description 19
- 238000007373 indentation Methods 0.000 claims abstract description 48
- 238000012549 training Methods 0.000 claims abstract description 44
- 208000037656 Respiratory Sounds Diseases 0.000 claims abstract description 33
- 238000001514 detection method Methods 0.000 claims abstract description 23
- 206010014080 Ecchymosis Diseases 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims abstract description 10
- 238000000605 extraction Methods 0.000 claims abstract description 7
- 238000003062 neural network model Methods 0.000 claims abstract description 7
- 238000001228 spectrum Methods 0.000 claims description 26
- 238000012360 testing method Methods 0.000 claims description 20
- 230000002708 enhancing effect Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 7
- 239000003814 drug Substances 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 5
- 238000013528 artificial neural network Methods 0.000 claims description 3
- 230000019771 cognition Effects 0.000 claims description 3
- 238000005520 cutting process Methods 0.000 claims description 3
- 229940079593 drug Drugs 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000013139 quantization Methods 0.000 abstract description 2
- 238000004458 analytical method Methods 0.000 description 5
- 238000002474 experimental method Methods 0.000 description 5
- 238000007689 inspection Methods 0.000 description 5
- 206010034754 petechiae Diseases 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000036039 immunity Effects 0.000 description 3
- 206010062717 Increased upper airway secretion Diseases 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 208000026435 phlegm Diseases 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 206010011376 Crepitations Diseases 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 210000004218 nerve net Anatomy 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000009987 spinning Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度卷积神经网络的舌象纹理定量分析方法,涉及图像识别处理技术领域。本发明包括如下步骤:步骤S1:构建多尺度卷积神经网络;步骤S2:舌象大数据采集并进行预处理;步骤S3:训练神经网络模型;步骤S4:对舌象进行点刺、瘀斑、齿痕的检测。本发明通过构建多尺度卷积神经网络可一次性检测出舌面图像中点刺、齿痕、裂纹三类不同尺度大小目标,对检测目标提取像素级轮廓区域,并按每种检测目标深浅程度和数量指标对点刺、齿痕、裂纹量化评级,具有专属性强、重复性好、准确度高的优点,能够显著提升检测能力。
Description
技术领域
本发明属于图像识别处理技术领域,特别是涉及一种基于多尺度卷积神经网络的舌象纹理定量分析方法。
背景技术
舌象特征在中医诊断病症等过程中具有较高的应用价值,尤其舌象纹理是中医舌诊中较为重要的信息。但是目前对舌象纹理的分析、判断还停留在人工凭经验处理的水平。这不仅限制了舌象纹理这一有用的人体生理特征在判断人体病症等领域的应用,而且传统的人工分析判断的准确率较低,具有较大的随意性和不确定性。
目前可以以图像处理和人工智能技术对舌面颜色和形态特征的机器识别,是中医舌诊辨体质系统研发的关键技术。诸如舌象中的点刺(含瘀点)、齿痕、裂纹三类舌面形态特征,也是中医9种体质中湿热质、痰湿质、血瘀质的关键评价指标,如果在这三类特征检测基础上进行其位置、数量、深浅程度的量化分析,可以进一步辨证湿热和痰湿个体表现差异,以达到对每个人健康状态分析之目的。
发明内容
本发明的目的在于提供一种基于多尺度卷积神经网络的舌象纹理定量分析方法,通过设计多尺度卷积神经网络以对舌象表面不同尺度检测目标进行像素级空间位置定位,能够一次性识别出点刺、齿痕、裂纹三类舌面形态特征一精确的轮廓边界,解决了现有的中医舌象纹理判断准确率低、医生判别难度大的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于多尺度卷积神经网络的舌象纹理定量分析方法,包括如下步骤:
步骤S1:构建多尺度卷积神经网络;
步骤S2:舌象大数据采集并进行预处理;
步骤S3:训练神经网络模型;
步骤S4:对舌象进行点刺、瘀斑、齿痕的检测;
其中,步骤S1中,构建的多尺度卷积神经网络结构包括多尺度共享卷积模块、目标候选区域搜索模块和目标候选区域的识别模块;所述多尺度共享卷积模块采用与舌象数据集相当的Reset50网络对整张图片的多个尺寸层级上提取抽象度特征,融合低抽象度特征形成多尺度高抽象特征图为后续网络共享使用;所述目标候选区域搜索模块包括生成候选区域框、候选区域框分类与边界回归、精选目标候选区域,最后生成相同尺度候选区域特征图;所述目标候选区域的识别模块用于对候选区域进行目标区域分类、目标区域边框修正和目标区域像素掩码计算,结果映射到原图得到检测目标及其区域像素。
优选地,所述多尺度共享卷积模块特征提取由构建低抽象度特征图谱C和构建高抽象度特征图谱P两个步骤组成;所述构建低抽象度特征图谱C采用ResNet50作为骨干网络,将残差模块的输出作为低抽象度特征图谱集合;所述构建高抽象度特征图谱在低抽象度特征图谱C的高层特征图上进行2倍上采样来得到更高分辨率的图谱,然后将这些上采样之后的特征图与对应的低抽象度特征图谱通过横向连接的方式融合在一起,一直迭代直至最浅的卷积图被合并为止。
优选地,所述步骤S2中,舌象采集大数据库中不同地区、不同年龄、不同人群的舌象抽取包含点刺、齿痕、裂纹、舌中沟的舌象,通过中医专家对舌象进行人工辨识、评审、构建样本数据集,并对样本数据集进行预处理;所述预处理包括数据集舌体提取、进行特征标注、数据增强处理。
优选地,所述样本数据集需使用图像数据标注工具对舌体表面点刺、齿痕、裂纹轮廓边界精确标注,将图像分割成舌体和多个目标区域;所述数据增强处理用于在神经网络进行深度学习之前,先对样本数据进行旋转、缩放、翻转、对比度四中方法组合对样本图像做随机增强处理,获取具有泛型的数据集。
优选地,所述步骤S3中,训练神经网络模型时时将样本数据集分为训练集、验证集和测试集;所述训练集和验证集用于完成网络模型学习和优化调整模型的参数,寻找最优的网络深度;所述测试集用以验证最后选择模型的性能,并使用MSCOCO预训练网络参数进行初始化,对候选区域生成网络并采用交替训练目标区域计算网络。
优选地,所述交替训练目标区域计算网络具体步骤如下:
步骤S31:使用在MSCOCO上预训练的模型初始化网络并训练候选区域生成网络微调训练;
步骤S32:对步骤S31中得到的网络参数生成的候选区域,使用在MSCOCO上预训练的模型初始化网络并训练目标区域计算网络微调训练;
步骤S33:使用步骤S32中微调后的目标区域计算网络重新初始化候选区域生成网络,固定共享卷积层,只微调候选区域生成网络独有的层,形成共享卷积层;
步骤S34:固定步骤S33中共享卷基层,利用步骤S33中得到的后续区域,只微调目标区域计算网络独有的层,形成统一网络。
优选地,所述步骤S4中,对舌象进行点刺、瘀斑、齿痕的检测具体步骤如下:
步骤S41:读取需要检测的图片,通过候选区域生成网络生成约20000个预测框;
步骤S42:对20000个预测框进行第一次边框修正,得到修订边框后的预测框;
步骤S43:对超过图像边界的预测框的边进行裁剪,使得该预测框不超过图像范围;
步骤S44:将所有预测框按照前景分数从高到低排序,选取前1000个预测框;
步骤S45:使用阈值为0.7的NMS算法排除掉重叠的预测框;
步骤S46:针对步骤S45中剩下的预测框,选取前300个得分高的预测框,进行分类和第二次边框修正,对得分最高的100个候选区域进行像素掩码计算。
本发明具有以下有益效果:
(1)本发明通过构建多尺度卷积神经网络可一次性检测出舌面图像中点刺、齿痕、裂纹三类不同尺度大小目标,对检测目标提取像素级轮廓区域,并按每种检测目标深浅程度和数量指标对点刺、齿痕、裂纹量化评级,具有专属性强、重复性好、准确度高的优点,能够显著提升检测能力;
(2)本发明通过在构建多尺度卷积神经网络过程中,使用多尺度低抽象度的特征图融合形成多尺度高抽象度特征图谱,两次融合后的特征图谱在面对不同尺寸的检测目标时,具有更好的鲁棒性,尤其是不会漏检中小型目标,提高了目标类别识别能力;
(3)本发明通过在构建多尺度卷积神经网络过程中,在多尺度特征图谱映射到相同大小特征图时,使用改进的局部区域平均法池化算法,相对于RoIPooling、RoIAlign池化算法降低了特征图的候选区域与原图候选区域间的空间像素偏差,增强了目标区域像素识别能力。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种基于多尺度卷积神经网络的舌象纹理定量分析方法的神经网络结构和流程图;
图2为本发明的舌象特征目标对象的标注系统显示界面;
图3为多尺度卷积神经网络在不同参数下损失变化实验分析结果;
图4为实施例一中点刺及瘀斑瘀点类特征检测结果实例图;
图5为实施例二中齿痕类特征检测结果实例图;
图6为实施例三中裂纹类特征检测结果实例图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于多尺度卷积神经网络的舌象纹理定量分析方法,包括如下步骤:
步骤S1:构建多尺度卷积神经网络;
步骤S2:舌象大数据采集并进行预处理;
步骤S3:训练神经网络模型;
步骤S4:对舌象进行点刺、瘀斑、齿痕的检测;
其中,步骤S1中,构建的多尺度卷积神经网络结构包括多尺度共享卷积模块、目标候选区域搜索模块和目标候选区域的识别模块三大;第一部分为多尺度共享卷积模块采用与舌象数据集相当的Reset50网络对整张图片的多个尺寸层级上提取抽象度特征,融合低抽象度特征形成多尺度高抽象特征图为后续网络共享使用;第二部分为目标候选区域搜索模块包括生成候选区域框、候选区域框分类与边界回归、精选目标候选区域,最后生成相同尺度候选区域特征图;第三部分为目标候选区域的识别模块用于对候选区域进行目标区域分类、目标区域边框修正和目标区域像素掩码计算,结果映射到原图得到检测目标及其区域像素。
其中,目标区域分类为每个候选生成分类训练标签,分类的标签为0负样本(没有覆盖到目标)、k个正样本(目标类别k=9,分别为点、刺、瘀点、轻度齿痕、较深齿痕、凹陷齿痕、浅裂纹、深裂纹、舌中沟)。标签赋值策略:舌象训练集中对每张图像人工标注的点刺、齿痕、裂纹的真实框,按预测框与真实框重叠比例IOU大小标记标签;目标区域边框修正对分类得分高的目标区域边框位置回归,预估修正后的框在预测框的上的水平和长宽缩放偏移量(ti={tx,ty,tw,th});目标区域掩码计算选择k个目标类别得分排名高前N个目标区域进行掩码计算,链接到全卷积网络生成每个目标类别的区域二值掩码,以求得每个目标对应的像素掩码,即k个类别的m×m的二值掩码;目标指标计算按点刺数量计算点刺指标(无点刺、少量点刺、较多点刺),按齿痕的分类、数量计算齿痕指标(无齿痕、轻度齿痕、中度齿痕、重度齿痕),按裂纹的分类、数量计算裂纹指标(无裂纹、轻度裂纹、中度裂纹、重度裂纹)。
其中,多尺度共享卷积模块特征提取由构建低抽象度特征图谱C和构建高抽象度特征图谱P两个步骤组成;构建低抽象度特征图谱C采用ResNet50作为骨干网络,将残差模块conv2,conv3,conv4,conv5的输出作为低抽象度特征图谱集合,表示为C{C2,C3,C4,C5},特征尺度为200×200、100×100、50×50、25×25,相对于输入图像具有{4,8,16,32}像素的步长;构建高抽象度特征图谱在低抽象度特征图谱C的高层特征图上进行2倍上采样来得到更高分辨率的图谱,然后将这些上采样之后的特征图与对应的低抽象度特征图谱通过横向连接的方式融合在一起,合并前自下而上的图谱会将经过1×1卷积降低通道数,一直迭代直至最浅的卷积图被合并为止;最后,使用3×3的卷积在所有合并后的特征图谱上进行卷积操作,消除上采样的混叠效应,得到最终的特征图谱P{P2,P3,P4,P5};这种多尺度的高抽象度特征图在面对不同尺寸的检测目标时,具有更好的鲁棒性,尤其是不会漏检中小型目标。
如图3所示,目标候选区域搜索模块中生成候选区域框是在高抽象度特征图谱P上滑动窗口,以每个特征点位置映射到原图的感受野中心点为基准点,围绕基准点选取12种不同长宽比与面积的候选框;初始候选框包括了四种面积(4、8、16、32),每种面积包含三种长宽比(1:1、1:2、2:1),预测框约17万;候选区域框分类为每个候选框生成分类训练标签,分类的标签为0负样本(没有覆盖目标)、1正样本(覆盖了目标);标签赋值策略为舌象训练集中对每张图像人工标注的点刺、齿痕、裂纹的真实框,由预测框与真实框重叠比例IOU大小标记标签;使用候选框二分类网络、候选框回归网络对候选框分类和边框预测;其中,候选区域模块损失函数定义如下表1:
表1多尺度卷积神经网络各模块损失函数定义
精选目标候选区域将分类的标签是1的候选框的分类得分以及边框回归预估转换为目标候选,对候选区域进行精选;精选候选区域策略:对超过图像边界的候选区域的边进行剪裁,使得目标候选区域不超过图像范围;将所有候选区域按照正区域分数从高到低排序,选取前12000个候选区域,非极大值抑制剔除重叠的候选区域,选取前3000个作为目标候选区域。提取目标候选区域特征为每个候选区域按其尺寸(w,h)从高抽象度特征图谱P对应的特征图中取出坐标区域,按候选区域尺寸大小计算特征图最佳图层f为:
分别为候选区域的宽和高。
使用改进的局部区域平均法池化算法将目标候选区域池化成7×7、14×14大小的候选区域特征图;各个改进的局部区域平均法池化算法如下表2所示:
表2改进的局部区域平均法池化算法
其中,步骤S2中,舌象采集大数据库中不同地区、不同年龄、不同人群的舌象抽取包含点刺、齿痕、裂纹、舌中沟的舌象,通过中医专家对舌象进行人工辨识、评审、构建样本数据集;因此构建的数据集样本共计有两万张,包含了人舌的随机图像,样本拍摄设备也图样覆盖各种品牌和像素分辨率的相机、手机,拍照条件有不同自然光照条件照或灯光照、多种伸舌姿势、不同拍照背景,并对样本数据集进行预处理;预处理包括数据集舌体提取、进行特征标注、数据增强处理。
其中,标注系统的操作界面如图2所示,样本数据集需使用mx_labelImg图像数据标注工具对舌体表面点刺、齿痕、裂纹轮廓边界精确标注,将图像分割成舌体和多个目标区域;
下表3展示了舌面标签的定义表:
表3舌面点刺齿痕裂纹标签定义
下表4为定义标注数据结构表:
表4标注数据结构定义
其中,数据增强处理用于在神经网络进行深度学习之前,先对样本数据进行旋转(±90°内随机角度)、缩放(80%~120%内随机倍数)、翻转(上下翻转、水平镜面翻转)、对比度(0.5~2内随机倍数)四中方法组合对样本图像做随机增强处理,获取具有泛型的数据集,数据增强后数据集扩大50倍。
其中,步骤S3中,数据集通过,读取舌象数据集和舌象中点刺、齿痕、裂纹的数据标注,对每张图标注的目标生成真实边框和区域像素掩码,以在训练阶段计算损失使用,训练神经网络模型时时将样本数据集按5:3:2分为训练集、验证集和测试集;训练集和验证集用于完成网络模型学习和优化调整模型的参数,寻找最优的网络深度;测试集用以验证最后选择模型的性能,并使用MSCOCO预训练网络参数进行初始化,对候选区域生成网络并采用交替训练目标区域计算网络。
其中,交替训练目标区域计算网络具体步骤如下:
步骤S31:使用在MSCOCO上预训练的模型初始化网络并训练候选区域生成网络(区域建议为目的)微调训练;
步骤S32:对步骤S31中得到的网络参数生成的候选区域,使用在MSCOCO上预训练的模型初始化网络并训练目标区域计算网络(以检测为目的)微调训练;
步骤S33:使用步骤S32中微调后的目标区域计算网络重新初始化候选区域生成网络,固定共享卷积层,只微调候选区域生成网络独有的层,形成共享卷积层;
步骤S34:固定步骤S33中共享卷基层,利用步骤S33中得到的后续区域,只微调目标区域计算网络独有的层,形成统一网络。
其中,步骤S4中,对舌象进行点刺、瘀斑、齿痕的检测具体步骤如下:
步骤S41:读取需要检测的图片,通过候选区域生成网络生成约20000个预测框;
步骤S42:对20000个预测框进行第一次边框修正,得到修订边框后的预测框;
步骤S43:对超过图像边界的预测框的边进行裁剪,使得该预测框不超过图像范围;
步骤S44:将所有预测框按照前景分数从高到低排序,选取前1000个预测框;
步骤S45:使用阈值为0.7的NMS算法排除掉重叠的预测框;
步骤S46:针对步骤S45中剩下的预测框,选取前300个得分高的预测框,进行分类和第二次边框修正,对得分最高的100个候选区域进行像素掩码计算,加快推断效率,提升精度。
本发明针对上述方案进行大量实验进行验证,验证结果如下:
实施例一:针对点刺类小尺度目标检测结果一致性验证
实验效果如图4所示:本发明项通过随机采集的舌象和专家评审,对舌象库抽取5000例点刺类舌象,按点、刺、瘀点瘀斑、无点刺共四类建立测试数据集。利用图像算法、MaskRCNN实例分割网络、多尺度卷积神经网络三种方法进行舌面点刺类特征项检测实验。多尺度卷积神经网络算法的检出率高于80%,检测出点刺与数据标注点刺的轮廓重合约80%以上,出现漏检和误检的情况要明显低于其他算法;舌面点刺类小尺度特征检测结果实例实验结果分析如下表5所示:
表5舌体齿痕定量分析准确率结果
实验结果显示:发明项方法对舌象中舌体的点、刺、瘀点瘀斑三类小尺度目标检测识别能力高,算法抗干扰性强,对识别目标边界轮廓的拟合度更高。
实施例二:针对齿痕类中等尺度目标检测结果一致性验证
实验效果如图5所示,本发明项通过随机采集的舌象和专家评审,对舌象库抽取5000例齿痕和无齿痕舌象,按轻度齿痕、中度齿痕、重度齿痕、无齿痕四类建立测试数据集。利用图像算法、MaskRCNN实例分割网络、多尺度卷积神经网络三种方法进行舌面齿痕特征项检测实验。多尺度卷积神经网络算法的检出率高于85%,检测出齿痕与数据标注齿痕的轮廓重合约80%以上,出现漏检和误检的情况要明显低于其他算法;舌面齿痕类多等尺度特征检测结果实例实验结果分析如下表6所示:
表6舌体齿痕定量分析准确率结果
实验结果显示:发明项方法对舌象中舌体的轻度齿痕、中度齿痕、重度齿痕三类中等尺度目标检测识别能力高,算法抗干扰性强,对识别目标边界轮廓的拟合度更高。
实施例三:针对裂纹类多尺度目标检测结果一致性验证
实验效果如图6所示,本发明项通过随机采集的舌象和专家评审,对舌象库抽取5000例裂纹和无裂纹舌象,按轻度裂纹、中度裂纹、重度裂纹、无裂纹四类建立测试数据集。利用图像算法、MaskRCNN实例分割网络、多尺度卷积神经网络三种方法进行舌面裂纹特征项检测实验。多尺度卷积神经网络算法的检出率高于85%,检测出裂纹与数据标注裂纹的轮廓重合约80%以上,出现漏检和误检的情况要明显低于其他算法;舌面裂纹类多等尺度特征检测结果实例实验结果分析如下表7所示:
表7舌体齿痕定量分析准确率结果
实验结果显示:发明项方法对舌象中舌体的轻度裂纹、中度裂纹、重度裂纹三类尺度目标检测识别能力高,算法抗干扰性强,对识别目标边界轮廓的拟合度更高。
值得注意的是,上述系统实施例中,所包括的各个单元只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,相应的程序可以存储于一计算机可读取存储介质中。
以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
Claims (7)
1.一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,包括如下步骤:
步骤S1:构建多尺度卷积神经网络;
步骤S2:舌象大数据采集并进行预处理;
步骤S3:训练神经网络模型;
步骤S4:对舌象进行点刺、瘀斑、齿痕的检测;
其中,步骤S1中,构建的多尺度卷积神经网络结构包括多尺度共享卷积模块、目标候选区域搜索模块和目标候选区域的识别模块;所述多尺度共享卷积模块采用与舌象数据集相当的Reset50网络对整张图片的多个尺寸层级上提取抽象度特征,融合低抽象度特征形成多尺度高抽象特征图为后续网络共享使用;所述目标候选区域搜索模块包括生成候选区域框、候选区域框分类与边界回归、精选目标候选区域,最后生成相同尺度候选区域特征图;所述目标候选区域的识别模块用于对候选区域进行目标区域分类、目标区域边框修正和目标区域像素掩码计算,结果映射到原图得到检测目标及其区域像素。
2.根据权利要求1所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述多尺度共享卷积模块特征提取由构建低抽象度特征图谱C和构建高抽象度特征图谱P两个步骤组成;所述构建低抽象度特征图谱C采用ResNet50作为骨干网络,将残差模块的输出作为低抽象度特征图谱集合;所述构建高抽象度特征图谱在低抽象度特征图谱C的高层特征图上进行2倍上采样来得到更高分辨率的图谱,然后将这些上采样之后的特征图与对应的低抽象度特征图谱通过横向连接的方式融合在一起,一直迭代直至最浅的卷积图被合并为止。
3.根据权利要求1所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述步骤S2中,舌象采集大数据库中不同地区、不同年龄、不同人群的舌象抽取包含点刺、齿痕、裂纹、舌中沟的舌象,通过中医专家对舌象进行人工辨识、评审、构建样本数据集,并对样本数据集进行预处理;所述预处理包括数据集舌体提取、进行特征标注、数据增强处理。
4.根据权利要求3所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述样本数据集需使用图像数据标注工具对舌体表面点刺、齿痕、裂纹轮廓边界精确标注,将图像分割成舌体和多个目标区域;所述数据增强处理用于在神经网络进行深度学习之前,先对样本数据进行旋转、缩放、翻转、对比度四中方法组合对样本图像做随机增强处理,获取具有泛型的数据集。
5.根据权利要求1所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述步骤S3中,训练神经网络模型时时将样本数据集分为训练集、验证集和测试集;所述训练集和验证集用于完成网络模型学习和优化调整模型的参数,寻找最优的网络深度;所述测试集用以验证最后选择模型的性能,并使用MSCOCO预训练网络参数进行初始化,对候选区域生成网络并采用交替训练目标区域计算网络。
6.根据权利要求5所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述交替训练目标区域计算网络具体步骤如下:
步骤S31:使用在MSCOCO上预训练的模型初始化网络并训练候选区域生成网络微调训练;
步骤S32:对步骤S31中得到的网络参数生成的候选区域,使用在MSCOCO上预训练的模型初始化网络并训练目标区域计算网络微调训练;
步骤S33:使用步骤S32中微调后的目标区域计算网络重新初始化候选区域生成网络,固定共享卷积层,只微调候选区域生成网络独有的层,形成共享卷积层;
步骤S34:固定步骤S33中共享卷基层,利用步骤S33中得到的后续区域,只微调目标区域计算网络独有的层,形成统一网络。
7.根据权利要求1所述的一种基于多尺度卷积神经网络的舌象纹理定量分析方法,其特征在于,所述步骤S4中,对舌象进行点刺、瘀斑、齿痕的检测具体步骤如下:
步骤S41:读取需要检测的图片,通过候选区域生成网络生成约20000个预测框;
步骤S42:对20000个预测框进行第一次边框修正,得到修订边框后的预测框;
步骤S43:对超过图像边界的预测框的边进行裁剪,使得该预测框不超过图像范围;
步骤S44:将所有预测框按照前景分数从高到低排序,选取前1000个预测框;
步骤S45:使用阈值为0.7的NMS算法排除掉重叠的预测框;
步骤S46:针对步骤S45中剩下的预测框,选取前300个得分高的预测框,进行分类和第二次边框修正,对得分最高的100个候选区域进行像素掩码计算。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910470107.5A CN110210391A (zh) | 2019-05-31 | 2019-05-31 | 基于多尺度卷积神经网络的舌象纹理定量分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910470107.5A CN110210391A (zh) | 2019-05-31 | 2019-05-31 | 基于多尺度卷积神经网络的舌象纹理定量分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110210391A true CN110210391A (zh) | 2019-09-06 |
Family
ID=67790045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910470107.5A Pending CN110210391A (zh) | 2019-05-31 | 2019-05-31 | 基于多尺度卷积神经网络的舌象纹理定量分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110210391A (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111091132A (zh) * | 2020-03-19 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像识别方法、装置、计算机设备及介质 |
CN111260608A (zh) * | 2020-01-08 | 2020-06-09 | 来康科技有限责任公司 | 一种基于深度学习的舌部区域检测方法及系统 |
CN111476259A (zh) * | 2019-11-22 | 2020-07-31 | 上海大学 | 一种基于卷积神经网络的齿痕舌识别算法 |
CN111582234A (zh) * | 2020-05-22 | 2020-08-25 | 莫登奎 | 基于uav和深度学习的大范围油茶林果智能检测与计数方法 |
CN111599444A (zh) * | 2020-05-18 | 2020-08-28 | 深圳市悦动天下科技有限公司 | 智能舌诊检测方法、装置、智能终端和存储介质 |
CN111626986A (zh) * | 2020-04-29 | 2020-09-04 | 云南大学 | 一种基于深度学习的三维超声腹壁疝补片检测方法及系统 |
CN111681238A (zh) * | 2020-06-12 | 2020-09-18 | 电子科技大学 | 一种基于神经网络的齿痕舌识别方法及系统 |
CN111798445A (zh) * | 2020-07-17 | 2020-10-20 | 北京大学口腔医院 | 一种基于卷积神经网络的牙齿图像龋坏识别方法及系统 |
CN111862190A (zh) * | 2020-07-10 | 2020-10-30 | 北京农业生物技术研究中心 | 自动测量离体植物软腐病斑面积的方法及装置 |
CN113033330A (zh) * | 2021-03-05 | 2021-06-25 | 北京工业大学 | 一种基于轻型卷积神经网络的舌体姿态异常判别方法 |
CN113989269A (zh) * | 2021-11-14 | 2022-01-28 | 北京工业大学 | 一种基于卷积神经网络多尺度特征融合的中医舌图像齿痕自动检测方法 |
CN114098640A (zh) * | 2021-11-18 | 2022-03-01 | 北京鹰之眼智能健康科技有限公司 | 体质识别方法、装置、存储介质及设备 |
CN114858920A (zh) * | 2022-05-17 | 2022-08-05 | 东方电气集团东方电机有限公司 | 一种基于超声的发电机端部齿根裂纹识别方法 |
WO2022252565A1 (zh) * | 2021-06-04 | 2022-12-08 | 浙江智慧视频安防创新中心有限公司 | 一种目标检测系统、方法、装置、设备及介质 |
CN115984846A (zh) * | 2023-02-06 | 2023-04-18 | 山东省人工智能研究院 | 一种基于深度学习的高分辨率图像中小目标的智能识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734108A (zh) * | 2018-04-24 | 2018-11-02 | 浙江工业大学 | 一种基于ssd网络的裂纹舌识别方法 |
CN109255790A (zh) * | 2018-07-27 | 2019-01-22 | 北京工业大学 | 一种弱监督语义分割的自动图像标注方法 |
-
2019
- 2019-05-31 CN CN201910470107.5A patent/CN110210391A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734108A (zh) * | 2018-04-24 | 2018-11-02 | 浙江工业大学 | 一种基于ssd网络的裂纹舌识别方法 |
CN109255790A (zh) * | 2018-07-27 | 2019-01-22 | 北京工业大学 | 一种弱监督语义分割的自动图像标注方法 |
Non-Patent Citations (2)
Title |
---|
JIONGNIMA: "《https://blog.csdn.net/jiongnima/article/details/79094159》", 21 January 2018 * |
汤一平等: "基于多任务卷积神经网络的舌象分类研究", 《计算机科学》 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111476259A (zh) * | 2019-11-22 | 2020-07-31 | 上海大学 | 一种基于卷积神经网络的齿痕舌识别算法 |
CN111260608A (zh) * | 2020-01-08 | 2020-06-09 | 来康科技有限责任公司 | 一种基于深度学习的舌部区域检测方法及系统 |
CN111091132B (zh) * | 2020-03-19 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像识别方法、装置、计算机设备及介质 |
CN111091132A (zh) * | 2020-03-19 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的图像识别方法、装置、计算机设备及介质 |
CN111626986B (zh) * | 2020-04-29 | 2022-06-21 | 云南大学 | 一种基于深度学习的三维超声腹壁疝补片检测方法及系统 |
CN111626986A (zh) * | 2020-04-29 | 2020-09-04 | 云南大学 | 一种基于深度学习的三维超声腹壁疝补片检测方法及系统 |
CN111599444A (zh) * | 2020-05-18 | 2020-08-28 | 深圳市悦动天下科技有限公司 | 智能舌诊检测方法、装置、智能终端和存储介质 |
CN111582234A (zh) * | 2020-05-22 | 2020-08-25 | 莫登奎 | 基于uav和深度学习的大范围油茶林果智能检测与计数方法 |
CN111681238A (zh) * | 2020-06-12 | 2020-09-18 | 电子科技大学 | 一种基于神经网络的齿痕舌识别方法及系统 |
CN111862190A (zh) * | 2020-07-10 | 2020-10-30 | 北京农业生物技术研究中心 | 自动测量离体植物软腐病斑面积的方法及装置 |
CN111862190B (zh) * | 2020-07-10 | 2024-04-05 | 北京农业生物技术研究中心 | 自动测量离体植物软腐病斑面积的方法及装置 |
CN111798445A (zh) * | 2020-07-17 | 2020-10-20 | 北京大学口腔医院 | 一种基于卷积神经网络的牙齿图像龋坏识别方法及系统 |
CN111798445B (zh) * | 2020-07-17 | 2023-10-31 | 北京大学口腔医院 | 一种基于卷积神经网络的牙齿图像龋坏识别方法及系统 |
CN113033330A (zh) * | 2021-03-05 | 2021-06-25 | 北京工业大学 | 一种基于轻型卷积神经网络的舌体姿态异常判别方法 |
WO2022252565A1 (zh) * | 2021-06-04 | 2022-12-08 | 浙江智慧视频安防创新中心有限公司 | 一种目标检测系统、方法、装置、设备及介质 |
CN113989269B (zh) * | 2021-11-14 | 2024-04-02 | 北京工业大学 | 一种基于卷积神经网络多尺度特征融合的中医舌图像齿痕自动检测方法 |
CN113989269A (zh) * | 2021-11-14 | 2022-01-28 | 北京工业大学 | 一种基于卷积神经网络多尺度特征融合的中医舌图像齿痕自动检测方法 |
CN114098640A (zh) * | 2021-11-18 | 2022-03-01 | 北京鹰之眼智能健康科技有限公司 | 体质识别方法、装置、存储介质及设备 |
CN114858920A (zh) * | 2022-05-17 | 2022-08-05 | 东方电气集团东方电机有限公司 | 一种基于超声的发电机端部齿根裂纹识别方法 |
CN114858920B (zh) * | 2022-05-17 | 2023-06-30 | 东方电气集团东方电机有限公司 | 一种基于超声的发电机端部齿根裂纹识别方法 |
CN115984846A (zh) * | 2023-02-06 | 2023-04-18 | 山东省人工智能研究院 | 一种基于深度学习的高分辨率图像中小目标的智能识别方法 |
CN115984846B (zh) * | 2023-02-06 | 2023-10-10 | 山东省人工智能研究院 | 一种基于深度学习的高分辨率图像中小目标的智能识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110210391A (zh) | 基于多尺度卷积神经网络的舌象纹理定量分析方法 | |
CN105045907B (zh) | 一种用于个性化社会图像推荐的视觉注意‑标签‑用户兴趣树的构建方法 | |
CN107680678A (zh) | 基于多尺度卷积神经网络甲状腺超声图像结节自动诊断系统 | |
CN104778464B (zh) | 一种基于深度卷积神经网络的服装定位检测方法 | |
CN107808143A (zh) | 基于计算机视觉的动态手势识别方法 | |
CN104063677B (zh) | 用于估计人体姿态的设备和方法 | |
CN101075346B (zh) | 数字图像中用于感兴趣点吸引的方法 | |
CN108334849A (zh) | 一种基于黎曼流形的行人重识别方法 | |
US20160125243A1 (en) | Human body part detection system and human body part detection method | |
CN109447940A (zh) | 卷积神经网络训练方法、超声图像识别定位方法及系统 | |
CN105930770B (zh) | 一种基于高斯过程隐变量模型的人体动作识别方法 | |
CN108764286A (zh) | 一种基于迁移学习的血管图像中特征点的分类识别方法 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN104200240A (zh) | 一种基于内容自适应哈希编码的草图检索方法 | |
CN109740454A (zh) | 一种基于yolo-v3的人体体态识别方法 | |
Su et al. | Machine learning-assisted region merging for remote sensing image segmentation | |
CN108921057A (zh) | 基于卷积神经网络的对虾形态测量方法、介质、终端设备及装置 | |
CN111274998A (zh) | 帕金森病手指敲击动作识别方法及系统、存储介质及终端 | |
Gottschlich et al. | Robust orientation field estimation and extrapolation using semilocal line sensors | |
CN107871316A (zh) | 一种基于深度神经网络的x光片手骨兴趣区域自动提取方法 | |
CN106844739A (zh) | 一种基于神经网络协同训练的遥感图像变化信息检索方法 | |
CN109508661A (zh) | 一种基于物体检测和姿态估计的举手者检测方法 | |
CN110334719A (zh) | 一种提取遥感影像中建筑物图像的方法及系统 | |
CN110533648A (zh) | 一种黑头识别处理方法及系统 | |
CN116229265A (zh) | 一种自动无损提取大豆植株表型的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190906 |