CN111816308B - 一种通过面部图片分析预测冠心病发病风险的系统 - Google Patents
一种通过面部图片分析预测冠心病发病风险的系统 Download PDFInfo
- Publication number
- CN111816308B CN111816308B CN202010669661.9A CN202010669661A CN111816308B CN 111816308 B CN111816308 B CN 111816308B CN 202010669661 A CN202010669661 A CN 202010669661A CN 111816308 B CN111816308 B CN 111816308B
- Authority
- CN
- China
- Prior art keywords
- module
- model
- data
- heart disease
- coronary heart
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000029078 coronary artery disease Diseases 0.000 title claims abstract description 73
- 230000001815 facial effect Effects 0.000 title claims abstract description 44
- 238000010191 image analysis Methods 0.000 title claims abstract description 13
- 238000012216 screening Methods 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 16
- 238000012502 risk assessment Methods 0.000 claims abstract description 14
- 238000010801 machine learning Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000013135 deep learning Methods 0.000 claims description 15
- 238000003745 diagnosis Methods 0.000 claims description 15
- 230000035945 sensitivity Effects 0.000 claims description 14
- 238000012360 testing method Methods 0.000 claims description 13
- 238000004140 cleaning Methods 0.000 claims description 9
- 210000003128 head Anatomy 0.000 claims description 8
- 238000000034 method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 5
- 210000005069 ears Anatomy 0.000 claims description 4
- 210000001061 forehead Anatomy 0.000 claims description 4
- 238000013434 data augmentation Methods 0.000 claims description 3
- 238000013210 evaluation model Methods 0.000 claims description 3
- 238000013508 migration Methods 0.000 claims description 3
- 230000005012 migration Effects 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 201000010099 disease Diseases 0.000 description 12
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 12
- 238000010968 computed tomography angiography Methods 0.000 description 7
- 238000002586 coronary angiography Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000007477 logistic regression Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 210000004351 coronary vessel Anatomy 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013146 percutaneous coronary intervention Methods 0.000 description 3
- 201000004384 Alopecia Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000005094 computer simulation Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 208000019622 heart disease Diseases 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009862 primary prevention Effects 0.000 description 2
- 230000009863 secondary prevention Effects 0.000 description 2
- 208000002330 Congenital Heart Defects Diseases 0.000 description 1
- 208000027318 Congenital heart valve disease Diseases 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010054805 Macroangiopathy Diseases 0.000 description 1
- 208000008589 Obesity Diseases 0.000 description 1
- 206010000891 acute myocardial infarction Diseases 0.000 description 1
- 230000003143 atherosclerotic effect Effects 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 208000028831 congenital heart disease Diseases 0.000 description 1
- 210000004087 cornea Anatomy 0.000 description 1
- 239000002537 cosmetic Substances 0.000 description 1
- 238000002316 cosmetic surgery Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 235000020824 obesity Nutrition 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 230000008733 trauma Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Data Mining & Analysis (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种通过面部图片分析预测冠心病发病风险的系统,由如下模块组成:数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块。本发明提供的通过面部图片分析预测冠心病发病风险的系统可以通过分析人类面部图片进行冠心病预测,得到的结果优于现有临床模型,操作简单,拍照即可,无需医生辅助,使得用户可完全通过自报实现冠心病筛查,简便易用,与现有技术相比,更适用于大范围社区高危人群筛查。
Description
技术领域
本发明属于人工智能及临床医学领域,涉及一种通过面部图片分析预测冠心病发病风险的系统。
背景技术
冠状动脉粥样硬化性心脏病(简称“冠心病”)是我国致死致残率第2位的疾病。冠心病疾病发展周期长,早期发现可防可治,因此,急需可用于社区、效果可靠的冠心病筛查工具以促进疾病早发现、早诊治,改善患者远期预后,减少疾病负担。
目前临床最常用的冠心病预测模型是Diamond-Forrester模型,该模型通过患者年龄、性别、症状以预测患者冠心病患病概率,指导进一步诊疗方案:概率>15%的患者推荐进行进一步无创检查;概率在5-15%的患者推荐进一步根据病史和危险因素评估风险,指导决策;概率<5%的患者可继续观察。该模型简单实用,但存在预测效能不足、建模人群年代久远等局限性。随后基于该模型的拓展模型纳入了大量病史、实验室检查信息。其中,最有代表性且临床较为常用的是CAD consortium模型,该模型包含年龄、性别、症状、糖尿病、高血压、高脂血症、吸烟。这些拓展模型的预测效能显著提升,但模型应用非常繁琐,且需要临床医生辅助应用,对于临床就诊信息基于医生辅助的依赖使得既往工具无法达到社区大范围疾病早筛目的。
除了传统基于临床变量的模型外,人类的面部特征被发现与罹患冠心病相关。男性脱发、耳褶症、睑黄瘤、角膜环、肥胖面容等面部特点已被证实独立于年龄、性别与冠心病及急性心肌梗死相关。由于面部特征获取简便,可进行自我筛查,可能成为一项冠心病早筛的工具。但目前已发现的面特征种类较少、定义不明确、人工评判可重复性较差,这使得面部特征无法常规应用于冠心病筛查。
因此,如何获得一种通过面部特征来进行冠心病筛查的方法成为亟待解决的问题。
发明内容
为了解决上述问题,本发明的目的在于提供一种通过面部图片分析预测冠心病发病风险的系统,该系统通过深度学习算法整合患者面部特征进行疾病预测为冠心病筛查提供一种便捷、可行的筛查方式。
为了实现上述目的,本发明提供一种通过面部图片分析预测冠心病发病风险的系统,由如下模块组成:
数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块;
所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和风险性评估模块的输入端连接,所述的机器学习模块的输出端与专家系统模块的输入端连接,所述的专家系统模块的输出端与风险性评估模块输入端连接,风险性模块的输出端与显示输出模块的输入端连接;
所述数据采集模块为一数码照相装置;
所述的数据预处理模块负责数据的预处理工作,包含两部分工作,数据清洗、数据标准化,数据清洗负责筛选数据采集模块获取图片,选取其中各角度质量最好的图片,清洗出无效数据和错误数据;数据标准化为去除多余的背景和衣服部分,将图片像素调整为256×256分辨率标准化的RGB图像;
所述机器学习模块包括基础学习模块和深度学习模块,所述一般学习模块利用交叉熵损失函数公式通过反向传播算法对模型的参数进行更新,其中,交叉熵损失函数/>公式为:
N代表训练样本总数,C为输出类型数,其中C=2,代表患病和不患病两种类型;
yn,c和分别代表第n个样本在第c类型上的预测值和真实值;
所述深度学习模块负责解决所述基础学习模块出现的过拟合现象,主要包括:
i.迁移学习
利用ImageNet数据集上训练好的参数对冠心病诊断模型的参数进行初始化;
ii.数据增广
通过随机平移、旋转、翻转等对输入数据进行增广;
iii.固定部分参数
训练初始阶段,所有参数参与更新;之后,固定住网络中靠近输入层的参数,只更新网络中靠近输出层的参数;
iv.固定部分参数
网络中引入随机丢弃(Drop out)、批归一化(Batch normalization)等特殊操作;
所述专家系统模块负责应用C-统计量、灵敏度、特异度、阴性预测值(Negativepredictive value,NPV)、阳性预测值(Positive predictive value,PPV)和判断正确率来验证模型对于冠心病的预测效能;
所述风险性评估模块指基于50层的残差卷积神经网络来构建冠心病诊断模型,在获得模型中各个参数之后,通过输入患者面部分辨率为256×256的三通道RGB图像,输出为两个概率值p1和p2,其总和为1,其大小分别对应患和不患冠心病的风险概率;
所述显示输出模块根据患者的实际判断数据,做出相应的输出。
优选地,所述数码照相装置为一两千万以上像素的数码相机或摄像头,设置P档,IOS 1600,连拍模式。
优选地,所述数据采集模块收集数据需要满足如下要求:(1)在患者进行冠脉确诊性检查之前拍摄;(2)数据收集时采用白色背景、直射室内光;(3)患者免冠、正常表情、不佩戴饰品、头发避免遮盖面部主要特征;(4)连续拍摄正面、两侧60°及头顶共4个角度照片,每角度3-5张;(5)照片上需高过头顶,下可看到男性喉结处,两侧耳朵轮廓应清晰可见,前额不被遮挡。
优选地,所述专家系统模块验证模型对于冠心病的预测效能的方法为:将模型给出的“是否患病”与“真实是否患病”进行对比后得出4个值;
其中,“真阳性”为模型诊断阳性,实际也为阳性;
“假阳性”为模型诊断阳性,实际为阴性;
“真阴性”为模型诊断阴性,实际也为阴性;
“假阴性”:模型诊断阴性,实际阳性;
将上述4个值进行各种加减组合形成评价模型的值:
灵敏度=真阳性/(真阳性+假阴性);
特异度=真阴性/(真阴性+假阳性);
阴性预测值=真阴性/(真阴性+假阴性);
阳性预测值=真阳性/(真阳性+假阳性);
同时,模型将进行C统计量的计算。
预测模型为概率模型,根据模型设置的不同Cut-off值,将得到连续变化的灵敏度和特异度。以“1-特异度”为横坐标,“灵敏度”为纵坐标,可画出受试者工作特征曲线(ROC,Receiver operating characteristic curve),该曲线下面积即为C统计量,该统计量值在0-1之间,越接近于1,模型效果越好。一般的,C统计量为0.5时说明模型完全不起作用,0.5<C统计量≤0.7表明诊断价值较低,0.7<C统计量≤0.9表示诊断价值中等,C统计量>0.9表示诊断价值较高。
本发明还提供一种终端设备,该终端设备包含存储介质及处理器;其中,所述存储介质存储如上所述的系统,所述该系统可被至少一个处理器执行,以使所述至少一个处理器执行冠心病发病风险的预测,再将预测结果及相关建议反馈给用户。
本发明的特点在于:
第一,本发明应用深度学习的方法,整合了所有可能与冠心病发生相关的人类面部特征(耳褶症、男性脱发、睑黄瘤、角膜环、肥胖面容等)进行高危人群的冠心病预测,与既往发明相比,本发明解决了既往应用面部特征进行冠心病预测时存在的问题。
第二,本发明应用深度学习算法分析面部图片获得了一项C-统计量为0.730,灵敏度为0.80,特异度为0.54的高效能冠心病筛查模型。与既往发明的Diamond-Forrester及其拓展模型相比,本发明是基于Resnet 50神经网络进行训练的冠心病诊断模型的预测效能显著提高。
第三,由于该发明仅需要用户根据要求进行拍照即可进行疾病预测,使得用户可完全通过自报实现冠心病筛查,简便易用,与现有技术相比,更适用于大范围社区高危人群筛查。
本发明的有益效果在于:
本发明提供一种通过面部图片分析预测冠心病发病风险的系统,该系统通过深度学习算法分析面部图片,并预测冠心病发病风险,无需临床就诊即可实现用户筛查,可实现社区大范围疾病早筛目的。
附图说明
图1为本发明所提供的通过面部图片分析预测冠心病发病风险的系统的一优选实施例的组成图。
图2为采用本发明所提供的系统建立分析预测冠心病发病风险的模型的一优选实施例的流程图。
图3为采用本发明所提供的系统建立模型的C统计量结果图。
图4为采用本发明所提供的系统建立的模型的测试流程图。
图5为采用本发明所提供的系统建立模型的C统计量结果图。
图6为采用本发明所提供的系统建立的模型的应用流程图。
具体实施方式
下面将对本发明的实施例进行详细、完善的描述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。同时,下列实施例仅是示例性和解释性的,而非限制本公开。
随着人工智能技术的发展,通过分析面部图片进行疾病预测逐渐成熟。通过深度学习算法整合患者面部特征进行疾病预测可能是一项便捷、可行的冠心病筛查方式。
ImageNet数据集是目前深度学习图像领域应用得非常多的一个领域,关于图像分类、定位、检测等研究工作大多基于此数据集展开。Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。
实施例1通过深度学习算法分析面部图片以预测冠心病模型的建立
实施例1为本发明提供的一种通过面部图片分析预测冠心病发病风险的系统的一优选实施例,如图1所示,由如下模块组成:
数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块;
所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和风险性评估模块的输入端连接,所述的机器学习模块的输出端与专家系统模块的输入端连接,所述的专家系统模块的输出端与风险性评估模块输入端连接,风险性模块的输出端与显示输出模块的输入端连接;
针对上述系统进行冠心病模型的确立,流程如图2所示:
收集5216例冠心病患者的20864张面部图片及患者冠脉CT或冠脉造影结果作为训练集用于模型建立。收集580例冠心病患者的2320张面部图片及患者冠脉CT或冠脉造影结果作为验证集用于模型验证。所有患者都经过面部图片及数据采集的知情同意。
在一种可能的实现方式中,针对模型建立的冠心病患者,判断患者其是否满足如下标准:(1)既往无经皮冠状动脉介入治疗(Percutaneous Coronary Intervention,PCI)史;(2)既往无冠状动脉旁路移植术(Coronary Artery Bypass Grafting,CABG)史;(3)合并其他器质性心脏疾病(如先天性心脏病、心脏瓣膜病或大血管疾病);(4)曾有人为面部改变(如整形手术、化妆或面部创伤等);(5)不接受拍照或无法熟练使用终端相机。
当患者满足上述使用条件,使用数据采集模块采集患者面部图片,数据采集模块为一两千万像素数码相机,设置P档,IOS 1600,连拍模式。收集数据需要满足如下要求:(1)在患者进行冠脉确诊性检查之前拍摄;(2)数据收集时采用白色背景、直射室内光;(3)患者免冠、正常表情、不佩戴饰品、头发避免遮盖面部主要特征;(4)连续拍摄正面、两侧60°及头顶共4个角度照片,每角度3-5张;(5)照片上需高过头顶,下可看到男性喉结处,两侧耳朵轮廓应清晰可见,前额不被遮挡。
在一种可能的实现方式中,患者的冠脉CT或冠脉造影结果作为用于模型建立和验证的参数,并不需要输入到模型中。由于冠脉CT或冠脉造影结果用于模型建立和验证,因此其准确性关系到模型结果的准确性,为此,为了避免单个医生有可能会阅片出错。因此,要求两个医生独立看片子给结果,有异议请第三位医生,以保证冠脉CT或冠脉造影结果的正确性。
然后进入数据预处理模块,包含两部分工作,数据清洗、数据标准化,数据清洗负责筛选各角度质量最好的图片,清洗出无效数据和错误数据;数据标准化为:去除多余的背景和衣服部分,将图片像素调整为256×256分辨率标准化的RGB图像。通过数据预处理模块可降低模型训练噪声。
在一种可能的实现方式中,在风险性评估模块中构建基于50层的残差卷积神经网络(Resnet 50神经网络)来构建冠心病诊断模型,在获得模型中各个参数之后,通过输入患者面部分辨率为256×256的三通道RGB图像,输出为两个概率值p1和p2,其总和为1,其大小分别对应患和不患冠心病的风险概率;
在一种可能的实现方式中,利用机器学习模块中的基础学习模块的交叉熵损失函数公式通过反向传播算法对模型的参数进行更新,其中,交叉熵损失函数/>公式为:
N代表训练样本总数,C为输出类型数,其中C=2,代表患病和不患病两种类型;
yn,c和分别代表第n个样本在第c类型上的预测值和真实值;
在一种可能的实现方式中,由于基础学习模块很多时候会出现过拟合现象,过拟合指训练好的模型在训练集上效果好,而在实际的测试集上效果很差,即模型过度拟合训练集的样本,在其他样本上效果很差,模型缺乏泛化能力。判断依据就是“模型在训练集上效果好(比如达到较高的准确率),而在验证集上效果差(测试准确率低),因此还需要一个测试集来解决过拟合问题。
在一种可能的实现方式中,采用验证集和深度学习模块负责解决所述基础学习模块出现的过拟合现象,主要包括:
i.迁移学习
利用ImageNet数据集上训练好的参数对冠心病诊断模型的参数进行初始化;
这里初始化指用模型用在ImageNet数据集上训练好的参数作为初始参数,在冠心病数据集上继续训练。
ii.数据增广
通过随机平移、旋转、翻转等对输入数据进行增广;
增广指对数据进行扩增,基于已有训练样本,生成更多的训练样本,比如通过对已有训练样本(图片)进行随机平移、翻转、旋转等操作生成更多训练样本。
iii.固定部分参数
训练初始阶段,所有参数参与更新;之后,固定住网络中靠近输入层的参数,只更新网络中靠近输出层的参数;
iv.固定部分参数
网络中引入随机丢弃(Drop out)、批归一化(Batch normalization)等特殊操作;
然后利用专家系统模块采用C-统计量、灵敏度、特异度、阴性预测值(Negativepredictive value,NPV)、阳性预测值(Positive predictive value,PPV)和判断正确率来评价模型对于冠心病的预测效能。
在一种可能的实现方式中,将模型给出的“是否患病”与“真实是否患病”进行对比后能得出4个值;
其中,“真阳性”为模型诊断阳性,实际也为阳性;
“假阳性”为模型诊断阳性,实际为阴性;
“真阴性”为模型诊断阴性,实际也为阴性;
“假阴性”:模型诊断阴性,实际阳性;
将上述4个值进行各种加减组合就形成了评价模型的值:
灵敏度=真阳性/(真阳性+假阴性);
特异度=真阴性/(真阴性+假阳性);
阴性预测值=真阴性/(真阴性+假阴性);
阳性预测值=真阳性/(真阳性+假阳性);
同时,模型将进行C统计量的计算。预测模型为概率模型,根据模型设置的不同Cut-off值,将得到连续变化的灵敏度和特异度。以“1-特异度”为横坐标,“灵敏度”为纵坐标,可画出受试者工作特征曲线(ROC,Receiver operating characteristic curve),该曲线下面积即为C统计量,该统计量值在0-1之间,越接近于1,模型效果越好。一般的,C统计量为0.5时说明模型完全不起作用,0.5<C统计量≤0.7表明诊断价值较低,0.7<C统计量≤0.9表示诊断价值中等,C统计量>0.9表示诊断价值较高。
最后在显示输出模块中做出相应的输出。
如图3所示,在验证样本中,算法的C-统计量为0.757(95%可信区间[ConfidenceInterval,CI],0.710-0.805),灵敏度为0.80,特异度为0.61,PPV为0.87,NPV为0.47。在与传统模型的比较中,算法显著优于Diamond-Forrester模型(C统计量0.631,95%CI 0.579-0.683,p<0.001)及CAD consortium模型(C统计量0.694,95%CI 0.645-0.743,p=0.03),与复杂的Logistic回归模型效能无显著差异(C统计量0.750,95%CI 0.701-0.799,p=0.79)。此外,在算法基础上进一步融合Diamond-Forrester模型(C统计量0.755,95%CI0.710-0.805,p=0.87)和Logistic回归模型(C统计量0.786,95%CI 0.740-0.833,p=0.08)未显著改善模型效能。
实施例2通过面部图片分析预测冠心病发病风险的系统预测患者冠心病的发病概率的测试
1013例冠心病患者的4052张照片及患者冠脉CT或冠脉造影结果作为测试集进行模型测试。所有患者都经过面部图片及数据采集的知情同意,流程如图4所示。
患者冠脉CT或冠脉造影结果处理方法同实施例1。
在一种可能的实现方式中,将上述患者使用数据采集模块采集患者面部图片,数据采集模块为一两千万像素数码相机,设置P档,IOS 1600,连拍模式。收集数据需要满足如下要求:(1)在患者进行冠脉确诊性检查之前拍摄;(2)数据收集时采用白色背景、直射室内光;(3)患者免冠、正常表情、不佩戴饰品、头发避免遮盖面部主要特征;(4)连续拍摄正面、两侧60°及头顶共4个角度照片,每角度3-5张;(5)照片上需高过头顶,下可看到男性喉结处,两侧耳朵轮廓应清晰可见,前额不被遮挡。
通过风险性评估模块和专家系统模块预测冠心病发病风险,显示输出模块中做出相应的输出。
如患者被模型预测为“冠心病患者”,则提示患者采取如下措施:(1)密切关注可疑冠心病症状变化;(2)必要时就诊进行冠脉确证性检查;(3)注意疾病危险因素的控制及一级、二级预防。
如图5所示,在测试样本中的C-统计量为0.730(95%CI,0.699-0.761),灵敏度为0.80,特异度为0.54,PPV为0.66,NPV为0.68。
比较临床指南推荐的Diamond-Forrester模型、广泛应用的CAD consortium模型和复杂Logistic回归模型,在测试样本中,深度学习模型效能显著优于临床指南推荐的Diamond-Forrester模型(0.730vs.0.623,p<0.001)、广泛应用的CAD consortium模型(0.730vs.0.652,p<0.001)以及26个临床变量建立的复杂Logistic回归模型(0.730vs.0.660,p<0.001)。此外,算法融合Diamond-Forrester模型(C统计量0.726,95%CI 0.695-0.757,p=0.66)和Logistic回归模型(C统计量0.724,95%CI 0.693-0.755,p=0.52)未显著改善模型效能。
实施例1论证了算法具有较高的诊断效能,并优于传统工具。与实施例1相比,实施例2中,算法的C统计量有0.027的衰减,该衰减属于正常测试现象,且在测试集中算法的效能仍明显优于传统工具,这提示算法除具有较高的诊断效能,还具有较好的外推效果,具有很高的推广应用价值。
综上,本发明建立的面部图片分析预测冠心病发病风险的系统,能够切实有效地对冠心病发病风险给出预测。
实施例3实际应用面部图片分析预测冠心病发病风险的系统预测患者冠心病的发病概率
在一种可能的实现方式中,将上述系统搭载至一套终端设备。该设备包含存储介质及处理器。所述存储介质存储有基于深度学习的冠心病判断程序,所述基于深度学习的冠心病判断程序可被至少一个处理器执行,以使所述至少一个处理器执行如上所述的基于深度学习的冠心病预测,再将预测结果及相关建议反馈给用户,流程如图6所示。
如患者被模型预测为“冠心病患者”,则提示患者采取如下措施:(1)密切关注可疑冠心病症状变化;(2)必要时就诊进行冠脉确证性检查;(3)注意疾病危险因素的控制及一级、二级预防。
终端可以以各种形式来实施。例如,本发明中描述的终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑等可具有图像获取功能(带有摄像头)的终端,以及诸如数字TV、台式计算机等可具有图像获取功能的固定终端。
从上述实施例可以看出,本发明提供一种通过面部图片分析预测冠心病发病风险的系统,该系统搭载一套深度学习模型,可以通过分析人类面部图片进行冠心病预测,得到的结果优于现有临床模型,操作简单,拍照即可,无需医生辅助,使得用户可完全通过自报实现冠心病筛查,简便易用,与现有技术相比,更适用于大范围社区高危人群筛查。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干修改或变化,这修改或变化也应视为本发明的保护范围所涵盖。
Claims (2)
1.一种通过面部图片分析预测冠心病发病风险的系统,其特征由如下模块组成:
数据采集模块、数据预处理模块、机器学习模块、风险性评估模块、专家系统模块、显示输出模块;
所述的数据采集模块的输出端与数据预处理模块的输入端连接,所述的数据预处理模块的输出端与机器学习模块和风险性评估模块的输入端连接,所述的机器学习模块的输出端与专家系统模块的输入端连接,所述的专家系统模块的输出端与风险性评估模块输入端连接,风险性模块的输出端与显示输出模块的输入端连接;
所述数据采集模块为一数码照相装置;
所述的数据预处理模块负责数据的预处理工作,包含两部分工作,数据清洗、数据标准化,数据清洗负责筛选数据采集模块获取图片,选取其中各角度质量最好的图片,清洗出无效数据和错误数据;数据标准化为去除多余的背景和衣服部分,将图片像素调整为256×256分辨率标准化的RGB图像;
所述机器学习模块包括基础学习模块和深度学习模块,所述基础学习模块利用交叉熵损失函数公式通过反向传播算法对模型的参数进行更新,其中,交叉熵损失函数/>公式如式(1)所示:
其中,N代表训练样本总数,C为输出类型数,其中C=2,代表患病和不患病两种类型;
和/>分别代表第n个样本在第c类型上的预测值和真实值;
所述深度学习模块负责解决所述基础学习模块出现的过拟合现象,主要包括:
i. 迁移学习
利用ImageNet数据集上训练好的参数对冠心病诊断模型的参数进行初始化;
ii. 数据增广
通过随机平移、旋转、翻转对输入数据进行增广;
iii. 固定部分参数
训练初始阶段,所有参数参与更新;之后,固定住网络中靠近输入层的参数,只更新网络中靠近输出层的参数;
iv. 其他避免过拟合的方法
网络中引入随机丢弃、批归一化的操作;
所述专家系统模块负责应用C-统计量、灵敏度、特异度、阴性预测值、阳性预测值和判断正确率来验证模型对于冠心病的预测效能;
所述风险性评估模块指基于50层的残差卷积神经网络来构建冠心病诊断模型,在获得模型中各个参数之后,通过输入患者面部分辨率为256×256的三通道RGB图像,输出为两个概率值p1和p2,其总和为1,其大小分别对应患和不患冠心病的风险概率;
所述显示输出模块根据患者的实际判断数据,做出相应的输出;
所述数码照相装置为一两千万以上像素的数码相机或摄像头,设置P档,IOS 1600,连拍模式;
所述数据采集模块收集数据需要满足如下要求:(1)在患者进行冠脉确诊性检查之前拍摄;(2)数据收集时采用白色背景、直射室内光;(3)患者免冠、正常表情、不佩戴饰品、头发避免遮盖面部主要特征;(4)连续拍摄正面、两侧60°及头顶共4个角度照片,每角度3-5张;(5)照片上需高过头顶,下可看到男性喉结处,两侧耳朵轮廓应清晰可见,前额不被遮挡;
所述专家系统模块验证模型对于冠心病的预测效能的方法为:将模型给出的“是否患病”与“真实是否患病”进行对比后得出4个值;
其中,“真阳性”为模型诊断阳性,实际也为阳性;
“假阳性”为模型诊断阳性,实际为阴性;
“真阴性”为模型诊断阴性,实际也为阴性;
“假阴性”:模型诊断阴性,实际阳性;
将上述4个值进行各种加减组合形成评价模型的值:
灵敏度=真阳性/(真阳性+假阴性);
特异度=真阴性/(真阴性+假阳性);
阴性预测值=真阴性/(真阴性+假阴性);
阳性预测值=真阳性/(真阳性+假阳性);
然后,以“1-特异度”为横坐标,“灵敏度”为纵坐标,作出受试者工作特征曲线,计算曲线下面积得到C统计量,其中,C统计量取值范围0-1,当C统计量≤0.5时表示模型完全不起作用,0.5<C统计量≤0.7表示诊断价值较低,0.7<C统计量≤0.9表示诊断价值中等,1>C统计量>0.9表示诊断价值较高。
2.一种终端设备,其特征在于,该终端设备包含存储介质及处理器;其中,所述存储介质存储如权利要求1所述的系统,所述该系统可被至少一个处理器执行,以使所述至少一个处理器执行冠心病发病风险的预测,再将预测结果及相关建议反馈给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010669661.9A CN111816308B (zh) | 2020-07-13 | 2020-07-13 | 一种通过面部图片分析预测冠心病发病风险的系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010669661.9A CN111816308B (zh) | 2020-07-13 | 2020-07-13 | 一种通过面部图片分析预测冠心病发病风险的系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111816308A CN111816308A (zh) | 2020-10-23 |
CN111816308B true CN111816308B (zh) | 2023-09-29 |
Family
ID=72843082
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010669661.9A Active CN111816308B (zh) | 2020-07-13 | 2020-07-13 | 一种通过面部图片分析预测冠心病发病风险的系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111816308B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284613A (zh) * | 2021-05-24 | 2021-08-20 | 暨南大学 | 一种基于深度学习的人脸诊断系统 |
CN118280575B (zh) * | 2024-05-30 | 2024-08-13 | 西北大学 | 一种基于多源数据处理的冠心病风险预测方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104768448A (zh) * | 2012-07-13 | 2015-07-08 | 昂热大学 | 用于提供可靠的非侵入式诊断测试的方法 |
CN106446595A (zh) * | 2016-12-16 | 2017-02-22 | 上海尚戴科技发展有限公司 | 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统 |
EP1711908B1 (en) * | 2004-02-03 | 2017-05-31 | Siemens Medical Solutions USA, Inc. | Systems and methods for automated diagnosis and decision support for heart related diseases and conditions |
CN108021916A (zh) * | 2017-12-31 | 2018-05-11 | 南京航空航天大学 | 基于注意力机制的深度学习糖尿病视网膜病变分类方法 |
CN110738247A (zh) * | 2019-09-30 | 2020-01-31 | 中国科学院大学 | 一种基于选择性稀疏采样的细粒度图像分类方法 |
CN111027487A (zh) * | 2019-12-11 | 2020-04-17 | 山东大学 | 基于多卷积核残差网络的行为识别系统、方法、介质及设备 |
-
2020
- 2020-07-13 CN CN202010669661.9A patent/CN111816308B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1711908B1 (en) * | 2004-02-03 | 2017-05-31 | Siemens Medical Solutions USA, Inc. | Systems and methods for automated diagnosis and decision support for heart related diseases and conditions |
CN104768448A (zh) * | 2012-07-13 | 2015-07-08 | 昂热大学 | 用于提供可靠的非侵入式诊断测试的方法 |
CN106446595A (zh) * | 2016-12-16 | 2017-02-22 | 上海尚戴科技发展有限公司 | 一种机器学习妊娠期糖尿病发病风险及病情程度预测系统 |
CN108021916A (zh) * | 2017-12-31 | 2018-05-11 | 南京航空航天大学 | 基于注意力机制的深度学习糖尿病视网膜病变分类方法 |
CN110738247A (zh) * | 2019-09-30 | 2020-01-31 | 中国科学院大学 | 一种基于选择性稀疏采样的细粒度图像分类方法 |
CN111027487A (zh) * | 2019-12-11 | 2020-04-17 | 山东大学 | 基于多卷积核残差网络的行为识别系统、方法、介质及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111816308A (zh) | 2020-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ilhan et al. | The contribution of artificial intelligence to reducing the diagnostic delay in oral cancer | |
CN109543719B (zh) | 基于多模态注意力模型的宫颈非典型病变诊断模型和装置 | |
CN109700433A (zh) | 一种舌象诊断系统和舌诊移动终端 | |
CN111816308B (zh) | 一种通过面部图片分析预测冠心病发病风险的系统 | |
WO2023155488A1 (zh) | 基于多源多尺度特征融合的眼底图像质量评价方法和装置 | |
Zhang et al. | The application of artificial intelligence in glaucoma diagnosis and prediction | |
Appiahene et al. | Detection of anemia using conjunctiva images: A smartphone application approach | |
CN109460717A (zh) | 消化道共聚焦激光显微内镜病变图像识别方法及装置 | |
CN111368708A (zh) | 一种基于人工智能的烧烫伤图像快速分级识别方法及系统 | |
Shamrat et al. | Analysing most efficient deep learning model to detect COVID-19 from computer tomography images | |
Hsu et al. | Deep learning for automated diabetic retinopathy screening fused with heterogeneous data from EHRs can lead to earlier referral decisions | |
Mohanarathinam et al. | Diabetic Retinopathy Detection and Classification using Hybrid Multiclass SVM classifier and Deeplearning techniques | |
Jabbar et al. | A Lesion-Based Diabetic Retinopathy Detection Through Hybrid Deep Learning Model | |
Youneszade et al. | A predictive model to detect cervical diseases using convolutional neural network algorithms and digital colposcopy images | |
Haja et al. | Advancing glaucoma detection with convolutional neural networks: a paradigm shift in ophthalmology | |
Li et al. | A deep-learning-enabled monitoring system for ocular redness assessment | |
Suwandi et al. | A Systematic Literature Review: Diabetic Retinopathy Detection Using Deep Learning | |
Sridhar et al. | Artificial intelligence in medicine: diabetes as a model | |
CN113139944B (zh) | 一种基于深度学习的阴道镜图像分类计算机辅助诊断系统和方法 | |
CN114972297A (zh) | 口腔健康监测方法及装置 | |
Zhong et al. | CeCNN: Copula-enhanced convolutional neural networks in joint prediction of refraction error and axial length based on ultra-widefield fundus images | |
CN112396597A (zh) | 不明原因肺炎影像快速筛查方法及装置 | |
KS et al. | Classification of Deep Learning Algorithm for Rheumatoid Arthritis Predictor | |
Shah et al. | Non-invasive Primary Screening of Oral Lesions into Binary and Multi Class using Convolutional Neural Network, Stratified K-fold Validation and Transfer Learning | |
Ghebrechristos et al. | RetiNet—feature extractor for learning patterns of diabetic retinopathy and age-related macular degeneration from publicly available datasets |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |