CN111048210A - 基于眼底图像评估疾病风险的方法及设备 - Google Patents

基于眼底图像评估疾病风险的方法及设备 Download PDF

Info

Publication number
CN111048210A
CN111048210A CN201911421200.3A CN201911421200A CN111048210A CN 111048210 A CN111048210 A CN 111048210A CN 201911421200 A CN201911421200 A CN 201911421200A CN 111048210 A CN111048210 A CN 111048210A
Authority
CN
China
Prior art keywords
risk
disease
related information
network
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911421200.3A
Other languages
English (en)
Inventor
熊健皓
王斌
赵昕
陈羽中
和超
张大磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yingtong Medical Technology Co ltd
Beijing Airdoc Technology Co Ltd
Original Assignee
Shanghai Eaglevision Medical Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Eaglevision Medical Technology Co Ltd filed Critical Shanghai Eaglevision Medical Technology Co Ltd
Priority to CN201911421200.3A priority Critical patent/CN111048210A/zh
Publication of CN111048210A publication Critical patent/CN111048210A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30041Eye; Retina; Ophthalmic

Abstract

本发明提供一种基于眼底图像评估疾病风险的方法及设备,包括获取用户的眼底图像;利用机器学习模型对所述眼底图像进行识别,输出用于表示所述用户的疾病风险的评估结果,所述机器学习模型包括特征提取网络和至少一个输出网络,其中所述特征提取网络用于从所述眼底图像中提取特征信息,所述至少一个输出网络用于分别根据所述特征信息输出所述评估结果。

Description

基于眼底图像评估疾病风险的方法及设备
技术领域
本发明涉及医疗图像分析领域,具体涉及一种基于眼底图像评估心血管风险的方法及设备。
背景技术
医疗领域中有一系列基于身体指标量化疾病风险程度的方法,如《中国科技成果》(半月刊)记载的文章《冠心病、脑卒中综合危险度评估及干预方案的研究成果》,该方法通过采集人体的年龄、性别、收缩压、舒张压等指标,使用cox函数、逻辑回归等算法,以采集指标作为输入计算得到一个风险值,此风险值表示5-10年内被评估人发生心血管事件的几率。一种常使用的方程为:
Figure BDA0002352429890000011
其中S0()表示10年(或者N年的平均存活率),βX是近似的基本发病率,βXhat是每种指标和权重的逻辑回归加权值。
由此可见,为了进行疾病风险评估,专业人员需要考虑多种风险因素,包括身体指标、生活习惯等等。其中一些信息可以直接询问受试者,但血液必须有创采集,并且需要较长时间分析血液指标,最终需要医生或者专业人员对一系列风险因素进行量化和计算从而得到风险评估结果,这种评估方式效率低、成本高。
发明内容
有鉴于此,本发明提供一种疾病风险评估模型构建方法,包括:
获取样本数据,包括眼底图像和多种疾病相关信息;利用大量所述样本数据对机器学习模型进行训练,使其输出用于表示患病风险的评估结果,所述机器学习模型包括特征提取网络和至少一个输出网络,其中所述特征提取网络用于从所述眼底图像中提取特征信息,所述至少一个输出网络用于分别根据所述特征信息输出与所述疾病相关信息相应的所述评估结果;所述机器学习模型根据输出的所述评估结果与样本数据中的所述疾病相关信息的差异调整自身的参数。
可选地,所述至少一个输出网络包括分类网络和/或回归网络;
所述分类网络输出的评估结果为分类结果,所述分类结果与所述样本数据中相应的疾病相关信息的差异通过交叉熵函数进行表示;
所述回归网络输出的评估结果为数值,所述回归结果与所述样本数据中相应的心脑血管相关信息的差异通过误差函数进行表示。
可选地,所述输出网络有多个,所述机器学习模型根据输出的所述评估结果与样本数据中的所述疾病相关信息的差异调整自身的参数,包括:
根据各种评估结果与样本数据中相应的疾病相关信息的差异确定多个第二损失值;
根据所述多个第二损失值确定第一损失值;
所述机器学习模型至少根据所述第一损失值调整自身参数。
可选地,所述机器学习模型至少根据所述第一损失值调整所述特征提取网络的参数。
可选地,所述机器学习模型还分别根据所述多个第二损失值调整相应的输出网络的参数。
可选地,所述机器学习模型只有一个输出网络,用于根据所述特征信息和所述多种疾病相关信息输出与所述多种疾病相关信息中的一种相应的评估结果。
可选地,所述疾病风险评估模型为心血管风险评估模型,所述疾病相关信息为心血管相关信息;所述心血管相关信息包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部。
可选地,所述多种心血管相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它心血管相关信息确定的。
可选地,所述疾病风险评估模型为糖尿病风险评估模型,所述疾病相关信息为糖尿病相关信息;所述糖尿病相关信息包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部。
可选地,所述糖尿病相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它糖尿病相关信息确定的。
可选地,所述疾病风险评估模型为痴呆风险评估模型,所述疾病相关信息为痴呆相关信息;所述痴呆相关信息包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部。
可选地,所述痴呆相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它痴呆相关信息确定的。
本发明提供一种疾病风险评估方法,包括:获取用户的眼底图像;利用机器学习模型对所述眼底图像进行识别,输出用于表示所述用户的疾病风险的评估结果,所述机器学习模型包括特征提取网络和至少一个输出网络,其中所述特征提取网络用于从所述眼底图像中提取特征信息,所述至少一个输出网络用于分别根据所述特征信息输出所述评估结果。
可选地,所述输出网络有多个,用于分别输出不同种类的评估结果。
可选地,所述输出网络包括分类网络和/或回归网络。
可选地,所述疾病风险为心血管风险;所述评估结果包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部。
可选地,所述方法还包括:根据各个评估结果确定用于表示心脑血管风险的风险值。
可选地,所述疾病风险为糖尿病风险;所述评估结果包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部。
可选地,所述方法还包括:根据各个评估结果确定用于表示糖尿病风险的风险值。
可选地,所述疾病风险为痴呆风险;所述评估结果包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部。
可选地,所述方法还包括:根据各个评估结果确定用于表示痴呆风险的风险值。
可选地,所述机器学习模型具有唯一的输出网络,用于输出表示疾病风险的风险值。
可选地,所述风险值包括心血管风险值、糖尿病风险值和痴呆风险值。
相应地,本发明提供一种心脑血管风险评估模型构建设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述疾病风险评估模型构建方法。
相应地,本发明提供一种疾病风险评估设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述疾病风险评估方法。
根据本发明提供的疾病风险评估模型构建方法和设备,通过获取眼底图像和多种疾病相关信息组成的样本数据,对由神经网络组成的具有学习能力的模型进行训练,训练过程中将模型输出的评估结果与样本数据的标签进行比对,根据差异优化模型的参数,使模型能够学习疾病相关信息与眼底图像所呈现内容的关系,由此构建出的模型可以通过眼底图像得到疾病风险相关信息。
根据本发明提供的疾病风险评估方法和设备,通过获取用户的眼底图像,并利用机器学习模型提取眼底图像的特征,根据该特征即可输出用于表示用户疾病风险的评估结果,本方案不需要采集用户的血样或者其它身体指标,只需要采集眼底图像,实现无创的评估过程;利用如电脑、智能手机和服务器等电子设备即可在短时间内得到受试者的疾病风险评估结果,具有很强的便利性和稳定性;并且本方案不需要引入如血样采集设备等专业医疗设备,也不需要医生或专业研究人员参与,由此可以降低评估疾病风险的成本。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的一种机器学习模型训练示意图;
图2为本发明实施例中的另一种机器学习模型训练示意图;
图3为本发明实施例中的一种机器学习模型评估疾病风险的示意图;
图4为本发明实施例中的另一种机器学习模型评估疾病风险的示意图;
图5为本发明实施例中的第三种机器学习模型评估疾病风险的示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明的一个实施例提供一种疾病风险评估模型构建方法,本方法涉及机器学习模型,如图1所示该模型包括特征提取网络11和多个输出网络12。本申请所述的网络是指神经网络,尤其是指卷积神经网络。下面所描述的分类网络和回归网络都需要具备卷积层、池化层、激活层组成的特征提取结构。一个或者多个特征提取结构可以构成一个特征提取网络,该网络提取的特征会输入到后续的输出网络中。网络具有初始化的参数,在本实施例中使用样本数据对这些网络进行训练以优化这些参数,从而使网络能够输出用于评估疾病风险的信息。
首先获取样本数据,其中包括眼底图像和多种疾病相关信息。作为举例,疾病相关信息例如是年龄信息、体重信息、血压信息以及一些相关病史信息等等。样本数据应当取自真实受试者,比如可以通过读取体检数据或者病例数据获得某个人的疾病相关信息,或者可以通过调查问卷的方式采集这些信息。眼底图像是通过眼底照相机所拍的图像,其中具有黄斑、视盘、血管等器官的影像。眼底的视网膜血管是人体中可看见的血管,被视为了解其它脏器血管情况的窗口。因此,眼底血管的特征在一定程度上反映了一些器官的状态,眼底图像与冠心病、糖尿病、脑卒中、痴呆的风险存在非常紧密的联系,本申请所述风险是指未来的患病风险。
在实际应用时可以对眼底图像进行一些预处理,例如可以剪裁边缘、调整尺寸、增强对比度等等来规范数据内容和提高图像质量。
一条样本数据中的眼底图像和多种疾病相关信息应当来自同一个受试者。为了训练机器学习模型,应当获取大量的样本数据,并将其划分为训练数据和测试数据。
然后,利用大量样本数据对机器学习模型进行训练,使其输出用于表示疾病风险的评估结果。在本实施例中,模型输出的结果与样本数据中的疾病相关信息一一对应,也即样本数据中的疾病相关信息作为标签,模型的输出内容与标签相对应。作为举例,比如一个样本数据包括眼底图像P和疾病相关信息A、疾病相关信息B、疾病相关信息C,则眼底图像P具有A、B、C三个标签,模型对眼底图像P进行识别而输出与A相应的评估结果A’,以及输出与B相应的评估结果B’和输出与C相应的评估结果C’。
如图1所示的特征提取网络11用于从眼底图像中提取特征信息,多个输出网络12用于分别根据特征信息输出与所述疾病相关信息相应的评估结果。这些输出网络共用同一个特征提取网络提取的特征,输出与标签相应的结果。例如特征提取网络11对眼底图像P进行提取,得到特征信息featurep,而第一个输出网络根据featurep输出与标签A相应的评估结果A’、第二个输出网络根据featurep输出与标签B相应的评估结果B’、第三个输出网络根据featurep输出与标签C相应的评估结果C’。
机器学习模型根据输出的评估结果与样本数据中的疾病相关信息的差异调整自身的参数。根据神经网络的特点,模型需要根据上述差异确定损失值(loss),通过反向传递来优化自身的参数,从而减小上述差异。
根据本发明实施例提供的疾病风险评估模型构建方法,通过获取眼底图像和多种疾病相关信息组成的样本数据,对由神经网络组成的具有学习能力的模型进行训练,训练过程中将模型输出的评估结果与样本数据的标签进行比对,根据差异优化模型的参数,使模型能够学习疾病相关信息与眼底图像所呈现内容的关系,由此构建出的模型可以通过眼底图像得到疾病风险相关信息。
对于不同种类的评估结果和标签而言,差异的表达方式可以是不同或者相同的。在一个实施例中,评估结果全部属于分类结果,包括二分类或者多分类,也即多个输出网络可以全部为分类网络。分类网络的输出网络(或输出结构)一般包含Softmax或者Sigmoid函数的输出层,输出一般为0-1的置信度或者概率,来描述输入属于某一个或者多个类别的概率或者置信度。比如一个疾病相关信息是“是否吸烟”的信息,用标签0表示不吸烟、标签1表示吸烟,那么输出网络将根据特征信息执行二分类,其输出0-1的数值来表示分类结果,多分类问题与此类似。
作为优选方案,分类结果与标签的差异可使用交叉熵函数来表示,比如
Figure BDA0002352429890000061
由此,可以得到各个分类结果与相应的标签的损失值。在其它可能的实施方案中,也可以使用对数似然函数、指数损失函数或者平方损失函数来表示分类结果与标签的差异。
在一个实施例中,评估结果全部属于回归预测结果,也即多个输出网络可以全部为回归预测网络,此网络输出的结果为数值。回归网络的输出是对某一具体指标的数值预测值,比如:年龄、性别、收缩压等。该网络的输出网络至少包含全连接层,用于对输入进行加权并输出,并且也可以添加激活层改变对输入的响应值,比如使用Relu为激活函数,将小于0的数值输出0,大于0的数值不变。比如一个疾病相关信息是年龄,即一个标签是年龄值,那么输出网络将根据特征信息执行回归预测,输出一个数值,即预测的年龄。
回归预测结果与标签的差异可使用误差函数进行表示,比如均方误差函数(MeanSquare Error,MSE)、平均绝对误差函数(Mean Absolute Error,MAE)、平均绝对百分误差函数(Mean Absolute Percentage Error,MAPE)等。由此,可以得到各个回归预测结果与相应的标签的损失值。
本申请中描述的损失函数是对输出网络的输出计算损失。分类网络和回归网络可以共享相同的特征提取网络,但分类网络和回归网络的输出网络对特征提取网络提取的特征独立地进行处理和输出。
在一个优选的实施例中,评估结果同时包括分类结果和回归预测结果,多个输出网络中既包括分类网络也包括回归预测网络,这两种结果分别采用上述方式表达其与标签的差异,从而确定各个损失值。根据上述优选方案,针对各种类型的标签和输出分别采用合适类型的网络,结合分类网络和回归网络两方面的优势提高训练结果的准确性。
作为第一个实施例,疾病风险评估模型可以为心血管风险评估模型,为了使模型能够评估心血管风险,所使用的样本数据中的多种疾病相关信息为年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI(Body Mass Index,身体质量指数)、腰围、吸烟史、总胆固醇、居住地信息、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部,这些信息均可以间接表达心血管风险。
作为第二个实施例,疾病风险评估模型可以为糖尿病风险评估模型,为了使模型能够评估糖尿病风险,所使用的样本数据中的多种疾病相关信息为糖尿病相关信息。多种糖尿病相关信息包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部,这些信息均可以间接表达糖尿病风险。
作为第三个实施例,疾病风险评估模型可以为痴呆风险评估模型,为了使模型能够评估痴呆风险,所使用的样本数据中的多种疾病相关信息为痴呆相关信息。多种疾病相关信息包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部,这些信息均可以间接表达痴呆风险。
模型输出的评估结果是与标签相应的各个结果,可以把这些识别目标转换成分类问题或者回归预测问题,比如年龄既可以是回归预测结果,也可以将年龄分段从而转变为分类结果。
根据本实施例中的模型结构可知,每一种评估结果和其对应的标签的差异都可以计算一个损失值(第二损失值),比如年龄的损失值Lage、收缩压的损失值LSBP、舒张压的损失值LDBP、性别的损失值Lgender、糖尿病类型的损失值LDB等等。在模型根据这些损失值调整参数时,可根据这些损失值计算一个总的损失值(第一损失值)Ltot,即Ltot=f(Lage,LSBP,LDBP,Lgender,LDB,…),而且这些第二损失值对总的损失值的影响程度可以是不同的,比如可以设定各个第二损失值的影响权重,通过线性或非线性加权计算总的损失值。最终模型根据计算出的总的损失值调整参数。
进一步地,机器学习模型至少根据第一损失值调整特征提取网络11的参数,从而优化特征提取性能,使其得到特征信息更加准确,从而提高输出网络的准确性。各个输出网络12的参数也可以根据第一损失值进行调整,或者分别根据多个第二损失值调整相应的输出网络的参数。比如对于年龄的输出网络而言,可根据年龄的损失值Lage调整该网络的参数。
上述优选实施方式通过总的损失值优化特征提取网络的参数,通过各种评估结果相应的损失值优化相应输出网络的参数,由此可以提高模型训练的效率和性能。
在上述实施例的基础上,本发明的另一个实施例中提供一种机器学习模型,该模型包括特征提取网络11和至少一个输出网络12,而其中一个输出网络12用于根据特征信息输出风险值。本实施例中的样本数据的标签包括风险值,样本数据中的风险值是利用除自身外的其它疾病相关信息确定的,比如是根据Cox模型(proportional hazards model,比例风险回归模型),将年龄、性别、收缩压、舒张压、糖尿病历史等信息作为输入而得到的风险值,此风险值用来表示未来5-10年内被评估人发生心血管事件的几率。
在本实施例中,根据输出网络输出的风险值和样本数据中的风险值的差异可确定风险值的损失值Lrisk,如果还存在其它输出网络和相应的损失值,在计算总的损失函数时将纳入Lrisk,并且可以使Lrisk对总的损失值的影响程度大于其他损失值的影响程度,比如在进行线性或非线性加权计算时使Lrisk具有较高的权重。另外Lrisk可以被用于调整该输出网络的参数。
参照图2,对于只有一个用于输出风险值的输出网络12的机器学习模型,输出网络12用于根据特征提取网络11输出的特征信息和多种疾病相关信息输出与其中一种疾病相关信息相应的识别结果,并根据识别结果的损失值优化模型的参数。
在一个优选的实施例中,输出网络12用于根据特征提取网络11输出的特征信息和多种疾病相关信息输出风险值,并根据风险值的损失值Lrisk优化模型的参数。作为举例,比如一个样本数据包括眼底图像P和疾病相关信息A、疾病相关信息B、疾病相关信息C和风险值R,则眼底图像P的标签为R,特征提取网络11对眼底图像P提取特征信息,并根据疾病相关信息A、疾病相关信息B、疾病相关信息C和特征信息输出与R相应的评估结果R’。
按照模型所识别疾病风险的种类,风险值可以是心血管风险值、糖尿病风险值和痴呆风险值。本实施例将风险值这一指标作为标签之一,并设置模型的一个输出网络输出关于风险值的结果,使模型直接学习风险值与眼底图像的关系,从而使训练后的模型能够直接得到风险值,由此可以提高其工作效率。
本发明的一个实施例提供一种疾病风险评估方法,本方法涉及机器学习模型,该模型可以但不限于使用上述实施例介绍的方法进行训练而得到。参照图3,本实施例的方法包括:获取用户的眼底图像20,利用机器学习模型21对眼底图像20进行识别,输出用于表示用户的疾病风险的评估结果。机器学习模型21包括特征提取网络211和多个输出网络212。其中特征提取网络211用于从眼底图像中提取特征信息,输出网络212用于分别根据特征信息输出评估结果。眼底图像20是通过眼底照相机所拍的图像,其中具有黄斑、视盘、血管等器官的影像。所述输出网络包括分类网络和/或回归网络。
本实施例中的多个输出网络212分别输出不同种类的评估结果。评估结果包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地信息中的部分或者全部。
根据本发明实施例提供的疾病风险评估方法,通过获取用户的眼底图像,并利用机器学习模型提取眼底图像的特征,根据该特征即可输出用于表示用户疾病风险的评估结果,本方案不需要采集用户的血样或者其它身体指标,只需要采集眼底图像,实现无创的评估过程;利用如电脑、智能手机和服务器等电子设备即可在短时间内得到受试者的疾病风险评估结果,具有很强的便利性和稳定性;并且本方案不需要引入如血样采集设备等专业医疗设备,也不需要医生或专业研究人员参与,由此可以降低评估疾病风险的成本。
上述评估结果可以间接确定该用户的疾病风险,在得到这些信息后可人为按照设定的标准评估风险,或者可以利用设定的算法计算风险值。在优选的实施例中,本方法还包括根据各个评估结果确定用于表示疾病风险的风险值。比如按照设定的cox函数或者逻辑回归模型,利用上述部分或全部评估结果计算风险值,此风险值表示5-10年内被评估人的发生疾病事件的几率。
具体地,cox函数为
Figure BDA0002352429890000091
其中Risk为风险值,β是各个指标(各种评估结果)的权值,X是指标数值(各种评估结果的数值),
Figure BDA0002352429890000092
是各个指标(各种评估结果)的均值;
逻辑回归模型为
Figure BDA0002352429890000101
其中P为风险值,β0是基础发病率的权重(预设值),β是各个指标(各种评估结果)的权值,X是指标数值(各种评估结果的数值)。
在一个可选的实施例,多个输出网络212中的一个直接输出上述风险值。如图4所示,本实施例中的机器学习模型包括n个输出网络212,它们分别根据眼底图像的特征信息输出如年龄、性别、收缩压、舒张压、糖尿病历史等评估结果,并且其中一个输出网络212输出风险值。直接输出风险值的方案更加直观,如果同时还输出其它相关信息,则还可以利用其它信息也计算出风险值,从而对输出结果进行验证,给予用户多方面的评估结果,提高评估准确性。
本发明的一个实施例提供一种疾病风险评估方法,本方法中涉及机器学习模型,该模型可以但不限于使用上述实施例介绍的方法进行训练而得到。本实施例的方法包括:获取用户的眼底图像,参照图5所示,眼底图像20是通过眼底照相机所拍的图像,其中具有黄斑、视盘、血管等器官的影像。
利用机器学习模型对眼底图像进行识别,输出用于表示用户的疾病风险的评估结果。本实施例中的机器学习模型包括特征提取网络211和唯一的输出网络212。其中特征提取网络211用于从眼底图像中提取特征信息,输出网络212用于根据特征信息输出评估结果,该评估结果为风险值,此风险值表示5-10年内被评估人的发生疾病事件的几率。或者,用户可以提供一种或多种容易采集的疾病相关信息,比如一些无创采集的信息,输出网络212可结合特征信息和多种疾病相关信息输出风险值。由于此模型不具备其它输出网络,因此在训练时可以提高效率。
由于此模型不具备其它输出网络,因此在训练时可以提高效率;评估时不呈现其它相关信息,结果简洁且直观,适合快速评估的应用场景。
作为第一个实施例,疾病风险评估方法可以为心血管风险评估方法,相应的评估结果包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部。在得到这些评估结果后,可以计算心血管风险值,或者模型输出的评估结果包括心血管风险值。
作为第二个实施例,疾病风险评估方法可以为糖尿病风险评估方法,相应的评估结果包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部。在得到这些评估结果后,可以计算糖尿病风险值,或者模型输出的评估结果包括糖尿病风险值。
作为第三个实施例,疾病风险评估方法可以为痴呆风险评估方法,相应的评估结果包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部。在得到这些评估结果后,可以计算痴呆风险值,或者模型输出的评估结果包括痴呆风险值。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims (25)

1.一种疾病风险评估模型构建方法,其特征在于,包括:
获取样本数据,包括眼底图像和多种疾病相关信息;利用大量所述样本数据对机器学习模型进行训练,使其输出用于表示患病风险的评估结果,所述机器学习模型包括特征提取网络和至少一个输出网络,其中所述特征提取网络用于从所述眼底图像中提取特征信息,所述至少一个输出网络用于分别根据所述特征信息输出与所述疾病相关信息相应的所述评估结果;所述机器学习模型根据输出的所述评估结果与样本数据中的所述疾病相关信息的差异调整自身的参数。
2.根据权利要求1所述的方法,其特征在于,所述至少一个输出网络包括分类网络和/或回归网络;
所述分类网络输出的评估结果为分类结果,所述分类结果与所述样本数据中相应的疾病相关信息的差异通过交叉熵函数进行表示;
所述回归网络输出的评估结果为数值,所述回归结果与所述样本数据中相应的疾病相关信息的差异通过误差函数进行表示。
3.根据权利要求1所述的方法,其特征在于,所述输出网络有多个,所述机器学习模型根据输出的所述评估结果与样本数据中的所述疾病相关信息的差异调整自身的参数,包括:
根据各种评估结果与样本数据中相应的疾病相关信息的差异确定多个第二损失值;
根据所述多个第二损失值确定第一损失值;
所述机器学习模型至少根据所述第一损失值调整自身参数。
4.根据权利要求3所述的方法,其特征在于,所述机器学习模型至少根据所述第一损失值调整所述特征提取网络的参数。
5.根据权利要求3或4所述的方法,其特征在于,所述机器学习模型还分别根据所述多个第二损失值调整相应的输出网络的参数。
6.根据权利要求1所述的方法,其特征在于,所述机器学习模型只有一个输出网络,用于根据所述特征信息和所述多种疾病相关信息输出与所述多种疾病相关信息中的一种相应的评估结果。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述疾病风险评估模型为心血管风险评估模型,所述疾病相关信息为心血管相关信息;所述心血管相关信息包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部。
8.根据权利要求7所述的方法,其特征在于,所述多种心血管相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它心血管相关信息确定的。
9.根据权利要求1-6中任一项所述的方法,其特征在于,所述疾病风险评估模型为糖尿病风险评估模型,所述疾病相关信息为糖尿病相关信息;所述糖尿病相关信息包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部。
10.根据权利要求9所述的方法,其特征在于,所述糖尿病相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它糖尿病相关信息确定的。
11.根据权利要求1-6中任一项所述的方法,其特征在于,所述疾病风险评估模型为痴呆风险评估模型,所述疾病相关信息为痴呆相关信息;所述痴呆相关信息包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部。
12.根据权利要求11所述的方法,其特征在于,所述痴呆相关信息还包括风险值,所述样本数据中的风险值是利用除自身外的其它痴呆相关信息确定的。
13.一种疾病风险评估方法,其特征在于,包括:获取用户的眼底图像;利用机器学习模型对所述眼底图像进行识别,输出用于表示所述用户的疾病风险的评估结果,所述机器学习模型包括特征提取网络和至少一个输出网络,其中所述特征提取网络用于从所述眼底图像中提取特征信息,所述至少一个输出网络用于分别根据所述特征信息输出所述评估结果。
14.根据权利要求13所述的方法,其特征在于,所述输出网络有多个,用于分别输出不同种类的评估结果。
15.根据权利要求13或14所述的方法,其特征在于,所述输出网络包括分类网络和/或回归网络。
16.根据权利要求13所述的方法,其特征在于,所述疾病风险为心血管风险;所述评估结果包括年龄、性别、收缩压、舒张压、糖尿病历史、高血压病史、高密度脂蛋白、低密度脂蛋白、BMI、腰围、吸烟史、总胆固醇、居住地、家族病史、糖化血红蛋白信息、尿酸信息中的部分或者全部。
17.根据权利要求16所述的方法,其特征在于,所述方法还包括:根据各个评估结果确定用于表示心脑血管风险的风险值。
18.根据权利要求13所述的方法,其特征在于,所述疾病风险为糖尿病风险;所述评估结果包括年龄、性别、收缩压、舒张压、家族糖尿病历史、高密度脂蛋白、三油甘脂、BMI、腰围、空腹血糖、餐后两小时血糖、葡萄糖耐量试验数据、血液白细胞计数中的部分或者全部。
19.根据权利要求18所述的方法,其特征在于,所述方法还包括:根据各个评估结果确定用于表示糖尿病风险的风险值。
20.根据权利要求13所述的方法,其特征在于,所述疾病风险为痴呆风险;所述评估结果包括年龄、性别、收缩压、BMI、受教育年限、总胆固醇、是否活跃参与体育运动、是否携带有APOEε4基因中的部分或者全部。
21.根据权利要求20所述的方法,其特征在于,所述方法还包括:根据各个评估结果确定用于表示痴呆风险的风险值。
22.根据权利要求13所述的方法,其特征在于,所述机器学习模型具有唯一的输出网络,用于输出表示疾病风险的风险值。
23.根据权利要求22所述的方法,其特征在于,所述风险值包括心血管风险值、糖尿病风险值和痴呆风险值。
24.一种心脑血管风险评估模型构建设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-12中任意一项所述的疾病风险评估模型构建方法。
25.一种疾病风险评估设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求13-23中任意一项所述的疾病风险评估方法。
CN201911421200.3A 2019-12-31 2019-12-31 基于眼底图像评估疾病风险的方法及设备 Pending CN111048210A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911421200.3A CN111048210A (zh) 2019-12-31 2019-12-31 基于眼底图像评估疾病风险的方法及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911421200.3A CN111048210A (zh) 2019-12-31 2019-12-31 基于眼底图像评估疾病风险的方法及设备

Publications (1)

Publication Number Publication Date
CN111048210A true CN111048210A (zh) 2020-04-21

Family

ID=70243174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911421200.3A Pending CN111048210A (zh) 2019-12-31 2019-12-31 基于眼底图像评估疾病风险的方法及设备

Country Status (1)

Country Link
CN (1) CN111048210A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696100A (zh) * 2020-06-17 2020-09-22 上海鹰瞳医疗科技有限公司 基于眼底影像确定吸烟程度的方法及设备
CN113689954A (zh) * 2021-08-24 2021-11-23 平安科技(深圳)有限公司 高血压风险预测方法、装置、设备及介质
CN114255234A (zh) * 2022-02-28 2022-03-29 北京鹰瞳科技发展股份有限公司 对基于眼底图像识别心脑血管风险的模型进行训练的方法及其相关产品
CN115482933A (zh) * 2022-11-01 2022-12-16 北京鹰瞳科技发展股份有限公司 用于对驾驶员的驾驶风险进行评估的方法及其相关产品
CN115602330A (zh) * 2022-12-15 2023-01-13 北京鹰瞳科技发展股份有限公司(Cn) 对评估冠心病危险级别的评估模型进行训练的方法和设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110301433A1 (en) * 2010-06-07 2011-12-08 Richard Scott Sadowsky Mental state analysis using web services
CN107358055A (zh) * 2017-07-21 2017-11-17 湖州师范学院 智能辅助诊断系统
CN107680683A (zh) * 2017-10-09 2018-02-09 上海睦清视觉科技有限公司 一种ai眼部健康评估方法
CN109886143A (zh) * 2019-01-29 2019-06-14 上海鹰瞳医疗科技有限公司 多标签分类模型训练方法和设备
WO2019200535A1 (zh) * 2018-04-17 2019-10-24 深圳华大生命科学研究院 基于人工智能的眼科疾病诊断建模方法、装置及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110301433A1 (en) * 2010-06-07 2011-12-08 Richard Scott Sadowsky Mental state analysis using web services
CN107358055A (zh) * 2017-07-21 2017-11-17 湖州师范学院 智能辅助诊断系统
CN107680683A (zh) * 2017-10-09 2018-02-09 上海睦清视觉科技有限公司 一种ai眼部健康评估方法
WO2019200535A1 (zh) * 2018-04-17 2019-10-24 深圳华大生命科学研究院 基于人工智能的眼科疾病诊断建模方法、装置及系统
CN109886143A (zh) * 2019-01-29 2019-06-14 上海鹰瞳医疗科技有限公司 多标签分类模型训练方法和设备

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111696100A (zh) * 2020-06-17 2020-09-22 上海鹰瞳医疗科技有限公司 基于眼底影像确定吸烟程度的方法及设备
CN113689954A (zh) * 2021-08-24 2021-11-23 平安科技(深圳)有限公司 高血压风险预测方法、装置、设备及介质
CN114255234A (zh) * 2022-02-28 2022-03-29 北京鹰瞳科技发展股份有限公司 对基于眼底图像识别心脑血管风险的模型进行训练的方法及其相关产品
CN114255234B (zh) * 2022-02-28 2022-05-20 北京鹰瞳科技发展股份有限公司 对基于眼底图像识别心脑血管风险的模型进行训练的方法及其相关产品
CN115482933A (zh) * 2022-11-01 2022-12-16 北京鹰瞳科技发展股份有限公司 用于对驾驶员的驾驶风险进行评估的方法及其相关产品
CN115482933B (zh) * 2022-11-01 2023-11-28 北京鹰瞳科技发展股份有限公司 用于对驾驶员的驾驶风险进行评估的方法及其相关产品
CN115602330A (zh) * 2022-12-15 2023-01-13 北京鹰瞳科技发展股份有限公司(Cn) 对评估冠心病危险级别的评估模型进行训练的方法和设备

Similar Documents

Publication Publication Date Title
CN111048210A (zh) 基于眼底图像评估疾病风险的方法及设备
Rady et al. Prediction of kidney disease stages using data mining algorithms
Yang et al. A single-channel EEG based automatic sleep stage classification method leveraging deep one-dimensional convolutional neural network and hidden Markov model
CN113011485B (zh) 多模态多病种长尾分布眼科疾病分类模型训练方法和装置
CN111080643A (zh) 基于眼底图像的糖尿病及相关疾病的分类方法及设备
CN111028232A (zh) 基于眼底图像的糖尿病分类方法及设备
CN110299205A (zh) 基于人工智能的生物医学信号特征处理及评测方法、装置及应用
CN107845424B (zh) 诊断信息处理分析的方法和系统
CN111612278A (zh) 生命状态预测方法、装置、电子设备及存储介质
CN111047590A (zh) 基于眼底图像的高血压分类方法及设备
CN115131642B (zh) 一种基于多视子空间聚类的多模态医学数据融合系统
CN115831364B (zh) 基于多模态特征融合的2型糖尿病风险分层预测方法
CN112932501A (zh) 一种基于一维卷积神经网络自动识别失眠方法
Bhaskar et al. A computationally efficient correlational neural network for automated prediction of chronic kidney disease
CN114783580A (zh) 一种医疗数据质量评估方法及系统
CN114300126A (zh) 一种基于早癌筛查问卷与前馈神经网络的癌症预测系统
CN114049957A (zh) 一种风险预测模型训练方法、疾病风险预测模型及方法
CN115547502B (zh) 基于时序数据的血透病人风险预测装置
KR102371440B1 (ko) 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템
Fazlur et al. Integrated Deep Learning Model for Heart Disease Prediction Using Variant Medical Data Sets.
Li et al. Automatic sleep staging by a hybrid model based on deep 1D-ResNet-SE and LSTM with single-channel raw EEG signals
Balnarsaiah et al. Parkinson’s disease detection using modified ResNeXt deep learning model from brain MRI images
Yousef et al. Classification of Diabetic Foot Thermal Images Using Deep Convolutional Neural Network.
Malik et al. Heart Disease Prediction Using Artificial Intelligence
Huang et al. Parkinson's severity diagnosis explainable model based on 3D multi-head attention residual network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220228

Address after: 102200 Room 202, floor 2, building 8, courtyard 9, Heying Road, science and Technology Park, Changping District, Beijing

Applicant after: Beijing Yingtong Medical Technology Co.,Ltd.

Applicant after: Beijing Yingtong Technology Development Co., Ltd

Address before: 200030 room 01, 8 building, 1 Yizhou Road, Xuhui District, Shanghai, 180

Applicant before: SHANGHAI EAGLEVISION MEDICAL TECHNOLOGY Co.,Ltd.