CN117831771B - 一种基于深度学习的疾病风险预测模型构建方法及系统 - Google Patents

一种基于深度学习的疾病风险预测模型构建方法及系统 Download PDF

Info

Publication number
CN117831771B
CN117831771B CN202410247940.4A CN202410247940A CN117831771B CN 117831771 B CN117831771 B CN 117831771B CN 202410247940 A CN202410247940 A CN 202410247940A CN 117831771 B CN117831771 B CN 117831771B
Authority
CN
China
Prior art keywords
data
processing
model
risk prediction
processing result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410247940.4A
Other languages
English (en)
Other versions
CN117831771A (zh
Inventor
庄永杰
陈继巧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KCI Biotech Suzhou Co Ltd
Original Assignee
KCI Biotech Suzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KCI Biotech Suzhou Co Ltd filed Critical KCI Biotech Suzhou Co Ltd
Priority to CN202410247940.4A priority Critical patent/CN117831771B/zh
Publication of CN117831771A publication Critical patent/CN117831771A/zh
Application granted granted Critical
Publication of CN117831771B publication Critical patent/CN117831771B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种基于深度学习的疾病风险预测模型构建方法及系统。属于医疗数据挖掘技术领域,所述方法包括:实时获取心脑血管疾病数据,并对获取的数据进行预处理;预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化。通过实时获取心脑血管疾病的临床数据和生物标志物数据,并对数据进行预处理,能够确保数据的准确性和完整性。

Description

一种基于深度学习的疾病风险预测模型构建方法及系统
技术领域
本发明提出了一种基于深度学习的疾病风险预测模型构建方法及系统,属于医疗数据挖掘技术领域。
背景技术
随着生活水平的提高和人口老龄化的加剧,心脑血管疾病已成为威胁人类健康的主要疾病之一。早期预测和预防心脑血管疾病对于提高患者的生活质量和降低医疗成本具有重要意义。然而,传统的疾病风险预测方法通常基于统计学模型,对数据的处理和分析能力有限,难以准确预测个体的疾病风险。
近年来,深度学习技术在图像识别、语音识别等领域取得了巨大成功。深度学习技术通过构建多层神经网络,能够自动提取数据的特征,并利用大量数据进行训练,提高模型的预测精度。然而,在疾病风险预测领域,深度学习技术的应用还处于起步阶段,如何构建一个准确、实时的疾病风险预测模型,以及如何评估和优化模型仍面临许多挑战。
发明内容
本发明提供了一种基于深度学习的疾病风险预测模型构建方法及系统,用以解决上述背景技术中提到的问题:
本发明提出的一种基于深度学习的疾病风险预测模型构建方法,所述方法包括:
实时获取心脑血管疾病数据,并对获取的数据进行预处理;
将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示。
进一步的,所述实时获取心脑血管疾病的数据,并对获取的数据进行预处理;包括
通过临床医疗服务系统实时获取心脑血管疾病数据,所述心脑血管疾病数据包括临床数据以及生物标志物数据;
对获取的心脑血管疾病数据进行预处理,所述预处理包括数据清洗、去除重复值以及缺失值填充;
对预处理后的数据进行标准化以及归一化处理,并对其进行压缩。
进一步的,所述将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;包括:
所述云空间获取压缩后的数据,将其标记为第一数据,并通过备份算法对所述第一数据进行备份获取第二数据;
将第一数据存入第一存储空间,将第二数据存入第二存储空间,对第一存储空间内的数据进行第一处理,对第二存储空间内的数据进行第二处理;
根据第一处理的结果获取第一处理结果,根据第二处理的结果获取第二处理结果。
进一步的,所述第一处理的步骤包括:
所述第一存储空间接收到第一数据后,根据数据类型对所述第一数据进行分段,并将分段后的所述第一数据存储至不同的子空间内;
将所述不同的子空间内分段后的第一数据划分为多个数据块,每个数据块表示一个子任务;
针对每个子任务,通过多线程并行处理算法,通过不同的计算资源对所述子任务进行并行处理,并获得处理结果;
通过合并算法将不同子空间内进行处理的处理结果进行合并,获得第一处理结果。
进一步的,所述第二处理的步骤包括:
所述第二存储空间接收到第二数据后,通过时间序列将所述第二数据划分为三部分,所述三部分包括第一部分,第二部分以及第三部分,所述第一部分占比65%,第二部分占比20%,第三部分占比15%;所述第一部分用于训练,第二部分用于验证,第三部分用于测试;
将划分为三部分的第二数据分别存储至不同的子空间;
将不同子空间内存储的第二数据根据数据类型划分为多个数据块,每个数据块表示一个子任务;通过独立的处理线程和/或进程对所述子任务进行并行处理,获得处理结果;
通过合并算法将所述处理结果进行合并,获得合并后的第二处理结果。
进一步的,所述基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化,包括:
对第一处理结果进行特征选择,选取与心脑血管疾病相关的特征,并将第一处理结果按照6:4的比例划分训练集以及验证集;
通过逻辑回归以及支持向量机构建疾病风险预测模型,在所述训练集上对所述疾病风险预测模型进行训练,并通过交叉验证对所述疾病风险预测模型进行选择与调参;
通过验证集对训练后的疾病风险预测模型的指标进行评估,并根据对指标的评估结果,分析模型存在的问题以及改进空间;
根据模型评估结果,对模型进行优化;
根据第二处理结果处理后获得的训练集对优化后的模型进行重新训练,并通过超参数对模型进行调优;
在训练过程中通过第二处理结果处理后获得的验证集对模型进行评估,通过验证集的性能指标来选择模型的参数配置;
训练以及验证完成后,根据第二处理结果处理后获得的测试集对经过训练和验证的模型进行最终评估;通过测试集的结果来检验模型的表现,并对模型进行进一步的优化和改进。
进一步的,所述将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示;包括:
收集新的个体数据,并对所述个体数据预处理;
将新的个体数据输入到评估及优化后的疾病风险预测模型中进行风险预测;
将模型预测的风险评估结果输出,所述风险评估结果包括预测的患病概率以及风险等级;
将风险评估结果通过可视化方式进行展示所述可视化方式包括条形图、饼图以及折线图;
根据风险评估结果,给出相应的结果解释和健康建议。帮助个体了解自己的健康状况并采取预防措施。例如,对于高风险个体,可以建议他们进行更频繁的体检、改善饮食、增加运动量等;对于中风险个体,可以建议他们进行规律的体检和血压、血脂、血糖监测等。同时,可以提供在线咨询和健康管理服务,帮助个体更好地管理自己的健康。
本发明提出的一种基于深度学习的疾病风险预测模型构建系统,所述系统包括:
数据获取模块:实时获取心脑血管疾病数据,并对获取的数据进行预处理;
数据处理模块:将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
模型构建模块:基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
风险评估模块:将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示。
本发明提出的一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述的存储器上运行的计算机程序,所述处理器执行所述程序,以实现如上述任一所述的一种基于深度学习的疾病风险预测模型构建方法。
本发明提出的一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现如上述任一所述的一种基于深度学习的疾病风险预测模型构建方法。
本发明有益效果:通过实时获取心脑血管疾病的临床数据和生物标志物数据,并对数据进行预处理,确保数据的准确性和完整性;通过将预处理后的数据存入云空间,并备份为第二数据,将数据分别存入不同的存储空间,并对不同存储空间内的数据进行处理,提高数据处理的效率和可靠性;基于深度学习算法利用第一处理结果构建疾病风险预测模型,通过第二处理结果对构建的模型进行评估和优化。特征选择、训练集和验证集的划分、逻辑回归和支持向量机等算法的应用,能够有效构建准确的疾病风险预测模型;将评估和优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测,并输出风险评估结果。通过可视化方式展示结果,使医生和患者能够直观地了解预测结果;根据模型评估结果对模型进行优化,并通过第二处理结果处理后获得的训练集和测试集对模型进行重新训练和评估。不断优化和改进模型,提高模型的准确性和可靠性。同时,根据数据类型将第一数据进行划分存储,并将其用于构建疾病风险预测模型。由于不同类型的数据可能具有不同的特征和重要性,划分存储可以更好地利用数据的特点,提高模型的准确性;通过将第二数据根据时间序列划分为训练集、验证集和测试集,可以更好地模拟模型在不同时间段的应用情况。利用第二数据对第一数据构建的模型进行评估和优化,可以及时发现模型的问题,并进行改进;第一数据用于构建初步的疾病风险预测模型,而第二数据用于对模型进行评估和优化。通过迭代优化,可以不断改进模型的性能,提高模型对心脑血管疾病的预测准确性和可靠性;通过使用第二数据对模型进行评估和优化,可以减少模型在训练集上的过拟合问题,提高模型的泛化能力。这样模型不仅可以准确预测已知数据,也能够对未知数据进行较好的预测。
附图说明
图1为本发明所述方法步骤图;
图2为本发明所述系统模块图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明的一个实施例,如图1所示,一种基于深度学习的疾病风险预测模型构建方法,所述方法包括:
S1:实时获取心脑血管疾病数据,并对获取的数据进行预处理;
S2:将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
S3:基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
S4:将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示。
上述技术方案的工作原理为:通过临床医疗服务系统实时获取心脑血管疾病的临床数据和生物标志物数据。对收集到的数据进行清洗,去除重复数据,并对缺失值进行填充。然后对数据进行标准化和归一化处理,确保数据的统一性和可比性。最后,使用压缩算法对处理后的数据进行压缩,以减少存储空间和提高计算效率;将预处理后的数据存入云空间,并备份为第二数据。同时,将第一数据和第二数据分别存入不同的存储空间。在不同的存储空间内对数据进行进一步的处理,可能包括特征选择、降维等操作,以提取更有用的特征;基于深度学习算法,使用第一处理结果构建疾病风险预测模型。该模型可以是分类模型或回归模型,根据具体需求选择适当的算法和模型架构。然后,使用第二处理结果对构建的模型进行评估和优化,可能包括调整模型参数、采用交叉验证等方法,以提高模型的性能和泛化能力。将评估和优化后的疾病风险预测模型应用于新的个体数据,对新的个体数据进行与训练数据相同的预处理操作,包括数据清洗、特征编码、特征缩放等。确保数据的格式和特征与模型输入一致;使用经过评估和优化的模型,对预处理后的个体数据进行预测。输入个体数据到模型中,获取预测结果;根据模型预测的结果,计算心脑血管疾病的风险评估值。这可以是一个概率值(如0-1之间的概率),或者是一个分类结果(如低风险、中等风险、高风险);将风险评估结果以可视化的方式展示出来,以便用户更直观地理解和分析。可以使用图表、图形或其他可视化工具来呈现风险评估结果,例如绘制柱状图、饼图、热力图等。确保可视化结果易于理解和解释。
上述技术方案的效果为:通过实时获取心脑血管疾病的数据,可以获取最新的临床数据和生物标志物数据,提高模型的准确性和时效性;对收集到的数据进行清洗、去重和缺失值填充等预处理操作,确保数据的一致性和可用性;通过标准化和归一化处理,使得不同特征的数据具有可比性,避免数据在不同尺度上的偏差影响模型训练;通过压缩算法对数据进行压缩处理,减少存储空间和提高计算效率;基于深度学习算法,使用预处理后的数据构建疾病风险预测模型,能够利用大量的数据特征来识别和预测心脑血管疾病;通过第二处理结果对构建的模型进行评估和优化,选择合适的模型参数和算法,提高模型的性能和泛化能力;将优化后的模型应用于新的个体数据,进行心脑血管疾病风险预测,能够提供个体的心脑血管健康风险等级,帮助医疗机构和个人了解和管理心脑血管健康;通过可视化方式展示风险评估结果,如图表、图形等,使用户能够直观地理解和分析结果,为医疗决策和健康管理提供有益的参考。
本发明的一个实施例,所述实时获取心脑血管疾病的数据,并对获取的数据进行预处理;包括
通过临床医疗服务系统实时获取心脑血管疾病数据,所述心脑血管疾病数据包括临床数据以及生物标志物数据;
对获取的心脑血管疾病数据进行预处理,所述预处理包括数据清洗、去除重复值以及缺失值填充;
对预处理后的数据进行标准化以及归一化处理,并对其进行压缩。
上述技术方案的工作原理为:通过临床医疗服务系统,可以实时获取患者的心脑血管疾病相关数据,包括临床数据(如症状、诊断、治疗方案等)以及生物标志物数据(如血压、血糖、血脂等);对获取的心脑血管疾病数据进行预处理,包括数据清洗、去除重复值以及缺失值填充。数据清洗是指对数据中的错误、异常或不完整的部分进行清理和修复,以确保数据的准确性和完整性;去除重复值是指在数据中找到并删除重复的条目;缺失值填充是指对缺失的数据进行估算或填充,以确保数据集完整性和可用性;对预处理后的数据进行标准化和归一化处理,以使数据具有统一的尺度和分布。标准化可以将不同尺度的数据转换为相同的标准尺度,避免不同变量之间的量纲影响;归一化则可以将数据限定在一定的范围内,消除了数据之间的量纲和单位差异;对处理后的数据进行压缩,可以采用各种压缩算法,如主成分分析(PCA)等,以减少数据的维度和复杂度,提高数据的处理效率和存储利用率。
上述技术方案的效果为:通过实时获取心脑血管疾病数据,可以及时了解患者的疾病状况,对患者进行更加精准和有效的诊断和治疗;对获取的心脑血管疾病数据进行预处理,可以去除数据中的噪声和异常值,提高数据的质量和可靠性,为后续的数据分析和建模提供保障;对预处理后的数据进行标准化和归一化处理,可以消除数据之间的量纲和单位差异,使得不同变量之间更容易进行比较和分析,提高数据的可读性和可解释性;对处理后的数据进行压缩,可以减少数据的维度和复杂度,提高数据的处理效率和存储利用率,节约计算资源和存储空间。
本发明的一个实施例,所述将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;包括:
所述云空间获取压缩后的数据,并将其标记为第一数据,并通过备份算法对所述第一数据进行备份获取第二数据;
将第一数据存入第一存储空间,将第二数据存入第二存储空间,对第一存储空间内的数据进行第一处理,对第二存储空间内的数据进行第二处理;
根据第一处理的结果获取第一处理结果,根据第二处理的结果获取第二处理结果。
上述技术方案的工作原理为:从云空间获取经过预处理和压缩后的数据,将其标记为第一数据,并通过备份算法对第一数据进行备份,得到第二数据;将第一数据存入第一存储空间,将第二数据存入第二存储空间。然后,针对不同存储空间内的数据,分别进行第一处理和第二处理操作,以获得第一处理结果和第二处理结果;根据第一处理的结果,获取第一处理结果;根据第二处理的结果,获取第二处理结果。其中,第一处理结果是指对收集的心脑血管疾病数据进行预处理后,存储在第一存储空间中并进行处理后得到的结果,用于构建深度学习模型。在第一处理阶段,将数据按照类型分段存储至不同的子空间,并对每个子任务进行多线程并行处理,最终将不同子空间内进行处理的处理结果进行合并,获得第一处理结果。第二处理结果是指对心脑血管疾病数据进行预处理后备份得到的第二数据,在存储至第二存储空间后进行处理后得到的结果。该结果用于评估和优化构建的深度学习模型。在第二处理阶段,将备份得到的第二数据按照时间序列划分为三部分,并分别存储至不同的子空间。然后,对每个子任务进行独立的处理线程和/或进程的并行处理,并通过合并算法将处理结果进行合并,获得合并后的第二处理结果。
上述技术方案的效果为:通过对第一数据进行备份获取第二数据,将数据存入不同的存储空间,并对其进行处理,可以提高数据的冗余性,增强数据的安全性和可靠性,一旦发生数据丢失或损坏,可以通过备份数据进行恢复,保障数据的完整性;将第一数据与第二数据分别存入不同的存储空间,并进行并行处理,可以有效提升数据处理的效率,缩短数据处理的时间,加快模型构建和优化的进程,提高工作效率;通过获得第一处理结果和第二处理结果,可以进行对比分析,验证两种处理方式的差异和影响,从而选择最优的数据处理策略,提高模型的准确性和稳定性;采用备份算法获取第二数据,将数据存入不同存储空间,并分别进行处理,使得系统具有更好的鲁棒性和灵活性,能够适应不同的数据处理需求和变化。
本发明的一个实施例,所述第一处理的步骤包括:
所述第一存储空间接收到第一数据后,根据数据类型对所述第一数据进行分段,并将分段后的所述第一数据存储至不同的子空间内;
将所述不同的子空间内分段后的第一数据划分为多个数据块,每个数据块表示一个子任务;
针对每个子任务,通过多线程并行处理算法,通过不同的计算资源对所述子任务进行处并行处理,并获得处理结果;
通过合并算法将不同子空间内进行处理的处理结果进行合并,获得第一处理结果。
上述技术方案的工作原理为:第一存储空间接收到第一数据后,根据数据类型对所述第一数据进行分段,并将分段后的所述第一数据存储至不同的子空间内,以便进行并行处理;将所述不同的子空间内分段后的第一数据划分为多个数据块,每个数据块表示一个子任务,以便并行处理;针对每个子任务,通过多线程并行处理算法,通过不同的计算资源对所述子任务进行处并行处理,并获得处理结果;通过合并算法将不同子空间内进行处理的处理结果进行合并,获得第一处理结果。其中,多线程并行处理算法的工作流程包括:第一存储空间根据数据类型对第一数据进行分段,将分段后的数据存储到不同的子空间内。将每个子空间内的分段数据划分为多个数据块,每个数据块表示一个子任务。对每个子任务,使用多线程并行处理算法,利用不同的计算资源并行处理子任务,得到处理结果。合并算法的工作流程包括合并算法读取第一存储空间中的所有子空间的处理结果;对于每个子空间的处理结果,合并算法将其整合成一个统一的结果。
上述技术方案的效果为:通过将第一数据分段存储至不同的子空间,并采用多线程并行处理算法对每个子任务进行并行处理,可以充分利用计算资源,提高数据处理的效率,加快处理速度,从而节省时间和成本;将第一数据进行分段存储和任务划分,可以将大规模的数据处理任务划分为多个独立的子任务,降低了单个任务的复杂性,使得任务处理更加简单和高效;通过合并算法将不同子空间内进行处理的结果进行合并,可以获得第一处理结果,进一步提高了数据处理的准确性和完整性,确保了处理结果的一致性;该技术方案可以根据需要对不同的子任务进行动态调整和分配计算资源,具有较好的可扩展性和灵活性,适应不同规模和复杂度的数据处理需求。综上所述,该技术方案通过并行处理、数据分段和任务划分、结果合并等方式,提高了数据处理的效率和准确性,同时具备较好的可扩展性和灵活性,为后续的数据处理工作提供了可靠的基础和支持。
本发明的一个实施例,所述第二处理的步骤包括:
所述第二存储空间接收到第二数据后,通过时间序列将所述第二数据划分为三部分,所述三部分包括第一部分,第二部分以及第三部分,所述第一部分占比65%,第二部分占比20%,第三部分占比15%;所述第一部分用于训练,第二部分用于验证,第三部分用于测试;
将划分为三部分的第二数据分别存储至不同的子空间;也即第一部分存储至第一子空间、第二部分存储至第二子空间,第三部分存储至第三子空间;
将不同子空间内存储的第二数据根据数据类型划分为多个数据块,每个数据块表示一个子任务;通过独立的处理线程和/或进程对所述子任务进行并行处理,获得处理结果;
通过合并算法将所述处理结果进行合并,获得合并后的第二处理结果。所述第二处理结果也即第一部分、第二部分以及第三部分的处理结果,第一部分处理结果也即训练集,第二部分结果也即验证集,第三部分结果也即测试集。
上述技术方案的工作原理为:第二数据通过时间序列被划分为三个部分,包括训练集、验证集和测试集。其中训练集占比65%,用于模型训练;验证集占比20%,用于调整模型参数并评估模型性能;测试集占比15%,用于最终的模型测试和评估;将划分后的第二数据分别存储至不同的子空间内,即训练集存储至第一子空间、验证集存储至第二子空间、测试集存储至第三子空间。每个子空间内的数据根据数据类型划分为多个数据块,每个数据块表示一个子任务;通过独立的处理线程和/或进程对每个子任务进行并行处理,获得对应的处理结果。这里采用并行处理的方式可以提高数据处理效率,降低计算成本,同时也适应了不同规模和复杂度的数据处理需求;通过合并算法将不同子空间内处理的结果进行合并,获得合并后的第二处理结果,包括训练集、验证集和测试集的处理结果。这里的处理结果包括模型参数、预测结果等,用于评估模型的性能和准确性。
上述技术方案的效果为:通过时间序列将第二数据划分为训练集、验证集和测试集,并将它们存储在不同的子空间中。这样做可以保持数据的完整性和独立性,避免了数据混合和重复使用,提高了模型训练和测试的可靠性;采用独立的处理线程和/或进程对每个子任务进行并行处理,可以大幅提高数据处理的效率和速度。并行处理能够同时处理多个子任务,充分利用计算资源,加快数据处理的速度,尤其是在大规模数据处理时具有明显的优势;通过合并算法将处理结果进行合并,得到完整的第二处理结果。合并算法可以根据需要进行加权、求平均等操作,从而获得全局的处理结果。这样做可以综合考虑不同部分的处理效果,提高整体模型的准确性和性能;通过将第二数据划分为训练集、验证集和测试集,可以对模型进行全面的评估和优化。训练集用于模型训练,验证集用于参数调整和模型选择,测试集用于最终的模型测试和评估。这样可以确保模型在不同数据上的泛化能力和稳定性。
本发明的一个实施例,所述基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化,包括:
对第一处理结果进行特征选择,选取与心脑血管疾病相关的特征,并将第一处理结果按照6:4的比例划分训练集,验证集;
通过逻辑回归以及支持向量机构建疾病风险预测模型,在所述训练集上对所述疾病风险预测模型进行训练,并通过交叉验证对所述疾病风险预测模型进行选择与调参;
通过验证集对训练后的疾病风险预测模型的指标进行评估,并根据对指标的评估结果,分析模型存在的问题以及改进空间;所述指标包括准确率、召回率、精确率以及F1值。
根据模型评估结果,对模型进行优化;所述优化包括调整特征选择、增加新特征、改变模型结构;
根据第二处理结果处理后获得的训练集对优化后的模型进行重新训练,并通过超参数对模型进行调优;
并在训练过程中通过第二处理结果处理后获得的验证集对模型进行评估,通过验证集的性能指标来选择模型的参数配置;
训练以及验证完成后,根据第二处理结果处理后获得的测试集对经过训练和验证的模型进行最终评估;通过测试集的结果来检验模型的表现,并对模型进行进一步的优化和改进。
上述技术方案的工作原理为:对第一处理结果进行特征选择,选取与心脑血管疾病相关的特征,并将其按照6:4的比例划分为训练集和验证集。特征选择是为了筛选出对心脑血管疾病预测有重要影响的特征,以提高模型的准确性和泛化能力;采用逻辑回归和支持向量机等深度学习算法构建疾病风险预测模型,并在训练集上对模型进行训练。逻辑回归和支持向量机是常用的分类算法,可以通过学习训练数据的特征和标签之间的关系,建立一个预测心脑血管疾病的模型;通过验证集对训练后的疾病风险预测模型的指标进行评估,包括准确率、召回率、精确率和F1值等。这些指标可以客观地评估模型的性能和效果,从而分析模型存在的问题和改进空间;根据模型评估结果,对模型进行优化。优化包括调整特征选择、增加新特征、改变模型结构等操作,以提高模型的预测能力和泛化能力,例如,假设验证集上评估训练后的疾病风险预测模型,得到了以下指标:准确率为90%,召回率为85%,精确率为92%,F1值为88%。根据这些指标,可以分析模型存在的问题以及改进空间。比如:准确率较高,说明模型对样本的分类能力较强,但召回率略低,可能存在一定程度的漏诊,即将真实的正例样本识别为负例。可以考虑增加训练数据、调整模型阈值或采用更加复杂的模型来提高召回率。精确率较高,说明模型对负例样本的分类能力较强,但F1值相对较低,可能存在误判和漏诊的情况。可以考虑进一步优化特征选择、调整模型参数、改变模型结构等方式来提高模型的预测准确性和鲁棒性。可以通过可视化方式对模型的学习曲线和决策边界进行分析,进一步了解模型的性能和表现,并通过对模型的可解释性进行探索,发现模型在哪些特征上具有更强的判断能力,进一步优化模型;使用第二处理结果处理后获得的训练集对优化后的模型进行重新训练,并通过超参数对模型进行调优。超参数是模型训练过程中需要手动设置的参数,通过调整超参数可以进一步提高模型的性能;在训练过程中,使用第二处理结果处理后获得的验证集对模型进行评估,并根据验证集的性能指标来选择模型的参数配置。这样可以避免模型在训练集上过拟合的问题,提高模型的泛化能力;训练和验证完成后,使用第二处理结果处理后获得的测试集对经过训练和验证的模型进行最终评估。通过测试集的结果来检验模型的表现,并根据测试集的反馈对模型进行进一步的优化和改进。
上述技术方案的效果为:通过对第一处理结果进行特征选择,选取与心脑血管疾病相关的特征,可以降低模型的复杂度,减少噪声和冗余信息的干扰,提高模型的训练和预测效果;采用逻辑回归和支持向量机等深度学习算法构建疾病风险预测模型,这些算法具有较强的分类能力和泛化能力,能够从训练数据中学习到特征与标签之间的关系,并构建出一个有效的预测模型;通过交叉验证对模型进行选择和调参,可以避免模型在训练集上过拟合的问题,提高模型的泛化能力和稳定性;通过对训练后的模型在验证集上进行评估,可以客观地评价模型的性能和效果。指标如准确率、召回率、精确率和F1值等可以反映模型对正负样本的识别能力和预测准确性;根据模型评估结果,对模型进行优化,包括调整特征选择、增加新特征和改变模型结构等。通过不断优化模型,可以提高预测准确率和泛化能力,适应更复杂的真实场景;通过超参数调优,如学习率、正则化参数等,可以进一步提高模型性能和泛化能力,使模型更好地适应不同的数据集和问题;使用处理后的测试集对经过训练和验证的模型进行最终评估,以验证模型的表现。通过测试集的结果,可以检验模型是否达到预期的效果,并根据需要对模型进行进一步的优化和改进。
本发明的一个实施例,所述将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示;包括:
收集新的个体数据,并对所述个体数据预处理;
将新的个体数据输入到评估及优化后的疾病风险预测模型中进行风险预测;
将模型预测的风险评估结果输出,所述风险评估结果包括预测的患病概率以及风险等级;
将风险评估结果通过可视化方式进行展示所述可视化方式包括条形图、饼图以及折线图;
根据风险评估结果,给出相应的结果解释和健康建议。帮助个体了解自己的健康状况并采取预防措施。
上述技术方案的工作原理为:首先,收集新的个体数据,包括临床数据和生物标志物数据。然后,对这些数据进行预处理,包括数据清洗、去除重复值和缺失值填充等操作,确保数据的完整性和准确性;将预处理后的新个体数据输入到评估及优化后的疾病风险预测模型中进行风险预测。该模型可能基于机器学习算法或统计模型开发而成,经过训练和优化,可以根据个体数据来预测心脑血管疾病的患病概率和风险等级;根据疾病风险预测模型的预测结果,生成风险评估结果,其中包括预测的患病概率和相应的风险等级。这些结果可以帮助医生和患者了解个体的心脑血管疾病风险程度;将风险评估结果通过可视化方式展示,例如使用条形图、饼图和折线图等形式,直观地呈现风险评估结果。这样可以帮助医生和患者更好地理解和分析个体的风险情况;根据风险评估结果,系统可以提供相应的结果解释和健康建议。例如,对于高风险个体,可以建议他们进行更频繁的体检、改善饮食、增加运动量等;对于中风险个体,可以建议他们进行规律的体检和血压、血脂、血糖监测等。同时,可以提供在线咨询和健康管理服务,帮助个体更好地管理自己的健康。
上述技术方案的效果为:通过对新的个体数据进行预处理和输入到疾病风险预测模型中,可以实现对每位个体的心脑血管疾病风险进行个性化评估,提高评估准确性和可靠性;通过可视化方式展示风险评估结果,例如使用条形图、饼图和折线图等形式,直观地呈现风险评估结果,让患者和医生更容易理解和分析个体的健康状况,从而提高治疗效果;根据风险评估结果,系统可以提供相应的健康建议和预防措施建议,帮助个体了解自身的健康状况并采取相应的预防措施,从而降低患病风险,提高生活质量。
本发明的一个实施例,如图2所示,一种基于深度学习的疾病风险预测模型构建系统,所述系统包括:
数据获取模块:实时获取心脑血管疾病数据,并对获取的数据进行预处理;
数据处理模块:将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
模型构建模块:基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
风险评估模块:将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示。
上述技术方案的工作原理为:通过临床医疗服务系统实时获取心脑血管疾病的临床数据和生物标志物数据。对收集到的数据进行清洗,去除重复数据,并对缺失值进行填充。然后对数据进行标准化和归一化处理,确保数据的统一性和可比性。最后,使用压缩算法对处理后的数据进行压缩,以减少存储空间和提高计算效率;将预处理后的数据存入云空间,并备份为第二数据。同时,将第一数据和第二数据分别存入不同的存储空间。在不同的存储空间内对数据进行进一步的处理,可能包括特征选择、降维等操作,以提取更有用的特征;基于深度学习算法,使用第一处理结果构建疾病风险预测模型。该模型可以是分类模型或回归模型,根据具体需求选择适当的算法和模型架构。然后,使用第二处理结果对构建的模型进行评估和优化,可能包括调整模型参数、采用交叉验证等方法,以提高模型的性能和泛化能力。将评估和优化后的疾病风险预测模型应用于新的个体数据,对新的个体数据进行与训练数据相同的预处理操作,包括数据清洗、特征编码、特征缩放等。确保数据的格式和特征与模型输入一致;使用经过评估和优化的模型,对预处理后的个体数据进行预测。输入个体数据到模型中,获取预测结果;根据模型预测的结果,计算心脑血管疾病的风险评估值。这可以是一个概率值(如0-1之间的概率),或者是一个分类结果(如低风险、中等风险、高风险);将风险评估结果以可视化的方式展示出来,以便用户更直观地理解和分析。可以使用图表、图形或其他可视化工具来呈现风险评估结果,例如绘制柱状图、饼图、热力图等。确保可视化结果易于理解和解释。
上述技术方案的效果为:通过实时获取心脑血管疾病的数据,可以获取最新的临床数据和生物标志物数据,提高模型的准确性和时效性;对收集到的数据进行清洗、去重和缺失值填充等预处理操作,确保数据的一致性和可用性;通过标准化和归一化处理,使得不同特征的数据具有可比性,避免数据在不同尺度上的偏差影响模型训练;通过压缩算法对数据进行压缩处理,减少存储空间和提高计算效率;基于深度学习算法,使用预处理后的数据构建疾病风险预测模型,能够利用大量的数据特征来识别和预测心脑血管疾病;通过第二处理结果对构建的模型进行评估和优化,选择合适的模型参数和算法,提高模型的性能和泛化能力;将优化后的模型应用于新的个体数据,进行心脑血管疾病风险预测,能够提供个体的心脑血管健康风险等级,帮助医疗机构和个人了解和管理心脑血管健康;通过可视化方式展示风险评估结果,如图表、图形等,使用户能够直观地理解和分析结果,为医疗决策和健康管理提供有益的参考。
本发明的一个实施例,一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述的存储器上运行的计算机程序,所述处理器执行所述程序,以实现如上述中任一所述的一种基于深度学习的疾病风险预测模型构建方法。
本发明的一个实施例,一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如上述中任一所述的一种基于深度学习的疾病风险预测模型构建方法。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (6)

1.一种基于深度学习的疾病风险预测模型构建方法,其特征在于,所述方法包括:
实时获取心脑血管疾病数据,并对获取的数据进行预处理;
将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示;
所述将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;包括:
所述云空间获取压缩后的数据,将其标记为第一数据,并通过备份算法对所述第一数据进行备份获取第二数据;
将第一数据存入第一存储空间,将第二数据存入第二存储空间,对第一存储空间内的数据进行第一处理,对第二存储空间内的数据进行第二处理;
根据第一处理的结果获取第一处理结果,根据第二处理的结果获取第二处理结果;
所述第一处理的步骤包括:
所述第一存储空间接收到第一数据后,根据数据类型对所述第一数据进行分段,并将分段后的所述第一数据存储至不同的子空间内;
将所述不同的子空间内分段后的第一数据划分为多个数据块,每个数据块表示一个子任务;
针对每个子任务,通过多线程并行处理算法,通过不同的计算资源对所述子任务进行并行处理,并获得处理结果;
通过合并算法将不同子空间内进行处理的处理结果进行合并,获得第一处理结果;
所述第二处理的步骤,包括:
所述第二存储空间接收到第二数据后,通过时间序列将所述第二数据划分为三部分,所述三部分包括第一部分,第二部分以及第三部分,所述第一部分占比65%,第二部分占比20%,第三部分占比15%;所述第一部分用于训练,第二部分用于验证,第三部分用于测试;
将划分为三部分的第二数据分别存储至不同的子空间;
将不同子空间内存储的第二数据根据数据类型划分为多个数据块,每个数据块表示一个子任务;通过独立的处理线程和/或进程对所述子任务进行并行处理,获得处理结果;
通过合并算法将所述处理结果进行合并,获得合并后的第二处理结果;
所述基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化,包括:
对第一处理结果进行特征选择,选取与心脑血管疾病相关的特征,并将第一处理结果按照6:4的比例划分训练集以及验证集;
通过逻辑回归以及支持向量机构建疾病风险预测模型,在所述训练集上对所述疾病风险预测模型进行训练,并通过交叉验证对所述疾病风险预测模型进行选择与调参;
通过验证集对训练后的疾病风险预测模型的指标进行评估,并根据对指标的评估结果,分析模型存在的问题以及改进空间;
根据模型评估结果,对模型进行优化;
根据第二处理结果处理后获得的训练集对优化后的模型进行重新训练,并通过超参数对模型进行调优;
在训练过程中通过第二处理结果处理后获得的验证集对模型进行评估,通过验证集的性能指标来选择模型的参数配置;
训练以及验证完成后,根据第二处理结果处理后获得的测试集对经过训练和验证的模型进行最终评估;通过测试集的结果来检验模型的表现,并对模型进行进一步的优化和改进。
2.根据权利要求1所述一种基于深度学习的疾病风险预测模型构建方法,其特征在于,所述实时获取心脑血管疾病的数据,并对获取的数据进行预处理;包括
通过临床医疗服务系统实时获取心脑血管疾病数据,所述心脑血管疾病数据包括临床数据以及生物标志物数据;
对获取的心脑血管疾病数据进行预处理,所述预处理包括数据清洗、去除重复值以及缺失值填充;
对预处理后的数据进行标准化以及归一化处理,并对其进行压缩。
3.根据权利要求1所述一种基于深度学习的疾病风险预测模型构建方法,其特征在于,所述将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示;包括:
收集新的个体数据,并对所述个体数据预处理;
将新的个体数据输入到评估及优化后的疾病风险预测模型中进行风险预测;
将模型预测的风险评估结果输出,所述风险评估结果包括预测的患病概率以及风险等级;
将风险评估结果通过可视化方式进行展示所述可视化方式包括条形图、饼图以及折线图;
根据风险评估结果,给出结果解释和健康建议。
4.一种用于实现如权利要求1所述基于深度学习的疾病风险预测模型构建方法的系统,其特征在于,所述系统包括:
数据获取模块:实时获取心脑血管疾病数据,并对获取的数据进行预处理;
数据处理模块:将预处理后的数据存入云空间,进行标记,对标记后的数据进行备份,将标记前后的数据分别存入不同的存储空间,并对不同存储空间内的数据分别进行处理;获得第一处理结果以及第二处理结果;
模型构建模块:基于深度学习算法通过所述第一处理结果构建疾病风险预测模型,通过所述第二处理结果对构建的所述疾病风险预测模型进行评估及优化;
风险评估模块:将评估及优化后的疾病风险预测模型应用于新的个体数据,进行心脑血管疾病风险预测;并输出风险评估结果,将风险评估结果通过可视化方式进行展示。
5.一种电子设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述的存储器上运行的计算机程序,所述处理器执行所述程序,以实现如权利要求的1-3中任一所述的一种基于深度学习的疾病风险预测模型构建方法。
6.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行,以实现如权利要求1-3中任一所述的一种基于深度学习的疾病风险预测模型构建方法。
CN202410247940.4A 2024-03-05 2024-03-05 一种基于深度学习的疾病风险预测模型构建方法及系统 Active CN117831771B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410247940.4A CN117831771B (zh) 2024-03-05 2024-03-05 一种基于深度学习的疾病风险预测模型构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410247940.4A CN117831771B (zh) 2024-03-05 2024-03-05 一种基于深度学习的疾病风险预测模型构建方法及系统

Publications (2)

Publication Number Publication Date
CN117831771A CN117831771A (zh) 2024-04-05
CN117831771B true CN117831771B (zh) 2024-05-17

Family

ID=90523155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410247940.4A Active CN117831771B (zh) 2024-03-05 2024-03-05 一种基于深度学习的疾病风险预测模型构建方法及系统

Country Status (1)

Country Link
CN (1) CN117831771B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648827A (zh) * 2018-05-11 2018-10-12 北京邮电大学 心脑血管疾病风险预测方法及装置
CN114035936A (zh) * 2021-10-15 2022-02-11 北京潞晨科技有限公司 一种基于人工智能的多维并行处理方法、系统、设备和可读存储介质
CN117012392A (zh) * 2023-08-04 2023-11-07 中国人民解放军总医院第二医学中心 高血压风险评估模型构建方法、膳食食疗及健康管理系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108648827A (zh) * 2018-05-11 2018-10-12 北京邮电大学 心脑血管疾病风险预测方法及装置
CN114035936A (zh) * 2021-10-15 2022-02-11 北京潞晨科技有限公司 一种基于人工智能的多维并行处理方法、系统、设备和可读存储介质
CN117012392A (zh) * 2023-08-04 2023-11-07 中国人民解放军总医院第二医学中心 高血压风险评估模型构建方法、膳食食疗及健康管理系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于深度学习的心脑血管疾病预测方法研究;马宗帅;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20160115(第第1期期);摘要、正文第21-30页 *

Also Published As

Publication number Publication date
CN117831771A (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
CN109770903B (zh) 功能磁共振影像的分类预测系统
JP2021504061A (ja) 脊椎骨折を識別するための3次元医用画像解析の方法及びシステム
CN110051324B (zh) 一种急性呼吸窘迫综合征死亡率预测方法及系统
CN111598867B (zh) 用于检测特定面部综合征的方法、装置及计算机可读存储介质
WO2023198224A1 (zh) 一种精神障碍类磁共振图像初步筛查模型构建方法
CN112183572A (zh) 一种生成预测肺炎严重程度的预测模型的方法及装置
CN111340794A (zh) 冠状动脉狭窄的量化方法及装置
CN117315379B (zh) 面向深度学习的医学影像分类模型公平性评估方法及装置
CN110403611B (zh) 血液中糖化血红蛋白成分值预测方法、装置、计算机设备和存储介质
CN117831771B (zh) 一种基于深度学习的疾病风险预测模型构建方法及系统
CN116864121A (zh) 健康风险筛查系统
US11776126B2 (en) Systems and methods for evaluating the brain after onset of a stroke using computed tomography angiography
CN114564992A (zh) 一种基于病理数据的病理特征概率分布预测方法及系统
CN114550930A (zh) 疾病预测方法、装置、设备及存储介质
CN113693584A (zh) 抑郁症症状预测变量的选择方法、计算机设备及存储介质
Kavya et al. Heart Disease Prediction Using Logistic Regression
Muthulakshmi et al. Big Data Analytics for Heart Disease Prediction using Regularized Principal and Quadratic Entropy Boosting
CN116738352B (zh) 视网膜血管阻塞疾病的视杆细胞异常分类方法及装置
Leinonen et al. Empirical investigation of multi-source cross-validation in clinical machine learning
Seják et al. ElectroCardioGuard: Preventing patient misidentification in electrocardiogram databases through neural networks
Darmawahyuni et al. Analysis of Classifier Performance on ECG Interpretation for Precision Medicine: Which performance metrics should we use?
Nagarjuna et al. Machine Learning Based Prognosis of Heart Malady
EP4198997A1 (en) A computer implemented method, a method and a system
CN118172645A (zh) 一种人工智能图像识别方法、装置和电子设备
CN115170549A (zh) 一种血管病变的确定方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant