CN118098575A

CN118098575A - 一种早发冠心病预测方法及系统

Info

Publication number: CN118098575A
Application number: CN202410489564.XA
Authority: CN
Inventors: 杜海林
Original assignee: People's Hospital Of Qingbaijiang District Chengdu
Current assignee: People's Hospital Of Qingbaijiang District Chengdu
Priority date: 2024-04-23
Filing date: 2024-04-23
Publication date: 2024-05-28

Abstract

本发明涉及人工智能技术领域，具体涉及一种早发冠心病预测方法及系统，该方法通过引入与早发冠心病存在更明显相关性的个人数据和基础医疗数据，结合拓展医疗数据，为个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集、拓展医疗数据对应的第三特征向量集分配适宜的权重，全面并以适宜的权重考虑目标对象各项指标对早发冠心病患病概率的影响，并在特征处理过程中引入软阈值去除层滤除影响早发冠心病预测结果准确性的不必要特征，最终通过归一化处理得到早发冠心病患病概率，提高了早发冠心病预测结果的全面性和准确性。

Description

一种早发冠心病预测方法及系统

技术领域

本发明涉及人工智能技术领域，尤其是一种早发冠心病预测方法及系统。

背景技术

冠状动脉粥样硬化性心脏病是一种临床上常见的因冠状动脉狭窄或阻塞导致心肌缺血缺氧所致的心脏病。随着人们生活水平、饮食习惯和精神压力的不断改变，青少年的超重、肥胖呈明显增加趋势，导致冠心病的发病年龄也越来越低龄化，即早发冠心病（男＜55岁，女＜65岁）。早发冠心病正以不低的比率在年轻人群中发病，发病前多无征兆、发病急、多表现为急性冠脉综合征（Acute Coronary Syndrome, ACS）。近年来ACS的发病率和死亡率逐渐升高，尤其是早发冠心病罹患ACS不但严重威胁生命健康，也给家庭、社会带来了沉重的经济负担，因而亟需对早发冠心病进行准确预测以针对可能罹患早发冠心病的人群进行防治策略研究。

现有的早发冠心病预测方法大部分采用机器学习方法，利用低密度脂蛋白（LDL）、C-反应蛋白（CRP）等医学生化指标，并结合目标对象的年龄、性别等基础信息实现对早发冠心病的预测。然而，现有的早发冠心病预测方法所依据的医学生化指标与早发冠心病不具有强相关性，如C-反应蛋白在目标对象体内具有炎症时也会呈现升高现象，因此无法全面、准确地预测目标对象是否会罹患早发冠心病。

发明内容

为解决上述现有技术问题，本发明提供早发冠心病预测方法及系统，能够全面、准确地对目标对象进行早发冠心病预测。

为了达到上述技术目的，本发明所采取的技术方案包括：

第一方面，本发明提供了一种早发冠心病预测方法，包括：

获取目标对象的相关数据，相关数据包括个人数据、基础医疗数据和拓展医疗数据，个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原；或者，拓展医疗数据为0；

对相关数据进行编码处理，并对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集；

在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重；

将分配好权重的第一特征向量集、第二特征向量集、第三特征向量集送入预设的残差网络，得到残差输出结果，残差网络包括若干个残差块以及在每个残差块做特征融合后的位置设置的软阈值去除层；

将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

另外，本发明的一种早发冠心病预测方法，还可以具有以下附加的技术特征：

进一步地，本发明的一种早发冠心病预测方法中，获取目标对象的相关数据包括：

响应于目标对象完成诊疗服务或者体检服务，读取目标对象的数据；

确认目标对象的数据中存在基础医疗数据，将目标对象的数据确定为相关数据。

进一步地，在本发明中，在获取目标对象的相关数据后，早发冠心病预测方法还包括：

将个人数据、基础医疗数据和拓展医疗数据分别存储至各自对应的不同的数据表中。

进一步地，在本发明中，对相关数据进行编码处理包括：

分别对个人数据中的所有项、基础医疗数据中的所有项和拓展医疗数据中的所有项求均值、方差、最大值、最小值后做标准化。

进一步地，在本发明中，对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集包括：

采用预设的特征提取网络对编码后的相关数据进行特征提取，得到第一特征向量集、第二特征向量集和第三特征向量集，特征提取网络包括由稠密网络组成的稠密块以及依次设置在稠密块后的max-pooling层、Dropout层、Flatten层和Dense层。

进一步地，在本发明中，早发冠心病预测方法还包括：

以图表的形式展示相关数据和早发冠心病预测结果。

第二方面，本发明提出了一种早发冠心病预测系统，包括：

服务端模块，所述服务端模块包括用户管理子单元和数据分析子单元；

其中，用户管理子单元用于获取目标对象的相关数据，相关数据包括个人数据、基础医疗数据和拓展医疗数据，个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原；或者，拓展医疗数据为0；

数据分析子单元用于对相关数据进行编码处理，并对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集；数据分析子单元用于在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重；数据分析子单元用于将分配好权重的第一特征向量集、第二特征向量集、第三特征向量集送入预设的残差网络，得到残差输出结果，残差网络包括若干个残差块以及在每个残差块做特征融合后的位置设置的软阈值去除层；数据分析子单元还用于将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

进一步地，在本发明中，早发冠心病预测系统还包括客户端模块，客户端模块包括数据采集子单元、数据上传子单元；

其中，数据采集子单元用于响应于目标对象完成诊疗服务或者体检服务，读取目标对象的数据；

数据上传子单元用于确认目标对象的数据中存在基础医疗数据，将目标对象的数据确定为相关数据。

进一步地，在本发明中，客户端模块还包括数据展示子单元；

数据展示子单元用于以图表的形式展示相关数据和早发冠心病预测结果。

进一步地，在本发明中，用户管理子单元还用于将个人数据、基础医疗数据和拓展医疗数据分别存储至各自对应的不同的数据表中。

本发明的有益效果体现在，通过获取目标对象的个人数据、基础医疗数据和拓展医疗数据，其中个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原，或者为0；然后对相关数据进行编码处理后进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集，并在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重，使得第二特征向量集中的特征向量的权重最高，同时为第一特征向量集中的特征向量和第三特征向量集中的特征向量分配了适宜的权重，进而将分配好权重的第一特征向量集、第二特征向量集和第三特征向量集送入设置有软阈值去除层的残差网络，在特征融合的同时滤除不必要的特征，最终将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。本发明引入了与早发冠心病存在更明显相关性的个人数据和基础医疗数据，结合拓展医疗数据，为个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集、拓展医疗数据对应的第三特征向量集分配适宜的权重，全面地并以适宜的权重考虑目标对象各项指标对早发冠心病患病概率的影响，并在特征处理过程中引入软阈值去除层滤除影响早发冠心病预测结果准确性的不必要特征，最终通过归一化处理得到早发冠心病患病概率，提高了早发冠心病预测结果的全面性和准确性。

附图说明

图1为本发明所提供的一种早发冠心病预测方法具体实施例的流程示意图；

图2为本发明所提供的一种早发冠心病预测方法具体实施例的相关数据获取流程示意图；

图3为本发明所提供的一种早发冠心病预测方法具体实施例的特征提取网络结构示意图；

图4为本发明所提供的一种早发冠心病预测系统具体实施例的结构示意图；

图5为本发明所提供的另一种早发冠心病预测系统具体实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现有的早发冠心病预测方法大部分采用机器学习方法，利用低密度脂蛋白（LDL）、C-反应蛋白（CRP）等医学生化指标，并结合目标对象的年龄、性别等基础信息实现对早发冠心病的预测。然而，现有的早发冠心病预测方法所依据的医学生化指标与早发冠心病不具有强相关性，如C-反应蛋白在目标对象体内具有炎症时也会呈现升高现象，因此无法全面、准确地预测目标对象是否会罹患早发冠心病。为此，本发明实施例提出了一种早发冠心病预测方法及系统，通过获取目标对象的个人数据、基础医疗数据和拓展医疗数据，其中个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原，或者为0；然后对相关数据进行编码处理后进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集，并在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重，使得第二特征向量集中的特征向量的权重最高，同时为第一特征向量集中的特征向量和第三特征向量集中的特征向量分配了适宜的权重，进而将分配好权重的第一特征向量集、第二特征向量集和第三特征向量集送入设置有软阈值去除层的残差网络，在特征融合的同时滤除不必要的特征，最终将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。本发明引入了与早发冠心病存在更明显相关性的个人数据和基础医疗数据，结合拓展医疗数据，为个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集、拓展医疗数据对应的第三特征向量集分配适宜的权重，全面地并以适宜的权重考虑目标对象各项指标对早发冠心病患病概率的影响，并在特征处理过程中引入软阈值去除层滤除影响早发冠心病预测结果准确性的不必要特征，最终通过归一化处理得到早发冠心病患病概率，提高了早发冠心病预测结果的全面性和准确性。

参照图1，本发明实施例中的一种早发冠心病预测方法，包括：

S101、获取目标对象的相关数据。

其中，目标对象为本发明实施例需要进行早发冠心病预测的对象，相关数据包括个人数据、基础医疗数据和拓展医疗数据，个人数据包括身高和体重/>，基础医疗数据包括甘油三酯数据/>和空腹血糖数据/>，拓展医疗数据包括肌酸激酶、C-反应蛋白/>、纤维蛋白原；或者，拓展医疗数据为除基础医疗数据外的医疗数据或者0。本发明实施例用/>表示目标对象的相关数据，其中/>表示基础医疗数据，/>表示拓展医疗数据，/>表示个人数据。

需要说明的是，拓展医疗数据视情况而定，当目标对象做了相应的检测时获取对应的拓展医疗数据，否则本发明实施例用0填补拓展医疗数据的值，补全相关数据中的空缺项，从而确保输入后续数据处理的相关模型的相关数据的尺寸统一，提高预测结果的可靠性和准确性。

具体地，本发明实施例自动获取目标对象的相关数据，根据目标对象的个人数据中的身高和体重/>能够计算得到目标对象的身体质量指数/>：

；

根据目标对象的基础医疗数据中的甘油三酯数据和空腹血糖数据/>能够计算得到目标对象的甘油三酯葡萄糖数据/>：

；

然后根据目标对象的身体质量指数和甘油三酯葡萄糖数据/>能够计算得到目标对象的甘油三酯葡萄糖体质量指数/>：

；

本发明实施例在获取目标对象的相关数据时自动完成目标对象的身体质量指数、甘油三酯葡萄糖数据/>以及甘油三酯葡萄糖体质量指数/>的计算。

近年来甘油三酯葡萄糖体质量指数在代谢性疾病研究领域受到了广泛关注，其在评估糖尿病前期、高血压前期、动脉粥样硬化、高尿酸血症、非酒精性脂肪肝等多种临床常见疾病表现出良好的预测性能。然而，在早发冠心病预测领域/>鲜有涉及。根据相关研究可知，甘油三酯葡萄糖体质量指数/>与冠心病存在明显相关性，因此基于上述计算过程，本发明实施例获取的目标对象的相关数据与冠心病存在明显相关性。

由此，本发明实施例能够自动获取目标对象与早发冠心病具有明显相关性的相关数据，使得后续能够以该相关数据为基础对目标对象罹患早发冠心病的概率进行预测。

可选地，在一些实施例中，目标对象的个人数据还包括性别、年龄/>、以及有无高血压/>、脂肪肝/> />、高尿酸血症/>等基础病史。

参照图2，可选地，在一些实施例中，获取目标对象的相关数据可以包括：

步骤S11、响应于目标对象完成诊疗服务或者体检服务，读取目标对象的数据；

步骤S12、确认目标对象的数据中存在基础医疗数据，将目标对象的数据确定为相关数据。

具体地，对于步骤S11，本发明实施例与各医疗机构的医疗系统对接，在目标对象完成诊疗服务或者体检服务时自动读取目标对象诊疗或者体检过程测得的数据，使得目标对象在进行诊疗或者体检的同时能够自动上传其相关数据以供本发明实施例基于该相关数据进行早发冠心病预测，具有方便、快捷、全面的优势，为针对早发冠心病人群的防治策略提供及时、全面的数据支撑。

对于步骤S12，根据前述可知，目标对象的基础医疗数据与早发冠心病存在明显相关性，能够提高早发冠心病预测结果的准确性。本发明实施例在步骤S11读取目标对象的数据后自动判断目标对象的数据中是否存在基础医疗数据，若是则将步骤S11读取到的目标对象的数据确定为相关数据。

可选地，在一些实施例中，在步骤S101获取到目标对象的相关数据后，早发冠心病预测方法还可以包括：

其中，每个数据表中的数据以其自身的简写作为数据索引。

S102、对相关数据进行编码处理，并对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集。

具体地，本发明实施例对相关数据进行编码处理，得到编码后的相关数据/>，以提高相关数据的准确性和可用性，便于后续进行特征提取和早发冠心病预测，更好地捕捉相关数据中的信息，提高早发冠心病预测结果的全面性、准确性和可靠性。同时，本发明实施例提取编码后的相关数据的特征，能够减少编码后的相关数据的数据维度，并提取或整理出有效的第一特征向量、第二特征向量和第三特征向量以便于后续基于这些特征对目标对象进行早发冠心病的预测。

其中，本发明实施例可采用的编码处理方式包括：

独热编码（One-Hot Encoding）：将相关数据中的各项数据转换为二进制形式，每个可能的取值都对应一个新的二进制特征。

标签编码（Label Encoding）：将相关数据中的各项数据转换为整数形式，每个不同的类别被映射为一个整数。

数值型数据标准化（Normalization）：对数值型特征进行标准化处理，将其缩放到一个特定的范围内，如0到1或者-1到1之间。标准化可以保证不同特征的尺度一致，有利于模型的训练和收敛。

类别型数据处理（Categorical Data Processing）：对类别型数据进行处理，包括独热编码、标签编码等。这种处理方法可以将非数值型数据转换为模型可接受的数值型数据，从而应用于机器学习模型中。

缺失值处理（Missing Value Imputation）：处理相关数据中的缺失值，采用合适的方法填充缺失值，如均值、中位数、众数填充等。缺失值处理有助于提高预测性能。

特征工程（Feature Engineering）：通过组合、转换、筛选等方法创建新的特征，以提高模型的性能和泛化能力。特征工程是医疗数据分析中至关重要的一步，可以帮助模型更好地捕捉数据中的信息。

可选地，在一些实施例中，步骤S102可以包括：

分别对个人数据中的所有项、基础医疗数据中的所有项和拓展医疗数据中的所有项求均值、方差、最大值、最小值后做标准化，得到所述编码后的相关数据。

可以理解的是，本发明实施例分别对个人数据中的所有项、基础医疗数据中的所有项和拓展医疗数据中的所有项求均值、方差、最大值、最小值后做标准化，能够补全相关数据中的缺失值，提高相关数据的可靠性、完整性以及后续早发冠心病预测结果的准确性和全面性。

可选地，在一些实施例中，采用StandardScaler进行数据标准化处理。

可选地，在一些实施例中，步骤S103并对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集可以包括：

采用预设的特征提取网络对编码后的相关数据进行特征提取，得到第一特征向量集、第二特征向量集和第三特征向量集。

参照图3，其中，特征提取网络包括由稠密网络（DenseNets）组成的稠密块（Dense-Block）以及依次设置在所述稠密块后的max-pooling层、Dropout层、Flatten层和Dense层。

根据图3可知，特征提取网络中设置有若干个稠密块，部分稠密块具有不同的卷积核，但每个稠密块中的组件大小保持不变。

需要说明的是：

卷积核是神经网络中用于提取特征的滤波器。在卷积层中，卷积核通过在输入数据上滑动并进行卷积操作，从而提取出输入数据中的特征信息。

max-pooling层是池化层的一种，用于对特征图进行下采样。在 Max-Pooling 中，将每个池化区域中的最大值作为该区域的输出，从而减少特征图的尺寸，提高计算效率和减少过拟合。

Dropout层是一种正则化技术，用于随机地将神经元的输出设置为零，从而减少神经网络的过拟合。Dropout层可以防止网络过度依赖某些特定的神经元，提高模型的泛化能力。

Flatten层用于将多维的特征图展平成一维向量，以便传递给后续的全连接层进行分类或回归等任务。

Dense层是全连接层，它将上一层的所有神经元连接到下一层的所有神经元，实现特征的线性组合和映射。

在本发明的实施例中，若目标对象的相关数据的数据量过小，则预测结果的可靠性和准确性会受到影响。为此，本发明实施例在稠密块后依次设置max-pooling层、Dropout层、Flatten层和Dense层，通过max-pooling层减少特征图的尺寸，提高计算效率和减少过拟合，通过Dropout层减少神经网络的过拟合，通过Flatten层将多维的特征图展平成一维向量，最后通过Dense层实现特征的线性组合和映射，从而实现了更好的特征提取效果和梯度流动效果，克服了目标对象的相关数据的数据量的局限性，提高了预测结果的可靠性和准确性。

S104、在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重。

其中，可以理解的是，第二特征向量集中的特征向量的权重最高，同时本发明还为第一特征向量集中的特征向量和第三特征向量集中的特征向量分配了适宜的权重，使得本发明实施例后续基于分配好权重的第一特征向量集、第二特征向量集、第三特征向量集进行早发冠心病预测时能够全面且有侧重地考虑个人数据、基础医疗数据和拓展医疗数据对早发冠心病患病概率的影响，提高预测结果的全面性和准确性。

需要说明的是，Relief特征选择算法是一种常用的基于样本权重的特征选择算法。它最初由Kira和Rendell于1992年提出，并在后来的研究中不断改进和扩展。Relief算法的基本思想是通过比较样本与其邻近样本之间的特征差异来评估特征的重要性，从而选择最具区分性的特征。

具体地，本发明实施例在采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量、第三特征向量集中的特征向量分配权重时，首先进行初始化，设置参数k以及迭代次数t，其中k用来表示每个样本邻近样本的数量。

在基础医疗数据对应的第二特征向量集中随机选择一个样本，计算其与其他样本的距离，并根据距离找到该样本的k个最近邻样本，其中包括同类别样本和异类别样本。对于第二特征向量集中的每个特征向量，计算该特征向量对于同类别样本和异类别样本之间的差异度并根据特征差异度调整特征向量的权重。重复上述步骤t次后得到每个特征向量的平均权重。

其中，对于每个特征，Relief算法通过计算同类别样本和异类别样本之间的差异度来衡量其重要性。在完成迭代后，根据特征权重，可以选择排名靠前的特征作为最重要的特征，从而进行特征选择。

可以理解的是，本发明实施例采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量、第三特征向量集中的特征向量分配权重，不依赖于数据分布的先验假设，灵活性和适用性较高，并且通过样本之间的比较提高了对数据中的噪声的鲁棒性，同时还具有较高的计算效率。

S104、将分配好权重的第一特征向量集、第二特征向量集、第三特征向量集送入预设的残差网络，得到残差输出结果。

其中，残差网络包括若干个残差块以及在每个残差块做特征融合后的位置设置的软阈值去除层。

需要说明的是，残差网络ResNet通过残差学习来解决深度神经网络中的梯度消失和梯度爆炸问题。ResNet的核心思想是引入了残差块（residual block），使得网络可以学习残差映射而不是直接学习底层到顶层的映射关系，从而减轻了网络的训练难度并提高了收敛速度。ResNet中的基本单元是残差块，它包含了跨层的连接。在传统的CNN中，每个层的输入都是前一层的输出，而在残差块中，如果该层的输出与输入尺寸不同，就通过一个恒等映射（identity mapping）或者一个 1x1 的卷积来匹配维度。这种跨层连接使得网络可以更容易地学习残差，避免了深度增加时的性能下降问题。

在本发明的实施例中，残差网络包括若干个残差块以及在每个残差块做特征融合后的位置设置的软阈值去除层。可以理解的是，在特征融合层后，可能会存在一些不相关或不重要的特征，这些特征可能会对最终的预测结果产生负面影响。本发明实施例通过在每个残差块做特征融合后的位置设置软阈值去除层，并通过设置一个阈值将特征值小于阈值的部分置为零，从而去除噪声和不相关的特征，提高对输入的第一特征向量、第二特征向量和第三特征向量的泛化能力，并减少了后续预测过程的计算量和计算成本，提高预测效率和预测的准确性。更为重要的是，本发明实施例在步骤S103为个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集、拓展医疗数据对应的第三特征向量集分配适宜的权重，全面地并以适宜的权重考虑目标对象各项指标对早发冠心病患病概率的影响，并在步骤S104的特征处理过程中引入软阈值去除层滤除影响早发冠心病预测结果准确性的不必要特征，提高了早发冠心病预测结果的全面性和准确性。

S105、将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

本发明实施例将残差输出结果通过Softmax函数进行归一化处理，得到目标对象罹患早发冠心病的概率预测值。具体如下：

；

其中，表示第/>个神经元的输入，神经元的数目为/>，/>表示/>作为输入的预测结果，具体为概率值。

可选地，在一些实施例中，早发冠心病预测方法还可以包括：

以图表的形式展示相关数据和早发冠心病预测结果。

具体地，本发明实施例是是存储目标对象的相关数据和早发冠心病预测结果，以供用户随时查看，并通过图表的形式展示相关数据和早发冠心病预测结果，使得目标对象的相关数据和早发冠心病预测结果更加直观。

综上所述，本发明实施例采用上述步骤S101-S105的早发冠心病预测方法，通过获取目标对象的个人数据、基础医疗数据和拓展医疗数据，其中个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原，或者为0；然后对相关数据进行编码处理后进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集，并在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重，使得第二特征向量集中的特征向量的权重最高，同时为第一特征向量集中的特征向量和第三特征向量集中的特征向量分配了适宜的权重，进而将分配好权重的第一特征向量集、第二特征向量集和第三特征向量集送入设置有软阈值去除层的残差网络，在特征融合的同时滤除不必要的特征，最终将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。本发明引入了与早发冠心病存在更明显相关性的个人数据和基础医疗数据，结合拓展医疗数据，为个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集、拓展医疗数据对应的第三特征向量集分配适宜的权重，全面地并以适宜的权重考虑目标对象各项指标对早发冠心病患病概率的影响，并在特征处理过程中引入软阈值去除层滤除影响早发冠心病预测结果准确性的不必要特征，最终通过归一化处理得到早发冠心病患病概率，提高了早发冠心病预测结果的全面性和准确性。

其次，参照附图描述根据本发明实施例提出的一种早发冠心病预测系统。

图4是本发明一个实施例的一种早发冠心病预测系统结构示意图。

系统具体包括：

服务端模块400，服务端模块400包括用户管理子单元401和数据分析子单元402；

其中，用户管理子单元401用于获取目标对象的相关数据，相关数据包括个人数据、基础医疗数据和拓展医疗数据，个人数据包括身高和体重，基础医疗数据包括甘油三酯数据和空腹血糖数据，拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原；或者，拓展医疗数据为0；

数据分析子单元402用于对相关数据进行编码处理，并对编码后的相关数据进行特征提取，得到个人数据对应的第一特征向量集、基础医疗数据对应的第二特征向量集和拓展医疗数据对应的第三特征向量集；数据分析子单元402用于在第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为第一特征向量集中的特征向量、第二特征向量集中的特征向量以及第三特征向量集中的特征向量分配权重；数据分析子单元402用于将分配好权重的第一特征向量集、第二特征向量集、第三特征向量集送入预设的残差网络，得到残差输出结果，残差网络包括若干个残差块以及在每个残差块做特征融合后的位置设置的软阈值去除层；数据分析子单元402还用于将残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

参照图5，可选地，在一些实施例中，早发冠心病预测系统还包括客户端模块500，客户端模块500包括数据采集子单元501、数据上传子单元502；

其中，数据采集子单元501用于响应于目标对象完成诊疗服务或者体检服务，读取目标对象的数据；

数据上传子单元502用于确认目标对象的数据中存在基础医疗数据，将目标对象的数据确定为相关数据。

继续参照图5，可选地，在一些实施例中，客户端模块500还包括数据展示子单元503；

数据展示子单元503用于以图表的形式展示相关数据和早发冠心病预测结果。

可选地，在一些实施例中，用户管理子单元401还用于将个人数据、基础医疗数据和拓展医疗数据分别存储至各自对应的不同的数据表中。可见，上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本发明的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。

此外，虽然在功能性模块的背景下描述了本发明，但应当理解的是，除非另有相反说明，功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本发明的范围，本发明的范围由所附权利要求书及其等同方案的全部范围来决定。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

在本发明的实施例的描述中，需要理解的是，术语“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“中心”、“顶”、“底”、“顶部”、“底部”、“内”、“外”、“内侧”、“外侧”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。其中，“里侧”是指内部或围起来的区域或空间。“外围”是指某特定部件或特定区域的周围的区域。

在本发明的实施例的描述中，术语“第一”、“第二”、“第三”、“第四”仅用以描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”、“第三”、“第四”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本发明的实施例的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“组装”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的实施例的描述中，具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

在本发明的实施例的描述中，需要理解的是，“-”和“~”表示的是两个数值之同的范围，并且该范围包括端点。例如：“A-B”表示大于或等于A，且小于或等于B的范围。“A~B”表示大于或等于A，且小于或等于B的范围。

在本发明的实施例的描述中，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种早发冠心病预测方法，其特征在于，包括：

获取目标对象的相关数据，所述相关数据包括个人数据、基础医疗数据和拓展医疗数据，所述个人数据包括身高和体重，所述基础医疗数据包括甘油三酯数据和空腹血糖数据，所述拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原；或者，所述拓展医疗数据为0；

对所述相关数据进行编码处理，并对编码后的所述相关数据进行特征提取，得到所述个人数据对应的第一特征向量集、所述基础医疗数据对应的第二特征向量集和所述拓展医疗数据对应的第三特征向量集；

在所述第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为所述第一特征向量集中的特征向量、所述第二特征向量集中的特征向量以及所述第三特征向量集中的特征向量分配权重；

将分配好权重的所述第一特征向量集、所述第二特征向量集、所述第三特征向量集送入预设的残差网络，得到残差输出结果，所述残差网络包括若干个残差块以及在每个所述残差块做特征融合后的位置设置的软阈值去除层；

将所述残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

2.根据权利要求1所述的一种早发冠心病预测方法，其特征在于，所述获取目标对象的相关数据包括：

响应于所述目标对象完成诊疗服务或者体检服务，读取所述目标对象的数据；

确认所述目标对象的数据中存在所述基础医疗数据，将所述目标对象的数据确定为所述相关数据。

3.根据权利要求1所述的一种早发冠心病预测方法，其特征在于，在所述获取目标对象的相关数据后，所述方法还包括：

将所述个人数据、所述基础医疗数据和所述拓展医疗数据分别存储至各自对应的不同的数据表中。

4.根据权利要求1所述的一种早发冠心病预测方法，其特征在于，所述对所述相关数据进行编码处理包括：

分别对所述个人数据中的所有项、所述基础医疗数据中的所有项和所述拓展医疗数据中的所有项求均值、方差、最大值、最小值后做标准化。

5.根据权利要求1所述的一种早发冠心病预测方法，其特征在于，所述对编码后的所述相关数据进行特征提取，得到所述个人数据对应的第一特征向量集、所述基础医疗数据对应的第二特征向量集和所述拓展医疗数据对应的第三特征向量集包括：

采用预设的特征提取网络对所述编码后的相关数据进行特征提取，得到所述第一特征向量集、所述第二特征向量集和所述第三特征向量集，所述特征提取网络包括由稠密网络组成的稠密块以及依次设置在所述稠密块后的max-pooling层、Dropout层、Flatten层和Dense层。

6.根据权利要求1所述的一种早发冠心病预测方法，其特征在于，所述方法还包括：

以图表的形式展示所述相关数据和所述早发冠心病预测结果。

7.一种早发冠心病预测系统，其特征在于，包括：

其中，所述用户管理子单元用于获取目标对象的相关数据，所述相关数据包括个人数据、基础医疗数据和拓展医疗数据，所述个人数据包括身高和体重，所述基础医疗数据包括甘油三酯数据和空腹血糖数据，所述拓展医疗数据包括肌酸激酶、C-反应蛋白、纤维蛋白原；或者，所述拓展医疗数据为0；

所述数据分析子单元用于对所述相关数据进行编码处理，并对编码后的所述相关数据进行特征提取，得到所述个人数据对应的第一特征向量集、所述基础医疗数据对应的第二特征向量集和所述拓展医疗数据对应的第三特征向量集；所述数据分析子单元用于在所述第二特征向量集中分别选取各个特征向量作为样本，采用Relief特征选择算法为所述第一特征向量集中的特征向量、所述第二特征向量集中的特征向量以及所述第三特征向量集中的特征向量分配权重；所述数据分析子单元用于将分配好权重的所述第一特征向量集、所述第二特征向量集、所述第三特征向量集送入预设的残差网络，得到残差输出结果，所述残差网络包括若干个残差块以及在每个所述残差块做特征融合后的位置设置的软阈值去除层；所述数据分析子单元还用于将所述残差输出结果通过Softmax函数进行归一化处理，得到早发冠心病预测结果。

8.根据权利要求7所述的一种早发冠心病预测系统，其特征在于，所述系统还包括客户端模块，所述客户端模块包括数据采集子单元、数据上传子单元；

其中，所述数据采集子单元用于响应于所述目标对象完成诊疗服务或者体检服务，读取所述目标对象的数据；

所述数据上传子单元用于确认所述目标对象的数据中存在所述基础医疗数据，将所述目标对象的数据确定为所述相关数据。

9.根据权利要求8所述的一种早发冠心病预测系统，其特征在于，所述客户端模块还包括数据展示子单元；

所述数据展示子单元用于以图表的形式展示所述相关数据和所述早发冠心病预测结果。

10.根据权利要求7所述的一种早发冠心病预测系统，其特征在于，所述用户管理子单元还用于将所述个人数据、所述基础医疗数据和所述拓展医疗数据分别存储至各自对应的不同的数据表中。