CN116994700A

CN116994700A - 基于深度学习的喹硫平剂量个体化推荐方法及装置

Info

Publication number: CN116994700A
Application number: CN202310755439.4A
Authority: CN
Inventors: 张津源; 于泽; 高飞; 周春华; 于静
Original assignee: FIRST HOSPITAL OF HEBEI MEDICAL UNIVERSITY; Beijing Medicinovo Technology Co ltd
Current assignee: FIRST HOSPITAL OF HEBEI MEDICAL UNIVERSITY; Beijing Medicinovo Technology Co ltd
Priority date: 2023-03-31
Filing date: 2023-06-25
Publication date: 2023-11-03
Anticipated expiration: 2043-06-25

Abstract

本发明提供一种基于深度学习的喹硫平剂量个体化推荐方法及装置，属于信息处理技术领域，包括：获取多维个体特征信息；基于目标检验方法对每个多维个体特征信息中的无用维度特征进行筛选，得到筛选后的多维个体特征信息，每个筛选后的多维个体特征信息均包括一个喹硫平剂量标签；将每个筛选后的多维个体特征信息作为一个训练样本，获取N个训练样本，将训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵；将特征节点权重矩阵输入预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息；基于喹硫平给药剂量预测信息和训练样本对应的喹硫平剂量标签确定第一损失函数，基于第一损失函数更新预设GCDNN模型。

Description

基于深度学习的喹硫平剂量个体化推荐方法及装置

技术领域

本发明涉及信息处理技术领域，尤其涉及一种基于深度学习的喹硫平剂量个体化推荐方法及装置。

背景技术

在进行医学治疗时，容易出现喹硫平给药剂量不当，导致喹硫平与特定受体结合致使患者出现副作用的情况。但由于个体用喹硫平治疗效果差异较大，且影响喹硫平治疗效果的变量众多，很难明确喹硫平剂量与影响喹硫平效果变量之间的关系。

如何明确喹硫平剂量与影响喹硫平效果变量之间的关系是当前业界亟待解决的问题。

发明内容

本发明提供一种基于深度学习的喹硫平剂量个体化推荐方法及装置。

本发明提供一种基于深度学习的喹硫平剂量个体化推荐方法，包括：

获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下维度信息中的至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，其中，所述目标检验方法包括：Mann-Whitney U检验方法、方差检验方法、卡方检验方法、Fish检验方法和XGBoost算法中的至少一项，每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签；

将每个所述筛选后的多维个体特征信息作为一个训练样本，获取N个所述训练样本，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵；

将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息；

基于喹硫平给药剂量预测信息和所述训练样本对应的喹硫平剂量标签确定第一损失函数，基于所述第一损失函数更新所述预设GCDNN模型；

其中，所述预设GCDNN模型用于根据多维个体特征信息，输出喹硫平给药剂量预测信息。

根据本发明提供的一种基于深度学习的喹硫平剂量个体化推荐方法，所述基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，包括：

对所述N个多维个体特征信息中的连续型自变量特征信息进行Mann-Whitney U检验方法或方差检验方法检验，根据检验结果，筛选得到初筛后的P个多维个体特征信息；

对所述N个多维个体特征信息中分类变量特征信息的独热编码进行比例分析，根据比例分析结果，筛选得到初筛后的K个多维个体特征信息；

基于重要度提取算法对各个初筛后的多维个体特征信息进行重要性分析，根据重要性分析结果，确定N个筛选后的多维个体特征信息。

根据本发明提供的一种基于深度学习的喹硫平剂量个体化推荐方法，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵，包括：

构建所述训练样本中每个维度信息对应的无向图，并计算各个所述无向图的邻接矩阵；

所述GC模块基于所述无向图的邻接矩阵和所述训练样本对应的特征矩阵，进行邻接矩阵重构；

对重构邻接矩阵的节点嵌入矩阵进行全局平均池化，得到各个无向图的嵌入向量；

连接各个所述各个无向图的嵌入向量，输出特征节点权重矩阵。

根据本发明提供的一种基于深度学习的喹硫平剂量个体化推荐方法，所述将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息，包括：

所述DNN模块根据所述特征节点权重矩阵进行各层之间的矩阵相乘处理和激活函数处理，输出喹硫平给药剂量预测信息。

根据本发明提供的一种基于深度学习的喹硫平剂量个体化推荐方法，在所述获取N个多维个体特征信息之前，还包括：

获取多个初始多维个体特征信息，每个所述初始多维个体信息包括多个维度信息；

删除多个初始多维个体特征信息中的目标初始多维个体特征信息，得到N个多维个体特征信息；

其中，所述目标初始多维个体特征信息是所述维度信息的数量小于预设阈值的初始多维个体特征信息。

本发明还提供一种基于深度学习的喹硫平剂量个体化推荐装置，包括：

获取模块，用于获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

筛选模块，用于基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，其中，所述目标检验方法包括：Mann-Whitney U检验方法、方差检验方法、卡方检验方法、Fish检验方法和XGBoost算法中的至少一项，每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签；

输入模块，用于将每个所述筛选后的多维个体特征信息作为一个训练样本，获取N个所述训练样本，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵；

输出模块，用于将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息；

更新模块，用于基于喹硫平给药剂量预测信息和所述训练样本对应的喹硫平剂量标签确定第一损失函数，基于所述第一损失函数更新所述预设GCDNN模型；

根据本发明提供的一种基于深度学习的喹硫平剂量个体化推荐装置，所述筛选模块，具体用于：

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述基于深度学习的喹硫平剂量个体化推荐方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述基于深度学习的喹硫平剂量个体化推荐方法。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述基于深度学习的喹硫平剂量个体化推荐方法。

本发明提供的一种基于深度学习的喹硫平剂量个体化推荐方法及装置，通过获取多个多维个体特征信息，对每个多维个体特征信息中的无用维度特征进行筛选，得到的筛选后的多维个体特征信息可以有效降低每个多维个体特征信息的维度，保留对喹硫平剂量信息影响较大的特征，从而提高模型训练的效率，保证预测结果的准确性；将训练样本输入到预设GCDNN模型中，可以充分学习特征节点之间的关系，有效提高预测准确性；基于喹硫平给药剂量预测信息和训练样本对应的喹硫平剂量标签确定的第一损失函数，可以不断更新预设GCDNN模型的参数，使得预测结果与实际数据之间的距离最小化，从而提高训练的准确性，使得最终由模型输出的喹硫平给药剂量预测信息，可以准确地明确喹硫平剂量信息与其他特征信息之间的关系。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的基于深度学习的喹硫平剂量个体化推荐方法的流程示意图之一；

图2是本发明提供的基于深度学习的喹硫平剂量个体化推荐方法的流程示意图之二；

图3是本发明提供的基于深度学习的喹硫平剂量个体化推荐装置的结构示意图；

图4是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是本发明提供的基于深度学习的喹硫平剂量个体化推荐方法的流程示意图之一，如图1所示，包括：

步骤110，获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

在本申请实施例中，多维个体特征信息具体可以是指个体在多个维度上的，可以表示个体特征和属性的信息。具体地，多维个体特征信息中可以包括喹硫平剂量信息，喹硫平剂量信息具体可以是指个体服用该喹硫平的剂量数据。

具体地，以喹硫平剂量信息为目标变量，以多维个体特征信息中除喹硫平剂量信息外的特征信息为自变量。

具体地，多维个体特征信息中还可以包括体征信息，体征信息具体可以是指人体生理状态的表现或指标，可以反映一个人的身体健康状况，例如身高、体重、血压、体温以及心率等信息。

具体地，多维个体特征信息中还可以包括历史喹硫平用药信息，历史喹硫平用药信息具体可以是指某个个体在过去使用喹硫平的历史记录，具体可以包括用药的频次以及时间等信息。

具体地，多维个体特征信息中还可以包括其它药物用药信息，其它药物用药信息具体可以是指个体在过去使用的除喹硫平以外的其他药物的历史记录，包括用药剂量、用药频次、用药时长等方面的信息。

具体地，多维个体特征信息中还可以包括不良反应信息，不良反应信息具体可以是指个体在用药期间出现的不良反应的记录，包括具体症状、发生的时间、持续时间以及程度等信息。

具体地，多维个体特征信息中还可以包括诊断信息，诊断信息具体可以是指就诊过程中有关目标疾病的确诊信息，具体可以包括目标疾病名称、确诊结果以及严重程度等信息。

具体地，目标疾病可以预先指定，目标疾病与喹硫平是对应关系，喹硫平是用于治疗目标疾病的药物之一。

具体地，多维个体特征信息中还可以包括治疗方案信息，治疗方案信息具体可以是指治疗目标疾病所采用的具体治疗方案，具体可以包括治疗周期、手术类型以及手术时长等信息。

在本申请实施例中，获取N个多维个体特征信息，一个个体对应一个多维个体特征信息，N为正整数。

步骤120，基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，其中，所述目标检验方法包括：Mann-WhitneyU检验方法、方差检验方法、卡方检验方法、Fish检验方法和XGBoost算法中的至少一项，每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签，其中，M为非零正整数；

在本申请实施例中，无用维度特征具体可以是指多维个体特征信息中对目标变量，即对喹硫平剂量信息的影响程度低，没有影响的特征信息。无用维度特征如果作为模型的训练集的一部分训练模型，则可能会干扰模型的预测结果，降低模型的预测能力，因此，在训练模型前，需要去除无用维度特征。

在本申请实施例中，目标检验方法是指针对目标变量，通过对自变量进行检验来判断二者之间是否具有相关性的统计分析方法，包括Mann-Whitney U(曼-惠特尼-威尔科克森)检验方法、方差检验方法、卡方检验方法、Fish检验(费舍尔精确检验)方法和XGBoost(eXtreme Gradient Boosting，极端梯度提升)算法中的至少一项。

具体地，Mann-Whitney U检验方法是指一种非参数统计方法，通过对两组数据的秩次进行比较，最终计算出一个P值，用于判断两组数据是否有显著性差异。

具体地，方差检验方法是指一种用于检验两个或多个总体方差是否相等的统计方法。

具体地，卡方检验方法具体可以用于检验观测值与理论值之间的偏离程度是否显著，从而判断两个特征变量之间是否存在显著的关联性。

具体地，Fish检验方法是指一种分析两个分类变量之间关系的统计方法，通过比较观察到的数据与预期的数据之间的偏离程度，来检验两个特征变量之间的独立性。

具体地，XGBoost算法是指一种基于梯度提升树的机器学习算法，具体可以进行回归、排序等方面的工作。

在本申请实施例中，基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，具体可以是，利用目标检验方法将各个多维个体特征信息中的无用维度特征筛选出来后，将无用维度特征删除。每个多维个体特征信息中删除的无用维度特征可能是不相同的，删除掉每个多维个体特征信息中的无用维度特征后，得到N个筛选后的多维个体特征信息。

每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签，喹硫平剂量标签具体可以是指喹硫平剂量信息，即个体服用该喹硫平的剂量数据。

步骤130，将每个所述筛选后的多维个体特征信息作为一个训练样本，获取N个所述训练样本，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵；

在本申请实施例中，将每个筛选后的多维个体特征信息作为一个训练样本，每个训练样本中都有一个喹硫平剂量标签，由于一个个体对应一个多维个体特征信息，有N个多维个体特征信息，所以最终获取N个训练样本。

在本申请实施例中，预设GCDNN模型可以是预先设置的，具体是一种结合了GC(Graph Convolutional，图卷积)模块和DNN(Deep Neural Network，深度神经网络)模块的模型。

具体地，GC模块中包括GCN(Graph Convolutional Network,图卷积神经网络)模型，GCN模型是一种深度学习模型，将训练样本输入到GC模块中，由GCN模型对特征节点及特征节点之间的关系进行学习。

具体地，一个特征节点可以是指多维个体特征信息中的某项特征信息，例如体重、性别或身高等。

具体地，由GC模型输出特征节点权重矩阵，特征节点权重矩阵中的权重表示了每两个特征节点之间的相关性，权重高的表示两个特征节点之间的相关性较强，权重低的表示两个特征节点之间的相关性较弱，例如体重和性别之间的权重较高，则表示体重与性别之间的相关性较强；再例如，体重和身高之间的权重较低，则表示体重与身高之间的相关性较弱。

步骤140，将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息；

DNN模块由多个神经网络层组成，每个神经网络层中包含了多个神经元，将特征节点权重矩阵输入DNN模块，由DNN模块经过多层神经网络层的训练，包括各层神经网络层之间的矩阵相乘、激活函数处理等，最终输出喹硫平给药剂量预测信息。

具体地，喹硫平给药剂量预测信息表示模型预测出来的喹硫平剂量值，一个喹硫平给药剂量预测信息可以对应一个训练样本。

步骤150，基于喹硫平给药剂量预测信息和所述训练样本对应的喹硫平剂量标签确定第一损失函数，基于所述第一损失函数更新所述预设GCDNN模型；

具体地，同一个训练样本中，对应了一个喹硫平给药剂量预测信息，和一个喹硫平剂量标签。

在本申请实施例中，第一损失函数用来衡量喹硫平给药剂量预测信息和喹硫平剂量标签之间的差距，表示预测结果和实际数据之间的差距。第一损失函数具体可以是均方误差、平均绝对误差或对数损失等。

在本申请实施例中，基于第一损失函数更新预设GCDNN模型，具体可以是用不断重复反向传播算法或梯度下降等优化算法，更新模型的GC模块和DNN模块的参数，使得第一损失函数最小化的过程。当第一损失函数最小化到某个预设的阈值时，即可停止更新参数。

具体地，第一损失函数具体可以为：

其中M为分类个数。

具体地，将预设GCDNN模型的目标函数设为：

OF＝L+γ_*||Λ||

其中γ_*为正则化项，Λ为DNN部分的参数。

具体地，以Accuracy(精度)、Precision(准确率)、Recall(召回率)、F1-Score作为预设GCDNN模型的评估指标。

具体地，Accuracy公式如下：

具体地，Precision公式如下：

具体地，Recall公式如下：

具体地，F1-score公式如下：

具体地，其中TP为被正确地划分为正例的个数，FP为被错误地划分为正例的个数，FN为被错误地划分为负例的个数，TN为被正确地划分为负例的个数。

具体地，当模型在测试集上表现出高精度、高准确率、高召回率、高F1-Score时，可以表示模型评估效果是可行的，最终综合考虑各个评估指标的表现，以确定最适合的模型和参数组合。

通过获取多个多维个体特征信息，对每个多维个体特征信息中的无用维度特征进行筛选，得到的筛选后的多维个体特征信息可以有效降低每个多维个体特征信息的维度，保留对喹硫平剂量信息影响较大的特征，从而提高模型训练的效率，保证预测结果的准确性；将训练样本输入到预设GCDNN模型中，可以充分学习特征节点之间的关系，有效提高预测准确性；基于喹硫平给药剂量预测信息和训练样本对应的喹硫平剂量标签确定的第一损失函数，可以不断更新预设GCDNN模型的参数，使得预测结果与实际数据之间的距离最小化，从而提高训练的准确性，使得最终由模型输出的喹硫平给药剂量预测信息，可以准确地明确喹硫平剂量信息与其他特征信息之间的关系。

可选地，所述基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，包括：

在本申请实施例中，连续型自变量特征信息是指在一定区间内可以任意取值的数值变量，例如年龄、身高、患病年限等。

在本申请实施例中，Mann-Whitney U检验方法是指一种非参数统计方法，通过对两组数据的秩次进行比较，最终计算出一个P值，用于判断两组数据是否有显著性差异。

具体地，将N个多维个体特征信息中的单个连续型自变量特征信息，分为两组，一组包含连续型自变量特征信息和目标变量的数据，另一组只包含目标变量的数据。对于包含连续型自变量特征信息的一组，并按照目标变量值的大小进行排序。然后将两组数据进行合并，对于每个连续型自变量特征信息的数据，确定它在排序后在该组中的秩次。根据两组数据的秩次和之差，根据Mann-Whitney Wilcoxon秩和检验的临界值确定P值。

具体地，如果P值小于0.05，则检验结果可以是连续型自变量特征信息与目标变量之间存在显著性差异，否则检验结果为它们之间无显著性差异。

在本申请实施例中，方差检验方法是指一种用于检验两个或多个总体方差是否相等的统计方法，利用p值来评估不同连续型自变量特征信息对目标变量的影响是否显著。如果p值小于0.05，则检验结果可以是，连续型自变量特征信息对目标变量的影响是显著的。

具体地，如果某个连续型自变量特征信息的检验结果是，该连续型自变量特征信息与目标变量之间存在显著性差异，则保留该某个连续型自变量特征信息，否则删除该连续型自变量特征信息，最终得到初筛后的P个多维个体特征信息，P为非零正整数。

在本申请实施例中，分类变量特征信息具体可以是指，如性别、血型等这类只在有限选项内取值的特征。

在本申请实施例中，分类变量特征信息的独热编码具体可以是通过，将分类变量特征信息转换为一个长度等于分类变量取值数目的二进制向量，其中每个取值对应一个二进制数来实现。

具体地，对于一个有三个取值(A、B、C)的分类变量，可以将其转换为三个二进制向量([1,0,0]、[0,1,0]、[0,0,1])，分别对应A、B、C三个取值。这样，该分类变量特征信息的独热编码就可以表示为一个长度为三的二进制向量，其中只有一个位置为1，其他位置为0。

具体地，对N个多维个体特征信息中分类变量特征信息的独热编码进行比例分析，具体可以是，计算每个分类变量特征信息中的各个独热编码占该分类变量总数据的比例，如果比例小于0.01的，则认为比例分析结果为该分类变量特征信息是极度不平衡变量，否则比例分析结果为该分类变量特征信息不是极度不平衡变量。

具体地，根据比例分析结果，将是极度不平衡变量的分类变量特征信息删除。

具体地，在删除极度不平衡变量的分类变量特征信息后，还可以对分类变量特征信息用卡方检验方法或Fish检验方法，检验分类变量特征信息和目标变量之间的显著性关系。

具体地，卡方检验方法是一种非参数检验方法，具体可以通过计算卡方统计量和自由度，来确定p值。其中，卡方统计量可以衡量分类变量特征信息和目标变量之间的差异；自由度则是将分类变量特征信息的取值数目减去1和目标变量的取值数目减去1的乘积，示例性地，例如性别有两类，则性别的取值数目为2。

具体地，如果p值小于0.05，则可以认为该分类变量特征信息对目标变量的影响是显著的，保留该分类变量特征信息，否则则删除该分类变量特征信息。

具体地，Fish检验是一种非参数检验方法，具体可以需要将分类变量特征信息和目标变量转换为频数表格，根据各个单元格的取值和边缘值来确定P值，如果p值小于0.05，则可以认为该分类变量特征信息对目标变量的影响是显著的，保留该分类变量特征信息，否则则删除该分类变量特征信息。

具体地，经过上述对分类变量特征信息的筛选步骤，得到初筛后的K个多维个体特征信息，K为非零正整数。

在本申请实施例中，重要度提取算法具体可以是XGBoost算法，XGBoost算法是指一种基于梯度提升树的机器学习算法，具体可以进行回归、排序等方面的工作。

具体地，基于重要度提取算法对各个初筛后的多维个体特征信息进行重要性分析，具体可以是，利用XGBoost算法构建决策树。

具体地，在单个决策树中，选取某个自变量的最佳分裂点。最佳分裂点可以是使得分裂后的子节点的均方误差之和最小的分裂点，其中均方误差之和具体可以是，某一分支的子节点的喹硫平剂量平均值与各个子节点的喹硫平剂量的平方差。例如，以体重130斤为分裂点，则该分裂点的左子节点为所有小于130斤的数据，右子节点为所有大于130斤的数据，该分裂点与其他分裂点比起来两边子节点的均方误差之和最小，则为最佳分裂点。

具体地，单个决策树中，沿着该自变量的最佳分裂点继续找到所有其它自变量的最佳分裂点进行分裂，构建完成单个决策树。越靠近根节点的，权值越大，找到所有决策树中权值之和最大的前十个变量，则是重要度排序为前十的变量。

具体地，将每个初筛后的多维个体特征信息的所有数据均分成九类，一共形成九个训练集，每个训练集中均包含其中的八类数据，缺少其中一类数据，并且，各个训练集之间缺少的数据各不相同。还有一个验证集，包含了同一个初筛后的多维个体特征信息的所有数据。在训练过程中XGBoost模型会构建多颗决策树，训练各个训练集时都会调整决策树的节点排序，最终找到最重要的十个自变量，用验证集进行验证。

具体地，最重要的十个自变量就是重要性分析结果，并将重要性分析结果中的十个自变量组成筛选后的多维个体特征信息，得到N个筛选后的多维个体特征信息。此时，筛选后的多维个体特征信息中的维度跟筛选前相比已经大大减小。

具体地，还可以利用LightGBM(Light Gradient Boosting Machine，轻量级梯度提升决策树)插补重要性得分排序前十的自变量的缺失值。

本申请实施例中，通过对连续型自变量特征信息、分类变量特征信息进行筛选，可以有效筛选出喹硫平剂量相关性小的变量，得到初筛后的多维个体特征信息，从而有效降低多维个体特征信息的维度；并对各个初筛后的多维个体特征信息进行重要性分析，有效降低每个多维个体特征信息的维度，保留对喹硫平剂量信息影响较大的特征，从而提高模型训练的效率，保证预测结果的准确性。

可选地，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵，包括：

在本申请实施例中，一个维度信息具体是指一个自变量，例如体重、性别或身高等信息。

具体地，一个训练样本中包括一个筛选后的多维个体特征信息。

具体地，构建训练样本中每个维度信息对应的无向图G_j，具体可以是以一个维度信息中的一个数据为一个节点，例如某个个体的体重，无向图G_j的边则是连接两个相似特征值的节点。

具体地，相似特征值具体可以是指，当两个数据的绝对值在预先设定的阈值范围内时，即可认为两个节点之间具有相似特征值，即可连接两个节点构成边，从而构建训练样本中每个维度信息对应的无向图。

具体地，相似特征值的计算公式具体可以是：

(|X_k,j-X_l,j|<0.05*(max(X_:j)-min(X_:,j)))

具体地，计算各个无向图的邻接矩阵A_j，即一个无向图G_j对应一个邻接矩阵A_j。

具体地，训练样本对应的特征矩阵具体可以是将训练样本中每个维度信息构建一个特征矩阵，其中包括该维度信息的所有数据。

在本申请实施例中，GC模块中包含了GAE(Graph Autoencoder，图自编码器)，即图卷积神经网络，GAE包含两部分：编码器和解码器。编码器负责将无向图的图结构和节点特征转换为嵌入向量，编码器采用GCN(Graph Convolutional Network，图卷积网络)模型作为其主干网络；解码器则负责从嵌入向量中重构图的邻接矩阵。

具体地，将输入特征矩阵I_N和邻接矩阵A_j输入到GCN编码器中。编码器将基于图结构和节点特征计算节点嵌入矩阵Z_j。其中，节点嵌入矩阵Z_j包含了每个节点的嵌入向量。

具体地，节点嵌入矩阵Z_j的计算公式具体可以是：

Z_j＝GCN(I_N,A_j)

具体地，进行邻接矩阵重构具体可以是由解码器重构邻接矩阵计算公式具体可以是：

具体地，邻接矩阵A_j可以捕捉图的结构信息，GAE的目的就使重构出的邻接矩阵与原始矩阵A_j尽可能相似。而为了达到这个目的，GAE反复优化调整节点嵌入矩阵Z_j，这样就可以使得每个节点的新特征包含其邻接节点的信息，即GCN能够学习到图中各个节点之间的拓扑结构和关系。

在本申请实施例中，对重构邻接矩阵的节点嵌入矩阵Z_j进行全局平均池化，得到各个无向图G_j的嵌入向量W_(j)。并将各个无向图G_j的嵌入向量W_(j)横向连接，得到特征节点权重矩阵W^[1]＝[w¹,w²,…,w^N]∈R^K×N，其中，K为DNN模型的第一层神经元的个数。

本申请实施例中，通过将训练样本输入到预设GCDNN模型中，通过构建无向图，可以由GC模块充分学习无向图中各个节点之间的关系，从而保证最终输出的特征节点权重矩阵可以准确表示各个节点之间的权重关系，有效提高预测准确性；

可选地，所述将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息，包括：

在本申请实施例中，DNN模型是一个多层的全连接神经网络，其结构由多个隐藏层组成。

具体地，在第一层中，DNN模型将嵌入向量W_(j)与特征节点权重矩阵W^[1]进行矩阵乘法得到Z₁，Z₁＝W_(j)×W^[1]。其后通过激活函数，例如ReLU、tanh等对Z₁进行非线性变换，得到DNN模型第一层矩阵A₁。

具体地，DNN模型重复前述矩阵乘法和激活函数处理的过程，最后输出喹硫平给药剂量预测向量，其中每一个向量对一个个体的喹硫平给药剂量预测信息。

本申请实施例中，通过DNN模型对特征节点权重矩阵进行各层之间的矩阵相乘处理和激活函数处理，可以有效保证输出的喹硫平给药剂量预测信息的准确性。

可选地，在所述获取N个多维个体特征信息之前，还包括：

在本申请实施例中，初始多维个体信息具体是未经任何处理的，最原始的多维个体信息，其中包括了多个维度信息。

具体地，可能出现某个个体的初始多维个体信息中缺失数据过多的情况，因此需要对此类个体的初始多维个体信息删除掉。

在本申请实施例中，预先设置预设阈值，当初始多维个体信息中的某个维度信息的数据的数量小于预设阈值时，将该维度信息设为目标初始多维个体特征信息，将多个目标初始多维个体特征信息一一删除，从而得到N个多维个体特征信息。

本申请实施例中，通过将目标初始多维个体特征信息删除，有效避免初始多维个体信息中缺失数据过多的情况，有效保证了后续预测结果的准确性。

图2是本发明提供的基于深度学习的喹硫平剂量个体化推荐方法的流程示意图之二，如图2所示，包括：从真实世界中获取数据，将体征信息、历史喹硫平用药信息、诊断信息、治疗方案信息、不良反应信息等建立起数据库，并删除数据库中缺失率大于阈值的样本。接着对变量进行初筛和终筛，将变量中的无用特征，即与喹硫平剂量信息无关或者相关性很少的特征给删除，进行初筛和终筛后的样本数据构建预设GCDNN模型。进行模型优化后，将该模型应用到个性智能推送喹硫平剂量预测的装置中，该装置可以有效得出针对个体的喹硫平剂量预测信息，并且结合喹硫平剂量预测信息，安排喹硫平剂量的服用，可以有效使得服用过程中，血药浓度合理有效、不良反应低，并且该装置适用的覆盖人群广。

下面对本发明提供的基于深度学习的喹硫平剂量个体化推荐装置进行描述，下文描述的基于深度学习的喹硫平剂量个体化推荐装置与上文描述的基于深度学习的喹硫平剂量个体化推荐方法可相互对应参照。

图3是本发明提供的基于深度学习的喹硫平剂量个体化推荐装置的结构示意图，如图3所示，包括：

获取模块310，用于获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

筛选模块320，用于基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，其中，所述目标检验方法包括：Mann-Whitney U检验方法、方差检验方法、卡方检验方法、Fish检验方法和XGBoost算法中的至少一项，每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签；

输入模块330，用于将每个所述筛选后的多维个体特征信息作为一个训练样本，获取N个所述训练样本，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵；

输出模块340，用于将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息；

更新模块350，用于基于喹硫平给药剂量预测信息和所述训练样本对应的喹硫平剂量标签确定第一损失函数，基于所述第一损失函数更新所述预设GCDNN模型；

本申请实施例中，通过获取多个多维个体特征信息，对每个多维个体特征信息中的无用维度特征进行筛选，得到的筛选后的多维个体特征信息可以有效降低每个多维个体特征信息的维度，保留对喹硫平剂量信息影响较大的特征，从而提高模型训练的效率，保证预测结果的准确性；将训练样本输入到预设GCDNN模型中，可以充分学习特征节点之间的关系，有效提高预测准确性；基于喹硫平给药剂量预测信息和训练样本对应的喹硫平剂量标签确定的第一损失函数，可以不断更新预设GCDNN模型的参数，使得预测结果与实际数据之间的距离最小化，从而提高训练的准确性，使得最终由模型输出的喹硫平给药剂量预测信息，可以准确地明确喹硫平剂量信息与其他特征信息之间的关系。

图4是本发明提供的电子设备的结构示意图，如图4所示，该电子设备可以包括：处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440，其中，处理器410，通信接口420，存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令，以执行基于深度学习的喹硫平剂量个体化推荐方法，该方法包括：获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下维度信息中的至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

此外，上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的基于深度学习的喹硫平剂量个体化推荐方法，该方法包括：获取N个多维个体特征信息，其中，所述多维个体特征信息包括以下维度信息中的至少一项：喹硫平剂量信息、体征信息、历史喹硫平用药信息、其它药物用药信息、不良反应信息、诊断信息和治疗方案信息，其中，N为非零正整数；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于深度学习的喹硫平剂量个体化推荐方法，其特征在于，包括：

2.根据权利要求1所述的基于深度学习的喹硫平剂量个体化推荐方法，其特征在于，所述基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，包括：

3.根据权利要求1所述的基于深度学习的喹硫平剂量个体化推荐方法，其特征在于，将所述训练样本输入预设GCDNN模型中的GC模块，输出特征节点权重矩阵，包括：

4.根据权利要求1所述的基于深度学习的喹硫平剂量个体化推荐方法，其特征在于，所述将所述特征节点权重矩阵输入所述预设GCDNN模型中的DNN模块，输出喹硫平给药剂量预测信息，包括：

5.根据权利要求1所述的基于深度学习的喹硫平剂量个体化推荐方法，其特征在于，在所述获取N个多维个体特征信息之前，还包括：

6.一种基于深度学习的喹硫平剂量个体化推荐装置，其特征在于，包括：

筛选模块，用于基于目标检验方法对每个所述多维个体特征信息中的无用维度特征进行筛选，得到N个筛选后的多维个体特征信息，其中，所述目标检验方法包括：Mann-WhitneyU检验方法、方差检验方法、卡方检验方法、Fish检验方法和XGBoost算法中的至少一项，每个所述筛选后的多维个体特征信息均包括一个喹硫平剂量标签；

7.根据权利要求6所述的基于深度学习的喹硫平剂量个体化推荐装置，其特征在于，所述筛选模块，具体用于：

8.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1至5任一项所述基于深度学习的喹硫平剂量个体化推荐方法。

9.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于深度学习的喹硫平剂量个体化推荐方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于深度学习的喹硫平剂量个体化推荐方法。