CN112201348B

CN112201348B - 基于知识感知的多中心临床数据集适配设备

Info

Publication number: CN112201348B
Application number: CN202011171924.XA
Authority: CN
Inventors: 黄正行; 陈晋飙; 段会龙
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2022-07-26
Anticipated expiration: 2040-10-28
Also published as: CN112201348A

Abstract

本发明公开了一种基于知识感知的多中心临床数据集适配设备，包含：数据输入单元、知识图谱嵌入单元、基于知识感知的对抗性学习单元和临床结果预测单元；知识图谱嵌入单元包括：知识图谱模块和图卷积神经网络模块；所述基于知识感知的对抗性学习单元包括：患者表征模块、知识表征模块、基于知识感知的患者表征模块和多中心鉴别器模块；所述临床结果预测单元用于对基于知识感知的患者表征模块输出的所述患者特征表示π进行拟合，得到临床目标的预测结果。本发明的基于知识感知的多中心临床数据集适配设备，引入外部的临床专家知识，能够同时捕获多中心临床数据集中患者的共享特征和中心相关特征，从而提高在不同临床环境下的应用性能。

Description

基于知识感知的多中心临床数据集适配设备

技术领域

本发明涉及一种基于知识感知的多中心临床数据集适配设备。

背景技术

许多大型临床数据集，特别是从不同的临床研究中心收集的数据集，包含了大量地理位置不同和具有中心特异性特征的参与者。利用从多个中心收集的临床数据，在不同的临床环境中证明或反驳一个假设，对于改善患者治疗和护理、提高医疗保健管理质量和开展有效的临床研究至关重要。然而在许多情况下，多中心收集的临床数据集因为其患者样本的基因、所处环境和种族分布的不同，从这些数据集中学习到的知识在不同中心中存在显著差异。

几项大规模研究表明，基于从一个临床中心收集的数据训练的机器学习模型不能可靠地部署在其他临床环境中。这是由于在训练数据集和评估数据集之间存在分布偏移。为了提高模型在多中心临床数据集中的适配性，目前主要有以下两种研究方向：

(1)实例匹配。实例匹配一般通过对源数据集和目标数据集中具有相似倾向性评分的患者样本的筛选和匹配，生成新的近似随机实验的数据集，以消除不同数据集之间的干扰因素，这样从一个数据集学到的知识就可以应用到其他数据集上。

(2)表征学习。表征学习则是通过深度表征学习，比如多视点深度网络和对抗性学习，从异质性临床数据中提取潜在的共享患者特征，以解决多中心临床数据集之间的数据分布差距。

尽管实例匹配和表征学习都有各自独特的优势，但它们都有同样严重的局限性，即在学习过程中没有利用临床专家知识，在特定临床环境中的应用性能存在局限性。

发明内容

本发明提供了一种基于知识感知的多中心临床数据集适配设备，采用如下的技术方案：

一种基于知识感知的多中心临床数据集适配设备，包括：数据输入单元、知识图谱嵌入单元、基于知识感知的对抗性学习单元和临床结果预测单元；

数据输入单元用于向基于知识感知的对抗性学习单元输入训练数据对其进行训练，训练数据包括源数据集

和目标数据集

源数据集

目标数据集

两个数据集都拥有患者特征x，其中源数据集

中的患者额外带有临床目标结果的真实标签y；

知识图谱嵌入单元包括：

知识图谱模块，用于构建与特定疾病或者特定临床问题相关的知识图谱，知识图谱为

其中ε和

分别是知识图谱中的概念e和关系r的集合；

图卷积神经网络模块，用于将知识图谱模块中的知识图谱的概念和关系通过图卷积神经网络的训练转化为向量表示；

基于知识感知的对抗性学习单元包括：

患者表征模块，用于提取源数据集

和目标数据集

中患者的特征表示z^p；

知识表征模块,用于结合训练完的图卷积神经网络模块输出的向量提取患者特征所对应的知识特征x^k，并对知识特征x^k进行编码和解码，提取潜在的知识特征表示z^k；

基于知识感知的患者表征模块，用于捕获患者的特征表示z^p和知识特征表示z^k的相关性以分别生成包含知识的患者特征表示π^p和面向患者的知识特征表示π^k，并最终组合成基于知识感知的患者特征表示π，基于知识感知的患者特征表示π＝[π^p；π^k]；

多中心鉴别器模块，用于对基于知识感知的患者表征模块输出的患者特征表示π进行拟合，学习源数据集

和目标数据集

之间的临床中心不变映射；

临床结果预测单元用于对基于知识感知的患者表征模块输出的患者特征表示π进行拟合，得到临床目标的预测结果；

进一步地，图卷积神经网络模块由一个图卷积神经网络组成，知识图谱中的每个概念e_i，其对应的特征向量

被随机初始化，然后通过图卷积过程生成新的特征向量，图卷积神经网络通过以下公式进行计算：

其中l代表图卷积神经网络的层数，

是概念e_i在关系r下相邻节点的集合，

为relu激活函数，

代表第l层关系r下的权重矩阵，

代表第l层自身节点的权重矩阵，

代表概念e_i在第l层的特征向量；

采用DistMult因子分解对三元组(e_i,r,e_j)进行评分，其中e_i为头节点，e_j为尾节点，r代表两个节点间的关系，评分通过以下公式计算：

其中

分别是概念e_i和e_j的编码向量，R_r是与关系r相关的对角矩阵，

为sigmoid激活函数；

选择交叉熵函数作为知识特征提取模块的损失函数，

其中

为知识特征提取模块的损失函数，<(e_i,r,e_j),y>代表三元组与相应的标签，当三元组(e_i,r,e_j)包含在所构建的知识图谱中，y为1，反之y则为0，

代表<(e_i,r,e_j),y>的集合；

通过Adam算法优化损失函数

在损失函数

不再下降时，停止训练；

在图卷积神经网络训练完成后，得到临床概念最终的特征向量表示。

进一步地，患者表征模块由一个患者特征编码器组成，患者特征编码器包括一个第一多层感知机，第一多层感知机的结构设定为二层，以两个数据集中的数据作为第一多层感知机的输入层；

设定第一层输出n_i1个节点，第二层输出n_i2个节点，第一多层感知机通过以下公式进行计算：

z₁ ^p＝σ(W₁x+b₁)，

z₂ ^p＝σ(W₂z₁ ^p+b₂)，

其中，x表示输入层，W₁表示第一层节点的权重矩阵，b₁表示第一层的偏置，W₂表示第二层节点的权重矩阵，b₂表示第二层的偏置，z₁ ^p，z₂ ^p分别表示第一层、第二层输出的患者的特征表示。

进一步地，知识表征模块包含：知识特征提取子模块、知识特征编码器和知识特征解码器；

知识特征提取子模块通过数据输入单元输入的训练数据提取相应的概念e_i和对应的特征向量

对最终得到的所有特征向量

取平均获得知识特征x^k；

通过知识特征编码器提取出知识特征x^k潜在的知识特征表示z^k，再通过知识特征解码器对知识特征表示z^k重建,其计算公式如下：

z^k＝W_k1x^k+b_k1，

其中，W_k1表示知识特征编码器的权重矩阵，b_k1表示知识特征编码器的偏置，W_k2表示知识特征解码器的权重矩阵，b_k2表示知识特征解码器的偏置，

表示重建的特征向量。

进一步地，基于知识感知的患者表征模块的注意力机制的计算公式如下：

M＝(z^p)^T·z^k,

其中M是患者样本的相关性矩阵，M_i,j代表患者的特征表示z^p的第i个元素和知识特征表示z^k的第j个元素的相关信息，通过SoftMax函数

来计算M每行和每列的权值向量α^p和α^k；

之后通过以下公式生成包含知识的患者特征表示π^p和面向患者的知识特征表示π^k：

π^p＝B^p⊙z^p,

π^k＝B^k⊙z^k，

其中U_p1和U_k1是权重矩阵，I^p,I^k＝[1,…,1]^T为n维全1向量，

代表Kronecker乘积运算，⊙代表点乘，B^p和B^k分别代表包含知识的患者特征表示矩阵和面向患者的知识特征表示矩阵；

患者特征表示π^p和知识特征表示π^k最终组合成基于知识感知的患者特征表示π作为基于知识感知的患者表征模块的输出。

进一步地，多中心鉴别器模块为第一Sigmoid输出层，通过以下公式进行计算：

h_d1＝relu(W_d1π(x)+b_d1)，

其中，基于知识感知的患者特征表示π(x)表示输入层，W_d1，W_d2分别为第一Sigmoid输出层的第一和第二层网络的权重矩阵，b_d1，b_d2分别为第一Sigmoid输出层的第一和第二层网络的偏置，h_d1表示第一Sigmoid输出层的第一层网络的输出，

表示多中心鉴别器模块的鉴别结果。

进一步地，临床结果预测单元为第二Sigmoid输出层，通过以下公式进行计算：

h_t1＝relu(W_t1π(x)+b_t1)，

其中，基于知识感知的患者特征表示π(x)表示输入层，W_t1，W_t2分别为第二Sigmoid输出层的第一和第二层网络的权重矩阵，b_t1，b_t2分别为第二Sigmoid输出层的第一和第二层网络的偏置，h_t1表示第二Sigmoid输出层的第一层网络的输出，

表示述临床结果预测单元的预测结果。

进一步地，数据输入单元向基于知识感知的对抗性学习单元输入训练数据对其进行训练的具体方法为：

将源数据集

按照一定比例划分为训练集和测试集；

将源数据集

的训练集和目标数据集

输入基于知识感知的对抗性学习单元，生成基于知识感知的患者特征表示π并输入临床结果预测单元，对其进行训练；

将源数据集

的测试集和加上标签的目标数据集

输入基于知识感知的对抗性学习单元，生成基于知识感知的患者特征表示π并输入临床结果预测单元，对其进行验证。

进一步地，将源数据集

的训练集和目标数据集

输入基于知识感知的对抗性学习单元，生成基于知识感知的患者特征表示π并输入临床结果预测单元，对其进行训练的具体方法为：

选择交叉熵函数作为多中心鉴别器模块的损失函数，

其中

为多中心鉴别器模块的损失函数，π(x_s)和π(x_t)分别代表源数据集

的基于知识感知的患者特征表示π和目标数据集

的患者的基于知识感知的患者特征表示π，

表示多中心鉴别器模块的鉴别结果，

和

为数学期望函数；

选择绝对误差函数作为知识表征模块的重建损失函数，

其中

为知识表征模块的损失函数，

为数学期望函数。

选择交叉熵函数作为临床结果预测单元的损失函数，

其中

为临床结果预测单元的损失函数，Q为临床结果标签的数量，π(x_s)代表源数据集

的基于知识感知的患者特征表示π，

代表临床目标的预测结果，

为数学期望函数；

知识感知的对抗性学习单元与临床结果预测单元的总损失函数

为：

其中λ₁，λ₂为超参数；

优化总损失函数

在总损失函数

不再下降时，停止训练。

进一步地，通过Adam算法优化总损失函数

本发明的有益之处在于所提供的基于知识感知的多中心临床数据集适配设备，引入外部的临床专家知识，能够同时捕获多中心临床数据集中患者的共享特征和中心相关特征，从而提高在不同临床环境下的应用性能，有助于更好的开展相应的临床研究，帮助患者得到更好的治疗和护理。

附图说明

图1是本发明的基于知识感知的多中心临床数据集适配设备的示意图。

具体实施方式

以下结合附图和具体实施例对本发明作具体的介绍。

如图1所示为本发明的一种基于知识感知的多中心临床数据集适配设备(Knowledge-Aware Multi-center clinical dataset Adaptation model，KAMA)，包括：数据输入单元、知识图谱嵌入单元、基于知识感知的对抗性学习单元和临床结果预测单元。

和目标数据集

源数据集

目标数据集

两个数据集都拥有患者特征x，其中源数据集

中的患者额外带有临床目标结果的真实标签y。

知识图谱嵌入单元包括：知识图谱模块和图卷积神经网络模块。

知识图谱模块用于构建与特定疾病或者特定临床问题相关的知识图谱。知识图谱以临床文献、方案和指南作为信息来源，即引入外部的临床专家知识。表示为

其中ε和

分别是知识图谱中的概念e和关系r的集合。患者的每一个特征v∈V对应于一个相应的临床概念e∈ε，概念之间存在的关系由

表示，其中V是所有特征的集合。

图卷积神经网络模块用于将知识图谱模块中的知识图谱的概念和关系通过图卷积神经网络的训练转化为向量表示。

基于知识感知的对抗性学习单元包括：患者表征模块、知识表征模块、基于知识感知的患者表征模块和多中心鉴别器模块。

患者表征模块用于提取源数据集

和目标数据集

中患者的特征表示z^p。

知识表征模块用于结合训练完的图卷积神经网络模块输出的向量提取患者特征所对应的知识特征x^k，并对知识特征x^k进行编码和解码，提取潜在的知识特征表示z^k。

基于知识感知的患者表征模块用于捕获患者的特征表示z^p和知识特征表示z^k的相关性，充分利用两者之间的交互作用，来分别生成包含知识的患者特征表示π^p和面向患者的知识特征表示π^k，并通过这两者最终组合成基于知识感知的患者特征表示π，基于知识感知的患者特征表示π＝[π^p；π^k]。

多中心鉴别器模块用于对基于知识感知的患者表征模块输出的患者特征表示π进行拟合，确保学习到源数据集

和目标数据集

之间临床中心不变映射。

临床结果预测单元用于对基于知识感知的患者表征模块输出的患者特征表示π进行拟合，得到临床目标的预测结果。

作为一种优选的实施方式，图卷积神经网络模块由一个图卷积神经网络组成。知识图谱中的每个概念e_i，e_i∈ε，其对应的特征向量

其中l代表图卷积神经网络的层数，

是概念e_i在关系r下相邻节点的集合，

为relu激活函数，

代表第l层关系r下的权重矩阵，

代表第l层自身节点的权重矩阵，

代表概念e_i在第l层的特征向量。

经过对临床概念的编码，采用DistMult因子分解对三元组(e_i,r,e_j)进行评分，其中e_i为头节点，e_j为尾节点，r代表两个节点间的关系，评分通过以下公式计算：

其中

为sigmoid激活函数。

选择交叉熵函数作为知识特征提取模块的损失函数，

其中

代表<(e_i,r,e_j),y>的集合。

通过Adam算法优化损失函数

在损失函数

不再下降时，停止训练。

在图卷积神经网络训练完成后，得到临床概念最终的特征向量表示。比如概念e_i所对应的特征向量为

作为一种优选的实施方式，患者表征模块由一个患者特征编码器组成，患者特征编码器包括一个第一多层感知机，第一多层感知机的结构设定为二层，以两个数据集中的数据作为第一多层感知机的输入层。

z₁ ^p＝σ(W₁x+b₁)，

z₂ ^p＝σ(W₂z₁ ^p+b₂)，

作为一种优选的实施方式，知识表征模块包含：知识特征提取子模块、知识特征编码器和知识特征解码器。

对最终得到的所有特征向量

取平均获得知识特征x^k。

患者的知识特征x^k的提取步骤如下：

(1)对于第i位患者的特征集合V_i，提取其所直接对应的临床概念集合

(2)从知识图谱

中筛选出该患者对应的子图

其中

和

分别是

中的概念e_i和关系r_i的集合。对于任意概念e_i，必须满足

或者e_i与

之间存在关系

(3)把子图

输入到训练完的图卷积神经网络模块中，得到

中所有概念的特征向量。

(4)最终对

中所有概念去重，并对去重后概念对应的特征向量取平均，得到最终患者的知识特征x^k。

z^k＝W_k1x^k+b_k1，

表示重建的特征向量。

作为一种优选的实施方式，基于知识感知的患者表征模块通过注意力机制来充分利用患者特征表示z^p和知识特征表示z^k之间的交互作用。该发明中假设患者特征变量对患者的整体表征有不同的贡献，而特征水平的注意力机制可以识别患者的重要特征来表征患者的临床状况。注意力机制的计算过程如下：

的注意力机制的计算公式如下：

M＝(z^p)^T·z^k,

来计算M每行和每列的权值向量α^p和α^k。

π^p＝B^p⊙z^p,

π^k＝B^k⊙z^k，

其中U_p1和U_k1是权重矩阵，I^p,I^k＝[1,…,1]^T为n维全1向量，

代表Kronecker乘积运算，⊙代表点乘，B^p和B^k分别代表包含知识的患者特征表示矩阵和面向患者的知识特征表示矩阵。

h_d1＝relu(W_d1π(x)+b_d1)，

表示多中心鉴别器模块的鉴别结果。

作为一种优选的实施方式，临床结果预测单元为第二Sigmoid输出层，通过以下公式进行计算：

h_t1＝relu(W_t1π(x)+b_t1)，

表示述临床结果预测单元的预测结果。

作为一种优选的实施方式，数据输入单元向基于知识感知的对抗性学习单元输入训练数据对其进行训练的具体方法为：

将源数据集

按照一定比例划分为训练集和测试集。

将源数据集

的训练集和目标数据集

输入基于知识感知的对抗性学习单元，生成基于知识感知的患者特征表示π并输入临床结果预测单元，对其进行训练。

将源数据集

的测试集和加上标签的目标数据集

进一步地，将源数据集

的训练集和目标数据集

选择交叉熵函数作为多中心鉴别器模块的损失函数，

其中

的基于知识感知的患者特征表示π和目标数据集

的患者的基于知识感知的患者特征表示π，

表示多中心鉴别器模块的鉴别结果，

和

为数学期望函数。

选择绝对误差函数作为知识表征模块的重建损失函数，

其中

为知识表征模块的损失函数，

为数学期望函数。

选择交叉熵函数作为临床结果预测单元的损失函数，

其中

的基于知识感知的患者特征表示π，

代表临床目标的预测结果，

为数学期望函数。

为：

其中λ₁，λ₂为超参数。

优化总损失函数

在总损失函数

不再下降时，停止训练。在本发明中，通过Adam算法优化总损失函数

应用时，首先在知识图谱嵌入单元中的知识图谱模块中构建相应的知识图谱，并在图卷积神经网络模块中预训练图卷积神经网络，使得图谱中概念e_i可以以特征向量

的形式表示。

之后基于知识感知的对抗性学习单元利用输入单元中的真实世界数据，在知识表征模块结合知识图谱嵌入单元预训练结果，获得患者对应的知识特征x^k，并通过编码和解码的方法提取潜在的知识特征表示z^k。同时基于知识感知的对抗性学习单元通过患者表征模块提取真实世界数据中潜在的患者特征表示z^p。再之后利用基于知识感知的对抗性学习单元中的基于知识感知的患者表征模块，通过注意力机制分别生成包含知识的患者特征表示π^p和面向患者的知识特征表示π^k，并最终组合成基于知识感知的患者特征表示π＝[π^p；π^k]。多中心鉴别器模块确保学到的基于知识感知的患者特征表示π是源数据集和目标数据集之间临床中心不变映射。临床结果预测单元以基于知识感知的患者特征表示π为输入，输出相应的临床目标的预测结果。

当完成模型训练后，将目标数据集的患者样本输入到训练好的基于知识感知的对抗性学习单元中，模型单元能够根据患者的特征和对应知识图谱的知识特征来输出特定临床目标下的预测结果。

为了更好地比较本发明所提出的基于知识感知的多中心临床数据集适配设备的优越性，以对于心衰患者院内急性肾损伤的预测为例，基于从中国某医院普通心脏病病房提取的真实临床数据集PLAGH(The General Hospital of the People′s LiberationArmy，PLAGH)和国外免费公开的重症监护临床数据集MIMIC III，本发明的设备与现有的多层感知机设备(Multilayer Perceptron，MLP)和表征学习的对抗性学习设备(AdversarialLearning，AL)就在多中心数据集上的预测性能进行了对比。

实验结果用ROC曲线下面积(Receiver Characteristic Operator Area UnderCurve，AUC)来作为评估指标，AUC的计算方法就是随机抽出一对样本(一个正样本，一个负样本)，然后用训练得到分类器对两个样本进行预测，预测得到正样本为正的概率大于负样本为正概率的概率，AUC越大就说明预测结果越准确。AUC的计算公式如下：

其中M为正样本的数目，N为负样本的数目，假设第i个正样本被分类器预测为正的概率为p_i，n_i即被分类器预测为正的概率小于p_i的负样本个数。

最终分别以PLAGH为源数据集、MIMIC为目标数据集和MIMIC为源数据集、PLAGH为目标数据集，三种设备的对比结果如表1所示，可见，本发明的设备预测在源数据集和目标数据集上的预测效果更好，并且在目标数据集上的提高非常显著。

表1本发明的设备与对比设备在急性肾损伤预测任务上的表现

以上显示和描述了本发明的基本原理、主要特征和优点。本行业的技术人员应该了解，上述实施例不以任何形式限制本发明，凡采用等同替换或等效变换的方式所获得的技术方案，均落在本发明的保护范围内。

Claims

1.一种基于知识感知的多中心临床数据集适配设备，其特征在于，包括：数据输入单元、知识图谱嵌入单元、基于知识感知的对抗性学习单元和临床结果预测单元；

所述数据输入单元用于向所述基于知识感知的对抗性学习单元输入训练数据对其进行训练，所述训练数据包括源数据集

和目标数据集

所述源数据集

所述目标数据集

两个数据集都拥有患者特征x，其中所述源数据集

中的患者额外带有临床目标结果的真实标签y；

知识图谱嵌入单元包括：

知识图谱模块，用于构建与特定疾病或者特定临床问题相关的知识图谱，所述知识图谱为

其中ε和

分别是知识图谱中的概念e和关系r的集合；

图卷积神经网络模块，用于将所述知识图谱模块中的知识图谱的概念和关系通过图卷积神经网络的训练转化为向量表示；

所述基于知识感知的对抗性学习单元包括：

患者表征模块，用于提取所述源数据集

和所述目标数据集

中患者的特征表示z^p；

知识表征模块,用于结合训练完的图卷积神经网络模块输出的向量提取患者特征所对应的知识特征x^k，并对所述知识特征x^k进行编码和解码，提取潜在的知识特征表示z^k；

基于知识感知的患者表征模块，用于捕获所述患者的特征表示z^p和所述知识特征表示z^k的相关性以分别生成包含知识的患者特征表示π^p和面向患者的知识特征表示π^k，并最终组合成基于知识感知的患者特征表示π，所述基于知识感知的患者特征表示π＝[π^p；π^k]；

多中心鉴别器模块，用于对所述基于知识感知的患者表征模块输出的所述患者特征表示π进行拟合，学习所述源数据集

和所述目标数据集

之间的临床中心不变映射；

所述临床结果预测单元用于对基于知识感知的患者表征模块输出的所述患者特征表示π进行拟合，得到临床目标的预测结果；

所述基于知识感知的患者表征模块的注意力机制的计算公式如下：

M＝(z^p)^T·z^k,

其中M是患者样本的相关性矩阵，M_i,j代表患者的所述特征表示z^p的第i个元素和所述知

识特征表示z^k的第j个元素的相关信息，通过SoftMax函数

来计算M每行和每列的权值向量α^p和α^k；

之后通过以下公式生成包含知识的所述患者特征表示π^p和面向患者的所述知识特征表示π^k：

π^p＝B^p⊙z^p,

π^k＝B^k⊙z^k，

其中U_p1和U_k1是权重矩阵，I^p,I^k＝[1,…,1]^T为n维全1向量，

所述患者特征表示π^p和所述知识特征表示π^k最终组合成所述基于知识感知的患者特征表示π作为所述基于知识感知的患者表征模块的输出；

所述多中心鉴别器模块为第一Sigmoid输出层，通过以下公式进行计算：

h_d1＝relu(W_d1π(x)+b_d1)，

其中，所述基于知识感知的患者特征表示π(x)表示输入层，W_d1，W_d2分别为所述第一Sigmoid输出层的第一和第二层网络的权重矩阵，b_d1，b_d2分别为所述第一Sigmoid输出层的第一和第二层网络的偏置，h_d1表示所述第一Sigmoid输出层的第一层网络的输出，

表示所述多中心鉴别器模块的鉴别结果；

所述临床结果预测单元为第二Sigmoid输出层，通过以下公式进行计算：

h_t1＝relu(W_t1π(x)+b_t1)，

其中，所述基于知识感知的患者特征表示π(x)表示输入层，W_t1，W_t2分别为所述第二Sigmoid输出层的第一和第二层网络的权重矩阵，b_t1，b_t2分别为所述第二Sigmoid输出层的第一和第二层网络的偏置，h_t1表示所述第二Sigmoid输出层的第一层网络的输出，

表示述临床结果预测单元的预测结果；

所述数据输入单元向所述基于知识感知的对抗性学习单元输入训练数据对其进行训练的具体方法为：

将所述源数据集

按照一定比例划分为训练集和测试集；

将所述源数据集

的训练集和所述目标数据集

输入所述基于知识感知的对抗性学习单元，生成所述基于知识感知的患者特征表示π并输入所述临床结果预测单元，对其进行训练；

将所述源数据集

的测试集和加上标签的所述目标数据集

输入所述基于知识感知的对抗性学习单元，生成所述基于知识感知的患者特征表示π并输入所述临床结果预测单元，对其进行验证；

所述将所述源数据集

的训练集和所述目标数据集

输入所述基于知识感知的对抗性学习单元，生成所述基于知识感知的患者特征表示π并输入所述临床结果预测单元，对其进行训练的具体方法为：

选择交叉熵函数作为所述多中心鉴别器模块的损失函数，

其中

为所述多中心鉴别器模块的损失函数，π(x_s)和π(x_t)分别代表所述源数据集

的所述基于知识感知的患者特征表示π和所述目标数据集

的患者的所述基于知识感知的患者特征表示π，

表示所述多中心鉴别器模块的鉴别结果，

和

为数学期望函数；

选择绝对误差函数作为所述知识表征模块的重建损失函数，

其中

为所述知识表征模块的损失函数，

为数学期望函数，

表示重建的特征向量；

选择交叉熵函数作为所述临床结果预测单元的损失函数，

其中

为所述临床结果预测单元的损失函数，Q为临床结果标签的数量，π(x_s)代表所述源数据集

的所述基于知识感知的患者特征表示π，

代表临床目标的预测结果，

为数学期望函数；

所述知识感知的对抗性学习单元与所述临床结果预测单元的总损失函数

为：

其中λ₁，λ₂为超参数；

优化所述总损失函数

在所述总损失函数

不再下降时，停止训练。

2.根据权利要求1所述的基于知识感知的多中心临床数据集适配设备，其特征在于，

所述图卷积神经网络模块由一个图卷积神经网络组成，所述知识图谱中的每个概念e_i，其对应的特征向量

被随机初始化，然后通过图卷积过程生成新的特征向量，所述图卷积神经网络通过以下公式进行计算：

其中l代表图卷积神经网络的层数，

是概念e_i在关系r下相邻节点的集合，

为relu激活函数，

代表第l层关系r下的权重矩阵，

代表第l层自身节点的权重矩阵，

代表概念e_i在第l层的特征向量；

其中

为sigmoid激活函数；

选择交叉熵函数作为所述知识特征提取模块的损失函数，

其中

为所述知识特征提取模块的损失函数，<(e_i,r,e_j),y>代表三元组与相应的标签，当三元组(e_i,r,e_j)包含在所构建的知识图谱中，y为1，反之y则为0，

代表<(e_i,r,e_j),y>的集合；

通过Adam算法优化损失函数

在损失函数

不再下降时，停止训练；

在所述图卷积神经网络训练完成后，得到临床概念最终的特征向量表示。

3.根据权利要求2所述的基于知识感知的多中心临床数据集适配设备，其特征在于，

所述患者表征模块由一个患者特征编码器组成，所述患者特征编码器包括一个第一多层感知机，所述第一多层感知机的结构设定为二层，以两个数据集中的数据作为所述第一多层感知机的输入层；

设定第一层输出n_i1个节点，第二层输出n_i2个节点，所述第一多层感知机通过以下公式进行计算：

z₁ ^p＝σ(W₁x+b₁)，

z₂ ^p＝σ(W₂z₁ ^p+b₂)，

4.根据权利要求3所述的基于知识感知的多中心临床数据集适配设备，其特征在于，

所述知识表征模块包含：知识特征提取子模块、知识特征编码器和知识特征解码器；

所述知识特征提取子模块通过所述数据输入单元输入的所述训练数据提取相应的概念e_i和对应的特征向量

对最终得到的所有特征向量

取平均获得所述知识特征x^k；

通过所述知识特征编码器提取出所述知识特征x^k潜在的所述知识特征表示z^k，再通过所述知识特征解码器对所述知识特征表示z^k重建,其计算公式如下：

z^k＝W_k1x^k+b_k1，

其中，W_k1表示所述知识特征编码器的权重矩阵，b_k1表示所述知识特征编码器的偏置，W_k2表示所述知识特征解码器的权重矩阵，b_k2表示所述知识特征解码器的偏置，

表示重建的特征向量。

5.根据权利要求1所述的基于知识感知的多中心临床数据集适配设备，其特征在于，

通过Adam算法优化所述总损失函数