CN111524571A

CN111524571A - 一种脑卒中患者个性化治疗方案推荐方法

Info

Publication number: CN111524571A
Application number: CN202010434146.2A
Authority: CN
Inventors: 刘勇国; 曹晨; 杨尚明; 李巧勤
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2020-08-11
Anticipated expiration: 2040-05-21
Also published as: CN111524571B

Abstract

本发明公开了一种脑卒中患者个性化治疗方案推荐方法，包括以下步骤：S1、将患者电子病历中的查体与评估结果的文本信息进行预处理；S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示；S3、基于文档向量对神经网络模型进行训练，得到个性化治疗方案推荐模型；S4、将新患者电子病历的查体与评估结果进行数据统一表达、分词及文本过滤处理后进行文档向量表示，输入个性化治疗方案推荐模型，得到推荐的个性化治疗方案。本发明将患者电子病历中的评估与查体信息看为一个文档，将个性化治疗方案推荐过程转化为一个多标签分类问题，能够根据患者的查体结果与评估结果推荐个性化治疗方案，为医师提供辅助决策，减轻医生负担。

Description

一种脑卒中患者个性化治疗方案推荐方法

技术领域

本发明涉及一种脑卒中患者个性化治疗方案推荐方法。

背景技术

脑卒中是一种以脑部缺血及出血性损伤症状为主要临床表现的疾病，又称脑中风或脑血管意外。脑卒中具有高发病率、高死亡率和高致残率的特点，给患者家庭和社会带来很大负担。临床观察显示，合理的康复治疗和康复训练是改善卒中患者身体功能和降低死亡率的有效方法。由于患者之间病情和个体性差异较大，康复治疗需要有针对性，为患者量身打造个性化康复治疗方案尤为重要。目前通常是由医师基于评估师对患者身体功能状态的评估结果制定康复治疗方案，主要依赖医师主观经验，具有一定主观性。

随着数据挖掘、机器学习等技术的发展及在临床医疗领域的应用，为患者推荐个性化康复治疗方案成为可能。通过对患者身体功能评估结果进行挖掘分析，可根据患者情况推荐个性化康复治疗方案，为医师提供辅助决策。

中国专利“CN109859851A一种治疗方案推荐方法和装置”所述技术方案通过获取目标患者的患病症状信息，根据目标患者信息从目标数据库中查找治疗方案，得到多个候选治疗方案，然后计算候选治疗方案所关联的患者症状与目标患者症状之间的相似度，相似度满足预设条件则输出最终候选治疗方案，根据临床用药数据对多个候选治疗方案进行筛选，得到至少一个目标治疗方案，最后输出目标治疗方案。

论文“A novel classification method for aid decision of traditionalChinese patent medicines for stroke treatment”所述技术方案通过收集卒中患者症状信息、历史疾病信息、舌脉诊断信息以及理化指标等300多个指标，使用统计分析、特征选择、降维等方法最终得到36个特定指标，将患者患病特征与中成药针对症状进行匹配，得到中成药治疗脑卒中的辅助决策模型，为患者进行用药推荐。

临床上医师通过患者状态及评估结果为患者制定治疗方案，存在下列问题：1)患者评估结果得分相同，但是不同患者之间存在差异，需要结合患者自身身体状态来制定治疗方案。2)受医师主观影响大，不同医师之间的治疗方案存在差异。

基于数据挖掘、机器学习等技术的治疗方案推荐方法，主要基于患者症状相似性进行推荐，大多只能进行剂量或用药类型推荐；且临床中存在患者症状相似但却患病不同的情况，现有按症状推荐的方法可能导致推荐结果不可用。

发明内容

本发明的目的在于克服现有技术的不足，提供一种采用自然语言处理的方法，将患者电子病历中的评估与查体信息看为一个文档，根据患者的查体结果与评估结果推荐个性化治疗方案，为医师提供辅助决策，减轻医生负担的一种脑卒中患者个性化治疗方案推荐方法。

本发明的目的是通过以下技术方案来实现的：一种脑卒中患者个性化治疗方案推荐方法，包括以下步骤：

S1、将患者电子病历中的查体与评估结果的文本信息进行预处理；

S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示；

S3、基于步骤S2得到的文档向量对神经网络模型进行训练，得到个性化治疗方案推荐模型；

S4、将新患者电子病历的查体与评估结果进行数据统一表达、分词及文本过滤处理后进行文档向量表示，然后输入步骤S3训练好的个性化治疗方案推荐模型，得到模型推荐的个性化治疗方案。

进一步地，所述步骤S1中，查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案；

信息预处理包括以下子步骤：

S11、缺失数据删除：训练数据集包括患者查体与评估结果、治疗方案。由于部分数据存在缺失的情况，将数据集中治疗方案缺失的患者数据删除，其中治疗方案为医生开具的具体治疗内容；

S12、数据表达统一：不同医生对治疗方案的描述存在差异，需要将治疗方案中采用不同术语表示的治疗内容进行统一；如“上肢运动训练”和“上肢运动功能训练”，实际为同一治疗方案，采用人工方式统一为“上肢运动训练”；

S13、分词及文本过滤：

S131、分词：利用python的第三方库jieba对患者电子病历中查体与评估结果的文本进行分词处理；

S132、标点符号去除：将查体与评估结果中的标点符号去除；

S133、停用词过滤。

进一步地，所述步骤S2具体实现方法为：将每个患者的查体结果与评估结果分别表示为一个文档；获取所有文档的不同词组成词表，词表长度为M；假设每个文档中含有L个句子，第i个句子表示为s_i，i∈[1，L]，设句子s_i中有T个单词，第t个单词的one-hot向量表示为x_it，t∈[1，T]；则对于每一个词的one-hot向量均为一个M维向量，且只在其对应位置上的值为1，其他位置都是0；

句子s_i使用该句子所包含的所有词的词向量加权平均表示：

将L个句子横向拼接生成第i个患者的查体与评估结果文档d_i，表示为一个L×M的二维矩阵：

d_i＝[s₁，s₂，s₃，...s_L]。

进一步地，所述步骤S3包括以下子步骤：

S31、使用步骤S2得到的文档向量作为输入，使用VGG16网络提取患者特征；所述VGG16网络包含16个隐藏层，其中13层为卷积层，3层为全连接层；卷积核大小3×3，卷积步长为1；

每个卷积层分5个卷积段，每个卷积段后都连接一个最大池化层来进行下采样，池化核大小为2×2，池化步长为2；

第一个卷积段使用64个卷积核进行两次卷积；第二个卷积段使用128个卷积核进行两次卷积；第三个卷积段使用256个卷积核进行三次卷积操作；第四和第五个卷积段都使用512个卷积核进行三次卷积操作；

全连接层的目的是为了将输出扁平化，即转化为一个一维向量，其中前两层全连接层神经元个数都为4096，即将其转化为1×4096大小，最后一层神经元数为1000；

若第k层为卷积层，第k-1层为池化层或者输入层，则第k层的第j个特征图计算如下：

其中，M_j表示卷积核数量，

表示第k-1层所有关联的特征图，

表示第k层的第j个卷积核，“*”表示卷积运算；

表示偏置参数；

若第k层为池化层，第k-1层为卷积层，则第k层池化的计算公式如下所示：

其中down表示池化操作，

表示权重参数，

表示第k-1层所有关联的特征图；

网络的所有隐藏层都使用ReLU作为激活函数，其计算公式如下：

f(x)＝max(0，x)

VGG16网络输出一维向量，表示从患者电子病历文档中提取的患病特征；

S32、将S31得到的患者患病特征作为输入，使用Unet网络实现特征重构；

Unet网络结构由卷积层、最大池化层、反卷积层以及ReLU非线性激活函数组成；

Unet网络的下采样过程分多组卷积操作进行，每组卷积操作后进行一次最大池化操作；收缩路径共进行4次下采样，每次下采样使用大小为3×3的卷积核进行两次卷积操作，接着使用ReLU作为激活函数进行计算，最后进行最大池化操作；

Unet网络的上采样过程进行4次上采样操作，上采样过程使用的是多组反卷积；每次上采样经过卷积核大小为2×2的卷积操作后，使用ReLU作为激活函数进行计算，然后输入大小为3×3的卷积核进行两次卷积操作；每次上采样操作都需要将前一次上采样后得到的特征进行合并；

Unet最后一层输出长度为n的特征向量s＝{s₁,…,s_t,…,s_n}，其中n表示标签总数量，s_t表示模型输出的对应第t个标签的特征值；

S33、使用softmax计算标签归一化概率；

将Unet网络输出的特征值作为softmax的输入，计算患者数据经模型预测的第t个标签(治疗方案)的概率：

S34、误差反向传播与迭代训练：利用样本的真实治疗方案概率分布和模型预测治疗方案概率分布之间的交叉熵计算代价函数L(θ)，作为模型预测误差：

其中Batch为批量随机梯度下降中设置的批量样本数，P_i为第i个样本的预测治疗方案概率分布，y_i为第i个样本的真实治疗方案概率分布，θ为模型参数，包括所有权重和偏置参数；

使用批量梯度下降的误差反向传播算法对网络进行迭代训练，更新模型参数，使模型预测误差最小化，完成模型训练并保存训练好的模型。

进一步地，所述步骤S4具体实现方法为：对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示，输入步骤S3训练好的网络模型，最终输出标签概率大于预设阈值的康复治疗方案。

本发明的有益效果是：本发明采用自然语言处理的方法，将患者电子病历中的评估与查体信息看为一个文档，为其推荐个性化治疗方案，可以解决患者因为评估项目不同而导致输入长度不一致的问题，允许进行变长输入；将个性化治疗方案推荐过程转化为一个多标签分类问题，借鉴编码-解码器思想，采用VGG16模型进行患者患病情况特征提取，其中卷积层采取分段方式，减少网络参数，有效减少模型训练时间；使用Unet网络进行特征重构，最后通过softmax输出相应标签概率，即每个患者拥有该标签对应治疗方案的概率，根据患者的查体结果与评估结果推荐个性化治疗方案，为医师提供辅助决策，减轻医生负担。

附图说明

图1为本发明的一种脑卒中患者个性化治疗方案推荐方法的流程图；

图2为本发明的模型训练框架图；

图3为本发明的Unet网络结构图。

具体实施方式

下面结合附图进一步说明本发明的技术方案。

临床医师可以为每个患者制定多个治疗方案，每个治疗方案作为电子病历的一个标签，则本发明的个性化治疗方案推荐问题可以转化为一个多标签分类问题。通过采集卒中患者的电子病历信息，提取患者电子病历中的评估结果与查体结果，用词向量表示，使用VGG16网络进行特征提取，然后通过Unet网络进行特征重构，最后使用softmax输出各个标签的概率，根据概率大小得到推荐的治疗方案。

本发明的脑卒中患者个性化治疗方案推荐方法的流程如图1所示，模型训练框架图如图2所示。一种脑卒中患者个性化治疗方案推荐方法，包括以下步骤：

S1、将患者电子病历中的查体与评估结果的文本信息进行预处理；查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案；

信息预处理包括以下子步骤：

S13、分词及文本过滤：

S132、标点符号去除：将查体与评估结果中的标点符号去除；

S133、停用词过滤；经过分词处理后，文本还存在一些不具有任何信息的词语，如“的”、“及”、“及其”等，属于冗余信息，通过导入哈工大停用词表，将这些词语剔除。

以一个患者的电子病历为例，其中的评估结果与查体情况如下：患者左侧肢体偏瘫；改良Ashworth分级：踝跖屈肌肌张力1级；Brunnstrom分期：下肢Ⅲ期；Fugl-Meyer评分：1)运动：下肢17分，共同运动不完全；2)平衡8分；3)感觉：减退。4)被动关节活动度：正常5)疼痛：无疼痛。坐位平衡2级，站立平衡1级，监护下可扶拐站立，少量帮助下扶栏杆步行30米；由于患者左侧上肢较无力，自主活动较差，导致患者需要他人帮助完成自理活动；由于患者躯干力量较弱且颈椎腰部有疼痛，导致患者转移时需要帮助；由于患者左侧手部无活动，导致患者依赖家属护工照顾。

本步骤具体实现方法为：将每个患者的查体结果与评估结果分别表示为一个文档；获取所有文档的不同词组成词表，词表长度为M；假设每个文档中含有L个句子，第i个句子表示为s_i，i∈[1，L]，设句子s_i中有T个单词，第t个单词的one-hot向量表示为x_it，t∈[1，T]；则对于每一个词的one-hot向量均为一个M维向量，且只在其对应位置上的值为1，其他位置都是0；

句子s_i使用该句子所包含的所有词的词向量加权平均表示：

d_i＝[s₁，s₂，s₃，...s_L]。

S3、基于步骤S2得到的文档向量对神经网络模型进行训练，得到个性化治疗方案推荐模型；包括以下子步骤：

S31、使用步骤S2得到的文档向量d_i作为输入，使用VGG16网络提取患者特征；所述VGG16网络包含16个隐藏层，其中13层为卷积层，3层为全连接层；卷积核大小3×3，卷积步长为1；

其中，M_j表示卷积核数量，

表示第k-1层所有关联的特征图，

表示第k层的第j个卷积核，“*”表示卷积运算；

表示偏置参数；

其中down表示池化操作，

表示权重参数，

表示第k-1层所有关联的特征图；偏置参数与权重参数均通过网络学习后自动获得；

f(x)＝max(0，x)

S32、将S31得到的患者患病特征作为输入，使用Unet网络实现特征重构，Unet网络结构如图3所示；

Unet网络结构由卷积层、最大池化层(下采样)、反卷积层(上采样)以及ReLU非线性激活函数组成；

S33、使用softmax计算标签归一化概率；

S4、具体实现方法为：对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示，然后输入步骤S3训练好的个性化治疗方案推荐模型，最终输出标签概率大于预设阈值的康复治疗方案，得到模型推荐的个性化治疗方案。

本领域的普通技术人员将会意识到，这里所述的实施例是为了帮助读者理解本发明的原理，应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合，这些变形和组合仍然在本发明的保护范围内。

Claims

1.一种脑卒中患者个性化治疗方案推荐方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法，其特征在于，所述步骤S1中，查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案；

信息预处理包括以下子步骤：

S11、缺失数据删除：将数据集中治疗方案缺失的患者数据删除；

S12、数据表达统一：将治疗方案中采用不同术语表示的治疗内容进行统一；

S13、分词及文本过滤：

S132、标点符号去除：将查体与评估结果中的标点符号去除；

S133、停用词过滤。

3.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法，其特征在于，所述步骤S2具体实现方法为：将每个患者的查体结果与评估结果分别表示为一个文档；获取所有文档的不同词组成词表，词表长度为M；假设每个文档中含有L个句子，第i个句子表示为s_i，i∈[1，L]，设句子s_i中有T个单词，第t个单词的one-hot向量表示为x_it，t∈[1，T]；则对于每一个词的one-hot向量均为一个M维向量，且只在其对应位置上的值为1，其他位置都是0；

句子s_i使用该句子所包含的所有词的词向量加权平均表示：

d_i＝[s₁，s₂，s₃，...s_L]。

4.根据权利要求3所述的一种脑卒中患者个性化治疗方案推荐方法，其特征在于，所述步骤S3包括以下子步骤：

其中，M_j表示卷积核数量，

表示第k-1层所有关联的特征图，

表示第k层的第j个卷积核，“*”表示卷积运算；

表示偏置参数；

其中down表示池化操作，

表示权重参数，

表示第k-1层所有关联的特征图；

f(x)＝max(0，x)

S33、使用softmax计算标签归一化概率；

5.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法，其特征在于，所述步骤S4具体实现方法为：对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示，输入步骤S3训练好的网络模型，最终输出标签概率大于预设阈值的康复治疗方案。