CN111524571A - 一种脑卒中患者个性化治疗方案推荐方法 - Google Patents
一种脑卒中患者个性化治疗方案推荐方法 Download PDFInfo
- Publication number
- CN111524571A CN111524571A CN202010434146.2A CN202010434146A CN111524571A CN 111524571 A CN111524571 A CN 111524571A CN 202010434146 A CN202010434146 A CN 202010434146A CN 111524571 A CN111524571 A CN 111524571A
- Authority
- CN
- China
- Prior art keywords
- patient
- convolution
- layer
- treatment scheme
- physical examination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011282 treatment Methods 0.000 title claims abstract description 98
- 238000000034 method Methods 0.000 title claims abstract description 37
- 208000006011 Stroke Diseases 0.000 title claims abstract description 25
- 238000011156 evaluation Methods 0.000 claims abstract description 45
- 238000012549 training Methods 0.000 claims abstract description 25
- 230000011218 segmentation Effects 0.000 claims abstract description 17
- 238000001914 filtration Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000003062 neural network model Methods 0.000 claims abstract description 4
- 238000011176 pooling Methods 0.000 claims description 29
- 230000004913 activation Effects 0.000 claims description 12
- 238000005070 sampling Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 230000008602 contraction Effects 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000004064 dysfunction Effects 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000011269 treatment regimen Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 13
- 208000024891 symptom Diseases 0.000 description 9
- 210000001364 upper extremity Anatomy 0.000 description 7
- 229940079593 drug Drugs 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 206010008190 Cerebrovascular accident Diseases 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003141 lower extremity Anatomy 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- 230000003863 physical function Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 201000006474 Brain Ischemia Diseases 0.000 description 1
- 206010008120 Cerebral ischaemia Diseases 0.000 description 1
- 206010019468 Hemiplegia Diseases 0.000 description 1
- 206010049816 Muscle tightness Diseases 0.000 description 1
- 210000003423 ankle Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 206010008118 cerebral infarction Diseases 0.000 description 1
- 208000026106 cerebrovascular disease Diseases 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 208000037907 haemorrhagic injury Diseases 0.000 description 1
- 238000011337 individualized treatment Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种脑卒中患者个性化治疗方案推荐方法,包括以下步骤:S1、将患者电子病历中的查体与评估结果的文本信息进行预处理;S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示;S3、基于文档向量对神经网络模型进行训练,得到个性化治疗方案推荐模型;S4、将新患者电子病历的查体与评估结果进行数据统一表达、分词及文本过滤处理后进行文档向量表示,输入个性化治疗方案推荐模型,得到推荐的个性化治疗方案。本发明将患者电子病历中的评估与查体信息看为一个文档,将个性化治疗方案推荐过程转化为一个多标签分类问题,能够根据患者的查体结果与评估结果推荐个性化治疗方案,为医师提供辅助决策,减轻医生负担。
Description
技术领域
本发明涉及一种脑卒中患者个性化治疗方案推荐方法。
背景技术
脑卒中是一种以脑部缺血及出血性损伤症状为主要临床表现的疾病,又称脑中风或脑血管意外。脑卒中具有高发病率、高死亡率和高致残率的特点,给患者家庭和社会带来很大负担。临床观察显示,合理的康复治疗和康复训练是改善卒中患者身体功能和降低死亡率的有效方法。由于患者之间病情和个体性差异较大,康复治疗需要有针对性,为患者量身打造个性化康复治疗方案尤为重要。目前通常是由医师基于评估师对患者身体功能状态的评估结果制定康复治疗方案,主要依赖医师主观经验,具有一定主观性。
随着数据挖掘、机器学习等技术的发展及在临床医疗领域的应用,为患者推荐个性化康复治疗方案成为可能。通过对患者身体功能评估结果进行挖掘分析,可根据患者情况推荐个性化康复治疗方案,为医师提供辅助决策。
中国专利“CN109859851A一种治疗方案推荐方法和装置”所述技术方案通过获取目标患者的患病症状信息,根据目标患者信息从目标数据库中查找治疗方案,得到多个候选治疗方案,然后计算候选治疗方案所关联的患者症状与目标患者症状之间的相似度,相似度满足预设条件则输出最终候选治疗方案,根据临床用药数据对多个候选治疗方案进行筛选,得到至少一个目标治疗方案,最后输出目标治疗方案。
论文“A novel classification method for aid decision of traditionalChinese patent medicines for stroke treatment”所述技术方案通过收集卒中患者症状信息、历史疾病信息、舌脉诊断信息以及理化指标等300多个指标,使用统计分析、特征选择、降维等方法最终得到36个特定指标,将患者患病特征与中成药针对症状进行匹配,得到中成药治疗脑卒中的辅助决策模型,为患者进行用药推荐。
临床上医师通过患者状态及评估结果为患者制定治疗方案,存在下列问题:1)患者评估结果得分相同,但是不同患者之间存在差异,需要结合患者自身身体状态来制定治疗方案。2)受医师主观影响大,不同医师之间的治疗方案存在差异。
基于数据挖掘、机器学习等技术的治疗方案推荐方法,主要基于患者症状相似性进行推荐,大多只能进行剂量或用药类型推荐;且临床中存在患者症状相似但却患病不同的情况,现有按症状推荐的方法可能导致推荐结果不可用。
发明内容
本发明的目的在于克服现有技术的不足,提供一种采用自然语言处理的方法,将患者电子病历中的评估与查体信息看为一个文档,根据患者的查体结果与评估结果推荐个性化治疗方案,为医师提供辅助决策,减轻医生负担的一种脑卒中患者个性化治疗方案推荐方法。
本发明的目的是通过以下技术方案来实现的:一种脑卒中患者个性化治疗方案推荐方法,包括以下步骤:
S1、将患者电子病历中的查体与评估结果的文本信息进行预处理;
S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示;
S3、基于步骤S2得到的文档向量对神经网络模型进行训练,得到个性化治疗方案推荐模型;
S4、将新患者电子病历的查体与评估结果进行数据统一表达、分词及文本过滤处理后进行文档向量表示,然后输入步骤S3训练好的个性化治疗方案推荐模型,得到模型推荐的个性化治疗方案。
进一步地,所述步骤S1中,查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案;
信息预处理包括以下子步骤:
S11、缺失数据删除:训练数据集包括患者查体与评估结果、治疗方案。由于部分数据存在缺失的情况,将数据集中治疗方案缺失的患者数据删除,其中治疗方案为医生开具的具体治疗内容;
S12、数据表达统一:不同医生对治疗方案的描述存在差异,需要将治疗方案中采用不同术语表示的治疗内容进行统一;如“上肢运动训练”和“上肢运动功能训练”,实际为同一治疗方案,采用人工方式统一为“上肢运动训练”;
S13、分词及文本过滤:
S131、分词:利用python的第三方库jieba对患者电子病历中查体与评估结果的文本进行分词处理;
S132、标点符号去除:将查体与评估结果中的标点符号去除;
S133、停用词过滤。
进一步地,所述步骤S2具体实现方法为:将每个患者的查体结果与评估结果分别表示为一个文档;获取所有文档的不同词组成词表,词表长度为M;假设每个文档中含有L个句子,第i个句子表示为si,i∈[1,L],设句子si中有T个单词,第t个单词的one-hot向量表示为xit,t∈[1,T];则对于每一个词的one-hot向量均为一个M维向量,且只在其对应位置上的值为1,其他位置都是0;
句子si使用该句子所包含的所有词的词向量加权平均表示:
将L个句子横向拼接生成第i个患者的查体与评估结果文档di,表示为一个L×M的二维矩阵:
di=[s1,s2,s3,...sL]。
进一步地,所述步骤S3包括以下子步骤:
S31、使用步骤S2得到的文档向量作为输入,使用VGG16网络提取患者特征;所述VGG16网络包含16个隐藏层,其中13层为卷积层,3层为全连接层;卷积核大小3×3,卷积步长为1;
每个卷积层分5个卷积段,每个卷积段后都连接一个最大池化层来进行下采样,池化核大小为2×2,池化步长为2;
第一个卷积段使用64个卷积核进行两次卷积;第二个卷积段使用128个卷积核进行两次卷积;第三个卷积段使用256个卷积核进行三次卷积操作;第四和第五个卷积段都使用512个卷积核进行三次卷积操作;
全连接层的目的是为了将输出扁平化,即转化为一个一维向量,其中前两层全连接层神经元个数都为4096,即将其转化为1×4096大小,最后一层神经元数为1000;
若第k层为卷积层,第k-1层为池化层或者输入层,则第k层的第j个特征图计算如下:
若第k层为池化层,第k-1层为卷积层,则第k层池化的计算公式如下所示:
网络的所有隐藏层都使用ReLU作为激活函数,其计算公式如下:
f(x)=max(0,x)
VGG16网络输出一维向量,表示从患者电子病历文档中提取的患病特征;
S32、将S31得到的患者患病特征作为输入,使用Unet网络实现特征重构;
Unet网络结构由卷积层、最大池化层、反卷积层以及ReLU非线性激活函数组成;
Unet网络的下采样过程分多组卷积操作进行,每组卷积操作后进行一次最大池化操作;收缩路径共进行4次下采样,每次下采样使用大小为3×3的卷积核进行两次卷积操作,接着使用ReLU作为激活函数进行计算,最后进行最大池化操作;
Unet网络的上采样过程进行4次上采样操作,上采样过程使用的是多组反卷积;每次上采样经过卷积核大小为2×2的卷积操作后,使用ReLU作为激活函数进行计算,然后输入大小为3×3的卷积核进行两次卷积操作;每次上采样操作都需要将前一次上采样后得到的特征进行合并;
Unet最后一层输出长度为n的特征向量s={s1,…,st,…,sn},其中n表示标签总数量,st表示模型输出的对应第t个标签的特征值;
S33、使用softmax计算标签归一化概率;
将Unet网络输出的特征值作为softmax的输入,计算患者数据经模型预测的第t个标签(治疗方案)的概率:
S34、误差反向传播与迭代训练:利用样本的真实治疗方案概率分布和模型预测治疗方案概率分布之间的交叉熵计算代价函数L(θ),作为模型预测误差:
其中Batch为批量随机梯度下降中设置的批量样本数,Pi为第i个样本的预测治疗方案概率分布,yi为第i个样本的真实治疗方案概率分布,θ为模型参数,包括所有权重和偏置参数;
使用批量梯度下降的误差反向传播算法对网络进行迭代训练,更新模型参数,使模型预测误差最小化,完成模型训练并保存训练好的模型。
进一步地,所述步骤S4具体实现方法为:对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示,输入步骤S3训练好的网络模型,最终输出标签概率大于预设阈值的康复治疗方案。
本发明的有益效果是:本发明采用自然语言处理的方法,将患者电子病历中的评估与查体信息看为一个文档,为其推荐个性化治疗方案,可以解决患者因为评估项目不同而导致输入长度不一致的问题,允许进行变长输入;将个性化治疗方案推荐过程转化为一个多标签分类问题,借鉴编码-解码器思想,采用VGG16模型进行患者患病情况特征提取,其中卷积层采取分段方式,减少网络参数,有效减少模型训练时间;使用Unet网络进行特征重构,最后通过softmax输出相应标签概率,即每个患者拥有该标签对应治疗方案的概率,根据患者的查体结果与评估结果推荐个性化治疗方案,为医师提供辅助决策,减轻医生负担。
附图说明
图1为本发明的一种脑卒中患者个性化治疗方案推荐方法的流程图;
图2为本发明的模型训练框架图;
图3为本发明的Unet网络结构图。
具体实施方式
下面结合附图进一步说明本发明的技术方案。
临床医师可以为每个患者制定多个治疗方案,每个治疗方案作为电子病历的一个标签,则本发明的个性化治疗方案推荐问题可以转化为一个多标签分类问题。通过采集卒中患者的电子病历信息,提取患者电子病历中的评估结果与查体结果,用词向量表示,使用VGG16网络进行特征提取,然后通过Unet网络进行特征重构,最后使用softmax输出各个标签的概率,根据概率大小得到推荐的治疗方案。
本发明的脑卒中患者个性化治疗方案推荐方法的流程如图1所示,模型训练框架图如图2所示。一种脑卒中患者个性化治疗方案推荐方法,包括以下步骤:
S1、将患者电子病历中的查体与评估结果的文本信息进行预处理;查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案;
信息预处理包括以下子步骤:
S11、缺失数据删除:训练数据集包括患者查体与评估结果、治疗方案。由于部分数据存在缺失的情况,将数据集中治疗方案缺失的患者数据删除,其中治疗方案为医生开具的具体治疗内容;
S12、数据表达统一:不同医生对治疗方案的描述存在差异,需要将治疗方案中采用不同术语表示的治疗内容进行统一;如“上肢运动训练”和“上肢运动功能训练”,实际为同一治疗方案,采用人工方式统一为“上肢运动训练”;
S13、分词及文本过滤:
S131、分词:利用python的第三方库jieba对患者电子病历中查体与评估结果的文本进行分词处理;
S132、标点符号去除:将查体与评估结果中的标点符号去除;
S133、停用词过滤;经过分词处理后,文本还存在一些不具有任何信息的词语,如“的”、“及”、“及其”等,属于冗余信息,通过导入哈工大停用词表,将这些词语剔除。
S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示;
以一个患者的电子病历为例,其中的评估结果与查体情况如下:患者左侧肢体偏瘫;改良Ashworth分级:踝跖屈肌肌张力1级;Brunnstrom分期:下肢Ⅲ期;Fugl-Meyer评分:1)运动:下肢17分,共同运动不完全;2)平衡8分;3)感觉:减退。4)被动关节活动度:正常5)疼痛:无疼痛。坐位平衡2级,站立平衡1级,监护下可扶拐站立,少量帮助下扶栏杆步行30米;由于患者左侧上肢较无力,自主活动较差,导致患者需要他人帮助完成自理活动;由于患者躯干力量较弱且颈椎腰部有疼痛,导致患者转移时需要帮助;由于患者左侧手部无活动,导致患者依赖家属护工照顾。
本步骤具体实现方法为:将每个患者的查体结果与评估结果分别表示为一个文档;获取所有文档的不同词组成词表,词表长度为M;假设每个文档中含有L个句子,第i个句子表示为si,i∈[1,L],设句子si中有T个单词,第t个单词的one-hot向量表示为xit,t∈[1,T];则对于每一个词的one-hot向量均为一个M维向量,且只在其对应位置上的值为1,其他位置都是0;
句子si使用该句子所包含的所有词的词向量加权平均表示:
将L个句子横向拼接生成第i个患者的查体与评估结果文档di,表示为一个L×M的二维矩阵:
di=[s1,s2,s3,...sL]。
S3、基于步骤S2得到的文档向量对神经网络模型进行训练,得到个性化治疗方案推荐模型;包括以下子步骤:
S31、使用步骤S2得到的文档向量di作为输入,使用VGG16网络提取患者特征;所述VGG16网络包含16个隐藏层,其中13层为卷积层,3层为全连接层;卷积核大小3×3,卷积步长为1;
每个卷积层分5个卷积段,每个卷积段后都连接一个最大池化层来进行下采样,池化核大小为2×2,池化步长为2;
第一个卷积段使用64个卷积核进行两次卷积;第二个卷积段使用128个卷积核进行两次卷积;第三个卷积段使用256个卷积核进行三次卷积操作;第四和第五个卷积段都使用512个卷积核进行三次卷积操作;
全连接层的目的是为了将输出扁平化,即转化为一个一维向量,其中前两层全连接层神经元个数都为4096,即将其转化为1×4096大小,最后一层神经元数为1000;
若第k层为卷积层,第k-1层为池化层或者输入层,则第k层的第j个特征图计算如下:
若第k层为池化层,第k-1层为卷积层,则第k层池化的计算公式如下所示:
网络的所有隐藏层都使用ReLU作为激活函数,其计算公式如下:
f(x)=max(0,x)
VGG16网络输出一维向量,表示从患者电子病历文档中提取的患病特征;
S32、将S31得到的患者患病特征作为输入,使用Unet网络实现特征重构,Unet网络结构如图3所示;
Unet网络结构由卷积层、最大池化层(下采样)、反卷积层(上采样)以及ReLU非线性激活函数组成;
Unet网络的下采样过程分多组卷积操作进行,每组卷积操作后进行一次最大池化操作;收缩路径共进行4次下采样,每次下采样使用大小为3×3的卷积核进行两次卷积操作,接着使用ReLU作为激活函数进行计算,最后进行最大池化操作;
Unet网络的上采样过程进行4次上采样操作,上采样过程使用的是多组反卷积;每次上采样经过卷积核大小为2×2的卷积操作后,使用ReLU作为激活函数进行计算,然后输入大小为3×3的卷积核进行两次卷积操作;每次上采样操作都需要将前一次上采样后得到的特征进行合并;
Unet最后一层输出长度为n的特征向量s={s1,…,st,…,sn},其中n表示标签总数量,st表示模型输出的对应第t个标签的特征值;
S33、使用softmax计算标签归一化概率;
将Unet网络输出的特征值作为softmax的输入,计算患者数据经模型预测的第t个标签(治疗方案)的概率:
S34、误差反向传播与迭代训练:利用样本的真实治疗方案概率分布和模型预测治疗方案概率分布之间的交叉熵计算代价函数L(θ),作为模型预测误差:
其中Batch为批量随机梯度下降中设置的批量样本数,Pi为第i个样本的预测治疗方案概率分布,yi为第i个样本的真实治疗方案概率分布,θ为模型参数,包括所有权重和偏置参数;
使用批量梯度下降的误差反向传播算法对网络进行迭代训练,更新模型参数,使模型预测误差最小化,完成模型训练并保存训练好的模型。
S4、具体实现方法为:对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示,然后输入步骤S3训练好的个性化治疗方案推荐模型,最终输出标签概率大于预设阈值的康复治疗方案,得到模型推荐的个性化治疗方案。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。
Claims (5)
1.一种脑卒中患者个性化治疗方案推荐方法,其特征在于,包括以下步骤:
S1、将患者电子病历中的查体与评估结果的文本信息进行预处理;
S2、将患者电子病历中的查体与评估结果中的词语、句子、文档用向量的方式表示;
S3、基于步骤S2得到的文档向量对神经网络模型进行训练,得到个性化治疗方案推荐模型;
S4、将新患者电子病历的查体与评估结果进行数据统一表达、分词及文本过滤处理后进行文档向量表示,然后输入步骤S3训练好的个性化治疗方案推荐模型,得到模型推荐的个性化治疗方案。
2.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法,其特征在于,所述步骤S1中,查体与评估信息包括患者专科查体、评估项目得分情况、对患者功能障碍情况的描述以及患者治疗方案;
信息预处理包括以下子步骤:
S11、缺失数据删除:将数据集中治疗方案缺失的患者数据删除;
S12、数据表达统一:将治疗方案中采用不同术语表示的治疗内容进行统一;
S13、分词及文本过滤:
S131、分词:利用python的第三方库jieba对患者电子病历中查体与评估结果的文本进行分词处理;
S132、标点符号去除:将查体与评估结果中的标点符号去除;
S133、停用词过滤。
3.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法,其特征在于,所述步骤S2具体实现方法为:将每个患者的查体结果与评估结果分别表示为一个文档;获取所有文档的不同词组成词表,词表长度为M;假设每个文档中含有L个句子,第i个句子表示为si,i∈[1,L],设句子si中有T个单词,第t个单词的one-hot向量表示为xit,t∈[1,T];则对于每一个词的one-hot向量均为一个M维向量,且只在其对应位置上的值为1,其他位置都是0;
句子si使用该句子所包含的所有词的词向量加权平均表示:
将L个句子横向拼接生成第i个患者的查体与评估结果文档di,表示为一个L×M的二维矩阵:
di=[s1,s2,s3,...sL]。
4.根据权利要求3所述的一种脑卒中患者个性化治疗方案推荐方法,其特征在于,所述步骤S3包括以下子步骤:
S31、使用步骤S2得到的文档向量作为输入,使用VGG16网络提取患者特征;所述VGG16网络包含16个隐藏层,其中13层为卷积层,3层为全连接层;卷积核大小3×3,卷积步长为1;
每个卷积层分5个卷积段,每个卷积段后都连接一个最大池化层来进行下采样,池化核大小为2×2,池化步长为2;
第一个卷积段使用64个卷积核进行两次卷积;第二个卷积段使用128个卷积核进行两次卷积;第三个卷积段使用256个卷积核进行三次卷积操作;第四和第五个卷积段都使用512个卷积核进行三次卷积操作;
全连接层的目的是为了将输出扁平化,即转化为一个一维向量,其中前两层全连接层神经元个数都为4096,即将其转化为1×4096大小,最后一层神经元数为1000;
若第k层为卷积层,第k-1层为池化层或者输入层,则第k层的第j个特征图计算如下:
若第k层为池化层,第k-1层为卷积层,则第k层池化的计算公式如下所示:
网络的所有隐藏层都使用ReLU作为激活函数,其计算公式如下:
f(x)=max(0,x)
VGG16网络输出一维向量,表示从患者电子病历文档中提取的患病特征;
S32、将S31得到的患者患病特征作为输入,使用Unet网络实现特征重构;
Unet网络结构由卷积层、最大池化层、反卷积层以及ReLU非线性激活函数组成;
Unet网络的下采样过程分多组卷积操作进行,每组卷积操作后进行一次最大池化操作;收缩路径共进行4次下采样,每次下采样使用大小为3×3的卷积核进行两次卷积操作,接着使用ReLU作为激活函数进行计算,最后进行最大池化操作;
Unet网络的上采样过程进行4次上采样操作,上采样过程使用的是多组反卷积;每次上采样经过卷积核大小为2×2的卷积操作后,使用ReLU作为激活函数进行计算,然后输入大小为3×3的卷积核进行两次卷积操作;每次上采样操作都需要将前一次上采样后得到的特征进行合并;
Unet最后一层输出长度为n的特征向量s={s1,…,st,…,sn},其中n表示标签总数量,st表示模型输出的对应第t个标签的特征值;
S33、使用softmax计算标签归一化概率;
将Unet网络输出的特征值作为softmax的输入,计算患者数据经模型预测的第t个标签(治疗方案)的概率:
S34、误差反向传播与迭代训练:利用样本的真实治疗方案概率分布和模型预测治疗方案概率分布之间的交叉熵计算代价函数L(θ),作为模型预测误差:
其中Batch为批量随机梯度下降中设置的批量样本数,Pi为第i个样本的预测治疗方案概率分布,yi为第i个样本的真实治疗方案概率分布,θ为模型参数,包括所有权重和偏置参数;
使用批量梯度下降的误差反向传播算法对网络进行迭代训练,更新模型参数,使模型预测误差最小化,完成模型训练并保存训练好的模型。
5.根据权利要求1所述的一种脑卒中患者个性化治疗方案推荐方法,其特征在于,所述步骤S4具体实现方法为:对新患者电子病历数据中的查体与评估结果按照步骤S1、S2中预处理步骤进行数据表达统一、分词及文本过滤处理后进行文档向量表示,输入步骤S3训练好的网络模型,最终输出标签概率大于预设阈值的康复治疗方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010434146.2A CN111524571B (zh) | 2020-05-21 | 2020-05-21 | 一种脑卒中患者个性化治疗方案推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010434146.2A CN111524571B (zh) | 2020-05-21 | 2020-05-21 | 一种脑卒中患者个性化治疗方案推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111524571A true CN111524571A (zh) | 2020-08-11 |
CN111524571B CN111524571B (zh) | 2022-06-10 |
Family
ID=71905704
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010434146.2A Expired - Fee Related CN111524571B (zh) | 2020-05-21 | 2020-05-21 | 一种脑卒中患者个性化治疗方案推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111524571B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112242198A (zh) * | 2020-09-16 | 2021-01-19 | 汕头大学 | 基于大数据的失语症个性化治疗方案推荐方法及系统 |
CN113077866A (zh) * | 2021-03-19 | 2021-07-06 | 国家康复辅具研究中心 | 肢体运动训练方案自动推荐方法和系统 |
CN113505304A (zh) * | 2021-09-10 | 2021-10-15 | 明品云(北京)数据科技有限公司 | 一种目标对象推荐方法及系统 |
CN114171162A (zh) * | 2021-12-03 | 2022-03-11 | 广州穗海新峰医疗设备制造股份有限公司 | 一种基于大数据分析的镜像神经元康复训练的方法及系统 |
CN114596937A (zh) * | 2022-03-07 | 2022-06-07 | 四川大学 | 一种脊柱退变性结构偏差评价纠正系统 |
CN114613465A (zh) * | 2022-03-11 | 2022-06-10 | 岭南师范学院 | 一种脑卒中患病风险预测和个性化治疗推荐方法及系统 |
CN115148330A (zh) * | 2022-05-24 | 2022-10-04 | 中国医学科学院北京协和医院 | Pop治疗方案形成方法及系统 |
CN115206484A (zh) * | 2022-07-12 | 2022-10-18 | 国家康复辅具研究中心 | 一种脑卒中康复训练系统 |
CN116013503A (zh) * | 2022-12-27 | 2023-04-25 | 北大计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN117038010A (zh) * | 2023-10-10 | 2023-11-10 | 中国人民解放军总医院 | 一种化疗预备阶段的治疗画像生成方法和系统 |
CN117558451A (zh) * | 2024-01-11 | 2024-02-13 | 广州中大医疗器械有限公司 | 一种基于大数据的神经损失程度评估方法 |
CN118039062A (zh) * | 2024-04-12 | 2024-05-14 | 四川省肿瘤医院 | 一种基于大数据分析的个体化化疗剂量远程控制方法 |
CN118448006A (zh) * | 2024-07-08 | 2024-08-06 | 南昌大学第一附属医院 | 一种用于骨科的患者康复方案推荐方法及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096616A (zh) * | 2016-06-08 | 2016-11-09 | 四川大学华西医院 | 一种基于深度学习的磁共振影像特征提取及分类方法 |
CN106778014A (zh) * | 2016-12-29 | 2017-05-31 | 浙江大学 | 一种基于循环神经网络的患病风险预测方法 |
CN108345633A (zh) * | 2017-12-29 | 2018-07-31 | 天津南大通用数据技术股份有限公司 | 一种自然语言处理方法及装置 |
CN110349668A (zh) * | 2019-07-11 | 2019-10-18 | 四川大学 | 一种基于bp神经网络的治疗方案辅助决策方法及其系统 |
CN110491499A (zh) * | 2019-07-10 | 2019-11-22 | 厦门大学 | 面向标注电子病历的临床辅助决策方法及系统 |
CN110781924A (zh) * | 2019-09-29 | 2020-02-11 | 哈尔滨工程大学 | 一种基于全卷积神经网络的侧扫声纳图像特征提取方法 |
CN110928936A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 基于强化学习的信息处理方法、装置、设备和存储介质 |
-
2020
- 2020-05-21 CN CN202010434146.2A patent/CN111524571B/zh not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096616A (zh) * | 2016-06-08 | 2016-11-09 | 四川大学华西医院 | 一种基于深度学习的磁共振影像特征提取及分类方法 |
CN106778014A (zh) * | 2016-12-29 | 2017-05-31 | 浙江大学 | 一种基于循环神经网络的患病风险预测方法 |
CN108345633A (zh) * | 2017-12-29 | 2018-07-31 | 天津南大通用数据技术股份有限公司 | 一种自然语言处理方法及装置 |
CN110491499A (zh) * | 2019-07-10 | 2019-11-22 | 厦门大学 | 面向标注电子病历的临床辅助决策方法及系统 |
CN110349668A (zh) * | 2019-07-11 | 2019-10-18 | 四川大学 | 一种基于bp神经网络的治疗方案辅助决策方法及其系统 |
CN110781924A (zh) * | 2019-09-29 | 2020-02-11 | 哈尔滨工程大学 | 一种基于全卷积神经网络的侧扫声纳图像特征提取方法 |
CN110928936A (zh) * | 2019-10-18 | 2020-03-27 | 平安科技(深圳)有限公司 | 基于强化学习的信息处理方法、装置、设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
商金秋等: "基于电子病历可视分析的临床诊断模型", 《计算机系统应用》 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112242198A (zh) * | 2020-09-16 | 2021-01-19 | 汕头大学 | 基于大数据的失语症个性化治疗方案推荐方法及系统 |
CN112242198B (zh) * | 2020-09-16 | 2024-02-02 | 汕头大学 | 基于大数据的失语症个性化治疗方案推荐方法及系统 |
CN113077866A (zh) * | 2021-03-19 | 2021-07-06 | 国家康复辅具研究中心 | 肢体运动训练方案自动推荐方法和系统 |
WO2023035940A1 (zh) * | 2021-09-10 | 2023-03-16 | 上海明品医学数据科技有限公司 | 一种目标对象推荐方法及系统 |
CN113505304A (zh) * | 2021-09-10 | 2021-10-15 | 明品云(北京)数据科技有限公司 | 一种目标对象推荐方法及系统 |
CN114171162A (zh) * | 2021-12-03 | 2022-03-11 | 广州穗海新峰医疗设备制造股份有限公司 | 一种基于大数据分析的镜像神经元康复训练的方法及系统 |
CN114596937A (zh) * | 2022-03-07 | 2022-06-07 | 四川大学 | 一种脊柱退变性结构偏差评价纠正系统 |
CN114613465A (zh) * | 2022-03-11 | 2022-06-10 | 岭南师范学院 | 一种脑卒中患病风险预测和个性化治疗推荐方法及系统 |
CN115148330B (zh) * | 2022-05-24 | 2023-07-25 | 中国医学科学院北京协和医院 | Pop治疗方案形成方法及系统 |
CN115148330A (zh) * | 2022-05-24 | 2022-10-04 | 中国医学科学院北京协和医院 | Pop治疗方案形成方法及系统 |
CN115206484A (zh) * | 2022-07-12 | 2022-10-18 | 国家康复辅具研究中心 | 一种脑卒中康复训练系统 |
CN116013503A (zh) * | 2022-12-27 | 2023-04-25 | 北大计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN116013503B (zh) * | 2022-12-27 | 2024-02-20 | 北京大学长沙计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN117038010A (zh) * | 2023-10-10 | 2023-11-10 | 中国人民解放军总医院 | 一种化疗预备阶段的治疗画像生成方法和系统 |
CN117038010B (zh) * | 2023-10-10 | 2024-02-13 | 中国人民解放军总医院 | 一种化疗预备阶段的治疗画像生成方法和系统 |
CN117558451A (zh) * | 2024-01-11 | 2024-02-13 | 广州中大医疗器械有限公司 | 一种基于大数据的神经损失程度评估方法 |
CN118039062A (zh) * | 2024-04-12 | 2024-05-14 | 四川省肿瘤医院 | 一种基于大数据分析的个体化化疗剂量远程控制方法 |
CN118448006A (zh) * | 2024-07-08 | 2024-08-06 | 南昌大学第一附属医院 | 一种用于骨科的患者康复方案推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111524571B (zh) | 2022-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111524571B (zh) | 一种脑卒中患者个性化治疗方案推荐系统 | |
Alam et al. | A model for early prediction of diabetes | |
de La Torre et al. | Weighted kappa loss function for multi-class classification of ordinal data in deep learning | |
Yu et al. | Automatic ICD code assignment of Chinese clinical notes based on multilayer attention BiRNN | |
Terrada et al. | Supervised machine learning based medical diagnosis support system for prediction of patients with heart disease | |
CN110993081A (zh) | 一种医生在线推荐方法及系统 | |
CN111492437A (zh) | 支持医学决策的方法和系统 | |
CN111192680A (zh) | 一种基于深度学习和集成分类的智能辅助诊断方法 | |
CN109670179A (zh) | 基于迭代膨胀卷积神经网络的病历文本命名实体识别方法 | |
Liu et al. | Automatic bone age assessment based on intelligent algorithms and comparison with TW3 method | |
CN116364299B (zh) | 一种基于异构信息网络的疾病诊疗路径聚类方法及系统 | |
CN109360658B (zh) | 一种基于词向量模型的疾病模式挖掘方法及装置 | |
Chen et al. | Disease concept-embedding based on the self-supervised method for medical information extraction from electronic health records and disease retrieval: Algorithm development and validation study | |
CN112489769A (zh) | 基于深度神经网络的慢性病智慧中医诊断与药物推荐系统 | |
CN111477295B (zh) | 一种基于隐语义模型的中医组方推荐方法及系统 | |
Bardak et al. | Improving clinical outcome predictions using convolution over medical entities with multimodal learning | |
CN109920535A (zh) | 一种移动中医辨证分析方法及装置 | |
Choubey et al. | Rule based diagnosis system for diabetes | |
CN114420279A (zh) | 一种医疗资源推荐方法、装置、设备及存储介质 | |
Swarupa et al. | Disease prediction: smart disease prediction system using random forest algorithm | |
Ullah et al. | A fully connected quantum convolutional neural network for classifying ischemic cardiopathy | |
CN105718726A (zh) | 基于粗糙集的医疗辅助检查系统知识获取和推理方法 | |
CN113643781B (zh) | 基于时序预警信号的健康干预方案个性化推荐方法及系统 | |
CN116862891A (zh) | 编码器-解码器结构的双分支oct血管超精细语义分割方法 | |
CN114743647A (zh) | 医疗数据处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220610 |