CN114255865A - 一种基于循环神经网络的诊疗项目预测方法 - Google Patents

一种基于循环神经网络的诊疗项目预测方法 Download PDF

Info

Publication number
CN114255865A
CN114255865A CN202011007493.3A CN202011007493A CN114255865A CN 114255865 A CN114255865 A CN 114255865A CN 202011007493 A CN202011007493 A CN 202011007493A CN 114255865 A CN114255865 A CN 114255865A
Authority
CN
China
Prior art keywords
diagnosis
treatment
sequence
record
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011007493.3A
Other languages
English (en)
Other versions
CN114255865B (zh
Inventor
赵奎
闫玉芳
曹吉龙
马慧敏
魏景峰
张帅康
高天
董莉颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Institute of Computing Technology of CAS
Original Assignee
Shenyang Institute of Computing Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Institute of Computing Technology of CAS filed Critical Shenyang Institute of Computing Technology of CAS
Priority to CN202011007493.3A priority Critical patent/CN114255865B/zh
Publication of CN114255865A publication Critical patent/CN114255865A/zh
Application granted granted Critical
Publication of CN114255865B publication Critical patent/CN114255865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于循环神经网络的诊疗项目预测方法,包括:将清洗后的诊疗记录按照特定的时间间隔转化成诊疗记录序列;将每一个诊疗记录转化成独热码并用向量表示,并将每一条诊疗记录的最后一个时间间隔的诊疗记录作为预测目标,将其作为该条记录的标签,得到已标注的诊疗记录数据;挖掘规范的诊疗模式,并训练循环神经网络预测模型。在基于当前的诊疗序列预测后续的诊疗项目时,首先计算当前诊疗序列与规范诊疗模式的相似度,若规范则输入到预测模型中得到最终的预测结果。本发明弥补传统方法在数据特征处理方面的缺陷,提高了训练速度以及模型的准确率,而且在预测前先判断当前诊疗过程的规范性,达到了规范诊疗的目标,使预测结果更加合理。

Description

一种基于循环神经网络的诊疗项目预测方法
技术领域
本发明属于医学辅助诊疗领域,具体说是一种基于循环神经网络的诊疗项目预测方法。
背景技术
临床路径是指基于循证医学,针对某一疾病构建的标准化、程序化诊疗计划。临床路径的核心可归结为“在正确的时间进行正确的诊疗项目”,其通常将疾病的诊疗过程可以划分为若干个阶段,每个阶段都有所需的诊疗项目。采用这种规范化的诊疗过程,能够有效提升治疗效果、降低医疗费用、规范医疗行为。因此,对每一阶段诊疗项目进行预测是临床路径个性化规划的一项重要任务。
传统的临床路径主要通过医疗专家制定,制定出来的临床路径通常在很长一段时间内不再更新,由于疾病在治疗过程中的动态演变性以及不同医院之间实时方案的差异,导致人工制定的临床路径变异率极高,难以满足不同医院和病人的个性化需求。
随着人工智能技术的发展,医院开始借助机器来辅助医生进行每一阶段诊疗项目的决策。然而,现有的技术存在着以下不足:(1)部分方法基于决策树、逻辑回归、支持向量机等传统机器学习算法,这些算法依赖于数据特征的选取,但是医疗数据存在着数据量大、不完整度高、来源多样以及非结构化的特点,传统的由人工参与的特征提取方式在面对大量的复杂的医疗数据时,效率低且容易遗漏重要的信息,从而降低了预测结果的准确性;(2)部分方法只是基于过去的诊疗项目预测后续的诊疗项目,未考虑过去每一个阶段的诊疗项目是否符合规范的临床路径;(3)部分方法未考虑到病人住院过程的医疗数据具有半时序性的特征,患者住院期间,发生在同一时间间隔的诊疗记录不区分发生的先后顺序,但是不同时间间隔的诊疗记录之间具有时序性。
发明内容
为了提高后续诊疗项目预测的准确性,满足临床路径个性化规划的需求,本发明提供一种基于循环神经网络的诊疗项目预测方法,其能充分的捕获复杂的临床数据的特征,并且在预测后续的诊疗项目之前先判断过去诊疗项目是否符合规范的临床路径,提高了诊疗项目预测结果的准确率,增强了预测结果的合理性。
本发明为实现上述目的所采用的技术方案是:
一种基于循环神经网络的诊疗项目预测方法,包括以下步骤:
获取诊疗记录数据,并对诊疗记录数据进行清洗;
将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,并将该序列分为训练集、验证集和测试集;
使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列;
使用诊疗记录时间序列构建诊疗项目预测模型;
计算待检测诊疗记录时间序列与规范诊疗模式序列的相似度,若相似度大于阈值,则将待检测诊疗记录时间序列输入诊疗项目预测模型,得到最后一个时间间隔内诊疗项目发生的概率,否则,不对该待检测诊疗记录时间序列进行处理。
所述诊疗记录数据包括:诊断结果、医嘱、用药情况、检查项目。
所述对诊疗记录数据进行清洗具体为:
删除与预测任务无关的字段,采用设定的标准值填充或者删除的方式处理诊疗记录数据中的缺失值和噪声。
所述将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,包括以下步骤:
将清洗后的诊疗记录数据按照设定的时间间隔转化成诊疗记录序列;
统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;
用skip-gram算法将诊疗记录集合的编码转化成向量表示,得到向量形式的诊疗记录序列;
将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从向量形式的诊疗记录序列中删除,得到已标注的向量形式的诊疗记录时间序列即去掉最后一个时间间隔的诊疗记录集合向量的数据。
所述使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列,包括以下步骤:
1)将所有向量形式的诊疗记录时间序列初始化为一个簇并加入簇表;
2)在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中;
3)重复步骤2),直到产生设定的K个簇时停止,将K个簇的质心作为规范诊疗模式序列。
用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:
Figure BDA0002696464120000031
式中X是簇Ci中的样本即一条向量形式的诊疗记录序列,ci是簇Ci的质心,P是和样本X同维度的全1列向量,⊙表示矩阵的哈达马乘积,×表示矩阵乘法;
样本X和质心ci之间的距离为:
Figure BDA0002696464120000032
式中cos<X,ci>[j][j]表示余弦相似度结果矩阵cos<X,ci>中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数;
簇总体相似度表达式为:
Figure BDA0002696464120000041
式中k是当前簇的个数,SSE的值越大说明相似度越低。
所述使用诊疗记录时间序列构建诊疗项目预测模型,包括以下步骤:
1)构建基于门控循环单元的两层循环神经网络层;
2)构建以softmax函数作为分类器的循环神经网络预测模型输出层;
3)将诊疗记录时间序列输入到循环神经网络预测模型中;
4)根据预设的超参数进行训练,训练的过程中根据验证集的结果调整神经网络预测模型的超参数,所述的超参数为:优化器学习率、随机断开神经元的概率、权重衰减系数;
5)进行迭代训练预设的次数后,保存神经网络预测模型的超参数;输入测试集的数据,获得测试结果即每一个诊疗记录发生的概率;重复步骤3)至5),直至模型收敛,即得到诊疗项目预测模型。
所述构建基于门控循环单元的两层循环神经网络层具体为:
zt=σ(Wzxt+Uzht-1+bz)
rt=σ(Wrxt+Urht-1+br)
Figure BDA0002696464120000042
Figure BDA0002696464120000043
式中zt,rt分别表示循环神经网络中门控循环单元的更新门和重置门,
Figure BDA0002696464120000044
表示记忆单元,ht表示隐藏层状态,xt表示诊疗记录序列X中第t个时间间隔的诊疗记录向量,W,U分别表示各层的权重矩阵,下角标z、r、h分别表示更新门、重置门、隐藏层,b表示各层的偏倚量,⊙表示矩阵的哈达马乘积,σ()表示sigmoid函数,tanh()表示tanh函数。
所述构建以softmax函数作为分类器的循环神经网络预测模型输出层具体为:
Figure BDA0002696464120000051
式中H为疾病状态表示向量,T表示时间间隔的总数,Ws,bs分别表示权重矩阵和偏倚量,所述疾病状态表示向量为由向量形式的诊疗记录序列经过两层神经网络层后得到。
所述待检测诊疗记录时间序列与规范诊疗模式序列的相似度的计算方法为:
Figure BDA0002696464120000052
式中D表示待检测的诊疗记录序列,S表示规范的诊疗模式序列,P表示与诊疗记录序列同维度的全1列向量,目的是按行计算余弦相似度,⊙表示哈达马乘积,×表示矩阵乘法;
得到的结果矩阵cos<D,S>[i][j]表示诊疗记录序列中的第i个诊疗日向量和规范诊疗模式序列中的第j个诊疗日向量的余弦相似度,其值越接近于1,则二者的相似程度越高,越接近于-1,则二者的相似程度越低。
本发明具有以下有益效果及优点:
1.数据转化:将非结构化的诊疗记录转化成可计算的向量,一方面降低了转化后向量的维度,从而提高了模型的训练速度,另一方面更加充分的捕获临床数据的特征。
2.时间序列数据处理:临床诊疗记录具有半时序性的特征,将发生在同一时间间隔的诊疗记录转化为诊疗记录集合向量,将不同时间间隔的诊疗记录用诊疗记录序列向量表示。
3.挖掘规范的诊疗模式序列:在预测后续的诊疗项目之前,根据规范的诊疗模式序列判断过去每一阶段的诊疗项目是否符合规范的临床路径,增强了预测结果的合理性。
附图说明
图1是一种基于循环神经网络的诊疗项目预测方法的流程示意图;
图2是基于GRU的循环神经网络神经元内部结构示意图;
图3是基于循环神经网络的预测模型结构示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步的详细说明。
如图1所示,建模步骤为:
步骤1:数据采集与预处理。从数据库中获取样本数据,并保存到本地。数据预处理具体过程:医疗数据具有维度高、数据量大、缺失值多等特征。对于该预测任务,删除与预测任务无关的字段,处理诊疗记录中的缺失值和噪声,采用正常值填充或者删除的方式进行处理。
步骤2:数据向量表示。将非结构化的医疗数据转化成可计算的向量,具体步骤包括:
步骤2.1,将步骤1清洗后的数据按照特定的时间间隔转化成诊疗记录序列,诊疗记录序列中包含的是一个患者住院过程中全部的诊疗记录。呈现形式:矩阵的形式纵向呈现,每一行表示一个时间间隔的全部诊疗记录(也就是下文中的诊疗记录集合);诊疗记录序列由若干行诊疗记录集合组成;
步骤2.2,统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;
步骤2.3,用skip-gram算法将步骤2.2获得的诊疗记录集合的编码转化成向量表示,从而得到向量形式的诊疗记录序列;
步骤2.4,将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从原始的序列中删除,得到已标注的向量形式的时间序列,将该数据划分为训练集、验证集和测试集;
诊疗记录集合:一个患者一个时间间隔内的诊疗记录,由一个时间间隔内诊疗项目组成,也就是上述提到的矩阵中的一行。
诊疗记录序列:一个患者全部的诊疗记录,由若干个诊疗记录集合构成。
诊疗记录集合向量:是指用skip-gram算法转化后得到的向量形式的诊疗记录集合,其最后一行作为预测标签。
向量形式的诊疗记录序列:由若干个诊疗记录集合向量组成。
每一条向量形式的诊疗记录序列:是指一个患者的全部诊疗记录,由若干个诊疗记录集合向量组成。
步骤3:规范诊疗模式挖掘。在现有的诊疗记录中挖掘规范的诊疗模式,具体步骤包括:
步骤3.1,将步骤2中获得的所有诊疗记录序列初始化为一个簇加入簇表;
步骤3.2,在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中,用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:
Figure BDA0002696464120000071
式中X是簇Ci中的样本,ci是Ci的质心,P是和样本X同维度的全1列向量,⊙表示矩阵的哈达马乘积,×表示矩阵乘法。
样本X和质心ci之间的距离如下:
Figure BDA0002696464120000072
式中cos<X,ci>[j][j]表示余弦相似度结果矩阵cos<X,ci>中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数。
簇总体相似度表达式如下:
Figure BDA0002696464120000073
式中k是当前簇的个数,SSE的值越大说明相似度越低;
步骤3.3,重复步骤3.2,直到产生K个簇时停止,将K个簇的质心作为规范诊疗模式序列。
如图3所示,为循环神经网络预测模型,包括两层循环神经网络和分类器,接收诊疗记录序列进行训练。
步骤4:预测模型训练。具体步骤包括:
如图2所示基于GRU的循环神经网络神经元内部结构示意图,包括重置门和更新门。
步骤4.1,预构建的循环神经网络预测模型神经网络层训练过程的函数表达式为:
zt=σ(Wzxt+Uzht-1+bz)
rt=σ(Wrxt+Urht-1+br)
Figure BDA0002696464120000081
Figure BDA0002696464120000082
式中zt,rt分别表示循环神经网络中门控循环单元(GRU)的更新门和重置门,
Figure BDA0002696464120000083
表示记忆单元,ht表示隐藏层状态,xt表示诊疗记录序列X中第t个时间间隔的诊疗记录向量,W,U分别表示各层的权重矩阵,b表示各层的偏倚量,⊙表示矩阵的哈达马乘积,σ()表示sigmoid函数,tanh()表示tanh函数。
步骤4.2,预构建的循环神经网络预测模型输出层训练过程的函数表达式为:
Figure BDA0002696464120000084
式中H为疾病状态表示向量,T表示时间间隔的总数,Ws,bs分别表示权重矩阵和偏倚量。
步骤4.3,分批次的将步骤2获得的标注的诊疗记录序列输入到循环神经网络预测模型中;
步骤4.4,根据预设的超参数进行训练,训练的过程中根据验证集的结果的调整模型优化器学习率、随机断开神经元的概率、权重衰减系数;
步骤4.5,进行迭代训练预设的次数后,保存模型的参数;输入测试集的数据,获得测试结果;重复步骤4.3至4.5,直至模型收敛,将测试结果最优的模型作为最终的诊疗项目预测模型。
步骤5:相似度计算。计算待检测序列与步骤3获得的规范的诊疗模式的相似度,计算方式如下:
Figure BDA0002696464120000091
式中D表示待检测的诊疗记录序列,S表示规范的诊疗模式序列,P表示与诊疗记录序列同维度的全1列向量,目的是按行计算余弦相似度,⊙表示哈达马乘积,×表示矩阵乘法。
得到的结果矩阵cos<D,S>[i][j]表示诊疗记录序列中的第i个诊疗日向量和规范诊疗模式序列中的第j个诊疗日向量的余弦相似度,其值越接近于1说明二者的相似程度越高,越接近于-1说明二者的相似程度越低。
步骤6:后续诊疗项目预测。如果待检测的序列符合规范的诊疗模式,即步骤5中计算的相似度大于给定的阈值,将待检测序列输入到步骤4构建的预测模型中,得到患者在最后一个时间间隔诊疗项目发生的概率。
本实施例中的一种基于循环神经网络的诊疗项目预测方法,充分利用自然语言处理技术弥补现有方法在数据特征处理方面的不足,本发明的创新性在于在预测后续的诊疗项目之前,先判断过往每一个阶段的诊疗项目是否规范,增强了预测结果的合理性。在经过端到端的监督训练之后,可完成准确的诊疗项目预测任务。

Claims (10)

1.一种基于循环神经网络的诊疗项目预测方法,其特征在于,包括以下步骤:
获取诊疗记录数据,并对诊疗记录数据进行清洗;
将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,并将该序列分为训练集、验证集和测试集;
使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列;
使用诊疗记录时间序列构建诊疗项目预测模型;
计算待检测诊疗记录时间序列与规范诊疗模式序列的相似度,若相似度大于阈值,则将待检测诊疗记录时间序列输入诊疗项目预测模型,得到最后一个时间间隔内诊疗项目发生的概率,否则,不对该待检测诊疗记录时间序列进行处理。
2.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述诊疗记录数据包括:诊断结果、医嘱、用药情况、检查项目。
3.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述对诊疗记录数据进行清洗具体为:
删除与预测任务无关的字段,采用设定的标准值填充或者删除的方式处理诊疗记录数据中的缺失值和噪声。
4.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述将清洗后的诊疗记录数据转换成向量形式的诊疗记录时间序列,包括以下步骤:
将清洗后的诊疗记录数据按照设定的时间间隔转化成诊疗记录序列;
统计诊疗记录序列中所有诊疗记录的数量,以独热码的形式对每一个诊疗记录进行编码,将每条诊疗记录序列的每个时间间隔内的诊疗记录的编码相加取平均得到诊疗记录集合的编码;
用skip-gram算法将诊疗记录集合的编码转化成向量表示,得到向量形式的诊疗记录序列;
将每一条向量形式的诊疗记录序列中的最后一个时间间隔的诊疗记录集合向量,作为该条数据的预测标签,并将该诊疗记录集合向量从向量形式的诊疗记录序列中删除,得到已标注的向量形式的诊疗记录时间序列即去掉最后一个时间间隔的诊疗记录集合向量的数据。
5.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述使用聚类算法,对诊疗记录时间序列进行处理,得到规范诊疗模式序列,包括以下步骤:
1)将所有向量形式的诊疗记录时间序列初始化为一个簇并加入簇表;
2)在簇表中选取一个总体相似度最低的簇C,利用K-means方法将簇C分为C1和C2加入簇表中;
3)重复步骤2),直到产生设定的K个簇时停止,将K个簇的质心作为规范诊疗模式序列。
6.根据权利要求5所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,用向量之间的余弦相似度来表征簇的整体相似度,余弦相似度的函数表达式为:
Figure FDA0002696464110000021
式中X是簇Ci中的样本即一条向量形式的诊疗记录序列,ci是簇Ci的质心,P是和样本X同维度的全1列向量,⊙表示矩阵的哈达马乘积,×表示矩阵乘法;
样本X和质心ci之间的距离为:
Figure FDA0002696464110000022
式中cos<X,ci>[j][j]表示余弦相似度结果矩阵cos<X,ci>中的第j行第j列,即第j个时间间隔的余弦相似度,n表示时间间隔总数;
簇总体相似度表达式为:
Figure FDA0002696464110000031
式中k是当前簇的个数,SSE的值越大说明相似度越低。
7.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述使用诊疗记录时间序列构建诊疗项目预测模型,包括以下步骤:
1)构建基于门控循环单元的两层循环神经网络层;
2)构建以softmax函数作为分类器的循环神经网络预测模型输出层;
3)将诊疗记录时间序列输入到循环神经网络预测模型中;
4)根据预设的超参数进行训练,训练的过程中根据验证集的结果调整神经网络预测模型的超参数,所述的超参数为:优化器学习率、随机断开神经元的概率、权重衰减系数;
5)进行迭代训练预设的次数后,保存神经网络预测模型的超参数;输入测试集的数据,获得测试结果即每一个诊疗记录发生的概率;重复步骤3)至5),直至模型收敛,即得到诊疗项目预测模型。
8.根据权利要求7所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述构建基于门控循环单元的两层循环神经网络层具体为:
zt=σ(Wzxt+Uzht-1+bz)
rt=σ(Wrxt+Urht-1+br)
Figure FDA0002696464110000032
Figure FDA0002696464110000033
式中zt,rt分别表示循环神经网络中门控循环单元的更新门和重置门,
Figure FDA0002696464110000034
表示记忆单元,ht表示隐藏层状态,xt表示诊疗记录序列X中第t个时间间隔的诊疗记录向量,W,U分别表示各层的权重矩阵,下角标z、r、h分别表示更新门、重置门、隐藏层,b表示各层的偏倚量,⊙表示矩阵的哈达马乘积,σ()表示sigmoid函数,tanh()表示tanh函数。
9.根据权利要求7所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述构建以softmax函数作为分类器的循环神经网络预测模型输出层具体为:
Figure FDA0002696464110000041
式中H为疾病状态表示向量,T表示时间间隔的总数,Ws,bs分别表示权重矩阵和偏倚量,所述疾病状态表示向量为由向量形式的诊疗记录序列经过两层神经网络层后得到。
10.根据权利要求1所述的一种基于循环神经网络的诊疗项目预测方法,其特征在于,所述待检测诊疗记录时间序列与规范诊疗模式序列的相似度的计算方法为:
Figure FDA0002696464110000042
式中D表示待检测的诊疗记录序列,S表示规范的诊疗模式序列,P表示与诊疗记录序列同维度的全1列向量,目的是按行计算余弦相似度,⊙表示哈达马乘积,×表示矩阵乘法;
得到的结果矩阵cos<D,S<[i][j]表示诊疗记录序列中的第i个诊疗日向量和规范诊疗模式序列中的第j个诊疗日向量的余弦相似度,其值越接近于1,则二者的相似程度越高,越接近于-1,则二者的相似程度越低。
CN202011007493.3A 2020-09-23 2020-09-23 一种基于循环神经网络的诊疗项目预测方法 Active CN114255865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011007493.3A CN114255865B (zh) 2020-09-23 2020-09-23 一种基于循环神经网络的诊疗项目预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011007493.3A CN114255865B (zh) 2020-09-23 2020-09-23 一种基于循环神经网络的诊疗项目预测方法

Publications (2)

Publication Number Publication Date
CN114255865A true CN114255865A (zh) 2022-03-29
CN114255865B CN114255865B (zh) 2024-09-13

Family

ID=80788565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011007493.3A Active CN114255865B (zh) 2020-09-23 2020-09-23 一种基于循环神经网络的诊疗项目预测方法

Country Status (1)

Country Link
CN (1) CN114255865B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114582511A (zh) * 2022-05-07 2022-06-03 中国人民解放军总医院第八医学中心 一种支气管扩张症急性加重期预警方法、装置、设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778014A (zh) * 2016-12-29 2017-05-31 浙江大学 一种基于循环神经网络的患病风险预测方法
RU2017137802A (ru) * 2017-12-29 2019-07-01 Общество С Ограниченной Ответственностью "Интеллоджик" Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106778014A (zh) * 2016-12-29 2017-05-31 浙江大学 一种基于循环神经网络的患病风险预测方法
RU2017137802A (ru) * 2017-12-29 2019-07-01 Общество С Ограниченной Ответственностью "Интеллоджик" Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐雯;高峻逸;马辛宇;张超贺;马连韬;王亚沙;: "循环神经网络模型在腹膜透析临床预后预测中的初步应用", 北京大学学报(医学版), no. 03, 22 May 2019 (2019-05-22) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114582511A (zh) * 2022-05-07 2022-06-03 中国人民解放军总医院第八医学中心 一种支气管扩张症急性加重期预警方法、装置、设备及介质

Also Published As

Publication number Publication date
CN114255865B (zh) 2024-09-13

Similar Documents

Publication Publication Date Title
CN111160139B (zh) 心电信号的处理方法、装置及终端设备
CN111367961B (zh) 基于图卷积神经网络的时序数据事件预测方法、系统及其应用
CN109659033B (zh) 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN106778014B (zh) 一种基于循环神经网络的患病风险预测建模方法
Hartono et al. Implementation of Artifical Neural Networks with Multilayer Perceptron for Analysis of Acceptance of Permanent Lecturers
CN113486578B (zh) 一种工业过程中设备剩余寿命的预测方法
CN110522444B (zh) 一种基于Kernel-CNN的心电信号识别分类方法
CN110957015A (zh) 电子医疗记录数据的缺失值填充方法
CN110188653A (zh) 基于局部特征聚合编码和长短期记忆网络的行为识别方法
WO2022166158A1 (zh) 一种基于卷积生存网络的血透并发症长期风险预测系统
CN115644823A (zh) 康复效果动态预测及个体化干预方法和系统
CN116936108B (zh) 一种面向不平衡数据的疾病预测系统
CN117034142B (zh) 一种不平衡医疗数据缺失值填充方法及系统
CN111803059A (zh) 一种基于时域卷积网络的心电信号分类方法及装置
Qian Exploration of machine algorithms based on deep learning model and feature extraction
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
Da et al. Brain CT image classification with deep neural networks
CN114220164B (zh) 一种基于变分模态分解和支持向量机的手势识别方法
CN116110597A (zh) 一种基于数字孪生的患者病症类别智能分析方法及装置
CN109545372B (zh) 一种基于距离贪心策略的病人生理数据特征选择方法
CN113539412B (zh) 基于深度学习的中草药推荐系统
CN114942951A (zh) 一种基于ais数据的渔船捕鱼行为分析方法
CN113140320B (zh) 一种用于先心病手术患儿术后远期营养不良的预测模型的构建方法
CN114255865B (zh) 一种基于循环神经网络的诊疗项目预测方法
Belattar et al. Comparing machine learning and deep learning classifiers for enhancing agricultural productivity: case study in Larache Province, Northern Morocco.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant