CN109378064A - 医疗数据处理方法、装置电子设备及计算机可读介质 - Google Patents

医疗数据处理方法、装置电子设备及计算机可读介质 Download PDF

Info

Publication number
CN109378064A
CN109378064A CN201811269760.7A CN201811269760A CN109378064A CN 109378064 A CN109378064 A CN 109378064A CN 201811269760 A CN201811269760 A CN 201811269760A CN 109378064 A CN109378064 A CN 109378064A
Authority
CN
China
Prior art keywords
data
neural network
network model
diagnosis
treatment scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811269760.7A
Other languages
English (en)
Other versions
CN109378064B (zh
Inventor
李林峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Medical Jiyun Medical Data Research Institute Co Ltd
Original Assignee
Nanjing Medical Jiyun Medical Data Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Medical Jiyun Medical Data Research Institute Co Ltd filed Critical Nanjing Medical Jiyun Medical Data Research Institute Co Ltd
Priority to CN201811269760.7A priority Critical patent/CN109378064B/zh
Publication of CN109378064A publication Critical patent/CN109378064A/zh
Application granted granted Critical
Publication of CN109378064B publication Critical patent/CN109378064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

本公开涉及一种医疗数据处理方法、装置、电子设备及计算机可读介质。该方法包括:抽取电子病历中的结构化特征;抽取电子病例中的非结构化特征;利用组合神经网络模型预测诊疗方案,其中包括:通过所述组合神经网络模型的第一DNN模型接收所述结构化特征,产生第一数据;通过所述组合神经网络模型中的时序神经网络模型接收所述非结构化特征,产生第二数据;通过所述组合神经网络的第二DNN模型,接收所述第一数据和所述第二数据,产生第三数据;由所述组合神经网络的输出层接收所述第三数据,输出预测的诊疗方案。根据本申请的方案能够提高预测准确性。

Description

医疗数据处理方法、装置电子设备及计算机可读介质
技术领域
本公开涉及计算机信息处理领域,具体而言,涉及一种医疗数据处理方法、装置、电子设备及计算机可读介质。
背景技术
随着近些年医疗信息化的大力发展,医疗大数据得到了爆发式增长。基于医疗数据和机器学习技术学习医生的诊疗行为,给出诊断和治疗建议,辅助低年资医生进行临床决策一直是医疗人工智能的热点方向。
现有技术一般是基于传统的机器学习方法如贝叶斯、逻辑回归、决策树和svm进行疾病诊断预测。近些年随着神经网络的兴起,也有一些工作是基于深度神经网络进行建模。但现有技术中对诊疗方案的推荐均基于临床指南,而非基于机器学习算法。基于临床指南等知识库的推荐方案可能和当前院内实际情况不符,例如设备参数差别、当前医院缺少推荐药品等;且由于临床指南语言较为笼统,在将临床指南中的特征转换为机器语言时具有一定难度。此外,无论是传统模型还是深度神经网络模型,均要求对电子病历进行结构化特征的提取,这一特性将严重限制模型的预测效果。
因此,需要一种新的医疗数据处理的方法、装置、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请提供一种医疗数据处理的方法,能够提高预测准确性。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一方面,提供一种医疗数据处理的方法,包括:
抽取电子病历中的结构化特征;
抽取电子病例中的非结构化特征;
利用组合神经网络模型预测诊疗方案,其中包括:
通过所述组合神经网络模型的第一DNN模型接收所述结构化特征,产生第一数据;
通过所述组合神经网络模型中的时序神经网络模型接收所述非结构化特征,产生第二数据;
由所述组合神经网络的第二DNN模型接收所述第一数据和所述第二数据,产生第三数据;
由所述组合神经网络的输出层接收所述第三数据,输出预测的诊疗方案。
根据一些实施例,所述结构化特征包括下述特征中的至少一种:患者基本信息;检验结果信息。
根据一些实施例,所述非结构化特征包括下述特征中的至少一种:主诉信息、现病史;家族史;检查报告。
根据一些实施例,前述方法还包括:利用病例样本中的诊疗方案作为样本标注;利用标注的所述病例样本训练所述组合神经网络模型。
根据一些实施例,所述诊疗方案包括诊断名称、检查信息、检验信息、用药信息中的至少一种。
根据一些实施例,所述利用标注的所述病例样本训练所述组合神经网络模型包括:训练多目标模型,使得训练得到的所述组合神经网络模型在训练数据上达到诊疗方案全局最优。
根据一些实施例,所述利用组合神经网络模型预测诊疗方案包括:选取所述组合神经网络模型给出的诊疗方案的前n项结果作为推荐方案。
根据一些实施例,所述时序神经网络模型包括:
one-hot编码层,基于输入的所述非结构化特征产生每个词的one-hot编码输出;
词向量层,基于来自所述one-hot编码层的输入,产生词向量;
时序神经网络层,基于来自所述词向量层的输入,产生所述第二数据。
根据本发明的另一方面,提供一种医疗数据处理的装置,包括:
第一抽取模块,用于抽取电子病历中的结构化特征;
第二抽取模块,用于抽取电子病例中的非结构化特征;
预测模块,用于将所述结构化特征和所述非结构化特征作为输入,利用组合神经网络模型预测诊疗方案,
其中所述组合神经网络模型包括:
第一DNN模型,用于接收所述结构化特征,产生第一数据;
时序神经网络模型,用于接收所述非结构化特征,产生第二数据;
第二DNN模型,用于接收所述第一数据和所述第二数据,产生第三数据;
输出层,用于基于来自所述第二DNN模型的所述第三数据输出预测的诊疗方案。
根据本发明的再一实施例,提供一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现前述任一所述的方法。
根据本发明的再一实施例,提供一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现前述任一所述的方法。
根据本发明的一些实施例,模型同时支持了病历中等结构化和非结构化信息,避免了结构化过程中的信息丢失,可提高预测准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
通过参照附图详细描述其示例实施例,本公开的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本公开的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出根据示例性实施例的可应用根据本发明实施例的方法或装置的系统的框图;
图2示出根据本发明示例性实施例的医疗数据处理的方法的流程图;
图3示出根据本发明实施例的用于预测诊疗方案的组合神经网络模型;
图4示意性示出了根据本发明示例实施例的用于医疗数据处理的装置的框图;
图5示出根据示例性实施例用于医疗数据处理的电子设备的框图。
具体实施方式
现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本公开将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本公开所必须的,因此不能用于限制本公开的保护范围。
在现有技术中,对医嘱行为(检查、检验、用药等)的推荐,现有技术基本都是基于临床指南,而非基于机器学习方法。
对于诊断推荐而言,不管是传统模型还是深度神经网络模型都要求对于电子病历进行结构化特征的提取,模型的效果严重受限于结构化的效果。
对于医嘱推荐而言,基于临床指南等知识库的推荐方法推荐的项目可能和院内的项目不匹配(比如检验套餐不同,指南推荐的药品医院没有等),且指南中对于符合条件描述都比较笼统用机器语言很难直接表达。
本发明提出一种技术构思和方案,基于时序神经网络(例如,RNN或RNN改进的LSTM、GRU、双向RNN等)和DNN建立模型,支持原始病历文本的输入,避免结构化过程造成的信息损失。基于该模型,对诊断、检查、检验、用药等诊疗方案进行预测,以辅助医生进行临床决策。
下面参照附图对本发明实施例进行详细说明。
图1示出根据示例性实施例的可应用根据本发明实施例的方法或装置的系统的框图。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如预测应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所提交的信息提供预测处理的后台管理服务器。后台管理服务器可以利用预测模型对接收到的信息和系统已存储的数据进行计算等处理,并将处理结果反馈给终端设备。服务器105还可根据实际需要进行其他相关操作和处理。服务器105可以是一个实体的服务器,还可例如为由多个服务器组成。
图2示出根据本发明示例性实施例的医疗数据处理的方法的流程图。
如图2所示,在S202,抽取电子病历中的结构化特征。
根据示例实施例,所述结构化特征包括下述特征中的至少一种:患者基本信息;检验结果信息。
例如,抽取病历中的患者年龄、性别、检验结果等特征作为结构化特征输入模型中的结构化特征部分:
年龄:55
性别:男
白细胞计数(WBC#)-静脉血:偏高(H)
CA72-4:偏高(H)。
在S204,抽取电子病例中的非结构化特征。
根据示例实施例,所述非结构化特征包括下述特征中的至少一种:主诉信息、现病史;家族史;检查报告。
例如,根据示例实施例,从病历值抽取到如下信息:
主诉:间断上腹痛半年。
现病史:患者半年前无明显诱因出现间断上腹痛,与进食无关,无恶心、呕吐,无腹胀、腹泻,无血便、黑便,就诊于当地医院,予中医治疗,未见明显缓解。患者1月前就诊于内蒙古鄂尔多斯市中心医院,行胃镜提示“胃角粘膜有1.0*0.8cm的糜烂灶显露”,病理提示高分化腺癌,为进一步诊治收入我院。患者自发病以来,饮食好,睡眠好,食欲好,二便好,体重下降5公斤。
在S206,利用组合神经网络模型预测诊疗方案。
如后面参照图3所描述的,步骤S206包括:
通过组合神经网络模型的第一DNN模型接收所述结构化特征,产生第一数据;
通过所述组合神经网络模型中的时序神经网络模型接收所述非结构化特征,产生第二数据;
通过所述组合神经网络的第二DNN模型接收所述第一数据和所述第二数据,产生第三数据;
由所述组合神经网络的输出层接收所述第三数据,输出预测的诊疗方案。
根据示例实施例,模型同时支持了病历中等结构化和非结构化信息,避免了结构化过程中的信息丢失,提供了预测准确度。
根据示例实施例,利用病例样本中的诊疗方案作为样本标注,然后利用标注的所述病例样本训练所述组合神经网络模型。
例如,使用病历中的诊断名称、医生开始的检查、检验、用药等数据作为样本标注。如果该次病历未开立检查或者检验,则使用空医嘱作为标注。例如,根据示例实施例的一个标注如下:
诊断:胃溃疡
检查医嘱:胃镜。
根据示例实施例,训练所述组合神经网络模型包括训练多目标模型,使得训练得到的所述组合神经网络模型在训练数据上达到诊疗方案(诊断、检查、检验、用药等)全局最优,但本发明不限于此。
把上述处理的样本输入模型进行训练,待到模型预测误差收敛则停止训练。
根据示例实施例,所述利用组合神经网络模型预测诊疗方案可选取所述组合神经网络模型给出的诊疗方案的前n项结果作为推荐方案。
例如,预测时,输入相关特征,取模型给出的诊断、检查、检验等的前n项结果作为推荐结果。
图3示出根据本发明实施例的用于预测诊疗方案的组合神经网络模型。
深度学习是一种特殊的机器学习,通过学习将世界使用嵌套的概念层次来表示并实现巨大的功能和灵活性。深度学习本质上就是深度神经网络(DNN)。多隐层的深度神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画。深度神经网络强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征。目前已经提出多种深度神经网络模型,并且人们还在继续探索和提出其他深度神经网络模型。
但是,全连接的DNN还存在着一个问题——无法对时间序列上的变化进行建模。为了适应这种需求,出现了循环神经网络。
时序神经网络模型可以是RNN或其改进模型。RNN网络由多个串联的隐藏网络层构成,特别适用于通过组合处理基于时域的数据集。RNN网络的隐藏层神经元的计算公式为:
s(t)=f(x(t)U+s(t-1)W)(1)
其中U、W为RNN网络模型的参数,f表示激活函数。对于时间t的隐藏层神经元激活值st,使用时间t的该隐藏层神经元的输入xt和上一隐藏层神经元(对应于上一时间t-1)的激活值st-1进行计算获得。
隐藏层状态可以认为是网络的记忆单元,包含了前面所有步的隐藏层状态。而输出层的输出只与当前步的s(t)有关。在实践中,为了降低网络的复杂度,往往s(t)只包含前面若干步而不是所有步的隐藏层状态。在传统神经网络中,每一个网络层的参数是不共享的。而在RNNs中,每输入一步,每一层各自都共享参数,这反映RNNs中的每一步都在做相同的工作,只是输入不同,因此大大地降低了网络中需要学习的参数。
在传统RNN中,训练算法为BPTT(Back-propagation Through Time,通过时间反向传播)。但是,当时间段比较长时,BPTT导致RNN网络需要回传的残差会呈指数级下降,导致网络权重更新缓慢,无法体现出RNN的长期记忆的效果,因此需要一个存储单元来存储记忆。
因此,又提出一种RNN的改进模型:长短期记忆模型(Long-short Term Memory,简称LSTM)。这种特殊的RNN网络模型以解决RNN模型梯度弥散的问题。LSTM具有“三重门”:输入门i,输出门o,遗忘门f,使用Sigmoid函数将取值范围限制到(0,1)之内。使用三个门可以控制不同时刻信息流动方向,通过控制遗忘门和输入门,选择合适的信息进入中央的细胞,将无关信息拒之门外;通过控制输出门,选择最合适的时刻输出细胞处理后的信息。
除了LSTM之外,根据本发明一些实施例,还可以选择GRU、双向RNN或SRU作为用于诊疗方案预测的时序神经网络模型。
如图3所示,根据本发明实施例的组合神经网络模型包括:
第一DNN模型,接收所述结构化特征,产生第一数据;
时序神经网络模型,接收所述非结构化特征,产生第二数据;
第二DNN模型,接收所述第一数据和所述第二数据,产生第三数据;
输出层,基于来自所述第二DNN模型的所述第三数据输出预测的诊疗方案。
在输出层可使用softmax激活函数(或其他诸如SVM的分类器)。softmax函数输入一个任意大于0值的矢量,并把它们转换为零一之间的数值矢量,其和为一。输出层输出最终的预测结果。
如图3所示,根据示例实施例,所述时序神经网络模型包括:
one-hot编码层,基于输入的所述非结构化特征产生每个词的one-hot编码输出;
词向量层,基于来自所述one-hot编码层的输入,产生词向量;
时序神经网络层,基于来自所述词向量层的输入,产生所述第二数据。
使用计算机对自然语言进行处理,便需要将自然语言处理成为机器能够识别的符号,而且在机器学习过程中,需要将其进行数值化。第一种方法可以通过one-hot矩阵表示一个单词,one-hot矩阵是指每一行有且只有一个元素为1,其他元素都是0的矩阵。
词向量(Word Representation,Word embeding)是另一种可行又有效的方法。词向量,是指一组数值向量,例如使用一个指定长度的实数向量v来表示一个词。词向量在高维空间中的相对距离可以衡量词之间的相似程度。如图3所示,Embedding层是以one hot为输入、中间层节点为字向量维数的全连接层。
根据本公开的医疗数据处理的方法,考虑了结构化特征和非结构化特征,有更好的预测准确率。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本公开示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图4示意性示出了根据本发明示例实施例的用于医疗数据处理的装置的框图。
如图4所示,根据本发明示例实施例的用于医疗数据处理的装置400包括第一抽取模块410、第二抽取模块420、预测模块430。
第一抽取模块410用于抽取电子病历中的结构化特征。
第二抽取模块420用于抽取电子病例中的非结构化特征。
预测模块430用于将所述结构化特征和所述非结构化特征作为输入,利用组合神经网络模型预测诊疗方案,
其中所述组合神经网络模型包括:
第一DNN模型,用于接收所述结构化特征,产生第一数据;
时序神经网络模型,用于接收所述非结构化特征,产生第二数据;
第二DNN模型,用于接收所述第一数据和所述第二数据,产生第三数据;
输出层,用于基于来自所述第二DNN模型的所述第三数据输出预测的诊疗方案。
图4所示装置与前述方法对应,此处不再赘述。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
图5示出根据示例性实施例用于医疗数据处理的电子设备的框图。
下面参照图5来描述根据本公开的这种实施方式的电子设备500。图5显示的电子设备500仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从储存部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括触摸屏、键盘等的输入部分506;包括诸如液晶显示器(LCD)等以及扬声器等的输出部分507;包括闪存等的储存部分508;以及包括诸如无线网卡、高速网卡等的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如半导体存储器、磁盘等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入储存部分508。
通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施例的方法。
以上描述了根据本发明实施例的用于医疗数据处理的方法和装置及电子设备和介质。通过以上的详细描述,本领域的技术人员易于理解,根据本发明实施例的方法和装置具有以下优点中的一个或多个。
根据一些实施例,模型同时支持了病历中等结构化和非结构化信息,避免了结构化过程中的信息丢失,可提高预测准确性。
根据示例实施例,此模型可以同时对诊断、检查、检验、用药等医嘱做出预测,或者对其中的单项进行预测。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (11)

1.一种医疗数据处理的方法,其特征在于,包括:
抽取电子病历中的结构化特征;
抽取电子病例中的非结构化特征;
利用组合神经网络模型预测诊疗方案,其中包括:
通过所述组合神经网络模型的第一DNN模型接收所述结构化特征,产生第一数据;
通过所述组合神经网络模型中的时序神经网络模型接收所述非结构化特征,产生第二数据;
通过所述组合神经网络的第二DNN模型接收所述第一数据和所述第二数据,产生第三数据;
由所述组合神经网络的输出层接收所述第三数据,输出预测的诊疗方案。
2.如权利要求1所述的方法,其特征在于,所述结构化特征包括下述特征中的至少一种:患者基本信息;检验结果信息。
3.如权利要求1所述的方法,其特征在于,所述非结构化特征包括下述特征中的至少一种:主诉信息、现病史;家族史;检查报告。
4.如权利要求1所述的方法,其特征在于,还包括:
利用病例样本中的诊疗方案作为样本标注;
利用标注的所述病例样本训练所述组合神经网络模型。
5.如权利要求4所述的方法,其特征在于,所述诊疗方案包括诊断名称、检查信息、检验信息、用药信息中的至少一种。
6.如权利要求5所述的方法,其特征在于,所述利用标注的所述病例样本训练所述组合神经网络模型包括:
训练多目标模型,使得训练得到的所述组合神经网络模型在训练数据上达到诊疗方案全局最优。
7.如权利要求4所述的方法,其特征在于,所述利用组合神经网络模型预测诊疗方案包括:
选取所述组合神经网络模型给出的诊疗方案的前n项结果作为推荐方案。
8.如权利要求1所述的方法,其特征在于,所述时序神经网络模型包括:
one-hot编码层,基于输入的所述非结构化特征产生每个词的one-hot编码输出;
词向量层,基于来自所述one-hot编码层的输入,产生词向量;
时序神经网络层,基于来自所述词向量层的输入,产生所述第二数据。
9.一种医疗数据处理装置,其特征在于,包括:
第一抽取模块,用于抽取电子病历中的结构化特征;
第二抽取模块,用于抽取电子病例中的非结构化特征;
预测模块,用于将所述结构化特征和所述非结构化特征作为输入,利用组合神经网络模型预测诊疗方案,
其中所述组合神经网络模型包括:
第一DNN模型,用于接收所述结构化特征,产生第一数据;
时序神经网络模型,用于接收所述非结构化特征,产生第二数据;
第二DNN模型,用于接收所述第一数据和所述第二数据,产生第三数据;
输出层,用于基于来自所述第二DNN模型的所述第三数据输出预测的诊疗方案。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN201811269760.7A 2018-10-29 2018-10-29 医疗数据处理方法、装置电子设备及计算机可读介质 Active CN109378064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811269760.7A CN109378064B (zh) 2018-10-29 2018-10-29 医疗数据处理方法、装置电子设备及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811269760.7A CN109378064B (zh) 2018-10-29 2018-10-29 医疗数据处理方法、装置电子设备及计算机可读介质

Publications (2)

Publication Number Publication Date
CN109378064A true CN109378064A (zh) 2019-02-22
CN109378064B CN109378064B (zh) 2021-02-02

Family

ID=65390300

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811269760.7A Active CN109378064B (zh) 2018-10-29 2018-10-29 医疗数据处理方法、装置电子设备及计算机可读介质

Country Status (1)

Country Link
CN (1) CN109378064B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109978022A (zh) * 2019-03-08 2019-07-05 腾讯科技(深圳)有限公司 一种医疗文本信息处理方法及装置、存储介质
CN110136007A (zh) * 2019-04-09 2019-08-16 中康龙马(北京)医疗健康科技有限公司 一种自适应调整医疗保险覆盖策略的方法
CN110297908A (zh) * 2019-07-01 2019-10-01 中国医学科学院医学信息研究所 诊疗方案预测方法及装置
CN110473629A (zh) * 2019-08-22 2019-11-19 南京航空航天大学 一种肾透析治疗方案推荐方法及系统
CN111144658A (zh) * 2019-12-30 2020-05-12 医渡云(北京)技术有限公司 医疗风险预测方法、装置、系统、存储介质与电子设备
CN111243697A (zh) * 2020-01-08 2020-06-05 来康科技有限责任公司 一种基于神经网络对目标对象数据进行判断的方法及系统
CN111402973A (zh) * 2020-03-02 2020-07-10 平安科技(深圳)有限公司 信息匹配分析方法、装置、计算机系统及可读存储介质
CN111863236A (zh) * 2019-04-24 2020-10-30 通用电气精准医疗有限责任公司 医疗机器合成数据和对应事件生成
CN112071431A (zh) * 2020-09-18 2020-12-11 山东众阳健康科技集团有限公司 基于深度学习和知识图谱的临床路径自动生成方法及系统
CN112270220A (zh) * 2020-10-14 2021-01-26 西安工程大学 一种基于深度学习的缝纫手势识别方法
CN112652386A (zh) * 2020-12-25 2021-04-13 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN113345286A (zh) * 2021-08-03 2021-09-03 南京大经中医药信息技术有限公司 一种融合了ai技术和视频技术的师承教学系统及方法
CN113436745A (zh) * 2021-06-30 2021-09-24 四川大学华西医院 一种基于数据库分析的人工智能辅助诊断方法
US11984201B2 (en) 2019-11-20 2024-05-14 GE Precision Healthcare LLC Medical machine synthetic data and corresponding event generation

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104915560A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
CN106485054A (zh) * 2016-09-21 2017-03-08 广东工业大学 基于bp神经网络算法的智能诊断用数据分析方法及系统
CN106484674A (zh) * 2016-09-20 2017-03-08 北京工业大学 一种基于深度学习的中文电子病历概念抽取方法
US20180137941A1 (en) * 2015-06-02 2018-05-17 Infervision Co., Ltd. Method For Analysing Medical Treatment Data Based On Deep Learning and Intelligence Analyser Thereof
US20180158552A1 (en) * 2016-12-01 2018-06-07 University Of Southern California Interpretable deep learning framework for mining and predictive modeling of health care data
CN108647732A (zh) * 2018-05-14 2018-10-12 北京邮电大学 一种基于深度神经网络的病理图像分类方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180137941A1 (en) * 2015-06-02 2018-05-17 Infervision Co., Ltd. Method For Analysing Medical Treatment Data Based On Deep Learning and Intelligence Analyser Thereof
CN104915560A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 一种基于广义神经网络聚类的疾病病种诊疗方案预测方法
CN106484674A (zh) * 2016-09-20 2017-03-08 北京工业大学 一种基于深度学习的中文电子病历概念抽取方法
CN106485054A (zh) * 2016-09-21 2017-03-08 广东工业大学 基于bp神经网络算法的智能诊断用数据分析方法及系统
US20180158552A1 (en) * 2016-12-01 2018-06-07 University Of Southern California Interpretable deep learning framework for mining and predictive modeling of health care data
CN108647732A (zh) * 2018-05-14 2018-10-12 北京邮电大学 一种基于深度神经网络的病理图像分类方法及装置

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490251B (zh) * 2019-03-08 2022-07-01 腾讯科技(深圳)有限公司 基于人工智能的预测分类模型获取方法及装置、存储介质
CN109978022B (zh) * 2019-03-08 2022-07-29 腾讯科技(深圳)有限公司 一种医疗文本信息处理方法及装置、存储介质
CN109978022A (zh) * 2019-03-08 2019-07-05 腾讯科技(深圳)有限公司 一种医疗文本信息处理方法及装置、存储介质
CN110490251A (zh) * 2019-03-08 2019-11-22 腾讯科技(深圳)有限公司 基于人工智能的预测分类模型获取方法及装置、存储介质
CN110136007A (zh) * 2019-04-09 2019-08-16 中康龙马(北京)医疗健康科技有限公司 一种自适应调整医疗保险覆盖策略的方法
CN111863236A (zh) * 2019-04-24 2020-10-30 通用电气精准医疗有限责任公司 医疗机器合成数据和对应事件生成
CN110297908A (zh) * 2019-07-01 2019-10-01 中国医学科学院医学信息研究所 诊疗方案预测方法及装置
CN110473629A (zh) * 2019-08-22 2019-11-19 南京航空航天大学 一种肾透析治疗方案推荐方法及系统
US11984201B2 (en) 2019-11-20 2024-05-14 GE Precision Healthcare LLC Medical machine synthetic data and corresponding event generation
CN111144658A (zh) * 2019-12-30 2020-05-12 医渡云(北京)技术有限公司 医疗风险预测方法、装置、系统、存储介质与电子设备
CN111144658B (zh) * 2019-12-30 2023-06-16 医渡云(北京)技术有限公司 医疗风险预测方法、装置、系统、存储介质与电子设备
CN111243697A (zh) * 2020-01-08 2020-06-05 来康科技有限责任公司 一种基于神经网络对目标对象数据进行判断的方法及系统
CN111402973A (zh) * 2020-03-02 2020-07-10 平安科技(深圳)有限公司 信息匹配分析方法、装置、计算机系统及可读存储介质
WO2021174788A1 (zh) * 2020-03-02 2021-09-10 平安科技(深圳)有限公司 信息匹配分析方法、装置、计算机系统及可读存储介质
CN112071431A (zh) * 2020-09-18 2020-12-11 山东众阳健康科技集团有限公司 基于深度学习和知识图谱的临床路径自动生成方法及系统
CN112071431B (zh) * 2020-09-18 2024-02-23 众阳健康科技集团有限公司 基于深度学习和知识图谱的临床路径自动生成方法及系统
CN112270220A (zh) * 2020-10-14 2021-01-26 西安工程大学 一种基于深度学习的缝纫手势识别方法
WO2022134357A1 (zh) * 2020-12-25 2022-06-30 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN112652386A (zh) * 2020-12-25 2021-04-13 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN113436745A (zh) * 2021-06-30 2021-09-24 四川大学华西医院 一种基于数据库分析的人工智能辅助诊断方法
CN113345286B (zh) * 2021-08-03 2021-11-19 南京大经中医药信息技术有限公司 一种融合了ai技术和视频技术的师承教学系统及方法
CN113345286A (zh) * 2021-08-03 2021-09-03 南京大经中医药信息技术有限公司 一种融合了ai技术和视频技术的师承教学系统及方法

Also Published As

Publication number Publication date
CN109378064B (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN109378064A (zh) 医疗数据处理方法、装置电子设备及计算机可读介质
Shang et al. Gamenet: Graph augmented memory networks for recommending medication combination
CN109326353A (zh) 预测疾病终点事件的方法、装置及电子设备
US20200185102A1 (en) System and method for providing health information
Jin et al. A treatment engine by predicting next-period prescriptions
CN109062901B (zh) 神经网络训练方法和装置及命名实体识别方法和装置
CN108604227A (zh) 用于神经临床释义生成的系统和方法
Khedkar et al. Deep learning and explainable AI in healthcare using EHR
Ma et al. A general framework for diagnosis prediction via incorporating medical code descriptions
WO2023029506A1 (zh) 病情分析方法、装置、电子设备及存储介质
Zhou et al. Self-selective attention using correlation between instances for distant supervision relation extraction
US20210375441A1 (en) Using clinical notes for icu management
Davazdahemami et al. A deep learning approach for predicting early bounce-backs to the emergency departments
Du et al. An interpretable outcome prediction model based on electronic health records and hierarchical attention
Yan et al. Hierarchical interpretation of neural text classification
Manashty et al. Life model: A novel representation of life-long temporal sequences in health predictive analytics
US20220398500A1 (en) Partially local federated learning
Hughes et al. Supervised topic models for clinical interpretability
WO2023272563A1 (zh) 智能分诊方法、装置、存储介质及电子设备
Qu et al. Disease risk prediction via heterogeneous graph attention networks
Melek et al. A theoretic framework for intelligent expert systems in medical encounter evaluation
Kulshrestha et al. A deep learning model for online doctor rating prediction
CN112802573A (zh) 药品包推荐方法、装置、计算机系统及可读存储介质
CN112035567A (zh) 一种数据处理方法、装置及计算机可读存储介质
Mu et al. Diagnosis prediction via recurrent neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant