CN112397194A - 用于生成患者病情归因解释模型的方法、装置和电子设备 - Google Patents
用于生成患者病情归因解释模型的方法、装置和电子设备 Download PDFInfo
- Publication number
- CN112397194A CN112397194A CN201910760059.3A CN201910760059A CN112397194A CN 112397194 A CN112397194 A CN 112397194A CN 201910760059 A CN201910760059 A CN 201910760059A CN 112397194 A CN112397194 A CN 112397194A
- Authority
- CN
- China
- Prior art keywords
- information
- sample
- attribution
- patient
- disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 201000010099 disease Diseases 0.000 claims abstract description 80
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 80
- 238000012549 training Methods 0.000 claims abstract description 34
- 208000024891 symptom Diseases 0.000 claims abstract description 29
- 238000003556 assay Methods 0.000 claims abstract description 27
- 230000004044 response Effects 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 48
- 238000004590 computer program Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 13
- 210000004072 lung Anatomy 0.000 description 12
- 230000036760 body temperature Effects 0.000 description 10
- 230000005856 abnormality Effects 0.000 description 9
- 210000004369 blood Anatomy 0.000 description 9
- 239000008280 blood Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 210000003743 erythrocyte Anatomy 0.000 description 9
- 210000000265 leukocyte Anatomy 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 206010037660 Pyrexia Diseases 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 210000000038 chest Anatomy 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 210000001370 mediastinum Anatomy 0.000 description 5
- 230000015654 memory Effects 0.000 description 5
- 230000000306 recurrent effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000009666 routine test Methods 0.000 description 4
- 206010068319 Oropharyngeal pain Diseases 0.000 description 3
- 201000007100 Pharyngitis Diseases 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 206010028470 Mycoplasma infections Diseases 0.000 description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 206010037833 rales Diseases 0.000 description 2
- 206010000087 Abdominal pain upper Diseases 0.000 description 1
- 208000031940 Disease Attributes Diseases 0.000 description 1
- 241000288140 Gruiformes Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000002555 auscultation Methods 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000002612 cardiopulmonary effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000001652 frontal lobe Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 238000002350 laparotomy Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000002601 radiography Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开的实施例公开了一种用于生成患者病情归因解释模型的方法、装置和电子设备。该方法的一具体实施方式包括:获取样本集;从样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,症状信息,体格检查信息,化验信息和影像信息输入初始模型,得到病情归因解释信息;将得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。该实施方式提高了医生判断患者病情的效率。
Description
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于生成患者病情归因解释模型的方法、装置和电子设备。
背景技术
随着科技的发展,智能模型逐渐应用于各个领域。智能模型也称为“基于知识的软件开发模型”,它把瀑布模型和专家系统结合在一起,利用专家系统来帮助软件开发人员的工作。该模型应用基于规则的系统,采用归纳和推理机制,使维护在系统规格说明一级进行。这种模型在实施过程中以软件工程知识为基础的生成规则构成的知识系统与包含应用领域知识规则的专家系统相结合,构成这一应用领域软件的开发系统。智能模型开发的软件系统强调数据的含义,并试图使用现实世界的语言表达数据的含义。该模型可以勘探现有的数据,从中发现新的事实方法指导用户以专家的水平解决复杂的问题。它以瀑布模型为基本框架,在不同开发阶段引入了原型实现方法和面向对象技术以克服瀑布模型的缺点,适应于特定领域软件和专家决策系统的开发。
发明内容
本发明内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了生成患者病情归因解释模型的方法、装置和电子设备。
第一方面,本公开的实施例公开了一种用于生成患者病情归因解释模型的方法,包括:获取样本集,其中,样本集中的样本包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息,样本病人的影像信息和样本病人的病情归因解释信息;从样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息;将得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。
在一些实施例中,该方法还包括:响应于确定初始模型未训练完成,调整初始模型中的相关参数,以及从上述样本集中重新选取样本,使用调整后的初始模型作为初始模型,继续执行上述训练步骤。
在一些实施例中,上述得到病情归因解释信息,包括:将上述病情归因解释信息发送给终端设备,以及在上述终端设备的显示器上进行显示;将上述病情归隐解释信息已文本形式存储到上述终端设备的存储装置中。
第二方面,本公开的实施例提供了一种用于生成患者病情归因解释模型的装置,包括:获取单元,配置用于获取样本集;训练单元,配置用于从上述样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息;将上述得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。
第三方面,本公开的实施例提供了一种用于生成病情归因解释信息的方法,包括:获取患者的病例信息;将患者的病例信息中的基本信息,症状信息,体格检查信息,化验信息和影像信息输入采用如上述第一方面中所描述的方法生成的患者病情归因解释模型中,生成患者的病情归因解释信息;对上述病情归因解释信息进行分词操作,得到至少一个词;对于上述至少一个词中的每个词,对上述词进行词嵌入,得到词向量;对于所得到的词向量中的每个词向量,将上述词向量输入时间递归神经网络模型,得到第一语义向量;获取与预设医学术语集合对应的医学术语语义向量集合;对于得到的至少一个第一语义向量中的每个第一语义向量,确定上述第一语义向量与上述医学术语语义向量集合中的每个医学术语语义向量的余弦距离;将所确定的至少一个余弦距离中的最小余弦距离确定为上述第一语义向量的目标余弦距离;基于各个目标余弦距离对应的各个医学术语,生成结构化数据;将上述结构化数据发送到存储设备上。
第四方面,本公开的实施例提供了一种用于生成病情归因解释信息的装置,包括:获取模块,配置用于获取患者的病例信息;生成模块,配置用于将上述患者的病例信息中的基本信息,症状信息,体格检查信息,化验信息和影像信息输入采用如上述第一方面中所描述的方法生成的患者病情归因解释模型中,生成患者的病情归因解释信息。
第五方面,本公开的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一的方法。
第六方面,本公开实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一的方法。
本公开的一些实施例提供的生成患者病情归因解释模型的方法、装置和电子设备,通过获取样本集,可以从中选取样本以进行初始模型的训练。其中,样本集中的样本包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息,样本病人的影像信息和样本病人的病情归因解释信息。这样,将选取的样本的样本病例信息中样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,便可以得到病情归因解释信息。之后可以将得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,从而确定病情归因解释损失值。接着,将病情归因解释损失值与目标值进行比较。最后,可以根据比较结果来确定初始模型是否训练完成。如果确定初始模型训练完成,就可以将训练完成的初始模型作为患者病情归因解释模型。从而能够得到一种可以用于生成病情归因解释信息的患者病情归因解释模型。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开可以应用于其中的示例性系统架构图;
图2是根据本公开实施例的用于生成患者病情归因解释模型的方法的一个实施例的流程图。
图3是根据本公开实施例的一种用于生成患者病情归因解释模型的装置的一些实施例的流程图。
图4是根据本公开实施例的一种用于生成病情归因解释信息的装置的一些实施例的结构示意图。
图5是适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关公开,而非对该公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关公开相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开实施例的用于生成患者病情归因解释模型的方法的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以发送样本集。终端设备101、102、103上可以安装有各种语音应用。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有显示屏并且支持图像识别的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,服务器105可以从终端设备101、102、103获取样本集。样本集可以包括病人基本信息、病症信息、医生诊断结论信息和处理方法信息。例如对终端设备101、102、103上的生成病情归因解释信息应用提供支持的服务器。服务器可以利用终端设备中存储的样本集合对待训练模型进行训练得到患者病情归因解释模型(例如,二次训练的模型,三次训练的模型)。服务器还可以将终端设备提交的信息输入到患者病情归因解释模型中生成病情归因解释信息。
可选的,服务器可以将上述病情归因解释信息(例如,第二识别结果)反馈给终端设备。
需要说明的是,本公开实施例所提供的用于生成患者病情归因解释模型的方法一般由服务器105执行。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本公开实施例的用于生成患者病情归因解释模型的方法的又一个实施例的流程200。该用于生成患者病情归因解释模型的方法,包括以下步骤:
步骤201,获取样本集。
在一些实施例中,用于生成患者病情归因解释模型的方法的执行主体(例如图1所示的服务器105)可以通过连接用户用于存储样本集的终端设备来获取样本集。在这里,连接可以是有线连接和无线连接。需要指出的是,无线连接方式可以包括但不限于3G/4G连接、WiFi(Wireless Fidelity)无线连接、蓝牙连接、WiMAX(Worldwide Interoperabilityfor Microwave Access),全球微波互联接入连接、UWB(ultra wideband)无载波通信技术连接、以及其他现在已知或将来开发的无线连接方式。
步骤202,从样本集中选取样本。
在一些实施例中,执行主体可以从步骤201中获取的样本集中选取样本,以及执行步骤203至步骤206的训练步骤。其中,样本的选取方式并不限制。例如可以是随机选取至少一个样本,也可以是从中选取样本病例信息完整度较好(即病人已做完所有检查)的样本。
在这里,样本可以包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息,样本病人的影像信息和样本病人的病情归因解释信息。在这里,病情归因解释信息是用来解释病人患病原因的信息。样本病人的基本信息可以包括以下信息中的至少一项:性别信息,年龄信息,身高信息,体重信息。例如,“男性,40岁,身高185cm,体重80kg”。样本病人的症状信息可以是医生询问病人得到的反馈信息。例如,病人来医院看病,医生询问病人:“哪里不舒服?”,病人回答;“发烧已经两天了”。那么“发烧已经两天了”就是病人的症状信息。样本病人的体格检查信息可以是样本病人的物理检查信息。例如,病人的体格检查信息可以是医生给病人测量体温、心跳得到的数据信息。又例如,病人来医院就诊,医生给病人做物理检查得到病人信息:体温38°,心跳79次/分。那么,“体温38°,心跳79次/分”是病人的体格检查信息。样本病人的化验信息可以是样本病人的验血类化验的化验信息。例如,血常规化验:白细胞4.8,红细胞4.70。样本病人的影像信息可以是样本病人的做影像检查的影像信息。例如,脑部摄片:右侧额叶小片状钙化灶。
作为示例,样本病例信息可以是“男性;40岁;胃痛;体温37;血常规化验:白细胞4.3,红细胞4.40;胸部摄片:纵膈未见异常,肺野:双肺上野可见斑点状及素条状阴影”。病情归因解释信息可以是“体温37;血常规化验:白细胞4.3,红细胞4.40;肺野:双肺上野可见斑点状及素条状阴影”。
可以理解的是,样本病人的基本信息可以是预先人为设置的,也可以是执行主体或其他设备执行某设定程序而得到的。
步骤203,将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息。
在一些实施例中,执行主体可以将步骤202中选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型。对输入的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息进行分析,以及提取病症关键词和检查信息关键词。基于提取的病症关键词和检查信息关键词,形成关键词文本,从而得到病情归因解释信息。
在这里,初始模型可以是基于机器学习技术而创建的现有的各种神经网络模型。该神经网络模型可以具有现有的各种神经网络结构。初始模型的存储位置在本公开中同样不限制。例如,神经网络结构可以是长短期记忆网络(Long Short-Term Memory,LSTM)。又例如,神经网络结构可以是循环神经网络(Recurrent Neural Network,RNN)。
在这里,病症关键词可以是样本病人的基本信息,样本病人的症状信息中用于描述病人个人信息和描述病人病情的词汇。检查关键词可以是样本病人的各项检查信息(体格检查信息,化验信息,影像信息)中用于描述病人检查结果的词汇。上述关键词文本是将病症关键词和检查信息关键词汇总在一起,形成关键词文本。作为示例,输入的病人信息包括:病人的基本信息是“性别:女;年龄:35岁;身高:165cm”;病人的症状信息是“发烧并且喉咙痛”;病人的体格检查信息是“体温39°,心肺听诊:肺部有湿罗音”;病人的化验信息是“血常规化验:白细胞4.3,红细胞4.40”;病人的影像信息是“胸部摄片:纵膈未见异常,肺野:未见异常”。那么,病症关键词为“女”,“发烧”,“喉咙痛”。检查信息关键词为“体温39°”,“肺部有湿罗音”,“血常规化验:白细胞4.3,红细胞4.40”,“胸部摄片:纵膈未见异常,肺野:未见异常”。从而得到关键词文本“女,35岁,165cm,发烧,喉咙痛,体温39°,肺部有湿罗音,血常规化验:白细胞4.3,红细胞4.40,胸部摄片:纵膈未见异常,肺野:未见异常”。病情归因解释信息为“肺部有湿罗音,血常规化验:白细胞4.3,红细胞4.40,胸部摄片:纵膈未见异常,肺野:未见异常”。
在一些实施例的可选的一些实现的方式中,将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息,还包括:将上述病情归因解释信息发送给终端设备,以及在上述终端设备的显示器上进行显示;将上述病情归隐解释信息已文本形式存储到上述终端设备的存储装置中。
步骤204,将上述得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将上述病情归因解释损失值与目标值进行比较。
在一些实施例中,执行主体可以将步骤203中得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,从而可以确定病情归因解释损失值。然后将化验推荐损失值与目标值进行比较。在这里,目标值是病情归因解释损失值的期望输出值。可以理解的是,目标值可以是根据实际需求预先人为设置的。例如,将步骤203中得到的病情归因解释信息与样本病情归因解释信息作为参数,输入指定的损失函数(loss function)中,从而确定两者之间损失值。上述标注损失值可以是将上述得到的已标注文本信息与对应的样本已标注文本信息作为参数,输入指定的损失函数中得到的值。在这里,损失函数(例如平方损失函数、指数损失函数等)通常是用来估量模型的预测值(如样本文本中的样本已标注文本)与真实值(如通过步骤203得到的已标注文本)的不一致程度。它是一个非负实值函数。一般情况下,损失函数越小,模型的鲁棒性就越好。损失函数可以根据实际需求来设置。
步骤205,根据比较结果确定初始模型是否训练完成。
在一些实施例中,执行主体可以基于步骤204中将病情归因解释损失值与目标值的比较,得到比较结果。响应于上述比较结果病情归因解释损失值小于目标值,确定初始模型训练完成。
步骤206,确定满足上述结束训练条件,将初始模型确定为患者病情归因解释模型。
在一些实施例中,上述执行主体可以确定是否满足预设的结束训练条件。其中,上述结束训练条件可以是技术人员预先确定的用于结束上述训练步骤的条件。例如,上述结束训练条件可以包括但不限于以下至少一项:训练次数达到或超过预设次数;训练时间达到或超过预设时长;预先确定的损失函数的函数值小于预设阈值等等。
在一些实施例的一些可选的实现方式中,响应于上述比较结果病情归因解释损失值大于目标值,确定初始模型训练未完成。响应于确定初始模型未训练完成,调整初始模型中的相关参数,以及从上述样本集中重新选取样本,使用调整后的初始模型作为初始模型,继续执行包括步骤203至步骤206的训练步骤。
继续参考图3,一些实施例的用于生成患者病情归因解释模型的装置300包括:获取单元301和训练单元302。
在一些实施例中,获取单元301配置用于获取样本集。在这里,获取单元301可以有多种方式来获取样本集。例如,获取单元301可以通过连接(有线连接和无线连接)用户用于存储样本集的终端设备来获取样本集。上述样本集的样本包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验推荐信息,样本病人的影像信息和样本病人的病情归因解释信息。
在一些实施例中,训练单元302配置用于从上述样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息;将上述得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。
在一些实施例的一些可选的实现方式中,对上述病情归因解释信息进行分词操作,得到至少一个词;对于上述至少一个词中的每个词,对上述词进行词嵌入,得到词向量;对于所得到的词向量中的每个词向量,将上述词向量输入时间递归神经网络模型,得到第一语义向量;获取与预设医学术语集合对应的医学术语语义向量集合;对于得到的至少一个第一语义向量中的每个第一语义向量,确定上述第一语义向量与上述医学术语语义向量集合中的每个医学术语语义向量的余弦距离;将所确定的至少一个余弦距离中的最小余弦距离确定为上述第一语义向量的目标余弦距离;基于各个目标余弦距离对应的各个医学术语,生成结构化数据;将上述结构化数据发送到存储设备上。
在这里,分词操作就是将一段文本切分成一个个单独的词。词嵌入(WordEmbedding)或者分布式向量(Distributional Vectors)通常是指自然语言表示的单词转换为计算机能够理解的向量或矩阵形式的技术。时间递归神经网络(aka.循环神经网络,RNN)是一类擅长处理序列数据的神经网络,其单元连接形成一个有向环。余弦距离也可称为余弦相似度,是用向量空间中两个向量夹角的余弦值衡量两个个体间差异的大小,通过余弦定理计算两个向量的夹角,确定两个向量方向是否一致。如果两个向量的方向一致,即夹角越接近零,那么这两个向量就越相近。因此,本实施例中,通过计算第一语义向量与各第二语义向量之间的余弦距离,即可确定出目标文本中各词语所对应的各医学术语。医学术语是指在医疗过程中医生之间的通用标准语言。例如,剖腹胃切开术,胆囊空肠吻合术。获取各医学术语的第二语义向量可以是请医学专业人士预先人工整理出或者借助人工智能技术整理出各种医学标准化术语,先录入数据库中,然后,建立搜索索引,生成医学知识库。医学知识库中存储有医学术语和对应的向量表示。
继续参考图4,一些实施例的用于生成病情归因解释信息的装置400包括:获取模块401和生成模块402。
在一些实施例中,获取模块401配置用于获取患者的病例信息。病例信息包括:基本信息,症状信息,体格检查信息,化验信息和影像信息。在这里,获取模块401可以有多种方式来获取患者的病例信息。例如,获取模块401可以通过用户的输入来获取患者的病例信息。又例如,获取模块401可以通过连接用户用于存储病例信息的终端设备来获取患者的病例信息。
在一些实施例中,生成模块402配置用于将上述患者的病例信息中的基本信息,症状信息,体格检查信息,化验信息和影像信息输入采用如上述第一方面中所描述的方法生成的患者病情归因解释模型中,生成患者的病情归因解释信息。
作为示例,用户输入信息“25岁的女孩感冒发烧,初步判断是支原体感染,体温39.5°,血常规化验:白细胞4.3,红细胞4.40”,生成病情归因解释信息“支原体感染,体温39.5°,血常规化验:白细胞4.3,红细胞4.40”。
继续参考图5,示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图500。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述装置中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取样本集,其中,样本集中的样本信息包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本医生的处理信息和样本病人的病例文本信息;从样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息和样本医生的处理信息输入到初始模型中,得到病例文本信息;将上述得到的病例文本信息与对应的样本病人的病例文本信息进行分析,确定病例文本损失值,以及将病例文本损失值与目标值进行比较;根据比较结果确定上述初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为病例输入模型。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
需要说明的是,本公开实施例的用于生成患者病情归因解释模型的方法可以用于测试上述各实施例所生成的患者病情归因解释模型。进而根据测试结果可以不断地优化患者病情归因解释模型。该方法也可以是上述各实施例所生成的患者病情归因解释模型的实际应用方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。
Claims (9)
1.一种用于生成患者病情归因解释模型的方法,包括:
获取样本集,其中,所述样本集中的样本包括样本病例信息,样本病例信息包括样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息,样本病人的影像信息和样本病人的病情归因解释信息;
从所述样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息;将所述得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将所述病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。
2.根据权利要求1所述的方法,其中,所述方法还包括:
响应于确定初始模型未训练完成,调整初始模型中的相关参数,以及从所述样本集中重新选取样本,使用调整后的初始模型作为初始模型,继续执行所述训练步骤。
3.根据权利要求1所述的方法,其中,将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息,还包括:
将所述病情归因解释信息发送给终端设备,以及在所述终端设备的显示器上进行显示;
将所述病情归隐解释信息已文本形式存储到所述终端设备的存储装置中。
4.一种用于生成患者病情归因解释模型的装置,包括:
获取单元,配置用于获取样本集;
训练单元,配置用于从所述样本集中选取样本,以及执行以下训练步骤:将选取的样本的样本病例信息中的样本病人的基本信息,样本病人的症状信息,样本病人的体格检查信息,样本病人的化验信息和样本病人的影像信息输入初始模型,得到病情归因解释信息;将所述得到的病情归因解释信息与对应的样本病人的病情归因解释信息进行分析,确定病情归因解释损失值,以及将所述病情归因解释损失值与目标值进行比较;根据比较结果确定初始模型是否训练完成;响应于确定初始模型训练完成,将初始模型确定为患者病情归因解释模型。
5.一种用于存储病情归因解释信息的方法,包括:
获取患者的病例信息;
将所述患者的病例信息中的基本信息,症状信息,体格检查信息,化验信息和影像信息输入采用如权利要求1-3之一所述的方法生成的患者病情归因解释模型中,生成所述患者的病情归因解释信息;
对所述病情归因解释信息进行分词操作,得到至少一个词;
对于所述至少一个词中的每个词,对所述词进行词嵌入,得到词向量;
对于所得到的词向量中的每个词向量,将所述词向量输入时间递归神经网络模型,得到第一语义向量;
获取与预设医学术语集合对应的医学术语语义向量集合;
对于得到的至少一个第一语义向量中的每个第一语义向量,确定所述第一语义向量与医学术语语义向量集合中的每个医学术语语义向量的余弦距离;将所确定的至少一个余弦距离中的最小余弦距离确定为所述第一语义向量的目标余弦距离;
基于各个目标余弦距离对应的各个医学术语,生成结构化数据;
将所述结构化数据发送到所述存储设备上。
6.根据权利要求5所述的方法,其中,所述方法还包括:
将所述病情归因解释信息发送给终端设备,以及在所述终端设备的显示器上进行显示;
将所述病情归隐解释信息已文本形式存储到所述终端设备的存储装置中。
7.一种用于存储病情归因解释信息的装置,包括:
获取模块,配置用于获取患者的病例信息;
生成模块,配置用于将所述患者的病例信息中的基本信息,症状信息,体格检查信息,化验信息和影像信息输入采用如权利要求1-3之一所述的方法生成的患者病情归因解释模型中,生成所述患者的病情归因解释信息。
8.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-3,5-6中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-3,5-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760059.3A CN112397194B (zh) | 2019-08-16 | 2019-08-16 | 用于生成患者病情归因解释模型的方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910760059.3A CN112397194B (zh) | 2019-08-16 | 2019-08-16 | 用于生成患者病情归因解释模型的方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112397194A true CN112397194A (zh) | 2021-02-23 |
CN112397194B CN112397194B (zh) | 2024-02-06 |
Family
ID=74602910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910760059.3A Active CN112397194B (zh) | 2019-08-16 | 2019-08-16 | 用于生成患者病情归因解释模型的方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112397194B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421643A (zh) * | 2021-07-09 | 2021-09-21 | 浙江大学 | 一种ai模型可靠性判断方法、装置、设备及存储介质 |
CN114882993A (zh) * | 2022-05-19 | 2022-08-09 | 平安科技(深圳)有限公司 | 问题的解释要素生成方法、装置、介质及电子设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663089A (zh) * | 2012-04-09 | 2012-09-12 | 中国科学院软件研究所 | 一种基于球极映射的非结构化数据可视化方法 |
CN106897568A (zh) * | 2017-02-28 | 2017-06-27 | 北京大数医达科技有限公司 | 病历结构化的处理方法和装置 |
CN109065154A (zh) * | 2018-07-27 | 2018-12-21 | 清华大学 | 一种决策结果确定方法、装置、设备及可读存储介质 |
CN109119134A (zh) * | 2018-08-09 | 2019-01-01 | 脉景(杭州)健康管理有限公司 | 医学病历数据处理方法、医学数据推荐系统、设备及介质 |
CN109376267A (zh) * | 2018-10-30 | 2019-02-22 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN109492128A (zh) * | 2018-10-30 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN109741804A (zh) * | 2019-01-16 | 2019-05-10 | 四川大学华西医院 | 一种信息提取方法、装置、电子设备及存储介质 |
-
2019
- 2019-08-16 CN CN201910760059.3A patent/CN112397194B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102663089A (zh) * | 2012-04-09 | 2012-09-12 | 中国科学院软件研究所 | 一种基于球极映射的非结构化数据可视化方法 |
CN106897568A (zh) * | 2017-02-28 | 2017-06-27 | 北京大数医达科技有限公司 | 病历结构化的处理方法和装置 |
CN109065154A (zh) * | 2018-07-27 | 2018-12-21 | 清华大学 | 一种决策结果确定方法、装置、设备及可读存储介质 |
CN109119134A (zh) * | 2018-08-09 | 2019-01-01 | 脉景(杭州)健康管理有限公司 | 医学病历数据处理方法、医学数据推荐系统、设备及介质 |
CN109376267A (zh) * | 2018-10-30 | 2019-02-22 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN109492128A (zh) * | 2018-10-30 | 2019-03-19 | 北京字节跳动网络技术有限公司 | 用于生成模型的方法和装置 |
CN109741804A (zh) * | 2019-01-16 | 2019-05-10 | 四川大学华西医院 | 一种信息提取方法、装置、电子设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113421643A (zh) * | 2021-07-09 | 2021-09-21 | 浙江大学 | 一种ai模型可靠性判断方法、装置、设备及存储介质 |
CN114882993A (zh) * | 2022-05-19 | 2022-08-09 | 平安科技(深圳)有限公司 | 问题的解释要素生成方法、装置、介质及电子设备 |
CN114882993B (zh) * | 2022-05-19 | 2024-05-31 | 平安科技(深圳)有限公司 | 问题的解释要素生成方法、装置、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN112397194B (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107729929B (zh) | 用于获取信息的方法及装置 | |
Borsting et al. | Applied deep learning in plastic surgery: classifying rhinoplasty with a mobile app | |
CN109243600B (zh) | 用于输出信息的方法和装置 | |
WO2023029817A1 (zh) | 医学报告生成方法、模型的训练方法、装置及设备 | |
WO2020177348A1 (zh) | 用于生成三维模型的方法和装置 | |
US20220076052A1 (en) | Similarity determining method and device, network training method and device, search method and device, and electronic device and storage medium | |
US20220199254A1 (en) | Universal health machine for the automatic assessment of patients | |
Gurupur et al. | Analysing the power of deep learning techniques over the traditional methods using medicare utilisation and provider data | |
CN112397194B (zh) | 用于生成患者病情归因解释模型的方法、装置和电子设备 | |
WO2022179645A2 (zh) | 心电图分析方法、装置、电子设备和存储介质 | |
Seetharam et al. | Applications of machine learning in cardiology | |
CN112309565A (zh) | 用于匹配药品信息和病症信息的方法、装置、电子设备和介质 | |
Yildirim et al. | Real-time internet of medical things framework for early detection of Covid-19 | |
CN111523593A (zh) | 用于分析医学影像的方法和装置 | |
CN112397195B (zh) | 用于生成体格检查模型的方法、装置、电子设备和介质 | |
CN110503181B (zh) | 用于生成多层神经网络的方法和装置 | |
US20180277258A1 (en) | System for remote guidance of health care examinations | |
CN113220895A (zh) | 基于强化学习的信息处理方法、装置、终端设备 | |
CN113360611A (zh) | 基于检查结果的ai诊断方法、装置、存储介质和设备 | |
CN112394924B (zh) | 用于生成提问模型的方法、装置、电子设备和介质 | |
CN115658877A (zh) | 基于强化学习的药物推荐方法、装置、电子设备和介质 | |
CN113990422A (zh) | 一种随访数据的采集方法和装置 | |
CN112397196A (zh) | 生成影像检查推荐模型的方法和装置 | |
Karataş et al. | Mobile application that detects covid-19 from cough and image using smartphone recordings and machine learning | |
CN112446192A (zh) | 用于生成文本标注模型的方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |