CN116844711A - 基于深度学习的疾病辅助识别方法及装置 - Google Patents
基于深度学习的疾病辅助识别方法及装置 Download PDFInfo
- Publication number
- CN116844711A CN116844711A CN202310525512.9A CN202310525512A CN116844711A CN 116844711 A CN116844711 A CN 116844711A CN 202310525512 A CN202310525512 A CN 202310525512A CN 116844711 A CN116844711 A CN 116844711A
- Authority
- CN
- China
- Prior art keywords
- symptom
- entity
- keywords
- diseases
- disease
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 255
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 255
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013135 deep learning Methods 0.000 title claims abstract description 30
- 208000024891 symptom Diseases 0.000 claims abstract description 181
- 239000013598 vector Substances 0.000 claims abstract description 104
- 230000001364 causal effect Effects 0.000 claims abstract description 77
- 230000008451 emotion Effects 0.000 claims abstract description 71
- 238000012216 screening Methods 0.000 claims abstract description 34
- 238000007621 cluster analysis Methods 0.000 claims abstract description 27
- 238000004458 analytical method Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 23
- 230000002776 aggregation Effects 0.000 claims description 63
- 238000004220 aggregation Methods 0.000 claims description 63
- 238000000605 extraction Methods 0.000 claims description 35
- 230000008569 process Effects 0.000 claims description 15
- 125000004122 cyclic group Chemical group 0.000 claims description 10
- 238000013136 deep learning model Methods 0.000 claims description 10
- 238000003745 diagnosis Methods 0.000 claims description 9
- 230000009467 reduction Effects 0.000 claims description 9
- 230000000694 effects Effects 0.000 claims description 5
- 230000007246 mechanism Effects 0.000 claims description 5
- 230000008909 emotion recognition Effects 0.000 claims description 4
- 230000004931 aggregating effect Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 238000013518 transcription Methods 0.000 claims description 3
- 230000035897 transcription Effects 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 206010019233 Headaches Diseases 0.000 description 12
- 231100000869 headache Toxicity 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 6
- 208000002173 dizziness Diseases 0.000 description 6
- 238000007726 management method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- 230000036651 mood Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 206010000087 Abdominal pain upper Diseases 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 206010068319 Oropharyngeal pain Diseases 0.000 description 2
- 201000007100 Pharyngitis Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 208000012895 Gastric disease Diseases 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 201000007201 aphasia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H80/00—ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及智能决策领域,揭露一种基于深度学习的疾病辅助识别方法及装置,方法包括:在初始语录中不存在预设关键词时,从初始语录中提取症状关键词,查询症状关键词对应的关键词疾病,对症状关键词进行因果分析,得到症状关键词的因果疾病;对初始语录进行向量编码,得到编码语录,对编码语录进行上下文结合处理,得到上下文结合向量,计算上下文结合向量的情绪类别概率,确定情绪类别概率的情绪类别;利用情绪类别确定症状关键词的症状轻重等级,利用症状轻重等级对关键词疾病与因果疾病进行疾病筛选,得到筛选疾病;对筛选疾病进行聚类分析,得到聚类疾病,利用聚类疾病构建问诊患者的轮询节点树。本发明可以提升疾病辅助识别结果准确度。
Description
技术领域
本发明涉及智能决策领域,尤其涉及一种基于深度学习的疾病辅助识别方法及装置。
背景技术
目前,随着深度学习技术在医疗行业中的应用发展,利用人工智能实现医疗用户的疾病辅助诊断的技术也越来越成熟,现有疾病问诊的流程大致为先对用户的语录进行自然语言处理,利用处理得到的信息在疾病数据库中查询对应的疾病,并发给用户,但这个流程存在如下缺陷,一、自然语言处理时仅提取名词、主谓宾等,而对语气词“有点、啊”关注较少,患者在进行问诊时由于个体差异会或多或少加重或减轻某些症状的严重程度,如果不关注患者的语气词,则会导致对患者症状的轻重判断错误的情况,例如患者的忍耐力较强,说自己是“有点头痛”,但实际是非常头疼,二、对患者的疾病归类大多从患者的语录的关键词中提取,例如患者的语录关键词包括“头疼、头晕”,常规的疾病归类方式是从含有此症状的疾病中查询对应疾病,这样会查询到“感冒、贫血”这两种疾病,但患者实际疾病是胃疼,由于胃疼的症状中没有包含“头疼、头晕”,而是包含“头疼、头晕”的原因症状“反胃”与结果症状“呕吐”,导致对患者的疾病分类不准确。因此,由于对患者的语气词关注较少且不能分析患者的因果疾病类别,导致疾病辅助识别结果准确度不足。
发明内容
为了解决上述问题,本发明提供了一种基于深度学习的疾病辅助识别方法及装置,可以关注患者的语气词且能分析患者的症状所产生的原因与结果,从而提升疾病辅助识别准确度。
第一方面,本发明提供了一种基于深度学习的疾病辅助识别方法,包括:
采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
在第一方面的一种可能实现方式中,所述对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,包括:
构建所述症状关键词的实体抽取模型与关系配对模型;
组合所述症状关键词及其初始因果关键词,得到组合关键词,并在所述实体抽取模型中,利用下述公式计算所述组合关键词的注意力指数:
其中,Attention(Q,K,V)表示所述注意力指数,Q表示索引值,K表示关键字索引值,V表示关键字值,dk表示矩阵K的维度,Q、K、V基于所述组合关键词确定,Q用于查询所述组合关键词的隐藏信息,K用来计算所述组合关键词的注意力分布α,V用来基于注意力分布计算所述组合关键词聚合后的信息;
基于所述注意力指数,确定所述组合关键词的抽取实体;
在所述关系配对模型中,构建所述抽取实体的聚集序列,并利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体;
利用下述公式对所述聚集实体进行非线性变换,得到非线性向量:
xb=ReLU(∑a∈E(Waxa+Ba))
其中,xb表示所述非线性向量,Wa表示权重,Ba表示偏置,xa表示所述聚集序列中相对于b号抽取实体的前一个抽取实体,a与b表示前后关系的序号,E表示所述聚集序列中的所有抽取实体;
利用所述非线性向量确定所述症状关键词的因果疾病。
在第一方面的一种可能实现方式中,所述构建所述症状关键词的实体抽取模型与关系配对模型,包括:
将人体机制进行模块划分,得到划分模块,其中,所述划分模块中每个划分模块包括多种疾病症状类别;
将所述划分模块的邻近模块作为所述划分模块的因果模块,将所述因果模块中的疾病症状类别作为所述划分模块中疾病症状类别的因果症状类别,构建所述划分模块中疾病症状类别与其因果症状类别之间的症状因果关系;
在所述因果关系的基础上构建所述症状关键词的实体抽取模型与关系配对模型。
在第一方面的一种可能实现方式中,所述利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体,包括:
从所述聚集序列选取初始实体与循环实体;
对所述初始实体进行卷积操作,得到卷积实体;
将所述卷积实体与所述循环实体进行实体聚集,得到初始聚集实体;
判断所述循环实体是否为所述聚集序列中的末位实体;
在所述循环实体不为所述聚集序列中的末位实体时,返回上述从所述聚集序列选取初始实体与循环实体的步骤;
在所述循环实体为所述聚集序列中的末位实体时,将所述初始聚集实体作为所述聚集实体。
在第一方面的一种可能实现方式中,所述对所述初始语录进行向量编码,得到编码语录,包括:
利用下述公式对所述初始语录进行特征提取,得到语录向量:
T=Transformer(((BERT(y))⊙[w]))
其中,T表示所述语录向量,y表示所述初始语录中的每个句子,w表示位置编码信息,BERT表示自编码语言模型,Transformer表示自回归模型;
确定所述语录向量的关系模板;
根据所述语录向量与所述关系模板,利用下述公式计算所述初始语录的结果向量:
其中,I表示所述结果向量,T表示所述语录向量,O表示所述关系模板,ENCODER表示编码器,结构上包括多头注意力模块、Transformer模块内部的计算方法、对每个token进行处理;
将所述结果向量作为所述编码语录。
在第一方面的一种可能实现方式中,所述对所述编码语录进行上下文结合处理,得到上下文结合向量,包括:
获取所述编码语录对应的知识图谱三元组;
利用下述公式对所述编码语录进行上下文结合处理,得到上下文结合向量:
其中,zi表示所述上下文结合向量,即知识图谱三元组中输入实体在结合上下文信息之后的更新结果,Lq用于提取知识图谱三元组中输入实体的查询向量,Lk用于提取知识图谱三元组中输出实体的查询向量与键向量,Ni表示知识图谱三元组中输入实体对应的输出实体的数目,i与j表示知识图谱三元组中实体的序号,且i与j为前后顺序的实体的序号,zi′表示zi上一层节点更新层所输出的向量,aji表示知识图谱(输出实体、实体关系、输入实体)的向量,Wj表示表示zj的权值,Wi表示aji的权值,zj表示输出实体在节点更新层的输出向量。
在第一方面的一种可能实现方式中,所述利用所述情绪类别确定所述症状关键词的症状轻重等级,包括:
在所述情绪类别为坏倾向情绪时,确定所述坏倾向情绪的轻重削减级别;
利用所述轻重削减级别对所述症状关键词进行轻重等级削减,得到第一症状轻重等级;
在所述情绪类别为好倾向情绪时,确定所述好倾向情绪的轻重增加级别;
利用所述轻重增加级别对所述症状关键词进行轻重等级增加,得到第二症状轻重等级。
在第一方面的一种可能实现方式中,所述对所述筛选疾病进行聚类分析,得到聚类疾病,包括:
将所述筛选疾病中具有某一相同症状的筛选疾病划分为同一疾病聚类,并在划分的多个同一疾病聚类中检测是否存在聚类症状名相同的情况;
在所述划分的多个同一疾病聚类中检测不存在所述聚类症状名相同的情况时,得到所述聚类疾病。
在第一方面的一种可能实现方式中,所述利用所述聚类疾病构建所述问诊患者的轮询节点树,包括:
利用所述聚类疾病的名称关键词作为所述问诊患者的轮询根节点;
对所述轮询根节点对应的聚类疾病进行迭代聚类分析,并将每次迭代聚类分析所产生的名称关键词作为上一层轮询根节点的孩子节点,直至迭代聚类分析所产生的名称关键词相比上一次的迭代聚类分析所产生的名称关键词未发生变化时,得到所述轮询节点树。
第二方面,本发明提供了一种基于深度学习的疾病辅助识别装置,所述装置包括:
因果分析模块,用于采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
情绪识别模块,用于对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
疾病筛选模块,用于利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
第一轮询模块,用于对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
第二轮询模块,用于在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
与现有技术相比,本方案的技术原理及有益效果在于:
本发明实施例首先通过对所述症状关键词进行因果分析,以用于从所述症状关键词的原因因素与结果因素中查询所有可能涉及到的疾病,提升患者疾病分类准确率,进一步地,本发明实施例通过对所述初始语录进行向量编码,以用于结合所述初始语录中的上下文信息,分析所述初始语录的潜在情绪标签,进一步地,本发明实施例通过对所述编码语录进行上下文结合处理,以用于结合编码语录中语录之间的有向图关系和上下文信息对所述编码语录进行更新,进一步地,本发明实施例通过利用所述情绪类别确定所述症状关键词的症状轻重等级,以用于利用用户的语气词轻重来判断患者症状的轻重,进一步地,本发明实施例通过对所述筛选疾病进行聚类分析,以用于将数量较大的筛选疾病分为多个群体,并在后续利用每个群体的名字作为与患者交流的轮询文化关键词,减少从数量较多的疾病中选取轮询问话关键词的低效率。因此,本发明实施例提出的一种基于深度学习的疾病辅助识别方法及装置,可以关注患者的语气词且能分析患者的症状所产生的原因与结果,从而提升疾病辅助识别准确度。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种基于深度学习的疾病辅助识别方法的流程示意图;
图2为本发明一实施例中图1提供的一种基于深度学习的疾病辅助识别方法的其中一个步骤的流程示意图;
图3为本发明一实施例中图1提供的一种基于深度学习的疾病辅助识别方法的另外一个步骤的流程示意图;
图4为本发明一实施例提供的一种基于深度学习的疾病辅助识别装置的模块示意图;
图5为本发明一实施例提供的实现基于深度学习的疾病辅助识别方法的电子设备的内部结构示意图。
具体实施方式
应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
本发明实施例提供一种基于深度学习的疾病辅助识别方法,所述基于深度学习的疾病辅助识别方法的执行主体包括但不限于服务端、终端等能够被配置为执行本发明实施例提供的该方法的电子设备中的至少一种。换言之,所述基于深度学习的疾病辅助识别方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参阅图1所示,是本发明一实施例提供的基于深度学习的疾病辅助识别方法的流程示意图。其中,图1中描述的基于深度学习的疾病辅助识别方法包括:
S1、采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录。
本发明实施例中,所述初始语录是指所述问诊患者在与AI机器人聊天时的第一句话,例如,当所述问诊患者进入与AI机器人聊天的聊天室时,AI机器人发起问话“您有什么不舒服吗”,所述问诊患者回复“我头疼、头晕”,其中的“我头疼、头晕”即为所述初始语录。
本发明实施例中,所述预设关键词是指表示所述问诊患者不清楚自己病情的关键词,包括“不知道”、“不清楚”、“好像”等等。
本发明的一实施例中,所述在所述初始语录中不存在预设关键词时,之前还包括:对所述初始语录进行词语提取,得到提取词语;利用下述公式计算所述提取词语与所述预设关键词之间的余弦相似度:
其中,A表示所述余弦相似度,b表示所述提取词语的特征向量,c表示所述预设关键词的特征向量;
在所述余弦相似度大于预设相似度时,所述初始语录中存在所述预设关键词;在所述余弦相似度不大于所述预设相似度时,所述初始语录中不存在所述预设关键词。
本发明实施例中,所述关键词疾病是指在疾病类别数据库中所能查询到的所有涉及所述症状关键词的疾病类别。
进一步地,本发明实施例通过对所述症状关键词进行因果分析,以用于从所述症状关键词的原因因素与结果因素中查询所有可能涉及到的疾病,提升患者疾病分类准确率。
本发明的一实施例中,所述对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,包括:构建所述症状关键词的实体抽取模型与关系配对模型;组合所述症状关键词及其初始因果关键词,得到组合关键词,并在所述实体抽取模型中,利用下述公式计算所述组合关键词的注意力指数:
其中,Attention(Q,K,V)表示所述注意力指数,Q表示索引值,K表示关键字索引值,V表示关键字值,dk表示矩阵K的维度,Q、K、V基于所述组合关键词确定,Q用于查询所述组合关键词的隐藏信息,K用来计算所述组合关键词的注意力分布α,V用来基于注意力分布计算所述组合关键词聚合后的信息;
基于所述注意力指数,确定所述组合关键词的抽取实体;在所述关系配对模型中,构建所述抽取实体的聚集序列,并利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体;利用下述公式对所述聚集实体进行非线性变换,得到非线性向量:
xb=ReLU(∑a∈E(Waxa+Ba))
其中,xb表示所述非线性向量,Wa表示权重,Ba表示偏置,xa表示所述聚集序列中相对于b号抽取实体的前一个抽取实体,a与b表示前后关系的序号,E表示所述聚集序列中的所有抽取实体;
利用所述非线性向量确定所述症状关键词的因果疾病。
其中,所述初始因果关键词是指从所述症状关键词当前所在的划分模块的邻近模块中采集的症状关键词;所述聚集序列是指用于后续聚集操作的序列,可以为将所有抽取实体随机排序得到。
可选地,所述利用所述非线性向量确定所述症状关键词的因果疾病的过程为:利用分类器计算所述非线性向量对应的症状类别概率,利用所述症状类别概率查询对应的症状类别,再利用与上述查询所述症状关键词对应的关键词疾病的原理类似的步骤查询所述症状类别所涉及的所有疾病,得到所述因果疾病。
本发明的又一实施例中,参阅图2所示,所述构建所述症状关键词的实体抽取模型与关系配对模型,包括:
S201、将人体机制进行模块划分,得到划分模块,其中,所述划分模块中每个划分模块包括多种疾病症状类别;
S202、将所述划分模块的邻近模块作为所述划分模块的因果模块,将所述因果模块中的疾病症状类别作为所述划分模块中疾病症状类别的因果症状类别,构建所述划分模块中疾病症状类别与其因果症状类别之间的症状因果关系;
S203、在所述因果关系的基础上构建所述症状关键词的实体抽取模型与关系配对模型。
其中,所述实体抽取模型用于从所述初始因果关键词中抽取与所述症状关键词含有潜在因果关系的因果症状实体,所述实体抽取模型结构上包括:输入层、嵌入层、位置编码层、注意力层、全连接层等;所述关系配对模型用于确定所抽取的实体中每个实体之间的因果关系,所述关系配对模型结构上包括:卷积层、线性神经网络层、非线性链接层等。
可选地,所述将人体机制进行模块划分,得到划分模块的过程是指基于不同的划分标准将疾病症状划分为多个群体模块,例如基于身体部位的标准,先将身体机制划分头部、双臂、上半身、腿、脚等5个模块,每个模块包含成千上万种疾病症状,如头部包括头疼、头晕等,双臂包括手臂拉伤、长痘等。
本发明的又一实施例中,所述利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体,包括:从所述聚集序列选取初始实体与循环实体;对所述初始实体进行卷积操作,得到卷积实体;将所述卷积实体与所述循环实体进行实体聚集,得到初始聚集实体;判断所述循环实体是否为所述聚集序列中的末位实体;在所述循环实体不为所述聚集序列中的末位实体时,返回上述从所述聚集序列选取初始实体与循环实体的步骤;在所述循环实体为所述聚集序列中的末位实体时,将所述初始聚集实体作为所述聚集实体。
其中,基于所述聚集序列按照从第一个实体到最后一个实体的顺序排序的前提,所述初始实体与所述循环实体为前后位置的关系。可选地,所述将所述卷积实体与所述循环实体进行实体聚集,得到初始聚集实体的过程为通过所述关系配对模型中的线性神经网络层将所述初始实体传递至所述循环实体,并在所述循环实体处对所述初始实体与所述循环实体进行线性叠加的过程;所述在所述循环实体不为所述聚集序列中的末位实体时,返回上述从所述聚集序列选取初始实体与循环实体的步骤的过程为:将所述初始聚集实体作为下一次的初始实体,将所述循环实体的下一个实体作为所述初始聚集实体的循环实体,并继续进行线性叠加的过程。
S2、对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别。
本发明实施例通过对所述初始语录进行向量编码,以用于结合所述初始语录中的上下文信息,分析所述初始语录的潜在情绪标签。
本发明的一实施例中,所述对所述初始语录进行向量编码,得到编码语录,包括:利用下述公式对所述初始语录进行特征提取,得到语录向量:
T=Transformer(((BERT(y))⊙[w]))
其中,T表示所述语录向量,y表示所述初始语录中的每个句子,w表示位置编码信息,BERT表示自编码语言模型,Transformer表示自回归模型;
确定所述语录向量的关系模板;根据所述语录向量与所述关系模板,利用下述公式计算所述初始语录的结果向量:
其中,I表示所述结果向量,T表示所述语录向量,O表示所述关系模板,ENCODER表示编码器,结构上包括多头注意力模块、Transformer模块内部的计算方法、对每个token进行处理;
将所述结果向量作为所述编码语录。
其中,所述关系模板是指知识图谱三元组中输入实体与输出实体之间的关系,包括意图、行为、影响及感觉,意图是指患者说初始语录时的意图,行为是指患者说初始语录后想要做的事情,影响是指患者说初始语录时对自身的情绪影响,感觉是指患者说初始语录时的感受;其中,所述语录向量、所述关系模板及所述结果向量共同构成知识图谱三元组,所述语录向量作为知识图谱三元组中的实体,所述关系模板作为知识图谱三元组中的关系,所述结果向量作为知识图谱三元组中的输出预测结果。
进一步地,本发明实施例通过对所述编码语录进行上下文结合处理,以用于结合编码语录中语录之间的有向图关系和上下文信息对所述编码语录进行更新。
本发明的一实施例中,所述对所述编码语录进行上下文结合处理,得到上下文结合向量,包括:获取所述编码语录对应的知识图谱三元组;利用下述公式对所述编码语录进行上下文结合处理,得到上下文结合向量:
其中,zi表示所述上下文结合向量,即知识图谱三元组中输入实体在结合上下文信息之后的更新结果,Lq用于提取知识图谱三元组中输入实体的查询向量,Lk用于提取知识图谱三元组中输出实体的查询向量与键向量,Ni表示知识图谱三元组中输入实体对应的输出实体的数目,i与j表示知识图谱三元组中实体的序号,且i与j为前后顺序的实体的序号,zi′表示zi上一层节点更新层所输出的向量,aji表示知识图谱(输出实体、实体关系、输入实体)的向量,Wj表示表示zj的权值,Wi表示aji的权值,zj表示输出实体在节点更新层的输出向量。
本发明的一实施例中,所述通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,包括:通过所述预设的深度学习模型中的分类层算法计算所述上下文结合向量的情绪类别概率,其中,所述分类层算法包括:
其中,表示所述情绪类别概率,zi表示所述上下文结合向量,wi表示全连接层的权值,bi表示全连接层的偏置,i表示知识图谱三元组中输入实体的序号。
其中,所述情绪类别包括开心、伤心、愤怒、无语、焦急等类别。
S3、利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病。
本发明实施例通过利用所述情绪类别确定所述症状关键词的症状轻重等级,以用于利用用户的语气词轻重来判断患者症状的轻重。
本发明的一实施例中,所述利用所述情绪类别确定所述症状关键词的症状轻重等级,包括:在所述情绪类别为坏倾向情绪时,确定所述坏倾向情绪的轻重削减级别;利用所述轻重削减级别对所述症状关键词进行轻重等级削减,得到第一症状轻重等级;在所述情绪类别为好倾向情绪时,确定所述好倾向情绪的轻重增加级别;利用所述轻重增加级别对所述症状关键词进行轻重等级增加,得到第二症状轻重等级。
可选地,在所述情绪类别为坏倾向情绪时,表示此时患者的初始语录中将病情描述得相对于实际病情更严重,此时需要对病情级别进行削减;在所述情绪类别为好倾向情绪时,表示此时患者的初始语录中将病情描述得相对于实际病情较轻缓,此时需要将病情校正到正常等级。
本发明的一实施例中,所述利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病,包括:去除所述关键词疾病与所述因果疾病中不符合所述症状轻重等级的疾病,并将剩余的疾病作为所述筛选疾病。
可选地,所述去除所述关键词疾病与所述因果疾病中不符合所述症状轻重等级的疾病的过程是指:在所述症状轻重等级为轻但所述关键词疾病与所述因果疾病的实际轻重等级为严重时,对此时的疾病类别进行去除;在所述症状轻重等级为严重但所述关键词疾病与所述因果疾病的实际轻重等级为轻时,对此时的疾病类别进行去除;其中实际轻重等级为严重时的疾病类别为一些较为严重的疾病,例如癌症、肿瘤等,实际轻重等级为轻时的疾病类别为一些较为轻缓的疾病,例如感冒、发烧等。
S4、对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息。
本发明实施例通过对所述筛选疾病进行聚类分析,以用于将数量较大的筛选疾病分为多个群体,并在后续利用每个群体的名字作为与患者交流的轮询文化关键词,减少从数量较多的疾病中选取轮询问话关键词的低效率。
本发明的一实施例中,参阅图3所示,所述对所述筛选疾病进行聚类分析,得到聚类疾病,包括:
S301、将所述筛选疾病中具有某一相同症状的筛选疾病划分为同一疾病聚类,并在划分的多个同一疾病聚类中检测是否存在聚类症状名相同的情况;
S302、在所述划分的多个同一疾病聚类中检测不存在所述聚类症状名相同的情况时,得到所述聚类疾病。
其中,所述聚类症状名是指将所述筛选疾病中具有某一相同症状的筛选疾病划分为同一疾病聚类时的某一相同症状的名字。
本发明的一实施例中,所述利用所述聚类疾病构建所述问诊患者的轮询节点树,包括:利用所述聚类疾病的名称关键词作为所述问诊患者的轮询根节点;对所述轮询根节点对应的聚类疾病进行迭代聚类分析,并将每次迭代聚类分析所产生的名称关键词作为上一层轮询根节点的孩子节点,直至迭代聚类分析所产生的名称关键词相比上一次的迭代聚类分析所产生的名称关键词未发生变化时,得到所述轮询节点树。
可选地,所述通过所述轮询节点树实现对所述问诊患者进行第一轮询问诊,得到第一疾病类别的过程可以为:将第一层的轮询根节点的关键词作为问话来询问患者,例如第一层的轮询根节点的关键词包括“头疼、胃疼、喉咙痛”,则构建的问话为“您是否头疼、胃疼、喉咙痛”,当患者回复头疼时,则查询头疼的孩子节点进行问询。
S5、在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
其中,所述第二问诊轮询与上述的轮询节点树类似,不同的是,轮询节点树基于所筛选的疾病来发起问话,而所述第二问诊轮询基于身体的模块发起问话,这是因为患者回复内容不清楚时,需要从全身疾病症状考虑来发起问话,例如,将身体划分为头部、双臂、上半身、腿、脚等5个模块,将这5个模块的名字生成为第一轮的问询,再依次从每个模块内继续往下查找症状类别。
可以看出,本发明实施例首先通过对所述症状关键词进行因果分析,以用于从所述症状关键词的原因因素与结果因素中查询所有可能涉及到的疾病,提升患者疾病分类准确率,进一步地,本发明实施例通过对所述初始语录进行向量编码,以用于结合所述初始语录中的上下文信息,分析所述初始语录的潜在情绪标签,进一步地,本发明实施例通过对所述编码语录进行上下文结合处理,以用于结合编码语录中语录之间的有向图关系和上下文信息对所述编码语录进行更新,进一步地,本发明实施例通过利用所述情绪类别确定所述症状关键词的症状轻重等级,以用于利用用户的语气词轻重来判断患者症状的轻重,进一步地,本发明实施例通过对所述筛选疾病进行聚类分析,以用于将数量较大的筛选疾病分为多个群体,并在后续利用每个群体的名字作为与患者交流的轮询文化关键词,减少从数量较多的疾病中选取轮询问话关键词的低效率。因此,本发明实施例提出的一种基于深度学习的疾病辅助识别方法可以关注患者的语气词且能分析患者的症状所产生的原因与结果,从而提升疾病辅助识别准确度。
如图4所示,是本发明基于深度学习的疾病辅助识别装置功能模块图。
本发明所述基于深度学习的疾病辅助识别装置400可以安装于电子设备中。根据实现的功能,所述基于深度学习的疾病辅助识别装置可以包括因果分析模块401、情绪识别模块402、疾病筛选模块403、第一轮询模块404以及第二轮询模块405。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本发明实施例中,关于各模块/单元的功能如下:
所述因果分析模块401,用于采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
所述情绪识别模块402,用于对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
所述疾病筛选模块403,用于利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
所述第一轮询模块404,用于对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
所述第二轮询模块405,用于在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
详细地,本发明实施例中所述基于深度学习的疾病辅助识别装置400中的所述各模块在使用时采用与上述的图1至图3中所述的基于深度学习的疾病辅助识别方法一样的技术手段,并能够产生相同的技术效果,这里不再赘述。
如图5所示,是本发明实现基于深度学习的疾病辅助识别方法的电子设备的结构示意图。
所述电子设备可以包括处理器50、存储器51、通信总线52以及通信接口53,还可以包括存储在所述存储器51中并可在所述处理器50上运行的计算机程序,如基于深度学习的疾病辅助识别程序。
其中,所述处理器50在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器50是所述电子设备的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器51内的程序或者模块(例如执行基于深度学习的疾病辅助识别程序等),以及调用存储在所述存储器51内的数据,以执行电子设备的各种功能和处理数据。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器51在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器51在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(Secure Digital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器51不仅可以用于存储安装于电子设备的应用软件及各类数据,例如数据库配置化连接程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述通信总线52可以是外设部件互连标准(peripheral componentinterconnect,简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器51以及至少一个处理器50等之间的连接通信。
所述通信接口53用于上述电子设备5与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,所述用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器50逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
应该了解,所述实施例仅为说明之用,在专利发明范围上并不受此结构的限制。
所述电子设备中的所述存储器51存储的数据库配置化连接程序是多个计算机程序的组合,在所述处理器50中运行时,可以实现:
采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
具体地,所述处理器50对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性计算机可读取存储介质中。所述存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所发明的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种基于深度学习的疾病辅助识别方法,其特征在于,所述方法包括:
采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
2.根据权利要求1所述的方法,其特征在于,所述对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,包括:
构建所述症状关键词的实体抽取模型与关系配对模型;
组合所述症状关键词及其初始因果关键词,得到组合关键词,并在所述实体抽取模型中,利用下述公式计算所述组合关键词的注意力指数:
其中,Attention(Q,K,V)表示所述注意力指数,Q表示索引值,K表示关键字索引值,V表示关键字值,dk表示矩阵K的维度,Q、K、V基于所述组合关键词确定,Q用于查询所述组合关键词的隐藏信息,K用来计算所述组合关键词的注意力分布α,V用来基于注意力分布计算所述组合关键词聚合后的信息;
基于所述注意力指数,确定所述组合关键词的抽取实体;
在所述关系配对模型中,构建所述抽取实体的聚集序列,并利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体;
利用下述公式对所述聚集实体进行非线性变换,得到非线性向量:
xb=ReLU(∑a∈E(Waxa+Ba))
其中,xb表示所述非线性向量,Wa表示权重,Ba表示偏置,xa表示所述聚集序列中相对于b号抽取实体的前一个抽取实体,a与b表示前后关系的序号,E表示所述聚集序列中的所有抽取实体;
利用所述非线性向量确定所述症状关键词的因果疾病。
3.根据权利要求2所述的方法,其特征在于,所述构建所述症状关键词的实体抽取模型与关系配对模型,包括:
将人体机制进行模块划分,得到划分模块,其中,所述划分模块中每个划分模块包括多种疾病症状类别;
将所述划分模块的邻近模块作为所述划分模块的因果模块,将所述因果模块中的疾病症状类别作为所述划分模块中疾病症状类别的因果症状类别,构建所述划分模块中疾病症状类别与其因果症状类别之间的症状因果关系;
在所述因果关系的基础上构建所述症状关键词的实体抽取模型与关系配对模型。
4.根据权利要求2所述的方法,其特征在于,所述利用所述聚集序列对所述抽取实体进行实体聚集,得到聚集实体,包括:
从所述聚集序列选取初始实体与循环实体;
对所述初始实体进行卷积操作,得到卷积实体;
将所述卷积实体与所述循环实体进行实体聚集,得到初始聚集实体;
判断所述循环实体是否为所述聚集序列中的末位实体;
在所述循环实体不为所述聚集序列中的末位实体时,返回上述从所述聚集序列选取初始实体与循环实体的步骤;
在所述循环实体为所述聚集序列中的末位实体时,将所述初始聚集实体作为所述聚集实体。
5.根据权利要求1所述的方法,其特征在于,所述对所述初始语录进行向量编码,得到编码语录,包括:
利用下述公式对所述初始语录进行特征提取,得到语录向量:
T=Transformer(((BERT(y))⊙[w]))
其中,T表示所述语录向量,y表示所述初始语录中的每个句子,w表示位置编码信息,BERT表示自编码语言模型,Transformer表示自回归模型;
确定所述语录向量的关系模板;
根据所述语录向量与所述关系模板,利用下述公式计算所述初始语录的结果向量:
其中,I表示所述结果向量,T表示所述语录向量,O表示所述关系模板,ENCODER表示编码器,结构上包括多头注意力模块、Transformer模块内部的计算方法、对每个token进行处理;
将所述结果向量作为所述编码语录。
6.根据权利要求1所述的方法,其特征在于,所述对所述编码语录进行上下文结合处理,得到上下文结合向量,包括:
获取所述编码语录对应的知识图谱三元组;
利用下述公式对所述编码语录进行上下文结合处理,得到上下文结合向量:
其中,zi表示所述上下文结合向量,即知识图谱三元组中输入实体在结合上下文信息之后的更新结果,Lq用于提取知识图谱三元组中输入实体的查询向量,Lk用于提取知识图谱三元组中输出实体的查询向量与键向量,Ni表示知识图谱三元组中输入实体对应的输出实体的数目,i与j表示知识图谱三元组中实体的序号,且i与j为前后顺序的实体的序号,zi′表示zi上一层节点更新层所输出的向量,aji表示知识图谱(输出实体、实体关系、输入实体)的向量,Wj表示表示zj的权值,Wi表示aji的权值,zj表示输出实体在节点更新层的输出向量。
7.根据权利要求1所述的方法,其特征在于,所述利用所述情绪类别确定所述症状关键词的症状轻重等级,包括:
在所述情绪类别为坏倾向情绪时,确定所述坏倾向情绪的轻重削减级别;
利用所述轻重削减级别对所述症状关键词进行轻重等级削减,得到第一症状轻重等级;
在所述情绪类别为好倾向情绪时,确定所述好倾向情绪的轻重增加级别;
利用所述轻重增加级别对所述症状关键词进行轻重等级增加,得到第二症状轻重等级。
8.根据权利要求1所述的方法,其特征在于,所述对所述筛选疾病进行聚类分析,得到聚类疾病,包括:
将所述筛选疾病中具有某一相同症状的筛选疾病划分为同一疾病聚类,并在划分的多个同一疾病聚类中检测是否存在聚类症状名相同的情况;
在所述划分的多个同一疾病聚类中检测不存在所述聚类症状名相同的情况时,得到所述聚类疾病。
9.根据权利要求1所述的方法,其特征在于,所述利用所述聚类疾病构建所述问诊患者的轮询节点树,包括:
利用所述聚类疾病的名称关键词作为所述问诊患者的轮询根节点;
对所述轮询根节点对应的聚类疾病进行迭代聚类分析,并将每次迭代聚类分析所产生的名称关键词作为上一层轮询根节点的孩子节点,直至迭代聚类分析所产生的名称关键词相比上一次的迭代聚类分析所产生的名称关键词未发生变化时,得到所述轮询节点树。
10.一种基于深度学习的疾病辅助识别装置,其特征在于,所述装置包括:
因果分析模块,用于采集问诊患者的初始语录,在所述初始语录中不存在预设关键词时,从所述初始语录中提取症状关键词,查询所述症状关键词对应的关键词疾病,并对所述症状关键词进行因果分析,得到所述症状关键词的因果疾病,其中,所述初始语录包括语音语录与文本语录;
情绪识别模块,用于对所述初始语录进行向量编码,得到编码语录,对所述编码语录进行上下文结合处理,得到上下文结合向量,通过预设的深度学习模型计算所述上下文结合向量对应的情绪类别概率,确定所述情绪类别概率对应的情绪类别;
疾病筛选模块,用于利用所述情绪类别确定所述症状关键词的症状轻重等级,利用所述症状轻重等级对所述关键词疾病与所述因果疾病进行疾病筛选,得到筛选疾病;
第一轮询模块,用于对所述筛选疾病进行聚类分析,得到聚类疾病,利用所述聚类疾病构建所述问诊患者的轮询节点树,以通过所述轮询节点树实现对所述问诊患者进行第一轮询辅助问诊,得到第一疾病辅助信息;
第二轮询模块,用于在所述初始语录中存在所述预设关键词时,构建所述问诊患者的第二问诊轮询,利用所述第二问诊轮询对所述问诊患者进行第二轮询辅助问诊,得到第二疾病辅助信息,所述第一疾病辅助信息和第二疾病辅助信息用于所述问诊患者的辅助诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310525512.9A CN116844711A (zh) | 2023-05-10 | 2023-05-10 | 基于深度学习的疾病辅助识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310525512.9A CN116844711A (zh) | 2023-05-10 | 2023-05-10 | 基于深度学习的疾病辅助识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116844711A true CN116844711A (zh) | 2023-10-03 |
Family
ID=88158786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310525512.9A Pending CN116844711A (zh) | 2023-05-10 | 2023-05-10 | 基于深度学习的疾病辅助识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116844711A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275752A (zh) * | 2023-11-20 | 2023-12-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及系统 |
-
2023
- 2023-05-10 CN CN202310525512.9A patent/CN116844711A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117275752A (zh) * | 2023-11-20 | 2023-12-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及系统 |
CN117275752B (zh) * | 2023-11-20 | 2024-03-22 | 中国人民解放军总医院 | 基于机器学习的病例聚类分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022134759A1 (zh) | 关键词生成方法、装置、电子设备及计算机存储介质 | |
CN111414393B (zh) | 一种基于医学知识图谱的语义相似病例检索方法及设备 | |
CN112541338A (zh) | 相似文本匹配方法、装置、电子设备及计算机存储介质 | |
CN113111162A (zh) | 科室推荐方法、装置、电子设备及存储介质 | |
CN114822812A (zh) | 角色对话模拟方法、装置、设备及存储介质 | |
WO2022105496A1 (zh) | 智能回访方法、装置、电子设备及可读存储介质 | |
CN113722483A (zh) | 话题分类方法、装置、设备及存储介质 | |
CN113064994A (zh) | 会议质量评估方法、装置、设备及存储介质 | |
CN113779179A (zh) | 一种基于深度学习和知识图谱的icd智能编码的方法 | |
CN116844711A (zh) | 基于深度学习的疾病辅助识别方法及装置 | |
US20220245358A1 (en) | Creating a superset of knowledge | |
CN113821602B (zh) | 基于图文聊天记录的自动答疑方法、装置、设备及介质 | |
CN116821373A (zh) | 基于图谱的prompt推荐方法、装置、设备及介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN116720525A (zh) | 基于问诊数据的疾病辅助分析方法、装置、设备及介质 | |
CN116884612A (zh) | 疾病风险等级的智能分析方法、装置、设备及存储介质 | |
CN116702776A (zh) | 基于跨中西医的多任务语义划分方法、装置、设备及介质 | |
CN116719840A (zh) | 一种基于病历后结构化处理的医疗信息推送方法 | |
CN116665878A (zh) | 改善累计误差的智能问诊方法、装置、设备及存储介质 | |
CN116383766A (zh) | 基于多模态数据的辅诊方法、装置、设备及存储介质 | |
CN116468043A (zh) | 嵌套实体识别方法、装置、设备及存储介质 | |
CN114548114B (zh) | 文本情绪识别方法、装置、设备及存储介质 | |
CN116150690A (zh) | DRGs决策树构建方法及装置、电子设备、存储介质 | |
CN116340516A (zh) | 实体关系的聚类提取方法、装置、设备及存储介质 | |
CN116303922A (zh) | 咨询消息应答方法、装置、计算机设备、存储介质和产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |