CN112035636B - 医疗问诊系统的问答管理方法、装置、设备及存储介质 - Google Patents
医疗问诊系统的问答管理方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112035636B CN112035636B CN202010884354.2A CN202010884354A CN112035636B CN 112035636 B CN112035636 B CN 112035636B CN 202010884354 A CN202010884354 A CN 202010884354A CN 112035636 B CN112035636 B CN 112035636B
- Authority
- CN
- China
- Prior art keywords
- data
- information
- target
- question
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Human Computer Interaction (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能领域,公开了医疗问诊系统的问答管理方法、装置、设备及存储介质,应用于智慧医疗领域中,降低了线上误诊率。本发明方法包括:从目标终端获取目标特征数据;调用预置的神经网络预分类模型对目标特征数据进行预分类;若目标特征数据为第一类数据,则调用预置的知识图谱模型和第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至目标终端;若目标特征数据为第二类数据,则根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端;生成电子病历数据;调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。
Description
技术领域
本发明涉及医疗数据领域,尤其涉及一种医疗问诊系统的问答管理方法、装置、设备及存储介质。
背景技术
互联网医疗是人工智能应用的重要领域。随着技术的快速发展,移动医疗已经向诊疗阶靠拢和突破。近年来,线上问诊越来越普及,单日线上问诊量早已突破百万级日均规模,线上医生资源不足,线上问诊服务效率不高已成为突出问题。正因如此,高质量的计算机辅助医疗系统开发已成为各大公司和科研机构研发突破的重点领域。人工智能系统,尤其是自然语言理解,在算法和算力的大幅突破的背景下,这一命题的解决逐渐成为可能。
传统的自动化问诊流程是通过定义好的问诊流程图提出预设好的问题,收集用户的信息,这种方案会依次抛出预设好的问诊路径,一旦路径设定好系统不会依据用户的具体情况进行跳跃和切换。因为互联网医院受限于医疗本身复杂的特殊性和互联网中物理空间隔离的特点,预设的问题与用户的需求不匹配,导致线上误诊率高。
发明内容
本发明提供了一种医疗问诊系统的问答管理方法、装置、设备及存储介质,用于降低线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院接诊效率。
本发明实施例的第一方面提供一种医疗问诊系统的问答管理方法,包括:从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息;调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据;若所述目标特征数据为所述第一类数据,则调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;若所述目标特征数据为所述第二类数据,则根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端。
可选的,在本发明实施例第一方面的第一种实现方式中,所述调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据,包括:调用预置的神经网络预分类模型对所述目标数据进行预分类,确定预分类值;判断所述预分类值是否大于或等于第一阈值;若所述预分类值大于或等于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第一类数据,所述第一类数据为问诊信息类型齐全的数据;若所述预分类值小于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第二类数据,所述第二类数据为问诊信息类型缺失的数据。
可选的,在本发明实施例第一方面的第二种实现方式中,所述调用预置的神经网络预分类模型对所述目标数据进行预分类,确定预分类值,包括:调用多个预置编码器对目标数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,所述固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;将所述多个固定维度的向量输入到所述预置的神经网络预分类模型中,生成预测向量;对所述预测向量进行评分,得到所述目标数据的预分类值。
可选的,在本发明实施例第一方面的第三种实现方式中,所述若所述目标特征数据为所述第一类数据,则调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端,包括:若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱;对所述剪枝后的医学知识图谱进行决策树解析,得到解析结果;基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端。
可选的,在本发明实施例第一方面的第四种实现方式中,所述若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,包括:若所述目标特征数据为所述第一类数据,则确定所述第一类数据中涉及的问答关键词;根据所述问答关键词在预置的知识图谱模型的医学知识图谱中确定对应的图谱节点;对所述医疗知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,所述剪枝后的医学知识图谱不包含所述对应的图谱节点。
可选的,在本发明实施例第一方面的第五种实现方式中,所述基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端,包括:当解析结果为糖尿病时,调用预置的推荐关系表,在所述推荐关系表中查询得到多个糖尿病治疗方案;根据预置评分规则对所述多个糖尿病治疗方案进行评分,得到对应的多个分值,并根据所述多个分值按照从大到小的顺序进行排序,得到治疗推荐列表,所述治疗推荐列表包括所述多个糖尿病治疗方案;将所述治疗推荐列表中排序前两名的糖尿病治疗方案发送至所述目标终端。
可选的,在本发明实施例第一方面的第六种实现方式中,在所述从目标终端获取目标特征数据之前,所述医疗问诊系统的问答管理方法还包括:获取多个初始历史问诊单,并对所述多个初始历史问诊单进行脱敏处理,得到脱敏后的候选历史问诊单;对所述脱敏后的候选历史问诊单进行特征提取,得到多个候选特征,所述候选特征至少包括问诊单对话文本、用户年龄信息、用户性别信息、用户的主要诉求信息、医生诊疗处方信息和诊断信息;将所述多个候选特征确定为预置模板模型的输入数据,将标注过的诊断标签确定为预置模板模型的输出标签,对预置模板模型进行训练;生成预置的神经网络预分类模型,所述神经网络预分类模型用于对数据进行二分类。
本发明实施例的第二方面提供了一种医疗问诊系统的问答管理装置,包括:数据获取模块,用于从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息;判别模块,用于调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据;图谱推理模块,若所述目标特征数据为所述第一类数据,则用于调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;图谱树形逻辑模块,若所述目标特征数据为所述第二类数据,则用于根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;电子病历模块,用于根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;所述判别模块,还用于调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端。
可选的,在本发明实施例第二方面的第一种实现方式中,判别模块包括:预分类单元,用于调用预置的神经网络预分类模型对所述目标数据进行预分类,确定预分类值;判断单元,用于判断所述预分类值是否大于或等于第一阈值;第一确定单元,若所述预分类值大于或等于所述第一阈值,则用于确定所述目标特征数据对应的预分类结果为第一类数据,所述第一类数据为问诊信息类型齐全的数据;第二确定单元,用于若所述预分类值小于所述第一阈值,则用于确定所述目标特征数据对应的预分类结果为第二类数据,所述第二类数据为问诊信息类型缺失的数据。
可选的,在本发明实施例第二方面的第二种实现方式中,预分类单元具体用于:调用多个预置编码器对目标数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,所述固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;将所述多个固定维度的向量输入到所述预置的神经网络预分类模型中,生成预测向量;对所述预测向量进行评分,得到所述目标数据的预分类值。
可选的,在本发明实施例第二方面的第三种实现方式中,图谱推理模块包括:剪枝单元,用于若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱;解析单元,用于对所述剪枝后的医学知识图谱进行决策树解析,得到解析结果;确定发送单元,用于基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端。
可选的,在本发明实施例第二方面的第四种实现方式中,剪枝单元具体用于:若所述目标特征数据为所述第一类数据,则确定所述第一类数据中涉及的问答关键词;根据所述问答关键词在预置的知识图谱模型的医学知识图谱中确定对应的图谱节点;对所述医疗知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,所述剪枝后的医学知识图谱不包含所述对应的图谱节点。
可选的,在本发明实施例第二方面的第五种实现方式中,确定发送单元具体用于:当解析结果为糖尿病时,调用预置的推荐关系表,在所述推荐关系表中查询得到多个糖尿病治疗方案;根据预置评分规则对所述多个糖尿病治疗方案进行评分,得到对应的多个分值,并根据所述多个分值按照从大到小的顺序进行排序,得到治疗推荐列表,所述治疗推荐列表包括所述多个糖尿病治疗方案;将所述治疗推荐列表中排序前两名的糖尿病治疗方案发送至所述目标终端。
可选的,在本发明实施例第二方面的第六种实现方式中,医疗问诊系统的问答管理装置还包括:诊单获取模块,用于获取多个初始历史问诊单,并对所述多个初始历史问诊单进行脱敏处理,得到脱敏后的候选历史问诊单;特征提取模块,用于对所述脱敏后的候选历史问诊单进行特征提取,得到多个候选特征,所述候选特征至少包括问诊单对话文本、用户年龄信息、用户性别信息、用户的主要诉求信息、医生诊疗处方信息和诊断信息;训练模块,用于将所述多个候选特征确定为预置模板模型的输入数据,将标注过的诊断标签确定为预置模板模型的输出标签,对预置模板模型进行训练;生成模块,用于生成预置的神经网络预分类模型,所述神经网络预分类模型用于对数据进行二分类。
本发明实施例的第三方面提供了一种医疗问诊系统的问答管理设备,存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述医疗问诊系统的问答管理设备执行上述的医疗问诊系统的问答管理方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有指令,当所述指令被处理器执行时实现上述任一实施方式所述的医疗问诊系统的问答管理方法的步骤。
本发明实施例提供的技术方案中,从目标终端获取目标特征数据,目标特征数据用于指示目标用户通过目标终端向医疗问诊系统输入的问诊信息;调用预置的神经网络预分类模型对目标特征数据进行预分类,判定目标特征数据对应的预分类结果,预分类结果包括第一类数据和第二类数据;若目标特征数据为第一类数据,则调用预置的知识图谱模型和第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至目标终端;若目标特征数据为第二类数据,则根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端;根据多轮补充问题的答案和目标特征数据生成电子病历数据;调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。本发明实施例,降低了线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院的接诊效率。
附图说明
图1为本发明实施例中医疗问诊系统的问答管理方法的一个实施例示意图;
图2为本发明实施例中医疗问诊系统的问答管理方法的另一个实施例示意图;
图3为本发明实施例中医疗问诊系统的问答管理装置的一个实施例示意图;
图4为本发明实施例中医疗问诊系统的问答管理装置的另一个实施例示意图;
图5为本发明实施例中医疗问诊系统的问答管理设备的一个实施例示意图。
具体实施方式
本发明提供了一种医疗问诊系统的问答管理方法、装置、设备及存储介质,用于降低线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院接诊效率。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,本发明实施例提供的医疗问诊系统的问答管理方法的流程图,具体包括:
101、从目标终端获取目标特征数据,目标特征数据用于指示目标用户通过目标终端向医疗问诊系统输入的问诊信息。
服务器接收目标终端发送的目标特征数据,该目标特征数据用于指示目标用户通过目标终端向医疗问诊系统输入的问诊信息。其中,问诊信息包括问诊对话文本和目标用户的基础信息,该目标用户的基础信息包括目标用户的年龄信息、目标用户的性别信息以及目标用户的主要诉求信息。
可以理解的是,本发明的执行主体可以为医疗问诊系统的问答管理装置,还可以是服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
需要说明的是,在获取目标特征数据时,需要按照字符串匹配的分词方法对各个语句进行切分,其中不同特征对应的自定义分词词表不尽相同,文本集合可以按从左至右按不同字符空格隔开,这里的文本集合即为目标特征数据。
102、调用预置的神经网络预分类模型对目标特征数据进行预分类,判定目标特征数据对应的预分类结果,预分类结果包括第一类数据和第二类数据,第一类数据为问诊信息类型齐全的数据,第二类数据为问诊信息类型缺失的数据。
服务器调用预置的神经网络预分类模型对目标特征数据进行预分类,判定目标特征数据对应的预分类结果,预分类结果包括第一类数据和第二类数据,第一类数据为问诊信息类型齐全的数据,第二类数据为问诊信息类型缺失的数据。
其中,预分类结果除了包括数据类型,即预分类结果为第一类数据或第二类数据,还包括一个预分类值(分类预测值),服务器可以根据预分类值的大小,判断目标数据的完整程度。当该预分类值大于某一阈值(如第一阈值),会提示收集信息完备(即数据类型齐全)已能完成诊断,并结束问诊。同样,当该预分类值小于某一阈值(同样为第一阈值)时,服务器会提示收集信息不够完备(即数据类型不齐全,缺失),即表明需要调用知识图谱决策树模型生成补充问题并返回到目标用户的目标终端,以使得目标用户对补充问题进行描述,获取更多的问诊信息,其中,补充问题为多个,以便尽可能多的获取需要的问诊信息。
需要说明的是,收集信息是否完备(即数据类型是否齐全)的标准是指目标特征数据中存在必要的参数,这些必要的参数包括问诊对话文本、目标用户的年龄信息、目标用户的性别信息、目标用户的主要诉求信息、病例历史信息、关键字信息以及类别标签信息,其中,类别标签信息主要指目标用户可能属于的病种信息,例如,目标用户如果在文本对话中提及关键字“肝”,那么该目标用户可能对应的类别标签包括“肝功能异常”、“内脏功能异常”、“酒精”、“新陈代谢异常”等标签,同一个用户可以对应多个类别标签,具体此处不再赘述。
103、若目标特征数据为第一类数据,则调用预置的知识图谱模型和第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至目标终端。
若目标特征数据为第一类数据,则服务器调用预置的知识图谱模型和第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至目标终端。
104、若目标特征数据为第二类数据,则根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端。
具体的,若目标特征数据为第二类数据,则服务器根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端。
具体的,当判断收集信息不完备(为第二类数据)时,服务器会将相关用户信息、输出结果和预诊诊断结果作为混合字段输入到医疗图谱查询,图谱查询知识库中最可能的相关问题(即生成多轮补充问题)进行推送。
多轮补充问题会组织成im消息的形式展现在目标终端。将目标用户回答的补充信息,经过实体信息抽取和整合录入进医疗问诊系统的电子病历模块,得到更新后的数据,该更新后的数据包括病征信息、病史信息、年龄等基础信息,具体此处不做限定。
105、根据多轮补充问题的答案和目标特征数据生成电子病历数据。
服务器根据多轮补充问题的答案和目标特征数据生成电子病历数据。
106、调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。
服务器调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。
本发明实施例,通过预置的注意力神经网络模型对目标特征数据完备程度判断,对目标特征数据进行预分类,并通过预分类结果返回到预置的知识图谱模型进行解析,返回给目标终端排名最高的关键问题进行提问,降低了线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院的接诊效率。并且本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
请参阅图2,本发明实施例提供的医疗问诊系统的问答管理方法的另一个流程图,具体包括:
201、从目标终端获取目标特征数据,目标特征数据用于指示目标用户通过目标终端向医疗问诊系统输入的问诊信息。
服务器接收目标终端发送的目标特征数据,该目标特征数据用于指示目标用户通过目标终端向医疗问诊系统输入的问诊信息。其中,问诊信息包括问诊对话文本和目标用户的基础信息,该目标用户的基础信息包括目标用户的年龄信息、目标用户的性别信息以及目标用户的主要诉求信息。
可以理解的是,本发明的执行主体可以为医疗问诊系统的问答管理装置,还可以是服务器,具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。
需要说明的是,在获取目标特征数据时,需要按照字符串匹配的分词方法对各个语句进行切分,其中不同特征对应的自定义分词词表不尽相同,文本集合可以按从左至右按不同字符空格隔开,这里的文本集合即为目标特征数据。
可选的,在步骤201之前,还可以包括神经网络预分类模型的训练过程:
服务器获取多个初始历史问诊单,并对多个初始历史问诊单进行脱敏处理,得到脱敏后的候选历史问诊单;服务器对脱敏后的候选历史问诊单进行特征提取,得到多个候选特征,候选特征至少包括问诊单对话文本、用户年龄信息、用户性别信息、用户的主要诉求信息、医生诊疗处方信息和诊断信息;服务器将多个候选特征确定为预置模板模型的输入数据,将标注过的诊断标签确定为预置模板模型的输出标签,对预置模板模型进行训练;服务器生成预置的神经网络预分类模型,神经网络预分类模型用于对数据进行二分类。
202、调用预置的神经网络预分类模型对目标特征数据进行预分类,判定目标特征数据对应的预分类结果,预分类结果包括第一类数据和第二类数据,第一类数据为问诊信息类型齐全的数据,第二类数据为问诊信息类型缺失的数据。
其中,预分类结果除了包括数据类型,即预分类结果为第一类数据或第二类数据,还包括一个预分类值(分类预测值),服务器可以根据预分类值的大小,判断目标数据的完整程度。当该预分类值大于某一阈值(如第一阈值),会提示收集信息完备(即数据类型齐全)已能完成诊断,并结束问诊。同样,当该预分类值小于某一阈值(同样为第一阈值)时,服务器会提示收集信息不够完备(即数据类型不齐全,缺失),即表明需要调用知识图谱决策树模型生成补充问题并返回到目标用户的目标终端,以使得目标用户对补充问题进行描述,获取更多的问诊信息,其中,补充问题为多个,以便尽可能多的获取需要的问诊信息。
具体的,服务器调用预置的神经网络预分类模型对目标数据进行预分类,确定预分类值;服务器判断预分类值是否大于或等于第一阈值;若预分类值大于或等于第一阈值,则服务器确定目标特征数据对应的预分类结果为第一类数据,第一类数据为问诊信息类型齐全的数据;若预分类值小于第一阈值,则服务器确定目标特征数据对应的预分类结果为第二类数据,第二类数据为问诊信息类型缺失的数据。
需要说明的是,收集信息是否完备(即数据类型是否齐全)的标准是指目标特征数据中存在必要的参数,这些必要的参数包括问诊对话文本、目标用户的年龄信息、目标用户的性别信息、目标用户的主要诉求信息、病例历史信息、关键字信息以及类别标签信息,其中,类别标签信息主要指目标用户可能属于的病种信息,例如,目标用户如果在文本对话中提及关键字“肝”,那么该目标用户可能对应的类别标签包括“肝功能异常”、“内脏功能异常”、“酒精”、“新陈代谢异常”等标签,同一个用户可以对应多个类别标签,具体此处不再赘述。
可选的,调用预置的神经网络预分类模型对目标数据进行预分类,确定预分类值,包括:服务器调用多个预置编码器对目标数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;服务器将多个固定维度的向量输入到预置的神经网络预分类模型中,生成预测向量;服务器对预测向量进行评分,得到目标数据的预分类值。
203、若目标特征数据为第一类数据,则根据第一类数据对预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱。
具体的,若目标特征数据为第一类数据,则服务器确定第一类数据中涉及的问答关键词;服务器根据问答关键词在预置的知识图谱模型的医学知识图谱中确定对应的图谱节点;服务器对医疗知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,剪枝后的医学知识图谱不包含对应的图谱节点。
需要说明的是,这里的剪枝就是将目标特征数据中已获取的问答关键词,从医学知识图谱删除,然后根据删除后的医学知识图谱进行推理,避免在医疗图谱推理过程中出现重复的数据。
204、对剪枝后的医学知识图谱进行决策树解析,得到解析结果。
服务器对剪枝后的医学知识图谱进行决策树解析,得到解析结果。
205、基于解析结果和预置的推荐关系表确定第一诊断建议数据,并将第一诊断建议数据发送至目标终端。
服务器基于解析结果和预置的推荐关系表确定第一诊断建议数据,并将第一诊断建议数据发送至目标终端。例如,当解析结果为糖尿病时,服务器调用预置的推荐关系表,在推荐关系表中查询得到多个糖尿病治疗方案;服务器根据预置评分规则对多个糖尿病治疗方案进行评分,得到对应的多个分值,并根据多个分值按照从大到小的顺序进行排序,得到治疗推荐列表,治疗推荐列表包括多个糖尿病治疗方案;服务器将治疗推荐列表中排序前两名的糖尿病治疗方案发送至目标终端。
206、若目标特征数据为第二类数据,则根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端。
具体的,若目标特征数据为第二类数据,则服务器根据预置的知识图谱决策树模型、第二类数据进行医疗图谱查询,生成多轮补充问题并发送至目标终端。
具体的,当判断收集信息不完备(为第二类数据)时,服务器会将相关用户信息、输出结果和预诊诊断结果作为混合字段输入到医疗图谱查询,图谱查询知识库中最可能的相关问题(即生成多轮补充问题)进行推送。
多轮补充问题会组织成im消息的形式展现在目标终端。将目标用户回答的补充信息,经过实体信息抽取和整合录入进医疗问诊系统的电子病历模块,得到更新后的数据,该更新后的数据包括病征信息、病史信息、年龄等基础信息,具体此处不做限定。
可选的,在步骤206之前,还包括知识图谱决策树模型的构建过程,具体过程如下:
服务器将预置的知识图谱训练数据分成多个样本数据集;服务器调用第一预置公式计算每个数据样本集的纯度,其中,H(X)表示数据样本集合的信息熵,p(x)=pi表示随机变量X发生概率;服务器根据预置公式g(D,A)=H(D)-H(D|A)计算信息增益,得到多个特征信息增益,其中,g(D,A)表示特征A对样本数据集D的信息增益,H(D)表示样本数据集D的不确定度,H(D|A)表示给定条件A下样本数据集D的不确定度;服务器在多个特征信息增益中选择值最大的特征信息增益,确定为目标特征信息增益;服务器根据目标特征信息增益采用ID3算法生成知识图谱决策树模型。
需要说明的是,H(D|A)可以理解为由于特征A使得对样本数据集D的分类的不确定性减少的程度,即信息增益大的特征具有更强的分类能力。
可以理解的是,知识图谱决策树模型的构建过程也可以再步骤201之前进行。
207、根据多轮补充问题的答案和目标特征数据生成电子病历数据。
服务器根据多轮补充问题的答案和目标特征数据生成电子病历数据。
208、调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。
服务器调用神经网络预分类模型对电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至目标终端。
本发明实施例,通过预置的注意力神经网络模型对目标特征数据完备程度判断,对目标特征数据进行预分类,并通过预分类结果返回到预置的知识图谱模型进行解析,返回给目标终端排名最高的关键问题进行提问,降低了线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院的接诊效率。并且本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
上面对本发明实施例中医疗问诊系统的问答管理方法进行了描述,下面对本发明实施例中医疗问诊系统的问答管理装置进行描述,请参阅图3,本发明实施例中医疗问诊系统的问答管理装置的一个实施例包括:
数据获取模块301,用于从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息;
判别模块302,用于调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据;
图谱推理模块303,若所述目标特征数据为所述第一类数据,则用于调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;
图谱树形逻辑模块304,若所述目标特征数据为所述第二类数据,则用于根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;
电子病历模块305,用于根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;
所述判别模块302,还用于调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端。
本发明实施例,通过预置的注意力神经网络模型对目标特征数据完备程度判断,对目标特征数据进行预分类,并通过预分类结果返回到预置的知识图谱模型进行解析,返回给目标终端排名最高的关键问题进行提问,降低了线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院的接诊效率。并且本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
请参阅图4,本发明实施例中医疗问诊系统的问答管理装置的另一个实施例包括:
数据获取模块301,用于从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息;
判别模块302,用于调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据;
图谱推理模块303,若所述目标特征数据为所述第一类数据,则用于调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;
图谱树形逻辑模块304,若所述目标特征数据为所述第二类数据,则用于根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;
电子病历模块305,用于根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;
所述判别模块302,还用于调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端。
可选的,判别模块302包括:
预分类单元3021,用于调用预置的神经网络预分类模型对所述目标数据进行预分类,确定预分类值;
判断单元3022,用于判断所述预分类值是否大于或等于第一阈值;
第一确定单元3023,若所述预分类值大于或等于所述第一阈值,则用于确定所述目标特征数据对应的预分类结果为第一类数据,所述第一类数据为问诊信息类型齐全的数据;
第二确定单元3024,用于若所述预分类值小于所述第一阈值,则用于确定所述目标特征数据对应的预分类结果为第二类数据,所述第二类数据为问诊信息类型缺失的数据。
可选的,预分类单元3021具体用于:
调用多个预置编码器对目标数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,所述固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;将所述多个固定维度的向量输入到所述预置的神经网络预分类模型中,生成预测向量;对所述预测向量进行评分,得到所述目标数据的预分类值。
可选的,图谱推理模块303包括:
剪枝单元3031,用于若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱;
解析单元3032,用于对所述剪枝后的医学知识图谱进行决策树解析,得到解析结果;
确定发送单元3033,用于基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端。
可选的,剪枝单元3031具体用于:
若所述目标特征数据为所述第一类数据,则确定所述第一类数据中涉及的问答关键词;根据所述问答关键词在预置的知识图谱模型的医学知识图谱中确定对应的图谱节点;对所述医疗知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,所述剪枝后的医学知识图谱不包含所述对应的图谱节点。
可选的,确定发送单元3033具体用于:
当解析结果为糖尿病时,调用预置的推荐关系表,在所述推荐关系表中查询得到多个糖尿病治疗方案;根据预置评分规则对所述多个糖尿病治疗方案进行评分,得到对应的多个分值,并根据所述多个分值按照从大到小的顺序进行排序,得到治疗推荐列表,所述治疗推荐列表包括所述多个糖尿病治疗方案;将所述治疗推荐列表中排序前两名的糖尿病治疗方案发送至所述目标终端。
可选的,医疗问诊系统的问答管理装置还包括:
诊单获取模块306,用于获取多个初始历史问诊单,并对所述多个初始历史问诊单进行脱敏处理,得到脱敏后的候选历史问诊单;
特征提取模块307,用于对所述脱敏后的候选历史问诊单进行特征提取,得到多个候选特征,所述候选特征至少包括问诊单对话文本、用户年龄信息、用户性别信息、用户的主要诉求信息、医生诊疗处方信息和诊断信息;
训练模块308,用于将所述多个候选特征确定为预置模板模型的输入数据,将标注过的诊断标签确定为预置模板模型的输出标签,对预置模板模型进行训练;
生成模块309,用于生成预置的神经网络预分类模型,所述神经网络预分类模型用于对数据进行二分类。
本发明实施例,通过预置的注意力神经网络模型对目标特征数据完备程度判断,对目标特征数据进行预分类,并通过预分类结果返回到预置的知识图谱模型进行解析,返回给目标终端排名最高的关键问题进行提问,降低了线上误诊率,节省互联网医院接诊时间,提高了单位时间内互联网医院的接诊效率。并且本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
上面图3至图4从模块化功能实体的角度对本发明实施例中的医疗问诊系统的问答管理装置进行详细描述,下面从硬件处理的角度对本发明实施例中医疗问诊系统的问答管理设备进行详细描述。
图5是本发明实施例提供的一种医疗问诊系统的问答管理设备的结构示意图,该医疗问诊系统的问答管理设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)510(例如,一个或一个以上处理器)和存储器520,一个或一个以上存储应用程序533或数据532的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器520和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对医疗问诊系统的问答管理设备500中的一系列指令操作。更进一步地,处理器510可以设置为与存储介质530通信,在医疗问诊系统的问答管理设备500上执行存储介质530中的一系列指令操作。
医疗问诊系统的问答管理设备500还可以包括一个或一个以上电源540,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口560,和/或,一个或一个以上操作系统531,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5示出的医疗问诊系统的问答管理设备结构并不构成对医疗问诊系统的问答管理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。处理器510可以执行上述实施例中数据获取模块301、判别模块302、图谱推理模块303、图谱树形逻辑模块304、电子病历模块305、诊单获取模块306、特征提取模块307、训练模块308和生成模块309的功能。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质可以为非易失性计算机可读存储介质,该计算机可读存储介质也可以为易失性计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在计算机上运行时,使得计算机执行所述医疗问诊系统的问答管理方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种医疗问诊系统的问答管理方法,其特征在于,包括:
从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息,所述问诊信息包括问诊对话文本和所述目标用户的基础信息,所述基础信息包括所述目标用户的年龄信息、性别信息以及主要诉求信息;
调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据,所述问诊信息类型齐全的数据包括所述问诊对话文本、所述目标用户的年龄信息、性别信息、主要诉求信息、病例历史信息、关键字信息以及类别标签信息;
若所述目标特征数据为所述第一类数据,则调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;
若所述目标特征数据为所述第二类数据,则根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;
根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;
调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端;
所述调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据,包括:
调用预置的神经网络预分类模型对所述目标特征数据进行预分类,确定预分类值;
判断所述预分类值是否大于或等于第一阈值;
若所述预分类值大于或等于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第一类数据,所述第一类数据为问诊信息类型齐全的数据;
若所述预分类值小于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第二类数据,所述第二类数据为问诊信息类型缺失的数据;
所述调用预置的神经网络预分类模型对所述目标特征数据进行预分类,确定预分类值,包括:
调用多个预置编码器对目标特征数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,所述固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;
将所述多个固定维度的向量输入到所述预置的神经网络预分类模型中,生成预测向量;
对所述预测向量进行评分,得到所述目标特征数据的预分类值。
2.根据权利要求1所述的医疗问诊系统的问答管理方法,其特征在于,所述若所述目标特征数据为所述第一类数据,则调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端,包括:
若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱;
对所述剪枝后的医学知识图谱进行决策树解析,得到解析结果;
基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端。
3.根据权利要求2所述的医疗问诊系统的问答管理方法,其特征在于,所述若所述目标特征数据为所述第一类数据,则根据所述第一类数据对所述预置的知识图谱模型中医学知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,包括:
若所述目标特征数据为所述第一类数据,则确定所述第一类数据中涉及的问答关键词;
根据所述问答关键词在预置的知识图谱模型的医学知识图谱中确定对应的图谱节点;
对所述医疗知识图谱进行剪枝操作,得到剪枝后的医学知识图谱,所述剪枝后的医学知识图谱不包含所述对应的图谱节点。
4.根据权利要求2所述的医疗问诊系统的问答管理方法,其特征在于,所述基于所述解析结果和预置的推荐关系表确定第一诊断建议数据,并将所述第一诊断建议数据发送至所述目标终端,包括:
当解析结果为糖尿病时,调用预置的推荐关系表,在所述推荐关系表中查询得到多个糖尿病治疗方案;
根据预置评分规则对所述多个糖尿病治疗方案进行评分,得到对应的多个分值,并根据所述多个分值按照从大到小的顺序进行排序,得到治疗推荐列表,所述治疗推荐列表包括所述多个糖尿病治疗方案;
将所述治疗推荐列表中排序前两名的糖尿病治疗方案发送至所述目标终端。
5.根据权利要求1-4中任一项所述的医疗问诊系统的问答管理方法,其特征在于,在所述从目标终端获取目标特征数据之前,所述医疗问诊系统的问答管理方法还包括:
获取多个初始历史问诊单,并对所述多个初始历史问诊单进行脱敏处理,得到脱敏后的候选历史问诊单;
对所述脱敏后的候选历史问诊单进行特征提取,得到多个候选特征,所述候选特征至少包括问诊单对话文本、用户年龄信息、用户性别信息、用户的主要诉求信息、医生诊疗处方信息和诊断信息;
将所述多个候选特征确定为预置模板模型的输入数据,将标注过的诊断标签确定为预置模板模型的输出标签,对预置模板模型进行训练;
生成预置的神经网络预分类模型,所述神经网络预分类模型用于对数据进行二分类。
6.一种医疗问诊系统的问答管理装置,其特征在于,包括:
数据获取模块,用于从目标终端获取目标特征数据,所述目标特征数据用于指示目标用户通过所述目标终端向医疗问诊系统输入的问诊信息,所述问诊信息包括问诊对话文本和所述目标用户的基础信息,所述基础信息包括所述目标用户的年龄信息、性别信息以及主要诉求信息;
判别模块,用于调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据,所述问诊信息类型齐全的数据包括所述问诊对话文本、所述目标用户的年龄信息、性别信息、主要诉求信息、病例历史信息、关键字信息以及类别标签信息;
图谱推理模块,若所述目标特征数据为所述第一类数据,则用于调用预置的知识图谱模型和所述第一类数据进行医疗图谱推理,生成第一诊断建议数据并发送至所述目标终端;
图谱树形逻辑模块,若所述目标特征数据为所述第二类数据,则用于根据预置的知识图谱决策树模型、所述第二类数据进行医疗图谱查询,生成多轮补充问题并发送至所述目标终端;
电子病历模块,用于根据所述多轮补充问题的答案和所述目标特征数据生成电子病历数据;
所述判别模块,还用于调用所述神经网络预分类模型对所述电子病历数据重新进行预分类处理,直至生成第二诊断建议数据并发送至所述目标终端;
所述调用预置的神经网络预分类模型对所述目标特征数据进行预分类,判定所述目标特征数据对应的预分类结果,所述预分类结果包括第一类数据和第二类数据,所述第一类数据为问诊信息类型齐全的数据,所述第二类数据为问诊信息类型缺失的数据,包括:
调用预置的神经网络预分类模型对所述目标特征数据进行预分类,确定预分类值;
判断所述预分类值是否大于或等于第一阈值;
若所述预分类值大于或等于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第一类数据,所述第一类数据为问诊信息类型齐全的数据;
若所述预分类值小于所述第一阈值,则确定所述目标特征数据对应的预分类结果为第二类数据,所述第二类数据为问诊信息类型缺失的数据;
所述调用预置的神经网络预分类模型对所述目标特征数据进行预分类,确定预分类值,包括:
调用多个预置编码器对目标特征数据进行固定长度编码,生成多个固定维度的向量,其中,多个预置编码器包括纯文本编码器、病例历史编码器、用户信息编码器、重点关键字编码器和类别标签编码器,所述固定维度的向量包括用户基础信息向量、历史信息向量和当前问诊主要诉求信息向量;
将所述多个固定维度的向量输入到所述预置的神经网络预分类模型中,生成预测向量;
对所述预测向量进行评分,得到所述目标特征数据的预分类值。
7.一种医疗问诊系统的问答管理设备,其特征在于,所述医疗问诊系统的问答管理设备包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;
所述至少一个处理器调用所述存储器中的所述指令,以使得所述医疗问诊系统的问答管理设备执行如权利要求1-5中任意一项所述的医疗问诊系统的问答管理方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被处理器执行时实现如权利要求1-5中任意一项所述的医疗问诊系统的问答管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010884354.2A CN112035636B (zh) | 2020-08-28 | 2020-08-28 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
PCT/CN2021/084651 WO2022041727A1 (zh) | 2020-08-28 | 2021-03-31 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010884354.2A CN112035636B (zh) | 2020-08-28 | 2020-08-28 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112035636A CN112035636A (zh) | 2020-12-04 |
CN112035636B true CN112035636B (zh) | 2023-06-02 |
Family
ID=73586120
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010884354.2A Active CN112035636B (zh) | 2020-08-28 | 2020-08-28 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112035636B (zh) |
WO (1) | WO2022041727A1 (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112035636B (zh) * | 2020-08-28 | 2023-06-02 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
CN112786182B (zh) * | 2020-12-31 | 2024-05-10 | 深圳平安智慧医健科技有限公司 | 智能导诊方法、装置、电子设备及存储介质 |
CN112749286A (zh) * | 2021-01-26 | 2021-05-04 | 北京搜狗科技发展有限公司 | 知识图谱的构建和使用方法、装置和介质 |
CN112768091A (zh) * | 2021-01-26 | 2021-05-07 | 北京搜狗科技发展有限公司 | 一种问诊信息处理方法、装置和介质 |
CN113222408A (zh) * | 2021-05-12 | 2021-08-06 | 康键信息技术(深圳)有限公司 | 在线问诊业务监控方法、装置、设备及存储介质 |
CN113257407A (zh) * | 2021-05-31 | 2021-08-13 | 康键信息技术(深圳)有限公司 | 医疗公众号消息的处理方法、装置、设备及存储介质 |
CN113221570B (zh) * | 2021-05-31 | 2024-07-26 | 康键信息技术(深圳)有限公司 | 基于线上问诊信息的处理方法、装置、设备及存储介质 |
CN113792163B (zh) * | 2021-08-09 | 2022-12-27 | 北京达佳互联信息技术有限公司 | 多媒体推荐方法、装置、电子设备及存储介质 |
CN113707286A (zh) * | 2021-08-30 | 2021-11-26 | 康键信息技术(深圳)有限公司 | 基于决策树的问诊分配方法、装置、设备及存储介质 |
CN114300160B (zh) * | 2021-11-16 | 2022-10-18 | 北京左医科技有限公司 | 问诊对话方法及系统 |
CN114155965A (zh) * | 2021-12-13 | 2022-03-08 | 首都医科大学附属北京安贞医院 | 一种基于人机交互的高血压慢病管理智能服务系统 |
CN114566295A (zh) * | 2022-03-04 | 2022-05-31 | 康键信息技术(深圳)有限公司 | 线上问诊方法、装置、设备及存储介质 |
CN114692486B (zh) * | 2022-03-10 | 2024-03-15 | 中国科学技术大学 | 一种基于用户反馈知识图谱的产品优化设计方法 |
CN114629867A (zh) * | 2022-03-22 | 2022-06-14 | 康键信息技术(深圳)有限公司 | 在线问诊即时通讯系统和消息处理方法 |
CN114743656A (zh) * | 2022-04-13 | 2022-07-12 | 北京京东拓先科技有限公司 | 一种医疗问诊派单的实现方法及装置 |
CN114925160B (zh) * | 2022-04-18 | 2024-06-21 | 北京急救中心 | 一种基于知识图谱技术的院前急救指导推荐系统和方法 |
CN114925833B (zh) * | 2022-04-20 | 2023-07-21 | 中国人民解放军91977部队 | 一种基于能力数据底图的目标状态规律知识挖掘方法 |
CN114664458A (zh) * | 2022-04-26 | 2022-06-24 | 平安科技(深圳)有限公司 | 患者分类装置、计算机设备及存储介质 |
CN115631852B (zh) * | 2022-11-02 | 2024-04-09 | 北京大学重庆大数据研究院 | 证型推荐方法、装置、电子设备及非易失性存储介质 |
CN115982335B (zh) * | 2023-02-14 | 2024-06-18 | 智慧眼科技股份有限公司 | 一种主动式ai医疗问答系统、方法、设备及存储介质 |
CN115831356B (zh) * | 2023-02-20 | 2024-02-27 | 中国海洋大学 | 一种基于人工智能算法的辅助预测诊断方法 |
CN117493681B (zh) * | 2023-11-15 | 2024-05-14 | 无锡胤兴智创科技有限公司 | 一种基于云计算的智慧医疗信息推送系统及方法 |
CN117708306B (zh) * | 2024-02-06 | 2024-05-03 | 神州医疗科技股份有限公司 | 基于层进式问答结构的医学问答架构生成方法及系统 |
CN118197572A (zh) * | 2024-02-06 | 2024-06-14 | 海南大学 | 一种基于多轮对话的可解释问诊分诊方法及相关设备 |
CN118041700B (zh) * | 2024-04-12 | 2024-06-18 | 江西曼荼罗软件有限公司 | 一种医疗知识分发方法及系统 |
CN118116620A (zh) * | 2024-04-28 | 2024-05-31 | 支付宝(杭州)信息技术有限公司 | 一种医疗问答方法、装置和电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9542447B1 (en) * | 2015-10-13 | 2017-01-10 | International Business Machines Corporation | Supplementing candidate answers |
CN109284363A (zh) * | 2018-12-03 | 2019-01-29 | 北京羽扇智信息科技有限公司 | 一种问答方法、装置、电子设备及存储介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9646079B2 (en) * | 2012-05-04 | 2017-05-09 | Pearl.com LLC | Method and apparatus for identifiying similar questions in a consultation system |
US9965548B2 (en) * | 2013-12-05 | 2018-05-08 | International Business Machines Corporation | Analyzing natural language questions to determine missing information in order to improve accuracy of answers |
CN105912846A (zh) * | 2016-04-07 | 2016-08-31 | 南京小网科技有限责任公司 | 基于云计算和医学知识库技术的智能医疗辅助决策系统 |
CN107992543B (zh) * | 2017-11-27 | 2020-11-17 | 上海智臻智能网络科技股份有限公司 | 问答交互方法和装置、计算机设备及计算机可读存储介质 |
CN109559830A (zh) * | 2018-09-30 | 2019-04-02 | 西南医科大学附属医院 | 基于医学标准问题库的智能检验咨询系统及其实现方法 |
CN109522395A (zh) * | 2018-10-12 | 2019-03-26 | 平安科技(深圳)有限公司 | 自动问答方法及装置 |
CN110008324A (zh) * | 2019-03-29 | 2019-07-12 | 上海大易云计算股份有限公司 | 一种基于自然语义分析的招聘聊天方法及系统 |
CN110390003A (zh) * | 2019-06-19 | 2019-10-29 | 北京百度网讯科技有限公司 | 基于医疗的问答处理方法及系统、计算机设备及可读介质 |
CN111475628B (zh) * | 2020-03-30 | 2023-07-14 | 珠海格力电器股份有限公司 | 会话数据处理方法、装置、计算机设备和存储介质 |
CN111460124B (zh) * | 2020-04-21 | 2023-08-25 | 文思海辉智科科技有限公司 | 智能交互方法、装置及机器人 |
CN112035636B (zh) * | 2020-08-28 | 2023-06-02 | 康键信息技术(深圳)有限公司 | 医疗问诊系统的问答管理方法、装置、设备及存储介质 |
-
2020
- 2020-08-28 CN CN202010884354.2A patent/CN112035636B/zh active Active
-
2021
- 2021-03-31 WO PCT/CN2021/084651 patent/WO2022041727A1/zh active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9542447B1 (en) * | 2015-10-13 | 2017-01-10 | International Business Machines Corporation | Supplementing candidate answers |
CN109284363A (zh) * | 2018-12-03 | 2019-01-29 | 北京羽扇智信息科技有限公司 | 一种问答方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112035636A (zh) | 2020-12-04 |
WO2022041727A1 (zh) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112035636B (zh) | 医疗问诊系统的问答管理方法、装置、设备及存储介质 | |
Zhang et al. | The gap of semantic parsing: A survey on automatic math word problem solvers | |
US5671333A (en) | Training apparatus and method | |
KR102256240B1 (ko) | 논팩토이드형 질의 응답 시스템 및 방법 | |
CN111708873A (zh) | 智能问答方法、装置、计算机设备和存储介质 | |
Kazi et al. | Medchatbot: An umls based chatbot for medical students | |
CN111078837A (zh) | 智能问答信息处理方法、电子设备及计算机可读存储介质 | |
US20030212663A1 (en) | Neural network feedback for enhancing text search | |
CN116719520B (zh) | 代码生成方法及装置 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
CN112579666A (zh) | 智能问答系统和方法及相关设备 | |
CN117909466A (zh) | 领域问答系统、构造方法、电子设备及存储介质 | |
CN112199958A (zh) | 概念词序列生成方法、装置、计算机设备及存储介质 | |
CN113868406B (zh) | 搜索方法、系统、计算机可读存储介质 | |
CN114218378A (zh) | 一种基于知识图谱的内容推送方法、装置、设备及介质 | |
Sarkar et al. | NLP algorithm based question and answering system | |
CN112507139B (zh) | 基于知识图谱的问答方法、系统、设备及存储介质 | |
CN116303922B (zh) | 咨询消息应答方法、装置、计算机设备、存储介质和产品 | |
CN117131383A (zh) | 一种提高双塔模型搜索精排性能的方法 | |
CN116089592A (zh) | 一种开放域多答案问答的实现方法、设备及存储介质 | |
CN115269797A (zh) | 面向知识社区模糊问题的答案推荐方法及系统 | |
CN111428002B (zh) | 一种自然语言人机交互式的智能问答实现方法 | |
CN116414940A (zh) | 标准问题的确定方法、装置及相关设备 | |
Lichtblau et al. | Authorship attribution using the chaos game representation | |
JP2021111075A (ja) | 対話システムおよび文章生成装置の構成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |