CN110136839A - 一种症状信息处理方法、装置和电子设备 - Google Patents

一种症状信息处理方法、装置和电子设备 Download PDF

Info

Publication number
CN110136839A
CN110136839A CN201910397405.6A CN201910397405A CN110136839A CN 110136839 A CN110136839 A CN 110136839A CN 201910397405 A CN201910397405 A CN 201910397405A CN 110136839 A CN110136839 A CN 110136839A
Authority
CN
China
Prior art keywords
symptom
inquiry
information
default
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910397405.6A
Other languages
English (en)
Other versions
CN110136839B (zh
Inventor
夏源
施振辉
陆超
黄海峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201910397405.6A priority Critical patent/CN110136839B/zh
Publication of CN110136839A publication Critical patent/CN110136839A/zh
Application granted granted Critical
Publication of CN110136839B publication Critical patent/CN110136839B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Molecular Biology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Evolutionary Computation (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种症状信息处理方法、装置和电子设备,该方法包括:接收用户输入信息,并识别所述输入信息中的输入症状信息;根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。本发明实施例可以提高询问的准确性。

Description

一种症状信息处理方法、装置和电子设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种症状信息处理方法、装置和电子设备。
背景技术
随着人工智能技术的发展,人工智能技术在人们的生活中应用的范围也越来越广泛。例如:人工智能技术可以应用于智能询问领域,使得用户可以直接完成智能询问。
在实际运用中,在通过智能询问时,一般是基于传统的概率图模型(Probabilistic Graphical Model,PGM)与信息增益(Information Gain)的方法进行模拟询问过程。但是,该方法推理计算的时间较长,复杂度较高,且需要专家人工标注。若无人工标注,易导致询问的准确度较低。可见,当前询问的准确度较低。
发明内容
本发明实施例提供一种症状信息处理方法、装置和电子设备,以解决当前询问的准确度较低的问题。
第一方面,本发明实施例提供了一种症状信息处理方法,包括:
接收用户输入信息,并识别所述输入信息中的输入症状信息;
根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
可选的,所述根据预设询问策略识别所述输入症状信息对应的症状询问信息,包括:
根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状;
若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
可选的,所述接收用户输入信息,并识别所述输入信息中的输入症状信息,包括:
接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
可选的,所述预设神经网络语言模型为根据所述预设网络模型生成的医学实体数据进行训练得到。
可选的,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
可选的,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
第二方面,本发明实施例还提供一种症状信息处理装置,包括:
第一识别模块,用于接收用户输入信息,并识别所述输入信息中的输入症状信息;
第二识别模块,用于根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
输出模块,用于向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
可选的,所述第二识别模块包括:
询问子模块,用于根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
更新子模块,用于基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状,其中,i为正整数;
执行子模块,用于若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
可选的,所述第一识别模块还用于接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
可选的,所述预设神经网络为根据所述预设网络模型生成的医学实体数据进行训练得到。
可选的,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
可选的,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
第三方面,本发明实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种症状信息处理方法中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种症状信息处理方法中的步骤。
本发明实施例中,接收用户输入信息,并识别所述输入信息中的输入症状信息;根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。这样,通过预设询问策略可以准确的识别症状询问信息,从而提高询问的准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种症状信息处理方法的流程图;
图2是本发明实施例提供的另一种症状信息处理方法的流程图;
图3是本发明实施例提供的一种举例图;
图4是本发明实施例提供的一种症状信息处理装置的结构示意图;
图5是本发明实施例提供的另一种症状信息处理装置的结构示意图;
图6是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书中的术语“包括”以及它的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,说明书以及权利要求中使用“和/或”表示所连接对象的至少其中之一,例如A和/或B,表示包含单独A,单独B,以及A和B都存在三种情况。
在本发明实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本发明实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
参见图1,图1是本发明实施例提供的一种症状信息处理方法的流程图,如图1所示,包括以下步骤:
步骤101、接收用户输入信息,并识别所述输入信息中的输入症状信息。
其中,输入信息的具体类型在此不做限定,例如:输入信息可以为文本信息,也可以为语音信息。另外,输入信息也可以被称作为主诉。
例如:用户的输入信息可以为“我今天咳嗽头疼肚子疼,是不是感冒了”,则可以识别出上述输入信息中的输入症状信息为“咳嗽”、“头疼”和“肚子疼”。
步骤102、根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型(Neural Network Language Model)训练得到。
其中,根据预设询问策略可以识别确定输入症状信息对应的症状询问信息,例如:若输入症状信息为头疼,则该输入症状信息对应的症状询问信息可以为是否发烧,即症状询问信息与输入症状信息具有相关性。若输入症状信息为头疼所对应的症状询问信息为家乡是哪儿,则很明显此时输入症状信息与症状询问信息之间的相关性较小。
由于根据预设询问策略可以识别输入症状信息对应的症状询问信息,因此症状询问信息与输入症状信息的相关性较高,从而可以提高询问的准确程度。
其中,预设询问策略根据预设神经网络语言模型训练得到,预设神经网络语言模型可以通过获取医生与患者之间的询问信息流,并且根据预设神经网络语言模型根据多个询问信息流进行多次训练,从而可以得到上述预设询问策略。
例如:可以获取每一个询问信息流中的主诉以及医生根据患者的主诉给出的询问信息对预设神经网络语言模型训练,从而得到上述预设询问策略。
步骤103、向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
其中,用户针对症状询问信息返回的症状答复信息一般可以为是或者否。
其中,步骤103可以是向用户的用户终端(例如:手机)或者客户端发送上述症状询问信息,并接收用户的用户终端或者客户端返回的症状答复信息,其中,上述症状答复信息可以是用户针对上述症状询问信息输入的答复信息,例如:在步骤101中可以接收到用户的输入症状信息为:头疼,则在步骤103中向用户发送的症状询问信息可以为是否发烧,若用户针对该症状询问信息输入的答复信息为是,则下一步向用户的用户终端或者客户端发送的症状询问信息可以为是否咳嗽。
这样,预设询问策略根据预设神经网络语言模型训练得到,根据预设询问策略识别症状询问信息,且向用户的用户终端或者客户端发送症状询问信息,由于预设神经网络语言模型可以根据用户的输入症状信息准确的识别症状询问信息,从而使得症状询问信息与用户的输入症状信息的相关性较高,即提高了询问的准确度。
另外,本发明实施例提供的上述方法还可以根据所述症状答复信息确定所述输入信息对应的疾病特征。
其中,根据症状答复信息确定输入信息对应的疾病特征,例如:根据用户的输入信息中的输入症状信息以及症状答复信息,可以判断上述输入信息对应的疾病特征为某一疾病特症,则可以确定该输入信息对应的疾病特征为上述某一疾病特征。
另外,还可以将疾病特征告知用户,告知方式可以为通过语音告知,也可以为直接显示上述疾病特征。
另外,根据症状答复信息确定输入信息对应的疾病特征,可以是根据症状答复信息对应的轮数,其中,上述轮数为询问轮数(即发出了N次症状询问信息,则此时轮数为N轮),当轮数超过预设轮数值时,此时可以确定疾病特征,上述疾病特征为综合前几轮症状询问信息和症状答复信息所能够确定的疾病特征。
本发明实施例中,接收用户输入信息,并识别所述输入信息中的输入症状信息;根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。这样,通过预设询问策略可以准确的识别症状询问信息,从而提高询问的准确度。
参见图2,图2是本发明实施例提供的另一种症状信息处理方法的流程图。如图2所示,包括以下步骤:
步骤201、接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
其中,预设网络模型的具体类型在此不做限定,例如:预设网络模型的具体类型可以基于双向长短期记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)+注意力机制(Attention)+条件随机场(conditional random field,CRF)算法实现;当然,预设网络模型的具体类型也可以基于Bi-LSTM+CRF算法实现。
需要说明的是,预设网络模型采用上述类型,与现有的神经网络的类型相比,由于上述类型在进行分词处理时,考虑到了词与词之间的顺序关系,从而使得对于语义的表达更为准确。另外,网络模型中基于长短期记忆网络(LSTM)实现,则可以有效的解决现有技术中存在的梯度爆炸(gradient explosion)和梯度弥散(gradient vanishing)的问题,使得预设网络模型训练时更加稳定。
其中,包括医学实体数据的自然语言训练样本可以包括医学书籍、医学文献、医学报告和医学百科知识等,而包括医学实体数据的自然语言训练样本可以存储在医疗数据库中。由于上述自然语言训练样本一般均是经过相关医学专家精心编撰的,这些数据的准确度以及专业度均较高,因此,采用上述自然语言训练样本来训练预设网络模型,可以使得预设网络模型在对用户输入信息进行分词处理时,可以较为准确的识别用户输入信息中的医学实体。
另外,用户输入信息中的医学实体可以包括但不限于以下内容:症状、疾病、检查、检验、手术和药品等。
作为一种可选的方式,所述预设神经网络语言模型为根据所述预设网络模型生成的医学实体数据进行训练得到。
其中,采用上述通过预设网络模型对上述自然语言训练样本分词处理之后生成的医学实体来训练预设神经网络语言模型,同样,由于上述自然语言训练样本的准确度以及专业度较高,以及预设网络模型对于医学实体数据识别的准确度也较高,从而可以提高预设神经网络语言模型在预测下一个医学实体的准确度。
另外,预设神经网络语言模型可以基于单向长短期记忆网络的方式实现,当然,也可以基于双向长短期记忆网络的方式实现。
另外,采用无监督的神经网络语言模型对上述医学实体数据进行训练,从而可以得到上述预设神经网络语言模型。
本实施方式中,预设神经网络语言模型为根据预设网络模型生成的医学实体数据进行训练得到,可以使得预设神经网络语言模型在训练时得到最优的预设询问策略,减少询问轮数。
作为另一种可选的方式,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出的询问信息,所述预设症状信息是以所述预设神经网络语言模型作为采样器(sampler)获取到的症状信息。
其中,预设神经网络语言模型可以作为强化学习(Q-learning)探索动作空间(action space)时的采样器。
其中,预设症状信息可以为一个询问信息流中患者给出的主诉(即输入症状信息),而与预设症状信息对应的询问信息可以为上述询问信息流中包括的询问信息。
需要说明的是,本实施方式同样可以运用于第一个实施例中。
这样,从多个询问策略中确定目标询问策略,且根据目标询问策略提出询问信息,从而提高了症状询问信息的准确度。
其中,作为一种可选的方式,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
其中,上述预设参数也可以为每一个症状答复信息所对应的奖励值。当询问轮数较多时,则从第一次询问至最后一次询问,所输出的症状答复信息对应的奖励值之和最大的询问策略即为目标询问策略。
另外,在询问策略判断是否满足预设条件时,也可以结合判断询问轮数和预设参数的取值。
需要说明的是,本实施方式同样可以运用于第一个实施例中。
这样,由于预设条件可以包括预设参数的取值以及询问轮数,从而使得预设条件更加灵活,进而提高了确定目标询问策略的灵活性。
由于预设神经网络语言模型为根据预设网络模型生成的医学实体数据进行训练得到,所以采用预设神经网络语言模型代替随机采样器作为强化学习在贪心(ε-greedy)算法中的采样器,即通过预设神经网络语言模型搜索候选空间,也可以称作为探索动作空间(action space),此时预设神经网络语言模型具有引导作用,可以快速的收敛,并且不断的最大化奖励函数值,从而可以得到预设询问策略。
需要说明的是,预设神经网络语言模型在强化学习中考虑到了询问逻辑,在保证准确率的情况下,优化了询问体验。
例如:在训练的过程中,针对一次模拟询问,用户给出症状输入信息(即第一个症状触发词),则此时预设神经网络语言模型针对症状输入信息给出症状询问信息,若用户针对该症状询问信息的回答为是,则此时调高奖励值,若用户针对该症状询问信息的回答为否,则调低奖励值或者不调整奖励值。预设神经网络语言模型给出下一次的症状询问信息,并同样根据用户针对该症状询问信息的答复确定奖励值。重复执行上述步骤,可以得到多个询问策略,并可以从多个询问策略中得到最优的询问策略作为预设询问策略,需要说明的是,上述奖励值可以根据奖励函数确定。
步骤202、根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到。
现有技术中,在进行智能询问时,识别了输入症状信息之后,输出的症状询问信息为随机的,也就是说症状询问信息与输入症状信息之间的相关性较小,即通过根据用户的输入症状信息,输出针对上述输入症状信息的症状询问信息的准确度较低,从而完成交互询问的时间较长。
这样,由于根据预设询问策略可以识别输入症状信息对应的症状询问信息,因此症状询问信息与输入症状信息的相关性较高,即提高了输出的症状询问信息的准确度。
步骤203、向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
其中,用户针对症状询问信息返回的症状答复信息一般可以为是或者否。
作为一种可选的实现方式,所述根据预设询问策略识别所述输入症状信息对应的症状询问信息,包括:
根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状;
若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
其中,上述输入症状信息属于多个症状中的一个,而用户针对症状询问信息返回的症状答复信息一般可以为是或者否。
其中,确定预设参数的取值,具体可以为调高或者调低预设参数的取值,当然,需要说明的是,当症状答复信息否定其对应的输入症状信息时,则可以不调整预设参数的取值。上述预设参数可以为奖励函数中的奖励值。
另外,作为一种可选的实施方式,若所述预设参数的取值大于预设阈值,则基于所述症状集合当前所包括的症状,确定所述输入信息对应的疾病特征。其中,预设阈值的取值在此不做限定。
例如:根据用户输入信息中的输入症状信息以及预设询问策略,可以识别上述输入症状信息对应的一个症状集合如S(s1,s2,…sn),并可以给出下一次的症状询问信息a,并且上述a属于症状集合中未询问过的症状,即a(a∈Sunknown,Sunknown代表当前还没有被询问的症状结合),用户可以针对该症状询问信息作出相应的症状答复,并将症状答复信息返回。根据用户的症状答复信息可以更新症状集合,以及调整预设参数的取值,同时可以判断预设参数的取值是否大于预设阈值,根据不同的判断结果可以确定时执行继续输出症状询问信息还是可以直接确定疾病特征。当确定疾病特征时,还可以给出交互的流程,如输入症状信息和症状答复信息的顺序等。
本实施方式中,当预设参数的取值大于预设阈值时,确定疾病特征,由于预设参数的取值大于预设阈值时,说明此时确定的疾病特征与用户的输入信息的匹配度较高,即根据用户的输入信息确定的疾病特征的准确度较高。
本发明实施例中,通过步骤201至203,由于根据预设网络模型对输入信息进行分词处理之后,可以更加准确的确定输入信息中的输入症状信息,从而可以提高输出的症状询问信息的准确度。
参见图3,下面以一个举例具体说明上述实施例。
预配置过程:
电子设备可以从医疗问诊信息流对话数据库中获取相关医学数据(即存储有医生与患者之间的询问信息流、医学报告和医学百科等的数据库),其中,电子设备包括医疗实体分词模块、神经网络语言训练模块和强化学习模块;
医疗实体分词模块获取上述医学数据,并对上述医学数据进行分词处理,以得到各医疗实体;采用上述各医疗实体来训练神经网络语言训练模块,以得到神经网络语言模型,并可以将神经网络语言模型作为采样器,以训练智能体(agent)的策略(Q*函数);
强化学习模块采用上述医学数据进行强化学习,以得到智能体(agent)当前的最优策略;
询问过程:
电子设备中接收到用户的输入信息,并识别输入信息中的输入症状信息;
电子设备选择询问策略,例如可以选择上述最优策略输出症状询问信息;
接收用户的症状答复信息,并根据症状答复信息更新症状集合,以及奖励值;
判断是否满足预设条件,当满足预设条件时,输出询问结果;当不满足预设条件时,重复执行接收用户的症状答复信息,并根据症状答复信息更新症状集合,以及奖励值的步骤直到满足预设条件;
其中,预设条件可以包括:询问轮数大于预设轮数,或者奖励值大于预设阈值。
本发明实施例同样可以提高询问的准确度。
参见图4,图4是本发明实施例提供的症状信息处理装置的结构图,能实现上述实施例中症状信息处理方法的细节,并达到相同的效果。如图4所示,症状信息处理装置400包括:
第一识别模块401,用于接收用户输入信息,并识别所述输入信息中的输入症状信息;
第二识别模块402,用于根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
输出模块403,用于向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
可选的,参见图5,所述第二识别模块402包括:
询问子模块4021,用于根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
更新子模块4022,用于基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状,其中,i为正整数;
执行子模块4023,用于若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
可选的,所述第一识别模块401还用于接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
可选的,所述预设神经网络为根据所述预设网络模型生成的医学实体数据进行训练得到。
可选的,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
可选的,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
本发明实施例提供的症状信息处理装置400能够实现图1至图2的方法实施例中症状信息处理装置实现的各个过程,为避免重复,这里不再赘述。本发明实施例同样可以提高询问的准确度。
请参见图6,图6是本发明实施例提供的一种电子设备的结构图,该电子设备包括多核处理器,如图6所示,电子设备600包括处理器601、存储器602及存储在所述存储器602上并可在所述处理器上运行的计算机程序。
其中,所述计算机程序被所述处理器601执行时实现如下步骤:
接收用户输入信息,并识别所述输入信息中的输入症状信息;
根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
可选的,处理器601执行的所述根据预设询问策略识别所述输入症状信息对应的症状询问信息,包括:
根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状;
若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
可选的,处理器601执行的所述接收用户输入信息,并识别所述输入信息中的输入症状信息,包括:
接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
可选的,所述预设神经网络语言模型为根据所述预设网络模型生成的医学实体数据进行训练得到。
可选的,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
可选的,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
本发明实施例提供的电子设备能够实现图1和图2所示的方法实施例中电子设备实现的各个过程,且可以达到相同有益效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例提供的症状信息处理的方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (14)

1.一种症状信息处理方法,其特征在于,包括:
接收用户输入信息,并识别所述输入信息中的输入症状信息;
根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
2.如权利要求1所述的方法,其特征在于,所述根据预设询问策略识别所述输入症状信息对应的症状询问信息,包括:
根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状;
若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
3.如权利要求1所述的方法,其特征在于,所述接收用户输入信息,并识别所述输入信息中的输入症状信息,包括:
接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
4.如权利要求3所述的方法,其特征在于,所述预设神经网络语言模型为根据所述预设网络模型生成的医学实体数据进行训练得到。
5.如权利要求1至4中任一项所述的方法,其特征在于,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
6.如权利要求5所述的方法,其特征在于,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
7.一种症状信息处理装置,其特征在于,包括:
第一识别模块,用于接收用户输入信息,并识别所述输入信息中的输入症状信息;
第二识别模块,用于根据预设询问策略识别所述输入症状信息对应的症状询问信息,其中,所述预设询问策略根据预设神经网络语言模型训练得到;
输出模块,用于向所述用户输出所述症状询问信息,以得到所述用户针对所述症状询问信息返回的症状答复信息。
8.如权利要求7所述的症状信息处理装置,其特征在于,所述第二识别模块包括:
询问子模块,用于根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息,其中,所述症状集合包括多个症状,i为正整数;
更新子模块,用于基于第i个症状答复信息确定预设参数的取值,并更新所述症状集合,其中,若所述第i个症状答复信息肯定第i个输入症状信息则调高所述预设参数的取值,且在所述症状集合保留所述第i个输入症状信息对应的第i个症状,若所述第i个症状答复信息否定第i个输入症状信息则调低或不调所述预设参数的取值,且在所述症状集合删除所述第i个输入症状信息对应的第i个症状,i为正整数;
执行子模块,用于若所述预设参数的取值小于或者等于预设阈值,则i取值加1,并重复执行所述根据预设询问策略识别所述输入症状信息对应的症状集合,以及确定所述症状集合的第i个症状对应的第i个症状询问信息的步骤直到所述预设参数的取值大于预设阈值。
9.如权利要求7所述的症状信息处理装置,其特征在于,所述第一识别模块还用于接收用户输入信息,并根据预设网络模型对所述用户输入信息进行分词处理,以识别所述用户输入信息中的医学实体,并将所述识别的医学实体作为输入症状信息,其中,所述预设网络模型是根据包括医学实体数据的自然语言训练样本进行训练得到。
10.如权利要求9所述的症状信息处理装置,其特征在于,所述预设神经网络为根据所述预设网络模型生成的医学实体数据进行训练得到。
11.如权利要求7至10中任一项所述的症状信息处理装置,其特征在于,所述预设询问策略为多个询问策略中满足预设条件的目标询问策略,所述多个询问策略均是以预设症状信息作为输入,以所述预设症状信息对应的询问信息作为输出,所述预设症状信息是以所述预设神经网络语言模型作为采样器获取到的症状信息。
12.如权利要求11所述的症状信息处理装置,其特征在于,所述预设条件包括:询问轮数最少,所述目标询问策略为多个询问策略中询问轮数最少的询问策略;或者
所述预设条件包括:预设参数的取值最大,所述目标询问策略为多个询问策略中所述预设参数的取值最大的询问策略,其中,所述预设参数的取值跟随症状答复信息变化。
13.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-6中任一项所述的症状信息处理方法中的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的症状信息处理方法中的步骤。
CN201910397405.6A 2019-05-14 2019-05-14 一种症状信息处理方法、装置和电子设备 Active CN110136839B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910397405.6A CN110136839B (zh) 2019-05-14 2019-05-14 一种症状信息处理方法、装置和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910397405.6A CN110136839B (zh) 2019-05-14 2019-05-14 一种症状信息处理方法、装置和电子设备

Publications (2)

Publication Number Publication Date
CN110136839A true CN110136839A (zh) 2019-08-16
CN110136839B CN110136839B (zh) 2021-10-08

Family

ID=67573805

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910397405.6A Active CN110136839B (zh) 2019-05-14 2019-05-14 一种症状信息处理方法、装置和电子设备

Country Status (1)

Country Link
CN (1) CN110136839B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112017742A (zh) * 2020-09-08 2020-12-01 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN112837813A (zh) * 2019-11-25 2021-05-25 北京搜狗科技发展有限公司 自动问诊方法及装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740612A (zh) * 2016-01-27 2016-07-06 北京国医精诚科技有限公司 基于中医临床医案的疾病诊疗方法和系统
CN106295186A (zh) * 2016-08-11 2017-01-04 中国科学院计算技术研究所 一种基于智能推理的辅助疾病诊断的方法与系统
CN107403068A (zh) * 2017-07-31 2017-11-28 合肥工业大学 融合临床思维的智能辅助问诊方法及系统
CN107451407A (zh) * 2017-07-31 2017-12-08 广东工业大学 一种中医智能诊断方法、系统及中医医疗系统
CN109192300A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 智能问诊方法、系统、计算机设备和存储介质
CN109545391A (zh) * 2018-10-26 2019-03-29 曾警卫 一种基于深度学习的智能医疗自动问答系统及使用方法
CN109635122A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 智能疾病问询方法、装置、设备及存储介质
CN109741824A (zh) * 2018-12-21 2019-05-10 质直(上海)教育科技有限公司 一种基于机器学习的医疗问诊方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740612A (zh) * 2016-01-27 2016-07-06 北京国医精诚科技有限公司 基于中医临床医案的疾病诊疗方法和系统
CN106295186A (zh) * 2016-08-11 2017-01-04 中国科学院计算技术研究所 一种基于智能推理的辅助疾病诊断的方法与系统
CN107403068A (zh) * 2017-07-31 2017-11-28 合肥工业大学 融合临床思维的智能辅助问诊方法及系统
CN107451407A (zh) * 2017-07-31 2017-12-08 广东工业大学 一种中医智能诊断方法、系统及中医医疗系统
CN109192300A (zh) * 2018-08-17 2019-01-11 百度在线网络技术(北京)有限公司 智能问诊方法、系统、计算机设备和存储介质
CN109545391A (zh) * 2018-10-26 2019-03-29 曾警卫 一种基于深度学习的智能医疗自动问答系统及使用方法
CN109635122A (zh) * 2018-11-28 2019-04-16 平安科技(深圳)有限公司 智能疾病问询方法、装置、设备及存储介质
CN109741824A (zh) * 2018-12-21 2019-05-10 质直(上海)教育科技有限公司 一种基于机器学习的医疗问诊方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112837813A (zh) * 2019-11-25 2021-05-25 北京搜狗科技发展有限公司 自动问诊方法及装置
CN112017742A (zh) * 2020-09-08 2020-12-01 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质
CN112017742B (zh) * 2020-09-08 2024-05-24 平安科技(深圳)有限公司 分诊数据处理方法、装置、计算机设备及存储介质

Also Published As

Publication number Publication date
CN110136839B (zh) 2021-10-08

Similar Documents

Publication Publication Date Title
CN110111886A (zh) 一种基于XGBoost疾病预测的智能问诊系统及方法
CN108804677A (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
CN110119775A (zh) 医疗数据处理方法、装置、系统、设备和存储介质
CN109325106A (zh) 一种医美聊天机器人意图识别方法及装置
CN113871020B (zh) 一种基于ai机器学习的急危重症诊后健康管理方法及系统
CN111309887B (zh) 一种训练文本关键内容提取模型的方法和系统
WO2021179625A1 (zh) 智能分诊方法、装置、电子设备及存储介质
CN115982335B (zh) 一种主动式ai医疗问答系统、方法、设备及存储介质
CN110136839A (zh) 一种症状信息处理方法、装置和电子设备
WO2022227203A1 (zh) 基于对话表征的分诊方法、装置、设备及存储介质
JP2022530868A (ja) 機械学習に基づくターゲットオブジェクト属性予測方法、関連機器及びコンピュータプログラム
CN114781439B (zh) 模型获取系统、手势识别方法、装置、设备及存储介质
CN113053513A (zh) 一种基于智慧社区的智慧医疗系统
CN112287068A (zh) 基于人工智能的问诊对话数据处理方法及装置
CN108647229B (zh) 基于人工智能的虚拟人模型构建方法
CN110688478A (zh) 一种答案排序方法、装置及存储介质
CN113689943A (zh) 基于人工智能的就诊医院推荐方法、装置、设备及介质
Huang et al. A generic knowledge based medical diagnosis expert system
CN109509102B (zh) 理赔决策方法、装置、计算机设备和存储介质
Shafiq et al. Comprehensive Analysis of Nature-Inspired Algorithms for Parkinson’s Disease Diagnosis
CN111353290B (zh) 一种自动响应用户询问的方法和系统
CN116469534A (zh) 医院叫号管理系统及其方法
CN113434651B (zh) 话术推荐方法、装置及相关设备
Coelho et al. A novel sEMG data augmentation based on WGAN-GP
CN114520053A (zh) 一种医疗信息的处理方法、系统、终端和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant