CN113963793A - 一种问诊方法及其相关设备 - Google Patents

一种问诊方法及其相关设备 Download PDF

Info

Publication number
CN113963793A
CN113963793A CN202111237332.8A CN202111237332A CN113963793A CN 113963793 A CN113963793 A CN 113963793A CN 202111237332 A CN202111237332 A CN 202111237332A CN 113963793 A CN113963793 A CN 113963793A
Authority
CN
China
Prior art keywords
symptom
disease
determining
model
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111237332.8A
Other languages
English (en)
Inventor
尤心心
刘喜恩
杨雪
刘少辉
吴及
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Huiji Zhiyi Technology Co ltd
Tsinghua University
Original Assignee
Beijing Huiji Zhiyi Technology Co ltd
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Huiji Zhiyi Technology Co ltd, Tsinghua University filed Critical Beijing Huiji Zhiyi Technology Co ltd
Priority to CN202111237332.8A priority Critical patent/CN113963793A/zh
Publication of CN113963793A publication Critical patent/CN113963793A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本申请公开了一种问诊方法及其相关设备,该方法包括:在电子设备获取到该待诊断患者的病情自述信息之后,该电子设备先根据病情自述信息,确定待使用症状集;再根据该待使用症状集,确定待询问症状,以便在获取到该待诊断患者针对该待询问症状的询问反馈信息之后,根据该询问反馈信息,更新该待使用症状集,并继续执行上述“根据待使用症状集,确定待询问症状”的步骤,直至在达到第一停止条件时,根据该待使用症状集,确定待诊断患者的问诊结果,以使该问诊结果能够准确地表示出该待诊断患者较大可能患有的疾病,以便后续医生能够参考该问诊结果以及其他检查结果,对该待诊断患者进行更准确地疾病诊断,如此能够实现自动化问诊。

Description

一种问诊方法及其相关设备
技术领域
本申请涉及智能医疗技术领域,尤其涉及一种问诊方法及其相关设备。
背景技术
问诊是一种通过对话方式向病人及其知情者查询疾病的发生、发展情况和现在症状、治疗经过等,以诊断疾病的方法。
目前,问诊过程通常可以由医护人员进行引导实现,例如,当一个患者见到医生之后,该医生可以借助对话方式来实现针对该患者的问诊过程,以便后续该医生能够可以参考针对该患者的问诊结果以及其他检查结果(例如,尿检结果、血检结果、电子计算机断层扫描结果等),对该患者进行疾病诊断。
然而,因上述人工问诊过程存在缺陷,导致问诊效果较差。
发明内容
本申请实施例的主要目的在于提供一种问诊方法及其相关设备,能够实现自动化问诊,从而能够有效地提高问诊效果。
本申请实施例提供了一种问诊方法,应用于电子设备,所述方法包括:在获取到待诊断患者的病情自述信息之后,根据所述病情自述信息,确定待使用症状集;根据所述待使用症状集,确定待询问症状;在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待询问症状的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
本申请实施例还提供了一种问诊装置,包括:第一确定单元,用于在获取到待诊断患者的病情自述信息之后,根据所述病情自述信息,确定待使用症状集;第二确定单元,用于根据所述待使用症状集,确定待询问症状;第三确定单元,用于在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待询问症状的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
本申请实施例还提供了一种设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的问诊方法的任一实施方式。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行本申请实施例提供的问诊方法的任一实施方式。
本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行本申请实施例提供的问诊方法的任一实施方式。
基于上述技术方案,本申请具有以下有益效果:
本申请提供的技术方案中,对于一个具有看病需求的待诊断患者来说,在电子设备获取到该待诊断患者的病情自述信息之后,该电子设备先根据病情自述信息,确定待使用症状集(例如,咳嗽、打喷嚏等);再根据该待使用症状集,确定待询问症状(例如,头疼),以使该待询问症状不同于该待使用症状集中任一症状,从而使得该待诊断患者能够确认其是否出现该待询问症状,以便在获取到该待诊断患者针对该待询问症状的询问反馈信息(例如,有点头疼、没有头疼等信息)之后,根据该询问反馈信息,更新该待使用症状集,并继续执行上述“根据待使用症状集,确定待询问症状”的步骤,直至在达到第一停止条件时,根据该待使用症状集,确定待诊断患者的问诊结果,以使该问诊结果能够表示出该待诊断患者的身体状况(例如,很可能患有的疾病、和/或,身体出现的各种症状等),以便后续医生能够参考该问诊结果以及其他检查结果(例如,尿检结果、血检结果、电子计算机断层扫描结果等),对该待诊断患者进行更准确地疾病诊断。
可见,因本申请实施例提供的技术方案是由电子设备(例如,终端设备或者服务器等)进行实现的,使得在本申请实施例提供的问诊过程中无需由医护人员参与,如此能够实现自动化问诊,从而能够尽可能地克服因人工问诊过程存在缺陷而导致问诊效果较差的技术问题,进而能够有效地提高问诊效果。
另外,因上述“待诊断患者的问诊结果”是根据该待诊断患者的病情自述信息所携带的症状、以及借助多轮问诊交互过程所获得的症状进行确定的,使得该“待诊断患者的问诊结果”能够更准确地表示出该待诊断患者的身体状况,从而使得后续医生能够参考该“待诊断患者的问诊结果”针对该待诊断患者进行更准确地疾病诊断。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种问诊方法的流程图;
图2为本申请实施例提供的一种自动问诊过程的示例图;
图3为本申请实施例提供的一种疾病预诊模型的结构示意图;
图4为本申请实施例提供的一种GRU中一个节点的工作原理的示意图;
图5为本申请实施例提供的一种自动问诊应用实例的示意图;
图6为本申请实施例提供的一种自动问诊过程的示意图;
图7为本申请实施例提供的一种鉴别性表征数据的示意图;
图8为本申请实施例提供的一种问诊装置的结构示意图。
具体实施方式
发明人在针对问诊过程的研究中发现,人工问诊过程存在以下缺陷:①因针对每个患者的问诊过程都需要由至少一个医护人员进行参与,使得在患者人流量比较大时易导致一个医院需要消耗大量医护资源参与问诊过程,如此易导致该医院的医护资源紧张。②因针对一个患者的问诊过程通常是由医护人员进行主导的,故为了保证问诊过程的有效性,通常需要保证参与问诊过程的医护人员具有较高的问诊经验,如此导致那些经验不足的医护人员不能参与问诊过程,从而导致该医院的医护资源更紧张。③因有些患者所患疾病(例如,XXX肺炎等)具有较强的传染性,使得针对这些患者进行面对面问诊的医护人员容易被传染,故为了避免传染范围的扩大,需要针对这些医护人员进行隔离处理,如此易导致该医院的医护资源更紧张。
基于上述发现,为了解决背景技术部分所示的技术问题,本申请实施例提供了一种应用于电子设备的问诊方法,该方法包括:在获取到待诊断患者的病情自述信息之后,先根据病情自述信息,确定待使用症状集(例如,咳嗽、打喷嚏等);再根据该待使用症状集,确定待询问症状(例如,头疼),以使该待询问症状不同于该待使用症状集中任一症状,从而使得该待诊断患者能够确认其是否出现该待询问症状,以便在获取到该待诊断患者针对该待询问症状的询问反馈信息(例如,有点头疼、没有头疼等信息)之后,根据该询问反馈信息,更新该待使用症状集,并继续执行上述“根据待使用症状集,确定待询问症状”的步骤,直至在达到第一停止条件时,根据该待使用症状集,确定待诊断患者的问诊结果,以使该问诊结果能够表示出该待诊断患者的身体状况(例如,很可能患有的疾病、和/或,身体出现的各种症状等),以便后续医生能够参考该问诊结果以及其他检查结果(例如,尿检结果、血检结果、电子计算机断层扫描结果等),对该待诊断患者进行更准确地疾病诊断。
可见,因本申请实施例提供的技术方案是由电子设备(例如,终端设备或者服务器等)进行实现的,使得在本申请实施例提供的问诊过程中无需由医护人员参与,如此能够实现自动化问诊,从而能够尽可能地克服因人工问诊过程存在缺陷而导致问诊效果较差的技术问题,进而能够有效地提高问诊效果。另外,因上述“待诊断患者的问诊结果”是根据该待诊断患者的病情自述信息所携带的症状、以及借助多轮问诊交互过程所获得的症状进行确定的,使得该“待诊断患者的问诊结果”能够更准确地表示出该待诊断患者的身体状况,从而使得后续医生能够参考该“待诊断患者的问诊结果”针对该待诊断患者进行更准确地疾病诊断。
另外,本申请实施例不限定上述“电子设备”的实施方式,例如,其可以是终端设备或服务器等数据处理设备。其中,终端设备可以为智能手机、计算机、个人数字助理(Personal Digital Assitant,PDA)或平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例一
参见图1,该图为本申请实施例提供的一种问诊方法的流程图。
本申请实施例提供的应用于电子设备的问诊方法,包括S1-S5:
S1:在获取到待诊断患者的病情自述信息之后,根据该病情自述信息,确定待使用症状集。
上述“待诊断患者”是指需要进行问诊的人;而且本申请实施例不限定该“待诊断患者”,例如,当本申请实施例提供的问诊方法应用于医院(例如,医院问诊系统、医院问诊机器人等)时,该“待诊断患者”可以是指来该医院求诊的患者。又如,当本申请实施例提供的问诊方法应用于线上问诊(例如,智能医生等)时,该“待诊断患者”可以是指在该线上问诊所处网页上触发问诊请求的用户。
上述“病情自述信息”是指由待诊断患者或者该待诊断患者的病情知情者(例如,该待诊断患者的亲人等)主动针对该待诊断患者的身体状况进行描述介绍的相关内容。例如,“病情自述信息”可以包括图2所示的“医生,我流鼻涕,而且咳嗽”。
另外,本申请实施例不限定上述“病情自述信息”的获取方式,例如,当本申请实施例提供的问诊方法的执行主体为终端设备时,可以由待诊断患者或者该待诊断患者的病情知情者借助该终端设备的任一种输入设备(例如,键盘、拾音器、可触控显示屏、摄像头等)向该终端设备中输入该“病情自述信息”。又如,当本申请实施例提供的问诊方法的执行主体为服务器,且该服务器可以与终端设备进行数据通信时,可以先由待诊断患者或者该待诊断患者的病情知情者向该终端设备中输入该“病情自述信息”;再由该终端设备将该“病情自述信息”发送给服务器,以使服务器能够获取到该“病情自述信息”。
此外,本申请实施例不限定上述“病情自述信息”的数据类型,例如,其可以是语音数据、文本数据、图像数据等。
上述“待使用症状集”用于记录在待诊断患者的身体上所出现的至少一个症状;而且该“待使用症状集”可以利用上述“病情自述信息”进行初始化。例如,当上述“病情自述信息”为图2所示的“医生,我流鼻涕,而且咳嗽”时,可以将“待使用症状集”初始化为{流鼻涕,咳嗽}。
需要说明的是,本申请实施例不限定S1中“根据病情自述信息,确定待使用症状集”的实施方式,可以采用现有的或者未来出现的任一种能够针对上述“病情自述信息”进行症状提取的方法进行实施。
基于上述S1的相关内容可知,对于待诊断患者的问诊过程来说,可以先由该待诊断患者或者该待诊断患者的病情知情者提供针对待诊断患者的病情自述信息,以使该病情自述信息能够表示出在该待诊断患者的身体上所出现的一些症状;再利用该病情自述信息,初始化待使用症状集,以使该待使用症状集用于记录在该待诊断患者的身体上所出现的症状,以便后续能够以该待使用症状集中所记录的症状,针对该待诊断患者或者该待诊断患者的病情知情者进行至少一轮问诊交互过程。
S2:根据待使用症状集,确定待询问症状。
上述“待询问症状”是指需要借助询问方式由待诊断患者或者该待诊断患者的病情知情者确认在该待诊断患者的身体上是否出现的症状。例如,当上述“待使用症状集”为{流鼻涕,咳嗽}时,该“待询问症状”可以包括发热、咳嗽、和/或打喷嚏等。
另外,本申请实施例不限定S2的实施方式,例如,在一种可能的实施方式中,S2具体可以包括S21-S22:
S21:根据待使用症状集,确定待使用疾病诊断结果。
上述“待使用疾病诊断结果”用于表示待诊断患者可能患有的疾病;而且该“待使用疾病诊断结果”是根据待使用症状集确定的。例如,当上述“待使用症状集”为{流鼻涕,咳嗽}时,该待使用疾病诊断结果可以包括鼻炎和肺炎。
本申请实施例不限定S21的实施方式,例如,在一种可能的实施方式下,其具体可以包括S211-S212:
S211:将待使用症状集输入预先构建的疾病预诊模型,得到该疾病预诊模型输出的第一疾病预诊结果。
上述“第一疾病预诊结果”用于表示待诊断患者患有至少一种候选疾病的发生概率(例如,鼻炎的发生概率为0.4;肺炎的发生概率为0.39;皮炎的发生概率为0.008;乳腺炎的发生概率为0.0001;……)。
需要说明的是,上述“候选疾病”用于表示医生在针对一个患者进行疾病诊断时所需考虑到的疾病;而且本申请实施例不限定“至少一种候选疾病”的获取方式,例如,其可以是指从大量医学资料(例如,病历数据、医学论文、医学书籍数据、医学报刊、医学临床数据等)中进行疾病挖掘得到。
上述“疾病预诊模型”用于针对该疾病预诊模型的输入数据进行疾病预测处理;而且本申请实施例不限定该“疾病预诊模型”,例如,其可以采用现有的或者未来出现的任一种机器学习模型进行实施。
另外,为了进一步提高问诊效果,本申请实施例还提供了上述“疾病预诊模型”的另一种可能的实施方式,在该实施方式下,如图3所示,疾病预诊模型300可以包括表征向量确定模块301、池化层302、拼接模块303、全连接模块304和决策模块305。其中,池化层302包括N个池化模块,且各个池化模块的输入数据均包括表征向量确定模块301的输出数据;拼接模块303的输入数据包括N个池化模块的输出数据;全连接模块304的输入数据包括拼接模块303的输出数据;决策模块305的输入数据包括全连接模块304的输出数据。
为了便于理解疾病预诊模型300的工作原理,下面以上述“第一疾病预诊结果”的确定过程为例进行说明。
作为示例,利用疾病预诊模型300确定“第一疾病预诊结果”的过程,具体可以包括步骤11-步骤15:
步骤11:将待使用症状集输入表征向量确定模块301,得到该表征向量确定模块301输出的向量表征结果。
上述“表征向量确定模块301”用于针对该表征向量确定模块301的输入数据进行表征向量提取处理。
另外,本申请实施例不限定上述“表征向量确定模块301”的实施方式,例如,其可以采用现有的或者未来出现的任一种能够针对文本数据进行表征向量提取处理的方法进行实施。又如,为了提高表征向量的提取效率,“表征向量确定模块301”可以借助门控循环单元(Gate Recurrent Unit,GRU)模型进行实施;而且该实施过程具体可以包括:先对待使用症状集进行字符向量化处理(例如,word2vec等),得到该待使用症状集的字符向量;再将该待使用症状集的字符向量输入GRU模型,得到该GRU模型输出的向量表征结果。
需要说明的是,上述GRU模型的特点就是网络结构简单,而且计算速度快。另外,如图4所示,对于在当前时刻下的GRU模型来说,其可以参考前一时刻下GRU模型的输出数据h(t-1),以及在当前时刻下输入该GRU模型的字符向量x(t),确定该GRU模型在当前时刻下的输出数据;而且该确定过程具体可以包括:先利用两个门控机制来挖掘我们想要的特征,即更新门(如公式(1)所示)和重置门(如公式(2)所示),以使该更新门用于控制前一时刻的状态信息被带入到当前状态中的程度,更新门的值越大说明前一时刻的状态信息带入越多,并使得该重置门控制前一状态有多少信息被写入到当前的候选集h~t上,重置门越小,前一状态的信息被写入的越少;再利用门控信号rt和公式(3),计算经过重置门的特征与本次待更新的特征之间的相似度;最后,按照公式(4)控制本轮更新特征以及融合上次特征的程度,保证模型训练稳定不产生大幅震荡,容易收敛。
zt=σ(Wz·x(t)+Uz·h(t-1)+bz) (1)
rt=σ(Wr·x(t)+Ur·h(t-1)+br) (2)
h~t=tanh(Wh·x(t)+Uh(rt·h(t-1))+bh (3)
h(t)=h~t·zt+h(t-1)·(1-zt) (4)
式中,h(t)表示GRU模型在当前时刻下的输出数据;h(t-1)表示GRU模型在前一时刻下的输出数据;x(t)表示该GRU模型在当前时刻下的输入字符向量;Wz、Uz表示更新门中可训练权重,且bz表示更新门中可训练的归纳偏置;Wr、Ur表示重置门中可训练权重,且br表示重置门中可训练的归纳偏置;Wh、Uh表示可训练权重,且bh表示可训练的归纳偏置;σ()表示非线性激活函数;“·”表示两个矩阵之间的乘积;tanh()表示双曲正切函数。
上述“向量表征结果”用于表征待使用症状集携带的症状描述信息。
步骤12:将向量表征结果输入第n个池化模块,得到该第n个池化模块输出的第n个池化结果。其中,n为正整数,n≤N。
上述“第n个池化模块”用于针对该第n个池化模块的输入数据进行池化处理。
另外,上述“第n个池化模块”的工作原理不同于N个池化模块中除了该“第n个池化模块”以外的其他任一池化模块的工作原理。例如,若N为2,则第1个池化模块可以采用最大池化处理方式进行实施,且第2个池化模块可以采用平均池化处理方式进行实施。
步骤13:将第1个池化结果至第N个池化结果输入拼接模块303,得到该拼接模块303输出的拼接结果。
上述“拼接模块303”用于将该拼接模块303的输入数据进行拼接处理(例如,横向拼接处理等)。
步骤14:将拼接结果输入全连接模块304,得到该全连接模块304输出的全连接结果。
上述“全连接模块304”用于将该全连接模块304的输入数据进行全连接处理;而且本申请实施例不限定该“全连接模块304”的实施方式,可以采用现有的或者未来出现的任一种全连接网络(例如,全连接神经网络等)进行实施。
步骤15:将全连接结果输入决策模块305,得到该决策模块305输出的第一疾病预诊结果。
上述“决策模块305”用于针对该决策模块305的输入数据进行决策处理;而且本申请实施例不限定该“决策模块305”的实施方式,例如,其可以采用现有的或者未来出现的任一种决策网络(例如,softmax函数等)进行实施。
基于上述步骤11至步骤15的相关内容可知,对于疾病预诊模型300来说,其可以先借助表征向量确定模块301对待使用症状集进行字符特征提取,得到向量表征结果;再利用池化层302、拼接模块303、全连接模块304、以及决策模块305,对该向量表征结果进行分类处理,得到第一疾病预诊结果,以使该第一疾病预诊结果能够表示出基于待使用症状集预测得到的各种候选疾病的发生概率。
本申请实施例不限定上述“疾病预诊模型”的构建过程,例如,可以采用现有的或者未来出现的任一种模型构建方法进行实施。又如,为了提高模型预测效果,可以采用下文方法实施例二所示的模型构建方法进行实施。
基于上述S211的相关内容可知,在获取到待使用症状集之后,可以利用预先构建的疾病预诊模型,针对该待使用症状集进行疾病预测处理,得到并输出第一疾病预诊结果,以使该第一疾病预诊结果能够表示出待诊断患者患有各种候选疾病的发生概率。
S212:根据第一疾病预诊结果,确定待使用疾病诊断结果。
本申请实施例不限定S212的实施方式,例如,其可以包括:将第一疾病预诊结果中发生概率达到第一概率条件的至少一种候选疾病,确定为待使用疾病诊断结果。
上述“第一概率条件”可以预先设定;而且本申请实施例不限定该“第一概率条件”,例如,“第一概率条件”可以为:达到预设概率阈值(例如,0.3)。又如,当第一疾病预诊结果用于记录按照发生概率从大到小进行排列的至少一种候选疾病时,“第一概率条件”也可以为:排列序号低于Q(也就是,取排名最靠前的Q种候选疾病)。其中,Q为正整数。
基于上述S21的相关内容可知,在获取到待使用症状集之后,可以参考该待使用症状集中所有症状,对待诊断患者进行疾病预测处理,得到待使用疾病诊断结果,以使该待使用疾病诊断结果能够表示出该待诊断患者可能患有的疾病。
S22:根据待使用症状集和待使用疾病诊断结果,确定待询问症状。
本申请实施例不限定S22的实施方式,例如,其具体可以包括:从待使用疾病诊断结果对应的症状集合中随机选择至少一个症状,确定为待询问症状。其中,“待使用疾病诊断结果对应的症状集合”用于记录该待使用疾病诊断结果中所有疾病对应的表现症状。
需要说明的是,一种疾病对应的表现症状是指患有该疾病的患者所可能出现的至少一个症状。例如,鼻炎对应的表现症状可以包括:无鼻塞、打喷嚏、流鼻血、……;肺炎对应的表现症状可以包括:呼吸急促、无发绀、无寒颤、……;皮炎对应的表现症状可以包括:瘙痒、皮疹、皮肤和粘膜充血、……;乳腺炎对应的表现症状可以包括:乳房胀痛、畏寒、舌头有薄白苔、……。另外,各种疾病对应的表现症状均可以预先从大量医学资料(例如,病历数据、医学论文、医学书籍数据、医学报刊等)中进行数据分析(例如,数据挖掘)而得到。
另外,为了进一步提高待询问症状的准确性,本申请实施例还提供了S22的另一种可能的实施方式,其具体可以包括S221-S222:
S221:将待使用症状集和待使用疾病诊断结果输入预先构建的症状预测模型,得到该症状预测模型输出的第一症状预测结果。
上述“症状预测模型”用于针对该症状预测模型的输入数据进行症状预测处理;而且本申请实施例不限定该“症状预测模型”,例如,其可以是现有的或者未来出现的任一种机器学习模型。
另外,为了进一步提高问诊效果,本申请实施例还提供了上述“症状预测模型”的另一种可能的实施方式,在该实施方式下,该“症状预测模型”的模型架构与上述“疾病预诊模型”的模型架构保持相同。可见,上述“症状预测模型”也可以采用图3所示的模型结构进行实施。
实际上,因上述“症状预测模型”所涉及的症状个数(例如,119)不同于上述“疾病预诊模型”所涉及的疾病个数(例如,12),故为了提高模型预测效果,上述“症状预测模型”的输出节点数(例如,119)不同于上述“疾病预诊模型”的输出节点数(例如,12),以使上述“症状预测模型”的输出数据的数据维度(例如,119)不同于上述“疾病预诊模型”的输出数据的维度(例如,12)。
需要说明的是,当上述“症状预测模型”的输出数据的数据维度为119时,该上述“症状预测模型”的输出数据包括:118个症状的发生概率和停止问询的发生概率(也就是,无症状需问询的发生概率)。其中,上述“停止问询的发生概率”用于表示在当前轮的待使用症状集是否已包括了足够多的症状信息。
本申请实施例不限定上述“症状预测模型”的构建过程,例如,可以采用现有的或者未来出现的任一种模型构建方法进行实施。又如,为了提高模型预测效果,可以采用下文方法实施例二所示的模型构建方法进行实施。
上述“第一症状预测结果”用于表示待诊断患者出现各种症状的发生概率(例如,发热的发生概率为0.3;咳嗽的发生概率为0.29;打喷嚏的发生概率为0.28;呼吸急促的发生概率为0.02;……)。
S222:根据第一症状预测结果,确定待询问症状。
本申请实施例不限定S222的实施方式,例如,其可以包括:根据第一症状预测结果中发生概率达到第二概率条件的至少一种症状(例如,发热等),确定待询问症状。
上述“第二概率条件”可以预先设定;而且本申请实施例不限定该“第二概率条件”,例如,“第二概率条件”可以为:达到预设概率阈值(例如,0.2)。又如,当第一症状预测结果用于记录按照发生概率从大到小进行排列的至少一种症状时,“第二概率条件”也可以为:排列序号低于P(也就是,取排名最靠前的P个症状)。其中,P为正整数。又如,为了提高待询问症状的有效性,其可以采用下文方法实施例三所示的待询问症状的确定过程进行实施。
基于上述S22的相关内容可知,在获取到待使用疾病诊断结果之后,可以同时参考该待使用疾病诊断结果以及待使用症状集,确定待询问症状,以使该待询问症状能够更好地表示出在该待诊断患者的身体上比较可能出现的症状。
基于上述S2的相关内容可知,在获取到待使用症状集之后,可以参考该待使用症状集中所有症状,预测在待诊断患者的身体上可能还出现的症状,得到待询问症状,以便后续能够借助询问方式确认在该待诊断患者的身体上是否出现该待询问症状。
S3:判断是否达到第一停止条件,若是,则执行S5;若否,则执行S4。
上述“第一停止条件”可以预先设定;而且本申请实施例不限定该“第一停止条件”,例如,为了提高问诊效果,当上述“待询问症状”是根据第一症状预测结果确定的,且该第一症状预测结果包括:停止问询的发生概率(也就是,无症状需问询的发生概率)时,则该“第一停止条件”具体可以为:停止问询的发生概率高于该第一症状预测结果中任一症状的发生概率(也就是,基于第一症状预测结果确定的“待询问症状”包括“停止问询”这一伪症状)。
S4:在获取到待诊断患者针对待询问症状的询问反馈信息之后,根据该询问反馈信息,更新待使用症状集,并返回执行S2。
上述“询问反馈信息”用于表示在待诊断患者的身体上是否出现待询问症状;而且本申请实施例不限定该“询问反馈信息”的获取方式,例如,可以借助与该待诊断患者(或者,该待诊断患者的病情知情者)之间的对话交互过程进行实现。可见,上述“询问反馈信息”的获取过程可以包括步骤21-步骤23:
步骤21:根据待询问症状,生成症状问询信息。
上述“症状问询信息”用于向待诊断患者(或者,该待诊断患者的病情知情者)问询在该待诊断患者的身体上是否出现该待询问症状。例如,当上述“待询问症状”为发热,则该“症状问询信息”可以是“是否发热”。
另外,本申请实施例不限定上述“症状问询信息”的生成过程,例如,其具体可以包括:将待询问症状填入预先设定的症状问询模板(例如,“是否(此处需填入症状)”),得到症状问询信息。
实际上,不同症状对应的症状问询模板可能会不同。基于此,本申请实施例还提供了生成“症状问询信息”的另一种可能的实施方式,其具体可以包括:先从预先设定的至少一个候选模板中查找待询问症状对应的候选模板,确定为待使用模板;再将待询问症状填入该待使用模板,得到症状问询信息。
步骤22:将症状问询信息发送给待诊断患者(或者,该待诊断患者的病情知情者),以使该待诊断患者(或者,该待诊断患者的病情知情者)针对该症状问询信息进行答复。
本申请实施例不限定上述“症状问询信息”的发送方式,例如,当本申请实施例提供的问诊方法的执行主体为终端设备时,则该终端设备可以直接按照预设展示方式(例如,语音播放、文字显示、图像显示等方式)对该“症状问询信息”进行展示,以使该待诊断患者(或者,该待诊断患者的病情知情者)能够从该终端设备上获知该“症状问询信息”。又如,当本申请实施例提供的问诊方法的执行主体为服务器,且该服务器可以与终端设备进行数据通信时,可以先由该服务器将“症状问询信息”发送给该终端设备,以使该终端设备可以按照预设展示方式对该“症状问询信息”进行展示,以便该待诊断患者(或者,该待诊断患者的病情知情者)能够从该终端设备上获知该“症状问询信息”。
步骤23:在获取到待诊断患者(或者,该待诊断患者的病情知情者)针对症状问询信息的答复内容之后,根据该答复内容,确定该待诊断患者针对待询问症状的询问反馈信息。
上述“答复内容”是由待诊断患者(或者,该待诊断患者的病情知情者)针对该症状问询信息进行答复得到的,以使该“答复内容”能够表示出在该待诊断患者的身体上是否出现该待询问症状,从而使得该答复内容携带有该待诊断患者针对待询问症状的询问反馈信息。
实际上,对于上述“答复内容”来说,该答复内容可能会完整地表示出该待诊断患者所出现的症状(例如,图2所示的“没有发热,但是有咳嗽和打喷嚏”),故可以直接根据该答复内容确定上述“询问反馈信息”即可;但是,该答复内容也可能无法完整地表示出该待诊断患者所出现的症状(例如,图2所示的“有的”),使得在将该答复内容与其对应的症状问询信息(例如,图2所示的“咽部有没有不适感”)进行结合时才能完整地表示出该待诊断患者所出现的症状(例如,咽部有不适感),故可以结合该答复内容与其对应的症状问询信息,确定上述“询问反馈信息”。
基于此,本申请实施例还提供了步骤23的另一种可能的实施方式,其具体可以包括:在获取到待诊断患者(或者该待诊断患者的病情知情者)针对症状问询信息的答复内容之后,若确定该答复内容满足预设完整条件,则从该答复内容中提取该待诊断患者针对待询问症状的询问反馈信息;若确定该答复内容不满足预设完整条件,则根据该答复内容和该症状问询信息,确定该待诊断患者针对待询问症状的询问反馈信息。
需要说明的是,上述“预设完整条件”可以预先设定;而且本申请实施例不限定“预设完整条件”,例如,其具体可以包括:答复内容包括预先设定的待询问症状的核心字符信息(例如,“咽”、“部”、“不”、“适”、“感”)。
基于上述步骤21至步骤23的相关内容可知,在获取到待询问症状之后,可以先依据该待询问症状,生成症状问询信息,以使该症状问询信息被用于向待诊断患者确认其是否出现待询问症状;再将该待询问症状发送给待诊断患者(或者该待诊断患者的病情知情者),以使该待诊断患者(或者该待诊断患者的病情知情者)能够针对该症状问询信息进行答复,得到答复内容,以使该答复内容能够表示出该待诊断患者是否出现该待询问症状;最后,依据该答复内容,确定该待诊断患者针对待询问症状的询问反馈信息,以使该询问反馈信息能够表示出该待诊断患者是否出现该待询问症状。
本申请实施例不限定S4中“根据询问反馈信息,更新待使用症状集”的实施方式,例如,其具体可以包括:先根据询问反馈信息,确定补充症状(例如,无发热、咳嗽、打喷嚏等),以使该补充症状用于补充描述该待诊断患者的身体状况;再将该补充症状添加至待使用症状集,以使该待使用症状集能够新增一个症状,从而使得该待使用症状集能够更好地表示出该待诊断患者的身体状况。
基于上述S4的相关内容可知,在确定未达到第一停止条件时,可以确定针对待诊断患者的问诊过程仍未结束,从而可以确定还需要由该待诊断患者(或者,该待诊断患者的病情知情者)继续提供除了待使用症状集中所有症状以外的其他症状描述信息(例如,无发热、咳嗽、打喷嚏等症状),故在获取到待询问症状之后,可以先获取该待诊断患者针对待询问症状的询问反馈信息,再根据该询问反馈信息,更新待使用症状集,以使更新后的待使用症状集中症状个数高于更新前的待使用症状集中症状个数,从而使得更新后的待使用症状集能够更好地表示出该待诊断患者的身体状况。
需要说明的是,当S2包括S21-S22时,S4具体可以包括:在获取到待诊断患者针对待询问症状的询问反馈信息之后,根据询问反馈信息,更新待使用症状集,并返回执行S21。
S5:根据待使用症状集,确定待诊断患者的问诊结果。
上述“待诊断患者的问诊结果”是指针对待诊断患者的自动问诊结果,以使该“待诊断患者的问诊结果”用于表示出该待诊断患者的身体状况;而且本申请实施例不限定该“待诊断患者的问诊结果”,例如,其可以携带有该待诊断患者的可能患有的疾病和/或在该待诊断患者身上所出现的症状。
另外,本申请实施例不限定该“待诊断患者的问诊结果”的确定过程,例如,其具体可以包括:直接将待使用症状集,确定为待诊断患者的问诊结果。又如,其具体可以包括步骤31:
步骤31:先根据待使用症状集,确定待使用疾病信息。
上述“待使用疾病信息”用于表示待诊断患者的可能患有的疾病。
另外,本申请实施例不限定步骤31的实施方式,例如,步骤31具体可以为:先将待使用症状集中所有症状与各种候选疾病对应的表征症状进行匹配,得到该待使用症状集与各种候选疾病之间的匹配程度;再将匹配程度最高U个候选疾病进行集合,得到待使用疾病信息。又如,步骤31可以借助下文方法实施例四所示的疾病预测模型进行实施。
步骤32:根据待使用疾病信息,确定该待诊断患者的问诊结果。
本申请实施例不限定步骤32的实施方式,例如,步骤32具体可以为:直接将待使用疾病信息,确定为该待诊断患者的问诊结果。又如,步骤32具体可以为:将待使用疾病信息以及待使用症状集中所有症状进行集合处理,得到该待诊断患者的问诊结果。
基于上述S5的相关内容可知,在确定达到第一停止条件时,可以确定针对待诊断患者的问诊过程已结束,故可以参考待使用症状集,确定该待诊断患者的问诊结果,以使该问诊结果能够表示出该待诊断患者的身体状况(例如,身体出现什么症状、很有可能患有什么疾病等)。
基于上述S1至S5的相关内容可知,对于本申请实施例提供的问诊方法来说,在电子设备获取到该待诊断患者的病情自述信息之后,该电子设备先根据病情自述信息,确定待使用症状集(例如,咳嗽、打喷嚏等);再根据该待使用症状集,确定待询问症状(例如,头疼),以使该待询问症状不同于该待使用症状集中任一症状,从而使得该待诊断患者能够确认其是否出现该待询问症状,以便在获取到该待诊断患者针对该待询问症状的询问反馈信息(例如,有点头疼、没有头疼等信息)之后,根据该询问反馈信息,更新该待使用症状集,并继续执行上述“根据待使用症状集,确定待询问症状”的步骤,直至在达到第一停止条件时,根据该待使用症状集,确定待诊断患者的问诊结果,以使该问诊结果能够表示出该待诊断患者的身体状况(例如,很可能患有的疾病、和/或,身体出现的各种症状等),以便后续医生能够参考该问诊结果以及其他检查结果(例如,尿检结果、血检结果、电子计算机断层扫描结果等),对该待诊断患者进行更准确地疾病诊断。
可见,因本申请实施例提供的技术方案是由电子设备(例如,终端设备或者服务器等)进行实现的,使得在本申请实施例提供的问诊过程(如图5所示)中无需由医护人员参与,如此能够实现自动化问诊,从而能够尽可能地克服因人工问诊过程存在缺陷而导致问诊效果较差的技术问题,进而能够有效地提高问诊效果。
另外,因上述“待诊断患者的问诊结果”是根据该待诊断患者的病情自述信息所携带的症状、以及借助多轮问诊交互过程所获得的症状进行确定的,使得该“待诊断患者的问诊结果”能够更准确地表示出该待诊断患者的身体状况,从而使得后续医生能够参考该“待诊断患者的问诊结果”针对该待诊断患者进行更准确地疾病诊断。
需要说明的是,图5中“显示症状”是指上述“病情自述信息”携带的症状;“隐示症状”是指借助至少一轮问诊过程询问到的症状。
方法实施例二
实际上,当上文S2借助“疾病预诊模型”和“症状预测模型”进行实施时,待询问症状的预测准确性不仅可以被该“症状预测模型”的预测性能所影响,还可以被该“疾病预诊模型”的预测性能所影响,其具体为:若该“疾病预诊模型”的预测性能越高,则使得该“疾病预诊模型”针对待使用症状集输出的待使用疾病诊断结果越准确,从而使得该“症状预测模型”的输入数据越准确,进而使得该“症状预测模型”输出的待询问症状越准确,如此使得基于该待询问症状确定的该“疾病预诊模型”的下一轮输入数据越准确,如此有利于更好地确定出上述“待诊断患者的问诊结果”。
可见,上述“疾病预诊模型”的预测性能与上述“症状预测模型”的预测性能能够彼此影响,故为了进一步提高模型预测准确性,可以将“疾病预诊模型”和“症状预测模型”进行联合构建。基于此,本申请实施例提供了一种模型构建方法,其具体可以包括步骤41-步骤49:
步骤41:利用第一症状样本和该第一症状样本的实际疾病诊断结果,对待使用模型进行训练,得到待优化预诊模型。
上述“第一症状样本”用于表示对待使用模型进行训练时所需使用的样本数据;而且本申请实施例不限定“第一症状样本”,例如,该“第一症状样本”可以包括至少一个症状。另外,本申请实施例不限定上述“第一症状样本”的获取方式,例如,可以从病历样本中抽取得到。
上述“第一症状样本的实际疾病诊断结果”用于表示由医生参考该第一症状样本携带的症状信息实际诊断出的疾病;而且本申请实施例不限定该“第一症状样本的实际疾病诊断结果”的获取方式,例如,可以从病历样本中抽取。又如,可以由医生进行人工标注。
上述“待使用模型”用于针对该待使用模型的输入数据进行疾病预测处理;而且该“待使用模型”的模型结构可以与上文“疾病预诊模型”的模型结构保持一致,以便后续能够基于训练好的待使用模型,构建该“疾病预诊模型”。
本申请实施例不限定上述“待使用模型”的训练过程,例如,可以采用现有的或者未来出现的任一种模型训练方法进行实施。
上述“待优化预诊模型”用于表示训练好的待使用模型。
步骤42:根据第二症状样本,确定样本症状集。
上述“第二症状样本”用于表示对待优化预诊模型以及待优化症状模型进行训练时所需使用的样本数据;而且本申请实施例不限定“第二症状样本”,例如,该“第二症状样本”可以包括至少一个症状。另外,本申请实施例不限定上述“第二症状样本”的获取方式,例如,可以从病历样本中抽取得到。此外,本申请实施例不限定上述“第二症状样本”与上述“第一症状样本”之间的关系,可以相同,也可以不同。
上述“样本症状集”用于记录第二症状样本所携带的症状信息;而且该“样本症状集”类似于上文“待使用症状集”。
步骤43:将样本症状集输入待优化预诊模型,得到该待优化预诊模型输出的第二疾病预诊结果。
上述“第二疾病预诊结果”用于表示参考该样本症状集确定的至少一种候选疾病的发生概率;而且该“第二疾病预诊结果”类似于上文“第一疾病预诊结果”。
步骤44:根据样本症状集、第二疾病预诊结果和待优化症状模型,得到第二症状预测结果。
上述“待优化症状模型”用于针对该待优化症状模型的输入数据进行症状预测处理;而且上述“待优化症状模型”的模型结构可以与上文“症状预测模型”的模型结构保持一致,以便后续能够基于训练好的待优化症状模型,确定该“症状预测模型”。
上述“第二症状预测结果”用于表示参考样本症状集确定的各种症状的发生概率;而且上述“第二症状预测结果”类似于上文“第一症状预测结果”。
另外,本申请实施例不限定步骤44的实施方式,例如,其具体可以包括:先根据第二疾病预诊结果,确定样本疾病诊断结果;再将该样本疾病诊断结果和样本症状集输入待优化症状模型,得到该待优化症状模型输出的第二症状预测结果。
上述“样本疾病诊断结果”用于表示参考样本症状集确定的可能患有的疾病;而且上述“样本疾病诊断结果”类似于上文“待使用疾病诊断结果”。
步骤45:判断是否达到第二停止条件,若是,则执行步骤49;若否,则执行步骤46-步骤48。
上述“第二停止条件”可以预先设定;例如,可以采用现有的或者未来出现的任一模型停止条件进行实施。又如,可以采用下文所示的第二停止条件进行实施。
步骤46:根据第二疾病预诊结果和第二症状样本的实际疾病诊断结果,更新待优化预诊模型。
上述“第二症状样本的实际疾病诊断结果”用于表示由医生参考该第二症状样本携带的症状信息实际诊断出的疾病;而且本申请实施例不限定该“第二症状样本的实际疾病诊断结果”的获取方式,例如,可以从病历样本中抽取得到。又如,可以由医生进行人工标注。
可见,在确定未达到第二停止条件时,可以确定待优化预诊模型的预测性能仍然比较差,故可以根据第二疾病预诊结果和第二症状样本的实际疾病诊断结果之间的差异性,更新待优化预诊模型,以使更新后的待优化预诊模型具有更好的预测性能。
步骤47:根据第二症状预测结果和样本症状集对应的实际关联症状,更新待优化症状模型。
上述“样本症状集对应的实际关联症状”是指与该样本症状集中至少一个症状具有关联关系的症状。需要说明的是,对于两个症状来说,如果两个症状均属于同一个疾病对应的表现症状,则该两个症状具有关联关系(例如,“无鼻塞”和“打喷嚏”均属于鼻炎对应的表现症状,则“无鼻塞”和“打喷嚏”具有关联关系);如果这两个症状分别属于不同疾病对应的表现症状,则该两个症状不具有关联关系(例如,“打喷嚏”属于鼻炎对应的表现症状,且“瘙痒”属于皮炎对应的表现症状,则“打喷嚏”与“瘙痒”不具有关联关系)。
本申请实施例不限定上述“样本症状集对应的实际关联症状”的确定过程,例如,其具体可以包括:先将第二症状样本的实际疾病诊断结果中至少一个疾病对应的表现症状进行集合处理,得到该第二症状样本对应的表征症状集;再将该表征症状集与样本症状集之间的差集,确定为该样本症状集对应的实际关联症状。
基于上述步骤47的相关内容可知,在确定未达到第二停止条件时,可以确定待优化症状模型的预测性能比较差,故可以根据第二症状预测结果和样本症状集对应的实际关联症状之间的差异性,更新待优化症状模型,以使更新后的待优化症状模型具有更好的预测性能。
需要说明的是,本申请实施例不限定步骤47与步骤46的执行顺序,例如,可以依次执行步骤47和步骤46,也可以依次执行步骤46和步骤47,还可以同时执行步骤47和步骤46。
步骤48:返回执行步骤43。
本申请实施例中,在获取到更新后的待优化预诊模型以及更新后的待优化症状模型之后,可以基于更新后的待优化预诊模型以及更新后的待优化症状模型,执行步骤43及其后续步骤,以实现下一轮模型训练过程。
步骤49:根据待优化预诊模型和待优化症状模型,确定疾病预诊模型和症状预测模型。
本申请实施例中,在确定达到第二停止条件时,可以确定待优化预诊模型以及待优化症状模型均具有较好的预测性能,故可以将训练好的待优化预诊模型确定为疾病预诊模型,以使该疾病预诊模型具有较好的疾病预测性能,并可以将训练好的待优化症状模型确定为症状预测模型,以使该症状预测模型具有较好的症状预测性能。
基于上述步骤41至步骤49的相关内容可知,在一些情况下,可以借助两阶段训练过程,实现针对“疾病预诊模型”和“症状预测模型”的联合构建,以使构建好的“疾病预诊模型”和“症状预测模型”均具有较好的预测性能。
另外,为了进一步提高模型预测性能,本申请实施例提供了模型构建方法另一种可能的实施方式,在该实施方式中,该模型构建方法除了包括上述步骤41至步骤49以外,可以还包括步骤50-步骤52:
步骤50:根据第二症状预测结果,确定待添加症状。
上述“待添加症状”是指可能需要向上述“样本症状集”中进行添加的症状;而且该“待添加症状”类似于上文“待询问症状”。
步骤51:判断待添加症状是否属于样本症状集对应的实际关联症状,若是,则执行步骤52;若否,则执行步骤48。
本申请实施例中,在获取到待添加症状之后,可以判断该待添加症状是否属于样本症状集对应的实际关联症状,若属于,则可以确定在将该待添加症状添加至样本症状集之后能够有利于提高待优化预诊模型以及待优化症状模型的预测性能,故可以先将该待添加症状添加至该样本症状集,再执行步骤43及其后续步骤;若不属于,则可以确定在将该待添加症状添加至样本症状集之后易导致待优化预诊模型以及待优化症状模型的预测性能恶化,故可以直接执行步骤43及其后续步骤即可。
步骤52:将待添加症状添加至样本症状集,并返回执行步骤43。
需要说明的是,当上述“模型构建方法”包括步骤41-步骤52时,上述“第二停止条件”可以包括:上述“第二症状预测结果”中停止问询的发生概率高于该第二症状预测结果中任一症状的发生概率(也就是,基于第二症状预测结果确定的“待询问症状”包括“停止问询”)。
还需要说明的是,步骤52的执行时间晚于步骤47的执行时间,也晚于步骤46的执行时间,但早于步骤48的执行时间。
基于上述步骤41至步骤52的相关内容可知,在一些情况下,可以借助待优化预诊模型的更新过程、待优化症状模型的更新过程以及样本症状集的更新过程,共同引导待优化预诊模型以及待优化症状模型实现更好地学习过程,如此有利于进一步提高模型预测性能。
方法实施例三
为了进一步提高问诊效果,本申请实施例还提供了上述S222的另一种可能的实施方式,其具体可以包括步骤61-步骤63:
步骤61:根据第一症状预测结果,得到至少一个候选症状。
上述“至少一个候选症状”用于表示在第一症状预测结果中具有较高发生概率的症状;而且本申请实施例不限定该“至少一个候选症状”的确定过程,例如,其可以包括:将第一症状预测结果中发生概率达到第三概率条件的至少一种症状,确定为至少一个候选症状。
上述“第三概率条件”可以预先设定;而且本申请实施例不限定该“第三概率条件”,例如,“第三概率条件”可以为:达到预设概率阈值(例如,0.15)。又如,当第一症状预测结果用于记录按照发生概率从大到小进行排列的至少一种症状时,“第三概率条件”也可以为:排列序号低于E(也就是,取排名最靠前的E个症状)。其中,E为正整数。
步骤62:利用预先设定的无效症状筛选规则,对至少一个候选症状进行筛选处理,得到至少一个有效症状。
上述“无效症状筛选规则”可以预先设定;而且本申请实施例不限定该“无效症状筛选规则”,例如,其可以包括以下至少一个规则:(I)上述“待使用症状集”中已存在的症状视为无效症状;(II)已向待诊断患者询问过的症状视为无效症状;(III)与上述“待使用症状集”中各个症状之间的关联程度均满足预设无关联条件的症状视为无效症状。需要说明的是,上述“关联程度”的相关内容请参见下文步骤623中相关内容。
上述“预设无关联条件”可以预先设定;而且本申请实施例不限定该“预设无关联条件”,例如,其可以为:低于预设关联度阈值。又如,该“预设无关联条件”具体可以包括:待筛选症状与上述“待使用症状集”中各个症状之间的关联程度表示该待筛选症状不属于待使用症状集对应的高关联症状集。其中,“待筛选症状”可以是任一候选症状。
上述“待使用症状集对应的高关联症状集”用于记录与该待使用症状集中至少一个症状具有较高关联程度的症状;而且本申请实施例不限定该“待使用症状集对应的高关联症状集”的确定过程,例如,当待使用症状集包括Y个症状,且至少一种候选疾病对应的表现症状包括至少一个备选症状时,则该“待使用症状集对应的高关联症状集”的确定过程具体可以包括:先将各个备选症状与待使用症状集中第y个症状之间的关联程度按照从大到小进行排序,得到该第y个症状对应的症状关联排名序列;再将第y个症状对应的症状关联排名序列中排名序号低于预设序号阈值(例如,50)的症状进行集合,确定为该第y个症状对应的高关联症状集;其中,y为正整数,y≤Y,Y为正整数;最后,将第1个症状对应的高关联症状集、第2个症状对应的高关联症状集、……、以及第Y个症状对应的高关联症状集之间的并集,确定为“待使用症状集对应的高关联症状集”。
上述“有效症状”用于表示不满足无效症状筛选规则的候选症状。
本申请实施例不限定步骤62的实施方式,例如,当“无效症状筛选规则”包括上述(I)-(III)时,步骤62具体可以包括步骤621-步骤624:
步骤621:若确定至少一个候选症状包括至少一个第一症状,则将各个第一症状均确定为无效症状。其中,第一症状属于待使用症状集。
上述“第一症状”用于表示与待使用症状集中某个症状相同的候选症状。可见,第一症状是指属于待使用症状集的候选症状;而且上述“至少一个第一症状”是指上述“至少一个候选症状”与待使用症状集之间的交集。
另外,本申请实施例不限定该“第一症状”的确定过程,例如,当上述“至少一个候选症状”包括C个候选症状时,该“第一症状”的确定过程具体可以包括:若确定待使用症状集中存在与第c个候选症状相同的症状,则可以将该第c个候选症状确定为第一症状;若确定待使用症状集中不存在与第c个候选症状相同的症状,则可以确定该第c个候选症状不是第一症状。其中,c为正整数,c≤C,C为正整数。
步骤622:若确定至少一个候选症状包括至少一个第二症状,则将各个第二症状均确定为无效症状。
上述“第二症状”用于表示在当前轮问诊交互过程之前已经向待诊断患者询问过的症状。可见,第二症状是指属于历史询问症状集的候选症状;而且上述“至少一个第二症状”是指上述“至少一个候选症状”与历史询问症状集之间的交集。其中,“历史询问症状集”用于记录已向待诊断患者询问过的症状(也就是,在当前轮问诊交互过程之前已经向待诊断患者询问过的症状)。
另外,本申请实施例不限定该“第二症状”的确定过程,例如,当上述“至少一个候选症状”包括C个候选症状时,该“第二症状”的确定过程具体可以包括:若确定历史询问症状集中存在与第c个候选症状相同的症状,则可以将该第c个候选症状确定为第二症状;若确定待使用症状集中不存在与第c个候选症状相同的症状,则可以确定该第c个候选症状不是第二症状。其中,c为正整数,c≤C,C为正整数。
步骤623:若确定至少一个候选症状包括至少一个第三症状,则将各个第三症状均确定为无效症状。
上述“第三症状”用于表示与待使用症状集中任一症状之间的关联程度均满足预设无关联条件的候选症状。可见,第三症状与待使用症状集中任一症状之间的关联程度均满足预设无关联条件。
另外,本申请实施例不限定该“第三症状”的确定过程,例如,当上述“至少一个候选症状”包括C个候选症状时,该“第三症状”的确定过程具体可以包括:先计算第c个候选症状与待使用症状集中各个症状之间的关联程度,得到该第c个候选症状对应的至少一个待使用关联度;再判断该第c个候选症状对应的至少一个待使用关联度是否均满足预设无关联条件,若满足,则可以确定该第c个候选症状与待使用症状集中各个症状之间的关联程度均比较低,故可以将该第c个候选症状确定为第三症状;若不满足,则可以确定待使用症状集中存在与该第c个候选症状之间的关联程度比较高的症状,故可以确定该第c个候选症状不是第三症状。其中,c为正整数,c≤C,C为正整数。
此外,本申请实施例不限定两个症状之间的关联程度的计算过程,为了便于理解,下面结合示例进行说明。
作为示例,当待使用症状集包括待比较症状(例如,第c个候选症状)时,第三症状与待比较症状之间的关联程度的确定过程,具体可以包括:步骤71-步骤72:
步骤71:若待比较症状满足第一条件,则将第三症状与该待比较症状之间的点互信息(Pointwise Mutual Information,PMI),确定为该第三症状与该待比较症状之间的关联程度。
上述“第一条件”可以预先设定;而且本申请实施例不限定“第一条件”,例如,其具体可以为:属于阳性症状。需要说明的是,在医学领域中,每个症状均有阴阳性之分,而且其具体包括:若有该症状表现,则为阳性;若无该症状表现,则为阴性。例如:发热属于阳性症状,无发热属于阴性症状。
上述“第三症状与该待比较症状之间的点互信息”用于描述在语料库中第三症状与待比较症状的共现关系。其中,“语料库”用于记录医学领域的资料数据;而且该“语料库”可以包括大量病历数据、大量医学书籍数据、大量医学论文等。
步骤72:若待比较症状满足第二条件,则将预设关联度值,确定为第三症状与该待比较症状之间的关联程度。
上述“第二条件”可以预先设定;而且本申请实施例不限定“第二条件”,例如,其具体可以为:不属于阳性症状(例如,属于阴性症状、或者属于无关症状)。
需要说明的是,“无关症状”是指与待诊断患者所患疾病不相关的症状;而且本申请实施例不限定“无关症状”的确定过程,例如,对于一个历史询问症状(例如,乳房胀痛)来说,若待诊断患者未在预设反馈时间内针对该历史询问症状进行反馈,则可以确定该待诊断患者认为该历史询问症状与其所患疾病(例如,疑似呼吸道疾病等)无关,进而可以确定该历史询问症属于无关症状;若待诊断患者在预设反馈时间内完成针对该历史询问症状的反馈,则可以根据反馈内容,确定生成该历史询问症对应的阳性症状(例如,乳房胀痛)或者阴性症状(例如,无乳房胀痛)。
上述“预设关联度值”可以预先设定;而且本申请实施例不限定该“预设关联度值”,例如,其具体可以为0。可见,因非阳性症状(例如,阴性症状或者无关症状)所携带的字符信息与需要向待诊断患者询问的可能症状所携带的字符信息之间的差异性比较大,故可以直接将预设关联度值,确定为该非阳性症状与该可能症状之间的关联程度,以使该关联程度能够更准确地表示出该非阳性症状与该可能症状之间的较大差异。
需要说明的是,第c个候选症状与待使用症状集中第y个症状之间的关联程度均可以采用上述步骤71至步骤72进行实施,只需将上述步骤71至步骤72中“第三症状”替换为“第c个候选症状”、以及“待比较症状”替换为第y个症状即可。其中,y为正整数,y≤Y,Y为正整数;c为正整数,c≤C,C为正整数。
基于上述步骤623的相关内容可知,在获取到至少一个候选症状之后,可以根据各个候选症状与待使用症状集中各个症状之间的关联程度,判断各个候选症状是否满足上述(III)所示的无效症状筛选规则,以便后续参考该判断结果,确定这些候选症状中的无效症状。
步骤624:在确定至少一个候选症状中存在至少一个无效症状之后,从该至少一个候选症状中删除该至少一个无效症状,得到至少一个有效症状。
本申请实施例中,在确定上述“至少一个候选症状”中存在至少一个无效症状(例如,至少一个第一症状、至少一个第二症状、和/或至少一个第三症状等)之后,可以将这些无效症状均从该“至少一个候选症状”中删除,得到至少一个有效症状,以使该“至少一个有效症状”用于表示不满足上述(I)-(III)所示的“无效症状筛选规则”的候选症状。
基于上述步骤62的相关内容可知,在获取到至少一个候选症状之后,可以先从这些候选症状中筛选出满足无效症状筛选规则的至少一个无效症状;再将这些无效症状从这些候选症状中剔除,得到至少一个有效症状,以使这些有效症状用于表示不满足该无效症状筛选规则的候选症状,以便后续能够从这些有效症状中挑选出在当前轮问询交互过程中需要向待诊断患者询问的症状。
步骤63:从至少一个有效症状中确定出待询问症状。
本申请实施例不限定步骤63的实施方式,例如,其具体可以为:从至少一个有效症状中随机选择一个(或,多个)有效症状,确定为待询问症状。又如,其具体可以为:将至少一个有效症状中具有最高发生概率的有效症状(或者,具有较高发生概率的多个有效症状),确定为待询问症状。
基于上述步骤61至步骤63的相关内容可知,对于针对待诊断患者的一轮问诊过程来说,在利用待使用症状集确定出第一症状预测结果之后,可以先参考该第一症状预测结果,确定至少一个候选症状;再从这些候选症状中剔除那些不需要向待诊断患者询问的症状(例如,“待使用症状集”中已存在的症状、已询问过的症状、与“待使用症状集”中所有症状基于无关的症状等无效症状),得到至少一个有效症状;最后,从这些有效症状中挑选出待询问症状,如此能够有效地避免在当前轮问询交互过程中向该待诊断患者询问一些无效症状,从而有利于提高问诊效果。
方法实施例四
为了进一步提高问诊效果,本申请实施例还提供了上述S5的另一种可能的实施方式,其具体可以包括S51-S52:
S51:将待使用症状集输入预先构建的疾病预测模型,得到该疾病预测模型输出的疾病预测结果。
上述“疾病预测模型”用于针对该疾病预测模型的输入数据进行疾病预测处理;而且本申请实施例不限定该“疾病预测模型”,例如,可以任一种机器学习模型进行实施。
上述“疾病预测结果”用于表示待诊断患者患有至少一种候选疾病的发生概率(例如,鼻炎的发生概率为0.4;肺炎的发生概率为0.39;皮炎的发生概率为0.008;乳腺炎的发生概率为0.0001;……)。
S52:根据疾病预测结果,确定待诊断患者的问诊结果。
本申请实施例不限定S52的实施方式,例如,S52具体可以包括S521-S522:
S521:根据疾病预测结果,确定待使用疾病信息。
本申请实施例不限定S521的实施方式,例如,其具体可以包括:将疾病预测结果中具有最高发生概率的候选疾病(或者,具有较高发生概率的多个候选疾病),确定为待使用疾病信息。
S522:根据待使用疾病信息,确定该待诊断患者的问诊结果。
需要说明的是,S522的相关内容请参见上文步骤32的相关内容。
基于上述S51至S52的相关内容可知,如图6所示,在确定达到在确定达到第一停止条件时,可以确定针对待诊断患者的问诊过程已结束,故可以先利用预先构建的疾病预测模型针对待使用症状集中所有症状(例如,患者自述症状以及通过问诊交互过程询问到的症状等)进行疾病预测处理,得到并输出疾病预测结果;再参考该疾病预测结果,确定待诊断患者的问诊结果,以使该问诊结果能够更准确地表示出该待诊断患者的身体状况,以便后续医生能够参考该问诊结果对该待诊断患者进行更准确地疾病诊断。
可见,因上述“疾病预测模型”具有较好地疾病预测性能,使得利用该“疾病预测模型”针对待使用症状集中所有症状预测所得的疾病预测结果,能够更好地表示出该待诊断患者患有各种候选疾病的发生概率,从而使得参考该疾病预测结果确定的问诊结果能够更准确地表示出该待诊断患者的身体状况(例如,身体出现了哪些症状,未出现哪些症状,疑似患有哪些疾病等)。
另外,为了进一步提高问诊效果,本申请实施例还提供了上述S5的又一种可能的实施方式,其具体可以包括步骤81-步骤82:
步骤81:将待使用症状集输入预先构建的第m个疾病预测模型,得到该第m个疾病预测模型输出的第m个疾病预测结果。其中,m为正整数,m≤M。
上述“第m个疾病预测模型”用于针对该第m个疾病预测模型的输入数据进行疾病预测处理;而且本申请实施例不限定该“第m个疾病预测模型”,例如,可以任一种机器学习模型进行实施。
另外,为了进一步提高疾病预测准确性,可以采用多个疾病预测性能不同的疾病预测模型,针对待使用症状集中所有症状进行疾病预测处理。可见,“第m个疾病预测模型”的疾病预测性能不同于M个疾病预测模型中除了该第m个疾病预测模型以外的其他任意一个疾病预测模型的疾病预测性能;其具体为:“第m个疾病预测模型”的模型结构(和/或构建过程)不同于M个疾病预测模型中除了该第m个疾病预测模型以外的其他任意一个疾病预测模型的模型结构(和/或构建过程)。
基于此,本申请实施例还提供了上述“第m个疾病预测模型”的一种可能的实施方式,其具体可以包括文本向量提取网络和第m个文本分类网络;而且该第m个文本分类网络的输入数据包括该文本向量提取网络的输出数据。
上述“文本向量提取网络”用于针对该文本向量提取网络的数据进行文本向量表征处理;而且本申请实施例不限定该“文本向量提取网络”,例如,其可以采用双向编码模型(Bidirectional Encoder Representation fromTransformers,BERT)中12层transformer网络(例如,12层Encoder+12层Decoder)架构进行实施。
上述“第m个文本分类网络”的网络结构不同于M个疾病预测模型中除了该第m个疾病预测模型以外的其他任意一个疾病预测模型中文本分类网络的网络结构。例如,当M为4时,则第1个文本分类网络(也就是,第1个疾病预测模中文本分类网络)可以采用卷积神经网络(Congolutional Neural Networks,CNN)进行实施,第2个文本分类网络(也就是,第2个疾病预测模中文本分类网络)可以采用循环神经网络(Recurrent Neural Network,RNN)进行实施,第3个文本分类网络(也就是,第3个疾病预测模中文本分类网络)可以采用深度卷积神经网络(Deep pyramid Congolutional Neural Networks for TextCategorization,DPCNN)进行实施,第4个文本分类网络(也就是,第4个疾病预测模中文本分类网络)可以采用多特征卷积神经网络(Rich feature hierarchies for accurateoject detection and semantic segmentation,RCNN)进行实施。
本申请实施例不限定上述“第m个疾病预测模型”的构建过程,例如,其具体可以包括步骤91-步骤92:
步骤91:在获取到预训练模型之后,根据该预训练模型和第m个文本分类网络,得到第m个待训练模型。
上述“预训练模型”用于针对该预训练模型的输入数据进行文本向量表征处理;而且本申请实施例不限定该“预训练模型”,例如,其可以是谷歌发布的BERT预训练模型。
可见,在获取到谷歌发布的BERT预训练模型之后,可以在该BERT中12层transformer架构上添加第m个文本分类网络(例如,CNN、RNN、DPCNN、或RCNN),得到第m个待训练模型,以便后续能够借助针对该第m个待训练模型的训练过程(例如,参数微调过程等),得到第m个疾病预测模型。
步骤92:利用第三症状样本和该第三症状样本的实际疾病诊断结果,对第m个待训练模型进行训练,得到第m个疾病预测模型。
上述“第三症状样本”用于表示对第m个待训练模型进行训练时所需使用的样本数据;而且本申请实施例不限定“第三症状样本”,例如,该“第三症状样本”可以是一个症状集合(例如,类似于{咳嗽、发热、打喷嚏}的症状集合)。另外,本申请实施例不限定上述“第三症状样本”的获取方式,例如,可以从病历样本中抽取得到。
上述“第三症状样本的实际疾病诊断结果”用于表示由医生参考该第三症状样本携带的症状信息实际诊断出的疾病;而且本申请实施例不限定该“第三症状样本的实际疾病诊断结果”的获取方式,例如,可以从病历样本中抽取得到。又如,可以由医生进行人工标注。
本申请实施例不限定步骤92的实施方式,例如,可以采用现有的或者未来出现的任一种模型训练方法进行实施。又如,为了进一步提高第m个疾病预测模型的疾病预测性能,本申请实施例还提供了步骤92的另一种可能的实施方式,其具体可以包括步骤101-106:
步骤101:将第三症状样本输入第m个待训练模型,得到该第m个待训练模型输出的该第三症状样本的预测疾病诊断结果。
上述“第三症状样本的预测疾病诊断结果”用于表示参考该第三症状样本中所有症状确定的可能患有的疾病;而且该“第三症状样本的预测疾病诊断结果”类似于上文“待使用疾病诊断结果”。
步骤102:判断第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差距是否满足预设保留条件,若是,则执行步骤103-104;若否,则执行步骤104。
本申请实施例不限定上述“第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差距”的确定过程,例如,当上述“第三症状样本的实际疾病诊断结果”记录有鼻炎的实际发生概率为1、皮炎的实际发生概率为0、乳腺癌的实际发生概率为0、……,而且上述“第三症状样本的预测疾病诊断结果”记录有鼻炎的实际发生概率为0.8、皮炎的实际发生概率为0.1、乳腺癌的实际发生概率为0.05、……时,则可以按照预设距离计算公式(例如,欧氏距离、余弦距离等),确定上述“第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差距”。
上述“预设保留条件”可以预先设定;而且本申请实施例不限定该“预设保留条件”,例如,低于预设差距阈值。
基于上述步骤102的相关内容可知,在获取到第三症状样本的预测疾病诊断结果之后,可以计算第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差距;再判断该差距是否满足预设保留条件;若满足,则可以确定该第m个待训练模型的疾病预测性能比较好,故可以执行下文步骤103-104;但是,若不满足,则可以确定该第m个待训练模型的疾病预测性能比较差,故可以直接执行下文步骤104即可。
步骤103:将第m个待训练模型的模型参数,确定为待使用模型参数集。
上述“待使用模型参数集”用于表示构建第m个疾病预测模型时所需参考的模型参数。可见,对于针对第m个待训练模型的每一轮训练过程来说,只要在确定出第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差距满足预设保留条件时,可以直接将当前轮第m个待训练模型的所有模型参数,确定为一个待使用模型参数集进行保存处理,以便在完成针对该第m个待训练模型的所有训练过程之后,可以参考保存下来的至少一个待使用模型参数集,构建第m个疾病预测模型。
步骤104:判断是否达到第三停止条件,若是,则执行步骤106;若否,则执行步骤105。
上述“第三停止条件”可以预先设定;例如,可以采用现有的或者未来出现的任一模型停止条件(例如,模型更新次数达到预设次数阈值、第m个待训练模型呈收敛状态、第m个待训练模型的预测性能达到预设性能阈值等)进行实施。
步骤105:根据第三症状样本的疾病诊断预测结果和该第三症状样本的实际疾病诊断结果,更新第m个待训练模型,并返回执行步骤101。
本申请实施例中,在确定未达到第三停止条件时,可以确定仍未完成针对第m个待训练模型的所有训练过程,故可以参考第三症状样本的预测疾病诊断结果与该第三症状样本的实际疾病诊断结果之间的差异性,更新第m个待训练模型,得到更新后的第m个待训练模型,以便后续能够基于更新后的第m个待训练模型继续执行步骤101及其后续步骤,以实现针对该第m个待训练模型的下一轮训练过程。
步骤106:根据至少一个待使用模型参数集,确定第m个疾病预测模型。
本申请实施例不限定步骤106的实施方式,例如,其具体可以包括:先对至少一个待使用模型参数集进行平均处理(如公式(5)-(6)所示),得到平均模型参数集;再根据该平均模型参数集和第m个待训练模型的模型结构,确定第m个疾病预测模型,以使该第m个疾病预测模型的模型结构与该第m个待训练模型的模型结构相同,且使得该第m个疾病预测模型的所有模型参数均属于该平均模型参数集。
Figure BDA0003315185210000221
Figure BDA0003315185210000222
式中,Aparameter表示平均模型参数集;Pl表示第l个待使用模型参数集;
Figure BDA0003315185210000223
表示第l个待使用模型参数集中第b个模型参数,b为正整数,b≤B,B为正整数,B表示第m个待训练模型中模型参数个数。
基于上述步骤106的相关内容可知,在确定达到第三停止条件时,可以确定已完成针对第m个待训练模型的所有训练过程,故可以参考至少一个待使用模型参数集所包括的模型参数、以及第m个待训练模型的模型结构,确定第m个疾病预测模型,以使该第m个疾病预测模型的疾病预测性能更稳定准确。
基于上述步骤91至步骤92的相关内容可知,在一些情况下,为了提高训练效率,可以先通过向一些预训练模型(例如,BERT预训练模型)中添加文本分类网络的方式,初始化各个疾病预测模型;再借助第三症状样本及其实际疾病诊断结果,实现针对这些疾病预测模型的多轮模型参数微调处理,如此使得最终得到的各个疾病预测模型均具有更好地疾病预测性能。
基于上述步骤81的相关内容可知,在确定达到在确定达到第一停止条件时,可以确定针对待诊断患者的问诊过程已结束,故可以利用预先构建的M个疾病预测模型分别针对待使用症状集中所有症状进行疾病预测处理,分别得到M个疾病预测结果,以便后续能够综合该M个疾病预测结果,确定待诊断患者的问诊结果。
步骤82:根据第1个疾病预测结果至第M个疾病预测结果,确定待诊断患者的问诊结果。
本申请实施例不限定步骤82的实施方式,为了便于理解,下面结合两个示例进行说明。
示例1,当第m个疾病预测结果包括至少一个候选疾病的发生概率时,则步骤82具体可以包括:先利用第1个疾病预测结果至第M个疾病预测结果,确定至少一个候选疾病的患有概率;再根据该至少一个候选疾病的患有概率,确定待诊断患者的问诊结果。
第g个候选疾病的患有概率用于表示待诊断患者患有该第g个候选疾病的可能性;而且本申请实施例不限定该“第g个候选疾病的患有概率”的确定过程,例如,对第1个疾病预测结果中第g个候选疾病的发生概率、第2个疾病预测结果中第g个候选疾病的发生概率、……、以及第M个疾病预测结果中第g个候选疾病的发生概率进行第三统计分析处理,得到第g个候选疾病的患有概率。其中,g为正整数,g≤G,G为正整数,G表示候选疾病个数。
需要说明的是,上述“第三统计分析处理”可以预先设定;而且本申请实施例不限定该“第三统计分析处理”,例如,其可以是取平均值处理、取最大值处理、或者取最小值处理等。
本申请实施例不限定上述步骤“根据该至少一个候选疾病的患有概率,确定待诊断患者的问诊结果”的实施方式,例如,其具体可以包括:先将具有最高患有概率的候选疾病(或者,具有较高患有概率的多个候选疾病),确定为待使用疾病信息;再根据该待使用疾病信息,确定该待诊断患者的问诊结果。
基于上述示例1的相关内容可知,在获取到第1个疾病预测结果至第M个疾病预测结果之后,可以先对该疾病预测结果进行统计分析,得到待诊断患者患有各个候选疾病的可能性;再参考待诊断患者患有各个候选疾病的可能性,确定待诊断患者的问诊结果,以使该问诊结果能够更准确地表示出该待诊断患者的身体状况。
示例2,步骤82具体可以包括步骤821-步骤823:
步骤821:根据第m个疾病预测结果,确定第m个待使用疾病。其中,m为正整数,m≤M。
上述“第m个待使用疾病”是指第m个疾病预测结果中具有最大发生概率的疾病。
步骤822:对第1个待使用疾病至第M个待使用疾病进行第一统计分析处理,得到统计分析结果。
上述“第一统计分析处理”可以预先设定;而且本申请实施例不限定该“第一统计分析处理”,例如,其可以是出现频次统计处理。
上述“统计分析结果”用于表示针对第1个待使用疾病至第M个待使用疾病的第一统计分析处理结果;而且本申请实施例不限定该“统计分析结果”,例如,其具体可以为:第一疾病的出现频次为w1,第二疾病的出现频次为w2,第三疾病的出现频次为w3,且w1+w2+w3=M。其中,w1、w2、w3均是正整数。
步骤823:根据统计分析结果,确定待诊断患者的问诊结果。
作为示例,当上述“统计分析结果”包括至少一个疾病的出现频次,且“待诊断患者的问诊结果”携带有疾病患有信息时,步骤823具体可以为:先将该统计分析结果中具有最高出现频次的疾病,确定为待使用疾病信息;再根据该待使用疾病信息,确定该待诊断患者的问诊结果。
基于上述步骤81至步骤82的相关内容可知,在确定达到在确定达到第一停止条件时,可以确定针对待诊断患者的问诊过程已结束,故可以先利用预先构建的多个疾病预测模型分别针对待使用症状集中所有症状进行疾病预测处理,得到多个疾病预测结果;再参考这些疾病预测结果,确定待诊断患者的问诊结果,以使该问诊结果携带的疾病信息更稳定准确,如此有利于提高问诊效果。
另外,为了进一步提高问诊效果,本申请实施例还提供了上述S5的又一种可能的实施方式,其具体可以包括步骤111-步骤115:
步骤111:根据待使用症状集和至少一个疾病预测模型,确定至少一个疾病预测结果。
需要说明的是,步骤111可以采用步骤81的任一实施方式或者S51的任一实施方式进行实施。
步骤112:判断至少一个疾病预测结果是否满足预设置信度条件,若是,则执行步骤113;若否,则执行步骤114-115。
上述“预设置信度条件”可以预先设定;而且本申请实施例不限定该“预设置信度条件”,例如,其具体可以包括:上述“至少一个疾病预测结果”中存在达到优质预测条件的疾病预测结果。其中,“优质预测条件”是指一个疾病预测结果中最高发生概率与第二高发生概率之间的差值大于预设差值阈值(也就是,最高发生概率远远大于第二高发生概率)。
可见,在获取到至少一个疾病预测结果之后,可以先判断这些疾病预测结果是否满足预设置信度条件;若满足,则可以确定这些疾病预测结果中存在至少一个置信度较高的疾病预测结果,故可以直接根据这些疾病预测结果,确定待诊断患者的问诊结果;若不满足,则可以确定这些疾病预测结果的置信度均比较低,故为了提高问诊效果,可以采用下文步骤114-115,确定待诊断患者的问诊结果。
步骤113:根据至少一个疾病预测结果,确定待诊断患者的问诊结果。
需要说明的是,步骤113可以采用步骤82的任一实施方式或者S52的任一实施方式进行实施。
步骤114:根据至少一个候选疾病对应的至少一个症状的鉴别性表征数据,从该至少一个候选疾病对应至少一个症状中选择满足预设鉴别条件的至少一个参考症状。
第g个候选疾病对应的至少一个症状均属于第g个候选疾病对应的表现症状。
第g个候选疾病对应的第v个症状的鉴别性表征数据用于表示该第v个症状对该第g个候选疾病的诊断影响程度。例如,如图7所示的“0.4610805162361092”就是皮炎对应的瘙痒的鉴别性表征数据。其中,g为正整数,g≤G,G为正整数,G表示候选疾病个数;v为正整数,v≤Vg,Vg为正整数,Vg表示“第g个候选疾病对应的至少一个症状”中的症状个数。
本申请实施例不限定上述“鉴别性表征数据”的确定过程,例如,其可以借助词频逆文本频率指数(termfrequency–inverse document frequency,tf-idf)进行实现。为了便于理解,下面结合示例进行说明。
作为示例,当上述“第g个候选疾病对应的至少一个症状”包括待评估症状时,该待评估症状的鉴别性表征数据的确定过程,具体可以包括步骤121-步骤124:
步骤121:从语料库中确定G个候选疾病对应的参考文件。
作为示例,当语料库包括大量电子病历,且该电子病历包括医生针对患者诊断出的疾病信息时,则步骤121具体可以包括步骤:先从该语料库中查找包括第g个候选疾病的至少一个电子病历,得到该第g个候选疾病对应的至少一个电子病历;再根据该第g个候选疾病对应的至少一个电子病历,确定该第g个候选疾病对应的参考文件。其中,g为正整数,g≤G,G为正整数。
需要说明的是,本申请实施例不限定上述步骤“根据该第g个候选疾病对应的至少一个电子病历,确定该第g个候选疾病对应的参考文件”的实施方式,例如,可以将第g个候选疾病对应的至少一个电子病历进行集合处理,得到该第g个候选疾病对应的参考文件。又如,可以将第g个候选疾病对应的至少一个电子病历进行拼接处理,得到该第g个候选疾病对应的参考文件。
步骤122:根据第g个候选疾病对应的参考文件,确定待评估症状的词频。
上述“待评估症状的词频”用于表示该待评估症状在上述“第g个候选疾病对应的参考文件”中出现的频率。
另外,本申请实施例不限定步骤122的实施方式,例如,其具体可以包括:将该待评估症状在“第g个候选疾病对应的参考文件”中的出现次数与该“第g个候选疾病对应的参考文件”中词汇总数之间的比值,确定为该待评估症状的词频。
此外,因上述“第g个候选疾病对应的参考文件”是基于多个电子病历生成的,故为了提高待评估症状的鉴别性表征数据的准确性,本申请实施例还提供了步骤122的另一种可能的实施方式,在该实施方式中,上述“第g个候选疾病对应的参考文件”包括Jg个病历文件,且步骤122具体可以包括步骤1221-步骤1222:
步骤1221:根据上述“第g个候选疾病对应的参考文件”中第j个病历文件,确定待评估症状的第j个出现频率。其中,j为正整数,j≤Jg,Jg为正整数。
上述“第j个出现频率”用于表示该待评估症状在上述“第g个候选疾病对应的参考文件”中第j个病历文件内出现的频率。
另外,本申请实施例不限定该“第j个出现频率”的确定过程,例如,其具体可以包括:将该待评估症状在该第j个病历文件中的出现次数与该第j个病历文件中词汇总数之间的比值,确定为该待评估症状的第j个出现频率。
步骤1222:对待评估症状的第1个出现频率至待评估症状的第Jg个出现频率进行第二统计分析处理,得到待评估症状的词频。
上述“第二统计分析处理”可以预先设定;而且本申请实施例不限定该“第二统计分析处理”,例如,其具体可以为取平均值、取最大值、取最小值等。
基于上述步骤122的相关内容可知,对于待评估症状来说,在获取到第g个候选疾病对应的参考文件之后,可以参考该第g个候选疾病对应的参考文件,确定该待评估症状的词频,以使该待评估症状的词频能够表示出该待评估症状在该参考文件中出现的频率,以便后续能够参考该待评估症状的词频,确定该待评估症状的鉴别性表征数据。
步骤123:根据G个候选疾病对应的参考文件,确定待评估症状的逆向文件频率。
上述“待评估症状的逆向文件频率”用于度量该待评估症状对第g个候选疾病的诊断过程的重要性。
另外,本申请实施例不限定步骤123的实施方式,例如,其具体可以为:将G与包括待评估症状的参考文件个数之间的比值,确定为该待评估症状的逆向文件频率。
此外,因每一个参考文件均是基于多个电子病历生成的,故为了提高待评估症状的鉴别性表征数据的准确性,本申请实施例还提供了步骤123的另两种可能的实施方式,下面分别进行介绍。
在一种可能的实施方式下,当上述“第g个候选疾病对应的参考文件”包括Jg个病历文件时,步骤123具体可以包括步骤131-步骤133:
步骤131:将Jg个病历文件中包括待评估症状的病历文件个数与Jg之间比值,确定为第g个第一数值。其中,g为正整数,g≤G。
本申请实施例中,对于上述“第g个候选疾病对应的参考文件”所包括的Jg个病历文件来说,先从该Jg个病历文件中查找出包括待评估症状的所有目标病历;再将目标病历的个数与Jg之间比值,确定为第g个第一数值,以使该第g个第一数值能够表示出该待评估症状对第g个候选疾病的重要性;而且该第g个第一数值越大,则表示该待评估症状对第g个候选疾病越重要。其中,g为正整数,g≤G。
步骤132:将第1个第一数值至第G个第一数值进行加和处理,得到第二数值。
本申请实施例中,对于待评估症状来说,在获取到该待评估症状对应的第1个第一数值至第G个第一数值之后,可以将该G个第一数值进行加和处理,得到该待评估症状对应的第二数值,以便后续该第二数值能够代替上述“包括待评估症状的参考文件个数”,参与“待评估症状的逆向文件频率”的确定过程。
步骤133:根据G与第二数值之间的比值,确定待评估症状的逆向文件频率。
本申请实施例中,对于待评估症状来说,在获取到该待评估症状对应的第二数值之后,可以将G与该第二数值之间的比值,确定为待评估症状的逆向文件频率。
基于上述步骤131至步骤133的相关内容可知,对于待评估症状来说,可以参考该待评估症状在每种疾病对应的多个病历文本中出现情况,综合确定该待评估症状的逆向文件频率,以使该逆向文件频率能够更好地表示出该待评估症状对第g个候选疾病的诊断过程的重要性。
在另一种可能的实施方式中,步骤123具体可以包括步骤141-步骤143:
步骤141:将G个候选疾病对应的参考文件中包括待评估症状的各个参考文件,均确定为待使用文件。
上述“待使用文件”用于表示包括待评估症状的参考文件;而且本申请实施例不限定该“待使用文件”的确定过程,例如,其具体可以包括:判断第g个候选疾病对应的参考文件中是否出现待评估症状,若出现,则将该第g个候选疾病对应的参考文件,确定为待使用文件;若否,则舍弃该第g个候选疾病对应的参考文件。其中,g为正整数,g≤G。
步骤142:将所有待使用文件中待评估症状的出现概率进行加和,得到第三数值。其中,待使用文件是指包括待评估症状的参考文件。
第d个待使用文件中待评估症状的出现概率是指该待评估症状在该第d个待使用文件中出现的频率。其中,d为正整数,d≤D,D为正整数,D表示待使用文件个数。
另外,本申请实施例不限定上述“第d个待使用文件中待评估症状的出现概率”的确定过程,例如,采用上述步骤122的任一实施方式进行实施,只需将上述步骤122的任一实施方式中“第g个候选疾病对应的参考文件”替换为“第d个待使用文件”、以及“待评估症状的词频”替换为“第d个待使用文件中待评估症状的出现概率”即可。
基于上述步骤142的相关内容可知,对于待评估症状来说,在获取到D个待使用文件之后,先确定第d个待使用文件中待评估症状的出现概率;其中,d为正整数,d≤D,D为正整数。然后,将第1个待使用文件中待评估症状的出现概率、第2个待使用文件中待评估症状的出现概率、……、以及第D个待使用文件中待评估症状的出现概率进行加和处理,得到该待评估症状对应的第三数值,以便后续该第三数值能够代替上述“包括待评估症状的参考文件个数”,参与“待评估症状的逆向文件频率”的确定过程。
步骤143:根据G与第三数值之间的比值,确定待评估症状的逆向文件频率。
本申请实施例中,对于待评估症状来说,在获取到该待评估症状对应的第三数值之后,可以将G与该第三数值之间的比值,确定为待评估症状的逆向文件频率。
基于上述步骤131至步骤133的相关内容可知,对于待评估症状来说,可以参考该待评估症状在每种疾病对应的参考文本中出现的频率,综合确定该待评估症状的逆向文件频率,以使该逆向文件频率能够更好地表示出该待评估症状对第g个候选疾病的诊断过程的重要性。
基于上述步骤123的相关内容可知,对于待评估症状来说,在获取到G个候选疾病对应的参考文件之后,可以参考该G个参考文件,确定该待评估症状的逆向文件频率,以使该逆向文件频率能够表示出该待评估症状对第g个候选疾病的诊断过程的重要性,以便后续能够参考该逆向文件频率,确定该待评估症状的鉴别性表征数据。
步骤124:根据待评估症状的词频与该待评估症状的逆向文件频率之间的乘积,确定该待评估症状的鉴别性表征数据。
本申请实施例中,对于待评估症状来说,在获取到待评估症状的词频和该待评估症状的逆向文件频率之后,可以将待评估症状的词频与该待评估症状的逆向文件频率之间的乘积,确定为该待评估症状的鉴别性表征数据,以使该鉴别性表征数据能够表示出该待评估症状对该第g个候选疾病的诊断影响程度。
基于上述步骤121至步骤124的相关内容可知,对于某个疾病对应的一个症状来说,可以借助tf-idf的计算思路,确定该症状的鉴别性表征数据,以使该该鉴别性表征数据能够表示出该症状对该疾病的诊断影响程度。
需要说明的是,上文“第g个候选疾病对应的第v个症状的鉴别性表征数据”可以采用步骤121至步骤124进行确定,只需将步骤121至步骤124中“待评估症状”替换为“第v个症状”即可。其中,g为正整数,g≤G,G为正整数;v为正整数,v≤Vg,Vg为正整数。
上述“预设鉴别条件”可以预先设定;而且本申请实施例不限定该“预设鉴别条件”,例如,其具体可以为:大于预设表征阈值(例如,0.2)。
上述“参考症状”用于表示满足预设鉴别条件的症状(也就是,某个疾病下具有强代表性的症状)。例如,如图7所示,当上述“预设鉴别条件”为大于0.2时,可以将“瘙痒”、“皮疹”、“乳房胀痛”等均确定为参考症状。
基于上述114的相关内容可知,在确定上述“至少一个疾病预测结果”不满足预设置信度条件之后,可以根据各个候选疾病对应的各个症状的鉴别性表征数据,从这些候选疾病的所有症状中挑选出一些具有强代表性的症状,确定为参考症状,以便后续能够基于这些参考症状,快速地预测出待诊断患者很有可能患有的疾病。
步骤115:根据至少一个参考症状与待使用症状集之间的症状匹配结果,确定待诊断患者的问诊结果。
上述“症状匹配结果”用于表示上述“至少一个参考症状”中是否存在与待使用症状集中至少一个症状匹配成功的参考症状。
另外,本申请实施例不限定步骤115的实施方式,例如,当上述“至少一个参考症状”包括待匹配症状,且上述“症状匹配结果”表示待使用症状集中存在与该待匹配症状匹配成功的症状时,可以将该待匹配症状对应的候选疾病,确定为待使用疾病信息;再根据该待使用疾病信息,确定该待诊断患者的问诊结果。
基于上述步骤111至步骤115的相关内容可知,在确定达到在确定达到第一停止条件时,可以确定针对待诊断患者的问诊过程已结束,故可以先利用预先构建的至少一个疾病预测模型分别针对待使用症状集中所有症状进行疾病预测处理,得到至少一个疾病预测结果;再判断这些疾病预测结果是否可信,以便在确定这些疾病预测结果的可信性比较小时,可以借助大量候选疾病下具有强代表性的症状与待使用症状集之间的症状匹配结果,确定该待诊断患者的问诊结果,以使该问诊结果携带的疾病信息更准确可信,如此有利于提高问诊效果。
基于上述方法实施例提供的问诊方法,本申请实施例还提供了一种问诊装置,下面结合附图进行解释和说明。
装置实施例
装置实施例对问诊装置进行介绍,相关内容请参见上述方法实施例。
参见图8,该图为本申请实施例提供的一种问诊装置的结构示意图。
本申请实施例提供的问诊装置800,包括:
第一确定单元801,用于在获取到待诊断患者的病情自述信息之后,根据所述病情自述信息,确定待使用症状集;
第二确定单元802,用于根据所述待使用症状集,确定待询问症状;
第三确定单元803,用于在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待询问症状的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述第二确定单元802,包括:
第一确定子单元,用于根据所述待使用症状集,确定待使用疾病诊断结果;
第二确定子单元,用于根据所述待使用症状集和所述待使用疾病诊断结果,确定待询问症状;
所述第三确定单元803,具体用于:在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待使用疾病诊断结果的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述第一确定子单元,具体用于:将所述待使用症状集输入预先构建的疾病预诊模型,得到所述疾病预诊模型输出的第一疾病预诊结果;根据所述第一疾病预诊结果,确定所述待使用疾病诊断结果;
和/或,
所述第二确定子单元,具体用于:将所述待使用症状集和所述待使用疾病诊断结果输入预先构建的症状预测模型,得到所述症状预测模型输出的第一症状预测结果;根据所述第一症状预测结果,确定所述待询问症状。
在一种可能的实施方式下,所述疾病预诊模型包括表征向量确定模块、N个池化模块、拼接模块、全连接模块和决策模块;其中,N为正整数;
所述第一确定子单元,包括:
第三确定子单元,用于将所述待使用症状集输入所述表征向量确定模块,得到所述表征向量确定模块输出的向量表征结果;将所述向量表征结果输入第n个池化模块,得到所述第n个池化模块输出的第n个池化结果;其中,n为正整数,n≤N;将第1个池化结果至第N个池化结果输入所述拼接模块,得到所述拼接模块输出的拼接结果;将所述拼接结果输入所述全连接模块,得到所述全连接模块输出的全连接结果;将所述全连接结果输入所述决策模块,得到所述决策模块输出的所述第一疾病预诊结果。
在一种可能的实施方式下,所述问诊装置800,还包括:
第一构建单元,用于利用第一症状样本和所述第一症状样本的实际疾病诊断结果,对待使用模型进行训练,得到待优化预诊模型;根据第二症状样本,确定样本症状集;将所述样本症状集输入所述待优化预诊模型,得到所述待优化预诊模型输出的第二疾病预诊结果;根据所述样本症状集、所述第二疾病预诊结果和待优化症状模型,得到第二症状预测结果;根据所述第二疾病预诊结果和所述第二症状样本的实际疾病诊断结果,更新所述待优化预诊模型,根据所述第二症状预测结果和所述样本症状集对应的实际关联症状,更新所述待优化症状模型,并继续执行所述将所述样本症状集输入所述待优化预诊模型的步骤,直至在达到第二停止条件时,根据所述待优化预诊模型和所述待优化症状模型,确定所述疾病预诊模型和所述症状预测模型。
在一种可能的实施方式下,所述问诊装置800,还包括:
症状集更新子单元,用于在所述继续执行所述将所述样本症状集输入所述待优化预诊模型的步骤之前,根据所述第二症状预测结果,确定待添加症状;若确定所述待添加症状属于所述样本症状集对应的实际关联症状,则将所述待添加症状添加至所述样本症状集。
在一种可能的实施方式下,所述疾病预诊模型的模型架构与所述症状预测模型的模型架构相同。
在一种可能的实施方式下,所述第二确定子单元,包括:
第四确定子单元,用于根据所述第一症状预测结果,得到至少一个候选症状;
第五确定子单元,用于利用预先设定的无效症状筛选规则,对所述至少一个候选症状进行筛选处理,得到至少一个有效症状;
第六确定子单元,用于从所述至少一个有效症状中确定出所述待询问症状。
在一种可能的实施方式下,所述第五确定子单元,具体用于:若确定所述至少一个候选症状包括至少一个第一症状,则将各个所述第一症状均确定为无效症状;其中,所述第一症状属于所述待使用症状集;若确定所述至少一个候选症状包括至少一个第二症状,则将各个所述第二症状均确定为无效症状;其中,所述第二症状属于历史询问症状集;所述历史询问症状集用于记录已向所述待诊断患者询问过的症状;若确定所述至少一个候选症状包括至少一个第三症状,则将各个所述第三症状均确定为无效症状;其中,所述第三症状与所述待使用症状集中任一症状之间的关联程度均满足预设无关联条件;在确定所述至少一个候选症状中存在至少一个无效症状之后,从所述至少一个候选症状中删除所述至少一个无效症状,得到所述至少一个有效症状。
在一种可能的实施方式下,所述待使用症状集包括待比较症状,且所述问诊装置800,还包括:
关联度确定子单元,用于若所述待比较症状满足第一条件,则将所述第三症状与待比较症状之间的点互信息,确定为所述第三症状与待比较症状之间的关联程度;若所述待比较症状满足第二条件,则将预设关联度值,确定为所述第三症状与待比较症状之间的关联程度。
在一种可能的实施方式下,所述第三确定单元803,包括:
第七确定子单元,用于将所述待使用症状集输入预先构建的疾病预测模型,得到所述疾病预测模型输出的疾病预测结果;
第八确定子单元,用于根据所述疾病预测结果,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述疾病预测模型的个数为M;其中,M为正整数;
所述第七确定子单元,具体用于:将所述待使用症状集输入预先构建的第m个疾病预测模型,得到所述第m个疾病预测模型输出的第m个疾病预测结果;其中,m为正整数,m≤M;
所述第八确定子单元,具体用于:根据第1个疾病预测结果至第M个疾病预测结果,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述所述第八确定子单元,具体用于:利用第1个疾病预测结果至第M个疾病预测结果,确定至少一个候选疾病的患有概率;根据所述至少一个候选疾病的患有概率,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述所述第八确定子单元,具体用于:根据所述第m个疾病预测结果,确定第m个待使用疾病;其中,m为正整数,m≤M;对第1个待使用疾病至第M个待使用疾病进行第一统计分析处理,得到统计分析结果;根据所述统计分析结果,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述问诊装置800,还包括:
第二构建单元,用于在获取到预训练模型之后,根据所述预训练模型和第m个文本分类网络,得到第m个待训练模型;利用第三症状样本和所述第三症状样本的实际疾病诊断结果,对所述第m个待训练模型进行训练,得到所述第m个疾病预测模型。
在一种可能的实施方式下,所述第m个文本分类网络的网络结构不同于M个文本分类网络中除了所述第m个文本分类网络以外的其他任一文本分类网络的网络结构。
在一种可能的实施方式下,所述第二构建单元,包括:
模型训练子单元,用于将所述第三症状样本输入所述第m个待训练模型,得到所述第m个待训练模型输出的所述第三症状样本的预测疾病诊断结果;若所述第三症状样本的预测疾病诊断结果与所述第三症状样本的实际疾病诊断结果之间的差距满足预设保留条件,则将所述第m个待训练模型的模型参数,确定为待使用模型参数集;根据所述第三症状样本的疾病诊断预测结果和所述第三症状样本的实际疾病诊断结果,更新所述第m个待训练模型,并继续执行所述将所述第三症状样本输入所述第m个待训练模型的步骤,直至在达到第三停止条件时,根据至少一个所述待使用模型参数集,确定所述第m个疾病预测模型。
在一种可能的实施方式下,所述模型训练子单元,包括:
第九确定子单元,用于对至少一个所述待使用模型参数集进行平均处理,得到平均模型参数集;根据所述平均模型参数集和所述第m个待训练模型的模型结构,确定所述第m个疾病预测模型。
在一种可能的实施方式下,所述问诊装置800,还包括:
第四确定单元,用于在确定所述疾病预测结果不满足预设置信条件时,根据至少一个候选疾病对应的至少一个症状的鉴别性表征数据,从所述至少一个候选疾病对应的至少一个症状中选择满足预设鉴别条件的至少一个参考症状;
第五确定单元,用于根据所述至少一个参考症状与所述待使用症状集之间的症状匹配结果,确定所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述候选疾病的个数为G,第g个候选疾病对应的至少一个症状包括待评估症状;其中,g为正整数,g≤G,G为正整数;
所述问诊装置800,还包括:
第六确定单元,用于从语料库中确定G个候选疾病对应的参考文件;根据第g个候选疾病对应的参考文件,确定所述待评估症状的词频;根据所述G个候选疾病对应的参考文件,确定所述待评估症状的逆向文件频率;根据所述待评估症状的词频与所述待评估症状的逆向文件频率之间的乘积,确定所述待评估症状的鉴别性表征数据。
在一种可能的实施方式下,所述第g个候选疾病对应的参考文件包括Jg个病历文件;其中,所述Jg为正整数,g为正整数,g≤G,G为正整数;
所述第六确定单元,包括:
第十确定子单元,用于将所述Jg个病历文件中包括所述待评估症状的病历文件个数与所述Jg之间比值,确定为第g个第一数值;其中,g为正整数,g≤G;将第1个第一数值至第G个第一数值进行加和处理,得到第二数值;根据所述G与所述第二数值之间的比值,确定所述待评估症状的逆向文件频率。
在一种可能的实施方式下,所述第六确定单元,包括:
第十一确定子单元,用于将G个候选疾病对应的参考文件中包括所述待评估症状的各个参考文件,均确定为待使用文件;
将所有待使用文件中所述待评估症状的出现概率进行加和,得到第三数值;
根据所述G与所述第三数值之间的比值,确定所述待评估症状的逆向文件频率。
在一种可能的实施方式下,所述第g个候选疾病对应的参考文件包括Jg个病历文件;
所述第六确定单元,包括:
第十二确定子单元,用于根据第j个病历文件,确定所述待评估症状的第j个出现频率;其中,j为正整数,j≤Jg,Jg为正整数;对所述待评估症状的第1个出现频率至所述待评估症状的第Jg个出现频率进行第二统计分析处理,得到所述待评估症状的词频。
在一种可能的实施方式下,所述第八确定子单元,具体用于:根据所述疾病预测结果,确定待使用疾病信息;将所述待使用疾病信息与所述待使用症状集进行集合处理,得到所述待诊断患者的问诊结果。
在一种可能的实施方式下,所述问诊装置800,还包括:
问诊交互单元,用于根据所述待询问症状,生成症状问询信息;将所述症状问询信息发送给所述待诊断患者,以使所述待诊断患者针对所述症状问询信息进行答复;在获取到所述待诊断患者针对所述症状问询信息的答复内容之后,根据所述答复内容,确定所述询问反馈信息。
进一步地,本申请实施例还提供了一种设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述问诊方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述问诊方法的任一种实现方法。
进一步地,本申请实施例还提供了一种计算机程序产品,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行上述问诊方法的任一种实现方法。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本申请各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (28)

1.一种问诊方法,其特征在于,应用于电子设备,所述方法包括:
在获取到待诊断患者的病情自述信息之后,根据所述病情自述信息,确定待使用症状集;
根据所述待使用症状集,确定待询问症状;
在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待询问症状的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待使用症状集,确定待询问症状,包括:
根据所述待使用症状集,确定待使用疾病诊断结果;
根据所述待使用症状集和所述待使用疾病诊断结果,确定待询问症状;
所述继续执行所述根据所述待使用症状集,确定待询问症状的步骤,包括:
继续执行所述根据所述待使用症状集,确定待使用疾病诊断结果的步骤。
3.根据权利要求2所述的方法,其特征在于,所述根据所述待使用症状集,确定待使用疾病诊断结果,包括:
将所述待使用症状集输入预先构建的疾病预诊模型,得到所述疾病预诊模型输出的第一疾病预诊结果;根据所述第一疾病预诊结果,确定所述待使用疾病诊断结果;
和/或,
所述根据所述待使用症状集和所述待使用疾病诊断结果,确定待询问症状,包括:
将所述待使用症状集和所述待使用疾病诊断结果输入预先构建的症状预测模型,得到所述症状预测模型输出的第一症状预测结果;根据所述第一症状预测结果,确定所述待询问症状。
4.根据权利要求3所述的方法,其特征在于,所述疾病预诊模型包括表征向量确定模块、N个池化模块、拼接模块、全连接模块和决策模块;其中,N为正整数;
所述第一疾病预诊结果的确定过程,包括:
将所述待使用症状集输入所述表征向量确定模块,得到所述表征向量确定模块输出的向量表征结果;
将所述向量表征结果输入第n个池化模块,得到所述第n个池化模块输出的第n个池化结果;其中,n为正整数,n≤N;
将第1个池化结果至第N个池化结果输入所述拼接模块,得到所述拼接模块输出的拼接结果;
将所述拼接结果输入所述全连接模块,得到所述全连接模块输出的全连接结果;
将所述全连接结果输入所述决策模块,得到所述决策模块输出的所述第一疾病预诊结果。
5.根据权利要求3所述的方法,其特征在于,所述疾病预诊模型和所述症状预测模型的构建过程,包括:
利用第一症状样本和所述第一症状样本的实际疾病诊断结果,对待使用模型进行训练,得到待优化预诊模型;
根据第二症状样本,确定样本症状集;
将所述样本症状集输入所述待优化预诊模型,得到所述待优化预诊模型输出的第二疾病预诊结果;
根据所述样本症状集、所述第二疾病预诊结果和待优化症状模型,得到第二症状预测结果;
根据所述第二疾病预诊结果和所述第二症状样本的实际疾病诊断结果,更新所述待优化预诊模型,根据所述第二症状预测结果和所述样本症状集对应的实际关联症状,更新所述待优化症状模型,并继续执行所述将所述样本症状集输入所述待优化预诊模型的步骤,直至在达到第二停止条件时,根据所述待优化预诊模型和所述待优化症状模型,确定所述疾病预诊模型和所述症状预测模型。
6.根据权利要求5所述的方法,其特征在于,在所述继续执行所述将所述样本症状集输入所述待优化预诊模型的步骤之前,所述方法还包括:
根据所述第二症状预测结果,确定待添加症状;
若确定所述待添加症状属于所述样本症状集对应的实际关联症状,则将所述待添加症状添加至所述样本症状集。
7.根据权利要求3所述的方法,其特征在于,所述疾病预诊模型的模型架构与所述症状预测模型的模型架构相同。
8.根据权利要求3所述的方法,其特征在于,所述根据所述第一症状预测结果,确定所述待询问症状,包括:
根据所述第一症状预测结果,得到至少一个候选症状;
利用预先设定的无效症状筛选规则,对所述至少一个候选症状进行筛选处理,得到至少一个有效症状;
从所述至少一个有效症状中确定出所述待询问症状。
9.根据权利要求8所述的方法,其特征在于,所述至少一个有效症状的确定过程,包括:
若确定所述至少一个候选症状包括至少一个第一症状,则将各个所述第一症状均确定为无效症状;其中,所述第一症状属于所述待使用症状集;
若确定所述至少一个候选症状包括至少一个第二症状,则将各个所述第二症状均确定为无效症状;其中,所述第二症状属于历史询问症状集;所述历史询问症状集用于记录已向所述待诊断患者询问过的症状;
若确定所述至少一个候选症状包括至少一个第三症状,则将各个所述第三症状均确定为无效症状;其中,所述第三症状与所述待使用症状集中任一症状之间的关联程度均满足预设无关联条件;
在确定所述至少一个候选症状中存在至少一个无效症状之后,从所述至少一个候选症状中删除所述至少一个无效症状,得到所述至少一个有效症状。
10.根据权利要求9所述的方法,其特征在于,所述待使用症状集包括待比较症状,且所述第三症状与待比较症状之间的关联程度的确定过程,包括:
若所述待比较症状满足第一条件,则将所述第三症状与待比较症状之间的点互信息,确定为所述第三症状与待比较症状之间的关联程度;
若所述待比较症状满足第二条件,则将预设关联度值,确定为所述第三症状与待比较症状之间的关联程度。
11.根据权利要求1所述的方法,其特征在于,所述根据所述待使用症状集,确定所述待诊断患者的问诊结果,包括:
将所述待使用症状集输入预先构建的疾病预测模型,得到所述疾病预测模型输出的疾病预测结果;
根据所述疾病预测结果,确定所述待诊断患者的问诊结果。
12.根据权利要求11所述的方法,其特征在于,所述疾病预测模型的个数为M;其中,M为正整数;
所述将所述待使用症状集输入预先构建的疾病预测模型,得到所述疾病预测模型输出的疾病预测结果,包括:
将所述待使用症状集输入预先构建的第m个疾病预测模型,得到所述第m个疾病预测模型输出的第m个疾病预测结果;其中,m为正整数,m≤M;
所述根据所述疾病预测结果,确定所述待诊断患者的问诊结果,包括:
根据第1个疾病预测结果至第M个疾病预测结果,确定所述待诊断患者的问诊结果。
13.根据权利要求12所述的方法,其特征在于,所述根据第1个疾病预测结果至第M个疾病预测结果,确定所述待诊断患者的问诊结果,包括:
利用第1个疾病预测结果至第M个疾病预测结果,确定至少一个候选疾病的患有概率;根据所述至少一个候选疾病的患有概率,确定所述待诊断患者的问诊结果;
或者,
所述根据第1个疾病预测结果至第M个疾病预测结果,确定所述待诊断患者的问诊结果,包括:
根据所述第m个疾病预测结果,确定第m个待使用疾病;其中,m为正整数,m≤M;对第1个待使用疾病至第M个待使用疾病进行第一统计分析处理,得到统计分析结果;根据所述统计分析结果,确定所述待诊断患者的问诊结果。
14.根据权利要求12所述的方法,其特征在于,所述第m个疾病预测模型的构建过程,包括:
在获取到预训练模型之后,根据所述预训练模型和第m个文本分类网络,得到第m个待训练模型;
利用第三症状样本和所述第三症状样本的实际疾病诊断结果,对所述第m个待训练模型进行训练,得到所述第m个疾病预测模型。
15.根据权利要求14所述的方法,其特征在于,所述第m个文本分类网络的网络结构不同于M个文本分类网络中除了所述第m个文本分类网络以外的其他任一文本分类网络的网络结构。
16.根据权利要求14所述的方法,其特征在于,所述利用第三症状样本和所述第三症状样本的实际疾病诊断结果,对所述第m个待训练模型进行训练,得到所述第m个疾病预测模型,包括:
将所述第三症状样本输入所述第m个待训练模型,得到所述第m个待训练模型输出的所述第三症状样本的预测疾病诊断结果;
若所述第三症状样本的预测疾病诊断结果与所述第三症状样本的实际疾病诊断结果之间的差距满足预设保留条件,则将所述第m个待训练模型的模型参数,确定为待使用模型参数集;
根据所述第三症状样本的疾病诊断预测结果和所述第三症状样本的实际疾病诊断结果,更新所述第m个待训练模型,并继续执行所述将所述第三症状样本输入所述第m个待训练模型的步骤,直至在达到第三停止条件时,根据至少一个所述待使用模型参数集,确定所述第m个疾病预测模型。
17.根据权利要求16所述的方法,其特征在于,所述根据至少一个所述待使用模型参数集,确定所述第m个疾病预测模型,包括:
对至少一个所述待使用模型参数集进行平均处理,得到平均模型参数集;
根据所述平均模型参数集和所述第m个待训练模型的模型结构,确定所述第m个疾病预测模型。
18.根据权利要求11所述的方法,其特征在于,所述方法还包括:
在确定所述疾病预测结果不满足预设置信条件时,根据至少一个候选疾病对应的至少一个症状的鉴别性表征数据,从所述至少一个候选疾病对应的至少一个症状中选择满足预设鉴别条件的至少一个参考症状;
根据所述至少一个参考症状与所述待使用症状集之间的症状匹配结果,确定所述待诊断患者的问诊结果。
19.根据权利要求18所述的方法,其特征在于,所述候选疾病的个数为G,第g个候选疾病对应的至少一个症状包括待评估症状;其中,g为正整数,g≤G,G为正整数;
所述待评估症状的鉴别性表征数据的确定过程,包括:
从语料库中确定G个候选疾病对应的参考文件;
根据第g个候选疾病对应的参考文件,确定所述待评估症状的词频;
根据所述G个候选疾病对应的参考文件,确定所述待评估症状的逆向文件频率;
根据所述待评估症状的词频与所述待评估症状的逆向文件频率之间的乘积,确定所述待评估症状的鉴别性表征数据。
20.根据权利要求19所述的方法,其特征在于,所述第g个候选疾病对应的参考文件包括Jg个病历文件;其中,所述Jg为正整数,g为正整数,g≤G,G为正整数;
所述待评估症状的逆向文件频率的确定过程,包括:
将所述Jg个病历文件中包括所述待评估症状的病历文件个数与所述Jg之间比值,确定为第g个第一数值;其中,g为正整数,g≤G;
将第1个第一数值至第G个第一数值进行加和处理,得到第二数值;
根据所述G与所述第二数值之间的比值,确定所述待评估症状的逆向文件频率。
21.根据权利要求19所述的方法,其特征在于,所述待评估症状的逆向文件频率的确定过程包括:
将G个候选疾病对应的参考文件中包括所述待评估症状的各个参考文件,均确定为待使用文件;
将所有待使用文件中所述待评估症状的出现概率进行加和,得到第三数值;
根据所述G与所述第三数值之间的比值,确定所述待评估症状的逆向文件频率。
22.根据权利要求19所述的方法,其特征在于,所述第g个候选疾病对应的参考文件包括Jg个病历文件,且所述待评估症状的词频的确定过程包括:
根据第j个病历文件,确定所述待评估症状的第j个出现频率;其中,j为正整数,j≤Jg,Jg为正整数;
对所述待评估症状的第1个出现频率至所述待评估症状的第Jg个出现频率进行第二统计分析处理,得到所述待评估症状的词频。
23.根据权利要求11所述的方法,其特征在于,所述根据所述疾病预测结果,确定所述待诊断患者的问诊结果,包括:
根据所述疾病预测结果,确定待使用疾病信息;
将所述待使用疾病信息与所述待使用症状集进行集合处理,得到所述待诊断患者的问诊结果。
24.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述待询问症状,生成症状问询信息;
将所述症状问询信息发送给所述待诊断患者,以使所述待诊断患者针对所述症状问询信息进行答复;
在获取到所述待诊断患者针对所述症状问询信息的答复内容之后,根据所述答复内容,确定所述询问反馈信息。
25.一种问诊装置,其特征在于,包括:
第一确定单元,用于在获取到待诊断患者的病情自述信息之后,根据所述病情自述信息,确定待使用症状集;
第二确定单元,用于根据所述待使用症状集,确定待询问症状;
第三确定单元,用于在获取到所述待诊断患者针对所述待询问症状的询问反馈信息之后,根据所述询问反馈信息,更新所述待使用症状集,并继续执行所述根据所述待使用症状集,确定待询问症状的步骤,直至在达到第一停止条件时,根据所述待使用症状集,确定所述待诊断患者的问诊结果。
26.一种设备,其特征在于,所述设备包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1至24任一项所述的方法。
27.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1至24任一项所述的方法。
28.一种计算机程序产品,其特征在于,所述计算机程序产品在终端设备上运行时,使得所述终端设备执行权利要求1至24任一项所述的方法。
CN202111237332.8A 2021-10-21 2021-10-21 一种问诊方法及其相关设备 Pending CN113963793A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111237332.8A CN113963793A (zh) 2021-10-21 2021-10-21 一种问诊方法及其相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111237332.8A CN113963793A (zh) 2021-10-21 2021-10-21 一种问诊方法及其相关设备

Publications (1)

Publication Number Publication Date
CN113963793A true CN113963793A (zh) 2022-01-21

Family

ID=79466288

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111237332.8A Pending CN113963793A (zh) 2021-10-21 2021-10-21 一种问诊方法及其相关设备

Country Status (1)

Country Link
CN (1) CN113963793A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114822830A (zh) * 2022-06-27 2022-07-29 安徽讯飞医疗股份有限公司 问诊交互方法及相关装置、电子设备、存储介质
CN118039138A (zh) * 2024-04-12 2024-05-14 北京惠每云科技有限公司 基于大模型的可控路径预问诊方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114822830A (zh) * 2022-06-27 2022-07-29 安徽讯飞医疗股份有限公司 问诊交互方法及相关装置、电子设备、存储介质
CN118039138A (zh) * 2024-04-12 2024-05-14 北京惠每云科技有限公司 基于大模型的可控路径预问诊方法及装置

Similar Documents

Publication Publication Date Title
WO2022242459A1 (zh) 数据分类识别方法、装置、设备、介质及程序产品
CN109460473B (zh) 基于症状提取和特征表示的电子病历多标签分类方法
Xu et al. User memory reasoning for conversational recommendation
CN113963793A (zh) 一种问诊方法及其相关设备
WO2020073700A1 (zh) 图像描述模型的训练方法、装置及存储介质
CN110277167A (zh) 基于知识图谱的慢性非传染性疾病风险预测系统
WO2020057052A1 (en) Machine-aided dialog system and medical condition inquiry apparatus and method
CN115391494B (zh) 中医症候智能识别方法及装置
CN113707299A (zh) 基于问诊会话的辅助诊断方法、装置及计算机设备
CN116313120A (zh) 模型预训练方法、医学应用任务处理方法及其相关装置
CN116168825A (zh) 基于知识图谱增强的自动可解释性疾病自动诊断装置
CN115274086A (zh) 一种智能导诊方法及系统
CN116975218A (zh) 文本处理方法、装置、计算机设备和存储介质
CN108304568B (zh) 一种房地产公众预期大数据处理方法及系统
CN117036834B (zh) 基于人工智能的数据分类方法、装置及电子设备
WO2023124837A1 (zh) 问诊处理方法、装置、设备及存储介质
CN115964475A (zh) 一种用于医疗问诊的对话摘要生成方法
CN116719840A (zh) 一种基于病历后结构化处理的医疗信息推送方法
US20220130545A1 (en) Task-oriented Dialogue System for Automatic Disease Diagnosis
CN116994695A (zh) 报告生成模型的训练方法、装置、设备及存储介质
CN115331051A (zh) 基于近邻传播偏标签学习的脑影像数据分类模型建立方法
WO2021139220A1 (zh) 疫情监控方法、装置、计算机设备和存储介质
CN114117082A (zh) 用于对待校正数据校正的方法、设备和介质
CN113314217A (zh) 一种基于检验医学大数据的常见疾病辅助自诊系统
CN113886539A (zh) 话术推荐方法、装置、客服设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination