WO2023024422A1

WO2023024422A1 - 基于问诊会话的辅助诊断方法、装置及计算机设备

Info

Publication number: WO2023024422A1
Application number: PCT/CN2022/071881
Authority: WO
Inventors: 姚海申; 孙行智
Original assignee: 平安科技（深圳）有限公司
Priority date: 2021-08-27
Filing date: 2022-01-13
Publication date: 2023-03-02
Also published as: CN113707299B; CN113707299A

Abstract

本申请实施例属于人工智能和数字医疗领域，应用于智慧医疗领域中，涉及一种基于问诊会话的辅助诊断方法、装置、计算机设备及存储介质，方法包括获取问诊过程中产生的对话文本，对话文本包括医生与患者之间的问诊对话；通过训练好的第一特征提取模型对问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；通过训练好的第二特征提取模型对对话文本进行特征语句提取，得到问诊过程中的目标特征语句；将目标特征词与目标特征语句在对话文本进行差异化标识，作为问诊过程的辅助诊断信息进行展示。此外，本申请还涉及区块链技术，对话文本可存储于区块链中。本申请通过辅助诊断信息，可以降低医生误诊率。

Description

基于问诊会话的辅助诊断方法、装置及计算机设备

本申请以2021年8月27日提交的申请号为202110997039.5，名称为“基于问诊会话的辅助诊断方法、装置及计算机设备”的中国发明专利申请为基础，并要求其优先权。

技术领域

本申请涉及人工智能技术领域和数字医疗领域，尤其涉及一种基于问诊会话的辅助诊断方法、装置、计算机设备及存储介质。

背景技术

随着计算力和数据量的大幅度提升，人工智能技术获得进一步的发展，应用人工智能解决医疗领域问题已成为了热点。在医疗领域中，医生一般是通过对患者进行问诊，再根据问诊情况推断患者的患病情况。

受限于患者的表达情况，以及长时间的问诊对话，需要医生精神高度集中，才能对问诊过程中患者的描述进行关键词进行捕捉，即便如此，申请人意识到还是会存在遗漏关键词，造成诊断信息遗漏，使得误诊率较高。

发明内容

本申请实施例的目的在于提出一种基于问诊会话的辅助诊断方法、装置、计算机设备及存储介质，以解决误诊率较高的问题。

为了解决上述技术问题，本申请实施例提供一种基于问诊会话的辅助诊断方法，采用了如下所述的技术方案：

获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。

进一步的，在所述获取问诊过程中产生的对话文本之前，所述方法还包括：

构建第一特征提取模型以及第二特征提取模型；

通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型；

以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练。

进一步的，所述通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型的步骤包括：

根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务；以及

根据所述第一医学数据，构建基于上下语句预测的第二预训练任务；

基于所述第一预训练任务以及所述第二预设训练任务，对所述第一特征提取模型进行预训练。

进一步的，所述根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务的步骤包括：

通过随机掩码块对所述第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句；

对所述掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句；

计算所述预测结果语句与所述初始语句样本之间的第一误差损失；

以最小化第一误差损失为目标构建所述第一预训练任务。

进一步的，所述根据所述第一医学数据，构建基于上下语句预测的第二预训练任务的步骤包括：

将所述初始语句样本或与所述初始语句样本对应的掩码样本语句作为上句，为所述初始语句样本随机匹配下句，形成样本语句对；

对所述样本语句对进行上下语句预测，得到预测结果；

计算所述预测结果与正确的样本语句对之间的第二误差损失，所述正确的样本语句对包括初始语句样本以及对应的正确下句；

以最小化第二误差损失为目标构建所述第二预训练任务。

进一步的，所述以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练的步骤包括：

将所述预训练的第一特征提取模型与所述第二特征提取模型进行连接，得到连接后的模型；

通过第二医学数据对所述连接后的模型进行训练，并在训练过程中，通过所述疾病诊断交叉熵损失的反向传播调整所述预训练的第一特征提取模型与所述第二特征提取模型中的参数；

将所述连接后的模型训练到收敛或达到预设迭次数后，得到所述训练好的第一特征提取模型以及所述训练好的第二特征提取模型。

进一步的，所述将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识的步骤包括：

通过第一可视化要素对所述目标特征词进行可视化表达，所述第一可视化要素根据所述目标特征词的置信度进行确定，其中，所述目标特征词的置信度通过所述第一特征提取模型输出得到；

通过第二可视化要素对所述目标特征语句进行可视化表达，所述第二可神化要素根据所述目标特征语句的权重进行确定，其中，所述目标特征语句的权重通过所述第二特征提取模型输出得到；

通过第三可视化要素对所述问诊过程进行可视化表达，所述第三可视化要素根据所述对话文本中的问诊对话的时序进行确定。

为了解决上述技术问题，本申请实施例还提供一种基于问诊会话的辅助诊断装置，采用了如下所述的技术方案：

获取模块，用于获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

第一提取模块，用于通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

第二提取模块，用于通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

展示模块，用于将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。

为了解决上述技术问题，本申请实施例还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机流程，所述处理器执行所述计算机流程时实现下述所述的基于问诊会话的辅助诊断方法的步骤：

为了解决上述技术问题，本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机流程，所述计算机流程被处理器执行时实现下述所述的基于问诊会话的辅助诊断方法的步骤：

与现有技术相比，本申请实施例主要有以下有益效果：获取问诊过程中产生的对话文本后，通过训练好的第一特征提取模型对问诊对话进行特征词提取，得到每问诊对话中，每句话中的特征词；通过训练好的第二特征提取模型对对话文本进行特征语句提取，得到问诊过程中的特征语句；将问诊过程中的特征词与特征语句形成辅助诊断信息以供医生查看，在医生对于患者的诊断时，医生可以通过查看辅助诊断信息，重点关注辅助诊断信息中的特征词和特征语句，直观且不会发生遗漏，通过辅助诊断信息，可以降低医生误诊率。

附图说明

为了更清楚地说明本申请中的方案，下面将对本申请实施例描述中所需要使用的附图作一个简单介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的基于问诊会话的辅助诊断方法的一个实施例的流程图；

图3是根据本申请的基于问诊会话的辅助诊断方法的另一个实施例的流程图；

图4是图3中步骤S302的一个实施例的流程图；

图5是图2中步骤S204的一个实施例的流程图；

图6是根据本申请的基于问诊会话的辅助诊断装置的一个实施例的结构示意图；

图7是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同；本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的，不是旨在于限制本申请；本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案，下面将结合附图，对本申请实施例中的技术方案进行清楚、完整地描述。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是，本申请实施例所提供的基于问诊会话的辅助诊断方法一般由服务器执行，相应地，基于问诊会话的辅助诊断装置一般设置于服务器中。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，示出了根据本申请的基于问诊会话的辅助诊断方法的一个实施例的流程图。所述的基于问诊会话的辅助诊断方法，包括以下步骤：

步骤S201，获取问诊过程中产生的对话文本。

在本实施例中，基于问诊会话的辅助诊断方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式与终端进行通信。需要指出的是，上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。

具体地，服务器获取问诊过程中产生的对话文本。上述问诊过程可以线下的问诊过程，也可以是线上的问诊过程。

在线下的问诊过程中，医生与患者可以当面进行问诊交流，可以通过语音拾取器对问诊过程中医生与患者的对话进行采集，将采集到的对话上传到服务器上，通过服务器上部署的语音识别技术将医生与患者的对话进行文本转换，得到对应的问诊对话。

在线上的问诊过程中，医生和患者可以通过聊天窗口或者互联网语音进行问诊交流，服务器可以实时或者定时获取聊天窗口内容或者互联网语音内容，也可以是在问诊交流完成后，医生将聊天窗口内容或者互联网语音内容上传到服务器中。

一个对话文本可以对应一次问诊过程，可以理解的是，一个对话文本中可以包括一句或者一句以上的问诊对话，问诊对话可以由医生与患者之间的对话组成，也可以由患者单方的自述组成。

具体的，在线上的问诊过程中，医生可以通过医生终端与患者进行交流，患者可以通过患者终端与医生进行交流，在医生与患者的交流过程中，可以产生对应的对话文本。举例来说，对话文本可以如下：

患者：宝宝屁股长很多红疙瘩

医生：您好，我是XX皮肤科的A医生，很高兴为您服务，请问痒吗

患者：应该有点痒吧

患者：这是怎么回事

医生：这些症状出现多久了

医生：好像很严重

患者：一个星期吧

患者：就是突然长起来了，一会儿又消退了，总是反复

医生：症状二十四小时之内自行消退吗

患者：是的

需要强调的是，为进一步保证上述问诊对话的私密和安全性，上述问诊对话还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

步骤S202，通过训练好的第一特征提取模型对问诊对话进行特征词提取，得到每句问诊对话中的目标特征词。

具体地，服务器中部署有训练好的第一特征提取模型，服务器通过调用训练好的第一特征提取模型对问诊对话进行特征词提取。上述目标特征词可以是每句问诊对话中重要的字词。比如，在问诊对话“宝宝屁股长很多红疙瘩”中，屁股、红疙瘩是该问诊对话中重要的字词，因此，训练好的第一特征提取模型会输出屁股、红疙瘩两个词作为目标特征词。

在服务器获取到问诊过程中产生的对话文本，则会调用第一特征提取模型，将对话文本中问诊对话以句为单位按时序输入到第一特征提取模型中进行处理，第一特征提取模型会输出每句问诊对话中重要的字词作为目标特征词。

更具体的，将对话文本中每句问诊对话都进行词向量编码，得到每句问诊对话编码词向量输入到第一特征提取模型中进行特征提取，提取出每句问诊对话中重要的字词。

步骤S203，通过训练好的第二特征提取模型对问诊过程中的所有问诊对话进行特征语句提取，得到问诊过程中的目标特征语句。

具体地，服务器中部署有训练好的第二特征提取模型，服务器通过调用训练好的第二特征提取模型对对话文本进行特征语句提取。上述目标特征语句可以是问诊过程中重要的语句。比如，在对话文本中，问诊对话“宝宝屁股长很多红疙瘩”为重要的语句，训练好的第二特征提取模型会输出“宝宝屁股长很多红疙瘩”作为目标特征语句。

第二特征提取模型可以是基于时序模型进行构建的，以使第二特征提取模型能够保持语义随着问诊对话的时序得到很好的传递。

步骤S204，将目标特征词与所述目标特征语句在对话文本进行差异化标识，作为问诊过程的辅助诊断信息进行展示。

具体的，可以将目标特征词与目标特征语句在对话文本的基础上进行差异化标识，从而得到问诊过程的辅助诊断信息。由于目标特征词与目标特征语句进行差异化标识，使得重要的词和重要的语句可以被医生轻松捕捉和关注。

本实施例中，获取问诊过程中产生的对话文本后，通过训练好的第一特征提取模型对问诊对话进行特征词提取，得到每问诊对话中，每句话中的特征词；通过训练好的第二特征提取模型对对话文本进行特征语句提取，得到问诊过程中的特征语句；将问诊过程中的特征词与特征语句形成辅助诊断信息以供医生查看，在医生对于患者的诊断时，医生可以通过查看辅助诊断信息，重点关注辅助诊断信息中的特征词和特征语句，直观且不会发生遗漏，通过辅助诊断信息，可以降低医生误诊率。

进一步的，继续参考图3，图3示出了根据本申请的基于问诊会话的辅助诊断方法的另一个实施例的流程图。在获取问诊过程中产生的对话文本之前，所述的基于问诊会话的辅助诊断方法还包括：

步骤S301，构建第一特征提取模型以及第二特征提取模型。

具体的，服务器构建第一特征提取模型和第二特征提取模型，第一特征提取模型可以是基于神经网络进行构建的特征提取模型。

更具体的，第一特征提取模型可以包括分词模块、词向量模块、第一特征提取模块，第一特征提取模型输入的是一句问诊会话s，通过分词模块可以将该问诊会话s进行分词，得到分词序列{w1,w2,…,wn}，通过词向量模块可以将分词序列{w1,w2,…,wn}进行词向量编码，得到该问诊会话s的词向量{E1,E2,…,En}。第一特征提取模块用于对词向量{E1,E2,…,En}进行特征词提取，得到目标特征词。

在一种可能的实施例中，第一特征提取模型还可以包括第一输出模块以及第二输出模块，在第一特征提取模块对词向量{E1,E2,…,En}进行特征词提取后，得到目标特征词，目标特征词可以通过第一输出模块进行输出，而词向量{E1,E2,…,En}通过第二输出模块输出到第二特征提取模型中。

第二特征提取模型可以是基于时序模型进行构建的特征提取模型。

更具体的，第二特征提取模型的输入是对话文本，第二特征提取模型可以包括分词模块、词向量模块、第二特征提取模块，其中，第二特征提取模型中的分词模块、词向量模块可以与第一特征提取模型中的分词模块、词向量模块相同。第二特征提取模块用于提取特征语句，得到对话文本中的目标特征语句。

在一种可能的实施例中，第二特征提取模型与第一特征提取模型共用分词模块、词向量模块，第一特征提取模型通过第二输出模块将词向量vs输出到第二特征提取模型中。此时，第二特征提取模型输入的是对话文本对应的词向量序列，比如，对话文本中有m句问诊会话，则有m个词向量，对话文本对应的词向量序列为{s1,s2,…,sm}，其中，上述词向量序列也可以称为文本向量。

在一种可能的实施例中，第二特征提取模型还可以包括预测模块、第三输出模块以及第四输出模块，其中，预测模块用于诊断结果的预测，可以预测出当前对话文本对应的疾病诊断结果。第三输出模块用于输出目标特征语句，第四输出模块用于输出疾病诊断结果。

步骤S302，通过第一医学数据对第一特征提取模型进行预训练，得到预训练的第一特征提取模型。

具体的，服务器在构建好第一特征提取模型后，可以通过第一医学数据对第一特征提取模型进行预训练。第一医学数据可以是医学语料，第一医学数据可以根据百度百科、医学论文、医学杂志以及医学文章等语料渠道进行整理得到。

更具体的，可以从第一医学数据中整理出对应于各种疾病诊断的症状词作为特征词，对每句语料中的特征词进行标注，将未标注的语料输入到第一特征提取模型中进行处理，将提取到的特征词与语料中标注的特征词进行误差计算，得到提取到的特征词与语料中标注的特征词之间的误差，以最小化提取到的特征词与语料中标注的特征词之间的误差为目标，对第一特征提取模型进行迭代训练，直到达到预定的次数时或者提取到的特征词与语料中标注的特征词之间的误差最小时，则得到训练好的第一特征提取模型。

需要说明的是，第一特征提取模型经过预测训练后，已经是可以单独使用的模型，可以直接用于提取问诊对话中的特征词。

步骤S303，以疾病诊断交叉熵损失为优化目标，通过第二医学数据对预训练的第一特征提取模型以及第二特征提取模型进行联合训练。

具体的，服务器在构建好第二特征提取模型后，将预训练的第一特征提取模型与第二特征提取模型进行连接，再通过第二医学数据对预训练的第一特征提取模型以及第二特征提取模型进行联合训练。第二医学数据可以是医学语料，第二医学数据可以根据百度百科、医学论文、医学杂志以及医学文章等语料渠道进行整理得到。

本实施例中，在构建基于字词掩码预测的第一预训练任务与基于上下语句预测的第二预训练任务后，可以根据第一预训练任务与第二预训练任务对第一特征提取模型进行预训练，使第一特征提取模型与第二特征提取模型在联合训练阶段可以更好的拟合。

进一步的，可以将预训练的第一特征提取模型与第二特征提取模型进行连接，得到连接后的模型。通过第二医学数据对连接后的模型进行训练，并在训练过程中，通过疾病诊断交叉熵损失的反向传播调整预训练的第一特征提取模型与第二特征提取模型中的参数。将连接后的模型训练到收敛或达到预设迭次数后，得到训练好的第一特征提取模型以及训练好的第二特征提取模型。

具体的，可以将预训练的第一特征提取模型的隐含层输出与第二特征提取模型输入进行连接。

在一种可能的实施例中，第一特征提取模型包括分词模块、词向量模块、第一特征提取模块、第一输出模块、第二输出模块。词向量模块可以将分词序列{w1,w2,…,wn}进行词向量编码，得到该问诊会话s的词向量{E1,E2,…,En}，并将词向量{E1,E2,…,En}输入到第一特征提取模块和第二输出模块中，第一特征提取模块用于对词向量{E1,E2,…,En}进行特征词提取，得到目标特征词，并通过第一输出模块进行输出。第一特征提取模型通过第二输出模块与第二特征提取模型进行连接。

更具体的，第二特征提取模型包括预测模块、第三输出模块以及第四输出模块，可以从第二医学数据中整理出对应于各种疾病诊断的样本文本，对每个样本文本进行疾病诊断的标签标注，将未标注的样本文本输入到第二特征提取模型中进行处理，通过第三输出模块输出提取到的特征语句，通过预测模块对样本文本进行预测，并通过第四模块输出疾病诊断的预测结果。疾病诊断交叉熵损失可以如下述式子所示：

其中，p(x _i)为疾病诊断的标签，即是真实值，q(x _i)为疾病诊断的预测结果，即是预测值，H(p,q)为疾病诊断交叉熵损失，疾病诊断交叉熵损失H(p,q)越小，表示疾病诊断的预测结果越准确。

在一种可能的实施例中，也可以对通过第二医学数据对第二特征提取模型进行预训练，得到预训练的第二特征提取模型。具体的，可以从第二医学数据中整理出对应于各种疾病诊断的语句作为特征语句，对个样本文本中的特征语句进行标注，将未标注的样本文本输入到第二特征提取模型中进行处理，将提取到的特征语句与样本文本中标注的特征语句进行误差计算，得到提取到的特征语句与样本文本中标注的特征语句之间的误差，以最小化提取到的特征语句与样本文本中标注的特征语句之间的误差为目标，对第二特征提取模型进行迭代训练，直到达到预定的次数时或者提取到的特征语句与样本文本中标注的特征语句之间的误差最小时，则得到训练好的第二特征提取模型。

将预训练的第一特征提取模型与预训练的第二特征提取模型进行联合训练，得到联合训练模型后，再用新的样本文本对联合训练模型进行训练，此次训练则以疾病诊断交叉熵损失为优化目标进行。新的样本文本指的是没有用于第二特征提取模型的样本文本。

当然，也可以不用对第二特征提取模型进行预训练，在以疾病诊断交叉熵损失为优化目标进行联合训练时，增加第三输出模块输出的提取到的特征语句与样本文本中标注的特征语句之间的误差优化即可。

需要说明的是，上述提取到的特征词与语料中标注的特征词之间的误差，以及提取到的特征语句与样本文本中标注的特征语句之间的误差，这两种误差形式可以采用交叉熵损失，也可以采用均方差损失、对数损失等。

本实施例中，通过对预训练的第一特征提取模型与第二特征提取模型进行联合训练，由于第一特征提取模型的参数只需要进行微调，使得第二特征提取模型在训练过程中更容易拟合，提高训练速度。

进一步的，请继续参考图4，图4示出了根据本申请的第一特征提取模型的预训练方法的一个实施例的流程图。通过第一医学数据对第一特征提取模型进行预训练，得到预训练的第一特征提取模型的步骤包括：

步骤S3021，根据第一医学数据，构建基于字词掩码预测的第一预训练任务。

具体的，可以提取从第一医学数据中整理出对应于各种疾病诊断的症状词作为特征词，对每句语料中的特征词进行标注。

基于字词掩码预测的第一预训练任务可以理解为，对语料中的字词进行掩码，使得语料中的一些字词被遮掩，然后将掩码后的语料输入到第一特征提取模型中，使得第一特征提取模型依然输出正确的特征词，正确的特征词为对应语料中标注的特征词。

进一步的，可以通过随机掩码块对第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句。对掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句。计算预测结果语句与初始语句样本之间的第一误差损失。以最小化第一误差损失为目标构建第一预训练任务。

举例来说，语料为“宝宝屁股长很多红疙瘩”，经过掩码后为“宝宝屁股长很多■疙瘩”。第一预训练任务则是在输入“宝宝屁股长很多■疙瘩”情况下，正确预测出“宝宝屁股长很多红疙瘩”。

更进一步的，可以通过随机掩码块对第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句。对掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果词。计算预测结果词与初始语句样本中特征词之间的误差损失。以最小化该误差损失为目标构建第一预训练任务。

举例来说，语料为“宝宝屁股长很多红疙瘩”，经过掩码后为“宝宝屁股长很多■疙瘩”。第一预训练任务则是在输入“宝宝屁股长很多■疙瘩”情况下，正确提取出特征词“红疙瘩”。

本实施例中，通过随机掩码块对第一医学数据中的初始语句样本进行随机字词掩码，并对掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句后，使得第一预训练任务能够对不完整语句进行特征词提取，增加了第一特征提取网络在错词、漏词情况下的鲁棒性。

步骤S3022，根据第一医学数据，构建基于上下语句预测的第二预训练任务。

具体的，可以提取从第一医学数据中整理出对应于各种疾病诊断的上下语句，对于正确的上下语句标注为正样本语句对，对于错误的上下语句标注为负样本语句对。比如：“山重水复疑无路”作为样本语句，其正样本语句对为“山重水复疑无路，柳暗花明又一村”，其负样本语句可以是“山重水复疑无路，病树前头万木春”。

基于上下语句预测的第二预训练任务可以理解为，对于一个样本语句，存在正确的下句和错误的下句，样本语句与对应的正确下句可以组成正样本语句对，样本语句与错误的下句可以组成负样本语句对，将正样本语句对输入到第一特征提取模型中，则输出正确，将负样本语句对输入到第一特征提取模型中，则输出错误。

进一步的，可以将初始语句样本或与初始语句样本对应的掩码样本语句作为上句，为初始语句样本随机匹配下句，形成样本语句对；对样本语句对进行上下语句预测，得到预测结果；计算预测结果与正确的样本语句对之间的第二误差损失，正确的样本语句对包括初始语句样本以及对应的正确下句；以最小化第二误差损失为目标构建第二预训练任务。

举例来说，第二预训练任务则是输入“山重水复疑无路，柳暗花明又一村”情况下，输出正确，输入“山重水复疑无路，病树前头万木春”的情况下，输出错误。

在一种可能的实施例中，还可以对样本语句对中的样本语句进行字词掩码。则此时，第二预训练任务是输入“山重■复疑无路，柳暗花明又一村”情况下，输出正确，输入“山重■■疑无路，病树前头万木春”的情况下，输出错误。

本实施例中，将初始语句样本或与初始语句样本对应的掩码样本语句作为上句，为初始语句样本随机匹配下句，形成样本语句对，使用样本语句对进行对错预测，可以使得第二预训练任务能够对不正确语义的上下文进行特征语句提取，进一步增加了第一特征提取网络在错句情况下的鲁棒性。

步骤S3023，基于第一预训练任务以及第二预设训练任务，对第一特征提取模型进行预训练。

具体的，第一预训练任务以及第二预设训练任务可以分别进行，也可以交叉进行。在对样本语句对中的样本语句进行字词掩码时，第一预训练任务以及第二预设训练任务可以同时进行。

进一步的，请继续参考图5，图5示出了根据本申请的展示问诊过程方法的一个实施例的流程图。将目标特征词与目标特征语句在所述对话文本进行差异化标识的步骤包括：

步骤S2041，通过第一可视化要素对目标特征词进行可视化表达。

具体的，第一可视化要素可以根据目标特征词的置信度进行确定，其中，目标特征词的置信度通过第一特征提取模型输出得到。对目标特征词进行可视化表达可以理解为在对话文本的基础上，通过第一可视化要素对目标特征词进行渲染，使得目标特征词可以突出展示，更能吸引医生的注意。

第一特征提取模型会输出目标特征词的三元组信息，三元组信息包括目标特征词、目标特征词在语句中的位置以及置信度，比如“宝宝屁股长很多红疙瘩”中的第一目标特征词为“屁股”，第一目标特征词在语句中的位置为3和4，置信度表示“屁股”是第一目标特征词概率，置信度越高，则“屁股”是第一目标特征词概率越大，则说明“屁股”这个词越重要。“宝宝屁股长很多红疙瘩”中的第二目标特征词为“红疙瘩”，第一目标特征词在语句中的位置为8、9、10，置信度表示“红疙瘩”是第二目标特征词概率，置信度越高，则“红疙瘩”是第二目标特征词概率越大，则说明“红疙瘩”这个词越重要。

第一可视化要素可以是颜色，比如，“屁股”对应的置信度越大，则“屁股”的字体颜色越突出，以黑底白字的对话文本来说，第一可视化要素以红色为例，“屁股”对应的置信度越大，则“屁股”的字体颜色越红。

第一可视化要素还可以是尺寸，比如，“屁股”对应的置信度越大，则“屁股”的字体尺寸越大。

当然，第一可视化要素也可以是颜色和大小的结合。

步骤S2042，通过第二可视化要素对目标特征语句进行可视化表达。

具体的，第二可视化要素可以区别于第一可视化要素，比如，当第一可视化要素为颜色时，第二可视化要素可以是尺寸；当第一可视化要素为尺寸时，第二可视化要素可以是颜色；当第一可视化要素为颜色和大小的结合时，第二可视化要素可以是附加图形或者附加图形与颜色、尺寸的结合，附加图形比如在问诊对话前加柱形图、饼状图等，柱形图越长，则该问诊对话越重要，饼状图占比越大，则该问诊对话越重要。

具体的，第二可视化要素可以根据目标特征语句的权重进行确定，其中，目标特征语句的权重通过第二特征提取模型输出得到。可以是根据第二特征提取模型中的第二特征提取模块来进行确定，第二特征提取模块用于提取特征语句，得到对话文本中的目标特征语句。第二特征提取模块通过第三输出模块输出一个三元组信息，三元组信息中包括目标特征语句、目标特征语句在对话文本中的位置以及目标特征语句的权重。其中，目标特征语句的权重可以是目标特征语句的置信度。

在一种可能的实施例中，上述第二特征提取模型中，第二特征提取模块可以是注意力机制的特征提取模块，通过注意力机制对对话文本中每句问诊对话进行加权，得到每句问诊对话对应的权重。

在对话文本的基础上，对目标特征语句进行可视化表达可以理解为，通过第二可视化要素对目标特征语句进行渲染或附加图形，使得目标特征语句可以突出展示，更能吸引医生的注意。

步骤S2043，通过第三可视化要素对问诊过程进行可视化表达。

具体的，第三可视化要素可以根据对话文本中的问诊对话的时序进行确定。第三可视化要素可以理解为是对话文本的展示，在对话文本的展示中，每句问诊对话都是按对应的时序进行排列的。当然，在一些可能的实施例中，第三可视化要素也可以是根据对话文本中的问诊对话的重要程度进行确定，比如，将重要程度最高的问诊对话排在最前。问诊对话的重要程度可以根据目标特征词的置信度和问诊对话的权重进行相加得到。

在一种可能的实施例中，还可以通过第四可视化要素对对话文本的疾病诊断的预测结果进行可视化表达，疾病诊断的预测结果可以通过第二特征提取模型中的第四输出模块进行输出。具体的，针对对话文本，可以输出一个二元组信息，二元组信息包括疾病诊断的预测结果和对应的置信度，比如：“皮炎：36.16％”，其中，皮炎为疾病诊断的预测结果，36.16％为皮炎的置信度。疾病诊断的预测结果可以为多个，比如，“皮炎：36.16％”，“皮疹：28.12％”，“湿疹：19.07％”，“丘疹性荨麻疹：8.35％”，“荨麻疹：1.38％”等。

本实施例中，当患者在互联网医院进行就诊时，患者和医生进行对话沟通，系统首先通过医生与患者的对话收集患者的问诊信息，然后系统对收集到的问诊信息通过辅助诊断模型对患者进行疑似疾病诊断，辅助医生在问诊患者时进行疾病的判断，其中，辅助诊断模型包括第一特征提取模型和第二特征提取模型。此外，辅助诊断模型可以对作出的当前诊断提供有力证据，给出是根据医生与患者对话的哪些语句、哪些关键词给出的当前诊断，以供医生进行判断。通过该辅助诊断系统，可以有效提升医疗服务的质量和效率。通过将目标特征词与目标特征语句进行可视化，将更好的辅助医生进行判断，而不是一种黑盒式的给出诊断结果使得医生不知该结果依据什么给出的。

本申请可应用于智慧城市领域中，从而推动智慧城市的建设。例如，本申请可应用于智慧医疗领域中的数字医疗、互联网医院等多种涉及医疗问诊的应用领域。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机流程来指令相关的硬件来完成，该计算机流程可存储于一计算机可读取存储介质中，该流程在执行时，可包括如上述各方法的实施例的流程。其中，前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)等非易失性存储介质，或随机存储记忆体(Random Access Memory，RAM)等。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图6，作为对上述图2所示方法的实现，本申请提供了一种基于问诊会话的辅助诊断装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例所述的基于问诊会话的辅助诊断装置600包括：获取模块601、第一提取模块602、第二提取模块603以及展示模块604，其中：

获取模块601，用于获取问诊过程中产生的对话文本，对话文本包括医生与患者之间的问诊对话。

第一提取模块602，用于通过训练好的第一特征提取模型对问诊对话进行特征词提取，得到每句问诊对话中的目标特征词。

第二提取模块603，用于通过训练好的第二特征提取模型对对话文本进行特征语句提取，得到问诊过程中的目标特征语句。

展示模块604，用于将目标特征词与目标特征语句在对话文本进行差异化标识，作为问诊过程的辅助诊断信息进行展示。

在本实施例的一些可选的实现方式中，基于问诊会话的辅助诊断装置600还包括构建模块、预训练模块以及联合训练模块，其中：

构建模块，用于构建第一特征提取模型以及第二特征提取模型。

预训练模块，用于通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型。

联合训练模块，用于以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练。

本实施例中，通过对第一特征提取模型进行预训练，可以使第一特征提取模型与第二特征提取模型在联合训练阶段可以更好的拟合。

在本实施例的一些可选的实现方式中，预训练模块包括：第一构建子模块、第二构建子模块以及预训练子模块，其中：

第一构建子模块，用于根据第一医学数据，构建基于字词掩码预测的第一预训练任务。

第二构建子模块，用于根据第一医学数据，构建基于上下语句预测的第二预训练任务。

预训练子模块，用于基于第一预训练任务以及第二预设训练任务，对第一特征提取模型进行预训练。

在本实施例的一些可选的实现方式中，第一构建子模块包括：掩码单元、第一预测单元、第一计算单元以及第一构建单元，其中：

掩码单元，用于通过随机掩码块对第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句。

第一预测单元，用于对掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句。

第一计算单元，用于计算预测结果语句与初始语句样本之间的第一误差损失。

第一构建单元，用于以最小化第一误差损失为目标构建第一预训练任务。

在本实施例的一些可选的实现方式中，第二构建子模块包括：配对单元、第二预测单元、第二计算单元以及第二构建单元，其中：

配对单元，用于将初始语句样本或与初始语句样本对应的掩码样本语句作为上句，为初始语句样本随机匹配下句，形成样本语句对。

第二预测单元，用于对样本语句对进行上下语句预测，得到预测结果。

第二计算单元，用于计算预测结果与正确的样本语句对之间的第二误差损失，正确的样本语句对包括初始语句样本以及对应的正确下句。

第二构建单元，用于以最小化第二误差损失为目标构建第二预训练任务。

在本实施例的一些可选的实现方式中，联合训练模块包括：连接子模块、联合训练子模块以及迭代子模块，其中：

连接子模块，用于将预训练的第一特征提取模型与第二特征提取模型进行连接，得到连接后的模型；

联合训练子模块，用于通过第二医学数据对连接后的模型进行训练，并在训练过程中，通过疾病诊断交叉熵损失的反向传播调整预训练的第一特征提取模型与第二特征提取模型中的参数；

迭代子模块，用于将连接后的模型训练到收敛或达到预设迭次数后，得到训练好的第一特征提取模型以及训练好的第二特征提取模型。

在本实施例的一些可选的实现方式中，展示模块604包括：实体识别单元、问句筛选单元以及相似度计算单元，其中：

第一可视化子模块，用于通过第一可视化要素对所述目标特征词进行可视化表达，第一可视化要素根据目标特征词的置信度进行确定，其中，目标特征词的置信度通过所述第一特征提取模型输出得到；

第二可视化子模块，用于通过第二可视化要素对目标特征语句进行可视化表达，第二可神化要素根据目标特征语句的权重进行确定，其中，目标特征语句的权重通过第二特征提取模型输出得到；

第三可视化子模块，用于通过第三可视化要素对问诊过程进行可视化表达，第三可视化要素根据对话文本中的问诊对话的时序进行确定。

本实施例中，通过将目标特征词与目标特征语句进行可视化，将更好的辅助医生进行判断，而不是一种黑盒式的给出诊断结果使得医生不知该结果依据什么给出的。

为解决上述技术问题，本申请实施例还提供计算机设备。具体请参阅图7，图7为本实施例计算机设备基本结构框图。

所述计算机设备7包括通过系统总线相互通信连接存储器71、处理器72、网络接口73。需要指出的是，图中仅示出了具有组件71-73的计算机设备7，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。其中，本技术领域技术人员可以理解，这里的计算机设备是一种能够按照事先设定或存储的指令，自动进行数值计算和/或信息处理的设备，其硬件包括但不限于微处理器、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程门阵列(Field－Programmable Gate Array，FPGA)、数字处理器(Digital Signal Processor，DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器71至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等，所述计算机可读存储介质可以是非易失性，也可以是易失性。在一些实施例中，所述存储器71可以是所述计算机设备7的内部存储单元，例如该计算机设备7的硬盘或内存。在另一些实施例中，所述存储器71也可以是所述计算机设备7的外部存储设备，例如该计算机设备7上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器71还可以既包括所述计算机设备7的内部存储单元也包括其外部存储设备。本实施例中，所述存储器71通常用于存储安装于所述计算机设备7的操作系统和各类应用软件，例如基于问诊会话的辅助诊断方法的计算机可读指令等。此外，所述存储器71还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器72在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器72通常用于控制所述计算机设备7的总体操作。本实施例中，所述处理器72用于运行所述存储器71中存储的计算机可读指令或者处理数据，例如运行所述基于问诊会话的辅助诊断方法的计算机可读指令。

所述网络接口73可包括无线网络接口或有线网络接口，该网络接口73通常用于在所述计算机设备7与其他电子设备之间建立通信连接。

本实施例中提供的计算机设备可以执行上述基于问诊会话的辅助诊断方法的步骤。此处基于问诊会话的辅助诊断方法的步骤可以是下述各个实施例的基于问诊会话的辅助诊断方法中的步骤：

本申请还提供了另一种实施方式，即提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可读指令，所述计算机可读指令可被至少一个处理器执行，以使所述至少一个处理器执行如下述的基于问诊会话的辅助诊断方法的步骤：

本实施例中，获取到匹配语句对以及候选语句后，将匹配语句对作为正样本，识别候选语句中的实体并进行删除，得到无实体语句，将候选语句及其对应的无实体语句作为负样本，在训练初始语句匹配模型时，面对两个相似度较高但互为负样本的句子，可以基于注意力机制捕捉实体信息，强化了语句匹配时句子中实体的重要性，提高了训练完毕得到的语句匹配模型匹配的准确性；将用户问句输入语句匹配模型，即可准确地从问答库中确定与用户问句匹配的库存语句，同时展示与库存语句对应的答案信息，从而提高了信息检索的准确性。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如 ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本申请各个实施例所述的方法。

显然，以上所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例，附图中给出了本申请的较佳实施例，但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现，相反地，提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明，对于本领域的技术人员来而言，其依然可以对前述各具体实施方式所记载的技术方案进行修改，或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构，直接或间接运用在其他相关的技术领域，均同理在本申请专利保护范围之内。

Claims

一种基于问诊会话的辅助诊断方法，其中，包括下述步骤：

获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。
根据权利要求1所述的基于问诊会话的辅助诊断方法，其中，在所述获取问诊过程中产生的对话文本之前，所述方法还包括：

构建第一特征提取模型以及第二特征提取模型；

通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型；

以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练。
根据权利要求2所述的基于问诊会话的辅助诊断方法，其中，所述通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型的步骤包括：

根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务；

根据所述第一医学数据，构建基于上下语句预测的第二预训练任务；以及

基于所述第一预训练任务以及所述第二预设训练任务，对所述第一特征提取模型进行预训练。
根据权利要求3所述的基于问诊会话的辅助诊断方法，其中，所述根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务的步骤包括：

通过随机掩码块对所述第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句；

对所述掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句；

计算所述预测结果语句与所述初始语句样本之间的第一误差损失；

以最小化第一误差损失为目标构建所述第一预训练任务。
根据权利要求4所述的基于问诊会话的辅助诊断方法，其中，所述根据所述第一医学数据，构建基于上下语句预测的第二预训练任务的步骤包括：

将所述初始语句样本或与所述初始语句样本对应的掩码样本语句作为上句，为所述初始语句样本随机匹配下句，形成样本语句对；

对所述样本语句对进行上下语句预测，得到预测结果；

计算所述预测结果与正确的样本语句对之间的第二误差损失，所述正确的样本语句对包括初始语句样本以及对应的正确下句；

以最小化第二误差损失为目标构建所述第二预训练任务。
根据权利要求2所述的基于问诊会话的辅助诊断方法，其中，所述以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练的步骤包括：

将所述预训练的第一特征提取模型与所述第二特征提取模型进行连接，得到连接后的模型；

通过第二医学数据对所述连接后的模型进行训练，并在训练过程中，通过所述疾病诊断交叉熵损失的反向传播调整所述预训练的第一特征提取模型与所述第二特征提取模型中的参数；

将所述连接后的模型训练到收敛或达到预设迭次数后，得到所述训练好的第一特征提取模型以及所述训练好的第二特征提取模型。
根据权利要求6所述的基于问诊会话的辅助诊断方法，其中，所述将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识的步骤包括：

通过第一可视化要素对所述目标特征词进行可视化表达，所述第一可视化要素根据所述目标特征词的置信度进行确定，其中，所述目标特征词的置信度通过所述第一特征提取模型输出得到；

通过第二可视化要素对所述目标特征语句进行可视化表达，所述第二可神化要素根据所述目标特征语句的权重进行确定，其中，所述目标特征语句的权重通过所述第二特征提取模型输出得到；

通过第三可视化要素对所述问诊过程进行可视化表达，所述第三可视化要素根据所述问诊过程中产生的问诊对话的时序进行确定。
一种基于问诊会话的辅助诊断装置，其中，包括：

获取模块，用于获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

第一提取模块，用于通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

第二提取模块，用于通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

展示模块，用于将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现如下所述的基于问诊会话的辅助诊断方法的步骤：

获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。
根据权利要求9所述的计算机设备，其中，在所述获取问诊过程中产生的对话文本之前，所述方法还包括：

构建第一特征提取模型以及第二特征提取模型；

通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型；

以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练。
根据权利要求10所述的计算机设备，其中，所述通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型的步骤包括：

根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务；

根据所述第一医学数据，构建基于上下语句预测的第二预训练任务；以及

基于所述第一预训练任务以及所述第二预设训练任务，对所述第一特征提取模型进行预训练。
根据权利要求11所述的计算机设备，其中，所述根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务的步骤包括：

通过随机掩码块对所述第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句；

对所述掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句；

计算所述预测结果语句与所述初始语句样本之间的第一误差损失；

以最小化第一误差损失为目标构建所述第一预训练任务。
根据权利要求12所述的计算机设备，其中，所述根据所述第一医学数据，构建基于上下语句预测的第二预训练任务的步骤包括：

将所述初始语句样本或与所述初始语句样本对应的掩码样本语句作为上句，为所述初始语句样本随机匹配下句，形成样本语句对；

对所述样本语句对进行上下语句预测，得到预测结果；

计算所述预测结果与正确的样本语句对之间的第二误差损失，所述正确的样本语句对包括初始语句样本以及对应的正确下句；

以最小化第二误差损失为目标构建所述第二预训练任务。
根据权利要求10所述的计算机设备，其中，所述以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练的步骤包括：

将所述预训练的第一特征提取模型与所述第二特征提取模型进行连接，得到连接后的模型；

通过第二医学数据对所述连接后的模型进行训练，并在训练过程中，通过所述疾病诊断交叉熵损失的反向传播调整所述预训练的第一特征提取模型与所述第二特征提取模型中的参数；

将所述连接后的模型训练到收敛或达到预设迭次数后，得到所述训练好的第一特征提取模型以及所述训练好的第二特征提取模型。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现如下所述的基于问诊会话的辅助诊断方法的步骤：

获取问诊过程中产生的对话文本，所述对话文本包括医生与患者之间的问诊对话；

通过训练好的第一特征提取模型对所述问诊对话进行特征词提取，得到每句问诊对话中的目标特征词；

通过训练好的第二特征提取模型对所述对话文本进行特征语句提取，得到所述问诊过程中的目标特征语句；

将所述目标特征词与所述目标特征语句在所述对话文本进行差异化标识，作为所述问诊过程的辅助诊断信息进行展示。
根据权利要求15所述的计算机可读存储介质，其中，在所述获取问诊过程中产生的对话文本之前，所述方法还包括：

构建第一特征提取模型以及第二特征提取模型；

通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型；

以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练。
根据权利要求16所述的计算机可读存储介质，其中，所述通过第一医学数据对所述第一特征提取模型进行预训练，得到预训练的第一特征提取模型的步骤包括：

根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务；

根据所述第一医学数据，构建基于上下语句预测的第二预训练任务；以及

基于所述第一预训练任务以及所述第二预设训练任务，对所述第一特征提取模型进行预训练。
根据权利要求17所述的计算机可读存储介质，其中，所述根据所述第一医学数据，构建基于字词掩码预测的第一预训练任务的步骤包括：

通过随机掩码块对所述第一医学数据中的初始语句样本进行随机字词掩码，得到掩码样本语句；

对所述掩码样本语句中被掩码字词进行字词掩码预测，得到预测结果语句；

计算所述预测结果语句与所述初始语句样本之间的第一误差损失；

以最小化第一误差损失为目标构建所述第一预训练任务。
根据权利要求18所述的计算机可读存储介质，其中，所述根据所述第一医学数据，构建基于上下语句预测的第二预训练任务的步骤包括：

将所述初始语句样本或与所述初始语句样本对应的掩码样本语句作为上句，为所述初始语句样本随机匹配下句，形成样本语句对；

对所述样本语句对进行上下语句预测，得到预测结果；

计算所述预测结果与正确的样本语句对之间的第二误差损失，所述正确的样本语句对包括初始语句样本以及对应的正确下句；

以最小化第二误差损失为目标构建所述第二预训练任务。
根据权利要求16所述的计算机可读存储介质，其中，所述以疾病诊断交叉熵损失为优化目标，通过第二医学数据对所述预训练的第一特征提取模型以及所述第二特征提取模型进行联合训练的步骤包括：

将所述预训练的第一特征提取模型与所述第二特征提取模型进行连接，得到连接后的模型；

通过第二医学数据对所述连接后的模型进行训练，并在训练过程中，通过所述疾病诊断交叉熵损失的反向传播调整所述预训练的第一特征提取模型与所述第二特征提取模型中的参数；

将所述连接后的模型训练到收敛或达到预设迭次数后，得到所述训练好的第一特征提取模型以及所述训练好的第二特征提取模型。