CN110347838A

CN110347838A - 线上科室分诊模型训练方法及装置

Info

Publication number: CN110347838A
Application number: CN201910644736.5A
Authority: CN
Inventors: 黄羽
Original assignee: Chengdu Medical Cloud Technology Co Ltd
Current assignee: Chengdu Medical Cloud Technology Co Ltd
Priority date: 2019-07-17
Filing date: 2019-07-17
Publication date: 2019-10-18
Anticipated expiration: 2039-07-17
Also published as: CN110347838B

Abstract

本申请实施例提供一种线上科室分诊模型训练方法及装置，首先通过通用领域的语料文本对预测模型进行预训练，获得训练后的第一预测模型，采用医学领域的语料文本进行进一步的训练，并获得第二预测模型。最后，为了完成科室分诊、导诊的任务，通过预测目标函数及分诊目标函数对该第二预测模型进行再次训练，在预测目标函数及分诊目标函数均达到收敛时，结束训练，在去除预测目标函数后获得科室分诊模型。通过上述步骤中的三次训练，分别处理大量的不同的语料文本，能够有效提升科室分诊模型的准确率。同时，由于准确率的提升，可以在与患者进行较少次数的信息交互之后为用户推荐挂号或就诊的科室，提升了挂号及就诊效率。

Description

线上科室分诊模型训练方法及装置

技术领域

本申请涉及信息交互领域，具体而言，涉及线上科室分诊模型训练方法及装置。

背景技术

由于互联网技术的普及，越来越多的医院推出线上挂号及问诊的服务。但是在进行线上挂号或问诊时，大部分患者可能并不清楚自身的病症应该选择哪个科室进行挂号或问诊，从而浪费许多的时间，导致线上挂号及问诊的效率过低。

目前的分诊及导诊系统为了解决上述问题，通常需要与患者进行多次信息交互(多达10次以上)，甚至有的分诊及导诊系统还需要用户在交互界面上选择身体部位，操作较为复杂。尽管如此，目前的分诊及导诊的系统依旧无法为患者推荐出准确的科室进行挂号或问诊。同时，目前的分诊及导诊系统的科室不够细化，直接将年龄小于6岁的患者分至儿科，但实际儿科也包含许多细分科室，需要进行进一步划分。

发明内容

为了至少克服现有技术中的上述不足，本申请的目的之一在于提供一种线上科室分诊模型训练方法及装置。

第一方面，本发明实施例提供一种线上科室分诊模型训练方法，应用于计算机设备，所述方法包括：

采用通用领域的语料文本对预测模型进行训练，在所述预测模型中的预测目标函数达到收敛时，得到第一预测模型，其中，所述通用领域包括音乐领域、航空领域、建筑领域，所述预测模型中的预测目标函数用于预测所述通用领域的语料文本中被调整部分的内容；

采用医学领域的语料文本对所述第一预测模型进行再训练，在所述第一预测模型中的预测目标函数达到收敛时，得到第二预测模型，其中，第二预测模型中的预测目标函数用于预测所述医学领域的语料文本中被调整部分的内容；

在所述第二预测模型中增加用于根据患者描述语料文本进行科室识别的分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对所述第二预测模型进行预设次数的训练后，去除所述第二预测模型中的预测目标函数，对去除所述预测目标函数的第二预测模型进行再次训练，直到所述分诊目标函数收敛，得到训练好的科室分诊模型。

在可选的实施方式中，所述计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，所述采用通用领域的语料文本对预测模型进行训练，在所述预测模型中的预测目标函数达到收敛时，得到第一预测模型，包括：

根据所述词表保存的词组与词组向量的对应关系，对所述通用领域的语料文本进行编码，以获得语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量；

对编码后的通用领域的语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置；

将调整处理后的语料文本输入语义模型中进行语义训练，输出新的语料文本，其中，所述语义模型包括单向语义模型和双向语义模型；

基于输出的新的语料文本及输入所述预测模型中的语料文本，计算所述预测目标函数的函数值，在所述预测目标函数的函数值未达到收敛条件时，调整所述预测模型的模型参数，并重复上述步骤，在所述预测目标函数的函数值达到收敛条件时，得到第一预测模型。

在可选的实施方式中，在所述第二预测模型中增加分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对所述第二预测模型进行预设次数的训练后，去除所述第二预测模型中的预测目标函数，对去除所述预测目标函数的第二预测模型进行再次训练，直到所述分诊目标函数收敛，得到训练好的科室分诊模型，包括：

在第二预测模型中增加分诊目标函数；

根据词组与词组向量的对应关系，对所述患者描述语料文本进行编码，以获得所述患者描述语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量；

对编码后的所述患者描述语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置；

将调整处理后的所述患者描述语料文本及对应科室输入语义模型中进行语义训练，输出新的患者描述语料文本及第一科室；

基于输出的新的患者描述语料文本及所述第二预测模型中输入的所述患者描述语料文本计算预测目标函数的函数值；

基于输出的第一科室及输入的对应科室计算分诊目标函数的函数值；

根据所述预测目标函数值及目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数；

去除所述预测目标函数，并将所述训练样本输入到所述语义模型中进行训练，输出第二科室；

基于输入的训练样本中的对应科室及输出的第二科室计算分诊目标函数的函数值，在所述分诊目标函数的函数值未达到收敛条件时，调整所述第二预测模型的模型参数，并执行将所述训练样本输入到所述语义模型中进行训练，输出第二科室的步骤，直到所述分诊目标函数的函数值达到收敛条件时，得到科室分诊模型。

在可选的实施方式中，所述对编码后的通用领域的语料文本进行调整处理，包括：

对所述通用领域的语料文本中各个单句的多个连续的词组按照预设的概率随机进行掩码处理；

对所述通用领域的语料文本中的多个上下句进行随机排序；

或对所述通用领域的语料文本中的多个主题段落进行随机排序，其中，所述主题段落包括描述同一主题内容的多个自然段落。

在可选的实施方式中，在得到训练好的科室分诊模型之后，所述方法还包括：

将患者的描述文本输入到所述科室分诊模型中，得到多个科室及与所述多个科室分别对应的F1值，其中，所述F1值用于表示所述科室分诊模型的精确率；

若所述科室对应的F1值高于预设值，则将该F1值对应的科室作为该患者对应的分诊科室；

否则，向患者显示包含多个病症选项的文本；

将患者从所述文本中选择的病症选项输入到所述科室分诊模型中，并通过该病症选项去除不包含治疗该病症选项的科室以及计算剩余科室对应的F1值，重复该步骤直到剩余科室对应的F1值高于预设值或患者选择的病症选项只对应一个科室时，将剩余科室中F1值高于预设值或患者选择的病症选项对应的唯一科室作为该患者对应的分诊科室。

第二方面，本发明实施例提供一种线上科室分诊模型训练装置，应用于计算机设备，所述装置包括：

第一训练模块，用于采用通用领域的语料文本对预测模型进行训练，在所述预测模型中的预测目标函数达到收敛时，得到第一预测模型，其中，所述通用领域包括音乐领域、航空领域、建筑领域，所述预测模型中的预测目标函数用于预测所述通用领域的语料文本中被调整部分的内容；

第二训练模块，用于采用医学领域的语料文本对所述第一预测模型进行再训练，在所述第一预测模型中的预测目标函数达到收敛时，得到第二预测模型，其中，第二预测模型中的预测目标函数用于预测所述医学领域的语料文本中被调整部分的内容；

第三训练模块，用于在所述第二预测模型中增加用于根据患者描述语料文本进行科室识别的分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对所述第二预测模型进行预设次数的训练后，去除所述第二预测模型中的预测目标函数，对去除所述预测目标函数的第二预测模型进行再次训练，直到所述分诊目标函数收敛，得到训练好的科室分诊模型。

在可选的实施方式中，所述计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，所述第一训练模块包括：

第一编码子模块，用于根据所述词表保存的词组与词组向量的对应关系，对所述通用领域的语料文本进行编码，以获得语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量；

第一调整子模块，用于对编码后的通用领域的语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置；

第一语义训练子模块，用于将调整处理后的语料文本输入语义模型中进行语义训练，输出新的语料文本，其中，所述语义模型包括单向语义模型和双向语义模型；

第一预测模型获得子模块，用于基于输出的新的语料文本及输入所述预测模型中的语料文本，计算所述预测目标函数的函数值，在所述预测目标函数的函数值未达到收敛条件时，调整所述预测模型的模型参数，并重复上述步骤，在所述预测目标函数的函数值达到收敛条件时，得到第一预测模型。

在可选的实施方式中，所述第三训练模块包括：

函数增加子模块，用于在第二预测模型中增加分诊目标函数；

第二编码子模块，用于根据词组与词组向量的对应关系，对所述患者描述语料文本进行编码，以获得所述患者描述语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量；

第二调整子模块，用于对编码后的所述患者描述语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置；

第二语义训练子模块，用于将调整处理后的所述患者描述语料文本及对应科室输入语义模型中进行语义训练，输出新的患者描述语料文本及第一科室；

计算子模块，用于基于输出的新的患者描述语料文本及所述第二预测模型中输入的所述患者描述语料文本计算预测目标函数的函数值；还用于基于输出的第一科室及输入的对应科室计算分诊目标函数的函数值；

参数调整子模块，用于根据所述预测目标函数值及目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数；

去除子模块，用于去除所述预测目标函数，并将所述训练样本输入到所述语义模型中进行训练，输出第二科室；

科室分诊模型获得子模块，用于基于输入的训练样本中的对应科室及输出的第二科室计算分诊目标函数的函数值，在所述分诊目标函数的函数值未达到收敛条件时，调整所述第二预测模型的模型参数，并执行将所述训练样本输入到所述语义模型中进行训练，输出第二科室的步骤，知道所述分诊目标函数的函数值达到收敛条件时，得到科室分诊模型。

在可选的实施方式中，所述第一调整子模块具体用于：

对所述通用领域的语料文本中的多个上下句进行随机排序；

在可选的实施方式中，所述装置还包括：

计算模块，用于将患者的描述文本输入到所述科室分诊模型中，得到多个科室及与所述多个科室分别对应的F1值，其中，所述F1值用于表示所述科室分诊模型的精确率；

判断模块，用于当所述科室对应的F1值高于预设值时将该F1值对应的科室作为该患者对应的分诊科室；否则，向患者显示包含多个病症选项的文本；

导诊模块，用于将患者从所述文本中选择的病症选项输入到所述科室分诊模型中，并通过该病症选项去除不包含治疗该病症选项的科室以及计算剩余科室对应的F1值，重复该步骤直到剩余科室对应的F1值高于预设值或患者选择的病症选项只对应一个科室时，将剩余科室中F1值高于预设值或患者选择的病症选项对应的唯一科室作为该患者对应的分诊科室。

相对于现有技术而言，本申请具有以下有益效果：

本申请实施例提供一种线上科室分诊模型训练方法及装置，首先通过通用领域的语料文本对预测模型进行预训练，通过预训练可以学习大量的通用领域的语料文本中的语法及语言风格等，同时获得训练后的第一预测模型，随后为了提高模型的准确率，采用医学领域的语料文本进行进一步的训练，进一步学习医学领域的专业知识，同时获得第二预测模型。最后，为了完成科室分诊、导诊的任务，通过预测目标函数及分诊目标函数对该第二预测模型进行再次训练，在预测目标函数及分诊目标函数均达到收敛时，结束训练，在去除预测目标函数后获得科室分诊模型。通过上述步骤中的三次训练，分别处理大量的不同领域的语料文本，能够使语言模型学习到较多类型的语言风格、语法等，同时还能学习许多的医学领域的专业知识，能够有效地提升科室分诊模型的准确率。同时，由于准确率的提升，可以在与患者进行较少次数的信息交互之后为用户推荐挂号或就诊的科室，提升了挂号及就诊效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的线上科室分诊模型训练方法的流程图之一；

图2为本申请实施例提供的线上科室分诊模型训练方法的流程图之二；

图3为本申请实施例提供的步骤S110的子步骤流程图；

图4为本申请实施例提供的编码处理示例图；

图5为本申请实施例提供的步骤S220的子步骤流程图；

图6为本申请实施例提供的步骤S130的子步骤流程图；

图7为本申请实施例提供的线上科室分诊模型训练装置的功能模块图；

图8为本申请实施例提供的第一训练模块的子模块图；

图9为本申请实施例提供的第三训练模块的子模块图。

图标：100-线上科室分诊模型训练装置；101-第一训练模块；102-第二训练模块；103-第三训练模块；104-计算模块；105-判断模块；106-导诊模块；1011-第一编码子模块；1012-第一调整子模块；1013-第一语义训练子模块；1014-第一预测模型获得子模块；1031-函数增加子模块；1032-第二编码子模块；1033-第二调整子模块；1034-第二语义训练子模块；1035-计算子模块；1036-参数调整子模块；1037-去除子模块；1038-科室分诊模型获得子模块。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中，还需要说明的是，除非另有明确的规定和限定，术语“设置”、“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。

请参照图1，图1为本申请实施例提供的线上科室分诊模型训练方法的流程图之一。该方法应用于计算机设备，包括以下步骤：

步骤S110，采用通用领域的语料文本对预测模型进行训练，在预测模型中的预测目标函数达到收敛时，得到第一预测模型。

其中，所述通用领域包括音乐领域、航空领域、建筑领域，所述预测模型中的预测目标函数用于预测所述通用领域的语料文本中被调整部分的内容。

步骤S120，采用医学领域的语料文本对所述第一预测模型进行再训练，在第一预测模型中的预测目标函数达到收敛时，得到第二预测模型。

其中，第二预测模型中的预测目标函数用于预测所述医学领域的语料文本中被调整部分的内容。

步骤S130，在第二预测模型中增加分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对第二预测模型进行预设次数的训练后，去除第二预测模型中的预测目标函数，对去除预测目标函数的第二预测模型进行再次训练，直到分诊目标函数收敛，得到训练好的科室分诊模型。

在上述步骤S110至步骤S130中，首先运用大量的通用领域的语料文本对预测模型进行预训练，例如，航空领域、建筑领域、文学领域等，从该通用领域的语料文本中可以学习到大量的语法及语言风格。在预训练结束后，获得一个第一预测模型。

随后，为了提升该第一预测模型在医学领域的准确率，通过医学领域的语料文本(例如医学书籍、医学论文、学术报告及病历等)对上述的第一预测模型进行再训练，获得第二预测模型。通过大量的医学领域的语料文本能够学习较多的医学专业知识，提升预测模型的准确率。

最后，为了使该第二预测模型能够进行科室分诊及导诊，还需要在第二预测模型中增加用于根据患者描述文本进行科室分诊的分诊目标函数。在训练的过程中，首先用第一预测模型中的预测目标函数及分诊目标函数进行预设次数的训练(例如5000次)，在预设次数的训练完成之后，去除预测目标函数，仅使用分诊目标函数继续进行训练，直到该分诊目标函数收敛，得到科室分诊模型。

通过上述科室分诊模型可以对患者的描述文本进行处理，为患者推荐挂号或者就诊的科室，提高挂号及就诊效率。

请参照图2，在本实施例中，在步骤S130之后，所述方法还包括：

步骤S140，将患者的描述文本输入到所述科室分诊模型中，得到多个科室及与多个科室分别对应的F1值。

F1分数(F1Score)是统计学中用来衡量二分类模型精确度的一种指标。在本实施例中，F1值用于表示所述科室分诊模型的精确率，F1值越高，则表示该科室分诊模型的结果越准确。

在上述步骤中，患者在进行线上问诊时，在输入界面输入关于自身病症的描述文本(如症状、部位、用药情况、病史等信息)或者输入需要咨询的问题，科室分诊模型对该描述文本进行处理，得到多个科室及该多个科室分别对应的F1值，F1值越大则表示对应的科室越接近于患者应该就诊的科室。若患者在此步骤中输入的描述文本中的信息足够多，则科室分诊模型可以直接为患者给出科室。

步骤S150，判断各个F1值是否高于预设值。

步骤S160，若科室对应的F1值高于预设值，则将该F1值对应的科室作为该患者的分诊科室。

步骤S170，若科室对应的F1值不高于预设值，则向患者显示包含多个病症选项的文本。

在上述步骤中，首先判断各个科室对应的F1值是否高于预设值(例如99％)，若高于预设值，则表示该患者的描述文本中的信息足够多且准确，科室分诊模型无需通过多次交互即可为患者输出该高于预设值的F1值对应的科室。否则，则表示用户输入的描述文本并不能支持科室分诊模型准确的输出推荐科室，因此需要进入导诊环节。导诊环节需要与患者进行1-3次的信息交互，具体交互方式参照下文。

步骤S180，将患者从文本中选择的病症选项输入到科室分诊模型中，并通过该病症选项去除不包含治疗该病症选项的科室以及计算剩余科室对应的F1值，重复该步骤直到剩余科室对应的F1值高于预设值或患者选择的病症选项只对应一个科室时，将剩余科室中F1值高于预设值或患者选择的病症选项对应的唯一科室作为该患者对应的分诊科室。

在上述步骤中，通过信息抽取模块从患者的描述文本中获取相关的疾病关键字信息(例如身体部位、病症、病史等)，结合医学知识图谱向患者显示多个可供患者选择的病症。例如，当患者输入的是“我头疼”时，可向患者显示“发烧”、“感冒”等可能引起头疼的病症。

将用户选择的病症输入到科室分诊模型中进行计算，科室分诊模型结合医学知识图谱进一步确认患者就诊及问诊的科室(即去除掉不包含该病症的科室)，同时计算剩余科室对应的F1值。继续判断F1值是否高于预设值(例如99％)，若高于预设值，则直接输出该F1值对应的科室，否则，继续向患者显示多个可供选择的病症，根据用户的选择逐渐去除不对应的科室，直至仅剩余唯一的一个科室或科室的F1值高于预设值时，结束导诊环节，为患者输出分诊科室。

通过上述步骤，能够快速地对患者的描述文本进行处理，并准确地输出该描述文本对应的科室，提高了线上问诊及就诊效率，提升了用户体验。

请参照图3，图3为本申请实施例提供的步骤S110的子步骤流程图。在本实施例中，计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，步骤S110包括步骤S210至步骤S240：

步骤S210，根据词表保存的词组与词组向量的对应关系，对通用领域的语料文本进行编码，以获得语料文本中每个词组对应的词组向量。

其中，词组向量包括词向量、句向量及位置向量。

在本步骤中，首先对计算机中的词表进行初始化，从而获得词表中词组与词组向量的初始对应关系。根据该初始对应关系对通用领域的语料文本进行编码，从而获得通用领域的语料文本中每个词组对应的词组向量。

具体的，词组向量包括词向量、句向量以及位置向量。例如，请参照图4，输入的文本为“my dog is cute,he likes playing”，则需要对该句进行编码，获得其中每个词组的词向量、位置向量以及句向量。其中，E_A和E_B分别表示第一个句子及第二个句子，E₀-E₁₀分别表示输入的句子中每个词组对应的位置。

单词嵌入(Token Embeddings)，是指将单词划分成一组有限的公共子词单元。例如示例中“playing”被拆分成了“play”和“ing”。

位置嵌入(Position Embedding)，是指将单词的位置信息编码成特征向量，位置嵌入是向模型中引入单词位置关系的至关重要的一环。例如，示例中的E₀-E₁₀。

分割嵌入(Segment Embedding)，用于区分两个句子。例如，示例中的E_A和E_B。

步骤S220，对编码后的通用领域的语料文本进行调整处理。

其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置。

在本步骤中，在对通用领域的语料文本进行编码之后，还需要对该语料文本进行调整处理，包括掩码处理、更换上下句位置或更换主题段落的位置。

具体的，请参照图5，步骤S220包括以下子步骤中的至少一个：

子步骤S310，对通用领域的语料文本中各个单句的多个连续的词组按照预设的概率随机进行掩码处理。

在本步骤中，对语料文本进行掩码处理是指将一个句子中的连续的多个词语用其他词语或用[mask]代替。例如，将通用领域的语料文本中的80％的词组用[mask]进行替换，10％的词组使用其他单词替换，剩余10％的词组不进行替换。

子步骤S320，对通用领域的语料文本中的多个上下句进行随机排序。

在本步骤中，在一个主题段落中，把多个句子断开，得到sentence_n个句子，将通用领域的语料文本中的某一句子的下一个句子随机的替换或者不替换成其他句子，并使用onehot的形式进行编码。例如，若上一句与下一句能够构成上下文关系，则认为是正样本(该位为1)，反之是负样本(该位为0)。在本步骤中，为了加快训练速度，使得模型能够快速收敛，可以适当调低替换比例并约束替换范围。(例如通用领域的语料文本中的20％发生替换，若上一个句子发生替换，则下一句不发生替换)。

子步骤S330，对所述通用领域的语料文本中的多个主题段落进行随机排序。其中，所述主题段落包括描述同一主题内容的多个自然段落。

在本步骤中，主题段落由若干个句子构成，用于描述同一主题，可包括多个自然段落。在对通用领域的语料文本进行调整时，按照语料文本的原始主题段落将语料划分为多个主题段落，并对其中的多个主题段落进行随机排序，将同一主题段落的多个自然段落进行随机替换，依旧采用onehot形式对其进行编码，若替换之后的上下文的自然段落能构成同一主题，则为正样本(该位为1)，否则为负样本(该位为0)。为了加快模型的训练速度，同样可以按照预设的比例进行随机替换并约束替换范围。

步骤S230，将调整处理后的语料文本输入语义模型中进行语义训练，输出新的语料文本。其中，所述语义模型包括单向语义模型和双向语义模型。

在本步骤中，在对通用领域的语料文本处理完成后，将处理后的语料文本输入到sparse transformer(稀疏编码器)中进行矩阵运算，输出新的语料文本，其中，sparsetransformer中包括单向语义模型及双向语义模型。

所述双向语义模型可用于根据语料文本中未进行掩码处理的词组信息进行处理，预测出语料文本中被掩码的其余词组。而单向语义模型仅可使用需要被预测的词组的前文中的未进行掩码处理的词组完成预测任务，无法利用后文中的词组。通过结合单向语义模型和双向语义模型，可以使得预测结果更加准确。

被调整后的语料文本输入到上述包含双向语义模型及单向语义模型的sparsetransformer中进行矩阵运算后输出预测结果，即预测输出的被调整后的语料文本的原始内容。

步骤S240，基于输出的新的语料文本及输入预测模型中的语料文本，计算预测目标函数的函数值，在预测目标函数的函数值未达到收敛条件时，调整预测模型的模型参数，重复上述步骤，在预测目标函数的函数值达到收敛条件时，得到第一预测模型。

在本步骤中，为了对预测模型进行训练，以使sparse transformer输出的新的语料文本与调整处理前的语料文本误差较小，因此需要基于输出的新的语料文本及输入预测模型中的语料文本计算预测目标函数的函数值，该预测目标函数的函数值越大，则表示输出的新的语料文本与原始的语料文本差异越大，需要对该预测模型的模型参数进行调整，其中，模型参数包括词表中词组及词组向量的对应关系以及用于矩阵计算的sparsetransformer中的参数等。重复上述的步骤，直到该预测目标函数达到收敛条件，得到第一预测模型。其中，所述收敛条件包括进行了预设次数的训练或是预测目标函数的函数值已经收敛，不再继续减小。

具体地，所述预测目标函数包括用于预测被掩码处理之后的原始词组的mask_loss、用于预测是否为上下文的context_loss以及预测是否为同一主题段落的topic_loss。通过上述三种loss函数对预测模型进行训练，在达到收敛条件后，得到第一预测模型。

为了使第一预测模型能够对医学领域的文本进行预测，还需要对该第一预测模型进行进一步训练，获得第二预测模型。训练方式与上文描述的步骤S210至步骤S240相似，只是将通用领域的语料文本更换为医学领域的语料文本，在此不再进行赘述。

在进行了再训练之后，为了通过预测模型获得科室分诊模型，还需要进行分诊训练，可参照图6，图6为本申请实施例提供的步骤S130的子步骤流程图，包括：

步骤S410，在第二预测模型中增加分诊目标函数。

在本步骤中，为了完成科室分诊任务，需要在第二预测模型中增加用于进行科室分诊的分诊目标函数。

步骤S420，根据词组与词组向量的对应关系，对患者描述语料文本进行编码，以获得患者描述语料文本中每个词组对应的词组向量。其中，所述词组向量包括词向量、句向量及位置向量。

步骤S430，对编码后的患者描述语料文本进行调整处理。其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置。

在上述步骤中，首先对患者描述语料文本进行编码处理，根据第二预测模型中的词组与词组向量的对应关系进行编码处理，随后对编码之后的患者描述语料文本进行调整处理，具体调整方式与上文中描述的对通用领域的语料文本进行调整处理的方式相似，在此不再进行赘述。

步骤S440，将调整处理后的患者描述语料文本及对应科室输入语义模型中进行语义训练，输出新的患者描述语料文本及第一科室。

在本步骤中，将调整处理后的患者语料文本及对应的科室输入sparsetransformer中进行矩阵运算，并输出运算结果，该结果包括预测结果及分诊结果(即新的患者描述语料文本及第一科室)。

步骤S450，基于输出的新的患者描述语料文本及第二预测模型中输入的患者描述语料文本计算预测目标函数的函数值；基于输出的第一科室及输入的对应科室计算分诊目标函数的函数值。

步骤S460，根据预测目标函数值及分诊目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数。

在本步骤中，为了对模型进行训练，需要根据模型的输出结果进行参数调整，以保证模型的输出结果与期望输出结果差异较小。在本步骤中，分别采用预测目标函数pre_lm_loss及分诊目标函数department_loss计算预测结果、分诊结果与期望输出结果的差异值，并根据该差异值调整模型参数。重复上述步骤，直至完成预设次数的训练(例如预设5000次训练)。

步骤S470，去除预测目标函数，并将训练样本输入到语义模型中进行训练，输出第二科室。

步骤S480，基于输入的训练样本中的对应科室及输出的第二科室计算分诊目标函数的函数值，在分诊目标函数的函数值未达到收敛条件时，调整第二预测模型的模型参数，并执行将训练样本输入到语义模型中进行训练，输出第二科室的步骤，直到分诊目标函数的函数值达到收敛条件，得到科室分诊模型。

上述步骤中，在使用预测目标函数pre_lm_loss及分诊目标函数department_loss共同训练预设的次数后(例如5000次)，去除第二预测模型中的预测目标函数pre_lm_loss，仅保留分诊目标函数department_loss继续训练，通过分诊目标函数department_loss计算输出的第二科室与期望输出的分诊科室的差异，并根据所述分诊目标函数的函数值调整模型参数，直到该分诊目标函数达到收敛条件，结束训练，获得科室分诊模型。

请参照图7，图7为本申请实施例提供的线上科室分诊模型训练装置100的功能模块图，所述线上科室分诊模型训练装置100应用于计算机设备，包括：

第一训练模块101，用于采用通用领域的语料文本对预测模型进行训练，在所述预测模型中的预测目标函数达到收敛时，得到第一预测模型，其中，所述通用领域包括音乐领域、航空领域、建筑领域，所述预测模型中的预测目标函数用于预测所述通用领域的语料文本中被调整部分的内容。

第二训练模块102，用于采用医学领域的语料文本对所述第一预测模型进行再训练，在所述第一预测模型中的预测目标函数达到收敛时，得到第二预测模型，其中，第二预测模型中的预测目标函数用于预测所述医学领域的语料文本中被调整部分的内容。

第三训练模块103，用于在所述第二预测模型中增加用于根据患者描述语料文本进行科室识别的分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对所述第二预测模型进行预设次数的训练后，去除所述第二预测模型中的预测目标函数，对去除所述预测目标函数的第二预测模型进行再次训练，直到所述分诊目标函数收敛，得到训练好的科室分诊模型。

可选地，参照图8，在本实施例中，所述计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，所述第一训练模块101包括：

第一编码子模块1011，用于根据所述词表保存的词组与词组向量的对应关系，对所述通用领域的语料文本进行编码，以获得语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量。

第一调整子模块1012，用于对编码后的通用领域的语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置。

第一语义训练子模块1013，用于将调整处理后的语料文本输入语义模型中进行语义训练，输出新的语料文本，其中，所述语义模型包括单向语义模型和双向语义模型。

第一预测模型获得子模块1014，用于基于输出的新的语料文本及输入所述预测模型中的语料文本，计算所述预测目标函数的函数值，在所述预测目标函数的函数值未达到收敛条件时，调整所述预测模型的模型参数，并重复上述步骤，在所述预测目标函数的函数值达到收敛条件时，得到第一预测模型。

可选地，参照图9，在本实施例中，所述第三训练模块103包括：

函数增加子模块1031，用于在第二预测模型中增加分诊目标函数。

第二编码子模块1032，用于根据词组与词组向量的对应关系，对所述患者描述语料文本进行编码，以获得所述患者描述语料文本中每个词组对应的词组向量，其中，所述词组向量包括词向量、句向量及位置向量。

第二调整子模块1033，用于对编码后的所述患者描述语料文本进行调整处理，其中，所述调整处理包括对词组进行掩码处理、更换上下句位置或更换主题段落的位置。

第二语义训练子模块1034，用于将调整处理后的所述患者描述语料文本及对应科室输入语义模型中进行语义训练，输出新的患者描述语料文本及第一科室。

计算子模块1035，用于基于输出的新的患者描述语料文本及所述第二预测模型中输入的所述患者描述语料文本计算预测目标函数的函数值；还用于基于输出的第一科室及输入的对应科室计算分诊目标函数的函数值。

参数调整子模块1036，用于根据所述预测目标函数值及目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数。

去除子模块1037，用于去除所述预测目标函数，并将所述训练样本输入到所述语义模型中进行训练，输出第二科室。

科室分诊模型获得子模块1038，用于基于输入的训练样本中的对应科室及输出的第二科室计算分诊目标函数的函数值，在所述分诊目标函数的函数值未达到收敛条件时，调整所述第二预测模型的模型参数，并执行将所述训练样本输入到所述语义模型中进行训练，输出第二科室的步骤，知道所述分诊目标函数的函数值达到收敛条件时，得到科室分诊模型。

具体地，所述第一调整子模块1012具体用于：

对所述通用领域的语料文本中各个单句的多个连续的词组按照预设的概率随机进行掩码处理；对所述通用领域的语料文本中的多个上下句进行随机排序；或对所述通用领域的语料文本中的多个主题段落进行随机排序，其中，所述主题段落包括描述同一主题内容的多个自然段落。

继续参照图7，所述线上科室分诊模型训练装置100还包括：

计算模块104，用于将患者的描述文本输入到所述科室分诊模型中，得到多个科室及与所述多个科室分别对应的F1值，其中，所述F1值用于表示所述科室分诊模型的精确率。

判断模块105，用于当所述科室对应的F1值高于预设值时将该F1值对应的科室作为该患者对应的分诊科室；否则，向患者显示包含多个病症选项的文本。

导诊模块106，用于将患者从所述文本中选择的病症选项输入到所述科室分诊模型中，并通过该病症选项去除不包含治疗该病症选项的科室以及计算剩余科室对应的F1值，重复该步骤直到剩余科室对应的F1值高于预设值或患者选择的病症选项只对应一个科室时，将剩余科室中F1值高于预设值或患者选择的病症选项对应的唯一科室作为该患者对应的分诊科室。

可以理解的是，本实施例中的各功能模块的具体操作方法可参阅上述方法实施例中相应步骤的详细描述，在此不再重复赘述。

综上所述，本申请实施例提供一种线上科室分诊模型训练方法及装置，首先通过通用领域的语料文本对预测模型进行预训练，并获得训练后的第一预测模型，随后为了提高模型的准确率，采用医学领域的语料文本进行进一步的训练，并获得第二预测模型。最后，为了完成科室分诊、导诊的任务，通过预测目标函数及分诊目标函数对该第二预测模型进行再次训练，在预测目标函数及分诊目标函数均达到收敛时，结束训练，在去除预测目标函数后获得科室分诊模型。通过上述步骤中的三次训练，分别处理大量的不同的语料文本，能够有效提升科室分诊模型的准确率。同时，由于准确率的提升，可以在与患者进行较少次数的信息交互之后为用户推荐挂号或就诊的科室，提升了挂号及就诊效率。

以上所述，仅为本申请的各种实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种线上科室分诊模型训练方法，其特征在于，应用于计算机设备，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，所述采用通用领域的语料文本对预测模型进行训练，在所述预测模型中的预测目标函数达到收敛时，得到第一预测模型，包括：

3.根据权利要求1所述的方法，其特征在于，在所述第二预测模型中增加分诊目标函数，采用患者描述语料文本及对应科室所组成的训练样本对所述第二预测模型进行预设次数的训练后，去除所述第二预测模型中的预测目标函数，对去除所述预测目标函数的第二预测模型进行再次训练，直到所述分诊目标函数收敛，得到训练好的科室分诊模型，包括：

在第二预测模型中增加分诊目标函数；

根据所述预测目标函数的函数值及分诊目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数；

4.根据权利要求2所述的方法，其特征在于，所述对编码后的通用领域的语料文本进行调整处理，包括：

对所述通用领域的语料文本中的多个上下句进行随机排序；或

对所述通用领域的语料文本中的多个主题段落进行随机排序，其中，所述主题段落包括描述同一主题内容的多个自然段落。

5.根据权利要求2所述的方法，其特征在于，在得到训练好的科室分诊模型之后，所述方法还包括：

将患者的描述文本输入到所述科室分诊模型中，得到多个科室及与所述多个科室分别对应的F1值，其中，所述F1值用于表示所述科室分诊模型的精确率，F1值越大表示所述科室分诊模型的精确率越高；

否则，向患者显示包含多个病症选项的文本；

6.一种线上科室分诊模型训练装置，其特征在于，应用于计算机设备，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述计算机设备中存储有各个通用领域的词表，所述词表保存有词组与词组向量的对应关系，所述第一训练模块包括：

8.根据权利要求6所述的装置，其特征在于，所述第三训练模块包括：

参数调整子模块，用于根据所述预测目标函数的函数值及目标函数值调整第二预测模型的模型参数，重复上述步骤，直到训练次数达到预设次数；

9.根据权利要求7所述的装置，其特征在于，所述第一调整子模块用于：

10.根据权利要求7所述的装置，其特征在于，所述装置还包括：