CN113903420A

CN113903420A - 一种语义标签确定模型的构建方法、病历解析方法

Info

Publication number: CN113903420A
Application number: CN202111152503.7A
Authority: CN
Inventors: 周开银; 吴及; 刘喜恩; 尤心心; 刘少辉
Original assignee: Beijing Huiji Zhiyi Technology Co ltd; Tsinghua University
Current assignee: Beijing Huiji Zhiyi Technology Co ltd; Tsinghua University
Priority date: 2021-09-29
Filing date: 2021-09-29
Publication date: 2022-01-07

Abstract

本申请公开了一种语义标签确定模型的构建方法、病历解析方法，先利用样本病历文本和该样本病历文本的实际语义标签信息，构建语义标签确定模型，以使构建好的语义标签确定模型具有较好的语义标签确定性能，从而使得该语义标签确定模型能够针对一个病历文本数据进行比较准确地语义标签确定处理，进而使得利用该语义标签确定模型确定的预测语义标签信息，能够比较准确地描述出该病历文本数据中至少一个字符串的字段信息，如此使得基于该预测语义标签信息确定的该病历文本数据的语义解析结果，能够比较准确地描述出该病历文本数据中所携带的语义信息，如此有利于提高语义解析效果。

Description

一种语义标签确定模型的构建方法、病历解析方法

技术领域

本申请涉及智慧医疗技术领域，尤其涉及一种语义标签确定模型的构建方法、病历解析方法。

背景技术

电子病历是指一个患者从入院到出院过程中各种医疗文字和图像的载体，以使该电子病历用于记录医务人员对患者疾病发生、发展及转归进行检查、诊断、治疗等医疗活动过程；而且该电子病历通常包括门(急)诊电子病历、住院电子病历及其它电子医疗记录等。

然而，因大量电子病历存在书写不规范的缺陷，导致针对这些电子病历的语义解析过程比较困难，从而导致这些电子病历的语义解析结果比较差。

发明内容

本申请实施例的主要目的在于提供一种语义标签确定模型的构建方法、病历解析方法，能够提高针对病历数据的语义解析效果。

本申请实施例提供了一种语义标签确定模型的构建方法，所述方法包括：

获取样本病历文本和所述样本病历文本的实际语义标签信息；

根据所述样本病历文本和待训练模型，确定所述样本病历文本的预测语义标签信息；

根据所述预测语义标签信息和所述实际语义标签信息，更新所述待训练模型，并继续执行所述根据所述样本病历文本和待训练模型，得到所述样本病历文本的预测语义标签信息的步骤，直至在达到预设停止条件时，根据所述待训练模型，确定语义标签确定模型。

本申请实施例还提供了一种病历解析方法，所述方法包括：

获取待处理病历文本；

根据所述待处理病历文本和语义标签确定模型，确定所述待处理病历文本的预测语义标签信息；其中，所述语义标签确定模型是利用本申请实施例提供的语义标签确定模型的构建方法任一实施方式进行构建的；

根据所述待处理病历文本的预测语义标签信息，确定所述待处理病历文本的语义解析结果。

本申请实施例还提供了一种语义标签确定模型的构建装置，包括：

第一获取单元，用于获取样本病历文本和所述样本病历文本的实际语义标签信息；

第一确定单元，用于根据所述样本病历文本和待训练模型，确定所述样本病历文本的预测语义标签信息；

模型更新单元，用于根据所述预测语义标签信息和所述实际语义标签信息，更新所述待训练模型，并返回所述第一确定单元继续执行所述根据所述样本病历文本和待训练模型，得到所述样本病历文本的预测语义标签信息的步骤，直至在达到预设停止条件时，根据所述待训练模型，确定语义标签确定模型。

本申请实施例还提供了一种病历解析装置，包括：

第二获取单元，用于获取待处理病历文本；

第二确定单元，用于根据所述待处理病历文本和语义标签确定模型，确定所述待处理病历文本的预测语义标签信息；其中，所述语义标签确定模型是利用本申请实施例提供的语义标签确定模型的构建方法任一实施方式进行构建的；

第三确定单元，用于根据所述待处理病历文本的预测语义标签信息，确定所述待处理病历文本的语义解析结果。

本申请实施例还提供了一种设备，所述设备包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行本申请实施例提供的语义标签确定模型的构建方法的任一实施方式，或者执行本申请实施例提供的病历解析方法的任一实施方式。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行本申请实施例提供的语义标签确定模型的构建方法的任一实施方式，或者执行本申请实施例提供的病历解析方法的任一实施方式。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行本申请实施例提供的语义标签确定模型的构建方法的任一实施方式，或者执行本申请实施例提供的病历解析方法的任一实施方式。

基于上述技术方案，本申请具有以下有益效果：

本申请提供的技术方案中，先利用样本病历文本和该样本病历文本的实际语义标签信息，构建语义标签确定模型，以使构建好的语义标签确定模型具有较好的语义标签确定性能，从而使得该语义标签确定模型能够针对一个病历文本数据(例如，待处理病历文本)进行比较准确地语义标签确定处理，进而使得利用该语义标签确定模型确定的预测语义标签信息，能够比较准确地描述出该病历文本数据中至少一个字符串的字段信息(例如，“症状表现”、“药物史”、“外伤史”、“家族健康状况”、“家族传染病史”、“家族遗传病史”等字段名)，如此使得基于该预测语义标签信息确定的该病历文本数据的语义解析结果，能够比较准确地描述出该病历文本数据中所携带的语义信息(例如，“症状表现”是……等)，如此有利于提高针对病历数据的语义解析效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种病历文本数据的示意图；

图2为本申请实施例提供的一种语义标签确定模型的构建方法的流程图；

图3为本申请实施例提供的一种待训练模型的结构示意图；

图4为本申请实施例提供的一种待训练模型的示意图；

图5为本申请实施例提供的另一种待训练模型的结构示意图；

图6为本申请实施例提供的一种病历解析方法的流程图；

图7为本申请实施例提供的一种语义标签确定模型的构建装置的结构示意图；

图8为本申请实施例提供的一种病历解析装置的结构示意图。

具体实施方式

发明人在针对电子病历的研究中发现，大量电子病历存在书写不规范的缺陷，例如，有些电子病历中可能会出现缺少字段名(例如，“症状表现”、“药物史”、“症状史”、“外伤史”、“家族健康状况”、“家族传染病史”、“家族遗传病史”等)的现象。又如，有些电子病历中可能会出现穿插介绍不同字段名下的语义描述内容(如图1所示，在“症状史”的描述内容中穿插有“药物史”的描述内容以及“阴性症状史”的描述内容等)的混乱现象。可见，因这些电子病历存在书写不规范的缺陷，导致针对这些电子病历的语义解析过程比较困难，从而导致这些电子病历的语义解析结果比较差。

基于上述发现，为了克服背景技术部分的技术问题，本申请实施例提供了一种语义标签确定模型的构建方法以及一种病历解析方法，其具体包括：先利用样本病历文本和该样本病历文本的实际语义标签信息，构建语义标签确定模型，以使构建好的语义标签确定模型具有较好的语义标签确定性能，从而使得该语义标签确定模型能够针对一个病历文本数据(例如，待处理病历文本)进行比较准确地语义标签确定处理，进而使得利用该语义标签确定模型确定的预测语义标签信息，能够比较准确地描述出该病历文本数据中至少一个字符串的字段信息(例如，“症状表现”、“药物史”、“外伤史”、“家族健康状况”、“家族传染病史”、“家族遗传病史”等字段名)，如此使得基于该预测语义标签信息确定的该病历文本数据的语义解析结果，能够比较准确地描述出该病历文本数据中所携带的语义信息(例如，“症状表现”是……等)，如此有利于提高针对病历数据的语义解析效果。

另外，本申请实施例不限定语义标签确定模型的构建方法的执行主体，例如，本申请实施例提供的语义标签确定模型的构建方法可以应用于终端设备或服务器等数据处理设备。其中，终端设备可以为智能手机、计算机、个人数字助理(Personal DigitalAssitant，PDA)或平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。

此外，本申请实施例也不限定病历解析方法的执行主体，例如，本申请实施例提供的病历解析方法可以应用于终端设备或服务器等数据处理设备。其中，终端设备可以为智能手机、计算机、个人数字助理(Personal Digital Assitant，PDA)或平板电脑等。服务器可以为独立服务器、集群服务器或云服务器。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了便于理解本申请提供的技术方案，下面依次介绍“语义标签确定模型的构建方法”的相关内容和“病历解析方法”的相关内容。

方法实施例一

参见图2，该图为本申请实施例提供的一种语义标签确定模型的构建方法的流程图。

本申请实施例提供的语义标签确定模型的构建方法，包括S201-S205：

S201：获取样本病历文本和该样本病历文本的实际语义标签信息。

上述“样本病历文本”是指从一个电子病历中提取的一段病历内容；而且本申请实施例不限定该“样本病历文本”，例如，其可以是图1所示的病历文本数据。

另外，本申请实施例不限定上述“样本病历文本”的个数，例如，其可以为G。其中，G为正整数(例如，G＝9600)。

上述“样本病历文本的实际语义标签信息”用于表示该样本病历文本中各个字符串的实际的字段信息。

需要说明的是，本申请实施例不限定“字段信息”，例如，其可以包括字段名、和/或字段名与字符串之间的对应关系。其中，“字段名”用于描述一个字符串的病历内涵信息；而且本申请实施例不限定该“字段名”，例如，其具体可以为“症状表现”、“药物史”、“外伤史”、“家族健康状况”、“家族传染病史”、“家族遗传病史”、或者“其他”等。“字段名与字符串之间的对应关系”是指病历文本数据中一个字符串与该字符串的病历内涵信息之间的对应关系；而且本申请实施例不限定该“字段名与字符串之间的对应关系”，例如，如图1所示，其可以包括：字符串“男性，38岁”与与字段名“其他”之间的对应关系、字符串“反复上腹痛10年，再发1周，黑便2天”与字段名“症状表现”之间的对应关系、……。

另外，本申请实施例不限定上述“样本病历文本的实际语义标签信息”的获取过程，例如，其具体可以包括步骤11-步骤12：

步骤11：从预设病历规范资料数据中提取出K个候选语义标签。其中，K为正整数。

上述“预设病历规范资料数据”是指描述一个电子病历的规范书写规则；而且本申请实施例不限定该“预设病历规范资料数据”，例如，其可以包括《病历书写规范2014版》。

上述“候选语义标签”是指一个规范的电子病历所可能涉及的字段名，以使该“候选语义标签”可以被用于标注表示一个字符串的病历内涵信息。

另外，本申请实施例不限定上述“K”的取值，例如，当上述“预设病历规范资料数据”为《病历书写规范2014版》，则K可以为61，而且该61个候选语义标签涉及了9个病历书写方面的字段名。其中，上述“9个病历书写方面”包括症状、治疗、检查、查体(体格检查)、患者情况、其他既往史、鉴别、手术、以及其他。

步骤12：将样本病历文本和K个候选语义标签发送给技术人员，以使该技术人员按照该K个候选语义标签，标注该样本病历文本的实际语义标签信息，以使该“样本病历文本的实际语义标签信息”包括该K个候选语义标签中至少一个候选语义标签。

基于上述步骤11至步骤12的相关内容可知，为了提高病历语义解析的规范化，可以先从预设病历规范资料数据中提取一些规范化的候选语义标签；再依据这些候选语义标签，人工标注样本病历文本的实际语义标签信息，以使该实际语义标签信息能够准确地且规范地表示该样本病历文本中各个字符串的实际的字段信息。

S202：根据样本病历文本和待训练模型，确定该样本病历文本的预测语义标签信息。

上述“待训练模型”用于针对该待训练模型的输入数据进行语义标签确定处理；而且本申请实施例不限定该待训练模型，例如，其可以是任一种机器学习模型。又如，其可以采用下文方法实施例二所示的待训练模型的任一种实施方式进行实施。

上述“样本病历文本的预测语义标签信息”用于表示针对该样本病历文本中至少一个字符串预测的字段信息。

另外，本申请实施例不限定S202的实施方式，例如，其可以采用下文步骤21-步骤24所示的任一实施方式进行实施。又如，在一种可能的实施方式中，当待训练模型不包括下文“文本切分层”(例如，图3所示的待训练模型300)时，S202具体可以包括S2021-S2022：

S2021：对样本病历文本进行预设划分处理，得到至少一个样本片段。

上述“预设划分处理”可以预先设定；而且本申请实施例不限定该“预设划分处理”，例如，其具体可以包括：按照预设划分规则进行划分处理。

上述“预设划分规则”是指在针对一个病历文本数据进行划分处理时所需依据的规则；而且本申请实施例不限定该“预设划分规则”，例如，其具体可以包括：按照预设标点符号(例如，逗号，句号，顿号等)所处位置进行划分。其中，“预设标点符号”可以预先设定，也可以借助大数据分析手段从大量病历数据(例如，上述“G个样本病历文本”等)中分析得到。

另外，为了提高文本划分效果，可以借助机器学习模型进行实施。基于此可知，S2021具体可以包括：将样本病历文本输入预先构建的文本划分模型，得到该文本划分模型输出的至少一个样本片段。

需要说明的是，上述“文本划分模型”用于针对该文本划分模型的输入数据进行划分处理；而且该“文本划分模型”可以根据待使用病历文本和该待使用病历文本的实际划分结果进行构建。其中，“待使用病历文本的实际划分结果”是指由技术人员针对该待使用病历文本的进行人工划分所得的结果，以使该“待使用病历文本的实际划分结果”用于表示该待使用病历文本中实际划分的各个文本片段。另外，本申请实施例不限定“文本划分模型”的构建过程，可以采用现有的或者未来出现的任一种模型构建方法进行实施。此外，本申请实施例不限定上述“待使用病历文本”与上述“G个样本病历文本”之间的关系，例如，为了节省数据获取资源，上述“待使用病历文本”可以来自于上述“G个样本病历文本”。

基于上述S2021的相关内容可知，在获取到样本病历文本之后，可以先对该样本病历文本进行划分处理，得到该样本病历文本的至少一个样本片段，以使这些样本片段能够准确地表示出该样本病历文本携带的字符信息，以便后续能够基于这些样本片段，实现针对该样本病历文本语义标签确定处理。

S2022：将至少一个样本片段输入待训练模型，得到该待训练模型输出的样本病历文本的预测语义标签信息，以使该预测语义标签信息包括该至少一个样本片段的片段语义标签信息。

其中，第f个样本片段的片段语义标签信息用于表示针对样本病历文本中第f个样本片段预测的字段信息。其中，f为正整数，f≤F，F为正整数，F表示样本病历文本中样本片段个数。

基于上述S2022的相关内容可知，在获取到至少一个样本片段(例如，图4所示的“头疼三天”、“伴咳嗽咳痰”、“用感康片无效”等多个片段)之后，可以将这些样本片段输入待训练模型，以使该待训练模型针对这些样本片段进行语义标签确定处理，得到这些样本片段的片段语义标签信息，并将这些样本片段的片段语义标签信息作为样本病历文本的预测语义标签信息进行输出，以使该“样本病历文本的预测语义标签信息”能够表示出该样本病历文本中各个样本片段的字段信息包括各个候选语义标签的可能性，以便后续能够借助该“样本病历文本的预测语义标签信息”，衡量该待训练模型的语义标签确定性能。

基于上述S202的相关内容可知，在获取到样本病历文本之后，可以利用待训练模型针对该样本病历文本中各个字符串(例如，上文“样本片段”或者上文“文本片段”)进行语义标签确定处理，得到该样本病历文本的预测语义标签信息，以使该预测语义标签信息能够表示出针对该样本病历文本中各个字符串预测的字段信息，以便后续能够借助该“样本病历文本的预测语义标签信息”，衡量该待训练模型的语义标签确定性能。

S203：判断是否达到预设停止条件，若是，则执行S205；若否，则执行S204。

其中，“预设停止条件”可以预先设定；而且本申请实施例不限定该“预设停止条件”，例如，其具体可以为待训练模型的模型预测损失值低于预设损失阈值，也可以为该待训练模型的模型预测损失值的变化率低于预设变化率阈值，还可以为该待训练模型的更新次数达到预设次数阈值。

上述“待训练模型的模型预测损失值”用于表示该待训练模型的语义标签确定性能；而且，本申请实施例不限定该“待训练模型的模型预测损失值”的确定过程，例如，可以采用现有的或者未来出现的任一种模型损失值计算方法(例如，基于交叉熵的损失值计算方法)进行实施。又如，可以采用方法实施例三所示的确定“待训练模型的模型预测损失值”的任一种可能的实施方式进行实施。

S204：根据样本病历文本的预测语义标签信息和该样本病历文本的实际语义标签信息，更新待训练模型，并返回执行S202。

本申请实施例中，若确定当前轮的待训练模型未达到预设停止条件，则可以确定该待训练模型的语义标签确定性能仍然比较差，故可以根据样本病历文本的预测语义标签信息与该样本病历文本的实际语义标签信息之间的差距(例如，欧氏距离等)，更新该待训练模型，以使更新后的待训练模型具有更好的语义标签确定性能，并基于更新后的待训练模型，继续执行S202及其后续步骤。

需要说明的是，本申请实施例不限定待训练模型的更新过程，例如，可以采用现有的或者未来出现的任一种模型更新方法进行实施。又如，可以采用方法实施例四所示的任一种模型更新方法进行实施。

S205：根据待训练模型，确定语义标签确定模型。

本申请实施例中，若确定当前轮的待训练模型达到预设停止条件，则可以确定该待训练模型具有较好的语义标签确定性能，故可以根据该待训练模型，确定语义标签确定模型(例如，可以直接将该待训练模型，确定为语义标签确定模型)，以使该语义标签确定模型也具有较好的语义标签确定性能，以便后续能够基于该语义标签确定模型进行语义标签确定处理(如方法实施例五所示)。

基于上述S201至S205的相关内容可知，对于本申请实施例提供的语义标签确定模型的构建方法来说，在获取到样本病历文本和该样本病历文本的实际语义标签信息之后，先根据该样本病历文本和待训练模型，确定该样本病历文本的预测语义标签信息；再根据该预测语义标签信息和该实际语义标签信息，更新该待训练模型，并继续执行上述“根据该样本病历文本和待训练模型，得到该样本病历文本的预测语义标签信息”的步骤，直至在达到预设停止条件时，根据该待训练模型，确定语义标签确定模型。

可见，因待训练模型是根据样本病历文本及其实际语义标签信息进行训练的，使得该待训练模型能够从该样本病历文本及其实际语义标签信息中学习到语义标签确定规律，从而使得训练好的待训练模型具有较好的语义标签确定性能，进而使得基于训练好的待训练模型确定的语义标签确定模型，也具有较好的语义标签确定性能，如此使得该语义标签确定模型能够针对一个病历文本数据(例如，待处理病历文本)进行比较准确地语义标签确定处理。

方法实施例二

为了进一步提高待训练模型的语义标签确定性能，本申请实施例还提供了待训练模型的一种可能的实施方式，如图3所示，该待训练模型300可以包括：文本编码层301、专家编码层302、专家权重确定层303和决策层304。其中，专家编码层302包括M个专家编码网络，而且该各个专家编码网络的输入数据包括文本编码层301的输出数据；专家权重确定层303的输入数据包括文本编码层301的输出数据；决策层304的输入数据包括各个专家编码网络的输出数据和专家权重确定层303的输出数据。

为了便于理解待训练模型300的工作原理，下面以上述“样本病历文本的预测语义标签信息”的确定过程为例进行说明。

作为示例，利用待训练模型300确定上述“样本病历文本的预测语义标签信息”的过程，具体可以包括步骤21-步骤24：

步骤21：根据样本病历文本和文本编码层301，确定待使用文本编码结果。

其中，“文本编码层301”用于针对该文本编码层301的输入数据进行编码处理；而且本申请实施例不限定该“文本编码层301”，可以采用任一种编码网络进行实施。

上述“待使用文本编码结果”用于表示上述“样本病历文本”携带的语义信息。

另外，本申请实施例不限定步骤21的实施方式，例如，可以直接将样本病历文本输入文本编码层301，以使该文本编码层301针对该样本病历文本进行编码处理，得到并输出待使用文本编码结果。

实际上，一些病历文本数据中可能会出现穿插介绍不同字段名下的语义描述内容(如图1所示，在“症状史”的描述内容中穿插有“药物史”的描述内容以及“阴性症状史”的描述内容等)的混乱现象，故为了提高语义解析效果，可以将病历文本数据划分成多个文本片段，以便后续能够分别针对这些文本片段进行语义解析处理(如图4所示)。基于此，本申请实施例提供了步骤21的两种可能的实施方式，下面分别介绍该两种可能的实施方式。

在第一种可能的实施方式中，步骤21具体可以包括步骤31-步骤32：

步骤31：对样本病历文本进行预设划分处理，得到至少一个样本片段。

需要说明的是，步骤31的相关内容请参见上文S2021的相关内容。

步骤32：将至少一个样本片段输入文本编码层301，得到该文本编码层301输出的待使用文本编码结果，以使该待使用文本编码结果包括各个样本片段的文本编码结果。

其中，第f个样本片段的文本编码结果用于表示样本病历文本中第f个样本片段所携带的语义信息。f为正整数，f≤F，F为正整数，F表示样本病历文本中样本片段个数。

另外，本申请实施例不限定步骤32的实施方式，例如，当文本编码层301包括第一编码网络和第二编码网络时，步骤32具体可以包括步骤321-步骤322：

步骤321：将第f个样本片段输入第一编码网络，得到该第一编码网络输出的第f个样本片段的初步编码结果。其中，f为正整数，f≤F。

其中，“第一编码网络”用于针对该第一编码网络的输入数据进行编码处理；而且本申请实施例不限定该“第一编码网络”，例如，其可以采用任一编码网络进行实施。又如，其可以结合双向长短记忆网络(Bi-directional Long Short-TermMemory，BiLSTM)和注意力机制(Attention)进行实施。

上述“第f个样本片段的初步编码结果”用于表示该第f个样本片段携带的语义信息。

步骤322：将F个样本片段的初步编码结果输入第二编码网络，得到第二编码网络输出的待使用文本编码结果，以使该待使用文本编码结果包括F个样本片段的文本编码结果。

其中，“第二编码网络”用于针对该第二编码网络的输入数据进行编码处理；而且本申请实施例不限定该“第二编码网络”的工作原理，例如，其具体可以包括：参考F个样本片段的初步编码结果中除了第f个样本片段的初步编码结果以外的其他至少一个样本片段的初步编码结果，对该第f个样本片段的初步编码结果进行二次编码处理，得到该第f个样本片段的文本编码结果，以使该“第f个样本片段的文本编码结果”能够更准确地表示出该第f个样本片段携带的语义信息。

另外，本申请实施例不限定该“第二编码网络”，例如，其可以采用任一编码网络进行实施。又如，其可以结合BiLSTM和注意力机制(Attention)进行实施。

基于上述步骤31至步骤32的相关内容可知，对于步骤21的第一种可能的实施方式来说，可以先对样本病历文本进行预设划分处理，得到至少一个样本片段；再利用文本编码层301针对这些样本片段进行编码处理，得到这些样本片段的文本编码结果，以使这些样本片段的文本编码结果能够表示出该样本病历文本携带的语义信息。

在第二种可能的实施方式中，如图5所示，当待训练模型300还包括文本切分层305，且文本编码层301的输入数据包括该文本切分层305的输出数据时，步骤21具体可以包括步骤41-步骤42：

步骤41：将样本病历文本输入文本切分层305，得到该文本切分层305输出的至少一个文本片段。

其中，“文本切分层305”用于针对该文本切分层305的输入数据进行划分处理；而且本申请实施例不限定该“文本切分层305”的网络结构。

上述“至少一个文本片段”用于表示样本病历文本携带的字符信息。

步骤42：将至少一个文本片段输入文本编码层301，得到该文本编码层301输出的待使用文本编码结果，以使该待使用文本编码结果包括各个文本片段的文本编码结果。

需要说明的是，步骤42的相关内容类似于上文步骤32的相关内容，只需将上文步骤32的相关内容中“样本片段”替换为“文本片段”即可。

基于上述步骤41至步骤42的相关内容可知，对于步骤21的第二种可能的实施方式来说，可以先借助文本切分层305对样本病历文本进行划分处理，得到至少一个文本片段；再利用文本编码层301针对这些文本片段进行编码处理，得到这些文本片段的文本编码结果，以使这些文本片段的文本编码结果能够表示出该样本病历文本携带的语义信息。

基于上述步骤21的相关内容可知，在获取到样本病历文本之后，可以利用待训练模型300中文本编码层301对该样本病历文本中字符信息进行编码处理，得到待使用文本编码结果，以使该待使用文本编码结果能够表示出该待使用文本编码结果携带的语义信息。

步骤22：将待使用文本编码结果输入第m个专家编码网络，得到该第m个专家编码网络输出的第m个专家编码结果。其中，m为正整数，m≤M。

其中，“第m个专家编码网络”用于按照第m种专家编码处理性能针对该第m个专家编码网络的输入数据进行专家编码处理；而且本申请实施例不限定“第m个专家编码网络”的实施方式，例如，可以采用多层感知机(Muti－Layer Perception，MLP)进行实施。

需要说明的是，不同专家编码网络在进行专家编码处理时所具有的专家编码处理性能不同，以使不同专家编码网络在进行专家编码处理时所擅长处理的语义解析方向不同。例如，如图4所示，“专网1”是指第一专家编码网络；而且该“专网1”更擅长于处理那些语义解析难度比较大(也就是，语义标签确定难度比较大)的病历文本数据；“专网2”是指第二专家编码网络；而且该“专网2”更擅长于处理那些语义解析难度比较小(也就是，语义标签确定难度比较小)且所涉及的字段名比较少见(也就是，字段名出现频率比较低)的病历文本数据；“专网3”是指第三专家编码网络；而且该“专网3”更擅长于处理那些语义解析难度比较小且所涉及的字段名比较常见(也就是，字段名出现频率比较高)的病历文本数据。

步骤23：将待使用文本编码结果输入专家权重确定层303，得到该专家权重确定层303输出的M个专家编码网络对应的预测专家权重值。

其中，“专家权重确定层303”用于对该专家权重确定层303的输入数据进行决策影响程度确定处理；而且本申请实施例不限定该“专家权重确定层303”，例如，其可以借助全连接网络进行实施。

第m个专家编码网络对应的预测专家权重值用于表示上述“第m个专家编码结果”对上述“样本病历文本的预测语义标签信息”的确定过程所造成的影响程度，以使该“第m个专家编码网络对应的预测专家权重值”能够表示出第m个专家编码网络对该“样本病历文本的预测语义标签信息”的确定过程所造成的影响程度。其中，m为正整数，m≤M。

步骤24：将M个专家编码结果和M个专家编码网络对应的预测专家权重值输入决策层304，得到该决策层304输出的样本病历文本的预测语义标签信息。

其中，“决策层304”用于针对该决策层304的输入数据进行语义标签综合决策处理。

另外，本申请实施例不限定该“决策层304”的实施方式，例如，决策层304包括专家决策网络和决策融合网络，而且该决策融合网络的输入数据包括该专家决策网络的输出数据。

为了便于理解决策层304的工作原理，下面以上述“样本病历文本的预测语义标签信息”的确定过程为例进行说明。

作为示例，当决策层304包括专家决策网络和决策融合网络时，上述“样本病历文本的预测语义标签信息”的确定过程，具体可以包括步骤51-步骤52：

步骤51：将第m个专家编码结果输入专家决策网络，得到该专家决策网络输出的第m个专家决策结果。其中，m为正整数，m≤M。

其中，“专家决策网络”用于针对该专家决策网络的输入数据进行语义标签决策处理；而且本申请实施例不限定该“专家决策网络”的实施方式，例如，可以借助任一种解码网络(例如，条件随机场(Conditional Random Field，CRF))进行实施。

上述“第m个专家决策结果”是指针对上述“第m个专家编码结果”进行解码处理得到的解码结果，以使该“第m个专家决策结果”用于表示借助第m个专家网络针对样本病历文本预测的语义标签信息。

另外，本申请实施例不限定上述“第m个专家决策结果”的表示方式，例如，若上述“样本病历文本的实际语义标签信息”是从上述“K个候选语义标签”中确定的，则该“第m个专家决策结果”可以表示为

其中，

表示借助第m个专家网络预测的该样本病历文本中第y个字符串(例如，上文“样本片段”或者上文“文本片段”)的字段信息包括第k个候选语义标签的可能性。y为正整数，y≤Y，Y为正整数，Y表示样本病历文本中字符串个数；k为正整数，k≤K，K为正整数，K表示候选语义标签的个数。

此外，本申请实施例不限定上述“第m个专家决策结果”的确定过程，例如，为了进一步提高上述“第m个专家决策结果”的确定效率，本申请实施例还提供了确定上述“第m个专家决策结果”的另一种可能的实施方式，其具体可以包括步骤61-步骤62：

步骤61：将第m个专家编码结果与第k个候选语义标签的字符特征向量进行向量点积处理，得到第m个专家编码结果的第k个标签归属概率信息。其中，k为正整数，k≤K。

其中，“向量点积处理”用于计算两个向量数据之间的点积。

上述“第k个候选语义标签的字符特征向量”用于表示该第k个候选语义标签携带的字符信息；而且本申请实施例不限定该“第k个候选语义标签的字符特征向量”的确定过程，例如，可以利用预设向量提取网络针对该第k个候选语义标签进行特征向量提取处理，得到该第k个候选语义标签的字符特征向量。其中，“预设向量提取网络”可以借助现有的或者未来出现的任一种特征向量提取网络(例如，word2vec、BiLSTM等)进行实施。

上述“第m个专家编码结果的第k个标签归属概率信息”用于表示借助第m个专家网络预测的该样本病历文本中至少一个字符串的字段信息包括第k个候选语义标签的可能性；而且本申请实施例不限定该“第m个专家编码结果的第k个标签归属概率信息”的计算过程，例如，其可以采用公式(1)进行实施。

式中，L_m,k表示上述“第m个专家编码结果的第k个标签归属概率信息”；

表示借助第m个专家网络预测的该样本病历文本中第y个字符串(例如，上文“样本片段”或者上文“文本片段”)的字段信息包括第k个候选语义标签的可能性；

表示第m个专家编码结果；

表示第m个专家网络针对样本病历文本中第y个字符串(例如，上文“样本片段”或者上文“文本片段”)确定的专家编码结果，且

是一个1×U的向量数据；F_K表示上述“第k个候选语义标签的字符特征向量”，而且F_K为U×1的向量数据；U为正整数。

步骤62：对第m个专家编码结果的第1个标签归属概率信息至该第m个专家编码结果的第K个标签归属概率信息进行集合处理，得到第m个专家决策结果。

本申请实施例中，在获取到第m个专家编码结果的第1个标签归属概率信息至该第m个专家编码结果的第K个标签归属概率信息之后，可以将这K个标签归属概率信息进行集合处理，得到第m个专家决策结果，以使该第m个专家决策结果能够表示出借助第m个专家网络预测的该样本病历文本中各个字符串(例如，各个样本片段或者各个文本片段)的字段信息包括各个候选语义标签的可能性。

基于上述步骤51的相关内容可知，对于待训练模型300来说，在由该待训练模型300中第m个专家编码网络针对样本病历文本确定出第m个专家编码结果之后，可以由该待训练模型300中专家决策网络针对该第m个专家编码结果进行解码处理，得到第m个专家决策结果，以使该第m个专家决策结果能够表示出借助该第m个专家网络针对样本病历文本预测的语义标签信息。

步骤52：将M个专家决策结果和M个专家编码网络对应的预测专家权重值输入决策融合网络，得到该决策融合网络输出的样本病历文本的预测语义标签信息。

其中，“决策融合网络”用于针对该决策融合网络的输入数据进行融合处理；而且本申请实施例不限定该“决策融合网络”的实施方式，例如，其可以借助公式(2)-(3)进行实施。

P＝{p₁,p₂,…,p_K} (3)

式中，P表示样本病历文本的预测语义标签信息；p_k表示样本病历文本中至少一个字符串的字段信息包括第k个候选语义标签的可能性；t_m表示第m个专家编码网络对应的预测专家权重值；L_m,k表示上述“第m个专家编码结果的第k个标签归属概率信息”；m为正整数，m≤M，M为正整数。

基于上述步骤51至步骤52的相关内容可知，对于决策层304来说，可以借助专家决策网络和决策融合网络，针对该决策层304的输入数据进行综合决策处理，如此有利于提高决策效果。

基于上述步骤21至步骤24的相关内容可知，对于图3所示的待训练模型300来说，该待训练模型300可以先借助各个专家编码网络分别进行各个专家方面的单独决策；再参考所有单独决策结果进行综合决策，以使综合决策结果能够更好的表示出该待训练模型300的输入数据中各个字符串(例如，各个样本片段或者各个文本片段)的字段信息包括各个候选语义标签的可能性，以便后续能够借助该综合决策结果，确定该待训练模型300的语义标签确定性能。

方法实施例三

另外，为了进一步提高待训练模型的训练效果，本申请实施例还提供了确定“待训练模型的模型预测损失值”的三种可能的实施方式，下面分别结合三种情况进行介绍。

情况1，为了提高上述“待训练模型的模型预测损失值”的准确性，可以基于各个借助专家编码网络确定的决策结果的准确程度，确定该“待训练模型的模型预测损失值”。基于此，本申请实施例提供了确定“待训练模型的模型预测损失值”的第一种可能的实施方式，其具体可以包括步骤71-步骤73：

步骤71：根据第m个专家决策结果和样本病历文本的实际语义标签信息，确定第m个专家决策损失值。其中，m为正整数，m≤M。

其中，“第m个专家决策损失值”用于表示借助第m个专家编码网络针对样本病历文本预测的语义标签信息与该样本病历文本的实际语义标签信息之间的差距；而且本申请实施例不限定该“第m个专家决策损失值”的确定过程，例如，可以采用现有的或者未来出现的任一种能够确定出两个信息之间的距离的方法(例如，基于相似度的计算方法等)进行实施。

另外，为了保证待训练模型中不同专家编码网络具有不同的编码性能，可以采用不同损失函数，针对借助不同专家编码网络确定的决策结果进行预测性能衡量处理。基于此，本申请实施例还提供了确定“第m个专家决策损失值”的另一种可能的实施方式，其具体可以包括：根据第m个专家决策结果、样本病历文本的实际语义标签信息、以及第m个专家编码网络对应的网络损失函数，确定第m个专家决策损失值。

上述“第m个专家编码网络对应的网络损失函数”用于引导第m个专家编码网络按照第m种专家编码处理性能针对该第m个专家编码网络的输入数据进行专家编码处理；而且该“第m个专家编码网络对应的网络损失函数”可以预先设定。

另外，为了实现不同专家编码网络在进行专家编码处理时所具有的专家编码处理性能不同，可以借助不同惩罚因子进行引导。基于此可知，对于上述“第m个专家编码网络对应的网络损失函数”来说，上述“第m个专家编码网络对应的网络损失函数”中惩罚因子不同于M个专家编码网络中除了该第m个专家编码网络以外的其他任意一个专家编码网络对应的网络损失函数中惩罚因子。为了便于理解，下面以图4所示的三个专家编码网络为例进行说明。

作为示例，对于图4所示的三个专家编码网络来说，为了保证“专网1”更擅长于处理那些语义解析难度比较大的病历文本数据，如公式(4)-(6)所示，该“专网1”对应的网络损失函数中可以包括语义解析难度惩罚因子；为了保证“专网2”更擅长于处理那些语义解析难度比较小且所涉及的字段名比较少见的病历文本数据，如公式(7)所示，该“专网2”对应的网络损失函数中可以包括标签频次惩罚因子；为了保证“专网3”更擅长于处理那些语义解析难度比较小且所涉及的字段名比较常见的病历文本数据，如公式(9)所示，该“专网3”对应的网络损失函数中可以不包括任何惩罚因子。

式中，loss_hard表示“专网1”针对样本病历文本的专家决策损失值；z₁表示“专网1”的序号，也就是，“专网1”是第z₁个专家编码网络；Y表示样本病历文本中字符串个数(例如，样本片段个数或者文本片段个数)；T_g表示样本病历文本中第y个字符串的字段信息中实际包括的语义标签的序号(也就是，样本病历文本中第y个字符串的字段信息中实际包括第T_g个候选语义标签)；

表示借助“专网1”预测的样本病历文本中第y个字符串的字段信息包括第T_g个候选语义标签的可能性；

表示借助“专网1”预测的样本病历文本中第y个字符串的字段信息包括第k个候选语义标签的可能性；k为正整数，k≤K，K为正整数，K表示候选语义标签的个数。

需要说明的是，上述

与

就是语义解析难度惩罚因子；而且若一个字符串的语义解析难度越高，则该

会越小，以使b_y,k也越小，从而使得

越大，进而使得

越小，如此使得

在

中所占比例越小，从而导致loss_hard越大。

式中，loss_cls表示“专网2”针对样本病历文本的专家决策损失值；z₂表示“专网2”的序号，也就是，“专网2”是第z₂个专家编码网络；Y表示样本病历文本中字符串个数(例如，样本片段个数或者文本片段个数)；T_g表示样本病历文本中第y个字符串的字段信息中实际包括的语义标签的序号；

表示借助“专网2”预测的样本病历文本中第y个字符串的字段信息包括第T_g个候选语义标签的可能性；

表示借助“专网2”预测的样本病历文本中第y个字符串的字段信息包括第k个候选语义标签的可能性；S_k表示第k个候选语义标签的频次表征数据；k为正整数，k≤K，K为正整数，K表示候选语义标签的个数。

需要说明的是，上述

和

就是标签频次惩罚因子；而且若第T_g个候选语义标签越少见，则该第T_g个候选语义标签的频次表征数据

越小，以使

越大，从而使得

越小，如此导致loss_cls越大。

还需要说明的是，上述“第k个候选语义标签的频次表征数据”的确定过程类似于下文所示的“第q个语义标签的频次表征数据”的确定过程。

式中，loss_ce表示“专网3”针对样本病历文本的专家决策损失值；z₃表示“专网3”的序号，也就是，“专网3”是第z₃个专家编码网络；Y表示样本病历文本中字符串个数(例如，样本片段个数或者文本片段个数)；T_g表示样本病历文本中第y个字符串的字段信息中实际包括的语义标签的序号；

表示借助“专网3”预测的样本病历文本中第y个字符串的字段信息包括第T_g个候选语义标签的可能性；

表示借助“专网3”预测的样本病历文本中第y个字符串的字段信息包括第k个候选语义标签的可能性；k为正整数，k≤K，K为正整数，K表示候选语义标签的个数。

基于上述步骤71的相关内容可知，在获取到第m个专家决策结果之后，可以根据该第m个专家决策结果与样本病历文本的实际语义标签信息之间的差异性，确定第m个专家决策损失值，以使该第m个专家决策损失值能够表示出借助第m个专家编码网络针对样本病历文本预测的语义标签信息与该样本病历文本的实际语义标签信息之间的差距，从而使得该第m个专家决策损失值能够表示出该第m个专家编码网络的专家编码处理性能。其中，m为正整数，m≤M。

步骤72：根据M个专家决策损失值和M个专家编码网络对应的预测专家权重值，确定样本病历文本的语义预测损失值。

其中，“样本病历文本的语义预测损失值”用于表示由该样本病历文本的模型决策信息所体现的语义标签确定性能。

另外，本申请实施例不限定步骤72的实施方式，例如，步骤72具体可以包括：按照M个专家编码网络对应的预测专家权重值，对M个专家决策损失值进行加权求和，得到样本病历文本的语义预测损失值。为了便于理解，下面结合图4进行说明。

作为示例，对于图4所示的三个专家编码网络来说，其可以采用公式(10)确定样本病历文本的语义预测损失值。

L_all＝w_hard×loss_hard+w_cls×loss_cls+w_ce×loss_ce (10)

式中，L_all表示样本病历文本的语义预测损失值；loss_hard表示“专网1”针对样本病历文本的专家决策损失值；w_hard表示“专网1”对应的预测专家权重值；loss_cls表示“专网2”针对样本病历文本的专家决策损失值；w_cls表示“专网2”对应的预测专家权重值；loss_ce表示“专网3”针对样本病历文本的专家决策损失值；w_ce表示“专网3”对应的预测专家权重值。

步骤73：根据样本病历文本的语义预测损失值，确定待训练模型的模型预测损失值。

需要说明的是，本申请实施例不限定步骤73的实施方式，例如，当样本病历文本的个数为G时，步骤73具体可以包括：直接将G个样本病历文本的语义预测损失值进行加和，得到模型预测损失值。

基于上述步骤71至步骤73的相关内容可知，在一些情况下，可以借助所有专家决策结果与样本病历文本的实际语义标签信息之间的差距，确定出待训练模型的模型预测损失值，以使该模型预测损失值能够较好地表示出该待训练模型的语义标签确定性能。

情况2，为了提高上述“待训练模型的模型预测损失值”的准确性，可以参考预测专家权重值的合适程度，确定该“待训练模型的模型预测损失值”。基于此，本申请实施例提供了确定“待训练模型的模型预测损失值”的第二种可能的实施方式，其具体可以包括步骤81-步骤83：

步骤81：获取M个专家编码网络对应的先验专家权重值。

其中，第m个专家编码网络对应的先验专家权重值是指该第m个专家编码网络对应的实际专家权重值。m为正整数，m≤M，M为正整数。

另外，本申请实施例不限定上述“第m个专家编码网络对应的先验专家权重值”的确定过程，例如，可以预先由技术人员设定。

实际上，因不同专家编码网络在进行专家编码处理时所具有的专家编码处理性能不同，使得不同专家编码网络针对不同样本病历文本的决策影响程度不同。基于此，本申请实施例还提供了确定“第m个专家编码网络对应的先验专家权重值”的另一种可能的实施方式，其具体可以包括步骤91-步骤92：

步骤91：确定样本病历文本的样本类型信息。

其中，上述“样本病历文本的样本类型信息”用于描述该样本病历文本的语义标签所呈现的特点(例如，语义标签的确定难度、语义标签所涉及的字段名的常见程度等)。

本申请实施例不限定上述“样本病历文本的样本类型信息”，例如，其包括该样本病历文本的标签确定难度表征数据、和/或该样本病历文本的标签频次表征数据。

上述“样本病历文本的标签确定难度表征数据”用于表征该样本病历文本中至少一个字符串的字段信息的确定难度；而且本申请实施例不限定该“样本病历文本的标签确定难度表征数据”的实施方式，例如，其具体可以包括步骤101-步骤104：

步骤101：对样本病历文本进行预设划分处理，得到至少一个样本片段。

需要说明的是，步骤101的相关内容请参见上文步骤31的相关内容。

步骤102：将各个样本片段输入预先构建的语义解析模型，得到该语义解析模型输出的各个样本片段的语义标签解析信息。

其中，“语义解析模型”用于针对该语义解析模型的输入数据进行语义标签确定处理；而且本申请实施例不限定该“语义解析模型”，例如，其可以采用BiLSTM+CRF模型进行实施。另外，本申请实施例不限定该“语义解析模型”的构建过程，可以采用现有的或者未来出现的任一种模型构建方法进行实施。

“样本片段的语义标签解析信息”用于表示针对该样本片段预测的字段信息。

步骤103：根据各个样本片段的语义标签解析信息和样本病历文本的实际语义标签信息，确定样本病历文本的模型解析损失值。

其中，上述“样本病历文本的模型解析损失值”用于表示语义解析模型针对该样本病历文本的语义标签确定性能。

另外，本申请实施例不限定该“样本病历文本的模型解析损失值”的确定过程，例如，当样本片段的个数为F时，该“样本病历文本的模型解析损失值”的确定过程，具体可以包括：先根据第f个样本片段的语义标签解析信息和该第f个样本片段的实际语义标签信息，确定该第f个样本片段的模型解析损失值；再将F个样本片段的模型解析损失值之间的平均值，确定为该样本病历文本的模型解析损失值。

需要说明的是，本申请实施例不限定上述“第f个样本片段的模型解析损失值”的实施方式，可以采用现有的或者未来出现的任一种能够确定两个信息之间距离的方法进行实施。

步骤104：根据样本病历文本的模型解析损失值，确定该样本病历文本的标签确定难度表征数据。

需要说明的是，本申请实施例不限定步骤104的实施方式，例如，其具体可以为：将样本病历文本的模型解析损失值，确定为该样本病历文本的标签确定难度表征数据。

基于上述步骤101至步骤104的相关内容可知，在一些情况下，可以借助预先构建的具有语义标签确定功能的语义解析模型预判一个样本病历文本的标签确定难度表征数据，以使该标签确定难度表征数据能够表示出该样本病历文本的语义标签确定难度。

上述“样本病历文本的标签频次表征数据”用于表征该样本病历文本中至少一个字符串的实际语义标签的常见程度(也就是，该样本病历文本中至少一个字符串的实际语义标签的出现频次)；而且本申请实施例不限定该“样本病历文本的标签频次表征数据”的实施方式，例如，其具体可以包括：依据至少一个参考病历文本的实际语义标签信息，对样本病历文本的实际语义标签信息进行出现频次统计处理，得到该样本病历文本的标签频次表征数据。为了便于理解，下面结合示例进行说明。

作为示例，当样本病历文本的实际语义标签信息包括第1个语义标签至第Q个语义标签时，则上述“样本病历文本的标签频次表征数据”的确定过程可以包括：先统计第q个语义标签在至少一个参考病历文本的实际语义标签信息中的出现频次，得到该第q个语义标签的频次表征数据；再将第1个语义标签的频次表征数据至第Q个语义标签的频次表征数据之间的平均值，确定为该样本病历文本的标签频次表征数据。

需要说明的是，上述“至少一个参考病历文本”可以预先设定；而且本申请实施例不限定该“至少一个参考病历文本”的获取方式，例如，为了提高病例文本的使用效率，可以直接将G个样本病历文本，确定为该“至少一个参考病历文本”，以便后续能够依据该G个样本病历文本，确定各个样本病历文本的标签频次表征数据。

基于上述步骤91的相关内容可知，在获取到样本病历文本之后，可以确定该样本病历文本的样本类型信息，以使该样本类型信息能够表示出该样本病历文本的语义标签所呈现的特点(例如，语义标签的确定难度、语义标签所涉及的字段名的常见程度等)，以便后续能够基于该样本类型信息，确定各个专家编码网络对应的先验专家权重值。

步骤92：根据样本病历文本的样本类型信息和预设映射关系，确定M个专家编码网络对应的先验专家权重值。其中，预设映射关系包括样本类型信息与M个专家编码网络对应的先验专家权重值之间的对应关系。

上述“预设映射关系”用于记录各个样本类型信息对应的M个专家编码网络对应的先验专家权重值；而且该“预设映射关系”可以预先设定。

另外，本申请实施例不限定上述“预设映射关系”，例如，对于图4所示的3个专家编码网络来说，该“预设映射关系”可以包括第一候选类型信息与第一先验权重集合之间的对应关系、第二候选类型信息与第二先验权重集合之间的对应关系、第三候选类型信息与第三先验权重集合之间的对应关系、以及第四候选类型信息与第四先验权重集合之间的对应关系。

上述“第一候选类型信息”包括第一标签确定难度表征数据和第一标签频次表征数据，该第一标签确定难度表征数据达到难度阈值、而且该第一标签频次表征数据高于频次阈值，以使该“第一候选类型信息”用于代表“难分类-高频次”的病历文本数据。其中，“频次阈值”以及“频次阈值”均可以预先设定。

上述“第一先验权重集合”中“专网1”对应的先验专家权重值高于其他两个专家编码网络对应的先验专家权重值；而且本申请实施例不限定该“第一先验权重集合”，例如，其可以为[0.8,0.1,0.1]；而且“0.8”是指“专网1”对应的先验专家权重值；“0.1”是指“专网2”对应的先验专家权重值；“0.1”是指“专网3”对应的先验专家权重值。可见，对于“难分类-高频次”的病历文本数据来说，主要是借助“专网1”进行决策的。

上述“第二候选类型信息”包括第二标签确定难度表征数据和第二标签频次表征数据，该第二标签确定难度表征数据达到难度阈值、而且该第二标签频次表征数据不高于频次阈值，以使该“第二候选类型信息”用于代表“难分类-低频次”的病历文本数据。

上述“第二先验权重集合”中“专网1”对应的先验专家权重值以及“专网2”对应的先验专家权重值均“专网3”对应的先验专家权重值；而且本申请实施例不限定该“第二先验权重集合”，例如，其可以为[0.45,0.45,0.1]。其中，“0.45”是指“专网1”对应的先验专家权重值；“0.45”是指“专网2”对应的先验专家权重值；“0.1”是指“专网3”对应的先验专家权重值。可见，对于“难分类-低频次”的病历文本数据来说，主要是借助“专网1”以及“专网2”共同进行决策的。

上述“第三候选类型信息”包括第三标签确定难度表征数据和第三标签频次表征数据，该第三标签确定难度表征数据低于难度阈值、而且该第三标签频次表征数据高于频次阈值，以使该“第三候选类型信息”用于代表“易分类-高频次”的病历文本数据。

上述“第三先验权重集合”中“专网3”对应的先验专家权重值高于其他两个专家编码网络对应的先验专家权重值；而且本申请实施例不限定该“第三先验权重集合”，例如，其可以为[0.2,0.2,0.6]。其中，“0.2”是指“专网1”对应的先验专家权重值；“0.2”是指“专网2”对应的先验专家权重值；“0.6”是指“专网3”对应的先验专家权重值。可见，对于“易分类-高频次”的病历文本数据来说，主要是借助“专网3”进行决策的。

上述“第四候选类型信息”包括第四标签确定难度表征数据和第四标签频次表征数据，该第四标签确定难度表征数据低于难度阈值、而且该第四标签频次表征数据不高于频次阈值，以使该“第四候选类型信息”用于代表“易分类-低频次”的病历文本数据。

上述“第四先验权重集合”中“专网2”对应的先验专家权重值高于其他两个专家编码网络对应的先验专家权重值；而且本申请实施例不限定该“第四先验权重集合”，例如，其可以为[0.1,0.8,0.1]。其中，“0.1”是指“专网1”对应的先验专家权重值；“0.8”是指“专网2”对应的先验专家权重值；“0.1”是指“专网3”对应的先验专家权重值。可见，对于“难分类-低频次”的病历文本数据来说，主要是借助“专网2”进行决策的。

基于上述步骤92的相关内容可知，在获取到样本病历文本的样本类型信息之后，可以从预先构建的预设映射关系中查找该样本类型信息对应的先验权重集合，得到M个专家编码网络对应的先验专家权重值，以使这些先验专家权重值能够更好地指导待训练模型的训练更新过程。

基于上述步骤81的相关内容可知，在获取到样本病历文本之后，可以依据该样本病历文本，确定在待训练模型针对该样本病历文本进行语义标签确定处理时需要学习的专家权重先验知识，以便后续能够基于该专家权重先验知识，针对该待训练模型进行更好地训练更新。

步骤82：根据样本病历文本的预测语义标签信息和该样本病历文本的实际语义标签信息，确定该样本病历文本的语义预测损失值。

其中，“样本病历文本的语义预测损失值”用于表示由该样本病历文本的模型决策信息所体现的待训练模型的语义标签确定性能。

另外，本申请实施例不限定步骤82的实施方式，例如，可以采用现有的或者未来出现的任一种能够参考预测信息和实际信息确定预测损失的方法进行实施。

步骤83：根据M个专家编码网络对应的先验专家权重值和该M个专家编码网络对应的预测专家权重值，确定该样本病历文本的权重预测损失值。

其中，“权重预测损失值”用于表示由待训练模型的权重预测信息所体现的语义标签确定性能。

另外，本申请实施例不限定步骤83的实施方式，例如，可以将M个专家编码网络对应的先验专家权重值和该M个专家编码网络对应的预测专家权重值之间的差距，确定为该样本病历文本的权重预测损失值。需要说明的是，本申请实施例不限定“差距”的确定过程，例如，可以采用欧氏距离等进行实施。

步骤84：根据样本病历文本的语义预测损失值和该样本病历文本的权重预测损失值，确定待训练模型的模型预测损失值。

需要说明的是，本申请实施例不限定步骤84的实施方式，例如，当样本病历文本的个数为G时，步骤84具体可以包括：先将第g个样本病历文本的语义预测损失值和该第g个样本病历文本的权重预测损失值之间的和值，确定为该第g个样本病历文本的样本预测损失值；再对G个样本病历文本的样本预测损失值进行统计分析处理，得到待训练模型的模型预测损失值。其中，“统计分析处理”可以预先处理，例如，其可以为取平均值、取和值等。

基于上述步骤81至步骤84的相关内容可知，在一些情况下，可以借助所有专家编码网络对应的先验专家权重值与权重预测损失值之间的差距，确定出待训练模型的模型预测损失值，以使该模型预测损失值能够较好地表示出该待训练模型的语义标签确定性能。

情况3，为了提高上述“待训练模型的模型预测损失值”的准确性，可以同时参考各个借助专家编码网络确定的决策结果的准确程度、以及预测专家权重值的合适程度，确定该“待训练模型的模型预测损失值”。基于此，本申请实施例提供了确定“待训练模型的模型预测损失值”的第三种可能的实施方式，其具体可以包括步骤111-步骤113：

步骤111：根据第m个专家决策结果和样本病历文本的实际语义标签信息，确定第m个专家决策损失值。其中，m为正整数，m≤M。

步骤112：根据M个专家决策损失值和M个专家编码网络对应的预测专家权重值，确定样本病历文本的语义预测损失值。

步骤113：确定样本病历文本的样本类型信息。

步骤114：根据M个专家编码网络对应的先验专家权重值和该M个专家编码网络对应的预测专家权重值，确定该样本病历文本的权重预测损失值。

步骤115：根据样本病历文本的语义预测损失值和该样本病历文本的权重预测损失值，确定待训练模型的模型预测损失值。

需要说明的是，步骤111-步骤115的相关内容请分别参见上文步骤71、步骤72、步骤81、步骤83、步骤84。

基于上述步骤111至步骤115的相关内容可知，在一些情况下，可以借助所有专家决策结果与样本病历文本的实际语义标签信息之间的差距、以及所有专家编码网络对应的先验专家权重值与权重预测损失值之间的差距，确定出待训练模型的模型预测损失值，以使该模型预测损失值能够较好地表示出该待训练模型的语义标签确定性能。

方法实施例四

为了进一步提高待训练模型的训练效果，本申请实施例还提供了更新待训练模型(也就是，S203)的三种可能的实施方式，下面分别结合三种情况进行介绍。

情况1，为了提高待训练模型的学习效果，可以参考各个借助专家编码网络确定的决策结果与实际语义标签信息之间的差异性，更新该待训练模型。基于此，本申请实施例提供了更新待训练模型的第一种可能的实施方式，其具体可以包括：根据M个专家决策结果、M个专家编码网络对应的预测专家权重值、和样本病历文本的实际语义标签信息，更新待训练模型。

可见，在一些情况下，可以先根据M个专家决策结果、M个专家编码网络对应的预测专家权重值、和样本病历文本的实际语义标签信息，确定该样本病历文本的语义预测损失值(如，上述步骤71-步骤72所示的相关内容)；再依据该样本病历文本的语义预测损失值，更新待训练模型。

需要说明的是，上述“根据样本病历文本的语义预测损失值，更新待训练模型”具体可以包括：先根据该样本病历文本的语义预测损失值，确定待训练模型的模型预测损失值(如，上述步骤73所示的相关内容)；再利用该待训练模型的模型预测损失值，对该待训练模型进行反向传播更新处理，得到更新后的待训练模型。

情况2，为了提高待训练模型的学习效果，可以进一步参考预测专家权重值与先验专家权重值之间的差异性，更新该待训练模型。基于此，本申请实施例提供了更新待训练模型的第二种可能的实施方式，其具体可以包括：根据样本病历文本的预测语义标签信息、该样本病历文本的实际语义标签信息、M个专家编码网络对应的先验专家权重值、和该M个专家编码网络对应的预测专家权重值，更新待训练模型。

可见，在一些情况下，可以先根据样本病历文本的预测语义标签信息、该样本病历文本的实际语义标签信息、M个专家编码网络对应的先验专家权重值、和该M个专家编码网络对应的预测专家权重值，确定待训练模型的模型预测损失值(如，上述步骤82-84所示的相关内容)；再利用该待训练模型的模型预测损失值，对该待训练模型进行反向传播更新处理，得到更新后的待训练模型，以使更新后的待训练模型具有更好的语义标签确定性能。

情况3，为了提高待训练模型的学习效果，可以同时参考各个借助专家编码网络确定的决策结果与实际语义标签信息之间的差异性、以及预测专家权重值与先验专家权重值之间的差异性，更新该待训练模型。基于此，本申请实施例提供了更新待训练模型的第三种可能的实施方式，其具体可以包括：根据样本病历文本的M个专家决策结果、该样本病历文本的实际语义标签信息、M个专家编码网络对应的先验专家权重值、和该M个专家编码网络对应的预测专家权重值，更新待训练模型。

可见，在一些情况下，可以先根据样本病历文本的M个专家决策结果、该样本病历文本的实际语义标签信息、M个专家编码网络对应的先验专家权重值、和该M个专家编码网络对应的预测专家权重值，确定待训练模型的模型预测损失值(如，上述步骤111、步骤112、步骤114、以及步骤115所示的相关内容)；再利用该待训练模型的模型预测损失值，对该待训练模型进行反向传播更新处理，得到更新后的待训练模型，以使更新后的待训练模型具有更好的语义标签确定性能。

另外，基于上述方法实施例构建的语义标签确定模型的相关内容，本申请实施例还提供了一种病历解析方法，下面结合附图进行说明。

方法实施例五

参见图6，该图为本申请实施例提供的一种病历解析方法的流程图。

本申请实施例提供的病历解析方法，包括S601-S603：

S601：获取待处理病历文本。

其中，“待处理病历文本”是指需要进行病历解析处理的病历文本数据；而且本申请实施例不限定该“待处理病历文本”，例如，其可以包括从一个电子病历中提取的一段病历内容。

S602：根据待处理病历文本和语义标签确定模型，确定该待处理病历文本的预测语义标签信息。

其中，“语义标签确定模型”是利用本申请实施例提供的语义标签确定模型的构建方法的任一实施方式进行构建的；而且该“语义标签确定模型”的相关内容请参见上文“语义标签确定模型”的相关内容。

上述“待处理病历文本的预测语义标签信息”用于表示该针对待处理病历文本中至少一个字符串预测的字段信息；而且该“待处理病历文本的预测语义标签信息”的确定过程类似于上文“样本病历文本的预测语义标签信息”的确定过程，只需将上文“样本病历文本的预测语义标签信息”的确定过程的任一实施方式中“样本病历文本”替换为“待处理病历文本”、以及“待训练模型”替换为“语义标签确定模型”即可。

S603：根据待处理病历文本的预测语义标签信息，确定该待处理病历文本的语义解析结果。

本申请实施例中，在获取到待处理病历文本的预测语义标签信息之后，可以根据该预测语义标签信息携带的各个字段信息、以及待处理病历文本中各个字段信息对应的字符串，确定该待处理病历文本的语义解析结果，以使该语义解析结果能够表示出该待处理病历文本所携带的语义信息(例如，症状表现是……、药物史是……等语义信息)。

实际上，因上述“待处理病历文本的预测语义标签信息”的确定过程涉及文本划分处理，使得该待处理病历文本中可能会出现至少两个位置相邻的字符串具有相同的字段信息的现象，故为了提高语义解析效果，本申请实施例还提供了S603的另一种可能的实施方式，在该实施方式中，当上述“待处理病历文本的预测语义标签信息”包括该待处理病历文本中至少一个待处理片段的片段语义标签信息时，S603具体可以包括步骤121-步骤122：

步骤121：按照预设整合规则，对至少一个待处理片段的片段语义标签信息进行整合处理，得到至少一个待使用片段的片段语义标签信息。

其中，“待处理片段”是指在上述“待处理病历文本的预测语义标签信息”的确定过程中针对待处理病历文本进行划分处理得到的片段；而且本申请实施例不限定待处理片段的个数，例如，其具体可以为R。

第r个待处理片段的片段语义标签信息用于表示针对该第r个待处理片段预测的字段信息。

上述“预设整合规则”是指预先设定的语义标签信息合并规则；而且本申请实施例不限定该“预设整合规则”，例如，其具体可以包括：对于任意两个位置相邻的待处理片段来说，若这两个待处理片段的片段语义标签信息相同，则可以先将这两个待处理片段进行合并处理，得到该两个待处理片段对应的合并片段；再将这两个待处理片段所共有的片段语义标签信息，确定为该两个待处理片段对应的合并片段的片段语义标签信息。

步骤122：根据至少一个待使用片段的片段语义标签信息，确定待处理病历文本的语义解析结果。

本申请实施例中，在获取到至少一个待使用片段的片段语义标签信息之后，可以根据各个待使用片段、以及各个待使用片段的语义标签信息，确定该待处理病历文本的语义解析结果，以使该语义解析结果能够以更精简的方式表示出该待处理病历文本所携带的语义信息，如此有利于提高针对病历数据的语义解析效果。

基于上述步骤121至步骤122的相关内容可知，在获取到待处理病历文本的预测语义标签信息之后，可以针对该预测语义标签信息进行整合处理，得到整合后的预测语义标签信息，以使该整合后的预测语义标签信息能够以尽可能少的语义标签准确地表示出该待处理病历文本中各个字符串的字段信息，从而使得基于该整合后的预测语义标签信息，确定的待处理病历文本的语义解析结果能够以更精简的方式表示出该待处理病历文本所携带的语义信息，如此有利于提高针对病历数据的语义解析效果。

在一些情况下，一个待处理病历文本中位置连续的多个字符串具有相同字符信息的可能性比较大，故为了提高语义解析效果，本申请实施例还提供了S603的另一种可能的实施方式，其具体可以包括步骤131-步骤132：

步骤131：按照预设纠错校正规则，对待纠正语义标签信息进行纠错处理，得到纠错后语义标签。

其中，“待纠正语义标签信息”是指需要进行纠错处理的语义标签信息；而且本申请实施例不限定该“待纠正语义标签信息”，例如，其可以是上文“待处理病历文本的预测语义标签信息”，也可以是上文“至少一个待使用片段的片段语义标签信息”。

“预设纠错校正规则”可以预先设定；而且本申请实施例不限定该“预设纠错校正规则”，例如，当上述“待纠正语义标签信息”包括待处理病历文本中至少一个字符串的片段语义标签信息时，该“预设纠错校正规则”具体可以包括：对于任意多个位置连续的字符串来说，若这些字符串中存在非边缘字符串的片段语义标签信息不同于这些字符串中除了该非边缘字符串以外其他字符串的片段语义标签信息，且这些字符串中除了该非边缘字符串以外其他所有字符串的片段语义标签信息均相同，则可以确定该非边缘字符串的片段语义标签信息不正确，故可以将该非边缘字符串的片段语义标签信息修改为“这些字符串中除了该非边缘字符串以外其他所有字符串的片段语义标签信息”。其中，“非边缘字符串”是指在这些字符串中除了位置最靠前的字符串以及位置最靠后的字符串以外的其他任意一个字符串。

步骤132：根据纠错后语义标签，确定待处理病历文本的语义解析结果。

为了便于理解步骤132，下面结合三个示例进行说明。

示例1，当上述“待纠正语义标签信息”为上文“待处理病历文本的预测语义标签信息”时，步骤132具体可以包括：直接将纠错后语义标签，确定为待处理病历文本的语义解析结果。

示例2，当上述“待纠正语义标签信息”为上文“待处理病历文本的预测语义标签信息”，且纠错后语义标签包括该待处理病历文本中至少一个待处理片段的语义标签纠正信息时，步骤132具体可以包括：先按照预设整合规则，对至少一个待处理片段的语义标签纠正信息进行整合处理，得到至少一个待使用片段的片段语义标签信息；再根据至少一个待使用片段的片段语义标签信息，确定待处理病历文本的语义解析结果。

示例3，当上述“待纠正语义标签信息”为上文“至少一个待使用片段的片段语义标签信息”时，步骤132具体可以包括：直接将纠错后语义标签，确定为待处理病历文本的语义解析结果。

基于上述步骤131至步骤132的相关内容可知，在获取到待处理病历文本的预测语义标签信息之后，可以针对该预测语义标签信息进行整合处理以及纠错处理，得到处理后的预测语义标签信息，以使该处理后的预测语义标签信息能够以尽可能少的语义标签准确地表示出该待处理病历文本中各个字符串的字段信息，从而使得基于该处理后的预测语义标签信息，确定的待处理病历文本的语义解析结果能够更准确地表示出该待处理病历文本所携带的语义信息，如此有利于提高针对病历数据的语义解析效果。

基于上述S601至S603的相关内容可知，在获取到待处理病历文本之后，可以先利用预先构建好的语义标签确定模型对该待处理病历文本进行语义标签确定处理，得到该待处理病历文本的预测语义标签信息；再参考该预测语义标签信息，确定待处理病历文本的语义解析结果，以使该语义解析结果能够准确地表示出该待处理病历文本所携带的语义信息，如此有利于提高针对病历数据的语义解析效果。

另外，在一些应用场景(例如，判断电子病历是否规范书写等场景)中，需要判断上述待处理病历文本是否存在字段缺失现象。基于此，本申请实施例还提供了病历解析方法的另一种可能的实施方式，在该实施方式中，该病历解析方法除了包括上述S601-S603以外，可以还包括S604：

S604：根据待处理病历文本的语义解析结果和预设病历字段齐全条件，确定该待处理病历文本是否存在字段缺失现象。

其中，“预设病历字段齐全条件”是指预先设定的用于判断一段病历内容是否存在字段缺失现象的判断条件；而且本申请实施例不限定该“预设病历字段齐全条件”，例如，其具体可以包括：覆盖至少一个特定字段名。需要说明的是，上述“至少一个特定字段名”可以根据上述“预设病历规范资料数据”(例如，《病历书写规范2014版》)确定的。

可见，当“预设病历字段齐全条件”包括覆盖至少一个特定字段名时，若确定待处理病历文本的语义解析结果完全覆盖了上述“至少一个特定字段名”，则可以确定该待处理病历文本的语义解析结果达到预设病历字段齐全条件，故可以确定该待处理病历文本不存在字段缺失现象；若确定待处理病历文本的语义解析结果未能覆盖上述“至少一个特定字段名”，则可以确定该待处理病历文本的语义解析结果没有达到预设病历字段齐全条件，故可以确定该待处理病历文本存在字段缺失现象。

基于上述S604的相关内容可知，在获取到待处理病历文本的语义解析结果之后，可以判断该待处理病历文本的语义解析结果是否达到预设病历字段齐全条件，若达到，则可以确定该待处理病历文本达到字段齐全要求；若未达到，则可以确定该待处理病历文本存在字段缺失现象，如此能够实现病历文本数据的字段缺失识别处理。

基于上述方法实施例提供的语义标签确定模型的构建方法，本申请实施例还提供了一种语义标签确定模型的构建装置，下面结合附图进行解释和说明。

装置实施例一

装置实施例一对语义标签确定模型的构建装置进行介绍，相关内容请参见上述方法实施例。

参见图7，该图为本申请实施例提供的一种语义标签确定模型的构建装置的结构示意图。

本申请实施例提供的语义标签确定模型的构建装置700，包括：

第一获取单元701，用于获取样本病历文本和所述样本病历文本的实际语义标签信息；

第一确定单元702，用于根据所述样本病历文本和待训练模型，确定所述样本病历文本的预测语义标签信息；

模型更新单元703，用于根据所述预测语义标签信息和所述实际语义标签信息，更新所述待训练模型，并返回所述第一确定单元702继续执行所述根据所述样本病历文本和待训练模型，得到所述样本病历文本的预测语义标签信息的步骤，直至在达到预设停止条件时，根据所述待训练模型，确定语义标签确定模型。

在一种可能的实施方式中，所述待训练模型包括文本编码层、专家编码层、专家权重确定层和决策层；其中，所述专家编码层包括M个专家编码网络；M为正整数；

所述第一确定单元702，包括：

第一确定子单元，用于根据所述样本病历文本和所述文本编码层，得到待使用文本编码结果；

第二确定子单元，用于将所述待使用文本编码结果输入第m个专家编码网络，得到所述第m个专家编码网络输出的第m个专家编码结果；其中，m为正整数，m≤M；

第三确定子单元，用于将所述待使用文本编码结果输入所述专家权重确定层，得到所述专家权重确定层输出的所述M个专家编码网络对应的预测专家权重值；

第四确定子单元，用于将所述M个专家编码结果和所述M个专家编码网络对应的预测专家权重值输入决策层，得到所述决策层输出的所述样本病历文本的预测语义标签信息。

在一种可能的实施方式中，所述语义标签确定模型的构建装置700还包括：

第三获取单元，用于获取所述M个专家编码网络对应的先验专家权重值；

所述模型更新单元703，包括：

第一更新子单元，用于根据所述预测语义标签信息、所述实际语义标签信息、所述M个专家编码网络对应的先验专家权重值、和所述M个专家编码网络对应的预测专家权重值，更新所述待训练模型。

在一种可能的实施方式中，所述第三获取单元，包括：

第五确定子单元，用于确定所述样本病历文本的样本类型信息；

第六确定子单元，用于根据所述样本类型信息和预设映射关系，确定所述M个专家编码网络对应的先验专家权重值；其中，所述预设映射关系包括所述样本类型信息与所述M个专家编码网络对应的先验专家权重值之间的对应关系。

在一种可能的实施方式中，所述样本类型信息包括标签确定难度表征数据，且所述第三获取单元，包括：第七确定子单元；

或者，

所述样本类型信息包括标签频次表征数据；所述第三获取单元，包括：第八确定子单元；

或者，

所述样本类型信息包括标签确定难度表征数据和标签频次表征数据，且所述第三获取单元，包括：第七确定子单元和第八确定子单元；

所述第七确定子单元，用于对所述样本病历文本进行预设划分处理，得到至少一个样本片段；将各个所述样本片段输入预先构建的语义解析模型，得到所述语义解析模型输出的各个所述样本片段的语义标签解析信息；根据各个所述样本片段的语义标签解析信息和所述实际语义标签信息，确定所述样本病历文本的模型解析损失值；根据所述模型解析损失值，确定所述样本病历文本的标签确定难度表征数据；

所述第八确定子单元，用于依据至少一个参考病历文本的实际语义标签信息，对所述实际语义标签信息进行出现频次统计处理，得到所述样本病历文本的标签频次表征数据。

在一种可能的实施方式中，所述第一更新子单元，具体用于：根据所述预测语义标签信息和所述实际语义标签信息，确定所述样本病历文本的语义预测损失值；根据所述M个专家编码网络对应的先验专家权重值和所述M个专家编码网络对应的预测专家权重值，确定所述样本病历文本的权重预测损失值；根据所述样本病历文本的语义预测损失值和所述样本病历文本的权重预测损失值，确定所述待训练模型的模型预测损失值；根据所述模型预测损失值，更新所述待训练模型。

在一种可能的实施方式中，所述决策层包括专家决策网络和决策融合网络；所述第四确定子单元，包括：

第九确定子单元，用于将所述第m个专家编码结果输入所述专家决策网络，得到所述专家决策网络输出的第m个专家决策结果；其中，m为正整数，m≤M；

第十确定子单元，用于将M个专家决策结果和所述M个专家编码网络对应的预测专家权重值输入决策融合网络，得到所述决策融合网络输出的所述样本病历文本的预测语义标签信息。

在一种可能的实施方式中，所述模型更新单元703，包括：

第二更新子单元，用于根据所述M个专家决策结果、所述M个专家编码网络对应的预测专家权重值、和所述实际语义标签信息，更新所述待训练模型。

在一种可能的实施方式中，所述第二更新单元，包括：

第十一确定子单元，用于根据所述第m个专家决策结果和所述实际语义标签信息，确定第m个专家决策损失值；其中，m为正整数，m≤M；

第十二确定子单元，用于根据M个专家决策损失值和所述M个专家编码网络对应的预测专家权重值，确定所述样本病历文本的语义预测损失值；

第三更新子单元，用于根据所述样本病历文本的语义预测损失值，更新所述待训练模型。

在一种可能的实施方式中，所述第十一确定子单元，具体用于：根据所述第m个专家决策结果、所述实际语义标签信息、以及所述第m个专家编码网络对应的网络损失函数，确定所述第m个专家决策损失值；其中，所述第m个专家编码网络对应的网络损失函数中惩罚因子不同于所述M个专家编码网络中除了所述第m个专家编码网络以外的其他任意一个专家编码网络对应的网络损失函数中惩罚因子。

在一种可能的实施方式中，所述样本病历文本的实际语义标签信息是从K个候选语义标签中确定的；其中，K为正整数；

所述第九确定子单元，具体用于：将所述第m个专家编码结果与第k个候选语义标签的字符特征向量进行向量点积处理，得到所述第m个专家编码结果的第k个标签归属概率信息；其中，k为正整数，k≤K；对所述第m个专家编码结果的第1个标签归属概率信息至所述第m个专家编码结果的第K个标签归属概率信息进行集合处理，得到所述第m个专家决策结果。

在一种可能的实施方式中，所述待训练模型还包括文本切分层；

所述第一确定子单元，包括：

第十三确定子单元，用于将所述样本病历文本输入所述文本切分层，得到所述文本切分层输出的至少一个文本片段；

第十四确定子单元，用于将所述至少一个文本片段输入所述文本编码层，得到所述文本编码层输出的所述待使用文本编码结果；其中，所述待使用文本编码结果包括所述至少一个文本片段的文本编码结果。

在一种可能的实施方式中，所述文本编码层包括第一编码网络和第二编码网络；所述第十四确定子单元，具体用于：将各个所述文本片段输入所述第一编码网络，得到所述第一编码网络输出的各个所述文本片段的初步编码结果；将所述至少一个文本片段的初步编码结果输入所述第二编码网络，得到所述第二编码网络输出的所述至少一个文本片段的文本编码结果。

在一种可能的实施方式中，所述第一确定单元702，具体用于：对所述样本病历文本进行预设划分处理，得到至少一个样本片段；将所述至少一个样本片段输入所述待训练模型，得到所述待训练模型输出的所述样本病历文本的预测语义标签信息；其中，所述预测语义标签信息包括所述至少一个样本片段的片段语义标签信息。

基于上述方法实施例提供的病历解析方法，本申请实施例还提供了一种病历解析装置，下面结合附图进行解释和说明。

装置实施例二

装置实施例二对病历解析装置进行介绍，相关内容请参见上述方法实施例。

参见图8，该图为本申请实施例提供的一种病历解析装置的结构示意图。

本申请实施例提供的病历解析装置800，包括：

第二获取单元801，用于获取待处理病历文本；

第二确定单元802，用于根据所述待处理病历文本和语义标签确定模型，确定所述待处理病历文本的预测语义标签信息；其中，所述语义标签确定模型是利用权利要求1至14任一项所述的语义标签确定模型的构建方法进行构建的；

第三确定单元803，用于根据所述待处理病历文本的预测语义标签信息，确定所述待处理病历文本的语义解析结果。

在一种可能的实施方式中，所述待处理病历文本的预测语义标签信息包括所述待处理病历文本中至少一个待处理片段的片段语义标签信息；

所述第三确定单元803，具体用于：按照预设整合规则，对所述至少一个待处理片段的片段语义标签信息进行整合处理，得到至少一个待使用片段的片段语义标签信息；

根据所述至少一个待使用片段的片段语义标签信息，确定所述待处理病历文本的语义解析结果。

在一种可能的实施方式中，所述语义解析结果的确定过程，包括：按照预设纠错校正规则，对待纠正语义标签信息进行纠错处理，得到纠错后语义标签；根据所述纠错后语义标签，确定所述待处理病历文本的语义解析结果。

在一种可能的实施方式中，所述病历解析装置800还包括：

规范确定单元，用于根据所述待处理病历文本的语义解析结果和预设病历字段齐全条件，确定所述待处理病历文本是否存在字段缺失现象。

进一步地，本申请实施例还提供了一种设备，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

进一步地，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行本申请实施例提供的语义标签确定模型的构建方法的任一实施方式，或者执行本申请实施例提供的病历解析方法的任一实施方式。

进一步地，本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行本申请实施例提供的语义标签确定模型的构建方法的任一实施方式，或者执行本申请实施例提供的病历解析方法的任一实施方式。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种语义标签确定模型的构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述待训练模型包括文本编码层、专家编码层、专家权重确定层和决策层；其中，所述专家编码层包括M个专家编码网络；M为正整数；

所述预测语义标签信息的确定过程，包括：

根据所述样本病历文本和所述文本编码层，确定待使用文本编码结果；

将所述待使用文本编码结果输入第m个专家编码网络，得到所述第m个专家编码网络输出的第m个专家编码结果；其中，m为正整数，m≤M；

将所述待使用文本编码结果输入所述专家权重确定层，得到所述专家权重确定层输出的所述M个专家编码网络对应的预测专家权重值；

将所述M个专家编码结果和所述M个专家编码网络对应的预测专家权重值输入决策层，得到所述决策层输出的所述样本病历文本的预测语义标签信息。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

获取所述M个专家编码网络对应的先验专家权重值；

所述根据所述预测语义标签信息和所述实际语义标签信息，更新所述待训练模型，包括：

根据所述预测语义标签信息、所述实际语义标签信息、所述M个专家编码网络对应的先验专家权重值、和所述M个专家编码网络对应的预测专家权重值，更新所述待训练模型。

4.根据权利要求3所述的方法，其特征在于，所述获取所述M个专家编码网络对应的先验专家权重值，包括：

确定所述样本病历文本的样本类型信息；

根据所述样本类型信息和预设映射关系，确定所述M个专家编码网络对应的先验专家权重值；其中，所述预设映射关系包括所述样本类型信息与所述M个专家编码网络对应的先验专家权重值之间的对应关系。

5.根据权利要求4所述的方法，其特征在于，所述样本类型信息包括标签确定难度表征数据和/或标签频次表征数据；

所述标签确定难度表征数据的确定过程，包括：

对所述样本病历文本进行预设划分处理，得到至少一个样本片段；将各个所述样本片段输入预先构建的语义解析模型，得到所述语义解析模型输出的各个所述样本片段的语义标签解析信息；根据各个所述样本片段的语义标签解析信息和所述实际语义标签信息，确定所述样本病历文本的模型解析损失值；根据所述模型解析损失值，确定所述样本病历文本的标签确定难度表征数据；

所述标签频次表征数据的确定过程，包括：

依据至少一个参考病历文本的实际语义标签信息，对所述实际语义标签信息进行出现频次统计处理，得到所述样本病历文本的标签频次表征数据。

6.根据权利要求3所述的方法，其特征在于，所述根据所述预测语义标签信息、所述实际语义标签信息、所述M个专家编码网络对应的先验专家权重值、和所述M个专家编码网络对应的预测专家权重值，更新所述待训练模型，包括：

根据所述预测语义标签信息和所述实际语义标签信息，确定所述样本病历文本的语义预测损失值；

根据所述M个专家编码网络对应的先验专家权重值和所述M个专家编码网络对应的预测专家权重值，确定所述样本病历文本的权重预测损失值；

根据所述样本病历文本的语义预测损失值和所述样本病历文本的权重预测损失值，确定所述待训练模型的模型预测损失值；

根据所述模型预测损失值，更新所述待训练模型。

7.根据权利要求2所述的方法，其特征在于，所述决策层包括专家决策网络和决策融合网络；

所述预测语义标签信息的确定过程，包括：

将所述第m个专家编码结果输入所述专家决策网络，得到所述专家决策网络输出的第m个专家决策结果；其中，m为正整数，m≤M；

将M个专家决策结果和所述M个专家编码网络对应的预测专家权重值输入决策融合网络，得到所述决策融合网络输出的所述样本病历文本的预测语义标签信息。

8.根据权利要求7所述的方法，其特征在于，所述根据所述预测语义标签信息和所述实际语义标签信息，更新所述待训练模型，包括：

根据所述M个专家决策结果、所述M个专家编码网络对应的预测专家权重值、和所述实际语义标签信息，更新所述待训练模型。

9.根据权利要求8所述的方法，其特征在于，所述根据所述M个专家决策结果、所述M个专家编码网络对应的预测专家权重值、和所述实际语义标签信息，更新所述待训练模型，包括：

根据所述第m个专家决策结果和所述实际语义标签信息，确定第m个专家决策损失值；其中，m为正整数，m≤M；

根据M个专家决策损失值和所述M个专家编码网络对应的预测专家权重值，确定所述样本病历文本的语义预测损失值；

根据所述样本病历文本的语义预测损失值，更新所述待训练模型。

10.根据权利要求9所述的方法，其特征在于，所述第m个专家决策损失值的确定过程，包括：

根据所述第m个专家决策结果、所述实际语义标签信息、以及所述第m个专家编码网络对应的网络损失函数，确定所述第m个专家决策损失值；其中，所述第m个专家编码网络对应的网络损失函数中惩罚因子不同于所述M个专家编码网络中除了所述第m个专家编码网络以外的其他任意一个专家编码网络对应的网络损失函数中惩罚因子。

11.根据权利要求7所述的方法，其特征在于，所述样本病历文本的实际语义标签信息是从K个候选语义标签中确定的；其中，K为正整数；

所述第m个专家决策结果的确定过程，包括：

将所述第m个专家编码结果与第k个候选语义标签的字符特征向量进行向量点积处理，得到所述第m个专家编码结果的第k个标签归属概率信息；其中，k为正整数，k≤K；

对所述第m个专家编码结果的第1个标签归属概率信息至所述第m个专家编码结果的第K个标签归属概率信息进行集合处理，得到所述第m个专家决策结果。

12.根据权利要求2所述的方法，其特征在于，所述待训练模型还包括文本切分层；

所述待使用文本编码结果的确定过程，包括：

将所述样本病历文本输入所述文本切分层，得到所述文本切分层输出的至少一个文本片段；

将所述至少一个文本片段输入所述文本编码层，得到所述文本编码层输出的所述待使用文本编码结果；其中，所述待使用文本编码结果包括所述至少一个文本片段的文本编码结果。

13.根据权利要求12所述的方法，其特征在于，所述文本编码层包括第一编码网络和第二编码网络；

所述至少一个文本片段的文本编码结果的确定过程，包括：

将各个所述文本片段输入所述第一编码网络，得到所述第一编码网络输出的各个所述文本片段的初步编码结果；

将所述至少一个文本片段的初步编码结果输入所述第二编码网络，得到所述第二编码网络输出的所述至少一个文本片段的文本编码结果。

14.根据权利要求1-11任一项所述的方法，其特征在于，所述根据所述样本病历文本和待训练模型，得到所述样本病历文本的预测语义标签信息，包括：

对所述样本病历文本进行预设划分处理，得到至少一个样本片段；

将所述至少一个样本片段输入所述待训练模型，得到所述待训练模型输出的所述样本病历文本的预测语义标签信息；其中，所述预测语义标签信息包括所述至少一个样本片段的片段语义标签信息。

15.一种病历解析方法，其特征在于，所述方法包括：

获取待处理病历文本；

根据所述待处理病历文本和语义标签确定模型，确定所述待处理病历文本的预测语义标签信息；其中，所述语义标签确定模型是利用权利要求1至14任一项所述的语义标签确定模型的构建方法进行构建的；

16.根据权利要求15所述的方法，其特征在于，所述待处理病历文本的预测语义标签信息包括所述待处理病历文本中至少一个待处理片段的片段语义标签信息；

所述根据所述待处理病历文本的预测语义标签信息，确定所述待处理病历文本的语义解析结果，包括：

按照预设整合规则，对所述至少一个待处理片段的片段语义标签信息进行整合处理，得到至少一个待使用片段的片段语义标签信息；

17.根据权利要求15或16所述的方法，其特征在于，所述语义解析结果的确定过程，包括：

按照预设纠错校正规则，对待纠正语义标签信息进行纠错处理，得到纠错后语义标签；

根据所述纠错后语义标签，确定所述待处理病历文本的语义解析结果。

18.根据权利要求15所述的方法，其特征在于，所述方法还包括：

根据所述待处理病历文本的语义解析结果和预设病历字段齐全条件，确定所述待处理病历文本是否存在字段缺失现象。

19.一种语义标签确定模型的构建装置，其特征在于，包括：

20.一种病历解析装置，其特征在于，包括：

第二获取单元，用于获取待处理病历文本；

第二确定单元，用于根据所述待处理病历文本和语义标签确定模型，确定所述待处理病历文本的预测语义标签信息；其中，所述语义标签确定模型是利用权利要求1至14任一项所述的语义标签确定模型的构建方法进行构建的；

21.一种设备，其特征在于，所述设备包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行权利要求1至14任一项所述的语义标签确定模型的构建方法，或者执行权利要求15至18任一项所述的病历解析方法。

22.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1至14任一项所述的语义标签确定模型的构建方法，或者执行权利要求15至18任一项所述的病历解析方法。

23.一种计算机程序产品，其特征在于，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行权利要求1至14任一项所述的语义标签确定模型的构建方法，或者执行权利要求15至18任一项所述的病历解析方法。