CN114880462A

CN114880462A - 医用文档的分析方法、装置、设备以及存储介质

Info

Publication number: CN114880462A
Application number: CN202210177860.7A
Authority: CN
Inventors: 邢智慧; 陈俊; 黄海峰; 王磊; 代小亚
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-02-25
Filing date: 2022-02-25
Publication date: 2022-08-09

Abstract

本公开提供了一种医用文档的分析方法，涉及人工智能技术领域，尤其涉及深度学习领域。具体实现方案为：获取医用文档，提取医用文档中的至少一个第一病况信息；根据医用文档和第一病况信息，确定医用文档对应的第一分类标签；根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定所述医用文档对应的第二分类标签。本公开能够提高医用文档分析结果的准确性。

Description

医用文档的分析方法、装置、设备以及存储介质

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习领域，具体涉及一种医用文档的分析方法、装置、设备以及存储介质。

背景技术

临床辅助决策系统是根据医用文档中医生记录的信息，辅助医生分析病情做出诊疗决策。其中自动疾病诊断是临床辅助系统当中的核心组成部分，可以对医生的诊断提供强有力的辅助作用。

目前的医用文档分析方法主要是根据医用文档初步划分对应的疾病大类，无法提供精确的疾病分类，因此对医用文档的分析效果不佳。

发明内容

本公开提供了一种医用文档的分析方法、装置、设备以及存储介质。

根据本公开的一方面，提供了一种医用文档的分析方法，包括：

获取医用文档，提取医用文档中的至少一个第一病况信息；

根据医用文档和第一病况信息确定该医用文档对应的第一分类标签；

根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签。

根据本公开的另一方面，提供了一种模型训练方法，包括：

从历史医用文档中获取训练样本，训练样本包括样本医用文档和样本医用文档对应的确诊分类标签；

提取样本医用文档中的至少一个第一病况信息；

将样本医用文档和第一病况信息输入模型，由模型输出样本医用文档对应的第一分类标签；

对比确诊分类标签和第一分类标签，基于对比结果调整模型的参数，以得到训练好的模型。

根据本公开的一方面，提供了一种医用文档的分析装置，包括：

第一获取模块，用于获取医用文档，提取医用文档中的至少一个第一病况信息；

第一分类模块，用于根据医用文档和第一病况信息确定该医用文档对应的第一分类标签；

修正模块，用于根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签。

根据本公开的另一方面，提供了一种模型训练装置，包括：

第一提取模块，用于从历史医用文档中获取训练样本，训练样本包括样本医用文档和样本医用文档对应的确诊分类标签；

第二提取模块，用于提取样本医用文档中的至少一个第一病况信息；

第二分类模块，用于将样本医用文档和第一病况信息输入模型，由模型输出样本医用文档对应的第一分类标签；

调整模块，用于对比确诊分类标签和第一分类标签，基于对比结果调整模型的参数，以得到训练好的模型。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与该至少一个处理器通信连接的存储器；其中，

该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行上述医用文档的分析方法或上述模型训练方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行上述医用文档的分析方法或上述模型训练方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现上述医用文档的分析方法或上述模型训练方法。

本公开通过构建疾病标签分类的层级关系，先确定医用文档对应的第一分类标签，再从该第一分类标签对应的子标签中确定医用文档对应的第二分类标签，从而能够实现更为精确的疾病分类，提高对医用文档的分析效果。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开的一种应用场景示意图；

图2是根据本公开一实施例的医用文档的分析方法的实现流程示意图；

图3是根据本公开一实施例的医用文档的分析方法中模型的结构示意图；

图4是根据本公开一实施例的医用文档的分析方法的模型中特征融合层的结构示意图；

图5是根据本公开另一实施例的模型训练方法的实现流程示意图；

图6是根据本公开一实施例的医用文档的分析装置600的结构示意图；

图7是根据本公开另一实施例的医用文档的分析装置700的结构示意图；

图8是根据本公开一实施例的模型训练装置800的结构示意图；

图9是可以用来实施本公开的实施例的示例电子设备900的示意性框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本公开提出一种医用文档的分析方法，该方法可以应用于数据处理装置，例如，该装置可以部署于终端或服务器或其它处理设备执行的情况下，实现医用文档的分析。例如，该方法可以应用于图1所示的应用场景，如图1所示，该应用场景可以包括终端110和分析服务器120，以应用了该方法的装置部署于分析服务器中为例，使用者可以通过终端110向服务器120发送使用该分析方法的请求，分析服务器120可以从存储有电子医用文档数据的自身存储器中获取该请求中的目标医用文档，或者可以经过许可从任何存储有该电子医用文档数据的第三方服务器130获取该目标医用文档，也可以从该终端110获取该医用文档。分析服务器120使用该分析方法对医用文档进行分析后将得到的分析结果反馈给终端110，终端110可以接收并展示分析结果。

终端110通过无线网络或有线网络与分析服务器120相连。可选地，终端110是智能手机、平板电脑、笔记本电脑、台式计算机、智能手表、车载终端等，但并不局限于此。终端110安装和运行有支持医用文档分析的应用程序。

分析服务器120和第三方服务器130可以是独立的服务器，或是服务器集群或者分布式系统，或者是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、以及大数据和人工智能平台等基础云计算服务的云服务器。

图2是根据本公开一实施例的医用文档的方法的实现流程示意图，该方法至少包括以下步骤：

S201：获取医用文档，提取医用文档中的至少一个第一病况信息；

S202：根据医用文档和第一病况信息，确定该医用文档对应的第一分类标签；

S203：根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签。

需要说明的是，医用文档可以来自于患者的电子医用文档，也可以通过终端110输入。医用文档可以包括病历信息，病历信息中中可以包括病人信息和就诊形成的自由文本，自由文本是指病历中的文字表述，自由文本可以包括：病人就诊时表达的内容形成的主诉、医生对病人的诊断记录、病史数据、体征检查数据或检验数据中的至少一种，本公开实施例对此不做限定。其中，主诉是对病人或患者最主要的症状和/或体征的叙述。例如病历中会写“患者咳嗽3天，发热两天，伴有轻微头痛”。针对一些专科疾病，例如精神科，医用文档中的自由文本篇幅极长，会有非常大的篇幅描述患者的日常行为和感受。相较于一般的内外妇儿病历长度约几十到几百字不等，精神科病历能够达到上千字。

在一些可能的实施方式中，上述提取医用文档中的至少一个第一病况信息，包括：

对医用文档进行命名实体识别处理，识别出医用文档中出现同种含义的疾病症状；

统计每种疾病症状的出现频次，将出现频次高于第二阈值的疾病症状作为第一病况信息，和\或

将出现在医用文档中的主诉部分的疾病症状作为第一病况信息。

该第二阈值可以1、2、3、4中的任一数值，或是大于或等于0的任意整数，在此不作限定。

命名实体识别(Named Entity Recognition，NER)：是指识别文本中具有特定意义的实体词，通用领域中主要包括人名、地名、机构名、专有名词等，在医疗领域，如电子病历中的疾病症状、病况、诊断名称、手术名称、药物名称、解剖部位等。

通过命名实体识别可以统一医用文档中以不同形式描述的症状，方便对不同病况的出现次数进行统计，并将出现频次高于第二阈值的疾病症状作为患者的典型病况。因此，患者的典型病况可以包含多个疾病症状。例如，将发热和发烧统计为同一症状，将躁狂发作和处于躁狂状态统计为同一症状。

在一些可能的实施方式中，上述根据医用文档和第一病况信息，确定该医用文档对应的第一分类标签，包括：

将医用文档和第一病况信息输入预先训练的模型，由模型输出该医用文档对应的第一分类标签。

相关技术中，神经网络模型在临床辅助决策领域应用时，可以使用历史医用文档作为样本进行模型训练，从而实现对待分类的医用文档给出分类预测结果。但对于许多专科疾病，在诊断上对疾病的病况往往有更细粒度的区分，且相较于全科的医用文档数据较少，样本医用文档类型不够丰富全面，导致对每个疾病无法提供足够多的训练样本，使用较为复杂的深度学习算法也无法获得效果较好的模型。

另外，部分专科在病历内容上有自身的特殊性，例如精神病专科，涉及病种较多，且疾病之间有很细的区分，传统的量表或机器学习无法做到准确的预测。精神科病历的写法与内外妇儿差距较大，内外妇儿主要是通过症状、体征或检查检验的相关结果，确定患者所患疾病，而精神科的病历主要描述患者的心情感受和日常行为，往往仅有一些患者感受上的症状，如心烦、急躁、情绪低落等，缺少如发烧、咳嗽等典型症状以及患者的体征、检查检验等，使得在针对部分专科的病历分析上无法复用全科疾病的模型。

针对这一问题，本公开实施例提出的医用文档的分析方法，先采用预先训练的模型区分疾病大类(即输出医用文档对应的第一分类标签)，再在该疾病大类中区分对应的疾病小类(即确定医用文档对应的第二分类标签)，这种方式可以保证模型在训练过程中针对每个疾病大类有更多的训练样本，因此可以在整体样本数量有限的情况下，改善模型的训练效果，提高模型的准确性，从而提高对医用文档进行分析的效果。

图3是根据本公开一实施例的模型的结构示意图，如图3所示，在一些可能的实施方式中，上述将医用文档和第一病况信息输入预先训练的模型，由模型输出医用文档对应的第一分类标签，包括：

将医用文档输入模型的第一分支，得到医用文档特征，其中，第一分支包括第一嵌入层和第一编码层，第一嵌入层的输入端为第一分支的输入端，第一嵌入层的输出端连接第一编码层的输入端，第一编码层的输出端为第一分支的输出端；

将第一病况信息输入模型的第二分支，得到至少一个病况信息特征，其中，第二分支包括第二嵌入层和第二编码层，第二嵌入层的输入端为第二分支的输入端，第二嵌入层的输出端连接第二编码层的输入端，第二编码层的输出端为第二分支的输出端；

模型的特征融合层采用注意力机制对医用文档特征和至少一个病况信息特征进行特征融合，得到融合特征；根据融合特征进行分类处理，得到第一分类标签。

在一些可能的实施方式中，上述将医用文档输入模型的第一分支，得到医用文档特征，包括：

将医用文档输入第一嵌入层，由第一嵌入层对医用文档进行词向量编码(Embedding)，得到医用文档的向量表示；

医用文档中分解为以字词(token)为单位的数据结构，然后将所有token输入第一嵌入层，由第一嵌入层对医用文档进行词向量编码(Embedding)之后得到医用文档的向量表示X＝{x₁,…x_i,…}，每一个x代表字词所对应的向量。

第一编码层中的双向长短期记忆(Bi-directional Long Short-Term Memory，BiLSTM)网络对医用文档的向量表示进行特征提取，得到医用文档特征query。

BiLSTM网络的输出端连接最大池化层maxpooling对医用文档的向量表示进行特征提取，具体如下：

h_init＝MaxPool(BiLstm(Dropout(X)))

最大池化层的输出端连接一层全连接层，得到最终的医用文档自由文本表示结果：

h_seq＝σ(Wh_init+b)

其中W和b分别代表全连接层模型所要学习的参数，σ代表全连接采用的激活函数为Sigmoid函数，数学形式如下：

σ(x)＝1/1+e^-x

本实施例通过BiLSTM网络从医用文档的向量表示中进行特征提取，能够提高对长文本的特征提取的准确性。

在一些可能的实施方式中，上述将第一病况信息输入模型的第二分支，得到至少一个病况信息特征，包括：

将至少一个第一病况信息输入第二嵌入层，由第二嵌入层对第一病况信息进行词向量编码，得到第一病况信息的向量表示矩阵value，第一病况信息的向量表示矩阵包括各第一病况信息的向量表示value_i；

第二编码层中的文本分类卷积神经网络(Text Convolutional NauralNetworks，TextCNN)对第一病况信息的向量表示矩阵进行特征提取，得到病况信息特征key。

本实施例中，通过TextCNN对第一病况信息进行特征提取，可以为模型中的注意力机制提供集中注意力的目标，在面对长文本时能提高分类准确性。

图4是根据本公开一实施例的模型中特征融合层的结构示意图，如图4所示，在一些可能的实施方式中，上述模型的特征融合层采用注意力机制对医用文档特征和至少一个病况信息特征进行特征融合，得到融合特征，包括：

对医用文档特征query分别和每个病况信息特征key_i进行相似度计算，得到医用文档与每个第一病况信息的病况相似度特征s，s的计算方式如下：

s(key,query)＝w^Ttanh(Wkey_i+bquery)

其中w^T、W和b是模型学习的参数。

对所有病况相似度特征进行归一化处理softmax，得到与每个病况相似度特征对应的权重系数a，a的计算方式如下；

对每个权重系数a_i和与该权重系数对应的第一病况信息的向量表示value_i进行特征融合，得到融合特征att，att的计算方式如下。

本实施例中模型的特征融合层采用上述注意力机制可以使模型在处理医用文档的超长文本时，将注意力集中在对诊断更有意义的病况信息部分，提高分类的准确性。

在一些可能的实施方式中，上述根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签，包括：

根据第一病况信息、第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签。

本实施例中，根据预设分类依据信息，将初步确定的第一分类标签进一步划分，区分第一分类标签对应的第二分类标签，获得具体的诊断结果。

在一些可能的实施方式中，该方法还包括：

针对各个第一分类标签，获取第一分类标签对应的至少一个子标签；其中，第一分类标签表征疾病大类，所述子标签表征属于疾病大类的疾病小类；

针对各个子标签，获取子标签对应的医用文档和/或疾病相关信息；提取医用文档和/或疾病相关信息中的至少一个第二病况信息；

将至少一个第二病况信息作为子标签的预设分类依据信息。

第一分类标签与对应的至少一个子标签由预先构建的诊断空间层级关系确定，层级关系构建的方法有两种：第一种方法是结合ICD-10编码，ICD-10编码：即国际疾病伤害及死因分类标准第十版，是世界卫生组织(WHO)依据疾病的某些特征，按照规则将疾病分门别类，并用编码的方式来表示的系统，现有版本包括15.5万种代码，并记录多种新型诊断及预测。ICD-10中的编码具有层级关系，层级关系用于指示对应疾病之间的上下位关系。ICD-10中在同一个3位编码之下的6位编码表示的是相近的概念或者从属于某一种大概念之下，而不同6位编码之间是更细粒度概念的差异。因此，编码前三位相同的表示诊断之间比较接近，可以归为一大类；第二种方法是结合疾病的关键病况，关键病况的获取有两种途径，首先是参考相关医疗诊断书籍中知识，获取各疾病的关键病况，其次是结合既往病历，挖掘该疾病对应的病历中的典型病况。

表1展示了采用本公开实施例提出的医用文档的分析方法中构建的精神科诊断的部分层级关系，表格如下：

表1

表格中28种诊断通过层级构建，转化为5个大类标签，大大简化后续模型训练难度和对病历量级的要求。

在一些可能的实施方式中，上述提取医用文档和/或疾病相关信息中的至少一个第二病况信息，包括：

对医用文档和/或疾病相关信息中的至少一个进行命名实体识别处理，识别出同种含义的疾病症状；

统计每种疾病症状的出现频次，将出现频次高于第一阈值的疾病症状作为第二病况信息。

该第一阈值可以1、2、3、4中的任一数值，或是大于或等于0的任意整数，在此不作限定。

本实施例中，通过提取既往相关医用文档和外部书籍等疾病相关信息中提取典型病况，从而为分类结果的修正提供了分类依据。

在一些可能的实施方式中，上述根据第一病况信息、第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定该医用文档对应的第二分类标签，包括：

确定第一病况信息与各个子标签的第二病况信息的匹配度，将匹配度最高的子标签确定为第二分类标签，其中，该匹配度与第一病况信息和第二病况信息中相同疾病症状的数量呈正相关。

各子标签的预设分类依据信息包括至少一个第二病况信息，即疾病症状，可以将第一病况信息与各子标签的对应的第二病况信息的疾病症状进行对比，将相同疾病症状数量最多或相同数量占比最高的对应子标签作为第二分类标签，例如，第一病况信息包括5个疾病症状，第一分类标签有2个对应的子标签，子标签1的预设分类依据信息包括4个疾病症状，其中有3个疾病症状与第一病况信息中的疾病症状相同，相同疾病症状数量占比为75％；子标签2预设分类依据信息有6个疾病症状，其中有4个疾病症状与第一病况信息中的疾病症状相同，相同疾病症状数量占比为66.6％；如果按照相同疾病症状数量的方式则将子标签2作为第二分类标签。如果按照相同疾病症状数量占比最高的方式则将子标签1作为第二分类标签。

本实施例中，通过第一病况信息和第二病况信息的对比，根据匹配程度可以将第一分类标签修正为第二分类标签，从而获得医用文档的具体的诊断结果。

图5是根据本公开实施例的模型训练方法的实现流程图，包括：

S501：从历史医用文档中获取训练样本，训练样本包括样本医用文档和样本医用文档对应的确诊分类标签；

S502：提取样本医用文档中的至少一个第一病况信息；

S503：将样本医用文档和第一病况信息输入模型，由模型输出样本医用文档对应的第一分类标签；

S504：对比确诊分类标签和第一分类标签，基于对比结果调整模型的参数，以得到训练好的模型。

本实施例训练的模型的结构可以如图3所示，在此不再赘述。

在一些可能的实施方式中，上述将样本医用文档和第一病况信息输入模型，由模型输出样本医用文档对应的第一分类标签，包括：

将样本医用文档输入模型的第一分支，由模型的第一分支确定医用文档特征；

将第一病况信息输入模型的第二分支，由模型的第二分支确定至少一个病况信息特征；

由模型的特征融合层采用注意力机制对医用文档特征和至少一个病况信息特征进行特征融合，得到融合特征；根据融合特征进行分类处理，得到第一分类标签。

在一些可能的实施方式中，上述将样本医用文档输入模型的第一分支，由模型的第一分支确定医用文档特征，包括：

将样本医用文档输入第一分支的第一嵌入层，由第一嵌入层对样本医用文档分字后进行词向量编码，得到样本医用文档的向量表示；

第一分支的第一编码层中的双向长短期记忆BiLSTM网络对样本医用文档的向量表示进行特征提取，得到医用文档特征。

在一些可能的实施方式中，上述将第一病况信息输入模型的第二分支，由模型的第二分支确定至少一个病况信息特征，包括：

将至少一个第一病况信息输入第二分支的第二嵌入层，由第二嵌入层对至少一个第一病况信息进行词向量编码，得到第一病况信息的向量表示矩阵，第一病况信息的向量表示矩阵包括各第一病况信息的向量表示；

第二分支的第二编码层中的文本分类卷积神经网络TextCNN对第一病况信息的向量表示矩阵进行特征提取，得到病况信息特征。

在一些可能的实施方式中，上述模型的特征融合层采用注意力机制对医用文档特征和至少一个病况信息特征进行特征融合，得到融合特征，包括：

对医用文档特征分别和至少一个病况信息特征进行相似度计算，得到样本医用文档与每个第一病况信息的病况相似度特征；

对所有病况相似度特征进行归一化处理，得到与每个病况相似度特征对应的权重系数；

对权重系数和与权重系数对应的第一病况信息的向量表示进行特征融合，得到融合特征。

在一些可能的实施方式中，上述对比确诊分类标签和第一分类标签，基于对比结果调整模型的参数，所述参数包括：

上述全连接层所要学习的第一权重转移矩阵W和第一偏置矩阵b；

上述病况相似度特征s计算公式中所要学习的转置矩阵w^T、第二权重转移矩阵W和第三权重转移b。

图6是根据本公开另一实施例的医用文档的分析装置的结构示意图。如图6所述的医用文档的分析装置600，包括：

第一获取模块610，用于获取医用文档，提取医用文档中的至少一个第一病况信息；

第一分类模块620，用于根据医用文档和第一病况信息确定医用文档对应的第一分类标签；

修正模块630，用于根据第一分类标签对应的至少一个子标签以及各子标签的预设分类依据信息，从子标签中确定医用文档对应的第二分类标签。

图7是根据本公开另一实施例的医用文档的分析装置的结构示意图。如图7所述的医用文档的分析装置700，包括：

第一获取模块610、第一分类模块620、修正模块630和第二获取模块740，其中，第一获取模块610、第一分类模块620、修正模块630与上述对应模块相同，在此不再赘述。

在一些可能的实施方式中，上述第一分类模块620用于，将医用文档和第一病况信息输入预先训练的模型，由该模型输出医用文档对应的第一分类标签。

在一些可能的实施方式中，上述第一分类模块620还包括：

第一输入子模块621，用于将医用文档输入模型的第一分支，得到医用文档特征，其中，第一分支包括第一嵌入层和第一编码层，第一嵌入层的输入端为第一分支的输入端，第一嵌入层的输出端连接第一编码层的输入端，第一编码层的输出端为第一分支的输出端；

第二输入子模块622，用于将第一病况信息输入模型的第二分支，得到至少一个病况信息特征，其中，第二分支包括第二嵌入层和第二编码层，第二嵌入层的输入端为第二分支的输入端，第二嵌入层的输出端连接第二编码层的输入端，第二编码层的输出端为第二分支的输出端；

融合子模块623，用于采用注意力机制对医用文档特征和至少一个病况信息特征进行特征融合，得到融合特征；根据融合特征进行分类处理，得到第一分类标签。

在一些可能的实施方式中，上述第一输入子模块621用于：

将医用文档输入第一嵌入层，由第一嵌入层对医用文档进行词向量编码，得到医用文档的向量表示；

第一编码层中的双向长短期记忆BiLSTM网络对医用文档的向量表示进行特征提取，得到医用文档特征。

在一些可能的实施方式中，上述第二输入子模块622用于：

将至少一个第一病况信息输入第二嵌入层，由第二嵌入层对至少一个第一病况信息进行词向量编码，得到第一病况信息的向量表示矩阵，第一病况信息的向量表示矩阵包括各第一病况信息的向量表示；

第二编码层中的文本分类卷积神经网络TextCNN对第一病况信息的向量表示矩阵进行特征提取，得到病况信息特征。

在一些可能的实施方式中，上述融合子模块623用于：

对医用文档特征分别和至少一个病况信息特征进行相似度计算，得到医用文档与每个第一病况信息的病况相似度特征；

在一些可能的实施方式中，上述第二获取模块740用于：

针对各个第一分类标签，获取第一分类标签对应的至少一个子标签；其中，第一分类标签表征疾病大类，子标签表征属于疾病大类的疾病小类；

将至少一个第二病况信息作为子标签的预设分类依据信息。

在一些可能的实施方式中，上述第二获取模块740用于：

在一些可能的实施方式中，上述第一获取模块610用于：

在一些可能的实施方式中，上述修正模块630：

确定第一病况信息与各个子标签的第二病况信息的匹配度，将匹配度最高的子标签确定为第二分类标签，其中，匹配度与第一病况信息和第二病况信息中相同疾病症状的数量呈正相关。

本公开实施例的医用文档的分析装置600、700的各模块、子模块的具体功能和示例的描述，可以参见上述数据处理方法实施例中对应步骤的相关描述，在此不再赘述。

图8是根据本公开一实施例的模型训练装置的结构示意图。如图8所述的模型训练装置800，包括：

第一提取模块810，用于从历史医用文档中获取训练样本，训练样本包括样本医用文档和样本医用文档对应的确诊分类标签；

第二提取模块820，用于提取样本医用文档中的至少一个第一病况信息；

第二分类模块830，用于将样本医用文档和第一病况信息输入模型，由模型输出样本医用文档对应的第一分类标签；

调整模块840，用于对比确诊分类标签和第一分类标签，基于对比结果调整模型的参数，以得到训练好的模型。

在一些可能的实施方式中，上述第二分类模块830用于：

在一些可能的实施方式中，上述第一提取模块810用于：

在一些可能的实施方式中，上述第二提取模块820用于：

在一些可能的实施方式中，上述第二分类模块830用于：

本公开实施例的模型训练装置800的各模块、子模块的具体功能和示例的描述，可以参见上述数据处理方法实施例中对应步骤的相关描述，在此不再赘述。

本公开的技术方案中，所涉及的用户个人信息的获取，存储和应用等，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图9所示，设备900包括计算单元901，其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序，来执行各种适当的动作和处理。在RAM 903中，还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。

设备900中的多个部件连接至I/O接口905，包括：输入单元906，例如键盘、鼠标等；输出单元907，例如各种类型的显示器、扬声器等；存储单元908，例如磁盘、光盘等；以及通信单元909，例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理，例如医用文档的分析方法或模型训练方法。例如，在一些实施例中，医用文档的分析方法或模型训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元908。在一些实施例中，计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时，可以执行上文描述的医用文档的分析方法或模型训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元901可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行医用文档的分析方法或模型训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种医用文档的分析方法，包括：

获取医用文档，提取所述医用文档中的至少一个第一病况信息；

根据所述医用文档和所述第一病况信息，确定所述医用文档对应的第一分类标签；

根据所述第一分类标签对应的至少一个子标签以及各所述子标签的预设分类依据信息，从所述子标签中确定所述医用文档对应的第二分类标签。

2.根据权利要求1所述的方法，其中，所述根据所述医用文档和所述第一病况信息，确定所述医用文档对应的第一分类标签，包括：

将所述医用文档和所述第一病况信息输入预先训练的模型，由所述模型输出所述医用文档对应的第一分类标签。

3.根据权利要求2所述的方法，其中，所述将所述医用文档和所述第一病况信息输入预先训练的模型，由所述模型输出所述医用文档对应的第一分类标签，包括：

将所述医用文档输入所述模型的第一分支，得到医用文档特征，其中，所述第一分支包括第一嵌入层和第一编码层，所述第一嵌入层的输入端为所述第一分支的输入端，所述第一嵌入层的输出端连接所述第一编码层的输入端，所述第一编码层的输出端为所述第一分支的输出端；

将所述第一病况信息输入所述模型的第二分支，得到至少一个病况信息特征，其中，所述第二分支包括第二嵌入层和第二编码层，所述第二嵌入层的输入端为所述第二分支的输入端，所述第二嵌入层的输出端连接所述第二编码层的输入端，所述第二编码层的输出端为所述第二分支的输出端；

所述模型的特征融合层采用注意力机制对所述医用文档特征和所述至少一个病况信息特征进行特征融合，得到融合特征；根据所述融合特征进行分类处理，得到所述第一分类标签。

4.根据权利要求3所述的方法，其中，所述将所述医用文档输入所述模型的第一分支，得到医用文档特征，包括：

将所述医用文档输入所述第一嵌入层，由所述第一嵌入层对所述医用文档进行词向量编码，得到所述医用文档的向量表示；

所述第一编码层中的双向长短期记忆BiLSTM网络对所述医用文档的向量表示进行特征提取，得到所述医用文档特征。

5.根据权利要求3或4所述的方法，其中，所述将所述第一病况信息输入所述模型的第二分支，得到至少一个病况信息特征，包括：

将所述至少一个第一病况信息输入所述第二嵌入层，由所述第二嵌入层对所述至少一个第一病况信息进行词向量编码，得到所述第一病况信息的向量表示矩阵，所述第一病况信息的向量表示矩阵包括各第一病况信息的向量表示；

所述第二编码层中的文本分类卷积神经网络TextCNN对所述第一病况信息的向量表示矩阵进行特征提取，得到所述病况信息特征。

6.根据权利要求5所述的方法，其中，所述模型的特征融合层采用注意力机制对所述医用文档特征和所述至少一个病况信息特征进行特征融合，得到融合特征，包括：

对所述医用文档特征分别和所述至少一个病况信息特征进行相似度计算，得到所述医用文档与每个所述第一病况信息的病况相似度特征；

对所有所述病况相似度特征进行归一化处理，得到与每个病况相似度特征对应的权重系数；

对所述权重系数和与所述权重系数对应的所述第一病况信息的向量表示进行特征融合，得到融合特征。

7.根据权利要求1至6中任一所述的方法，其中，所述根据所述第一分类标签对应的至少一个子标签以及各所述子标签的预设分类依据信息，从所述子标签中确定所述医用文档对应的第二分类标签，包括：

根据所述第一病况信息、所述第一分类标签对应的至少一个子标签以及各所述子标签的预设分类依据信息，从所述子标签中确定所述医用文档对应的第二分类标签。

8.根据权利要求7所述的方法，还包括：

针对各个第一分类标签，获取所述第一分类标签对应的至少一个子标签；其中，所述第一分类标签表征疾病大类，所述子标签表征属于所述疾病大类的疾病小类；

针对各个所述子标签，获取所述子标签对应的医用文档和/或疾病相关信息；提取所述医用文档和/或疾病相关信息中的至少一个第二病况信息；

将所述至少一个第二病况信息作为所述子标签的预设分类依据信息。

9.根据权利要求8所述的方法，其中，所述提取所述医用文档和/或疾病相关信息中的至少一个第二病况信息，包括：

对所述医用文档和/或疾病相关信息中的至少一个进行命名实体识别处理，识别出同种含义的疾病症状；

统计每种疾病症状的出现频次，将出现频次高于第一阈值的疾病症状作为所述第二病况信息。

10.根据权利要求8或9所述的方法，其中，所述提取所述医用文档中的至少一个第一病况信息，包括：

对所述医用文档进行命名实体识别处理，识别出医用文档中出现同种含义的疾病症状；

统计每种疾病症状的出现频次，将出现频次高于第二阈值的疾病症状作为所述第一病况信息，和\或，将出现在医用文档中的主诉部分的疾病症状作为所述第一病况信息。

11.根据权利要求10所述的方法，其中，所述根据所述第一病况信息、所述第一分类标签对应的至少一个子标签以及各所述子标签的预设分类依据信息，从所述子标签中确定所述医用文档对应的第二分类标签，包括：

确定第一病况信息与所述各个子标签的第二病况信息的匹配度，将匹配度最高的子标签确定为所述第二分类标签，其中，所述匹配度与所述第一病况信息和所述第二病况信息中相同疾病症状的数量呈正相关。

12.一种模型训练方法，包括：

从历史医用文档中获取训练样本，所述训练样本包括样本医用文档和所述样本医用文档对应的确诊分类标签；

提取所述样本医用文档中的至少一个第一病况信息；

将所述样本医用文档和所述第一病况信息输入模型，由所述模型输出所述样本医用文档对应的第一分类标签；

对比所述确诊分类标签和第一分类标签，基于对比结果调整所述模型的参数，以得到训练好的模型。

13.根据权利要求12所述的方法，其中，所述将所述样本医用文档和所述第一病况信息输入模型，由所述模型输出所述样本医用文档对应的第一分类标签，包括：

将所述样本医用文档输入所述模型的第一分支，由所述模型的第一分支确定医用文档特征；

将所述第一病况信息输入所述模型的第二分支，由所述模型的第二分支确定至少一个病况信息特征；

由所述模型的特征融合层采用注意力机制对所述医用文档特征和所述至少一个病况信息特征进行特征融合，得到融合特征；根据所述融合特征进行分类处理，得到所述第一分类标签。

14.根据权利要求13所述的方法，其中，所述将所述样本医用文档输入所述模型的第一分支，由所述模型的第一分支确定医用文档特征，包括：

将所述样本医用文档输入所述第一分支的第一嵌入层，由所述第一嵌入层对所述样本医用文档分字后进行词向量编码，得到所述样本医用文档的向量表示；

所述第一分支的第一编码层中的双向长短期记忆BiLSTM网络对所述样本医用文档的向量表示进行特征提取，得到所述医用文档特征。

15.根据权利要求13或14所述的方法，其中，所述将所述第一病况信息输入所述模型的第二分支，由所述模型的第二分支确定至少一个病况信息特征，包括：

将所述至少一个第一病况信息输入所述第二分支的第二嵌入层，由所述第二嵌入层对所述至少一个第一病况信息进行词向量编码，得到所述第一病况信息的向量表示矩阵，所述第一病况信息的向量表示矩阵包括各第一病况信息的向量表示；

所述第二分支的第二编码层中的文本分类卷积神经网络TextCNN对所述第一病况信息的向量表示矩阵进行特征提取，得到所述病况信息特征。

16.根据权利要求15所述的方法，其中，所述模型的特征融合层采用注意力机制对所述医用文档特征和所述至少一个病况信息特征进行特征融合，得到融合特征，包括：

17.一种医用文档的分析装置，包括：

第一获取模块，用于获取医用文档，提取所述医用文档中的至少一个第一病况信息；

第一分类模块，用于根据所述医用文档和所述第一病况信息确定所述医用文档对应的第一分类标签；

修正模块，用于根据所述第一分类标签对应的至少一个子标签以及各所述子标签的预设分类依据信息，从所述子标签中确定所述医用文档对应的第二分类标签。

18.一种模型训练装置，包括：

第一提取模块，用于从历史医用文档中获取训练样本，所述训练样本包括样本医用文档和所述样本医用文档对应的确诊分类标签；

第二提取模块，用于提取所述样本医用文档中的至少一个第一病况信息；

第二分类模块，用于将所述样本医用文档和所述第一病况信息输入模型，由所述模型输出所述样本医用文档对应的第一分类标签；

调整模块，用于对比所述确诊分类标签和第一分类标签，基于对比结果调整所述模型的参数，以得到训练好的模型。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-11或12-16中任一项所述的方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-11或12-16中任一项所述的方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-11或12-16中任一项所述的方法。