CN113591886B

CN113591886B - 用于信息分类的方法、装置、设备及计算机可读存储介质

Info

Publication number: CN113591886B
Application number: CN202010363706.XA
Authority: CN
Inventors: 袁泉; 陈俊; 黄海峰; 陆超
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-04-30
Filing date: 2020-04-30
Publication date: 2023-11-07
Anticipated expiration: 2040-04-30
Also published as: CN113591886A

Abstract

本申请实施例公开了用于信息分类的方法、装置、设备及计算机可读存储介质，涉及人工智能技术领域。该方法的一具体实施方式包括：获取症状描述信息，并从该症状描述信息中提取得到症状实体；将该症状描述信息中的主诉信息作指导，计算该症状实体的第一注意力权值；根据该第一注意力权值对该症状实体进行加权计算，得到症状实体特征；根据该症状实体特征确定与该症状描述信息对应的症状类型。该实施方式通过利用主诉信息作为指导对提取出的症状实体进行注意力权值计算，使得基于加权后的计算结果确定出的症状类型的准确率更高。

Description

用于信息分类的方法、装置、设备及计算机可读存储介质

技术领域

本申请实施例涉及信息处理技术领域，尤其涉及人工智能技术领域。

背景技术

随着电子信息的发展，越来越多的信息得以数据化，庞杂的数据如何在各方面起到作用，与如何科学的对数据进行处理密切相关。

信息分类是一种非常重要的数据处理方式，通过对混杂各种类型的原始信息按预设的分类方式进行分类，就得以将信息按类型进行划分，从而尽可能的凸显其中包含有关键信息，以便基于关键信息完成后续的数据分析和数据整理。

以医学方面的症状描述信息为例，现有技术常使用基于传统机器学习的算法对其进行分类，从而确定出与症状描述信息对应的症状类型。

发明内容

本申请实施例提出了一种用于信息分类的方法、装置、电子设备及计算机可读存储介质。

第一方面，本申请实施例提出了一种用于信息分类的方法，包括：获取症状描述信息，并从症状描述信息中提取得到症状实体；将症状描述信息中的主诉信息作指导，计算症状实体的第一注意力权值；根据第一注意力权值对症状实体进行加权计算，得到症状实体特征；根据症状实体特征确定与症状描述信息对应的症状类型。

第二方面，本申请实施例提出了一种用于信息分类的装置，包括：症状实体提取单元，被配置成获取症状描述信息，并从症状描述信息中提取得到症状实体；第一注意力权值计算单元，被配置成将症状描述信息中的主诉信息作指导，计算症状实体的第一注意力权值；症状实体加权计算单元，被配置成根据第一注意力权值对症状实体进行加权计算，得到症状实体特征；症状类型确定单元，被配置成根据症状实体特征确定与症状描述信息对应的症状类型。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的用于信息分类的方法。

第四方面，本申请实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的用于信息分类的方法。

本申请实施例提供的用于信息分类的方法、装置、电子设备及计算机可读存储介质，在获取症状描述信息后，从该症状描述信息中提取得到症状实体；然后，将该症状描述信息中的主诉信息作指导，计算该症状实体的第一注意力权值；之后，根据该第一注意力权值对该症状实体进行加权计算，得到症状实体特征；最后，根据该症状实体特征确定与该症状描述信息对应的症状类型。区别于现有技术，本申请在根据症状描述信息确定症状类型的基础上，还从症状描述信息中提取出症状实体，并基于包含有关键信息的主诉信息作为指导，对提取出的症状实体进行了注意力权值的计算，从而能够更加准确的确定出不同症状实体的优先级，以便根据相对准确的症状实体的优先级排序提升确定出真实症状类型的概率。同时，由于症状实体在整个过程的参与，使得最终得到的症状类型与最初获取到的症状描述信息之间建立了准确的过渡关联关系，具有更强的可解释性。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性系统架构；

图2是根据本申请的用于信息分类的方法的一个实施例的流程图；

图3是根据本申请的用于信息分类的方法的另一个实施例的流程图；

图4是根据本申请的用于信息分类的方法的一个应用场景的流程示意图；

图5是根据本申请的用于信息分类的装置的一个实施例的结构示意图；

图6是适于用来实现本申请实施例的用于信息分类的方法的电子设备的框图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于信息分类的方法、装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如在线寻医类应用、搜索类应用等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来实现信息分类业务)，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如通过网络104接收终端设备101、102、103上传的症状描述信息，并根据自身内置的信息分类机制完成对症状描述信息的分类，并通过网络104将作为分类结果的症状类型返回至终端设备101、102、103。

需要说明的是，本申请后续各实施例所提供的用于信息分类的方法一般由服务器105执行，相应地，用于信息分类的装置一般设置于服务器105中。

需要指出的是，症状描述信息不仅可以由终端设备101、102、103通过网络104远程上传至服务器105，还可以由可直接对服务器105进行操作的管理人员直接在本地输入。同时，作为结果的症状类型除将其返回至相应的终端设备101、102、103之外，还可以额外保存一份在服务器105中，以便后续追溯或者注册用户更换新的终端设备后才能够服务器105中同步其之前的症状类型。

还需要指出的是，终端设备101、102、103中也可以安装有用于信息分类的应用，在满足计算力要求的基础上，终端设备101、102、103也完全可以完成对症状描述信息的处理并得到症状类型。此时，用于信息分类的方法也可以仅由终端设备101、102、103执行，相应地，用于信息分类的装置也可以设置于终端设备101、102、103中。此时，示例性系统架构100也可以不包括服务器105和网络104。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供信息分类服务)，也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本申请的用于信息分类的方法的一个实施例的实现流程200，包括以下步骤：

步骤201，获取症状描述信息，并从症状描述信息中提取得到症状实体。

在本实施例中，用于信息分类的方法的执行主体(例如图1所示的服务器105)可以从本地或非本地的存储设备(例如图1所示的终端设备101、102、103)获取症状描述信息。本地的存储设备可以为设置在上述执行主体内的一个数据存储模块，在此情况下，症状描述信息只需要通过本地读取即可获取到；非本地的存储设备还可以为其它专用于存储症状描述信息的另一数据存储服务器，在此情况下，上述执行主体可以通过向该数据存储服务器发送症状描述信息获取命令来获取由数据存储服务器返回的症状描述信息。

其中，症状描述信息是指包含病人主诉信息、病人经医学检测设备对病情的检测信息等在内的信息集合，根据实际应用场景的不同，症状描述信息也可以包含一些因特殊要求存在的信息类型，例如日期、历史就医次数等等；症状实体是指可直接在症状描述信息中引用或间接总结出的“关键词”或“梗概”，可以简短的标识较长症状描述信息所表示的真实含义，便于理解、总结和下结论，例如在如“腰腿疼痛半年”这句症状描述信息中，就可以提取出“腰痛”和“腿痛”的两个症状实体。

本步骤之所以要由上述执行主体从症状描述信息中提取出症状实体，是因为病人对自身情况认知的不到位和表述的差异性，症状描述信息中存在较多可能对真实病情起掩饰作用的信息，从而干扰确定出的症状类型的准确性，因此，本步骤通过对症状描述信息进行症状实体提取操作，得到了作为“关键词”或“梗概”的症状实体，从而可尽可能的通过“去粗取精”得到可提升后续确定出的症状类型准确性的描述信息。

具体的，可以利用NLU(Natural Language Understanding，自然语言理解，研究用电子计算机模拟人的语言交际过程，使计算机能理解和运用人类社会的自然语言，实现人机之间的自然语言通信，以代替人的部分脑力劳动，包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理)工具从以文本形式表示的症状描述信息中解析出多种类型的症状实体，其中对于诊断来说起到关键影响的有：症状、异常体征、检验结果提示、检查所见和手术，当然也可以将其它对诊断起到关键影响的信息解析为症状实体。在解析过程中，为便于上述执行主体对其进行处理，还可以对症状描述文本采用分字的策略，并对每一个字随机初始化对应的字向量，从而将其抽象为便于上述执行主体识别并处理的字向量形式。

为进一步提升提取出的症状实体的准确性，考虑到症状描述信息中往往存在书写错误和NLU工具识别错误的情况，从而导致错误信息影响后续处理，因此可按照多种方式对通过分词方式初步提取出的初始实体进行过滤，例如结合历史数据中各实体出现的频率，也可以按照该实体的有效性进行判别等等。一种按出现词频进行排序、去除结合历史诊断信息中提取出的症状实体确认属于低频的部分症状的实体的实现方式可通过如下步骤实现：

从症状描述信息中提取得到初始实体；

去除出现频次低于预设频次的初始实体，得到实体。

其中，该预设频次可根据历史数据总结设定得到，也可以根据专业技术人员结合自身经验给出，此处不做具体限定，具体数值也应根据实际应用场景的不同具体得到。

在一些实施例中，症状描述信息可以经病人通过各种渠道上传或主动采集到后集中存放在数据库中。在此场景下，上述执行主体可以从数据库中获取症状描述信息。在另外一些未事先存储的实施例中，症状描述信息可由用户经由其所使用的终端设备实施传输给上述执行主体。

步骤202，将症状描述信息中的主诉信息作指导，计算症状实体的第一注意力权值。

在步骤201的基础上，本步骤旨在由上述执行主体计算提取出的各症状实体的注意力权值(为区分对后续其它名词计算出的注意力权值，本申请后续将统一使用第一注意力权值表示对症状实体计算出的注意力权值)，指导计算第一注意力权值的参数为症状描述信息中的主诉信息，主诉信息为由病人直接对自身症状给出的描述信息，根据其存在方式的不同，可分为文字类型、图像类型以及文字图像结合类型。

应当理解的是，从症状描述信息中往往能够提取出多个症状实体，为了省事或者简便，往往存在将多个症状实体设置处于相同地位的现象，但实际情况却并非如此，不同的症状实体往往应该在用于确定对应的症状类型时起到不同重要程度的影响或作用，例如症状描述信息中多处提及腰痛，而仅有一处提及腿痛，在排除其他复杂因素的影响下，“腰疼”这一症状实体的注意力权值应明显高于“腿痛”这一注意力权值，并基于注意力权值的不同给出相应的症状类型确定结果。

基于此，本步骤由上述执行主体将症状描述信息中拥有较明显偏向性的主诉信息作为指导，来计算提取出的各症状实体的注意力权值。

一种包括但不限于的实现方式包括：

从症状描述信息中分离出主诉信息；

利用双向长短期记忆网络处理主诉信息，得到主诉向量；

利用主诉向量作指导，计算与症状实体对应的症状实体向量的第一注意力权值。

其中，由于主诉信息本就是构成症状描述信息中的一部分，因此只需要分离即可得到；由于主诉字段一般比较短，且需要能有一个综合上下文语境的能描述患者大致病情的关键信息，所以该实现方式优选了双向长短期记忆网络，双向长短期记忆网络是一种不仅可结合上文语境也可以结合下文语境的长短期记忆网络(Long Short-Term Memory，LSTM，一种时间递归神经网络，适合于处理和预测时间序列中间隔和延迟相对较长的重要事件)，当然，也可以采用其它可起到相同或类似效果的其它网络模型；之所以要以向量形式进行后续第一注意力权利要求的计算，是因为以文字或图像形式存在的主诉信息不便于进行后续处理，向量形式更便于编码为计算机可识别的内容，当然，也可以将其转换为其它便于计算机识别的形式，此处给出的向量形式均作为一种示例性形式。

步骤203，根据第一注意力权值对症状实体进行加权计算，得到症状实体特征。

在步骤202的基础上，本步骤旨在由上述执行主体根据计算出的各第一注意力权值对相应的症状实体通过加权计算法进行加权计算，从而得到症状实体特征，以使与病人病情关联紧密的症状实体在后续计算中发挥更大的作用。

步骤204，根据症状实体特征确定与症状描述信息对应的症状类型。

在步骤203的基础上，本步骤旨在由上述执行主体根据得到的根据症状实体特征确定与症状描述信息对应的症状类型。

具体的，本步骤由上述执行主体在根据症状实体特征确定与症状描述信息对应的症状类型时，可利用预先构建好的全连接层实现。全连接层初见于卷积神经网络，起到“分类器”的作用，如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话，本步骤中预先构建好的全连接层的作用为通过存在的映射关系确定症状实体特征对应的症状类型。

应当理解的是，基于提取出的多个症状实体，即使通过基于主诉信息的指导进行的第一注意力权值计算和加权处理，最终确定出的往往也是多个不同的症状类型，但基于上述进行的注意力权值计算，还可以通过全连接层输出每个症状类型的准确率得分(或称概率)，并对输出的各准确率得分按照一定的规律(例如将得分按照从高到低的方式，得分越高表示越准确)进行排序，以便于将此结果作为更富有参考性的参考信息提供给医生来得到最终的症状类型诊断结果。

本申请实施例提供的用于信息分类的方法，在获取症状描述信息后，从该症状描述信息中提取得到症状实体；然后，将该症状描述信息中的主诉信息作指导，计算该症状实体的第一注意力权值；之后，根据该第一注意力权值对该症状实体进行加权计算，得到症状实体特征；最后，根据该症状实体特征确定与该症状描述信息对应的症状类型。区别于现有技术，本申请在根据症状描述信息确定症状类型的基础上，还从症状描述信息中提取出症状实体，并基于包含有关键信息的主诉信息作为指导，对提取出的症状实体进行了注意力权值的计算，从而能够更加准确的确定出不同症状实体的优先级，以便根据相对准确的症状实体的优先级排序提升确定出真实症状类型的概率。同时，由于症状实体在整个过程的参与，使得最终得到的症状类型与最初获取到的症状描述信息之间建立了准确的过渡关联关系，具有更强的可解释性。

同时，相比于现有技术使用的极其依赖人工介入的基于传统机器学习算法，本方案可以尽可能的减少人工的介入，提升了整体的效率。

在上述实施例的基础上，本申请还通过图3提供了另一种用于信息分类的方法的流程300，在流程200的基础上，还通过从症状描述信息提取出于症状实体相关的辅助信息，并通过计算各辅助信息的注意力权值，以期通过更多的信息提升确定出的症状类型的准确性，包括如下步骤：

步骤301，获取症状描述信息，并从症状描述信息中提取得到症状实体。

步骤302，将症状描述信息中的主诉信息作指导，计算症状实体的第一注意力权值。

步骤303，根据第一注意力权值对症状实体进行加权计算，得到症状实体特征。

以上步骤301-306与如图2所示的步骤201-203一致，相同部分内容请参见上一实施例的相应部分，此处不再进行赘述。

步骤304，从症状描述信息中提取得到与症状实体相关的辅助信息。

本步骤旨在由上述执行主体从症状描述信息中提取得到与症状实体相关的辅助信息，辅助信息是指一些描述症状实体的对于诊断来讲也起着非常关键的作用的信息，比如从“咳嗽三天”和“咳嗽一个月”中均可以提取出症状实体“咳嗽”，但是三天可能对应的诊断是上呼吸道感染，而一个月可能对应的是肺炎。此外，通过辅助信息的提取还可以在一定程度上弥补实体提取过程中出现的漏提取的现象。

步骤305，将症状实体特征作为指导，计算辅助信息的第二注意力权值。

在步骤304的基础上，本步骤旨在由上述执行主体计算提取出的各辅助信息的注意力权值(为区分第一注意力权值，本申请后续将统一使用第二注意力权值表示对辅助信息计算出的注意力权值)，指导计算第二注意力权值的参数为提取出的症状实体，因为辅助信息与症状实体为相关关系，辅助信息为依附于症状实体存在的细节描述信息。同理，本步骤进行的第二注意力权值的计算，也是为了尽可能的区分不同辅助信息对相同症状实体的影响程度。

一种包括但不限于的实现方式包括：

利用多通道卷积神经网络从症状描述信息中提取得到与症状实体相关的辅助信息。

由于全部辅助信息可能存在于症状描述信息的任何位置，而症状描述信息长度比较长，且在这一个阶段重在提取关键的细节特征，因此此处使用多通道的卷积神经网络模型来尽可能的提升辅助信息的提取能力。相较于单通道的卷积神经网络模型，多通道能够使其具有更佳的分析和处理能力，更适合本申请对辅助信息的提取场景。

步骤306，利用第二注意力权值对辅助信息进行加权，得到症状实体辅助特征。

本步骤实现原理与步骤303相同，可参照对应部分内容对加权方式的解释说明，最终得到的症状实体辅助特征的作用为：使与病人病情关联紧密的症状实体能够更准确的表述，以期其在后续计算中发挥更大的作用。

步骤307，根据症状实体特征和症状实体辅助特征确定与症状描述信息对应的症状类型。

区别于流程200中的步骤304，本流程300由于步骤305、306对辅助信息进行的相关操作，使得在最终确定与症状描述信息对应的症状类型时，可根据症状实体特征和症状实体辅助特征共同进行，从而依靠增加的症状实体辅助特征提升最终确定出的症状类型的准确性。

进一步的，病人的包含年龄、性别、生理特征在内的个人信息在某些情况下，也可能会影响最终确定出的症状类型，同时，个人信息也可以作为建档保存的信息，便于后续再次找到该病人的历史信息。因此，步骤307还可以在增加基于病人的个人信息生成的个人信息特征的情况，同时基于三种特征来确定出与症状描述信息对应的症状类型，在进一步提升准确率的同时，以便于后续定位和追溯。

一种包括但不限于的实现方式可通过如下步骤实现：

获取症状描述信息所属病人的个人信息，并根据个人信息生成个人信息特征；

将症状实体特征、症状实体辅助特征以及个人信息特征均以向量形式进行拼接，得到拼接后向量；

利用预设的全连接层输出拼接后向量对应的症状类型。

为加深理解，本申请还结合一个具体的症状描述信息，通过将具体的症状描述信息输入预先构建出的一个双向注意力机制模型给出了一种具体的实现方案，请参见如图4所示的流程示意图。

该症状描述信息为：主诉：腰腿痛半年；现病史：半年来患者感腰腿痛，以右侧明显，伴右下肢麻木疼痛；辅助检查：腰椎MRI(Magnetic Resonance Imaging，磁共振成像)见腰4/5椎间盘突出；体格检查：左小腿外侧皮肤感觉稍减退。

通过对该症状描述信息进行实体提取，可得到如下症状实体：“腰痛”、“腿痛”以及“腰4/5椎间盘突出”。

为便于双向注意力机制模型对信息的处理，首先需要对症状描述信息中的各部分和提取出的症状实体进行编码化处理：

首先是对症状描述信息中的主诉进行编码，由于主诉字段一般比较短，且需要能有一个综合上下文语境的能描述患者大致病情的整体编码结果，所以在这里选用了双向长短期记忆网络。用{w₁,…,w_N}来表示输入的主诉字向量序列，对应输出的隐藏层表示为：

hⁱ＝BiLSTM(w_i)

其中，w表示与主诉对应的主诉向量，w_i为第i个主诉对应的主诉向量，BiLSTM为双向长短期记忆网络的英文缩写，在公式中指代使用双向长短期记忆网络对主诉向量进行处理，hⁱ为w_i经双向长短期记忆网络处理后得到的隐藏层输出；字向量的维度为100，隐藏层维度也是100。然后通过平均加权的方式，得到主诉的整体向量h^c表示，如下：

其中，N为主诉向量w的总个数，主诉的向量表示代表的是对患者病情的基本描述，接下来，利用它作指导来计算提取出的症状实体的注意力权值，用f₁,…,f_M来表示症状实体的向量表示集合，其中，f表示与症状实体对应的症状实体向量，权值计算的公式如下所示：

其中，tanh表示tanh激活函数，f_j表示第j个症状实体向量，W^f和b^f表示对症状实体向量与主诉向量融合表示时的网络参数，表示主诉向量和第j个症状实体向量的拼接表示。u_l表示融合了主诉信息的症状实体向量编码，l是为了标示对u_j进行累加计算时用的一个累加符号，v^f表示症状实体注意力权重计算时的网络参数，α_j表示计算得到的症状实体注意力权重，exp表示以自然常数e为底的指数函数。

这样，就可以通过症状实体的注意力权值对症状描述信息中的全部症状实体进行加权求和，使得与病情关联紧密的症状实体在后续计算中发挥更大的作用，得到症状实体特征h^f表示如下：

上述过程被称为双向注意力机制中的主诉信息指导下的症状实体注意力权值计算。

接下来，还需要对包括主诉在内的症状描述信息的文本整体进行编码，之所以需要进行这一步操作，主要有两个原因：(1)可能会存在一些漏召回现象，导致症状描述信息当中一些关键实体无法被召回；(2)症状描述信息中也存在很多对症状实体进行描述的对于诊断来说也起着非常关键作用的辅助信息，比如咳嗽三天和咳嗽一个月这两段文本提取出的实体都是咳嗽，但是三天可能对应的诊断是上呼吸道感染，而一个月可能对应的是肺炎。所以对症状描述信息的全文本进一步编码解析是非常有必要的，由于全部文本长度比较长，且在这一个阶段重在提取关键的细节特征，所以在对全文本解析阶段使用多通道的卷积神经网络模型：

选择使用了三个通道，分别包含了N个长度为3、4、5的卷积核，针对不同长度的卷积核长度我们对应的将文本进行相应的padding(填充)策略，以使得卷积结果保持相同的维度。

对于一个长度为m的卷积核来说，具体的卷积c_i计算方式如下：

c_i＝Relu(w·x_i:i+m-1+b)

其中，x_i表示症状描述信息的文本中第i个元素对应的向量，i:i+m-1表示长度为m的卷积核，Relu表示Relu激活函数，w和b分别为卷积核对应的参数，c_i表示基于i:i+m-1表示长度为m的卷积核计算出来的第i个卷积；这样经过多个卷积核的卷积操作之后，可以得到一个由卷积特征向量构成的集合c：

c＝[c₁,c₂,…,c_3N]

由于对于症状描述信息的全文本解析主要是为了获取与症状实体相关的辅助信息，所以用之前得到的症状实体特征去给这些辅助特征向量计算注意力权值，目的是提取出全文本当中对于提取出来的症状实体来说关键的辅助信息特征。

具体的计算方式如下：

其中，p为tanh激活函数中的参数，同样，对卷积特征向量进行注意力权值加权求和tanh表示tanh激活函数，z_i表示第i个辅助信息特征向量，W^p和b^p表示对辅助信息向量与症状实体向量融合表示时的网络参数，表示症状实体向量和第i个辅助信息特征向量的拼接表示。z_l表示融合了症状实体向量的辅助信息特征编码，l是为了标示对z_i进行累加计算时用的一个累加符号，v^p表示症状实体辅助特征注意力权重计算时的网络参数，β_i表示计算得到的症状实体辅助特征的注意力权重，exp表示以自然常数e为底的指数函数，得到症状实体辅助特征h^t，表示为：

上述过程被称为双向注意力机制下的症状实体指导的辅助信息注意力权值计算。这样，就可以实现综合利用症状描述信息当中的实体特征和辅助特征进行疾病的自动诊断任务。

除此之外，还将患者的个人信息进行特征编码，生成对应的患者个人信息特征向量，在模型的最后一层将上述三个向量：症状实体特征向量、症状实体辅助特征向量和患者个人信息特征向量进行拼接，然后经过全连接层，得到对应的诊断疾病空间中的每个疾病对应的分数。在实际应用场景当中，将分数高的疾病在诊断过程中推荐给医生，给医生对病情的判断起到一个很好的辅助作用。

经过如图4所示的流程示意图的处理，双向注意力机制模型经输出两个供参考的症状类型，分别为腰椎间盘突出和腿部肌肉萎缩，其中，腰椎间盘突出的准确率为65％，腿部肌肉萎缩的准确率为25％。应当理解的是，精准的疾病诊断系统可以提前预测患病的可能性，并提醒患者尽早的开展针对性的检查和治疗，避免病情的恶化。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种用于信息分类的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的用于信息分类的装置500可以包括：症状实体提取单元501、第一注意力权值计算单元502、症状实体加权计算单元503和症状类型确定单元504。其中，症状实体提取单元501，被配置成获取症状描述信息，并从症状描述信息中提取得到症状实体；第一注意力权值计算单元502，被配置成将症状描述信息中的主诉信息作指导，计算症状实体的第一注意力权值；症状实体加权计算单元503，被配置成根据第一注意力权值对症状实体进行加权计算，得到症状实体特征；症状类型确定单元504，被配置成根据症状实体特征确定与症状描述信息对应的症状类型。

在本实施例中，用于信息分类的装置500中：症状实体提取单元501、第一注意力权值计算单元502、症状实体加权计算单元503和症状类型确定单元504的具体处理及其所带来的技术效果可分别参考图2对应实施例中的步骤201-204的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，用于信息分类的装置500还可以包括：辅助信息提取单元，被配置成在根据症状实体特征确定与症状描述信息对应的症状类型之前，从症状描述信息中提取得到与症状实体相关的辅助信息；第二注意力权值计算单元，被配置成将症状实体特征作为指导，计算辅助信息的第二注意力权值；辅助信息加权计算单元，被配置成利用第二注意力权值对辅助信息进行加权，得到症状实体辅助特征；对应的，症状类型确定单元504包括：双特征确定症状类型子单元，被配置成根据症状实体特征和症状实体辅助特征确定与症状描述信息对应的症状类型。

在本实施例的一些可选的实现方式中，第一注意力权值计算单元502可以进一步被配置成：从症状描述信息中分离出主诉信息；利用双向长短期记忆网络处理主诉信息，得到主诉向量；利用主诉向量作指导，计算与症状实体对应的症状实体向量的第一注意力权值。

在本实施例的一些可选的实现方式中，辅助信息提取单元可以进一步被配置成：利用多通道卷积神经网络从症状描述信息中提取得到与症状实体相关的辅助信息。

在本实施例的一些可选的实现方式中，用于信息分类的装置500还可以包括：个人信息特征获取单元，被配置成在根据症状实体特征和症状实体辅助特征确定与症状描述信息对应的症状类型之前，获取症状描述信息所属病人的个人信息，并根据个人信息生成个人信息特征；

对应的，该双特征确定症状类型子单元可以进一步被配置成包括：

利用预设的全连接层输出拼接后向量对应的症状类型。

在本实施例的一些可选的实现方式中，用于信息分类的装置500还可以包括：准确度得分输出单元，被配置成当与拼接后向量对应有多个症状类型时，利用全连接层输出每个症状类型的准确度得分；排序单元，被配置成根据准确度得分对多个症状类型进行排序。

在本实施例的一些可选的实现方式中，症状实体提取单元501可以进一步被配置成：从症状描述信息中提取得到初始实体；去除出现频次低于预设频次的初始实体，得到实体。

本实施例作为对应于上述方法实施例的装置实施例存在，本实施例提供的用于信息分类的装置在根据症状描述信息确定症状类型的基础上，还从症状描述信息中提取出症状实体，并基于包含有关键信息的主诉信息作为指导，对提取出的症状实体进行了注意力权值的计算，从而能够更加准确的确定出不同症状实体的优先级，以便根据相对准确的症状实体的优先级排序提升确定出真实症状类型的概率。同时，症状实体在整个过程的参与，使得最终得到的症状类型与最初获取到的症状描述信息之间建立了准确的过渡关联关系，具有更强的可解释性。相比于现有技术使用的极其依赖人工介入的基于传统机器学习算法，本方案可以尽可能的减少人工的介入，提升了整体的效率。

根据本申请的实施例，本申请还提供了一种电子设备和一种计算机可读存储介质。

如图6所示，是根据本申请实施例的用于信息分类的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图6所示，该电子设备包括：一个或多个处理器601、存储器602，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图6中以一个处理器601为例。

存储器602即为本申请所提供的非瞬时计算机可读存储介质。其中，存储器存储有可由至少一个处理器执行的指令，以使至少一个处理器执行本申请所提供的用于信息分类的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的用于信息分类的方法。

存储器602作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的用于信息分类的方法对应的程序指令/模块(例如，附图5所示的症状实体提取单元501、第一注意力权值计算单元502、症状实体加权计算单元503和症状类型确定单元504)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的用于信息分类的方法。

存储器602可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储用于信息分类的电子设备在使用时所创建的各类数据等。此外，存储器602可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器602可选包括相对于处理器601远程设置的存储器，这些远程存储器可以通过网络连接至用于信息分类的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

用于信息分类的电子设备还可以包括：输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接，图6中以通过总线连接为例。

输入装置603可接收输入的数字或字符信息，以及产生用于信息分类的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，在根据症状描述信息确定症状类型的基础上，还从症状描述信息中提取出症状实体，并基于包含有关键信息的主诉信息作为指导，对提取出的症状实体进行了注意力权值的计算，从而能够更加准确的确定出不同症状实体的优先级，以便根据准确的症状实体的优先级排序提升确定出真实症状类型的概率。同时，症状实体在整个过程的参与，使得最终得到的症状类型与最初获取到的症状描述信息之间建立了准确的过渡关联关系，具有更强的可解释性。相比于现有技术使用的极其依赖人工介入的基于传统机器学习算法，本方案可以尽可能的减少人工的介入，提升了整体的效率。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种用于信息分类的方法，包括：

获取症状描述信息，并从所述症状描述信息中提取得到症状实体；

从所述症状描述信息中分离出主诉信息；

利用双向长短期记忆网络处理所述主诉信息，得到主诉向量；

利用所述主诉向量作指导，计算与所述症状实体对应的症状实体向量的第一注意力权值；

根据所述第一注意力权值对所述症状实体进行加权计算，得到症状实体特征；

利用多通道卷积神经网络从所述症状描述信息中提取得到与所述症状实体相关的辅助信息；

将所述症状实体特征作为指导，计算所述辅助信息的第二注意力权值；

利用所述第二注意力权值对所述辅助信息进行加权，得到症状实体辅助特征；根据所述症状实体特征和所述症状实体辅助特征确定与所述症状描述信息对应的症状类型。

2.根据权利要求1所述的方法，其中，在根据所述症状实体特征和所述症状实体辅助特征确定与所述症状描述信息对应的症状类型之前，还包括：

获取所述症状描述信息所属病人的个人信息，并根据所述个人信息生成个人信息特征；

对应的，根据所述症状实体特征和所述症状实体辅助特征确定与所述症状描述信息对应的症状类型，包括：

将所述症状实体特征、所述症状实体辅助特征以及所述个人信息特征均以向量形式进行拼接，得到拼接后向量；

利用预设的全连接层输出所述拼接后向量对应的症状类型。

3.根据权利要求2所述的方法，其中，当与所述拼接后向量对应有多个症状类型时，还包括：

利用所述全连接层输出每个所述症状类型的准确度得分；

根据所述准确度得分对多个所述症状类型进行排序。

4.根据权利要求1至3任一项所述的方法，其中，从所述症状描述信息中提取得到症状实体，包括：

从所述症状描述信息中提取得到初始实体；

去除出现频次低于预设频次的初始实体，得到所述实体。

5.一种用于信息分类的装置，包括：

症状实体提取单元，被配置成获取症状描述信息，并从所述症状描述信息中提取得到症状实体；

主诉信息分离单元，被配置成从所述症状描述信息中分离出主诉信息；

主诉信息处理单元，被配置成利用双向长短期记忆网络处理所述主诉信息，得到主诉向量；

第一注意力权值计算单元，被配置成利用所述主诉向量作指导，计算与所述症状实体对应的症状实体向量的第一注意力权值；

症状实体加权计算单元，被配置成根据所述第一注意力权值对所述症状实体进行加权计算，得到症状实体特征；

辅助信息提取单元，被配置成利用多通道卷积神经网络从所述症状描述信息中提取得到与所述症状实体相关的辅助信息；

第二注意力权值计算单元，被配置成将所述症状实体特征作为指导，计算所述辅助信息的第二注意力权值；

辅助信息加权计算单元，被配置成利用所述第二注意力权值对所述辅助信息进行加权，得到症状实体辅助特征；症状类型确定单元，被配置成根据所述症状实体特征和所述症状实体辅助特征确定与所述症状描述信息对应的症状类型。

6.根据权利要求5所述的装置，还包括：

个人信息特征获取单元，被配置成在根据所述症状实体特征和所述症状实体辅助特征确定与所述症状描述信息对应的症状类型之前，获取所述症状描述信息所属病人的个人信息，并根据所述个人信息生成个人信息特征；

对应的，所述症状类型确定单元进一步被配置成包括：

利用预设的全连接层输出所述拼接后向量对应的症状类型。

7.根据权利要求6所述的装置，还包括：

准确度得分输出单元，被配置成当与所述拼接后向量对应有多个症状类型时，利用所述全连接层输出每个所述症状类型的准确度得分；

排序单元，被配置成根据所述准确度得分对多个所述症状类型进行排序。

8.根据权利要求5至7任一项所述的装置，其中，所述症状实体提取单元进一步被配置成：

从所述症状描述信息中提取得到初始实体；

去除出现频次低于预设频次的初始实体，得到所述实体。

9.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任一项所述的用于信息分类的方法。

10.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的用于信息分类的方法。