CN110111885B

CN110111885B - 属性预测方法、装置、计算机设备及计算机可读存储介质

Info

Publication number: CN110111885B
Application number: CN201910386448.4A
Authority: CN
Inventors: 乔治; 葛屾; 晏阳天; 王锴; 吴贤; 范伟
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-05-09
Filing date: 2019-05-09
Publication date: 2023-09-19
Anticipated expiration: 2039-05-09
Also published as: EP3968337A1; WO2020224433A1; US20210406687A1; JP2022530868A; EP3968337A4; CN110111885A; JP7191443B2; KR20210113336A; KR102725608B1

Abstract

本发明公开了一种属性预测方法、装置、计算机设备及计算机可读存储介质，属于数据预测技术领域。所述方法通过基于表示检测特征历史和未来的变化规律的规律特征，确定出目标对象的全局特征，并对全局特征进行细化，以得到目标对象的至少一个局部特征，那么，细化后的局部特征更能体现目标对象的特点，进而根据局部特征预测目标对象的属性，可以提高预测的属性的精度，当目标对象的属性为预测的诊断结果时，则可以提高预测的诊断结果的精度。

Description

属性预测方法、装置、计算机设备及计算机可读存储介质

技术领域

本发明涉及数据预测技术领域，特别涉及一种属性预测方法、装置、计算机设备及计算机可读存储介质。

背景技术

EHR(electronic health records，电子健康记录)数据可以记录目标对象每一次的问诊记录，随着技术的发展，越来越多的临床诊断估计模型可以基于患者的EHR数据，模拟医生的诊断过程，以对用户未来的发病情况进行预测。

例如，将EHR数据中的医疗编码数据作为患者的属性，且输入至临床诊断估计模型中，临床诊断估计模型进行对医疗编码数据进行训练，可以输出预测的诊断结果，临床诊断估计模型进行对医疗编码数据进行训练的过程，也即是，临床诊断估计模型模拟医生的诊断过程，从而可以根据预测的诊断结果，来对患者未来的发病情况进行预测。

在上述诊断预测过程中，临床诊断估计模型输入的是医疗编码数据，由于医疗编码数据包括成千上种疾病的数据，对于一位患者而言，仅有可能患有其中的一种或者几种疾病，并不可能患有各种各样的疾病，因此，导致医疗编码数据内有用数据在医疗编码数据中分布比较稀疏且离散，并且医疗编码数据仅能表示患者患有的疾病，并不能表示患者整个的身体状态，那么，临床诊断估计模型对这样的医疗编码数据进行训练后，输出的预测的诊断结果精确度低。

发明内容

本发明实施例提供了一种属性预测方法、装置、计算机设备及计算机可读存储介质，能够解决临床诊断估计模型预测的诊断结果精确度低的问题。所述技术方案如下：

一方面，提供了一种属性预测方法，所述方法包括：

根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征；

将所述检测特征输入第一神经网络，通过所述第一神经网络分别对所述检测特征中各个时序上的检测特征进行反向时序计算和正向时序计算，输出第一规律特征和第二规律特征，所述第一规律特征用于表示所述检测特征的历史变化规律，所述第二规律特征用于表示所述检测特征的未来变化规律；

基于所述第一规律特征和第二规律特征，获取所述目标对象的全局特征；

将所述全局特征输入第二神经网络，通过所述第二神经网络逐级提取所述目标对象的细节，输出所述目标对象的至少一个局部特征；

基于所述目标对象的至少一个局部特征，对所述目标对象的属性进行预测。

另一方面，提供了一种属性预测装置，所述装置包括：

获取模块，用于根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征；

计算模块，用于将所述检测特征输入第一神经网络，通过所述第一神经网络分别对所述检测特征中各个时序上的检测特征进行反向时序计算和正向时序计算，输出第一规律特征和第二规律特征，所述第一规律特征用于表示所述检测特征的历史变化规律，所述第二规律特征用于表示所述检测特征的未来变化规律；

所述获取模块，还用于基于所述第一规律特征和第二规律特征，获取所述目标对象的全局特征；

提取模块，用于将所述全局特征输入第二神经网络，通过所述第二神经网络逐级提取所述目标对象的细节，输出所述目标对象的至少一个局部特征；

预测模块，用于基于所述目标对象的至少一个局部特征，对所述目标对象的属性进行预测。

另一方面，提供了一种计算机设备，该计算机设备包括：处理器；用于存放计算机程序的存储器；其中，该处理器用于执行存储器上所存放的计算机程序，实现上述属性预测方法所执行的操作。

另一方面，提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，该计算机程序被处理器执行时实现上述属性预测方法所执行的操作。

本发明实施例提供的技术方案带来的有益效果是：

通过基于表示检测特征历史和未来的变化规律的规律特征，确定出目标对象的全局特征，并对全局特征进行细化，以得到目标对象的至少一个局部特征，那么，细化后的局部特征更能体现目标对象的特点，进而根据局部特征预测目标对象的属性，因此，可以提高预测的属性的精度，当目标对象的属性为预测的诊断结果时，则可以提高预测的诊断结果的精度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种实施环境的示意图；

图2是本发明实施例提供的一种属性预测方法的流程图；

图3是本发明实施例提供的一种诊断估计模型的示意图；

图4是本发明实施例提供的一种属性预测装置的结构示意图；

图5是本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种实施环境的示意图。参见图1，该环境包括属性预测系统100，该属性预测系统包括预处理模块101，检测特征提取模块102、规律特征提取模块103以及预测模块104。

其中，预处理模块101，用于处理目标对象的检测数据以及检测数据对应的属性，具体将用户的检测数据以及检测数据对应的属性转化为检测特征提取模块102可以进行计算的数据。

检测特征提取模块102，用于提取检测数据的特征和检测数据对应的属性的混合特征，提取出的混合特征可以作为目标对象检测特征。具体地，检测特征提取模块102可以先基于预处理模块101处理后的数据，提取属性的特征以及检测数据的特征，然后，将提取到的属性的特征以及检测数据的特征进行拼接，最后，检测特征提取模块102基于拼接结果，提取检测特征。

规律特征提取模块103，用于提取规律特征以及生成目标对象的全局特征，该规律特征用于表示检测特征的全局变化规律，具体地，规律特征提取模块103可以先提取基于检测特征提取模块102提取到的检测特征的历史变化规律和未来变化规律，然后，规律特征提取模块103可以基于检测特征的历史变化规律和未来变化规律，获取检测特征的全局变化规律，最后根据代表全局变化规律的规律特征，确定目标对象的全局特征。

预测模块104，用于预测目标对象的属性，具体地，预测模块104可以通过神经网络对规律特征提取模块103生成的全局特征进行细化进，得到目标对象的局部特征，然后，预测模块104使用目标局部特征集中表达获取的多个局部特征进行集中，最后，预测模块104基于目标局部特征对目标对象的属性进行预测。

需要说明的是，该属性预测系统100中的各个模块的功能可以用一个计算机设备来实现，也可以用多个计算机设备来实现，本发明实施例实现各个模块的功能的计算机设备的数量不做具体限定。

图1介绍了属性预测系统中的各个模块的各自功能，为了体现属性预测系统进行属性预测的具体过程，参见图2，图2是本发明实施例提供的一种属性预测方法的流程图。参见图2，该实施例包括：

201、计算机设备根据目标对象的检测数据以及该检测数据对应的属性，获取该目标对象的检测特征。

该计算机设备可以是任一计算机设备。目标对象可以是任一个用户。

目标对象的检测数据可以包括目标对象历史每次检测的检测数据，每次检测的检测数据对应一个检测时间，因此，每次检测的检测数据可以包括与该目标对象有关的多种类型的数据，以检测目标对象的体征为例，一次检测到的数据心跳数据、血压数据等类型的数据，对于任一类型的数据而言，每一次检测，可能检测出很多个数据，一次检测出的多个数据可以组成一个和这一次检测时间有关的时序序列，因此，一个检测时间可能对应多个时序序列，可以为每种类型的时序序列进行标号，以区分一个检测时间上的多中类型的检测数据。需要说明的是，本发明实施例对检测时间不做具体限定，对两个检测时间之间的时间间隔不做具体限定。

那么，当该检测数据为目标对象的体征数据时，该检测数据可以是EHR数据内存储的时序数据，该时序数据包括目标对象每次问诊的问诊时间，以及在每个问诊时间上检测的目标对象的体征数据，可以理解的是，该问诊时间也即是检测时间。

一个属性用于指示目标对象的至少一个状态，该属性的每个位置对应一个状态，可以用状态标识表示该目对象是否具有对应的状态，该状态标识可以包括第一状态标识和第二状态标识，其中，该第一状态标识用于表示目标对象具有对应的状态，该第二状态标识用于表示目标对象不具有对应的状态，例如，当该属性内的任一位置上具有第一状态标识时，则说明目标对象具有该位置对应的状态，当该属性内的任一位置上具有第二状态标识时，则说明目标对象不具有该位置对应的状态。可以使用不同的字符串来表示第一状态标识和第二状态标识，本发明实施例对表示该第一状态标识或第二状态标识的字符串不做具体限定。

当每对目标对象进行一次检测后，会得到本次检测数据，基于本次的检测数据，可以确定目标对象的属性，因此，一个属性对应一个检测时间，而该目标对象的检测数据包括至少一个检测时间，则该目标对象的检测数据对应至少一个属性。

该至少一个状态可以为目标对象的患病状态，还可以为其他状态，本发明实施例对该至少一个状态不做具体限定。当该目标对象的状况为患病状态时，该检测数据对应的属性可以是医疗编码数据，一个医疗编码数据可以由0和1组成，在医疗编码数据中的每一个位置对应一个疾病，当任一位置上的数据为0时，代表目标对象不患有该位置对应的疾病，当任一位置上的数据为1时，代表目标对象患有该位置对应的疾病，可以理解的是，此处的0相当于第二状态标识，此处的1相当于第一状态标识。

为了便于计算，该计算机设备可以先对目标对象的检测数据以及该检测数据对应的属性进行预处理，使得检测数据以及检测数据对应的属性符合计算要求的格式，然后在对处理后的数据进行特征提取，得到该目标对象的检测特征。在一种可能的实现方式中，本步骤201可以通过下述步骤2011-2014所示的过程来实现。

步骤2011、该计算机设备将该检测数据对应的属性输入全连接神经网络，通过该全连接神经网络筛选出该属性中的目标状态，对该目标状态进行加权处理，输出该检测数据对应的属性的特征。

由于目标对象的属性内存储有多个状态，该目标对象具有属性内的一些状态，将目标对象所具有的状态作为目标状态。

为了便于计算，计算机设备对该检测数据对应的属性进行预处理，在一种可能的实现方式中，该计算机设备可以将该检测数据对应的属性用mulit-hot(多热)向量来表示，以达到对该检测数据对应的属性进行预处理的目的。该mulit-hot向量由0和1组成，0代表目标对象不具有对应的状态，1代表目标对象具有对应的状态。

那么，该计算机设备可以将mulit-hot向量输入全连接神经网络，通过全连接网络通过编码矩阵筛选出目标对象的目标状态，并对筛选出的目标状态进行加权处理，输出该检测数据对应的属性的特征，由于对筛选出的目标状态进行加权处理，使得处理后的结果可以集中mulit-hot向量对应的属性的特征。

具体地，该全连接网络中的每个网络节点可以通过第一公式对该mulit-hot向量内的数据进行计算，该第一公式可以表示为：π_j＝ReLU(W^Tx_j+b_π)，其中，W^T为编码特征矩阵，该W^T可以是预先训练出的矩阵，也可是全神经网络计算属性的特征过程中，训练出的矩阵；x为mulit-hot向量；j为第j次检测时间的编号；x_j为第j个检测时间对应的属性的mulit-hot向量；π_j第j次检测时所对应属性的特征向量，该特征向量代表第j次检测时所对应的属性的特征，j为大于等于1的整数。

当j为目标对象总共的检测次数时，若该计算机设备通过全神经网络进行对该检测数据对应的所有属性进行计算后，可以得到检测数据所对应属性的特征π＝[π₁,...,π_j]，需要说明的是，该计算机设备除了通过全连接网络计属性的特征外，还可以通过其他神经网络计算属性的特征。

由于一个属性用于指示目标对象的至少一个状态，那么，当该属性指示的状态较多时，该计算机设备将该属性用的mulit-hot向量来表示时，则mulit-hot向量的维度可能比较高，通过筛选目标状态，可以使得属性的特征π的维度相比mulit-hot向量的维度有所降低，则本步骤201所示的过程也可以视为一个降维的过程，以便后续的计算。

步骤2012、该计算机设备将该检测数据输入时间序列分析工具，通过时间序列分析工具提取该检测数据中每一类数据在各个时序的特征，输出特征集合。

时间序列分析工具可以是HCTSA(highly comparative time-series，高度比较的时间序列分析)代码库。每一类数据在各个时序的特征可以包括表示这一类数据的数据分布、熵、缩放属性等特征，可见这些特征可以表示这一类数据的自相关结构，并且由于这些特征是基于实际的检测数据得到的，因此这些特征具有可解释性。

当该计算机设备将第j次的检测数据输入到时间序列分析工具后，时间序列分析工具可以基于预设特征提取规则，提取第j次的检测数据中每一类数据的特征其中，表示第j次检测时第k个数据类型的时序特征，z为大于1的整数，k为数据类型的编号。需要说明的是，本发明实施例对该预设特征提取规则不做具体限定。

当将这j次的检测数据都通过时间序列分析工具处理后，该时间序列分析工具将提取到的每一次检测数据的特征存储在一个特征集合最后该时间序列分析工具可以输出该特征集合，从而该计算机设备可以得到该特征集合。

由于特征集合中的特征仅可以表示这各类数据的自相关结构，并不能体现所有检测数据的特征，因此，该计算机设备还需要通过执行下述步骤2013来获取检测数据的特征。

步骤2013、该计算机设备将特征集合输入深交叉网络，通过对该特征集合内的各个时序特征进行交叉处理，输出该检测数据的特征。

DCN(deep&cross network，深交叉网络)由交叉网络和一个深度网络，该计算设备可以将特征集合分别输入至交叉网络和深度网络，通过交叉网络可以将特征集合内的多条时序特征进行交叉，输出交叉后的特征，通过深度网络提取特征集合内所有特征的普通特征。最后，将DCN输出的交叉后的特征与深度网络提取的普通特征相结合，得到该检测数据的特征.

需要说明的是，该计算设备可以先执行步骤2012和2013，再执行步骤2011，本发明实施例对步骤2011-203的执行顺序不做具体限定。

步骤2014、该计算机设备将该属性的特征以及该检测数据的特征输入深度神经网络，通过该深度神经网络提取该检测数据和该检测数据对应的属性的混合特征，输出该检测特征。

该计算机设备可以先将该属性的特征以及检测数据的特征进行拼接，得到一个拼接后的特征，然后，再将并接后的特征输入至该深度神经中。

在一种可能的实现方式，采用连接数组的函数concat()，将第j次检测时所对应属性的特征π_j和第j次检测时的检测数据的特征τ_j拼接为χ_j，则χ_j＝concat[τ_j,τ_j]，然后，将χ_j作为该深度神经网络的输入，该深度神经网中的每个节点可以根据如下第二公式对χ_j中的数据进行计算，从而使得该深度神经网络可以输出第j个检测时间上的检测特征ξ_j，该第二公式可以表示为：其中，W_x为第一权值矩阵，b_x第一偏差参数。

由于W_x每个权值用于表示χ_j中的每个元素的重要程度，通过可以实现对χ_j中的每个元素进行加权处理，进而可以集成χ_j中的元素，ReLU(rectified linear unit线性整流)函数可以较好的挖掘数据间相关特征，因此，ReLU函数表达能力比较强，使用ReLU函数对进行处理，处理后结果ξ_j可以表达χ_j所具有的特征，因此，ξ_j可以作为第j次检测的检测特征。

当将每个检测时间所对应的属性的特征以及检测数据的特征进行拼接处理，该计算机设备再通过该深度神经网络可以提取每个检测时间上的检测特征，为了便于描述，将每个检测时间上的检测特征称为子检测特征，因此，深度神经网络最终输出的检测特征包括至少一个子检测特征，该计算机设备可以按照时序将该至少一个子检测特征存储在该检测特征内，得到检测特征ξ＝[ξ₁,ξ₂,...ξ_j]，其中，ξ_j为第j个子检测特征，也即是第j个检测时间所对应的检测特征。

由于检测数据的特征与属性的特征包括有各个时序的各种类型数据的特征，因此该检测特征具有多模态，则该检测特征可以视为多模态特征。

由于检测特征是基于检测数据和检测数据对应的属性获得的，相对于仅基于检测数据获得的目标对象的特征，本发明实施例中的检测特征更能体现目标对象检测过程中的特征。并且，检测数据为实际的检测到的数据，可以作为客观依据，使得获取的检测特征具有可解释性，检测数据对应的属性为主观判断的结果，因此，基于属性和检测数据，所获取的检测特征的精度较高。

为了便于理解本步骤2011-2014所示的过程，参见图3中的多模态特征提取部分，图3是本发明实施例提供的一种诊断估计模型的示意图，在多模态特征提取部分内，可见，首先将计算机设备医疗编码数据(即是检测数据对应的属性)转换为至mulit-hot向量，将mulit-hot向量输入全连接神经网络，全连接神经网络通过计算就可以输出医疗编码数据的特征(即是属性的特征)，需要说明的是，全连接神经网络通过计算就可以输出医疗编码数据的特征过程为对医疗编码数据进行嵌入的过程。

其次，计算机设备对时序数据(即是检测数据)进行特征提取，得到特征集合，再次，计算机设备将特征集合输入至DCN，DCN输出多时序交叉混合特征(cross multipletime series feature mixture)，也即是检测数据的特征，最后，计算机设备将多时序交叉混合特征与属性特征进行混合，并基于混合后的特征，获取多模态特征(即是检测特征)。

需要说明的是，该计算机设备除了使用深度神经网络，获取检测数据的特征外，还可以采取其他神经网络，来获取检测数据的特征。

202、该计算机设备将该检测特征输入第一神经网络，通过该第一神经网络分别对该检测特征中各个时序上的检测特征进行反向时序计算和正向时序计算，得到第一规律特征和第二规律特征，该第一规律特征用于表示该检测特征的历史变化规律，该第二规律特征用于表示该检测特征的未来变化规律。

第一神经网络可以是具有注意力(attention)机制的BiRNN(bidirectionalrecurrent neural networks，双向回归神经网络)，该BiRNN可以由一个第一子网络和一个第二子网络组成，其中，第一子网络用于获取第一规律特征，第二子网络用于获取第二规律特征。

在一种可能的实现方式中，该计算机设备按照反向时序顺序，将该检测特征输入该第一神经网络的第一子网络，通过该第一子网络对该检测特征进行反向时序计算，得到该第一规律特征；按照正向时序顺序，将该检测特征输入该第一神经网络的第二子网络，通过该第一子网络对该检测特征进行正向时序计算，得到该第二规律特征。

由于检测特征内的至少一个子检测特征是按照时间顺序排序的，则该计算机设备可以按照正向时序的方式，将检测特征输入第一子网络，该计算机设备可以按照反向时序的方式，将检测特征输入至第二子网络内。

在一种可能的实现方式中，该计算机设备按照从后往前的顺序，将检测特征ξ＝[ξ₁,ξ₂,...ξ_j]中的每个子检测特征依次输入第一子网络内的输入层的节点，具体地，该计算机设备将ξ_j输入第一子网络的输入层的第一个节点，将ξ_j-1输入第一子网络的输入层的第二个节点；当该计算机设备将该检测特征输入至第一子网络后，该第一子网络可以基于第一子网络内预设的计算规则，对检测特征内的各个子特征进行计算，最终，该第一子网络可以输出该第一规律特征其中，b用于表示反向，本发明实施例对该第一子网络内预设的计算规则不做具体限定。

在一种可能的实现方式中，该计算机设备按照从前往后的顺序，将检测特征ξ＝[ξ₁,ξ₂,...ξ_j]中的每个子检测特征依次输入第二子网络内的输入层的节点输入，具体地，该计算机设备将ξ₁输入第一子网络的输入层的第一个节点，将ξ₂输入第一子网络的输入层的第二个节点；当该计算机设备将该检测特征输入至第二子网络后，该第二子网络可以基于第二子网络内预设的计算规则，对检测特征内的各个子特征进行计算，最终，该第二子网络可以输出该第二规律特征其中，f代表正向，本发明实施例对该第二子网络内预设的计算规则不做具体限定。

203、该计算机设备基于该第一规律特征和第二规律特征，获取该目标对象的全局特征。

由于检测特征的历史变化规律是由第一规律特征来表示，检测特征的未来变化规律是由第二规律特征来表示的，那么第一规律特征和第二规律特征中的任一规律特征均不能表示检测特征的全局变化规律，为了得到更为精确的目标对象的全局特征，该计算机设备可以先基于第一规律特征以及第二规律特征，获取表示检测特征的全局变化规律的规律特征，再根据这个规律特征，获取全局特征。

在一种可能的实现方式中，本步骤203可以通过下述步骤2031-2033所示的过程来实现。

步骤2031、该计算机设备将该第一规律特征和第二规律特征进行拼接，得到第三规律特征。

当第一子网络输出该第一规律特征且第二子网络输出该第二规律特征后，该计算机设备可以通过第一神经网络对第一规律特征进行拼接，得到第三规律特征h＝[h₁,...,h_j]，其中，

步骤2032、该计算机设备对该第三规律特征进行加权处理，得到第四规律特征，该第四规律特征用于表示该检测特征的全局变化规律。

该计算设备可以通过第一神经网络中的注意力机制，对第三规律特征进行加权处理。在一种可能的实现方式中，本步骤2032可以通过步骤11-14所示的过程来实现。

步骤11、该计算机设备基于注意力机制以及该第三规律特征，进行权值学习，得到至少一个第一权值，该第一权值用于指示一个检测数据与该一个检测数据对应的属性的重要程度。

其中，该第一注意力机制为该第一神经网络内的任一个注意力机制，该计算机设备可以基于该第一注意力机制中的权值学习策略，进行权值学习，该权值学习策略可以是基于位置的注意力权值学习策略，那么基于位置的注意力权值学习策略可以表示为：其中，W_τ为第二权值向量，b_τ为第二偏差参数，为第j次检测时对应的第一权值。

那么，该计算设备可以基于第三规律特征h＝[h₁,...,h_j]中的各个规律特征以及上述位置的注意力权值学习策略，进行权值学习，可以得到j个第一权值，该j个第一权值也即是至少一个第一权值。

需要说明的是，该第一注意力机制中的权值学习策略还可以是其他注意力权值学习策，本发明实施例对该第一注意力机制中的权值学习策略不做具体限定。

步骤12、该计算机设备对该至少一个第一权值进行归一化处理，得到至少一个第二权值。

由于步骤11第一权值为通过数学计算得到的值，那么，该至少一个第一权值的可能过大或者过小，为了方便计算，可以对该至少一个第一权值进行归一化处理，使得处理后得到的各个第二权值的大小适中，那么，当该至少一个第一权值的过大时，可以将该至少一个第一权值成比例的缩小，当该至少一个第一权值的过小时，可以将该至少一个第一权值成比例的放大，以实现对该至少一个第一权值的归一化处理。

由于每个第二权值仅是对一个第一权值归一化的结果，因此，第二权值和第一权值的作用一样，均用于指示一个检测数据与该一个检测数据对应的属性的重要程度。

步骤13、该计算机设备基于至少一个第二权值，对该第三规律特征进行加权处理，得到该第四规律特征。

该计算机设备将该至少一个第二权值代入第三公式，将第三公式的输出作为该第四规律特征，以实现对第三规律特征加权处理，该第三公式可以表示为其中，c为第四规律特征，为与第j次检测时对应的第二权值，M该目标对象总共的检测次数。

由于一个第二权值用于表示一个检测数据与该一个检测数据对应的属性的重要程度，通过至少一个第二权值对该第三规律特征进行加权处理，第三规律特征更加集中的表达，因此，第四规律特征可以表示检测特征的全局变化规律。

由于将对第一规律特征和第二规律特征进行了加权处理，使得第一规律特征和第二规律特征可以由第四规律特征集成表示，因此第四规律特征既能表示第一规律特征所表示的历史变化规律，也能表示第一规律特征所表示的未来变化规律，因此，第四特征规律可以表示检测特征的全局变化规律。

步骤2033、该计算机设备基于该第三规律特征和该第四规律特征，获取该全局特征。

由于相邻检测数据之间的相关性最高以及相邻的属性之间的相关性最高，为了进一步预测目标对象下一次检测时的属性，该计算机设备可以将该第三规律特征中最后一次检测时间对应的规律特征和该第四规律特征代入至第四公式中，将第四公式的输出作为该全局特征，其中，第四公式可以表示为：其中，为该全局特征，h_M为第三规律特征中目标对象最后一次检测时间对应的规律特征，[h_M,c]为h_M和c拼接后的向量，W_d为第三权值矩阵，b_d第三偏差参数。

由于第四规律特征表示检测特征的全局变化规律，第一规律特征可以表示检测特征的历史变化规律，第二规律特征可以表示检测特征的未来变化规律，因此通过对这个三个规律特征进行加权处理，得到的结果可以表示目标对象的全局特征。

204、该计算机设备将该全局特征输入第二神经网络，通过该第二神经网络逐级提取该目标对象的细节，输出该目标对象的至少一个局部特征。

该第二神经网络可以是HMCN(hierarchical multi-label classificationnetworks，分层多标签分类网络)。由于全局特征不能表示目标对象的细节，因此，可以通过第二神经网络的提取目标对象的细节，具体地，第二神经网络可以逐级提取该目标对象的细节，使得最终提取的细节可以满足用于属性预测的需求。

该第二神经网络的每一层可以输出一个该局部特征。当该计算设备将该全局特征输出该第二神经网络后，该全局特征可以从输入层一直输入至第二神经网络的输出层，该第二神经网络可以对全局特征进行逐层计算，该第二神经网络的第一目标层在计算时，可以基于第二目标层的输出数据，计算第一目标层的层级特征以及计算该目标对象在第一目标层的局部特征，其中，第一目标层为该第二神经网络的任一层，第二目标层为该第二神经网络中该第一目标层的上一层，该层级特征用于表示该全局特征在该第二神经网络的网络层中的状态，该第一目标层的层级特征由该全局特征以及该第二目标层的层级特征来决定来确定。

当该第二神经网络的第二目标层生成第二目标层的层级特征以及该目标对象在第二目标层的局部特征后，该第二目标层可以向第一目标层输出第二目标层的层级特征以及该全局特征(第二目标层的输出数据)，以便第一目标层可以接收第二目标层的层级特征以及该全局特征。那么，随着第二神经网络各个网络层输出的全局特征使得该全局特征可以输入至该第二神经网络的各个网络层。

由于第一目标层的层级特征由该全局特征以及该第二目标层的层级特征来决定来确定，那么，当第一目标层接收到第二目标层的层级特征以及该全局特征后，该第一目标层可以基于第二目标层的层级特征以及和该全局特征，计算第一目标层的层级特征。在一种可能的实现方式中，该第二神经网络第i层的层级特征可以表示为：其中，G代表全局，为第四权重矩阵，为第i-1层的层级特征，b_G为第四偏差参数，第i层可以视为第一目标层。

该第一目标层上的节点可以基于第一目标层的层级特征以及该全局特征，获取该目标对象在第一目标层上的局部特征。在一种可能的实现方式中，该目标对象在第i层的局部特征可以表示为：其中，L代表网络层，为第五权重矩阵，b_T为第五偏差参数。

由于该第二神经网络的每一层都是基于上一层的层级特征以及全局特征来进计算的，那么目标对象在第二神经网络的每一层上的局部特征都受到上一层的局部特征的影响，由于每一层的层级表达由本层的层级特征决定，所以，该第二神经网络中任一个网络层生成的局部特征可以作为下一个网络层所生成的局部特征的父级，因此，第二神经网络可以实现逐级提取该目标对象的细节。

205、该计算机设备基于该目标对象的至少一个局部特征，对该目标对象的属性进行预测。

由于一个局部特征可以代表目标对象不同级别的细节，考虑到细节较多，可以对这些进行集中处理，获取更加细节的局部特征，然后在根据这个更加细节的局部特征，进行属性预测。

在一种可能的实现方式中，本步骤205可以通过下述步骤2051-2052所示的过程来实现。

步骤2051、该计算设备对该目标对象的至少一个局部特征进行加权处理，得到目标局部特征。

该目标局部特征也即是更加细节的局部特征。计算设备可以通过第二神经网络中的注意力机制，对目标对象的局部特征进行加权处理。在一种可能的实现方式中，本步骤2051可以通过步骤21-22所示的过程来实现。

步骤21、该计算机设备基于第二注意力机制以及该至少一个局部特征，进行权值学习，得到至少一个第三权值，一个第三权值用于表示一个局部特征的重要程度。

其中，该第二注意力机制为该第二神经网络内的任一注意力机制，机算计设备基于第二注意力机制以及该至少一个局部特征，进行权值学习，可以该第二注意力机制中的权值学习策略，学习权值，该第二注意力机制中的权值学习策略可以表示为：

其中，为第i个第三权值，W_α为第六权值矩阵，b_α为第六偏差参数，为第j个检测时间对应的参量权值。

需要说明的是，该第二注意力机制中的权值学习策略还可以是其他注意力权值学习策，本发明实施例对该第二注意力机制中的权值学习策略不做具体限定。

步骤22、该计算机设备基于该至少一个第三权值，对该目标对象的至少一个局部特征进行加权处理，得到该目标局部特征。

该计算机设备将至少一个第三权值和该目标对象的至少一个局部特征代入第五公式，将第五公式的输出作为目标局部特征，以实现对目标对象的至少一个局部特征的加权处理，该第五公式可以表示为：

其中，A_G为当前时序对应的检测数据所对应的属性，N为第二神经网络的层数。

由于一个第三权值一个局部特征的重要程度，通过至少一个第三权值对至少一个局部特征进行加权处理，使得到的目标局部特征更加细节化。

步骤2052、基于该目标局部特征，对该目标对象的属性进行预测。

该计算机设备可以将该目标局部特征，代入第六公式，以对目标对象的属性进行预测，该第六公式用于预测该目标对象的属性，该第六公式可以表示为：其中，为预测的目标对象在第M+1次检测数据所对应的属性，W_G为第七权值矩阵，b_G为第七偏差参数。

在一些实施例中，第二神经网络可以根据第二神经网络中的全局损失以及局部损失，确定是否输出当前预测的属性。

在一些可能的实现方式中，当将该全局特征输入至该第二神经网络后，若该第二神经网络中的全局损失以及局部损失满足预设条件，则该第二神经网络输出当前预测的属性，否则，该第二神经网络调整该第二神经网络内的权重矩阵，直至第二神经网络中的全局损失以及局部损失满足预设条件，该局部损失为该第二神经网络在每一层期望的输出数据与实际的输出数据的差值，该全局损失为该第二神经网络期望的最终输出数据与实际的最终输出数据的差值。

当第二神经网络的任一层计算结束后，该第二神经网络可以预测该任一层在下一个检测时间时的局部特征(简称预测局部特征)，那么，第i层的预测局部特征可以表示为

其中，为第i层的第八权值矩阵，b_L第八偏差参数。

第二神经网络可以预测至少一个目标对象的属性，当基于第二神经网络预测至少一个目标对象的属性时，基于该任一层的预测局部特征，该第二神经网络可以采用交叉熵策略计算该任一层的局部损失，那么，第i的局部损失L^li可以表示为：

其中，Q为目标对象的数目，为基于第Q个目标对象的全局特征，第i层实际的输出数据，为基于第Q个目标对象的全局特征，预测的第i层的输出数据。

当基于第二神经网络预测至少一个目标对象的属性时，若该第二神经网络每一层都计算结束后，该第二神经网络可以计算至少一个目标对象下次检测时的属性，然后，该第二神经网络可以预测的至少一个目标对象下次检测时的属性，采用交叉熵策略计算全局损失L^G，其中，L^G可以表示为：

其中，为实际输出的第Q个目标对象下一次检测时的属性，为预测的第Q个目标对象下一次检测时的属性。

该预设条件可以表示为Loss＝L^G+γ(L^l1+L^l2...L^lp)，其中，P为大于2的整数，例如，p＝3，Loss为预设的收敛值，γ为预定义的参数，用于平衡全局损失以及局部损失，当该计算机设备将Loss、γ、L^l1、L^l2、...、L^lp输入至上述预设条件的公式后，若上述公式成立，则该第二神经网络中的全局损失以及局部损失满足预设条件，否则该第二神经网络中的全局损失以及局部损失不满足预设条件。

当第二神经网络中的全局损失以及局部损失满足预设条件时，说明第二神经网络的每一层的生成的局部特征与期望的局部特征之间的差值达到预设精度，从而可以保证该第二神经网络的每一层的局部特征的精度较高，进而可以提高预测的属性精度。

需要说明的是，由于第二神经网络都是基于数值进行计算的，而目标对象的属性内的每个状态实际上是由状态标识表示的，所以，该计算机设备还需将第二神经网络实际输出的数据转换为由状态标识组成的属性，第二神经网络实际输出的数据可以包括至少一个概率值，每个概率值对应目标对象的属性内的一个状态，当任一概率值大于目标值时，说明该目标对象具有该任一概率对应的目标状态，则该计算机设备将第一状态标识存储在目标状态在属性内的位置；当任一概率值小于或等于该目标值时，说明该目标对象不具有该任一概率对应的目标状态，则该计算机设备将第二状态标识存储在目标状态在属性内的位置。那么，通过对每个概率值进行判断，可以得到属性的实际表达方式。本发明实施例对该目标值不做具体限定。

为了进一步表明步骤203-204所示的过程，参见图3中神经层次多标签建模部分，从该部分可知，注意力循环网络(attention recurrent networks)的输出数据(即是全局特征)至神经层次多标签建模部分，注意力循环网络相当于第一神经网络。具体地，该计算设备将全局特征输入至神经层次多标签建模部分中的第二神经网络的每一层，第一层根据全局特征生成第一层的层级特征再根据生成第一层的层级特征基于可以进行数据预测，得到第一层预测的输出数据计算机设备在计算第一层的局部损失L^l1，第一层将输出给第二层，使得第二层可以进行类似第一层的计算过程，最终第二神经网络的所有的层都可一得到一个计算机设备将M个输出至注意力集合(attentionalensembel)，在注意力集合中，基于第二注意机制，生成预测的输出数据进而根据预测的输出数据生成全局损失L_G。那么，当全局损失L_G和局部损失L_i都满足预设条件时，该第二神经网络可以输出

本发明实施例提供的方法，通过基于表示检测特征历史和未来的变化规律的规律特征，确定出目标对象的全局特征，并对全局特征进行细化，以得到目标对象的至少一个局部特征，那么，细化后的局部特征更能体现目标对象的特征，进而根据局部特征目标对象预测属性，因此，可以提高预测的属性的精度，当目标对象的属性为预测的诊断结果时，则可以提高预测的诊断结果的精度。并且，由于检测特征是基于检测数据和检测数据对应的属性获得的，相对于仅基于检测数据获得的目标对象的特征，本发明实施例中的检测特征更能体现目标对象检测过程中的特征。并且，检测数据为实际的检测到的数据，可以作为客观依据，使得获取的检测特征具有可解释性，检测数据对应的属性为主观判断的结果，因此，基于属性和检测数据，所获取的检测特征的精度较高。并且，当第二神经网络中的全局损失以及局部损失满足预设条件时，说明第二神经网络的每一层的生成的局部特征均达到了期望值，从而可以保证该第二神经网络的输出层输出的局部特征的精度较高。

图4是本发明实施例提供的一种属性预测装置的结构示意图，该装置包括：

获取模块401，用于根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征；

计算模块402，用于将所述检测特征输入第一神经网络，通过所述第一神经网络分别对所述检测特征中各个时序上的检测特征进行反向时序计算和正向时序计算，输出第一规律特征和第二规律特征，所述第一规律特征用于表示所述检测特征的历史变化规律，所述第二规律特征用于表示所述检测特征的未来变化规律；

所述获取模块401，还用于基于所述第一规律特征和第二规律特征，获取所述目标对象的全局特征；

提取模块403，用于将所述全局特征输入第二神经网络，通过所述第二神经网络逐级提取所述目标对象的细节，输出所述目标对象的至少一个局部特征；

预测模块404，用于基于所述目标对象的至少一个局部特征，对所述目标对象的属性进行预测。

可选地，所述获取模块401用于：

将所述检测数据对应的属性输入全连接神经网络，通过所述全连接神经网络删除对所述检测数据对应的属性中的非必要因素，得到所述检测数据对应的属性的特征；

将所述检测数据输入时间序列分析工具，通过时间序列分析工具提取所述检测数据中每一类数据在各个时序的特征，输出特征集合；

将特征集合输入深交叉神经网络，通过深交叉神经网络对所述特征集合内的各个时序特征进行交叉处理，得到所述检测数据的特征；

将所述属性的特征以及所述检测数据的特征输入深度神经网络，通过所述深度神经网络提取所述检测数据和所述检测数据对应的属性的混合特征，输出所述检测特征。

可选地，所述获取模块401用于：

将所述第一规律特征和第二规律特征进行拼接，得到第三规律特征；

对所述第三规律特征进行加权处理，得到第四规律特征，所述第四规律特征用于表示所述检测特征的全局变化规律；

基于所述第三规律特征和所述第四规律特征，获取所述全局特征。

可选地，所述对所述第三规律特征进行加权处理，得到第四规律特征包括：

基于第一注意力机制以及所述第三规律特征，进行权值学习，得到至少一个第一权值，一个所述第一权值用于表示一个检测数据与所述一个检测数据对应的属性的重要程度；

对所述至少一个第一权值进行归一化处理，得到至少一个第二权值；

基于所述至少一个第二权值，对所述第三规律特征进行加权处理，得到所述第四规律特征。

可选地，所述预测模块404包括：

处理单元，用于对所述目标对象的至少一个局部特征进行加权处理，得到目标局部特征；

预测单元，用于基于所述目标局部特征，对所述目标对象的属性进行预测。

可选地，所述处理单元用于；

基于第二注意力机制以及所述至少一个局部特征，进行权值学习，得到至少一个第三权值，一个第三权值用于表示一个局部特征的重要程度；

基于所述至少一个第三权值，对所述至少一个局部特征进行加权处理，得到所述目标局部特征。

可选地，所述第二神经网络的每一层输出一个所述局部特征。

可选地，所述装置还包括输出模块，用于当将所述全局特征输入至所述第二神经网络后，若所述第二神经网络中的全局损失以及局部损失满足预设条件，则所述第二神经网络输出当前预测的属性，所述局部损失为所述第二神经网络在每一层期望的输出数据与实际的输出数据的差值，所述全局损失为所述第二神经网络期望的最终输出数据与实际的最终数据的差值。

可选地，该装置还包括生成模块，用于基于所述第二神经网络中第一目标层的层级特征以及第二目标层生成的局部特征，生成所述第一目标层输出的局部特征，第一目标层的所述层级特征用于表示所述全局特征在第一目标层的中的状态，所述第二目标层为所述第二神经网络中所述第一目标层的上一层。

可选地，所述第一目标层的层级特征由所述全局特征以及所述第二目标层的层级特征来决定。

图5是本发明实施例提供的一种计算机设备的结构示意图，该计算机设备500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上CPU(central processingunits，处理器)501和一个或一个以上的存储器502，其中，所述存储器502中存储有至少一条指令，所述至少一条指令由所述处理器501加载并执行以实现上述各个方法实施例提供的方法。当然，该计算机设备500还可以具有有线或无线网络接口、键盘以及输入输出接口等部件，以便进行输入输出，该计算机设备500还可以包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括指令的存储器，上述指令可由终端中的处理器执行以完成下述实施例中属性预测方法。例如，所述计算机可读存储介质可以是ROM(read-only memory，只读存储器)、RAM(random access memory，随机存取存储器)、CD-ROM(compact disc read-only memory，只读光盘)、磁带、软盘和光数据存储设备等。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

需要说明的是：上述实施例提供的属性预测装置在预测属性时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的属性预测装置与属性预测方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种属性预测方法，其特征在于，所述方法包括：

根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征，所述检测数据对应的属性指示所述目标对象的患病状态，所述检测数据为所述目标对象的体征数据，所述体征数据为电子健康记录EHR数据内存储的时序数据，所述时序数据包括所述目标对象每次问诊的问诊时间，以及在每个问诊时间上检测的目标对象的体征数据，所述检测特征内的至少一个子检测特征按照所述问诊时间的时间顺序排序；

按照所述问诊时间的反向时序顺序，将所述检测特征中的每个子检测特征输入第一神经网络的第一子网络，通过所述第一子网络对所述检测特征进行反向时序计算，得到第一规律特征，所述第一规律特征用于表示所述检测特征的历史变化规律；

按照所述问诊时间的正向时序顺序，将所述检测特征输入所述第一神经网络的第二子网络，通过所述第二子网络对所述检测特征进行正向时序计算，得到第二规律特征，所述第二规律特征用于表示所述检测特征的未来变化规律；

2.根据权利要求1所述的方法，其特征在于，所述根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征包括：

将至少一个患病状态输入全连接神经网络，通过所述全连接神经网络筛选出所述至少一个患病状态中的目标状态，对所述目标状态进行加权处理，输出所述至少一个患病状态的特征；

将所述体征数据输入时间序列分析工具，通过时间序列分析工具提取所述体征数据中每一类数据在各个时序的特征，输出特征集合；

将特征集合输入深交叉神经网络，通过深交叉神经网络对所述特征集合内的各个时序特征进行交叉处理，得到所述体征数据的特征；

将所述至少一个患病状态的特征以及所述体征数据的特征输入深度神经网络，通过所述深度神经网络提取所述体征数据和所述至少一个患病状态的混合特征，输出所述检测特征。

3.根据权利要求1所述的方法，其特征在于，所述基于所述第一规律特征和第二规律特征，获取所述目标对象的全局特征包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述第三规律特征进行加权处理，得到第四规律特征包括：

基于第一注意力机制以及所述第三规律特征，进行权值学习，得到至少一个第一权值，一个所述第一权值用于表示一个体征数据与所述一个体征数据对应的患病状态的重要程度；

5.根据权利要求1所述的方法，其特征在于，所述基于所述目标对象的至少一个局部特征，对所述目标对象的属性进行预测包括：

对所述目标对象的至少一个局部特征进行加权处理，得到目标局部特征；

基于所述目标局部特征，对所述目标对象的属性进行预测。

6.根据权利要求5所述的方法，其特征在于，所述对所述目标对象的至少一个局部特征进行加权处理，得到目标局部特征包括：

7.根据权利要求1所述的方法，其特征在于，所述第二神经网络的每一层输出一个所述局部特征。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

当将所述全局特征输入至所述第二神经网络后，若所述第二神经网络中的全局损失以及局部损失满足预设条件，则所述第二神经网络输出当前预测的患病状态，所述局部损失为所述第二神经网络在每一层期望的输出数据与实际的输出数据的差值，所述全局损失为所述第二神经网络期望的最终输出数据与实际的最终数据的差值。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

基于所述第二神经网络中第一目标层的层级特征以及第二目标层生成的局部特征，生成所述第一目标层输出的局部特征，第一目标层的所述层级特征用于表示所述全局特征在第一目标层中的状态，所述第二目标层为所述第二神经网络中所述第一目标层的上一层。

10.根据权利要求9所述的方法，其特征在于，所述第一目标层的层级特征由所述全局特征以及所述第二目标层的层级特征来决定。

11.一种属性预测装置，其特征在于，所述装置包括：

获取模块，用于根据目标对象的检测数据以及所述检测数据对应的属性，获取所述目标对象的检测特征，所述检测数据对应的属性指示所述目标对象的患病状态，所述检测数据为所述目标对象的体征数据，所述体征数据为电子健康记录EHR数据内存储的时序数据，所述时序数据包括所述目标对象每次问诊的问诊时间，以及在每个问诊时间上检测的目标对象的体征数据，所述检测特征内的至少一个子检测特征按照所述问诊时间的时间顺序排序；

计算模块，用于按照所述问诊时间的反向时序顺序，将所述检测特征中的每个子检测特征输入第一神经网络的第一子网络，通过所述第一子网络对所述检测特征进行反向时序计算，得到第一规律特征，所述第一规律特征用于表示所述检测特征的历史变化规律；按照所述问诊时间的正向时序顺序，将所述检测特征输入所述第一神经网络的第二子网络，通过所述第二子网络对所述检测特征进行正向时序计算，得到第二规律特征，所述第二规律特征用于表示所述检测特征的未来变化规律；

12.根据权利要求11所述的装置，其特征在于，所述获取模块用于：

将至少一个患病状态输入全连接神经网络，通过所述全连接神经网络删除所述至少一个患病状态中的非必要因素，得到所述至少一个患病状态的特征；

13.根据权利要求11所述的装置，其特征在于，所述获取模块用于：

14.一种计算机设备，其特征在于，所述计算机设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条指令，所述指令由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求10任一项所述的属性预测方法所执行的操作。

15.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令，所述指令由处理器加载并执行以实现如权利要求1至权利要求10任一项所述的属性预测方法所执行的操作。