CN115905953A - 状态数据处理方法、装置、计算机设备会和存储介质 - Google Patents
状态数据处理方法、装置、计算机设备会和存储介质 Download PDFInfo
- Publication number
- CN115905953A CN115905953A CN202211475162.1A CN202211475162A CN115905953A CN 115905953 A CN115905953 A CN 115905953A CN 202211475162 A CN202211475162 A CN 202211475162A CN 115905953 A CN115905953 A CN 115905953A
- Authority
- CN
- China
- Prior art keywords
- state
- diagnosis
- historical
- diagnostic
- representation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000003672 processing method Methods 0.000 title abstract description 28
- 238000003745 diagnosis Methods 0.000 claims abstract description 309
- 230000004044 response Effects 0.000 claims abstract description 118
- 238000012545 processing Methods 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000004590 computer program Methods 0.000 claims abstract description 29
- 230000015654 memory Effects 0.000 claims description 32
- 238000011176 pooling Methods 0.000 claims description 27
- 230000004927 fusion Effects 0.000 claims description 20
- 230000000644 propagated effect Effects 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims description 5
- 230000000875 corresponding effect Effects 0.000 description 226
- 201000010099 disease Diseases 0.000 description 92
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 92
- 238000004364 calculation method Methods 0.000 description 47
- 230000008569 process Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 16
- 238000004519 manufacturing process Methods 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000001976 improved effect Effects 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 6
- 238000013145 classification model Methods 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 241000282414 Homo sapiens Species 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000001684 chronic effect Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 208000017667 Chronic Disease Diseases 0.000 description 2
- 208000031662 Noncommunicable disease Diseases 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000009901 attention process Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 230000000474 nursing effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000007480 spreading Effects 0.000 description 2
- 238000003892 spreading Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000004435 hydrogen atom Chemical class [H]* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 208000037920 primary disease Diseases 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种状态数据处理方法、装置、计算机设备、存储介质和计算机程序产品,包括:获取目标对象在不同历史时间下对应的历史诊断状态集合;从状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态以及历史诊断状态对应的关系类型;确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定针对待预测状态的传播特征表示;分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,以确定目标对象的状态响应特征表示;基于状态响应特征表示确定目标对象的对象特征表示,基于对象特征表示确定目标对象处于待预测状态的可能性信息。采用本方法能够提升诊断状态确定的准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种状态数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,计算机设备提供的功能越来越丰富。在一些情况下,计算机设备能够对目标对象的诊断状态进行预测,比如,计算机设备能够根据机器的历史故障来预测机器未来可能出现的故障,计算机设备也能够根据患者的历史患病来预测患者未来可能出现的疾病等。
相关技术中,通常是通过分类的方式对对目标对象的诊断状态进行预测,但是分类只能在固定几个类别中进行分类,导致在进行诊断状态确定时准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高诊断状态确定的准确性的状态数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
一方面,本申请提供了一种状态数据处理方法。所述方法包括:获取目标对象在不同历史时间下分别对应的历史诊断状态集合;从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及所述历史诊断状态与所述关联诊断状态之间的关系类型;所述状态关系网络用于描述诊断状态之间的关联关系;确定待预测状态与所述历史诊断状态在所述关系类型下的关联度,基于所述关联度和所述关联诊断状态,确定所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对所述待预测状态的状态响应特征表示;基于所述状态响应特征表示确定所述目标对象的对象特征表示,基于所述对象特征表示确定所述目标对象处于所述待预测状态的可能性信息。
另一方面,本申请还提供了一种状态数据处理装置。所述装置包括:历史状态确定模块,用于获取目标对象在不同历史时间下分别对应的历史诊断状态集合;关联状态确定模块,用于从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及所述历史诊断状态与所述关联诊断状态之间的关系类型;所述状态关系网络用于描述诊断状态之间的关联关系;传播特征推导模块,用于确定待预测状态与所述历史诊断状态在所述关系类型下的关联度,基于所述关联度和所述关联诊断状态,确定所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示注意力处理模块,用于分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对所述待预测状态的状态响应特征表示;对象特征确定模块,用于基于所述状态响应特征表示确定所述目标对象的对象特征表示;可能性预测模块,用于基于所述对象特征表示预测所述目标对象处于所述待预测状态的可能性信息。
另一方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述状态数据处理方法所述的步骤。
另一方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述状态数据处理方法所述的步骤。
另一方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述状态数据处理方法所述的步骤。
上述状态数据处理方法、装置、计算机设备、存储介质和计算机程序产品,通过获取目标对象在不同历史时间下分别对应的历史诊断状态集合,从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型,确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示,基于状态响应特征表示确定目标对象的对象特征表示,基于对象特征表示预测目标对象处于待预测状态的可能性信息,实现对任意的待预测状态进行预测,由于预测得到的可能性信息是利用状态关系网络和目标对象的历史诊断状态信息得到的,可以模拟目标对象的诊断状态衍变情况,从而提升了诊断状态确定时的准确性。此外,由于对各个历史诊断状态集合下的传播特征表示进行注意力处理,可以考虑到不同历史时间的诊断状态信息对预测结果的影响差异性,得到的对象特征表示更加准确,从而可以得到更加准确的可能性信息。
附图说明
图1为一个实施例中状态数据处理方法的应用环境图;
图2为一个实施例中状态数据处理方法的流程示意图;
图3为一个实施例中注意力处理步骤的流程示意图;
图4为一个实施例中确定对象特征表示的流程示意图;
图5为一个实施例中状态关系网络的传播过程示意图;
图6为一个实施例中状态数据处理方法的整体流程图;
图7为一个实施例中分类模型的流程示意图;
图8为一个实施例中诊断状态预测模型的结构示意图;
图9为一个实施例中同阶段传播模块的结构示意图;
图10为一个实施例中信息整合模块的示意图;
图11为一个实施例中诊断状态预测模型的应用场景流程图;
图12为一个实施例中状态数据处理装置的结构框图;
图13为一个实施例中计算机设备的内部结构图;
图14为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
本申请实施例提供的方案所涉及的人工智能的相关技术,具体通过如下实施例进行说明:
本申请实施例提供的状态数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。终端102可以向服务器104发送针对目标对象的诊断状态预测请求,并指定待预测状态,待预测状态可以是任意的诊断状态,进而服务器104在接收到诊断状态预测请求后,获取目标对象在不同历史时间下分别对应的历史诊断状态集合,根据多个历史诊断状态集合、待预测状态及预先建立的状态关系网络,确定目标对象处于该待预测状态的可能性信息,进而服务器104可以将可能性信息返回至终端102。
需要说明的是,本申请实施例中提供的状态数据处理方法还可以由终端102单独执行,也可以由服务器104单独执行,例如,终端102在确定了目标对象和待预测状态后,可以获取目标对象在不同历史时间下分别对应的历史诊断状态集合,进而根据多个历史诊断状态集合、待预测状态及预先建立的状态关系网络,确定目标对象处于该待预测状态的可能性信息;又如,服务器104可以按照预设周期对目标对象集合中各个目标对象进行针对待预测状态的预测,并将预测得到的可能性信息进行保存。
在一个实施例中,如图2所示,提供了一种状态数据处理方法,该方法可以由计算机设备执行,该计算机设备可以是图1中终端102或者是服务器104。在本实施例中,以计算机设备为服务器进行举例说明,具体包括以下步骤:
步骤202,获取目标对象在不同历史时间下分别对应的历史诊断状态集合。
其中,目标对象指的是待进行诊断状态预测的对象。这里的对象可以是独立的生命体或者非生命体,生命体例如可以是自然人、动物,非生命体例如可以是机器、车辆。在具体实施中,在预测患者疾病的场景下,该目标对象可以为待进行疾病预测的患者;在预测生产机器故障的场景下,该目标对象可以为待进行故障预测的生产机器;在预测车辆故障的场景下,该目标对象为待进行故障预测的车辆。历史诊断状态集合指的是由同一历史时间下的一个或者多个历史诊断状态所组成的集合,多个指的是至少两个。不同的历史时间对应不同的历史诊断状态集合,同一个历史诊断状态集合内的历史诊断状态对应相同的历史时间。历史诊断状态指的是目标对象在对应的历史时间所处的诊断状态。诊断状态指的是可以通过诊断确定的状态。可以理解的是,针对不同类型的目标对象,诊断状态的含义是不相同的。例如,在预测患者疾病的场景下,诊断状态可以是患者的疾病;在预测生产机器故障的场景下,诊断状态可以是生产机器的故障;在预测车辆故障的场景下,该诊断状态为可以为车辆的故障。
具体地,服务器可以根据目标对象的对象标识从预先建立的诊断状态数据库中查询得到目标对象在不同历史时间下的历史诊断状态集合,或者服务器可以从其他计算机设备通过有线或者无线的方式获取目标对象在不同历史时间下分别对应的历史诊断状态集合。
步骤204,从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型。
其中,状态关系网络指的是用于描述诊断状态之间的关联关系的网络。状态关系网络中的每一个节点代表一个诊断状态,节点之间的连接边代表诊断状态之间的关联关系。诊断状态之间的关联关系可以是用于表征诊断状态衍变情况的关系,例如,可以是表征两个诊断状态同时出现的概率,或者是当某一个诊断状态出现时,另一个诊断状态也会随之出现的概率。举个实际的例子,在预测患者疾病的场景下,诊断状态之间的关系可以是两种疾病之间的共病关系,共病又称合并症,指与原发疾病同时病发的一种或多种疾病。历史诊断状态对应的关联诊断状态指的是与历史诊断状态存在关联关系的诊断状态,关系类型指的是关系所属的分类,例如,对于表征两个诊断状态同时出现的概率的关系,可以对概率进行范围划分,每一个范围对应一个关系类型。
具体地,针对每一个历史诊断状态集合中的每一个历史诊断状态,服务器可以从预先建立的状态关系网络中确定与该历史诊断状态对应的关联诊断状态,以及该历史诊断状态与所对应的关联诊断状态之间的关系类型。
在一个具体的实施例中,服务器可以从预先建立的状态关系网络中确定与历史诊断状态所对应的节点通过连接边直接连接的节点,即一阶邻居节点,将该节点所表示的诊断状态确定为该历史诊断状态对应的关联诊断状态,这两个节点之间的连接边所表示的关系类型即为该历史诊断状态与该关联诊断状态之间的关系类型。在一个具体的实施例中,状态关系网络可以为知识图谱,可以基于诊断状态的层级信息和先验信息构建得到知识图谱。例如,可以基于诊断状态的层级信息和先验信息确定诊断状态之间的衍变路径,进而基于衍变路径构建知识图谱。
步骤206,确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示。
其中,待预测状态指的是待进行预测的诊断状态。待预测状态与历史诊断状态在关系类型下的关联度指的是待预测状态与历史诊断状态在关系类型下的相关程度,关联度越大,代表待预测状态与历史诊断状态在关系类型下的相关程度越高。在一个具体的实施例中,待预测状态与历史诊断状态在关系类型下的关联度,具体可以是待预测状态与历史诊断状态在关系类型下的相似度。传播特征表示用于表示状态关系网络在所针对的历史诊断状态集合下,针对待预测状态所传播的特征信息。
具体地,针对每一个历史诊断状态集合中的每一个历史诊断状态,服务器可以基于待预测状态的诊断状态表示特征、该历史诊断状态的诊断状态表示特征以及关系类型对应的关系表示特征进行关联度计算,得到待预测状态与历史诊断状态在关系类型下的关联度。状态关系网络在每一个历史诊断状态集合下针对待预测状态进行传播时,分别得到每一个历史诊断状态集合所对应的传播特征表示,由于在状态关系网络中传播时,是按照节点之间的路径进行传播的,那么所传播的特征可以通过传播路径上的节点特征得到,传播路径上的节点即历史诊断状态对应的关联诊断状态对应的节点,因此,可以基于关联度和关联诊断状态确定历史诊断状态所对应的传播特征表示,最后分别将同一个历史诊断状态集合中的各历史诊断状态各自对应的传播特征表示进行统计,例如可以分别将同一个历史诊断状态集合中的各历史诊断状态各自对应的传播特征表示进行相加,从而可以得到各历史诊断状态集合各自对应的传播特征表示。
在一个具体的实施例中,服务器可以将计算得到的关联度乘以该历史诊断状态所对应的关联诊断状态的诊断状态表示特征,得到该历史诊断状态对应的传播特征表示。
步骤208,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示。
其中,目标对象针对待预测状态的状态响应特征表示,指的是目标对象可能的诊断状态对待预测状态的响应信息。目标对象针对待预测状态的状态响应特征表示是综合了各个历史诊断状态集合对应的传播特征表示得到的。
具体地,服务器可以基于注意力机制对各个历史诊断状态集合下的传播特征表示进行注意力处理,得到各个历史诊断状态集合各自对应的注意力处理结果,进而可以对注意力处理结果进行整合,多个注意力处理结果是分别对应目标对象的不同历史时间的,整合得到的结果即可以从整体上反映目标对象可能的诊断状态对待预测状态的响应信息,因此通过整合各个历史诊断状态集合各自对应的注意力处理结果可以得到目标对象针对待预测状态的状态响应特征表示。
在一个具体的实施例中,对注意力处理结果进行整合具体可以是对各注意力处理结果进行池化处理。
步骤210,基于状态响应特征表示确定目标对象的对象特征表示,基于对象特征表示确定目标对象处于待预测状态的可能性信息。
其中,目标对象处于待预测状态的可能性信息用于指示目标对象处于待预测状态的可能性大小。在一个具体的实施例中,可能性信息例如可以是处于待预测状态的可能性等级,等级越高,代表可能性越大。在其他具体的实施例中,可能性信息还可以是处于待预测状态的概率,概率越大,代表可能性越大。在一个具体的实施例中,目标对象处于待预测状态的可能性信息可以用于指示目标对象将要处于待预测状态的可能性大小,即在各历史诊断状态集合所对应的历史时间之后,目标对象处于待预测状态的可能性大小。
对象特征表示是用于对目标对象的特征进行表示的,本申请实施例由于是针对目标对象进行诊断状态预测的,即要预测目标对象处于待预测状态的可能性大小,因此可以使用目标对象关于待预测疾病的特征信息作为对象特征表示,因此可以基于目标对象针对待预测状态的状态响应特征表示确定对象特征表示。
具体地,服务器在确定了目标对象针对待预测状态的状态响应特征表示后,可以基于状态响应特征表示确定目标对象的对象特征表示,进而基于所得到的对象特征表示确定目标对象处于待预测状态的可能性信息。
在一个具体的实施例中,服务器可以将所得到的状态响应特征表示确定为目标对象的对象特征表示。在其他实施例中,服务器可以基于状态响应特征表示在状态关系网络继续进行多次传播计算,每一次传播计算都会得到该传播阶段对应的状态响应特征表示,最后,服务器可以结合各传播阶段得到的状态响应特征表示得到对象特征表示,由于进行了多次传播,相当于对目标对象的诊断状态衍变情况进行了模拟,得到的对象特征表示可以更加反映目标对象的特征信息,从而可以预测得到更加准确的可能性信息。
在一个具体的实施例中,服务器基于对象特征表示确定目标对象处于待预测状态的可能性信息,具体可以是:基于对象特征表示和待预测状态的状态特征表示进行相似性计算,以得到目标对象处于待预测状态的概率。待预测状态的状态特征表示用于对待预测状态的特征进行表征的,可以通过对待预测状态进行特征映射得到,特征映射可以是将待预测状态的特征映射至向量空间,得到的状态特征表示为用于表示待预测状态的特征向量。
在一个具体的实施例,上述步骤206至步骤210可以是通过已训练好的诊断状态预测模型得到的,该诊断状态预测模型指的是用于对目标对象处于待预测状态的可能性信息进行预测的机器学习模型,该诊断状态预测模型包括多个传播计算层和预测层;传播计算层包括同阶段传播层、注意力层和池化层;在步骤206中,服务器可以获取待预测状态的状态特征表示,将待预测状态的初始特征表示作为第一个传播计算层的输入特征,在第一个传播计算层的同阶段传播层中,基于输入特征计算确定待预测状态与各历史诊断状态集合中的历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定各历史诊断状态各自对应的传播特征表示;在步骤208中,服务器可以在第一个传播计算层的注意力层中,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,并在第一个传播计算层的池化层中,对各个历史诊断状态集合的注意力处理结果进行池化处理,池化层输出的即为该传播计算层的状态响应特征表示;在步骤210中,服务器将该状态响应特征表示作为下一个传播计算层的输入特征,在一个传播计算层中执行与第一个传播计算层相同的步骤,将得到的状态响应特征表示继续输入下下一个传播计算层中,直至得到最后一个传播计算层的状态响应特征表示,最后结合各个传播计算层输出的状态响应特征表示确定目标对象的对象特征表示,然后在预测层中基于目标对象的对象特征表示和待预测状态的状态特征表示进行预测,得到目标对象处于待预测状态的可能性信息。
上述状态数据处理方法中,通过获取目标对象在不同历史时间下分别对应的历史诊断状态集合,从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型,确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示,基于状态响应特征表示确定目标对象的对象特征表示,基于对象特征表示确定目标对象处于待预测状态的可能性信息,实现对任意的待预测状态进行预测,由于预测得到的可能性信息是利用状态关系网络和目标对象的历史诊断状态信息得到的,可以模拟目标对象的诊断状态衍变情况,从而提升了诊断状态确定时的准确性。
此外,由于对各个历史诊断状态集合下的传播特征表示进行注意力处理,可以考虑到不同历史时间的诊断状态信息对预测结果的影响差异性,得到的对象特征表示更加准确,从而可以得到更加准确的可能性信息。
在一个实施例中,如图3所示,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,包括:
步骤302,获取各历史诊断状态集合各自对应的历史时间信息。
具体地,考虑到不同时间下的历史诊断状态集合对诊断状态预测的影响是不相同的,本实施例中,可以获取到各历史诊断状态集合各自对应的历史时间信息,将时间信息融入到传播特征表示,从而可以体现时序信息对诊断状态预测的影响。
步骤304,获取各历史时间信息对应的时间特征表示,分别将各历史诊断状态集合各自对应的传播特征表示和时间特征表示进行融合处理,得到各历史诊断状态集合各自的融合特征表示。
具体地,服务器可以从存储历史诊断状态集合的数据库中获取到各历史诊断状态集合各自的时间信息,得到各历史诊断状态集合各自对应的历史时间信息,然后对各历史时间信息进行时间嵌入,得到各历史时间信息对应的时间特征表示,进而服务器可以将对应于同一个历史诊断状态集合的时间特征表示和传播特征表示进行融合处理,得到各历史诊断状态集合各自的融合特征表示。
在一个具体的实施例中,服务器将对应于同一个历史诊断状态集合的时间特征表示和传播特征表示进行融合处理可以是:将对应于同一个历史诊断状态集合的时间特征表示和传播特征表示进行拼接,得到融合特征表示。在其他实施例中,服务器进行融合处理可以是:将对应于同一个历史诊断状态集合的时间特征表示和传播特征表示进行相加,得到融合特征表示。这里的相加指的是逐元素相加,即将每一个对应位置的元素进行相加。举例说明,假设某个历史诊断状态集合对应的时间特征表示是(x1,x2,……,xn),该历史诊断状态集合对应的传播特征表示是(y1,y2,……,yn),则得到的融合特征表示可以为(x1+y1,x2+y2,……,xn+yn)。
步骤306,针对各融合特征表示进行注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果。
具体地,服务器可以针对各融合特征表示进行自注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果,自注意力处理的过程,即分别将每一个融合特征表示作为查询信息,从各融合特征表示中抽取该查询信息所关注的信息,最后将抽取的信息进行融合,所得到的即为该融合特征表示的注意力处理结果。
上述实施例中,由于融合了各历史时间信息对应的时间特征表示,在注意力处理过程中可以考虑到时序信息,进而可以得到更为准确的状态响应特征表示,进一步提高诊断状态预测的准确性。
在一个实施例中,传播特征表示包括多个维度的元素,获取各历史时间信息对应的时间特征表示,包括:确定传播特征表示对应的维度数;根据历史时间信息、维度数以及各个元素在传播特征表示中的顺序,确定历史时间信息对应的时间特征表示。
其中,传播特征表示包括多个维度的元素,每一个维度的元素用于从不同的维度对传播的特征信息进行描述。传播特征表示对应的维度数即传播特征表示所包括的元素的数量。在一个具体的实施例中,传播特征表示例如可以是多维向量,传播特征表示对应的维度数为向量的维数。例如,假设传播特征表示为n维向量(x1,x2,……,xn),则传播特征表示对应的维度数为n。
具体地,服务器可以根据历史时间信息、维度数以及各个元素在传播特征表示中的顺序,计算得到历史时间信息对应的时间特征表示,其中,当元素在传播特征表示中的顺序中顺序为偶数时,通过正弦函数进行计算,当元素在传播特征表示中的顺序中顺序为奇数时,通过余弦函数进行计算,具体可以参考以下公式(1)和公式(2)获得时间特征表示:
在一个具体的实施例中,服务器通过以上公式得到时间特征表示后,可以进一步可以将对应于同一历史诊断状态集合的时间特征表示和传播特征表示进行融合,具体可以参考以下公式(3),在公式(3)中通过将时间特征表示和传播特征表示进行逐元素相加以实现融合:
其中,xe,1为得到的融合特征表示,dimemb为传播特征表示的维度数,ve,1为传播特征表示。
本实施例中,根据历史时间信息、维度数以及各个元素在传播特征表示中的顺序,确定历史时间信息对应的时间特征表示,可以对历史时间信息进行准确地编码,得到用于唯一表示历史时间信息的时间特征表示。
在一个实施例中,针对各融合特征表示进行注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果,包括:分别将每一个融合特征表示转换为查询表示、键表示和值表示;将所针对的融合特征表示所对应的查询表示分别和各个键表示计算相关度,基于相关度确定各个键表示各自对应的注意力权重;将各个键表示各自对应的注意力权重和各自对应的值表示相乘,统计所得到的各个乘积,基于统计结果得到所针对的融合特征表示所对应的注意力处理结果。
具体地,服务器可以分别将每一个融合特征表示分别乘以查询参数矩阵、键参数矩阵以及值参数矩阵,分别得到每个融合特征表示各自的查询表示(query)、键表示(key)和值表示(value),进而针对每一个融合特征表示的注意力处理具体可以是:服务器将所针对的融合特征表示的query分别和各个key计算相关度,这里计算相关度例如可以通过计算query和key之间的点积(Dot-product)实现,然后对计算得到的相关度进行归一化处理,归一化处理具体可以通过softmax实现,归一化处理得到的即为各个键表示各自的注意力权重,该注意力权重可以表示所针对的融合特征表示对各个融合特征表示的关注程度,关注程度越高的,则可以抽取更多的资讯,具体来说,服务器可以将各个键表示各自对应的注意力权重和各自对应的值表示相乘,统计所得到的各个乘积,基于统计结果得到所针对的融合特征表示所对应的注意力处理结果,其中,键表示对应的值表示,指的是该键表示和该值表示是对同一个融合特征表示转换得到的。在具体实施例中,统计各个乘积例如可以是对各个乘积相加,得到乘积的和,或者对各个乘积求平均值等。
在一个具体的实施例中,服务器将每一个融合特征表示转换为查询表示、键表示和值表示可以是通过注意力处理模型实现的,其中,查询参数矩阵、键参数矩阵以及值参数矩阵可以是注意力处理模型在训练过程中需要学习的参数。
上述实施例中,通过将融合特征表示转换为查询表示、键表示和值表示,进而可以将所针对的融合特征表示所对应的查询表示分别和各个键表示计算相关度,基于相关度确定各个键表示各自对应的注意力权重,基于注意力权重可以从各个融合特征表示不同程度地抽取所关注的资讯,从而可以得到较为准确的注意力处理结果。
需要说明的是,本申请实施例旨在利用状态关系网络与目标对象的历史诊断状态信息,模拟目标对象的诊断状态衍变情况,从而预测患者未来诊断状态,为了使得模拟的诊断状态衍变情况更加准确,可以通过状态关系网络对目标对象的历史诊断状态信息进行多次传播,以下实施例中,将具体介绍多次传播的具体实施方式。
在一个实施例中,如图4所示,基于状态响应特征表示确定目标对象的对象特征表示,包括:
步骤402,将所针对的历史诊断状态集合中各历史诊断状态对应的关联诊断状态所组成的关联诊断状态集合作为当前诊断状态集合,将状态响应特征表示作为当前输入特征。
具体地,服务器在得到状态响应特征表示,可以将状态响应特征表示作为当前输入特征进行第二次传播计算,在第二次传播计算中将第一次传播计算中的待预测状态的状态特征表示替换为状态响应特征表示,执行与第一次传播相同的步骤。在第二次传播计算中,每一历史诊断状态集合中的历史诊断状态的关联诊断状态组成该历史诊断状态集合的关联诊断状态集合,从而得到各历史诊断状态集合各自的当前诊断状态集合。
步骤404,确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型;当前诊断状态对应的关联诊断状态及当前关系类型是从状态关系网络中确定的。
具体地,当前诊断状态对应的关联诊断状态和当前关系类型可以通过以下步骤确定:从状态关系网络中确定与该当前诊断状态对应的节点通过连接边直接连接的节点,即该当前诊断状态对应的节点的一阶邻居节点,将该节点所表示的诊断状态确定为该当前诊断状态对应的关联诊断状态,这两个节点之间的连接边所表示的关系类型即为该当前诊断状态与该关联诊断状态之间的当前关系类型。
需要说明的是,当前诊断状态对应的关联诊断状态和当前关系类型可以是在服务器执行该步骤404前就已经确定并保存,从而在该步骤404中,服务器可以直接查询获得当前诊断状态对应的关联诊断状态和当前关系类型。
步骤406,确定当前输入特征与当前诊断状态在当前关系类型下的当前关联度,基于当前关联度和当前诊断状态对应的关联诊断状态,确定状态关系网络在当前诊断状态集合下,针对状态响应特征表示的当前传播特征表示。
其中,当前输入特征与当前诊断状态在当前关系类型下的当前关联度指的是当前输入特征与当前诊断状态的状态特征表示在当前关系类型下的相关程度,关联度越大,代表当前输入特征与当前诊断状态在当前关系类型下的相关程度越高。在一个具体的实施例中,这里的关联度,具体可以是当前输入特征与当前诊断状态的状态特征表示在当前关系类型下的相似度。
具体地,针对每一个当前诊断状态集合中的每一个当前诊断状态,服务器可以基于当前输入特征、该当前诊断状态的诊断状态表示特征以及当前关系类型对应的关系表示特征进行关联度计算,得到当前输入特征与当前诊断状态在当前关系类型下的当前关联度,进而基于当前关联度和当前诊断状态对应的关联诊断状态确定该当前诊断状态的传播特征表示,例如,服务器可以将当前关联度乘以该当前诊断状态对应的关联诊断状态的状态特征表示,得到该当前诊断状态对应的传播特征表示,最后分别将同一个当前诊断状态集合中的各当前诊断状态各自对应的传播特征表示进行统计,例如可以分别将同一个当前诊断状态集合中的各当前诊断状态各自对应的传播特征表示进行相加,从而可以得到各当前诊断状态集合各自对应的当前传播特征表示。
步骤408,分别对各个当前诊断状态集合下的当前传播特征表示进行注意力处理,基于各当前诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示。
具体地,服务器可以基于注意力机制对各个当前诊断状态集合下的传播特征表示进行注意力处理,得到各个当前诊断状态集合各自对应的注意力处理结果,进而可以对得到的多个注意力处理结果进行整合,得到目标对象针对待预测状态的状态响应特征表示,该状态响应特征表示即反映本次传播过程中目标对象针对待预测状态的响应信息。在一个具体的实施例中,对得到的多个注意力处理结果进行整合具体可以是对多个注意力处理结果进行池化处理,池化处理例如可以是平均池化或者最大池化。
在一个具体的实施例中,在基于各当前诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示之后,方法还包括:将所确定的状态响应特征表示作为当前输入特征,将当前诊断状态集合对应的关联诊断状态所组成的关联诊断状态集合确定为当前诊断状态集合,迭代执行确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态的步骤,直至达到第一预设迭代次数;基于最后一次迭代得到的当前状态响应特征表示,确定目标对象的对象特征表示。
其中,当前诊断状态集合对应的关联诊断状态指的是与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,针对每一个当前诊断状态集合,该当前诊断状态集合中的当前诊断状态所对应的关联诊断状态组成该当前诊断状态集合对应的关联诊断状态集合。
具体地,服务器可以将所确定的状态响应特征表示作为当前输入特征继续进行传播计算,每一次传播计算都会迭代执行上述步骤404至步骤408,得到目标对象针对待预测状态的状态响应特征表示,然后将该状态响应特征表示作为当前输入特征,将本次传播计算过程中的当前诊断状态集合所对应的关联诊断状态集合确定为当前诊断状态集合,继续进行下一次传播,直至达到第一预设迭代次数,这里的第一预设迭代次数可以根据需要进行设置,例如可以设置为5次。最后,服务器可以基于最后一次迭代得到的当前状态响应特征表示,确定目标对象的对象特征表示。
在一个具体实施例中,服务器可以将最后一次迭代得到的当前状态响应特征表示,直接确定为目标对象的对象特征表示。在其他实施例中,服务器可以对将所有的当前状态响应特征表示进行统计,例如可以将所有的当前状态响应特征表示相加,从而得到目标对象的对象特征表示。
上述实施例中,通过状态关系网络对目标对象的历史诊断状态信息进行多次传播,可以得到更加准确的对象特征表示,从而提到诊断状态预测的准确性。
在一个实施例中,基于最后一次迭代得到的状态响应特征表示,确定目标对象的对象特征表示,包括:将作为当前输入特征的各状态响应特征表示以及最后一次迭代得到的状态响应特征表示,按照时间顺序进行排列得到状态响应特征表示序列;对状态响应特征表示序列进行前向编码,得到各诊断状态响应特征各自的编码特征;基于最后一次迭代所得到的状态响应特征表示对应的编码特征,确定目标对象的对象特征表示。
具体地,服务器可以将作为当前输入特征的各状态响应特征表示以及最后一次迭代得到的状态响应特征表示,按照各自的生成时间从先到后进行排列,得到状态响应特征表示序列。例如,假设第一次传播计算得到的状态响应特征表示为o1,第二次传播计算得到的状态响应特征表示为o2,第二次传播计算得到的状态响应特征表示为o3,则得到的状态响应特征表示序列为o1 o2 o3。进一步地,针对状态响应特征表示序列进行前向编码,前向编码指的是按照顺序对状态响应特征表示序列中各个状态响应特征表示进行编码,并在每一次编码中结合上一次编码所得到的编码信息进行编码。前向编码完成后,可以得到各诊断状态响应特征各自的编码特征,服务器可以基于最后一次迭代所得到的状态响应特征表示对应的编码特征,确定目标对象的对象特征表示。在具体应用中,服务器可以将最后一次迭代所得到的状态响应特征表示对应的编码特征直接确定为目标对象的对象特征表示,或者服务器可以将各状态响应特征表示各自对应的编码特征进行融合,得到目标对象的对象特征表示。
在具体实施例中,服务器可以采用LSTM(Long Short-Term Memory,长短期记忆网络)网络、RNN(Recurrent Neural Network,循环神经网络)、BiLSTM(Bi-directional LongShort-Term Memory,双向长短期记忆网络)、GRU(gated recurrent unit,门控循环单元)、attention网络等神经网络结构实现对状态响应特征表示序列进行前向编码。
上述实施例中,通过将各状态响应特征表示组成状态响应特征表示序列,对状态响应特征表示序列,可以对各传播阶段的信息进行整合,使得目标对象的对象特征表示更加合理。
在一个实施例中,上述状态数据处理方法还包括:将所针对的历史诊断状态集合中的历史诊断状态所对应的关联诊断状态作为当前诊断状态从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型,将当前诊断状态、当前诊断状态对应的关联诊断状态以及当前关系类型组成状态关系组合,并进行存储;将当前诊断状态对应的关联诊断状态作为当前诊断状态,迭代执行从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态的步骤,直至达到第二预设迭代次数;其中,第一预设迭代次数与第二预设迭代次数匹配;确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,包括:查询存储的各状态关系组合,以确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态。
本实施例中,预先根据状态关系网络将目标对象的历史信息即各历史诊断状态集合转换为多个状态关系组合并进行存储,进而在传播计算的过程中,可以通过查询存储的各状态关系组合,以确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态。可以理解的是,本实施例中的步骤可以是在上文实施例中的步骤204执行过程中执行的,即服务器确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型,可以看成是将历史诊断状态集合在状态关系网络进行第一次传播,第一次传播得到的历史诊断状态、历史诊断状态对应的关联诊断状态以及历史诊断状态与关联诊断状态之间的关系类型同样可以保存为状态关系组合,并且在第一次传播之后,服务器可以历史诊断状态所对应的关联诊断状态作为当前诊断状态,继续在诊断状态网络中进行多次传播,每一次传播,迭代执行从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型,将当前诊断状态、当前诊断状态对应的关联诊断状态以及当前关系类型组成状态关系组合。这里迭代执行的次数为第二预设迭代次数,可以理解的是,此处的迭代过程所得到的状态关系组合是用于上文中迭代执行过程中,因此这里第二预设迭代次数和上文的第一预设迭代次数在数量上是相同的。
参考图5,为一个具体的实施例中,状态关系网络的传播过程示意图。其中,灰色圆圈表示图的当前节点,斜线圆圈代表下一次传播到的节点,代表第e个历史诊断状态集合。通过转换,目标对象的历史信息可以表示为其中,E为历史诊断状态集合的个数,K为图的最大传播阶数。
需要说明的是,每一次传播所得到的状态关系组合可以看成一个三元组,在这些三元组中,图的当前节点为头节点,下一次传播的节点为尾节点,即所得到状态关系组合是代表了传播方向的,那么服务器在通过查询状态关系组合确定关联诊断状态时,是通过将当前诊断状态与各状态关系组合中的头节点进行匹配来确定的,当当前诊断状态与某个状态关系组合中的头节点匹配成功时,该状态关系组合中的尾节点即作为该当前诊断状态的关联诊断状态。
本实施例中,通过迭代执行从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型,将当前诊断状态、当前诊断状态对应的关联诊断状态以及当前关系类型组成状态关系组合,并进行存储的步骤,可以对目标对象的历史信息进行预处理得到传播计算过程中所需的数据,从而可以提高诊断状态预测的效率。
在一个实施例中,状态关系网络通过以下方式进行构建:
1、获取多个参考对象在不同历史时间下分别对应的参考诊断状态集合。
其中,参考对象与目标对象是相同类型的对象。例如,在预测患者疾病的场景下,参考对象是其他有历史看病记录的患者;在预测生产机器故障的场景下,参考对象是有历史故障诊断记录的生产机器;在预测车辆故障的场景下,参考对象为有历史故障诊断记录的车辆。参考诊断状态集合指的是参考对象在历史时间下的历史诊断状态所组成的集合,即参考对象在历史时间下的历史诊断状态集合。
具体地,服务器可以从数据库中获得多个参考对象在不同历史时间下分别对应的历史诊断状态集合,得到多个参考诊断状态集合。
2、确定第一参考诊断状态对,第二参考诊断状态对中两个参考诊断状态之间存在并列关系。
其中,第一参考诊断状态对中两个参考诊断状态之间存在并列关系,指的是第二参考诊断状态对所包括的诊断状态是在一次诊断过程中同时出现的诊断状态,一个历史诊断状态集合对应一次诊断,因此第一参考诊断状态对可以是在同一个历史诊断状态集合中出现的两个诊断状态。并列关系是无向对称的。例如,某个生产机器在一次诊断中同时诊断了故障A和故障B,则故障A和故障B之间存在并列关系。
本实施例中,服务器可以确定多个第一参考诊断状态对,每一个第一参考诊断状态对包括两个诊断状态,这两个诊断状态之间存在并列关系。
3、在多个参考诊断状态集合中统计各个第一参考诊断状态对各自的出现频率,基于统计得到的出现频率进行频率等级划分,将各第一参考诊断状态对对应的出现频率所属的频率等级确定为各第一参考诊断状态对各自对应的关系类型。
具体地,由于第一参考诊断状态对中的两个诊断状态不存在时间先后顺序,服务器可以在多个参考诊断状态集合中统计各个第一参考诊断状态对各自的出现频率,即如果某个参考诊断状态集合中同时包括某个第一参考诊断状态对中的两个诊断状态,则该第一参考诊断状态对在该参考诊断状态集合中出现一次。在统计得到各个第一参考诊断状态对各自的出现频率,可以基于这些出现频率的分布范围进行频率等级划分,然后确定每一个第一参考诊断状态所属的频率等级,将频率等级确定为第一参考诊断状态的关系类型。
在一个具体的实施例中,服务器可以根据各个第一参考诊断状态对各自的出现频率进行分位数计算,根据分位数计算结果进行频率等级划分。
4、根据各第一参考诊断状态对以及各自对应的关系类型,构建状态关系网络。
具体地,服务器可以将第一参考诊断状态对中的各个诊断状态表示为节点,将关系类型表示为节点之间的连接边,以构建得到状态关系网络。
在一个实施例中,状态关系网络通过以下方式进行构建:确定第二参考诊断状态对,第二参考诊断状态对中两个参考诊断状态之间存在顺序关系;根据属于同一参考对象对应的参考诊断状态集合,统计各个第二参考诊断状态对各自的出现频率,基于统计得到的出现频率进行频率等级划分,将各第二参考诊断状态对应的出现频率所属的频率等级确定为各第二参考诊断状态对各自对应的关系类型。
其中,第二参考诊断状态对中两个参考诊断状态之间存在顺序关系,指的是第二参考诊断状态对所包括的两个诊断状态中的其中一个诊断状态是在另一个诊断状态被诊断之后出现,顺序关系是有向非对称的。例如,车辆在第一次故障诊断中诊断出了故障A,在第二次故障诊断中诊断出了故障B,则故障A和故障B之间存在顺序关系。需要说明的是,由于顺序关系是非有向非对称的,两个诊断状态可能会对应两个第二参考诊断状态对,例如,诊断状态A先出现,诊断状态B后出现,则第二参考诊断状态对可以为(诊断状态A,诊断状态B),如果诊断状态B先出现,诊断状态A后出现,则第二参考诊断状态对可以为(诊断状态B,诊断状态A)。
具体地,针对每一个第二参考诊断状态对,服务器可以在属于同一参考对象对应的多个参考诊断状态集合中,判断是否出现该第二参考诊断状态对,进而统计该第二参考诊断状态对的出现次数,得到该第二参考诊断状态对的出现频率。考虑到第二参考诊断状态对中的两个诊断状态之间是存在顺序关系,这里的判断第二参考诊断状态对出现的标准是,第二参考诊断状态对中的两个诊断状态在同一参考对象的两个不同的历史诊断状态集合中出现,并且出现的顺序与第二参考诊断状态对中的顺序一致,例如,假设某个第二参考诊断状态对为(诊断状态A,诊断状态B),即诊断状态A先出现,诊断状态B后出现,那么如果在某个参考对象的某个历史诊断状态集合A中出现诊断状态A,在历史诊断状态集合B中出现诊断状态B,如果历史诊断状态集合A对应的时间是早于历史诊断状态集合B,则判断该第二参考诊断状态对出现一次。
在统计得到各个第二参考诊断状态对各自的出现频率,可以基于这些出现频率的分布范围进行频率等级划分,然后确定每一个第二参考诊断状态所属的频率等级,将频率等级确定为第二参考诊断状态的关系类型。
在一个具体的实施例中,服务器可以根据各个第二参考诊断状态对各自的出现频率进行分位数计算,根据分位数计算结果进行频率等级划分。
本实施例中,服务器可以进一步根据各第一参考诊断状态对、各第一参考诊断状态对各自对应的关系类型、各第二参考诊断状态对以及各第二参考诊断状态对各自对应的关系类型,构建状态关系网络。具体地,服务器可以将第一参考诊断状态对中的各个诊断状态表示为节点,将第一参考诊断状态对对应的关系类型表示为第一参考诊断状态对对应的节点之间的连接边,并且将第二参考诊断状态对中的各个诊断状态表示为节点,将第二参考诊断状态对对应的关系类型表示为第二参考诊断状态对对应的节点之间的连接边,以构建得到状态关系网络。
上述实施例中,通过统计参考诊断状态对的出现频率,对出现频率进行等级划分来得到关系类型,可以更加合理地区分各类复杂诊断状态关系。
在一个实施例中,确定待预测状态与历史诊断状态在关系类型下的关联度,包括:针对每一个状态关系组合,分别获取状态关系组合中的历史诊断状态对应的状态特征表示、关联诊断状态对应的关联特征表示以及关系类型对应的关系特征表示;基于待预测状态对应的状态特征表示、历史诊断状态对应的状态特征表示以及关系特征表示,确定状态关系组合对应的关联度;基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示,包括:将关联度乘以关联特征表示,得到状态关系组合对应的传播特征表示;统计各个状态关系组合对应的传播特征表示,得到状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示。
其中,历史诊断状态对应的状态特征表示、关联诊断状态对应的关联特征表示以及关系类型对应的关系特征表示可以是分别对历史诊断状态、关联诊断状态以及关系类型分别进行特征映射得到的。在一个具体的实施例中,特征映射可以是通过机器学习模型实现,例如可以通过机器学习模型将历史诊断状态映射为embedding表示作为历史诊断状态的状态特征表示,将关联诊断状态映射为embedding表示作为关联诊断状态的状态特征表示,将关系类型映射成embedding表示作为关系类型的关系特征表示。
具体地,每一个历史诊断状态集合中包括多个历史诊断状态,每个历史诊断状态和所对应的关联诊断状态、关系类型组成状态关系组合,针对每一个状态关系组合,服务器可以将其中待预测状态对应的状态特征表示、历史诊断状态对应的状态特征表示以及关系特征表示进行相乘处理,然后再进行归一化处理,得到状态关系组合对应的关联度,进一步将关联度乘以该状态关系组合中关联诊断状态对应的关联特征表示,得到状态关系组合对应的传播特征表示,最后将对应于同一个历史诊断状态集合的状态关系组合的传播特征表示进行相加,得到状态关系网络在各个历史诊断状态集合下,针对待预测状态的传播特征表示。
上述实施例中,通过历史诊断状态对应的状态特征表示、关联诊断状态对应的关联特征表示以及关系类型对应的关系特征表示,基于待预测状态对应的状态特征表示、历史诊断状态对应的状态特征表示以及关系特征表示,可以准确快速地确定状态关系组合对应的关联度,进而可以得到更加准确地传播特征表示,提高诊断状态预测准确性。
在一个实施例中,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示,包括:对各历史诊断状态集合各自对应的注意力处理结果进行池化处理,得到目标对象针对待预测状态的状态响应特征表示;其中,整合处理包括最大池化处理或者平均池化处理。
具体地,本实施例中,服务器可以对各历史诊断状态集合各自对应的注意力处理结果进行平均池化处理或者最大池化处理,通过池化处理对各注意力处理结果进行整合,从而得到目标对象针对待预测状态的状态响应特征表示;其中,整合处理包括最大池化处理或者平均池化处理。
在一个具体的实施例中,如图6所示,为本申请实施例的状态数据处理方法的整体流程图。参考图6,在本实施例中,状态数据处理方法通过诊断状态预测模型实现,本实施例先基于整个数据库构建状态关系网络,再基于目标对象的历史信息即历史诊断状态集合,待预测状态和状态关系网络确定输入诊断状态预测模型的输入数据,将输入数据输入诊断状态预测模型中,通过诊断状态预测模型进行针对诊断状态的传播推导,最终输出目标对象未来处于待预测状态的概率。
以下将结合疾病预测场景对本实施例进行具体说明,可以理解的是,在疾病预测场景中,诊断状态指的是疾病,对象指的是病人。需要说明的是,本实施例中,状态数据处理方法可以由计算机设备执行,该计算机设备可以是图1中终端102或者是服务器104。在本实施例中,以计算机设备为服务器进行举例说明。
相关技术中,通常是通过多分类模型针对多个疾病进行分类预测,即将疾病预测看作多分类问题,每一个类为一个疾病。整个模型会包含多个单分类模型,如逻辑回归、支持向量机等,或使用随机森林、梯度提升树、神经网络等多分类模型。在输入模型需要的病人特征后,预测模型将对病人的特征进行分类,最终的所属类别的对应疾病,即为该患者的预测疾病。分类模型的大致流程如图7所示。如图7所示,该病人的疾病预测结果为心脏病。多分类疾病预测模型,只能同时预测一种疾病,且一定会预测一种疾病,导致预测的准确性低。并且,受限于多分类本身的构造,模型的疾病可预测种类较少,无法全面地覆盖现有疾病。
在该应用场景中,状态关系网络是基于两两疾病同时出现的概率构建的,hi和ti表示疾病,ri表示疾病对间的关系,状态关系网络共由N个疾病关系组合构成,状态关系网络在该应用场景中也可以称为共病网络。由于数据库以一次看病为记录单位,每次看病可能有多个诊断疾病,因此疾病关系可分为两类,顺序关系rseries和并列关系rpara。(hi,ri series,ti)中的ri series表示当hi被诊断后,未来看病诊断ti的概率,(hi,ri para,ti)中的ri para表示当hi和ri在一次看病中被同时诊断的概率,hi,ri series,ti)是有向非对称的,而(hi,ri para,ti)无向对称的。通过统计数据库中各疾病对的各关系频率并计算分位数,根据分位数分别将rseries和rpara均划分为5个等级,取值为1至5。rseries和rpara的等级即作为关系类型。
在本实施例中,诊断状态预测模型的结构可以参考图8,通过拆解,诊断状态预测模型的网络结构共可分为4个部分,分别为输入预处理模块、同阶段传播模块、信息整合模块、概率输出模块。以下分别对每个模块进行具体说明:
1、预处理模块
诊断状态预测模型的输入共有三个部分,分别为待预测疾病d,待预测病人的历史疾病信息和状态关系网络历史疾病信息即在不同历史时间下分别确诊的历史疾病,这里的历史时间指的是历史疾病的看病时间,看病时间例如可以是数据库中记录的时间,待预测病人在该看病时间确诊该历史疾病,因此该历史时间也即为确诊时间。d可以是任意使用者想要预测的疾病。在输入预处理模块,首先待预测疾病d以onehot(独热编码)的形式被投入网络,并通过诊断状态预测模型中的embedding层(图中未示出)转换为embedding表示(即待预测疾病的疾病特征表示),该embedding表示即为待预测疾病的疾病特征表示,将该embedding表示进一步输入推导模块(inference module)中。而历史信息将根据状态关系网络转换为多个图表示第e次看病记录的第k次传播结果,第k次传播结果中的当前节点与下一次所要传播的节点可以组成疾病关系组合,在该疾病关系组合中当前节点为头节点,下一次所要传播的节点作为尾节点,尾节点也即头节点对应的关联节点。
2、同阶段传播模块
该部分结构共分为3个部分,推导模块(inference module)、注意力处理模块(attention)和池化处理模块。以第一次传播为例,Inference module针对每一个疾病关系组合计算传播特征表示,具体来说,Inference module基于待预测疾病的embedding表示,疾病关系组合中头节点的embedding表示以及关系类型的特征表示进行关联度计算,具体可以参考以下公式(4)和公式(5),其中,当疾病关系组合中的关系为并列关系时,服务器可以基于待预测疾病的疾病特征表示、并列关系下关系等级的关系特征表示和关联疾病对应的疾病特征表示计算得到关联度,具体可以参考公式(4),当疾病关系组合中的关系为顺序关系时,服务器可以基于待预测疾病的疾病特征表示、顺序关系下关系等级的关系特征表示和关联疾病对应的疾病特征表示计算得到关联度,具体可以参考公式(5):
在计算得到各疾病关系组合的关联度后,服务器进一步可以将关联度乘以疾病关系组合中的尾节点的embedding表示,最后可以将同一次看病所对应的且与顺序关系对应的疾病关系组合的乘积进行统计得到第一统计结果,以及将同一次看病所对应的且与并且关系对应的疾病关系组合的乘积进行统计得到第二统计结果,计算第一统计结果和第二统计结果的平均值得到状态关系网络在该次看病的历史信息下,针对待预测状态的传播特征表示,具体可以参考以下公式(6):
上述公式(4)至公式(6)中,(he,i,re,i,te,i)表示的第i个疾病关系组合,he,i,te,i和d均为embedding表示,re,i为关系类型的关系特征表示,αe,i表示计算得到的第i个疾病关系组合与待预测疾病d的关联度,而ve,1是inference module的输出,表示对d相关的图传播信息,即状态关系网络在第e次看病的历史信息下,针对待预测疾病的传播特征表示。
在经过inference module后,得到的{ve,1}e∈[1,E]将输入注意力模块。
注意力处理模块可以基于全局输入信息对各输入进行加权,并且可以处理时序信息。同时,注意力处理模块与同样可以处理时序输入的RNN相比,拥有并行化的优点,可以在E较大时拥有更高的计算效率。注意力处理模块首先会将各看病时间进行嵌入表示,得到时间特征表示,计算公式可以参考上文中的公式(1)和公式(2),其中,表示第e次看病的时间嵌入,d表示疾病embedding的维度,xe,1表示第e次看病对应的传播特征表示,然后将时间特征表示与对应的传播特征表示进行融合处理,得到融合特征表示,进而基于自注意力机制针对各融合特征表示进行注意力处理,在经过注意力处理模块处理后,第e次看病对应输出的注意处理结果为向量ae。最后,同阶段传播模块使用池化处理模块将{ae}e∈[1,E]进行最大池化处理,即将各次看病对应的注意处理结果中各个向量分别在各向量维度取最大值,以整合得到dimemb维向量,相关公式可以参考以下公式(7):
其中,o1为同阶段传播模块编码的病人历史信息在待预测疾病d下的第一次传播的全部信息,即第一次传播计算得到的状态响应特征表示。
进一步地,将o1作为输入进行第二次传播的输入,继续进行传播计算,得到o2,……,oK,由图8可以看出,诊断状态预测模型包括的是多个相同的同阶段传播模块,每一次传播计算得到的状态响应特征表示作为下一次同阶段传播模块的输入,因此在后续的传播计算过程中,计算方式与第一次传播计算相同,即同样可以参考上述公式(4)至公式(7),只是将第一次传播计算中待预测疾病的embedding表示替换为当前输入的状态响应特征表示。
3、信息整合模块
参考图10,在得到所有传播阶段的信息编码{ok}k∈[1,K]后,模型会将所有ok按顺序输入LSTM模型(即图10中的长短期记忆网络)中,最终使用LSTM模型的最后一个单元的输出p表示病人历史信息,即得到病人的对象特征表示。在LSTM模型中,对所有ok按照时间顺序进行前向编码,在每一个当前编码模块(以下简称当前模块),将上一个模块的最终输出以及当前模块所输入的oe(第e次看病对应的状态响应特征表示)作为输入,分别确定遗忘门的输出、细胞记忆、输入门的输出,最后基于遗忘门的输出、细胞记忆、输入门的输出确定当前模块的最终输出,具体计算过程可以参考以下公式(8)至(14):
Fe=σ(oe*Uf+le-1*Wf) (9)
Ie=σ(oe*UI+le-1*WI) (10)
Oe=σ(oe*UO+le-1*WO) (11)
le=Oe*tanh(ce) (13)
上述公式中,[Wf,Uf,WI,UI,Wc,Uc,Wo,Uo]均为相应的权重,为LSTM的网络模型参数;Fe为LSTM模型中遗忘门当前模块的输出,σ为sigmod函数,oe为当前模块的输入,le-1为LSTM模型中上一个模块最终的输出,le为LSTM模型中当前模块最终的输出;Ie为LSTM模型中当前模块输入门的输出;Oe为LSTM模型中当前模块输出门的输出;ce为当前模块的细胞记忆,ce-1为上一个模块的细胞记忆。
4、概率输出模块
在经过前三个模块后,通过得到的疾病嵌入d(即待预测疾病的疾病特征表示)和病人嵌入p(即病人的病人特征表示),最终在模型的输出层中基于疾病特征表示和病人的病人特征表示计算相关度,得到该病人未来患待预测疾病的概率,计算过程具体可以参考如下公式(15)和公式(16):
需要说明的是,上述过程描述的是在诊断状态预测模型的使用阶段,即使用已经训练好的诊断状态预测模型预测病人未来患待预测疾病的概率,待预测疾病可以是任意的疾病。在模型训练阶段,训练样本可以从数据库中获取病人的最后一次历史记录中的疾病将作为标签,其余的历史记录作为训练过程中诊断状态预测模型的输入,待预测疾病d以1:1的比例随机选取最后一次历史记录的确诊疾病和未确诊疾病作为d。
需要说明的是,上述实施例中,各个疾病关系组合中各个节点的特征表示可以作为模型训练的参数,在训练开始时,初始化各个节点的特征表示,并在模型训练完成时,得到各个节点的特征表示并进行存储。当然,在其他实施例中,这些节点的特征表示也可以是通过其他嵌入表示模型预先生成的,本申请对此不做限定。
在该应用场景中,由于诊断状态预测模型输入简单,仅需调取公共的共病网络数据和病人历史患病数据,因此可以便捷地应用于体检和护理场景中。使用者仅需手动输入或从EHR数据库调取待预测病人的历史患病记录,系统即可快速输出待预测人的易感疾病列表。通过针对性地对易感疾病采取措施,可以有效提升体检和护理效率,降低人力和物力成本。应用场景流程如图11所示。
另一方面,由于四大慢性非传染性疾病导致的死亡率呈上升区域,慢性非传染性疾病导致的疾病负担越大。因此,慢性病的防控是很重要的。而因为慢性病具有覆盖人群广,并发症多、持续时间长、变化复杂的特点,本申请实施例提供的诊断状态预测模型,利用历史疾病数据进行未来疾病预测,具有个性化、准确高效的特点,可以很好地运用于慢性病或慢性并发症防控。
上述实施例中,通过将attention结构引入模型,使得模型能够处理时间信息,并且提高了模型的性能和并行计算能力。通过使用LSTM结构整合各传播阶段的信息,使病人的embedding表示更为合理,并且赋予模型处理长序列输入的能力。通过将疾病关系分为并列关系和顺序关系,并进行等级划分,可以优化疾病间关系的构建方式,使模型能够更合理地区分各类复杂疾病关系。
本申请还提供另外一种应用场景,在该应用场景,本申请的状态数据处理方法应用于预测生产机器的故障。在该应用场景中,对象指的是生产机器,诊断状态指的是生产机器的故障,在该应用场景中通过训练好的诊断状态预测模型对生产机器未来会发生待预测故障的概率进行预测。这里的未来指的是在最后一次对进行故障记录之后的时间。本实施例中,服务器首先根据存储车辆历史故障记录的数据库构建故障关系网络,针对待预测的目标生产机器,服务器可以通过故障关系网络对待预测生产机器的历史故障信息(即在不同历史时间下的历史故障集合)进行多次传播转化为故障关系组合,进而针对待预测生产机器的待预测故障,服务器可以基于该待预测故障、转化得到的故障关系组合,通过诊断状态预测模型进行预测,得到该目标生产机器未来会发生该待预测故障的概率。其中,诊断状态预测模型的具体结构以及预测过程可以参考上文实施例。
本申请还提供另外一种应用场景,在该应用场景,本申请的状态数据处理方法应用于预测车辆的故障。在该应用场景中,对象指的是车辆,诊断状态指的是车辆的故障,在该应用场景中通过训练好的诊断状态预测模型对车辆未来会发生待预测故障的概率进行预测。这里的未来指的是在最后一次对车辆进行故障记录之后的未来时间。本实施例中,服务器首先根据存储车辆历史故障记录的数据库构建故障关系网络,针对待预测的目标车辆,服务器可以通过故障关系网络对待预测车辆的历史故障信息(即在不同历史时间下的历史故障集合)进行多次传播转化为故障关系组合,进而针对待预测车辆的待预测故障,服务器可以基于该待预测故障、转化得到的故障关系组合,通过诊断状态预测模型进行预测,得到该目标车辆未来会发生该待预测故障的概率。其中,诊断状态预测模型的具体结构以及预测过程可以参考上文实施例。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的状态数据处理方法的状态数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个状态数据处理装置实施例中的具体限定可以参见上文中对于状态数据处理方法的限定,在此不再赘述。
在一个实施例中,如图12所示,提供了一种状态数据处理装置1200,包括:
历史状态确定模块1202,用于获取目标对象在不同历史时间下分别对应的历史诊断状态集合;
关联状态确定模块1204,用于从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型;状态关系网络用于描述诊断状态之间的关联关系;
传播特征推导模块1206,用于确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示;
注意力处理模块1208,用于分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示;
对象特征确定模块1210,用于基于状态响应特征表示确定目标对象的对象特征表示;
可能性预测模块1212,用于基于对象特征表示预测目标对象处于待预测状态的可能性信息。
上述状态数据处理装置,通过获取目标对象在不同历史时间下分别对应的历史诊断状态集合,从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及历史诊断状态与关联诊断状态之间的关系类型,确定待预测状态与历史诊断状态在关系类型下的关联度,基于关联度和关联诊断状态,确定状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示,分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示,基于状态响应特征表示确定目标对象的对象特征表示,基于对象特征表示预测目标对象处于待预测状态的可能性信息,实现对任意的待预测状态进行预测,由于预测得到的可能性信息是利用状态关系网络和目标对象的历史诊断状态信息得到的,可以模拟目标对象的诊断状态衍变情况,从而提升了诊断状态确定时的准确性。此外,由于对各个历史诊断状态集合下的传播特征表示进行注意力处理,可以考虑到不同历史时间的诊断状态信息对预测结果的影响差异性,得到的对象特征表示更加准确,从而可以得到更加准确的可能性信息。
在一个实施例中,注意力处理模块,还用于:获取各历史诊断状态集合各自对应的历史时间信息;获取各历史时间信息对应的时间特征表示,分别将各历史诊断状态集合各自对应的传播特征表示和时间特征表示进行融合处理,得到各历史诊断状态集合各自的融合特征表示;针对各融合特征表示进行注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果。
在一个实施例中,注意力处理模块,还用于:确定传播特征表示对应的维度数;根据历史时间信息、维度数以及各个元素在传播特征表示中的顺序,确定历史时间信息对应的时间特征表示。
在一个实施例中,注意力处理模块,还用于分别将每一个融合特征表示转换为查询表示、键表示和值表示;将所针对的融合特征表示所对应的查询表示分别和各个键表示计算相关度,基于相关度确定各个键表示各自对应的注意力权重;将各个键表示各自对应的注意力权重和各自对应的值表示相乘,统计所得到的各个乘积,基于统计结果得到所针对的融合特征表示所对应的注意力处理结果。
在一个实施例中,对象特征确定模块,还用于:将所针对的历史诊断状态集合中各历史诊断状态对应的关联诊断状态所组成的关联诊断状态集合作为当前诊断状态集合,将状态响应特征表示作为当前输入特征确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型;当前诊断状态对应的关联诊断状态及当前关系类型是从状态关系网络中确定的确定当前输入特征与当前诊断状态在当前关系类型下的当前关联度,基于当前关联度和当前诊断状态对应的关联诊断状态,确定状态关系网络在当前诊断状态集合下,针对状态响应特征表示的当前传播特征表示;分别对各个当前诊断状态集合下的当前传播特征表示进行注意力处理,基于各当前诊断状态集合各自对应的注意力处理结果,确定目标对象针对待预测状态的状态响应特征表示。
在一个实施例中,对象特征确定模块,还用于:将所确定的状态响应特征表示作为当前输入特征,将当前诊断状态集合对应的关联诊断状态所组成的关联诊断状态集合确定为当前诊断状态集合,迭代执行确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态的步骤,直至达到第一预设迭代次数;基于最后一次迭代得到的状态响应特征表示,确定目标对象的对象特征表示。
在一个实施例中,对象特征确定模块,还用于:将作为当前输入特征的各状态响应特征表示以及最后一次迭代得到的状态响应特征表示,按照时间顺序进行排列得到状态响应特征表示序列;对状态响应特征表示序列进行前向编码,得到各诊断状态响应特征各自的编码特征;基于最后一次迭代所得到的状态响应特征表示对应的编码特征,确定目标对象的对象特征表示。
在一个实施例中,装置还包括:图传播模块,用于将所针对的历史诊断状态集合中的历史诊断状态所对应的关联诊断状态作为当前诊断状态;从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型,将当前诊断状态、当前诊断状态对应的关联诊断状态以及当前关系类型组成状态关系组合,并进行存储;将当前诊断状态对应的关联诊断状态作为当前诊断状态,迭代执行从预先建立的状态关系网络中确定当前诊断状态对应的关联诊断状态的步骤,直至达到第二预设迭代次数;其中,第一预设迭代次数与第二预设迭代次数匹配;可能性预测模块,还用于:查询存储的各状态关系组合,以确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态。
在一个实施例中,装置还包括:关系网络构建模块,用于:获取多个参考对象在不同历史时间下分别对应的参考诊断状态集合;确定第一参考诊断状态对,第二参考诊断状态对中两个参考诊断状态之间存在并列关系;在多个参考诊断状态集合中统计各个第一参考诊断状态对各自的出现频率,基于统计得到的出现频率进行频率等级划分,将各第一参考诊断状态对所对应的出现频率所属的频率等级确定为各第一参考诊断状态对各自对应的关系类型;根据各第一参考诊断状态对以及各自对应的关系类型,构建状态关系网络。
在一个实施例中,关系网络构建模块,用于确定第二参考诊断状态对,第二参考诊断状态对中两个参考诊断状态之间存在顺序关系;根据属于同一参考对象对应的参考诊断状态集合,统计各个第二参考诊断状态对各自的出现频率,基于统计得到的出现频率进行频率等级划分,将各第二参考诊断状态对应的出现频率所属的频率等级确定为各第二参考诊断状态对各自对应的关系类型;根据各第一参考诊断状态对、各第一参考诊断状态对各自对应的关系类型、各第二参考诊断状态对以及各第二参考诊断状态对各自对应的关系类型,构建状态关系网络。
在一个实施例中,所针对的历史诊断状态集合中包括多个历史诊断状态,每个历史诊断状态和所对应的关联诊断状态、关系类型组成状态关系组合;传播特征推导模块,还用于:针对每一个状态关系组合,分别获取状态关系组合中的历史诊断状态对应的状态特征表示、关联诊断状态对应的关联特征表示以及关系类型对应的关系特征表示基于待预测状态对应的状态特征表示、历史诊断状态对应的状态特征表示以及关系特征表示,确定状态关系组合对应的关联度;将关联度乘以关联特征表示,得到状态关系组合对应的传播特征表示;统计各个状态关系组合对应的传播特征表示,得到状态关系网络在所针对的历史诊断状态集合下,针对待预测状态的传播特征表示。
在一个实施例中,注意力处理模块,还用于:对各历史诊断状态集合各自对应的注意力处理结果进行池化处理,得到目标对象针对待预测状态的状态响应特征表示;其中,整合处理包括最大池化处理或者平均池化处理。
上述状态数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史诊断状态、特征表示等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种状态数据处理方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种状态数据处理方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13、图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述状态数据处理方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述状态数据处理方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述状态数据处理方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (16)
1.一种状态数据处理方法,其特征在于,所述方法包括:
获取目标对象在不同历史时间下分别对应的历史诊断状态集合;
从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及所述历史诊断状态与所述关联诊断状态之间的关系类型;所述状态关系网络用于描述诊断状态之间的关联关系;
确定待预测状态与所述历史诊断状态在所述关系类型下的关联度,基于所述关联度和所述关联诊断状态,确定所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示;
分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定所述目标对象针对所述待预测状态的状态响应特征表示;
基于所述状态响应特征表示确定所述目标对象的对象特征表示,基于所述对象特征表示确定所述目标对象处于所述待预测状态的可能性信息。
2.根据权利要求1所述的方法,其特征在于,所述分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,包括:
获取各所述历史诊断状态集合各自对应的历史时间信息;
获取各所述历史时间信息对应的时间特征表示,分别将各历史诊断状态集合各自对应的传播特征表示和时间特征表示进行融合处理,得到各历史诊断状态集合各自的融合特征表示;
针对各融合特征表示进行注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果。
3.根据权利要求2所述的方法,其特征在于,所述传播特征表示包括多个维度的元素,所述获取各所述历史时间信息对应的时间特征表示,包括:
确定所述传播特征表示对应的维度数;
根据所述历史时间信息、所述维度数以及各个元素在所述传播特征表示中的顺序,确定所述历史时间信息对应的时间特征表示。
4.根据权利要求2所述的方法,其特征在于,所述针对各融合特征表示进行注意力处理,得到各历史诊断状态集合各自对应的注意力处理结果,包括:
分别将每一个融合特征表示转换为查询表示、键表示和值表示;
将所针对的融合特征表示所对应的查询表示分别和各个键表示计算相关度,基于所述相关度确定各个键表示各自对应的注意力权重;
将各个键表示各自对应的注意力权重和各自对应的值表示相乘,统计所得到的各个乘积,基于统计结果得到所述所针对的融合特征表示所对应的注意力处理结果。
5.根据权利要求1所述的方法,其特征在于,所述基于所述状态响应特征表示确定所述目标对象的对象特征表示,包括:
将所针对的历史诊断状态集合中各历史诊断状态对应的关联诊断状态所组成的关联诊断状态集合作为当前诊断状态集合,将所述状态响应特征表示作为当前输入特征;
确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,以及当前诊断状态与所对应的关联诊断状态之间的当前关系类型;所述当前诊断状态对应的关联诊断状态及当前关系类型是从所述状态关系网络中确定的;
确定当前输入特征与所述当前诊断状态在所述当前关系类型下的当前关联度,基于所述当前关联度和当前诊断状态对应的关联诊断状态,确定所述状态关系网络在所述当前诊断状态集合下,针对所述状态响应特征表示的当前传播特征表示;
分别对各个当前诊断状态集合下的当前传播特征表示进行注意力处理,基于各当前诊断状态集合各自对应的注意力处理结果,确定所述目标对象针对所述待预测状态的状态响应特征表示。
6.根据权利要求5所述的方法,其特征在于,在所述基于各当前诊断状态集合各自对应的注意力处理结果,确定所述目标对象针对所述待预测状态的状态响应特征表示之后,所述方法还包括:
将所确定的状态响应特征表示作为当前输入特征,将所述当前诊断状态集合对应的关联诊断状态所组成的关联诊断状态集合确定为当前诊断状态集合,迭代执行所述确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态的步骤,直至达到第一预设迭代次数;
基于最后一次迭代得到的状态响应特征表示,确定所述目标对象的对象特征表示。
7.根据权利要求6所述的方法,其特征在于,所述基于最后一次迭代得到的状态响应特征表示,确定所述目标对象的对象特征表示,包括:
将作为当前输入特征的各所述状态响应特征表示以及最后一次迭代得到的状态响应特征表示,按照时间顺序进行排列得到状态响应特征表示序列;
对所述状态响应特征表示序列进行前向编码,得到各诊断状态响应特征各自的编码特征;
基于最后一次迭代所得到的状态响应特征表示对应的编码特征,确定所述目标对象的对象特征表示。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
将所针对的历史诊断状态集合中的历史诊断状态所对应的关联诊断状态作为当前诊断状态;
从预先建立的状态关系网络中确定所述当前诊断状态对应的关联诊断状态,以及所述当前诊断状态与所对应的关联诊断状态之间的当前关系类型,将所述当前诊断状态、所述当前诊断状态对应的关联诊断状态以及所述当前关系类型组成状态关系组合,并进行存储;
将当前诊断状态对应的关联诊断状态作为当前诊断状态,迭代执行所述从预先建立的状态关系网络中确定所述当前诊断状态对应的关联诊断状态的步骤,直至达到第二预设迭代次数;其中,所述第一预设迭代次数与所述第二预设迭代次数匹配;
所述确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态,包括:
查询存储的各状态关系组合,以确定与当前诊断状态集合中的当前诊断状态对应的关联诊断状态。
9.根据权利要求1所述的方法,其特征在于,所述状态关系网络通过以下方式进行构建:
获取多个参考对象在不同历史时间下分别对应的参考诊断状态集合;
确定第一参考诊断状态对,所述第一参考诊断状态对中两个参考诊断状态之间存在并列关系;
在所述多个参考诊断状态集合中统计各个第一参考诊断状态对各自的出现频率,基于统计得到的出现频率进行频率等级划分,将各第一参考诊断状态对所对应的出现频率所属的频率等级确定为各第一参考诊断状态对各自对应的关系类型;
根据各第一参考诊断状态对以及各自对应的关系类型,构建状态关系网络。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
确定第二参考诊断状态对,所述第二参考诊断状态对中两个参考诊断状态之间存在顺序关系;
根据属于同一参考对象对应的参考诊断状态集合,统计各个第二参考诊断状态对各自的出现频率,
基于统计得到的出现频率进行频率等级划分,将各第二参考诊断状态对应的出现频率所属的频率等级确定为各第二参考诊断状态对各自对应的关系类型;
所述根据各第一参考诊断状态对以及各自对应的关系类型,构建状态关系网络,包括:
根据各第一参考诊断状态对、各所述第一参考诊断状态对各自对应的关系类型、各第二参考诊断状态对以及各所述第二参考诊断状态对各自对应的关系类型,构建状态关系网络。
11.根据权利要求9所述的方法,其特征在于,所述所针对的历史诊断状态集合中包括多个历史诊断状态,每个历史诊断状态和所对应的关联诊断状态、关系类型组成状态关系组合;所述确定待预测状态与所述历史诊断状态在所述关系类型下的关联度,包括:
针对每一个状态关系组合,分别获取所述状态关系组合中的历史诊断状态对应的状态特征表示、关联诊断状态对应的关联特征表示以及关系类型对应的关系特征表示;
基于所述待预测状态对应的状态特征表示、所述历史诊断状态对应的状态特征表示以及所述关系特征表示,确定所述状态关系组合对应的关联度;
所述基于所述关联度和所述关联诊断状态,确定所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示,包括:
将所述关联度乘以所述关联特征表示,得到所述状态关系组合对应的传播特征表示;
统计各个状态关系组合对应的传播特征表示,得到所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示。
12.根据权利要求1至11任意一项所述的方法,其特征在于,所述基于各历史诊断状态集合各自对应的注意力处理结果,确定所述目标对象针对所述待预测状态的状态响应特征表示,包括:
对各历史诊断状态集合各自对应的注意力处理结果进行池化处理,得到目标对象针对所述待预测状态的状态响应特征表示;
其中,所述池化处理包括最大池化处理或者平均池化处理。
13.一种状态数据处理装置,其特征在于,所述装置包括:
历史状态确定模块,用于获取目标对象在不同历史时间下分别对应的历史诊断状态集合;
关联状态确定模块,用于从预先建立的状态关系网络中确定与所针对的历史诊断状态集合中的历史诊断状态对应的关联诊断状态,以及所述历史诊断状态与所述关联诊断状态之间的关系类型;所述状态关系网络用于描述诊断状态之间的关联关系;
传播特征推导模块,用于确定待预测状态与所述历史诊断状态在所述关系类型下的关联度,基于所述关联度和所述关联诊断状态,确定所述状态关系网络在所述所针对的历史诊断状态集合下,针对所述待预测状态的传播特征表示;
注意力处理模块,用于分别对各个历史诊断状态集合下的传播特征表示进行注意力处理,基于各历史诊断状态集合各自对应的注意力处理结果,确定目标对象针对所述待预测状态的状态响应特征表示;
对象特征确定模块,用于基于所述状态响应特征表示确定所述目标对象的对象特征表示;
可能性预测模块,用于基于所述对象特征表示预测所述目标对象处于所述待预测状态的可能性信息。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211475162.1A CN115905953A (zh) | 2022-11-23 | 2022-11-23 | 状态数据处理方法、装置、计算机设备会和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211475162.1A CN115905953A (zh) | 2022-11-23 | 2022-11-23 | 状态数据处理方法、装置、计算机设备会和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115905953A true CN115905953A (zh) | 2023-04-04 |
Family
ID=86474260
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211475162.1A Pending CN115905953A (zh) | 2022-11-23 | 2022-11-23 | 状态数据处理方法、装置、计算机设备会和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115905953A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756233A (zh) * | 2023-08-23 | 2023-09-15 | 博智安全科技股份有限公司 | 一种态势数据处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-11-23 CN CN202211475162.1A patent/CN115905953A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116756233A (zh) * | 2023-08-23 | 2023-09-15 | 博智安全科技股份有限公司 | 一种态势数据处理方法、装置、电子设备及存储介质 |
CN116756233B (zh) * | 2023-08-23 | 2023-11-07 | 博智安全科技股份有限公司 | 一种态势数据处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020260078B2 (en) | Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers | |
US10872699B2 (en) | Case-based reasoning in the cloud using deep learning | |
CN113112030B (zh) | 训练模型的方法及系统和预测序列数据的方法及系统 | |
TW201905839A (zh) | 電腦輔助醫學方法、非暫態電腦可讀取媒體以及醫學系統 | |
Dhurandhar et al. | Tip: Typifying the interpretability of procedures | |
CN115087989A (zh) | 循环神经网络中的距离度量和聚类 | |
CN105144203A (zh) | 信号处理系统 | |
TWI778289B (zh) | 控制方法以及醫學系統 | |
CN109887606B (zh) | 一种基于注意力的双向递归神经网络的诊断预测方法 | |
Liu et al. | Multi-task learning via adaptation to similar tasks for mortality prediction of diverse rare diseases | |
CN113673244A (zh) | 医疗文本处理方法、装置、计算机设备和存储介质 | |
CN115905953A (zh) | 状态数据处理方法、装置、计算机设备会和存储介质 | |
Sampath et al. | Ensemble Nonlinear Machine Learning Model for Chronic Kidney Diseases Prediction | |
CN110704668A (zh) | 基于网格的协同注意力vqa方法和装置 | |
US20190221294A1 (en) | Time series data processing device, health prediction system including the same, and method for operating the time series data processing device | |
CN116261733A (zh) | 用于预测新模型参数的辅助模型 | |
Ghosh et al. | a Neuro-fuzzy based Classification Method | |
Mendoza et al. | Reverse engineering of grns: An evolutionary approach based on the tsallis entropy | |
Gu et al. | Which is more reliable, expert experience or information itself? weight scheme of complex cases for health management decision making | |
EP4374292A1 (en) | Causal discovery and missing value imputation | |
Yan et al. | Cost-sensitive selection of variables by ensemble of model sequences | |
Venkatrao et al. | CAD-CKD: a computer aided diagnosis system for chronic kidney disease using automated BiGSqENet in the Internet of Things platform | |
Al-Bwana | Coronavirus (COVID-19) Detection using Ensemble Learning | |
Raihan et al. | A deep learning and machine learning approach to predict neonatal death in the context of São Paulo | |
Mu et al. | Diagnosis prediction via recurrent neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40083966 Country of ref document: HK |