CN113782187A - 指标数据处理方法、相关设备及介质 - Google Patents

指标数据处理方法、相关设备及介质 Download PDF

Info

Publication number
CN113782187A
CN113782187A CN202111065905.3A CN202111065905A CN113782187A CN 113782187 A CN113782187 A CN 113782187A CN 202111065905 A CN202111065905 A CN 202111065905A CN 113782187 A CN113782187 A CN 113782187A
Authority
CN
China
Prior art keywords
index change
change curve
index
curve segment
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111065905.3A
Other languages
English (en)
Other versions
CN113782187B (zh
Inventor
钟明峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ping An Smart Healthcare Technology Co ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111065905.3A priority Critical patent/CN113782187B/zh
Publication of CN113782187A publication Critical patent/CN113782187A/zh
Application granted granted Critical
Publication of CN113782187B publication Critical patent/CN113782187B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Evolutionary Biology (AREA)
  • Artificial Intelligence (AREA)
  • Primary Health Care (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)

Abstract

本申请实施例公开了一种指标数据处理方法、相关设备及介质,应用于人工智能技术领域。其中方法包括:获取目标用户的用户特征数据并输入第一预测模型得到目标用户的预测指标变化曲线,根据预测指标变化曲线确定N个指标变化曲线片段,确定每个指标变化曲线片段的初始指标变化特征,根据初始指标变化特征和关联指标变化特征确定每个指标变化曲线片段的目标指标变化特征,将每个指标变化曲线片段的目标指标变化特征输入第二预测模型,得到每个指标变化曲线片段的异常值,根据每个指标变化曲线片段的异常值确定出异常指标变化曲线片段。采用本申请实施例,可以提高指标数据分析准确性。本申请涉及区块链技术,如可将预测指标变化曲线等写入区块链。

Description

指标数据处理方法、相关设备及介质
技术领域
本申请涉及人工智能技术领域,具体涉及一种指标数据处理方法、相关设备及介质。
背景技术
目前,存在许多需要对变化的指标数据进行数据分析的场景。通常由分析人员判断不同时间节点的指标值是否正常来实现指标数据的异常分析,然而,该方式受分析人员的主观因素影响大,导致对指标数据的分析结果准确性低。因此,如何提高针对指标数据的分析准确性成为一个亟待解决的问题。
发明内容
本申请实施例提供了一种指标数据处理方法、相关设备及介质,可以提高针对指标数据的分析准确性。
一方面,本申请实施例提供了一种指标数据处理方法,该方法包括:
获取目标用户的用户特征数据;
将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
在一种可能的实施方式中,所述N个指标变化曲线片段包括第i个指标变化曲线片段,i为小于或等于N的整数;若i为1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为预设特征向量;若i大于1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为所述N个指标变化曲线片段包括的第i-1个指标变化曲线片段的目标指标变化特征。
在一种可能的实施方式中,所述根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征,包括:
将所述关联指标变化特征和所述初始指标变化特征进行拼接,得到所述每个指标变化曲线片段对应的拼接特征向量;
根据所述拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量;
根据所述第一方向的关联特征向量和所述第二方向的关联特征向量确定所述每个指标变化曲线片段的目标指标变化特征。
在一种可能的实施方式中,所述第二预测模型为随机森林模型;
所述将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值,包括:
将所述每个指标变化曲线片段的目标指标变化特征输入所述随机森林模型,由所述随机森林模型包括的各个决策树根据所述每个指标变化曲线片段的目标指标变化特征分别进行划分,得到所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点;
根据所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点的数值,确定所述每个指标变化曲线片段的异常值。
在一种可能的实施方式中,所述用户特征数据包括第一特征数据和第二特征数据,所述第一特征数据所表征的特征维度与所述第二特征数据所表征的特征维度不同;
所述将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果,包括:
将所述第一特征数据输入所述第一预测模型,得到针对所述目标用户的第一特征向量;
将所述第二特征数据输入所述第一预测模型,得到针对所述目标用户的第二特征向量;
将所述第一特征向量和所述第二特征向量进行特征融合,得到融合特征向量;
根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果。
在一种可能的实施方式中,所述根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果,包括:
对所述第一预测模型包括的目标神经网络进行N次神经元失效处理;
根据所述融合特征向量和所述N次神经元失效处理后的第一预测模型,得到N个针对所述目标用户的初始预测结果;所述初始预测结果用于指示经神经元失效处理后的第一预测模型生成的初始预测指标变化曲线;
根据所述N个针对所述目标用户的初始预测结果确定出针对所述目标用户的预测结果。
在一种可能的实施方式中,所述方法还包括:
获取样本用户的样本用户特征数据和样本指标变化曲线;
将所述样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对所述样本用户的样本预测结果;所述样本预测结果用于指示所述样本用户的样本预测指标变化曲线;
将所述样本预测指标变化曲线和所述样本指标变化曲线输入所述第一初始预测模型的初始判别网络,得到判别结果;所述判别结果用于表示所述样本预测指标变化曲线为所述样本指标变化曲线的可能性;
利用所述样本预测指标变化曲线、所述样本指标变化曲线和所述判别结果更新所述第一初始预测模型的模型参数,得到所述第一预测模型;所述第一预测模型包括对所述初始生成网络进行参数更新后所得到的生成网络,所述生成网络用于根据所述目标用户的融合特征向量生成所述预测结果。
一方面,本申请实施例提供了一种指标数据处理装置,该装置包括:
获取模块,用于获取目标用户的用户特征数据;
输入模块,用于将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
确定模块,用于根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
所述确定模块,还用于根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
所述输入模块,还用于将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
所述确定模块,还用于根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
一方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,以执行上述方法中的部分或全部步骤。
一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
本申请实施例中,获取目标用户的用户特征数据,将用户特征数据输入第一预测模型,得到目标用户的预测指标变化曲线,根据预测指标变化曲线确定N个指标变化曲线片段,并确定每个指标变化曲线片段的初始指标变化特征,根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征,将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值,根据异常值确定出异常指标变化曲线片段。通过实施本申请实施例所提出的方法,可以结合用户特征数据(如用户的相关医疗数据等)得到目标用户的预测指标变化曲线,通过该曲线可以判断有无异常变化,后续可以从预测指标变化曲线中确定出可能存在异常的片段,并通过可能异常的片段对目标用户进行分析,以及可以提高对指标数据分析的准确性。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种指标数据处理方法的流程示意图;
图2为本申请实施例提供的另一种指标数据处理方法的流程示意图;
图3为本申请实施例提供的一种指标数据处理装置的结构示意图;
图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请实施例提出的指标数据处理方法实现于电子设备,该电子设备可以为终端设备或服务器。其中,终端设备可以为智能手机、平板电脑、笔记本电脑、台式计算机等。服务器可以是独立的服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,但并不局限于此。本申请涉及区块链技术,电子设备可将涉及的数据如目标用户的预测指标变化曲线、用户特征数据(如血压测量数据、用药行为数据等)等写入区块链中,以便于电子设备可以在区块链上获取所需信息,如目标用户的预测指标变化曲线。
在一些实施例中,电子设备可根据实际的业务需求,执行该指标数据处理方法,以提高对指标数据分析的准确性。比如,本申请技术方案可以应用于医疗数据分析场景。例如,本申请技术方案可以应用于对慢性病患者的血压指标异常分析场景,电子设备可以根据患者的患者特征数据(如用药行为数据、血压测量数据等)生成预测血压变化曲线,并根据该预测血压变化曲线确定出存在异常的曲线片段,进而可以根据该异常的曲线片段对患者进行分析,可以通过该预测血压变化曲线确定出变化过程中可能出现的异常,以提高对医疗数据的分析准确性和分析结果的可靠性。又比如,本申请技术方案还可以应用于情绪变化数据分析场景,例如用户特征数据可以是用户的生理数据(如脉搏信号数据、皮肤电信号数据等),指标变化曲线可以是心理情绪变化曲线。
可以理解的是,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着系统架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供的方案涉及人工智能技术,具体通过如下实施例进行说明:
基于上述的描述,本申请实施例提出了一种指标数据处理方法,该方法可以由上述提及的电子设备来执行。如图1所示,本申请实施例的指标数据处理方法的流程可以包括如下:
S101、获取目标用户的用户特征数据。
在一些实施例中,目标用户可以是任意需要进行数据分析的用户,如慢性病患者,或者年龄较大的人等;用户特征数据中可以包括一种或多种特征数据,当用户特征数据为多种时,每种特征数据所表征的特征维度可以相同也可以不相同,例如用户特征数据可以为用户行为特征数据、用户健康指标数据、用户个体数据等。可选的,该用户特征数据可以为与医疗相关的数据,如用户行为特征数据可以是用户的用药行为数据,或者用户健康指标数据可以是用户的血压测量数据,或者用户个体数据可以是用户的病理数据,如是否患有慢性病或其他并发症等。此处与用户特征数据不做限制。
示例性的,以目标用户为慢性病患者为例,对应的患者特征数据可以为与医疗相关的数据,该患者特征数据可以包括用药行为数据,如具体可以是该患者的针对所患慢性病的用药情况(如用药名称、用药频次、用药时间、用药用量等),以及该患者特征数据还可以包括健康指标数据,如具体可以是该患者的血压变化情况,如具体可以是该患者服用药品前后的血压变化情况(如用药前多个时间段的测量血压、用药前的平均测量血压、用药后多个时间段的测量血压、用药后的平均测量血压等)。
S102、将用户特征数据输入第一预测模型,得到针对目标用户的预测结果;该预测结果用于指示目标用户的预测指标变化曲线。
在一个可能的实施方式中,第一预测模型可以包括训练好的生成网络,电子设备可以将用户特征数据输入第一预测模型,由第一预测模型对用户特征数据进行特征提取,得到用户特征数据对应的特征向量,并由生成网络对该用户特征数据对应的特征向量进行处理,得到针对目标用户的预测结果。预测结果为目标用户的预测指标变化曲线,该指标可以为任意能连续变化的数据,以及预测指标变化曲线为根据用户特征数据预测得到的在目标时间段内的指标变化曲线。例如在包含目标用户用药前的3小时以及用药后的3小时的目标时间段内,目标用户的血压变化曲线。
此外,当用户特征数据为多种表征不同维度特征的特征数据时,通过第一预测模型可以实现将该多种不同维度特征的特征数据关联起来建立与指标变化之间的隐含关系。例如,用户特征数据包括用药行为数据和血压测量数据,由于用药行为与血压变化相关,通过第一预测模型可以将目标用户的用药行为与血压变化关联起来,实现预测输出对应的血压变化曲线;当通过多种与血压相关的特征进行关联预测时,可以使得输入特征更多,以及预测得到的血压变化曲线更准确。
S103、根据预测指标变化曲线确定N个指标变化曲线片段,并确定N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征。
在一个可能的实施方式中,电子设备可以对预测指标变化曲线进行滑动窗口处理,得到N个指标变化曲线片段,即此时该N个指标变化曲线片段之间为时间连续的曲线片段。其中,N为正整数,N的数量以及滑动窗口的大小可以由相关业务人员根据经验值确定;或者,也可以是电子设备根据指定的时间段(例如,以血压变化指标为例,指定的时间段可以为用药前的XX时间-XX时间、用药时的XX时间-XX时间、用药后的XX时间-XX时间等)从预测指标变化曲线中确定出对应的指标变化曲线片段,从而得到N个指标变化曲线片段,例如可以是根据容易出现指标异常的多个时间段确定出N个指标变化曲线片段等,即此时该N个指标变化曲线片段之间为时间不连续的曲线片段。
在一个可能的实施方式中,电子设备确定每个指标变化曲线片段的初始指标变化特征可以是将该每个指标变化曲线片段分别输入神经网络模型中,得到对应的初始指标变化特征;初始指标变化特征的形式可以为向量。其中,该神经网络模型可以是卷积神经网络(Convolutional Neural Network,CNN)模型,也可以是残差网络(Residual Network,ResNet)模型等。
S104、根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征。
其中,由于每个指标变化曲线片段表示的是预测指标变化曲线中一个时间段内的曲线片段,预测指标变化曲线中不同时间点对应的的指标之间可能会存在相互影响,因此每个指标变化曲线片段会存在关联的指标变化曲线片段,即所关联的指标变化曲线片段会对该被关联的指标变化曲线片段中的曲线变化有一定影响。如所关联的指标变化曲线片段波动密集或者曲线上升过快至超过正常阈值等,被关联的指标变化曲线片段可能也会处于异常指标变化状态,或者处于从异常指标变化状态转向正常指标变化状态阶段。
在一些实施例中,与每个指标变化曲线片段关联的指标变化曲线片段可以是N个指标变化曲线片段中位于该每个指标变化曲线片段的前一个曲线片段。例如,指标变化曲线片段为血压变化曲线片段,N个血压变化曲线片段为3个血压变化曲线片段,与第2个血压变化曲线片段关联的血压变化曲线片段为第1个血压变化曲线片段,与第3个血压变化曲线片段关联的血压变化曲线片段为第2个血压变化曲线片段;可选的,在第1个血压变化曲线片段时,与第1个血压变化曲线片段关联的血压变化曲线片段的关联血压变化特征可以是一个预设特征向量,该预测特征向量可以由相关业务人员根据经验值设置,或者也可以是将此前对目标用户进行预测所得到的历史预测血压变化曲线的曲线特征作为该关联血压变化特征。
可选的,与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征可以是该关联的指标变化曲线片段的目标指标变化特征。即将N个指标变化曲线片段中第i-1个指标变化曲线片段的目标指标变化特征作为第i-1个指标变化曲线片段的关联指标变化特征,并结合第i个指标变化曲线片段的初始指标变化特征共同确定第i个指标变化曲线片段的目标指标变化特征;i为大于1且小于或等于N的正整数。可以理解的是,每个指标变化曲线片段的初始指标变化特征包含自身的特征信息,而每个指标变化曲线片段的目标指标变化特征除了包含自身的特征信息时,还可以包含此前的指标变化曲线片段的特征信息。可选的,目标指标变化特征的形式可以为向量。
在一个可能的实施方式中,电子设备根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征具体可以是,根据初始指标变化特征包含的多个元素值中每个元素值分别与关联指标变化特征的乘积确定目标指标变化特征。其中,根据初始指标变化特征包含的多个元素值中每个元素值分别与关联指标变化特征的乘积确定目标指标变化特征可以是,将每个元素值分别与关联指标变化特征中的元素值相乘再求和,得到每个元素值分别对应的目标特征值,将每个元素值分别对应的目标特征值进行拼接得到的向量作为目标指标变化特征。
S105、将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值。
在一个可能的实施方式中,第二预测模型可以是分类模型,如可以是sigmoid神经网络模型或者逻辑回归模型(Logistic Regression),分类模型可以基于每个指标变化曲线片段的目标指标变化特征对每个指标变化曲线片段进行分类,即该每个指标变化曲线片段为异常片段或不异常片段。电子设备可以将每个指标变化曲线片段的目标指标变化特征输入分类模型,由分类模型根据每个指标变化曲线片段的目标指标变化特征进行预测输出预测结果,该预测结果可以表示分类结果,即异常片段或者不异常片段,可以通过预测结果确定每个指标变化曲线片段的异常值,如可以将所输出的为异常片段的概率作为异常值。异常值越大,对应的指标变化曲线片段有异常的可能性越大,反之,异常值越小,对应的指标变化曲线片段有异常的可能性越小。
S106、根据每个指标变化曲线片段的异常值从N个指标变化曲线片段中确定出异常指标变化曲线片段。
在一些实施例中,电子设备可以将N个指标变化曲线片段中异常值大于异常阈值的指标变化曲线片段确定为异常指标变化曲线片段;该异常指标变化曲线片段可以理解为是疑似有异常的指标变化曲线片段。该异常阈值可以由相关业务人员根据经验值设置,不同的指标变化曲线片段对应的异常阈值可以不相同也可以相同。例如,在确定出异常血压变化曲线片段之后,可以进一步对该异常血压变化曲线片段进行异常分析,以确定目标用户的健康状况等。
本申请实施例中,电子设备可以获取目标用户的用户特征数据,将用户特征数据输入第一预测模型,得到针对目标用户的预测结果,该预测结果用于指示目标用户的预测指标变化曲线,根据预测指标变化曲线确定N个指标变化曲线片段,并确定N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征,根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征,将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值,根据每个指标变化曲线片段的异常值从N个指标变化曲线片段中确定出异常指标变化曲线片段。通过实施本申请实施例所提出的方法,可以结合用户特征数据(如用户的相关医疗数据等)得到目标用户的预测指标变化曲线,通过该曲线可以判断有无异常变化,后续可以从预测指标变化曲线中确定出可能存在异常的片段,并通过可能异常的片段对目标用户进行分析,以及可以提高对指标数据分析的准确性。
请参见图2,图2为本申请实施例提供的一种指标数据处理方法的流程示意图,该方法可以由上述提及的电子设备执行。如图2所示,本申请实施例中指标数据处理方法的流程可以包括如下:
S201、获取目标用户的第一特征数据和第二特征数据。
在一些实施例中,电子设备可以获取目标用户的用户特征数据,该用户特征数据可以包括第一特征数据和第二特征数据,第一特征数据所表征的特征维度与第二特征数据所表征的特征维度不同。可选的,用户特征数据还可以包括目标用户的多种(两种以上)特征维度的特征数据,并根据该多种特征数据得到针对目标用户的融合特征向量,以用于得到预测指标变化曲线。为了便于阐述,后续以第一特征数据为用药行为数据、第二特征数据为血压测量数据为例进行说明。
S202、将第一特征数据输入第一预测模型,得到针对目标用户的第一特征向量,并将第二特征数据输入第一预测模型,得到针对目标用户的第一特征向量。
在一个可能的实施方式中,电子设备可以将第一特征数据输入第一预测模型,由第一预测模型对第一特征数据进行向量化处理,得到第一特征向量,以及可以将第二特征数据输入第一预测模型,由第一预测模型对第二特征数据进行向量化处理,得到第二特征向量。
在一些实施例中,对第一特征数据进行向量化处理具体可以是,从第一特征数据中获取数据类型为稀疏类型的第一子特征数据,并从第一特征数据中获取特征类型为稠密类型的第二子特征数据,根据第一子特征数据生成第一子特征矩阵,根据第二子特征数据生成第二子特征矩阵,根据第一子特征矩阵和第二子特征矩阵生成第一特征向量。其中,稀疏类型是指第一特征数据中的不可量化特征,稠密类型是指第一特征数据中的可量化特征。例如第一特征数据中为稀疏类型的子特征数据可以是用药名称等,第一特征数据中为稠密类型的子特征数据可以是用药频次、用药时间、用药用量等,以及相应的,第二特征数据中为稠密类型的子特征数据可以是用药前多个时间段的测量血压、用药前的平均测量血压、用药后多个时间段的测量血压、用药后的平均测量血压等。
在一些实施例中,根据第一子特征数据生成第一特征矩阵具体可以是,构建第一嵌入向量库,并根据第一子特征数据所包括的各个第一子特征从第一嵌入向量库中查询出各个第一子特征分别对应的特征嵌入向量,并将各个第一子特征分别对应的特征嵌入向量所构成的矩阵作为第一子特征矩阵;根据第二子特征数据生成第二特征矩阵具体可以是,构建第二嵌入向量库,并根据第二子特征数据所包括的各个第二子特征从第二嵌入向量库中查询出各个第二子特征分别对应的特征嵌入向量,并将各个子特征分别对应的特征值与各个第二子特征分别对应的特征嵌入向量的乘积作为各个第二子特征分别对应的目标特征嵌入向量,并将各个第二子特征分别对应的目标特征嵌入向量所构成的矩阵作为第二子特征矩阵。可选的,第一特征数据和第二特征数据中的为稀疏类型的子特征数据可以共用一个嵌入向量库,也可以是使用的是不同的嵌入向量库,以及第一特征数据和第二特征数据中的为稠密类型的子特征数据可以共用一个嵌入向量库,也可以是使用的是不同的嵌入向量库。可选的,该第一特征数据所使用的两种嵌入向量库(第一嵌入向量库和第二嵌入向量库)以及第二特征数据所使用的两种嵌入向量库可以是预先构建好的嵌入向量库,也可以是作为第一预测模型的模型参数,由模型训练所得到的。
在一些实施例中,根据第一子特征矩阵和第二子特征矩阵生成第一特征向量具体可以是,将第一子特征矩阵和第二子特征矩阵进行拼接,得到拼接矩阵,并对拼接矩阵进行降维处理,得到第一特征向量;或者可以是将第一子特征矩阵进行降维处理,得到第一初始特征向量,并将第二子特征矩阵进行降维处理,得到第二初始特征向量,根据第一初始特征向量和第二初始特征向量确定第一特征向量。其中,根据第一初始特征向量和第二初始特征向量确定第一特征向量可以是将第一初始特征向量与第二初始特征向量的拼接向量作为第一特征向量,也可以是将第一初始特征向量和第二初始特征向量的和向量作为第一特征向量,也可以是将第一初始特征向量和第二初始特征向量相乘所得到的向量作为第一特征向量。可选的,由第一预测模型对第二特征数据进行向量化处理,得到第二特征向量的具体方式可以同由第一预测模型对第一特征数据进行向量化处理,得到第一特征向量的具体方式,此处不再赘述。
S203、根据第一特征向量、第二特征向量和第一预测模型,得到针对目标用户的预测结果;该预测结果用于指示目标用户的预测指标变化曲线。
在一个可能的实施方式中,电子设备根据第一特征向量、第二特征向量和第一预测模型,得到针对目标用户的预测结果具体可以是,在第一预测模型中将第一特征向量和第二特征向量进行特征融合,得到融合特征向量,根据融合特征向量和第一预测模型,得到针对目标用户的预测结果。其中,将第一特征向量和第二特征向量进行特征融合,得到融合特征向量具体可以是,将第一特征向量和第二特征向量进行拼接所得到的向量作为融合特征向量;或者,从第一预测模型中获取融合特征矩阵,将第一特征向量、融合特征矩阵和第二特征向量依次相乘所得到的向量作为融合特征矩阵,该融合特征矩阵可以为预设的矩阵,也可以作为第一预测模型的模型参数由训练得到。通过特征融合可以实现第一特征向量和第二特征向量的特征交互,以及可以将第一特征向量所表征的目标用户特征和第二特征向量所表征的目标用户特征进行关联。
在一个可能的实施方式中,第一预测模型可以包括训练好的生成网络,电子设备可以通过生成网络对融合特征向量进行处理,得到针对目标用户的预测结果。该生成网络可以包括目标神经网络,因此电子设备根据融合特征向量和第一预测模型,得到针对目标用户的预测结果具体可以是,对第一预测模型包括的目标神经网络进行N次神经元失效处理,根据融合特征向量和N次神经元失效处理后的第一预测模型,得到N个针对目标用户的初始预测结果,根据N个针对目标用户的初始预测结果确定出针对目标用户的预测结果;该初始预测结果用于指示经神经失效处理后的第一预测模型生成的初始预测指标变化曲线。
其中,该神经元失效处理又称dropout处理,即对目标神经网络中的神经元设置一个失效概率,神经元失效处理为使得目标神经网络中的部分神经元以一定的失效概率进行失效,即不参与这次的模型预测工作。该目标神经网络中的部分神经元可以是卷积神经网络中的部分神经元,也可以是全连接层网络中的部分神经元。例如,假设神经元失效处理的是目标神经网络中的全连接层网络,以及该目标神经网络中全连接层网络的神经元的个数为100个,并使得全连接层的神经元以0.4的概率进行失效,因此进行神经元失效处理后的全连接层大约会为40个神经元不参与预测工作,以及每次进行神经失效处理后不参与预测工作的40个神经元不完成相同。
可以理解的是,将目标神经网络看成是训练后的第一预测模型包括的生成网络中的整个网络时,对目标神经网络进行一次神经元失效处理后,相当于得到了一个子网络,通过N次神经元失效处理后则得到了N个子网络,通过该生成网络包括的多个子网络对融合特征向量进行预测可以生成N个不同的初始预测结果,即得到N个不同的初始预测指标变化曲线,通过神经元失效处理可以防止模型过拟合。
在一些实施例中,电子设备根据N个针对目标用户的初始预测结果确定出针对目标用户的预测结果,可以是将N个初始预测结果所指示的N个初始预测指标变化曲线进行均值处理所得到的平均曲线作为针对目标用户的预测结果。通过该预测指标变化曲线,可以基于该预测指标变化曲线确定目标用户在目标时间段内的指标变化程度、指标波动程度、指标变化后的指标稳定区间等,以及可以获取到预测指标变化曲线中的异常指标变化曲线片段,并基于该异常指标变化曲线片段判断目标用户是否存在异常,以提高指标数据分析准确性。
在一个可能的实施方式中,第一预测模型可以是通过对第一初始预测模型进行训练得到的,第一初始预测模型可以包括初始生成网络以及初始判别网络,因此训练过程具体可以是,获取样本用户的样本用户特征数据和样本指标变化曲线,将样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对样本用户的样本预测结果,该样本预测结果用于指示样本用户的样本预测指标变化曲线,将样本预测指标变化曲线和样本指标变化曲线输入第一初始预测模型的初始判别网络,得到判别结果,该判断结果用于表示样本预测指标变化曲线为样本指标变化曲线的可能性,利用样本预测指标变化曲线、样本指标变化曲线和判别结果更新第一初始预测模型的模型参数,得到第一预测模型;该第一预测模型中包括对初始生成网络进行参数更新后所得到的生成网络,该生成网络用于根据目标用户的融合特征向量生成预测结果。通过训练第一初始预测模型中的初始生成网络和初始判别网络直至模型收敛,得到包括训练好的生成网络的第一预测模型。
可选的,若样本用户特征数据包括第一样本特征数据和第二样本特征数据,电子设备将样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对样本用户的样本预测结果具体可以是,将第一样本特征数据输入第一初始预测模型得到第一样本特征向量,将第二样本特征数据输入第二初始预测模型得到第二样本特征向量,并对第一样本特征向量和第二样本特征向量进行特征融合,得到融合样本特征向量,根据融合样本特征向量和初始生成网络,得到针对样本用户的样本预测结果。
S204、根据预测指标变化曲线确定N个指标变化曲线片段,并确定N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征。其中,步骤S204的具体实施方式可以参见步骤S103的相关描述,此处不再赘述。
S205、根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征。
其中,N个指标变化曲线片段包括第i个指标变化曲线片段,i为小于或等于N的整数;若i为1,与第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征可以为预设特征向量;若i大于1,与第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征可以为N个指标变化曲线片段包括的第i-1个指标变化曲线片段的目标指标变化特征。
例如,指标变化曲线片段为血压变化曲线片段,N个血压变化曲线片段为3个血压变化曲线片段,与第2个血压变化曲线片段关联的血压变化曲线片段为第1个血压变化曲线片段,与第3个血压变化曲线片段关联的血压变化曲线片段为第2个血压变化曲线片段,以及与第1个血压变化曲线片段关联的血压变化曲线片段的关联血压变化特征可以为预设特征向量,与第2个血压变化曲线片段关联的血压变化曲线片段的关联血压变化特征可以为第1个血压变化曲线片段的关联血压变化特征(即目标血压变化特征),与第3个血压变化曲线片段关联的血压变化曲线片段的关联血压变化特征可以为第2个血压变化曲线片段的关联血压变化特征(即目标血压变化特征)。
在一个可能的实施方式中,电子设备根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征具体可以是,将关联指标变化特征和初始指标变化特征进行拼接,得到每个指标变化曲线片段对应的拼接特征向量,根据拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量,根据第一方向的关联特征向量和第二方向的关联特征向量确定每个指标变化曲线片段的目标指标变化特征。其中,第一方向可以是针对拼接特征向量从左到右的方向,第二方向可以是针对拼接特征向量从右到左的方向。电子设备根据拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量可以是利用双向长短期记忆网络(Bi-directional Long Short-Term Memory,BiLSTM)对拼接特征向量进行处理得到第一方向的关联特征向量和第二方向的关联特征向量,即可以通过BiLSTM中的前向LSTM对拼接特征向量进行处理得到第一方向的关联特征向量,以及通过BiLSTM中的后向LSTM对拼接特征向量进行处理得到第二方向的关联特征向量。
在一些实施例中,电子设备根据第一方向的关联特征向量和第二方向的关联特征向量确定每个指标变化曲线片段的目标指标变化特征具体可以是,确定第一方向的关联特征向量的第一权重,以及第二方向的关联特征向量的第二权重,并利用第一权重和第二权重分别对第一方向的关联特征向量和第二方向的关联特征向量进行加权求和,并将所得到的加权关联特征向量和作为目标指标变化特征。该第一权重和第二权重可以由相关业务人员根据经验值设定。由此可以实现将初始指标变化特征和关联指标变化特征进行双向关联融合,得到目标指标变化特征,即从第一方向(前向)和第二方向(后向)挖掘特征间的隐藏关联信息,并对该隐藏关联信息进行有效融合,可以更充分获取到曲线片段的重要特征信息,进而基于该重要特征信息进行异常值预测,可以提高异常曲线片段的预测准确性,以及提高对指标数据的分析可靠性。
S206、将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值。
在一个可能的实施方式中,第二预测模型为随机森林模型;电子设备将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值具体可以是,将每个指标变化曲线片段的目标指标变化特征输入随机森林模型,由随机森林模型包括的各个决策树根据每个指标变化曲线片段的目标指标变化特征分别进行划分,得到每个指标变化曲线片段分别对应的在各个决策树中所划分的叶子节点,根据每个指标变化曲线片段分别对应的在各个决策树中所划分的叶子节点的数值,确定每个指标变化曲线片段的异常值。
可选的,确定每个指标变化曲线片段的异常值的过程和原理相同,以目标指标变化曲线片段为例(目标指标变化曲线片段为N个指标变化曲线片段中的任一个指标变化曲线片段);电子设备可以将目标指标变化曲线片段对应的在各个决策树中所划分到的叶子节点的数值的平均值,确定为目标指标变化曲线片段的异常值。此外,可以构建样本集,由样本集对待训练的随机森林模型进行训练,得到用于预测的随机森林模型。该样本集可以包括样本指标变化曲线片段对应的样本目标指标变化特征,以及该样本目标指标变化特征对应的标签(异常标签或不异常标签);训练过程可以是,构建K个决策树(K为正整数),K个决策树包括多个叶子节点,基于随机森林算法并利用样本集对待训练的随机森林模型进行训练,得到训练好的随机森林模型,该训练好的随机森林模型中的K个决策树包括多个具有训练好的数值的叶子节点。
例如,训练好的随机森林模型含有两个决策树1和决策树2,在决策树1中,根据特征划分,目标指标变化特征被划分到a节点,a节点对应的数值为A;在决策树2中,目标指标变化特征被划分到b节点,b节点对应的数值为B,即异常值y=(A+B)/2。
S207、根据每个指标变化曲线片段的异常值从N个指标变化曲线片段中确定出异常指标变化曲线片段。其中,步骤S207的具体实施方式可以参见步骤S106的相关描述,此处不再赘述。
本申请实施例中,电子设备可以获取目标用户的第一特征数据和第二特征数据,将第一特征数据输入第一预测模型,得到针对目标用户的第一特征向量,并将第二特征数据输入第一预测模型,得到针对目标用户的第一特征向量,根据第一特征向量、第二特征向量和第一预测模型,得到针对目标用户的预测结果,该预测结果用于指示目标用户的预测指标变化曲线,根据预测指标变化曲线确定N个指标变化曲线片段,并确定N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征,根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征,将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值,根据每个指标变化曲线片段的异常值从N个指标变化曲线片段中确定出异常指标变化曲线片段。通过实施本申请实施例所提出的方法,可以结合第一特征数据和第二特征数据得到融合特征向量,并基于融合特征向量预测得到目标用户的预测指标变化曲线,通过该曲线可以判断有无异常变化,后续可以从预测指标变化曲线中确定出可能存在异常的片段,并通过可能异常的片段对目标用户进行分析,以及可以提高对指标数据分析的准确性。
请参见图3,图3为本申请提供的一种指标数据处理装置的结构示意图。需要说明的是,图3所示的指标数据处理装置,用于执行本申请图1和图2所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示,经参照本申请图1和图2所示的实施例。该指标数据处理装置300可包括:获取模块301、输入模块302、确定模块303。其中:
获取模块301,用于获取目标用户的用户特征数据;
输入模块302,用于将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
确定模块303,用于根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
所述确定模块303,还用于根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
所述输入模块302,还用于将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
所述确定模块303,还用于根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
在一个可能的实施方式中,所述N个指标变化曲线片段包括第i个指标变化曲线片段,i为小于或等于N的整数;若i为1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为预设特征向量;若i大于1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为所述N个指标变化曲线片段包括的第i-1个指标变化曲线片段的目标指标变化特征。
在一个可能的实施方式中,所述确定模块303在用于根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征时,具体用于:
将所述关联指标变化特征和所述初始指标变化特征进行拼接,得到所述每个指标变化曲线片段对应的拼接特征向量;
根据所述拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量;
根据所述第一方向的关联特征向量和所述第二方向的关联特征向量确定所述每个指标变化曲线片段的目标指标变化特征。
在一个可能的实施方式中,所述第二预测模型为随机森林模型;
所述输入模块302在用于将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值时,具体用于:
将所述每个指标变化曲线片段的目标指标变化特征输入所述随机森林模型,由所述随机森林模型包括的各个决策树根据所述每个指标变化曲线片段的目标指标变化特征分别进行划分,得到所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点;
根据所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点的数值,确定所述每个指标变化曲线片段的异常值。
在一个可能的实施方式中,所述用户特征数据包括第一特征数据和第二特征数据,所述第一特征数据所表征的特征维度与所述第二特征数据所表征的特征维度不同;
所述输入模块302在用于将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果时,具体用于:
将所述第一特征数据输入所述第一预测模型,得到针对所述目标用户的第一特征向量;
将所述第二特征数据输入所述第一预测模型,得到针对所述目标用户的第二特征向量;
将所述第一特征向量和所述第二特征向量进行特征融合,得到融合特征向量;
根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果。
在一个可能的实施方式中,所述输入模块302在用于根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果时,具体用于:
对所述第一预测模型包括的目标神经网络进行N次神经元失效处理;
根据所述融合特征向量和所述N次神经元失效处理后的第一预测模型,得到N个针对所述目标用户的初始预测结果;所述初始预测结果用于指示经神经元失效处理后的第一预测模型生成的初始预测指标变化曲线;
根据所述N个针对所述目标用户的初始预测结果确定出针对所述目标用户的预测结果。
在一个可能的实施方式中,所述输入模块302还用于:
获取样本用户的样本用户特征数据和样本指标变化曲线;
将所述样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对所述样本用户的样本预测结果;所述样本预测结果用于指示所述样本用户的样本预测指标变化曲线;
将所述样本预测指标变化曲线和所述样本指标变化曲线输入所述第一初始预测模型的初始判别网络,得到判别结果;所述判别结果用于表示所述样本预测指标变化曲线为所述样本指标变化曲线的可能性;
利用所述样本预测指标变化曲线、所述样本指标变化曲线和所述判别结果更新所述第一初始预测模型的模型参数,得到所述第一预测模型;所述第一预测模型包括对所述初始生成网络进行参数更新后所得到的生成网络,所述生成网络用于根据所述目标用户的融合特征向量生成所述预测结果。
本申请实施例中,获取模块获取目标用户的用户特征数据;输入模块将用户特征数据输入第一预测模型,得到针对目标用户的预测结果,该预测结果用于指示目标用户的预测指标变化曲线;确定模块根据预测指标变化曲线确定N个指标变化曲线片段,并确定N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;确定模块根据每个指标变化曲线片段的初始指标变化特征以及与每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定每个指标变化曲线片段的目标指标变化特征;输入模块将每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;确定模块根据每个指标变化曲线片段的异常值从N个指标变化曲线片段中确定出异常指标变化曲线片段。通过实施本申请实施例所提出的装置,可以结合用户特征数据(如用户的相关医疗数据等)得到目标用户的预测指标变化曲线,通过该曲线可以判断有无异常变化,后续可以从预测指标变化曲线中确定出可能存在异常的片段,并通过可能异常的片段对目标用户进行分析,以及可以提高对指标数据分析的准确性。
在本申请各个实施例中的各功能模块可以集成在一个模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现,本申请不做限定。
请参见图4,图4为本申请实施例提供的一种电子设备的结构示意图。如图4所示,该电子设备400包括:至少一个处理器401、存储器402。可选的,该电子设备还可包括网络接口。其中,所述处理器401、存储器402以及网络接口之间可以交互数据,网络接口受所述处理器401的控制用于收发消息,存储器402用于存储计算机程序,所述计算机程序包括程序指令,处理器401用于执行存储器402存储的程序指令。其中,处理器401被配置用于调用所述程序指令执行上述方法。
所述存储器402可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器402也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;所述存储器402还可以包括上述种类的存储器的组合。
所述处理器401可以是中央处理器(central processing unit,CPU)。在一个实施例中,所述处理器401还可以是图形处理器(Graphics Processing Unit,GPU)。所述处理器401也可以是由CPU和GPU的组合。
在一个可能的实施方式中,所述存储器402用于存储程序指令,所述处理器401可以调用所述程序指令,执行以下步骤:
获取目标用户的用户特征数据;
将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
在一个可能的实施方式中,所述N个指标变化曲线片段包括第i个指标变化曲线片段,i为小于或等于N的整数;若i为1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为预设特征向量;若i大于1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为所述N个指标变化曲线片段包括的第i-1个指标变化曲线片段的目标指标变化特征。
在一个可能的实施方式中,所述处理器401在用于根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征时,具体用于:
将所述关联指标变化特征和所述初始指标变化特征进行拼接,得到所述每个指标变化曲线片段对应的拼接特征向量;
根据所述拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量;
根据所述第一方向的关联特征向量和所述第二方向的关联特征向量确定所述每个指标变化曲线片段的目标指标变化特征。
在一个可能的实施方式中,所述第二预测模型为随机森林模型;
所述处理器401在用于将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值时,具体用于:
将所述每个指标变化曲线片段的目标指标变化特征输入所述随机森林模型,由所述随机森林模型包括的各个决策树根据所述每个指标变化曲线片段的目标指标变化特征分别进行划分,得到所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点;
根据所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点的数值,确定所述每个指标变化曲线片段的异常值。
在一个可能的实施方式中,所述用户特征数据包括第一特征数据和第二特征数据,所述第一特征数据所表征的特征维度与所述第二特征数据所表征的特征维度不同;
所述处理器401在用于将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果时,具体用于:
将所述第一特征数据输入所述第一预测模型,得到针对所述目标用户的第一特征向量;
将所述第二特征数据输入所述第一预测模型,得到针对所述目标用户的第二特征向量;
将所述第一特征向量和所述第二特征向量进行特征融合,得到融合特征向量;
根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果。
在一个可能的实施方式中,所述处理器401在用于根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果时,具体用于:
对所述第一预测模型包括的目标神经网络进行N次神经元失效处理;
根据所述融合特征向量和所述N次神经元失效处理后的第一预测模型,得到N个针对所述目标用户的初始预测结果;所述初始预测结果用于指示经神经元失效处理后的第一预测模型生成的初始预测指标变化曲线;
根据所述N个针对所述目标用户的初始预测结果确定出针对所述目标用户的预测结果。
在一个可能的实施方式中,所述处理器401还用于:
获取样本用户的样本用户特征数据和样本指标变化曲线;
将所述样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对所述样本用户的样本预测结果;所述样本预测结果用于指示所述样本用户的样本预测指标变化曲线;
将所述样本预测指标变化曲线和所述样本指标变化曲线输入所述第一初始预测模型的初始判别网络,得到判别结果;所述判别结果用于表示所述样本预测指标变化曲线为所述样本指标变化曲线的可能性;
利用所述样本预测指标变化曲线、所述样本指标变化曲线和所述判别结果更新所述第一初始预测模型的模型参数,得到所述第一预测模型;所述第一预测模型包括对所述初始生成网络进行参数更新后所得到的生成网络,所述生成网络用于根据所述目标用户的融合特征向量生成所述预测结果。
具体实现中,本申请实施例中所描述的装置、处理器401、存储器402等可执行上述方法实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
本申请实施例中还提供一种计算机(可读)存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时,使所述处理器可执行上述方法实施例中所执行的部分或全部步骤。可选的,该计算机存储介质可以是易失性的,也可以是非易失性的。所述的计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例提供了一种计算机程序产品,该计算机程序产品可包括计算机程序,计算机程序被处理器执行时可实现上述方法中的部分或全部步骤,此处不赘述。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机存储介质中,该计算机存储介质可以为计算机可读存储介质,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请的部分实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。

Claims (10)

1.一种指标数据处理方法,其特征在于,所述方法包括:
获取目标用户的用户特征数据;
将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
2.根据权利要求1所述的方法,其特征在于,所述N个指标变化曲线片段包括第i个指标变化曲线片段,i为小于或等于N的整数;若i为1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为预设特征向量;若i大于1,与所述第i个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征为所述N个指标变化曲线片段包括的第i-1个指标变化曲线片段的目标指标变化特征。
3.根据权利要求1所述的方法,其特征在于,所述根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征,包括:
将所述关联指标变化特征和所述初始指标变化特征进行拼接,得到所述每个指标变化曲线片段对应的拼接特征向量;
根据所述拼接特征向量确定第一方向的关联特征向量和第二方向的关联特征向量;
根据所述第一方向的关联特征向量和所述第二方向的关联特征向量确定所述每个指标变化曲线片段的目标指标变化特征。
4.根据权利要求1所述的方法,其特征在于,所述第二预测模型为随机森林模型;
所述将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值,包括:
将所述每个指标变化曲线片段的目标指标变化特征输入所述随机森林模型,由所述随机森林模型包括的各个决策树根据所述每个指标变化曲线片段的目标指标变化特征分别进行划分,得到所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点;
根据所述每个指标变化曲线片段分别对应的在所述各个决策树中所划分的叶子节点的数值,确定所述每个指标变化曲线片段的异常值。
5.根据权利要求1所述的方法,其特征在于,所述用户特征数据包括第一特征数据和第二特征数据,所述第一特征数据所表征的特征维度与所述第二特征数据所表征的特征维度不同;
所述将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果,包括:
将所述第一特征数据输入所述第一预测模型,得到针对所述目标用户的第一特征向量;
将所述第二特征数据输入所述第一预测模型,得到针对所述目标用户的第二特征向量;
将所述第一特征向量和所述第二特征向量进行特征融合,得到融合特征向量;
根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果。
6.根据权利要求5所述的方法,其特征在于,所述根据所述融合特征向量和所述第一预测模型,得到针对所述目标用户的预测结果,包括:
对所述第一预测模型包括的目标神经网络进行N次神经元失效处理;
根据所述融合特征向量和所述N次神经元失效处理后的第一预测模型,得到N个针对所述目标用户的初始预测结果;所述初始预测结果用于指示经神经元失效处理后的第一预测模型生成的初始预测指标变化曲线;
根据所述N个针对所述目标用户的初始预测结果确定出针对所述目标用户的预测结果。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取样本用户的样本用户特征数据和样本指标变化曲线;
将所述样本用户特征数据输入第一初始预测模型中的初始生成网络,生成针对所述样本用户的样本预测结果;所述样本预测结果用于指示所述样本用户的样本预测指标变化曲线;
将所述样本预测指标变化曲线和所述样本指标变化曲线输入所述第一初始预测模型的初始判别网络,得到判别结果;所述判别结果用于表示所述样本预测指标变化曲线为所述样本指标变化曲线的可能性;
利用所述样本预测指标变化曲线、所述样本指标变化曲线和所述判别结果更新所述第一初始预测模型的模型参数,得到所述第一预测模型;所述第一预测模型包括对所述初始生成网络进行参数更新后所得到的生成网络,所述生成网络用于根据所述目标用户的融合特征向量生成所述预测结果。
8.一种文本相关性的确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标用户的用户特征数据;
输入模块,用于将所述用户特征数据输入第一预测模型,得到针对所述目标用户的预测结果;所述预测结果用于指示所述目标用户的预测指标变化曲线;
确定模块,用于根据所述预测指标变化曲线确定N个指标变化曲线片段,并确定所述N个指标变化曲线片段中每个指标变化曲线片段的初始指标变化特征;N为正整数;
所述确定模块,还用于根据所述每个指标变化曲线片段的初始指标变化特征以及与所述每个指标变化曲线片段关联的指标变化曲线片段的关联指标变化特征,确定所述每个指标变化曲线片段的目标指标变化特征;
所述输入模块,还用于将所述每个指标变化曲线片段的目标指标变化特征分别输入第二预测模型,得到每个指标变化曲线片段的异常值;
所述确定模块,还用于根据所述每个指标变化曲线片段的异常值从所述N个指标变化曲线片段中确定出异常指标变化曲线片段。
9.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN202111065905.3A 2021-09-10 2021-09-10 指标数据处理方法、相关设备及介质 Active CN113782187B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111065905.3A CN113782187B (zh) 2021-09-10 2021-09-10 指标数据处理方法、相关设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111065905.3A CN113782187B (zh) 2021-09-10 2021-09-10 指标数据处理方法、相关设备及介质

Publications (2)

Publication Number Publication Date
CN113782187A true CN113782187A (zh) 2021-12-10
CN113782187B CN113782187B (zh) 2023-06-27

Family

ID=78842929

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111065905.3A Active CN113782187B (zh) 2021-09-10 2021-09-10 指标数据处理方法、相关设备及介质

Country Status (1)

Country Link
CN (1) CN113782187B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453669A (zh) * 2023-06-14 2023-07-18 武汉大学中南医院 一种基于大数据的护理预测方法及装置

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485262A (zh) * 2016-09-09 2017-03-08 国网山西省电力公司晋城供电公司 一种母线负荷预测方法
CN110032670A (zh) * 2019-04-17 2019-07-19 腾讯科技(深圳)有限公司 时序数据的异常检测方法、装置、设备及存储介质
US20190391574A1 (en) * 2018-06-25 2019-12-26 Nec Laboratories America, Inc. Early anomaly prediction on multi-variate time series data
CN111679949A (zh) * 2020-04-23 2020-09-18 平安科技(深圳)有限公司 基于设备指标数据的异常检测方法及相关设备
CN112221156A (zh) * 2020-10-27 2021-01-15 腾讯科技(深圳)有限公司 数据异常识别方法、装置、存储介质以及电子设备
CN112241351A (zh) * 2020-09-30 2021-01-19 中国银联股份有限公司 数据处理方法、装置、设备和介质
CN112288163A (zh) * 2020-10-29 2021-01-29 平安科技(深圳)有限公司 目标对象的目标因子预测方法及相关设备
WO2021073152A1 (zh) * 2019-10-14 2021-04-22 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
WO2021082861A1 (zh) * 2019-10-31 2021-05-06 平安科技(深圳)有限公司 评分方法、装置、电子设备及存储介质
CN113011646A (zh) * 2021-03-15 2021-06-22 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及可读存储介质
WO2021135449A1 (zh) * 2020-06-30 2021-07-08 平安科技(深圳)有限公司 基于深度强化学习的数据分类方法、装置、设备及介质
WO2021139241A1 (zh) * 2020-05-13 2021-07-15 平安科技(深圳)有限公司 基于人工智能的患者分群方法、装置、设备及存储介质

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106485262A (zh) * 2016-09-09 2017-03-08 国网山西省电力公司晋城供电公司 一种母线负荷预测方法
US20190391574A1 (en) * 2018-06-25 2019-12-26 Nec Laboratories America, Inc. Early anomaly prediction on multi-variate time series data
CN110032670A (zh) * 2019-04-17 2019-07-19 腾讯科技(深圳)有限公司 时序数据的异常检测方法、装置、设备及存储介质
WO2021073152A1 (zh) * 2019-10-14 2021-04-22 平安科技(深圳)有限公司 基于神经网络的数据标签生成方法、装置、终端及介质
WO2021082861A1 (zh) * 2019-10-31 2021-05-06 平安科技(深圳)有限公司 评分方法、装置、电子设备及存储介质
CN111679949A (zh) * 2020-04-23 2020-09-18 平安科技(深圳)有限公司 基于设备指标数据的异常检测方法及相关设备
WO2021139241A1 (zh) * 2020-05-13 2021-07-15 平安科技(深圳)有限公司 基于人工智能的患者分群方法、装置、设备及存储介质
WO2021135449A1 (zh) * 2020-06-30 2021-07-08 平安科技(深圳)有限公司 基于深度强化学习的数据分类方法、装置、设备及介质
CN112241351A (zh) * 2020-09-30 2021-01-19 中国银联股份有限公司 数据处理方法、装置、设备和介质
CN112221156A (zh) * 2020-10-27 2021-01-15 腾讯科技(深圳)有限公司 数据异常识别方法、装置、存储介质以及电子设备
CN112288163A (zh) * 2020-10-29 2021-01-29 平安科技(深圳)有限公司 目标对象的目标因子预测方法及相关设备
CN113011646A (zh) * 2021-03-15 2021-06-22 腾讯科技(深圳)有限公司 一种数据处理方法、设备以及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JIAJUNZHANG 等: "A validated composite model to predict risk of curve progression in adolescent idiopathic scoliosis", ECLINICALMEDICINE, pages 1 - 8 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116453669A (zh) * 2023-06-14 2023-07-18 武汉大学中南医院 一种基于大数据的护理预测方法及装置
CN116453669B (zh) * 2023-06-14 2023-08-25 武汉大学中南医院 一种基于大数据的护理预测方法及装置

Also Published As

Publication number Publication date
CN113782187B (zh) 2023-06-27

Similar Documents

Publication Publication Date Title
US11526809B2 (en) Primary key-foreign key relationship determination through machine learning
CN111767707B (zh) 雷同病例检测方法、装置、设备及存储介质
CN112016318B (zh) 基于解释模型的分诊信息推荐方法、装置、设备及介质
KR100968187B1 (ko) 데이터 스트림 처리 시스템에서 출처 데이터를 유지 및 처리하는 방법 및 장치
CN112017789B (zh) 分诊数据处理方法、装置、设备及介质
CN112289442A (zh) 预测疾病终点事件的方法、装置及电子设备
CN112132624A (zh) 医疗理赔数据预测系统
CN109831665A (zh) 一种视频质检方法、系统及终端设备
CN111612278A (zh) 生命状态预测方法、装置、电子设备及存储介质
CN112784168B (zh) 信息推送模型训练方法以及装置、信息推送方法以及装置
US20220343160A1 (en) Time series data processing device configured to process time series data with irregularity
CN113782187B (zh) 指标数据处理方法、相关设备及介质
US8244656B2 (en) System and method for predicting rare events
CN111967581B (zh) 分群模型的解释方法、装置、计算机设备和存储介质
CN107562703A (zh) 字典树重构方法及系统
CN114400071A (zh) 饮食数据管理方法、相关设备及介质
CN112433952B (zh) 深度神经网络模型公平性测试方法、系统、设备及介质
CN115424725A (zh) 数据的分析方法和装置、存储介质及处理器
CN114334029A (zh) 化合物活性预测方法、网络训练方法、装置、介质及设备
CN115829755B (zh) 交易风险的预测结果的解释方法和装置
CN113723524B (zh) 基于预测模型的数据处理方法、相关设备及介质
US20240193417A1 (en) Apparatus for non-deterministic future state prediction using time series data and operation method thereof
CN116051155B (zh) 用户识别方法、装置、设备、存储介质和程序产品
CN116631642B (zh) 一种临床发现事件的抽取方法及装置
CN111177132B (zh) 关系型数据的标签清洗方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20220922

Address after: Room 2601 (Unit 07), Qianhai Free Trade Building, No. 3048, Xinghai Avenue, Nanshan Street, Qianhai Shenzhen-Hong Kong Cooperation Zone, Shenzhen, Guangdong 518000

Applicant after: Shenzhen Ping An Smart Healthcare Technology Co.,Ltd.

Address before: 1-34 / F, Qianhai free trade building, 3048 Xinghai Avenue, Mawan, Qianhai Shenzhen Hong Kong cooperation zone, Shenzhen, Guangdong 518000

Applicant before: Ping An International Smart City Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant