CN111738421A - 基于循环神经网络的数据处理方法、设备及介质 - Google Patents
基于循环神经网络的数据处理方法、设备及介质 Download PDFInfo
- Publication number
- CN111738421A CN111738421A CN202010589684.9A CN202010589684A CN111738421A CN 111738421 A CN111738421 A CN 111738421A CN 202010589684 A CN202010589684 A CN 202010589684A CN 111738421 A CN111738421 A CN 111738421A
- Authority
- CN
- China
- Prior art keywords
- time period
- neural network
- training
- model
- data processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于循环神经网络的数据处理方法、装置、设备和介质,该方法包括:获取第二待处理时序数据,输入至第二数据处理模型中;第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到;联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;基于第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到第二待处理时序数据的目标预测标签。本申请解决难以准确对时序数据进行预测的技术问题。
Description
技术领域
本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种基于循环神经网络的数据处理方法、设备及介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对数据处理也有更高的要求。
循环神经网络(Recurrent Neural Network,RNN)模型常用于处理时序数据,其中,时序数据指的是同一用户的同一时间段,在不同数据源如不同服务器上(参与方或者设备)的特征数据,例如,用户X在便利店购买了A商品,在便利店的服务器中产生一条新的销售记录,同时,用户X在银行系统的服务器也伴随着产生一条新的支出记录。
目前,不同时序数据存储在不同数据持有方或者参与方的服务器上,出于对时序数据的隐私保护,不同服务器之间不能直接进行时序数据的交互,即各服务器之间不能共享各自的时序数据以进行联合建模,进而导致各服务器只能基于少量的时序数据进行建模,致使需要训练更长时间才能使得训练后的模型达到目标性能,进而导致计算机需要耗费大量资源算力,致使计算机算力资源的利用率低。
发明内容
本申请的主要目的在于提供一种基于循环神经网络的数据处理方法、装置、设备和介质,旨在解决现有技术中,不同参与方之间不能直接进行时序数据的交互,计算机算力资源的利用率低的技术问题。
为实现上述目的,本申请提供一种基于循环神经网络的数据处理方法,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理方法包括:
获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
本申请还提供一种基于循环神经网络的数据处理装置,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理装置包括:
第一获取模块,用于获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
第一执行模块,用于基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
本申请还提供一种基于循环神经网络的数据处理设备,所述基于循环神经网络的数据处理设备为实体设备,所述基于循环神经网络的数据处理设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于循环神经网络的数据处理方法的程序,所述基于循环神经网络的数据处理方法的程序被处理器执行时可实现如上述的基于循环神经网络的数据处理方法的步骤。
本申请还提供一种介质,所述介质上存储有实现上述基于循环神经网络的数据处理方法的程序,所述基于循环神经网络的数据处理方法的程序被处理器执行时实现如上述的基于循环神经网络的数据处理方法的步骤。
本申请通过获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。与现有技术中基于少量时序数据进行建模,进而处理第二待处理时序数据相比,在本申请中采用基于已经训练完成的,第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,以得到第二待处理时序数据的目标预测标签,且所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新,进而在保护隐私的同时,实现了基于非相同时刻不同参与方的时序数据联邦构建模型,客服了现有技术中大量耗费计算机算力资源的缺陷,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。由于基于不同参与方的时序数据联邦构建模型,提升对待处理时序数据进行类型等预测的准确性,解决现有技术中,不同参与方之间不能直接进行时序数据的交互,致使难以准确对时序数据进行预测的技术问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于循环神经网络的数据处理方法第一实施例的流程示意图;
图2为本申请基于循环神经网络的数据处理方法第二实施例的细化流程示意图;
图3为本申请实施例方案涉及的硬件运行环境的设备结构示意图;
图4为本申请基于循环神经网络的数据处理方法中的第一场景示意图;
图5为本申请基于循环神经网络的数据处理方法中的第二场景示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种基于循环神经网络的数据处理方法,在本申请基于循环神经网络的数据处理方法的第一实施例中,参照图1,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理方法包括:
步骤S10,获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
步骤S20,基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
具体步骤如下:
步骤S10,获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
在本实施例中,所述基于循环神经网络的数据处理方法应用于第二设备,其中,具体不同时间段的第二设备可以是相同的,也可以是不同的,但是第二设备的设备类型相同,例如,用户在不同时间段在不同的医院看病,则不同的医院为不同的第二设备,但是第二设备都是医院,另外,所述第二设备与第一设备进行预设通信连接,特别地,第一设备可以为多个类型的设备,如第一设备可以是银行等支付机构的类型设备,还可以是电商等类型设备,对每个时间段的第一设备而言,可以包括某一具体银行以及具体的电商等两个第一设备,其中,第二设备是为主动参与方,第一设备为被动参与方,主动参与方指的是具有预设标签的第二训练时序数据的参与方,需要说明的是,主动参与方在每个时间段都是具有对应预设标签的第二训练时序数据的,以在每个时间段基于对应时间段的具有预设标签的第二训练时序数据,进行第二循环神经网络模型的训练。
需要说明的是,各个时间段的第二循环神经网络模型,各个时间段的第二训练时序数据以及各个时间段的第二中间参数是在第二设备中的,各个时间段的第一循环神经网络模型,各个时间段的第一训练时序数据以及各个时间段的第一中间参数是在第一设备中的,在本实施例中,可以是时间段确定,则第一设备以及第二设备确定,例如,t1时间段,则第二设备为a1医院,第一设备为b1银行支付系统,t2时间段,则第二设备为a2医院,第一设备为b2银行支付系统,由于可以存在多个第一设备,也即,可以存在多个第一循环神经网络模型以及第一训练时序数据。
在本实施例中,在对第二循环神经网络模型或者第一循环神经网络模型进行训练之前,每个参与方需要进行数据预处理,得到共同样本或者是共同样本集合,通过共同样本或者是共同样本集合得到训练时序数据(包括各第一设备中的各个第一训练时序数据与第二设备中的第二训练时序数据),具体地,如图4所示,可以把每个设备(参与方)所拥有的样本数据看成一个三维的矩阵,其中,x轴表示时序空间,y轴表示特征空间,z轴表示样本空间,把拥有预设标签的参与方(设备)叫做主动参与方(图4中左图所示,第二设备),其他的参与方叫做被动参与方(图4中右图所示,第一设备)。所有参与方通过预设样本对齐算法找到双方的共同样本集合(共同样本指分布于各参与方拥有不同时序特征,但描述同一实体的样本,比如共同用户集合)。如图4中主动参与方A的样本1、样本2、样本3和样本4分别对应与被动参与方B的样本1,样本2,样本3,和样本4是共同样本。另外,在本实施例中,各参与方按照约定的方法对各自样本的时序空间进行分段,每一时序段包含一部分时序特征,各参与方分配给每一时序段一个序号,序号小的时序段的在整个时序中位置靠前,时序段的长度不做限制,即时序段可以一段时间,也可以是一个时间点如时间刻。对于每一个共同样本而言,所有参与者在相同序号的时序段期间采集了该共同样本的不同特征(基于用户相同时间段的不同训练时序数据)。比如在图4中,样本1是A方和B方的一个共同样本,A,B两方在时序段1期间采集了样本1的不同特征,更实际地,例如,银行和医院在同一时间段记录同一用户的不同消费数据。
在本实施例中,第二循环神经网络模型是基于用户相同时间段的训练时序数据(包括第一训练时序数据和第二训练时序数据)共同训练的,具体地,所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的,而联邦前向训练过程中,目标时间段的第二循环神经网络模型包括目标时间段的第二初始模型参数和目标时间段的第二更新模型参数,目标时间段的第二初始模型参数为目标时间段的上一时间段的第二循环神经网络模型的第二更新模型参数,目标时间段的第二更新模型参数为目标时间段的第二初始模型参数联合目标时间段的第二训练时序数据和同一目标时间段的第一设备的第一训练时序数据训练得到的;本实施例中的用户相同时间段的训练时序数据指的是同一用户的同一时间段,在不同数据源(参与方或者设备)如不同服务器上的特征数据,例如,用户X在医院(参与方或者设备)购买了A药品,在医院的服务器中产生一条新的销售记录,同时,用户X在银行系统(参与方或者设备)的服务器也伴随着产生一条新的支出记录。
在本实施例中,具体地,还可以是三个或者多个不同类型数据源(参与方或者设备,以3个为例)即M类型数据源(参与方或者设备),N类型数据源(参与方或者设备)和L类型数据源(参与方或者设备)的时序数据共同即联邦进行第二循环神经网络模型的训练,需要说明的是,由于具有预设标签的第二训练时序数据在M类型数据源中,因而,任一时间段的M类型数据源是第二设备或者是主动参与方,任一时间段的拥有不具备数据标签数据的N类型数据源以及拥有不具备数据标签数据的L类型数据源为第一设备,其中,对于某一时间段第二设备如数据源M1,联合对应时间段的各个第一设备如数据源N1和数据源L1训练第二循环神经网络模型实质为:迭代进行第二时序训练流程,在每个第二时序训练流程中,基于目标时间段的第二设备即目标时间段的M类型数据源的在目标时间段的第二训练数据,进行目标时间段的第二中间参数的前向传播,在完成目标时间段第二中间参数的前向传播后,确定对目标时间段的第二循环神经网络模型进行模型参数的反馈调整,在该前向传播过程中,后一个时间段第二循环神经网络模型的模型参数是经由前一个时间段的第二循环神经网络模型的模型参数通过联邦不同设备的不同训练时序数据训练得到的。
步骤S20,基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
在本实施例中,第二数据处理模型是已经训练好的,因而基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程后,可以准确得到所述第二待处理时序数据的目标预测标签。
所述基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程的步骤之前,所述方法包括:
步骤S01,基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新,或者具体地,联邦前向训练过程中,目标时间段的第二循环神经网络模型包括目标时间段的第二初始模型参数和目标时间段的第二更新模型参数,目标时间段的第二初始模型参数为目标时间段的上一时间段的第二循环神经网络模型的第二更新模型参数,目标时间段的第二更新模型参数为目标时间段的第二初始模型参数联合目标时间段的第二训练时序数据和同一目标时间段的第一设备的第一训练时序数据训练得到的;
要准确对所述第二待处理时序数据执行第二预设数据处理流程,需要预先训练好第二数据处理模型。本实施例即是得到第二数据处理模型,因而,基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,且在联邦前向训练过程中,是对每个时间段的第二循环神经网络模型参数进行更改并将更改后的模型参数传播给下一个时间段,以进行下一个时间段的模型参数的再次更改并前向传播的,以得到第二目标循环神经网络模型,进而得到第二数据处理模型。
所述基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型的步骤,包括:
步骤S011,基于接收的在目标时间段对应上一时间段的前向传播的第二中间参数,所述目标时间段的第二训练时序数据,所述第二循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第二中间参数;
步骤S012,基于在目标时间段的前向传播的第二中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第二中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第二中间参数还用于计算每个时间段的损失梯度,以得到每个时间段的第二更新模型参数;
具体地,例如,接收在目标时间段对应上一时间段如t1时间段的前向传播的第二中间参数h2(t1),其中,在目标时间段对应上一时间段的前向传播的第二中间参数是通过在目标时间段对应上一时间段的再上一时间段的第二中间参数或者初始中间参数h2(t0)、在目标时间段对应上一时间段的第二训练时序数据,第二循环神经网络模型在目标时间段对应上一时间段的第二初始模型参数得到的。
在得到在目标时间段对应上一时间段的前向传播的第二中间参数h2(t1)后,还基于h2(t1)计算t1时间段的损失梯度,以得到t1时间段的第二更新模型参数,将t1时间段的第二更新模型参数作为t2时间段的初始模型参数。
如图5所示,基于在目标时间段对应上一时间段的前向传播的第二中间参数h2(t1),所述目标时间段的第二训练时序数据,所述第二循环神经网络模型在目标时间段的第二初始模型参数(第二循环神经网络模型在目标时间段的上一时间段的第二更新模型参数),确定在目标时间段的前向传播的第二中间参数,并基于所述在目标时间段的前向传播的第二中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第二中间参数h2(tn)。
步骤S013,基于所述最后时间段的第二中间参数,所述最后时间段的第二训练时序数据,所述第二循环神经网络模型在最后时间段的第二初始模型参数,最后时间段的预设预测模型,以及接收的在最后时间段的由第一设备的第一训练时序数据训练得到的第一中间参数计算对应最后时间段的第二反向中间梯度,并基于所述最后时间段的第二反向中间梯度,更新第二循环神经网络模型在最后时间段的第二更新模型参数和计算最后时间段对应上一时间段的第二反向中间梯度;
步骤S014,基于在最后时间段更新的第二循环神经网络模型的第二更新模型参数和最后时间段对应上一时间段的第二反向中间梯度进行联邦反向训练,直至最初时间段的第二循环神经网络模型的第二更新模型参数得到更新。
基于所述最后时间段的第二中间参数,所述最后时间段的第二训练时序数据,所述第二循环神经网络模型在最后时间段的第二初始模型参数,确定最后时间段的第二中间参数,基于最后时间段的第二中间参数,最后时间段的预设预测模型,以及接收的在最后时间段的由第一设备的第一训练时序数据训练得到的第一中间参数计算最后时间段的损失梯度,具体地,对最后时间段的第二中间参数和最后时间段的第一中间参数进行拼接,得到最后时间段的拼接参数,基于该最后时间段的拼接参数,以及最后时间段的预设预测模型,计算最后时间段的损失梯度,并基于所述最后时间段的损失梯度,更新所述最后时间段的预设预测模型的模型参数。
其中,通过第一设备在最后时间段的第一训练时序数据,第一设备在最后时间段的上一时间段的第一中间参数的,第一循环神经网络模型的模型参数,训练得到的第一中间参数。
基于所述最后时间段的损失梯度,所述最后时间段更新的预设预测模型的模型参数以及所述在最后时间段的第二训练时序数据,计算对应最后时间段的第二反向中间梯度g2(tn),并基于所述最后时间段的第二反向中间梯度g2(tn),更新第二循环神经网络模型在最后时间段的初始模型参数得到第二更新模型参数和计算最后时间段对应上一时间段的第二反向中间梯度g2(tn-1),并持续反向传播,更新第二循环神经网络模型在最后时间段对应上一时间段的第二更新模型参数和计算最后时间段对应上一时间段的再上一时间段的第二反向中间梯度。
基于在最后时间段对应上一时间段更新的第二循环神经网络模型的第二更新模型参数和最后时间段对应上一时间段的再上一时间段的第二反向中间梯度进行联邦反向训练,直至最初时间段的第二循环神经网络模型即t0时间段的第二循环神经网络模型的第二更新模型参数得到更新。
需要说明的是,在本实施例中,时间段可以指的是时刻。
步骤S02,将所述第二目标循环神经网络模型设置为所述第二数据处理模型。
在得到第二目标循环神经网络模型后,将所述第二目标循环神经网络模型设置为所述第二数据处理模型。
需要说明的是,在本实施例中,还可以具体应用于医疗机构,训练时序数据包括训练医疗时序数据,
所述基于第二训练医疗时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型的步骤,包括:
接收在目标时间段对应上一时间段的前向传播的第二中间参数,其中,在目标时间段对应上一时间段的前向传播的第二中间参数是通过在目标时间段对应上一时间段的再上一时间段的第二中间参数或者初始中间参数、在目标时间段对应上一时间段的第二训练医疗时序数据,第二循环神经网络模型在目标时间段对应上一时间段的第二初始模型参数得到的;
基于在目标时间段对应上一时间段的前向传播的第二中间参数,所述目标时间段的第二训练医疗时序数据,所述第二循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第二中间参数,并基于所述在目标时间段的前向传播的第二中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第二中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第二中间参数还用于计算每个时间段的损失梯度,以得到每个时间段的第二更新模型参数;
基于所述最后时间段的第二中间参数,所述最后时间段的第二训练医疗时序数据,所述第二循环神经网络模型在最后时间段的第二初始模型参数,最后时间段的预设预测模型,以及接收的在最后时间段的由第一设备的第一训练医疗时序数据训练得到的第一中间参数计算最后时间段的损失梯度,并基于所述最后时间段的损失梯度,更新所述最后时间段的预设预测模型的模型参数;
基于所述最后时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在最后时间段的第二训练医疗时序数据,计算对应最后时间段的第二反向中间梯度,并基于所述最后时间段的第二反向中间梯度,得到第二循环神经网络模型在最后时间段的第二更新模型参数和计算最后时间段对应上一时间段的第二反向中间梯度;
基于所述最后时间段对应上一时间段的第二反向中间梯度,所述在最后时间段对应上一时间段的第二训练医疗时序数据,第二循环神经网络模型在最后时间段的第二更新模型参数,更新第二循环神经网络模型在最后时间段对应上一时间段的第二更新模型参数和计算最后时间段对应上一时间段的再上一时间段的第二反向中间梯度;
基于在最后时间段对应上一时间段更新的第二循环神经网络模型的第二更新模型参数和最后时间段对应上一时间段的再上一时间段的第二反向中间梯度进行联邦反向训练,直至最初时间段的第二循环神经网络模型的第二更新模型参数得到更新。
基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签至少包括如下两种方式:
方式一:只通过已经训练好的第二循环神经网络模型,对当下时间段的第二待处理时序数据进行预测处理即执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
方式二:获取当下时间段的第二待处理时序数据对应的第一待处理时序数据,基于所述当下时间段的第二待处理时序数据和对应的第一待处理时序数据联合对已经训练好的第二循环神经网络模型进行模型参数更新后,对当下时间段的第二待处理时序数据进行预测处理即执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
在本实施例中,训练时序数据为医疗训练时序数据,所述第二待处理时序数据为第二待处理医疗时序数据,所述第二数据处理模型为医疗属性预测模型,
所述医疗属性预测模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型为联合第二训练医疗时序数据和同一目标时间段的第一设备的第一训练医疗时序数据训练得到的;
所述基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签,包括:
步骤M1.基于所医疗属性预测模型对所述第二待处理医疗时序数据执行医疗属性预测处理,得到所述第二待处理医疗时序数据的医疗属性预测结果。
具体地,第二待处理医疗时序数据可以是血压,血脂,血糖,尿酸,胆固醇,检测次数,检测时长等数据,将所述第二待处理医疗时序数据输入至训练好的医疗属性预测模型中(所述医疗属性预测模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型为联合第二训练医疗时序数据(之前在医疗机构检测到的血压,血脂,血糖,尿酸,胆固醇,检测次数,检测时长等数据)和同一目标时间段的第一设备的第一训练医疗时序数据(消费数据,贷款数据)训练得到的)后,基于所医疗属性预测模型对所述第二待处理医疗时序数据执行医疗属性预测处理,得到所述第二待处理医疗时序数据的医疗属性预测结果,该医疗属性预测结果包括大于第一预设标签值的第一医疗属性预测结果(某一医疗属性数据可能性大于90%),或者小于第一预设标签值大于第二预设标签值的第二医疗属性预测结果,或者小于第二预设标签值的第三医疗属性预测结果医疗属性预测结果不同,基于医疗属性预测结果得到的关联贷款额度不同。
本申请通过获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。与现有技术中基于少量时序数据进行建模,进而处理第二待处理时序数据相比,在本申请中采用基于已经训练完成的,第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,以得到第二待处理时序数据的目标预测标签,且所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新,进而在保护隐私的同时,实现了基于非相同时刻不同参与方的时序数据联邦构建模型,客服了现有技术中大量耗费计算机算力资源的缺陷,减少训练后的模型达到目标性能的时间耗费,提升计算机算力资源的利用率。由于基于不同参与方的时序数据联邦构建模型,提升对待处理时序数据进行类型等预测的准确性,解决现有技术中,不同参与方之间不能直接进行时序数据的交互,致使难以准确对时序数据进行预测的技术问题。
进一步地,基于本申请中第一实施例,在本申请的另一实施例中,联邦前向训练的过程中,基于目标时间段的第二初始模型参数,目标时间段的第二训练时序数据,目标时间段的前向传播的第二中间参数,接收的同一目标时间段的第一设备的第一训练时序数据确定的第一中间参数以及目标时间段的预设预测模型计算目标时间段的损失梯度,并基于所述目标时间段的损失梯度,更新所述目标时间段的预设预测模型的模型参数;
基于所述目标时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在目标时间段的第二训练时序数据,计算对应目标时间段的第二本地中间梯度,并基于所述目标时间段的第二本地中间梯度,得到第二循环神经网络模型在目标时间段的第二更新模型参数。
具体地,目标时间段的第二初始模型参数联合目标时间段的第二训练时序数据,目标时间段的上一时间段的第二中间参数得到目标时间段的第二中间参数,目标时间段的第二中间参数联合同一目标时间段的第一设备的第一训练时序数据确定的第一中间参数得到目标时间段的拼接参数,基于目标时间段的拼接参数以及目标时间段的预设预测模型,以及具有预设标签第二训练时序数据确定目标时间段的损失梯度,并基于所述目标时间段的损失梯度,更新所述目标时间段的预设预测模型的模型参数,基于所述更新的预设预测模型的模型参数以及所述在目标时间段的第二训练时序数据,计算对应目标时间段的第二本地中间梯度,确定目标时间段的第二本地梯度,根据目标时间段的第二本地梯度,确定目标时间段的第二更新模型参数,即得到第二循环神经网络模型在目标时间段的第二更新模型参数。
在本实施例中,由于联邦前向训练的过程中,基于目标时间段的第二初始模型参数,目标时间段的第二训练时序数据,目标时间段的前向传播的第二中间参数,接收的同一目标时间段的第一设备的第一训练时序数据确定的第一中间参数以及目标时间段的预设预测模型计算目标时间段的损失梯度,并基于所述目标时间段的损失梯度,更新所述目标时间段的预设预测模型的模型参数;基于所述目标时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在目标时间段的第二训练时序数据,计算对应目标时间段的第二本地中间梯度,并基于所述目标时间段的第二本地中间梯度,得到第二循环神经网络模型在目标时间段的第二更新模型参数。因而实现对第二循环神经网络模型进行双重更新,以提升第二循环神经网络模型的预测准确性。
本申请实施例提供一种基于循环神经网络的数据处理方法,在本申请基于循环神经网络的数据处理方法的另一实施例中,参照图2,应用于第一设备,所述基于循环神经网络的数据处理方法包括:
步骤A1,获取第一待处理时序数据,将所述第一待处理时序数据输入至第一数据处理模型中;
所述第一数据处理模型为对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第一循环神经网络模型还联合同一时间段的第一训练时序数据和同一时间段的第二设备的第二训练时序数据进行训练更新;
具体地,联邦前向训练过程中,目标时间段的第一循环神经网络模型包括目标时间段的第一初始模型参数和目标时间段的第一更新模型参数,目标时间段的第一初始模型参数为目标时间段的上一时间段的第一循环神经网络模型的第一更新模型参数,目标时间段的第一更新模型参数为目标时间段的第一初始模型参数联合目标时间段的第一训练时序数据和同一目标时间段的第二设备的第二训练时序数据训练得到的;
步骤A2,基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到发送给所述第二设备的第一待处理时序数据对应的第一中间参数。
在本实施例中,若在第一设备检测到第一待处理时序数据,则将第一待处理时序数据输入至第一数据处理模型中,由于第一数据处理模型是已经训练好的,因而,基于所述训练好的第一数据处理模型对所述第一待处理时序数据执行第一预设数据处理流程,得到发送给所述第二设备的第一待处理时序数据对应的第一中间参数,需要说明的是,所述第一数据处理模型为对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练后得到的;其中,联邦前向训练过程中,目标时间段的第一循环神经网络模型包括目标时间段的第一初始模型参数和目标时间段的第一更新模型参数,目标时间段的第一初始模型参数为目标时间段的上一时间段的第一循环神经网络模型的第一更新模型参数,目标时间段的第一更新模型参数为目标时间段的第一初始模型参数联合目标时间段的第一训练时序数据和同一目标时间段的第二设备的第二训练时序数据训练得到的。
具体地,也即,所述基于所述第二数据处理模型对所述第二待处理时序数据执行第一预设数据处理流程的步骤之前,包括:
步骤B1,对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练,以得到第一目标循环神经网络模型;
其中,所述对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练,以得到第一目标循环神经网络模型的步骤,包括:
步骤C1,基于接收的在目标时间段对应上一时间段的前向传播的第一中间参数,所述目标时间段的第一训练时序数据,所述第一循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第一中间参;
步骤C2,基于所述在目标时间段的前向传播的第一中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第一中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第一中间参数将被发送给同一时间段的第二设备,以供第二设备计算每个时间段的损失梯度,并基于每个时间段的损失梯度更新每个时间段的预设预测模型的模型参数,以计算对应每个时间段的第一本地中间梯度;
具体地,例如,接收在目标时间段对应上一时间段如t1时间段的前向传播的第一中间参数h1(t1),其中,在目标时间段对应上一时间段的前向传播的第一中间参数是通过在目标时间段对应上一时间段的再上一时间段的第一中间参数或者初始中间参数h1(t0)、在目标时间段对应上一时间段的第一训练时序数据,第一循环神经网络模型在目标时间段对应上一时间段的初始模型参数得到的。
基于所述每个时间段的第一本地中间梯度,得到第一循环神经网络模型在每个时间段的第一更新模型参数;
在得到在目标时间段对应上一时间段的前向传播的第一中间参数h1(t1)后,还基于h1(t1)计算t1时间段的损失梯度,以得到t1时间段的第一更新模型参数,将t1时间段的第一更新模型参数作为t2时间段的初始模型参数。
如图5所示,基于在目标时间段对应上一时间段的前向传播的第一中间参数h1(t1),所述目标时间段的第一训练时序数据,所述第一循环神经网络模型在目标时间段的模型参数(第一循环神经网络模型在目标时间段的上一时间段的第一更新模型参数),确定在目标时间段的前向传播的第一中间参数,并基于所述在目标时间段的前向传播的第一中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第一中间参数h1(tn)。
需要说明的是,每个时间段(目标时间段)的第一初始模型参数联合每个时间段的第一训练时序数据,每个时间段的上一时间段的第一中间参数得到每个时间段的第一中间参数,每个时间段的第一中间参数联合同一每个时间段的第二设备的第二训练时序数据确定的第二中间参数得到每个时间段的拼接参数,基于每个时间段的拼接参数以及每个时间段的预设预测模型,以及具有预设标签第二训练时序数据确定每个时间段的损失梯度,基于每个时间段的损失梯度,更新所述每个时间段的预设预测模型的模型参数,基于所述更新的预设预测模型的模型参数以及所述在每个时间段的第一训练时序数据等,计算对应每个时间段的第一本地中间梯度,确定每个时间段的第一本地梯度,根据每个时间段的第一本地梯度,确定每个时间段的第一更新模型参数,即得到第一循环神经网络模型在每个时间段的第一更新模型参数。
步骤C3,基于所述每个时间段的第一本地中间梯度,得到第一循环神经网络模型在每个时间段的第一更新模型参数;
步骤C4,基于所述最后时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在最后时间段的第一训练时序数据,计算对应最后时间段的第一反向中间梯度,并基于所述最后时间段的第一反向中间梯度,更新第一循环神经网络模型在最后时间段的模型参数和计算最后时间段对应上一时间段的第一反向中间梯度;
步骤C5,基于在最后时间段更新的第一循环神经网络模型的第一更新模型参数和最后时间段对应上一时间段的第一反向中间梯度进行联邦反向训练,直至最初时间段的第一循环神经网络模型的第一更新模型参数得到更新。
与第二设备更新第二循环神经网络模型一样,在本实施例中,基于所述最后时间段的损失梯度,所述最后时间段的更新的预设预测模型的模型参数,计算对应最后时间段的第一反向中间梯度g1(tn),并基于所述最后时间段的第一反向中间梯度g1(tn),更新第一循环神经网络模型在最后时间段的第一更新模型参数和计算最后时间段对应上一时间段的第一反向中间梯度g1(tn-1),并持续反向传播,更新第一循环神经网络模型在最后时间段对应上一时间段的第一更新模型参数和计算最后时间段对应上一时间段的再上一时间段的第一反向中间梯度。
基于在最后时间段对应上一时间段更新的第一循环神经网络模型的第一更新模型参数和最后时间段对应上一时间段的再上一时间段的第一反向中间梯度进行联邦反向训练,直至最初时间段的第一循环神经网络模型的第一更新模型参数得到更新,以得到第二目标循环神经网络模型。
步骤B2,将所述第一目标循环神经网络模型设置为所述第一数据处理模型。
在得到第二目标循环神经网络模型后,将所述第二目标循环神经网络模型设置为所述第一数据处理模型。
本实施例通过获取第一待处理时序数据,将所述第一待处理时序数据输入至已经训练完成的第一数据处理模型中;基于所述已经训练完成的第一数据处理模型对所述第一待处理时序数据执行第一预设数据处理流程,由于所述第一数据处理模型为对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练后得到的;且联邦前向训练过程中,目标时间段的第一循环神经网络模型包括目标时间段的第一初始模型参数和目标时间段的第一更新模型参数,目标时间段的第一初始模型参数为目标时间段的上一时间段的第一循环神经网络模型的第一更新模型参数,目标时间段的第一更新模型参数为目标时间段的第一初始模型参数联合目标时间段的第一训练时序数据和同一目标时间段的第一设备的第一训练时序数据训练得到的;因而,准确得到所述第一待处理时序数据的目标预测标签,也即,本申请中在保护隐私的同时,实现了基于不同参与方的时序数据联邦构建模型,提升对待处理时序数据进行类型等预测的准确性,解决现有技术中,不同参与方之间不能直接进行时序数据的交互,致使难以准确对时序数据进行预测的技术问题。
参照图3,图3是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图3所示,该基于循环神经网络的数据处理设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于循环神经网络的数据处理设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的基于循环神经网络的数据处理设备结构并不构成对基于循环神经网络的数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机介质的存储器1005中可以包括操作系统、网络通信模块以及基于循环神经网络的数据处理程序。操作系统是管理和控制基于循环神经网络的数据处理设备硬件和软件资源的程序,支持基于循环神经网络的数据处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于循环神经网络的数据处理系统中其它硬件和软件之间通信。
在图3所示的基于循环神经网络的数据处理设备中,处理器1001用于执行存储器1005中存储的基于循环神经网络的数据处理程序,实现上述任一项所述的基于循环神经网络的数据处理方法的步骤。
本申请基于循环神经网络的数据处理设备具体实施方式与上述基于循环神经网络的数据处理方法各实施例基本相同,在此不再赘述。
本申请还提供一种基于循环神经网络的数据处理装置,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理装置包括:
第一获取模块,用于获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
第一执行模块,用于基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
可选地,所述基于循环神经网络的数据处理装置还包括:
第一训练模块,用于基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型;
第一设置模块,用于将所述第二目标循环神经网络模型设置为所述第二数据处理模型。
可选地,所述第一训练模块包括:
第一接收单元,用于基于接收的在目标时间段对应上一时间段的前向传播的第二中间参数,所述目标时间段的第二训练时序数据,所述第二循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第二中间参数;
联邦前向训练单元,用于基于在目标时间段的前向传播的第二中间参数,进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第二中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第二中间参数还用于计算每个时间段的损失梯度,以得到每个时间段的第二更新模型参数;
第一计算单元,用于基于所述最后时间段的第二中间参数,所述最后时间段的第二训练时序数据,所述第二循环神经网络模型在最后时间段的第二初始模型参数,最后时间段的预设预测模型,以及接收的在最后时间段的由第一设备的第一训练时序数据训练得到的第一中间参数计算对应最后时间段的第二反向中间梯度,并基于所述最后时间段的第二反向中间梯度,更新第二循环神经网络模型在最后时间段的第二更新模型参数和计算最后时间段对应上一时间段的第二反向中间梯度;
第一更新单元,用于基于在最后时间段更新的第二循环神经网络模型的第二更新模型参数和最后时间段对应上一时间段的第二反向中间梯度进行联邦反向训练,直至最初时间段的第二循环神经网络模型的第二更新模型参数得到更新。
可选地,联邦前向训练的过程中,基于目标时间段的第二初始模型参数,目标时间段的第二训练时序数据,目标时间段的前向传播的第二中间参数,接收的同一目标时间段的第一设备的第一训练时序数据确定的第一中间参数以及目标时间段的预设预测模型计算目标时间段的损失梯度,并基于所述目标时间段的损失梯度,更新所述目标时间段的预设预测模型的模型参数;
基于所述目标时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在目标时间段的第二训练时序数据,计算对应目标时间段的第二本地中间梯度,并基于所述目标时间段的第二本地中间梯度,得到第二循环神经网络模型在目标时间段的第二更新模型参数。
可选地,训练时序数据为医疗训练时序数据,所述第二待处理时序数据为第二待处理医疗时序数据,所述第二数据处理模型为医疗属性预测模型,
所述医疗属性预测模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型为联合第二训练医疗时序数据和同一目标时间段的第一设备的第一训练医疗时序数据训练得到的;
所述第一执行模块包括:
第二获取单元,用于基于所医疗属性预测模型对所述第二待处理医疗时序数据执行医疗属性预测处理,得到所述第二待处理医疗时序数据的医疗属性预测结果。
本申请还提供一种基于循环神经网络的数据处理装置,应用于第一设备,所述基于循环神经网络的数据处理装置包括:
第三获取模块,用于获取第一待处理时序数据,将所述第一待处理时序数据输入至第一数据处理模型中;
所述第一数据处理模型为对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第一循环神经网络模型还联合同一时间段的第一训练时序数据和同一时间段的第二设备的第二训练时序数据进行训练更新;
第三执行模块,用于基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到发送给所述第二设备的第一待处理时序数据对应的第一中间参数。
可选地,所述基于循环神经网络的数据处理装置还包括:
第三训练模块,用于对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练,以得到第一目标循环神经网络模型;
第二设置模块,用于将所述第一目标循环神经网络模型设置为所述第一数据处理模型。
可选地,所述第三训练模块包括:
第二接收单元,用于基于接收的在目标时间段对应上一时间段的前向传播的第一中间参数,所述目标时间段的第一训练时序数据,所述第一循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第一中间参数;
第三获取单元,用于基于所述在目标时间段的前向传播的第一中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第一中间参数
其中,联邦前向训练的过程中,在每个时间段计算得到的第一中间参数将被发送给同一时间段的第二设备,以供第二设备计算每个时间段的损失梯度,并基于每个时间段的损失梯度更新每个时间段的预设预测模型的模型参数,以计算对应每个时间段的第一本地中间梯度;
第一获取单元,用于基于所述每个时间段的第一本地中间梯度,得到第一循环神经网络模型在每个时间段的第一更新模型参数;
第二计算单元,用于基于所述最后时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在最后时间段的第一训练时序数据,计算对应最后时间段的第一反向中间梯度,并基于所述最后时间段的第一反向中间梯度,更新第一循环神经网络模型在最后时间段的模型参数和计算最后时间段对应上一时间段的第一反向中间梯度;
第二更新单元,用于基于在最后时间段更新的第一循环神经网络模型的第一更新模型参数和最后时间段对应上一时间段的第一反向中间梯度进行联邦反向训练,直至最初时间段的第一循环神经网络模型的第一更新模型参数得到更新。
本申请基于循环神经网络的数据处理装置的具体实施方式与上述基于循环神经网络的数据处理方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种介质,且所述介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于循环神经网络的数据处理方法的步骤。
本申请介质具体实施方式与上述基于循环神经网络的数据处理方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (11)
1.一种基于循环神经网络的数据处理方法,其特征在于,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理方法包括:
获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
2.如权利要求1所述基于循环神经网络的数据处理方法,其特征在于,
所述基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程的步骤之前,所述方法包括:
基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型;
将所述第二目标循环神经网络模型设置为所述第二数据处理模型。
3.如权利要求2所述基于循环神经网络的数据处理方法,其特征在于,所述基于第二训练时序数据,对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练,以得到第二目标循环神经网络模型的步骤,包括:
基于接收的在目标时间段对应上一时间段的前向传播的第二中间参数,所述目标时间段的第二训练时序数据,所述第二循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第二中间参数;
基于在目标时间段的前向传播的第二中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第二中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第二中间参数还用于计算每个时间段的损失梯度,以得到每个时间段的第二更新模型参数;
基于所述最后时间段的第二中间参数,所述最后时间段的第二训练时序数据,所述第二循环神经网络模型在最后时间段的第二初始模型参数,最后时间段的预设预测模型,以及接收的在最后时间段的由第一设备的第一训练时序数据训练得到的第一中间参数计算对应最后时间段的第二反向中间梯度,并基于所述最后时间段的第二反向中间梯度,更新第二循环神经网络模型在最后时间段的第二更新模型参数和计算最后时间段对应上一时间段的第二反向中间梯度;
基于在最后时间段更新的第二循环神经网络模型的第二更新模型参数和最后时间段对应上一时间段的第二反向中间梯度进行联邦反向训练,直至最初时间段的第二循环神经网络模型的第二更新模型参数得到更新。
4.如权利要求3所述基于循环神经网络的数据处理方法,其特征在于,
联邦前向训练的过程中,基于目标时间段的第二初始模型参数,目标时间段的第二训练时序数据,目标时间段的前向传播的第二中间参数,接收的同一目标时间段的第一设备的第一训练时序数据确定的第一中间参数以及目标时间段的预设预测模型计算目标时间段的损失梯度,并基于所述目标时间段的损失梯度,更新所述目标时间段的预设预测模型的模型参数;
基于所述目标时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在目标时间段的第二训练时序数据,计算对应目标时间段的第二本地中间梯度,并基于所述目标时间段的第二本地中间梯度,得到第二循环神经网络模型在目标时间段的第二更新模型参数。
5.如权利要求1所述基于循环神经网络的数据处理方法,其特征在于,训练时序数据为医疗训练时序数据,所述第二待处理时序数据为第二待处理医疗时序数据,所述第二数据处理模型为医疗属性预测模型,
所述医疗属性预测模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型为联合第二训练医疗时序数据和同一目标时间段的第一设备的第一训练医疗时序数据训练得到的;
所述基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签,包括:
基于所医疗属性预测模型对所述第二待处理医疗时序数据执行医疗属性预测处理,得到所述第二待处理医疗时序数据的医疗属性预测结果。
6.一种基于循环神经网络的数据处理方法,其特征在于,应用于第一设备,所述基于循环神经网络的数据处理方法包括:
获取第一待处理时序数据,将所述第一待处理时序数据输入至第一数据处理模型中;
所述第一数据处理模型为对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第一循环神经网络模型还联合同一时间段的第一训练时序数据和同一时间段的第二设备的第二训练时序数据进行训练更新;
基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到发送给所述第二设备的第一待处理时序数据对应的第一中间参数。
7.如权利要求6所述基于循环神经网络的数据处理方法,其特征在于,所述基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到发送给所述第二设备的第一待处理时序数据对应的第一中间参数的步骤之前,包括:
对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练,以得到第一目标循环神经网络模型;
将所述第一目标循环神经网络模型设置为所述第一数据处理模型。
8.如权利要求7所述基于循环神经网络的数据处理方法,其特征在于,所述对不同时间段的第一循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第一循环神经网络模型进行各个时间段的联邦反向训练,以得到第一目标循环神经网络模型的步骤,包括:
基于接收的在目标时间段对应上一时间段的前向传播的第一中间参数,所述目标时间段的第一训练时序数据,所述第一循环神经网络模型在目标时间段的初始模型参数,确定在目标时间段的前向传播的第一中间参数;
基于所述在目标时间段的前向传播的第一中间参数进行对后续各个时间段的联邦前向训练,直到得到最后时间段的第一中间参数;
其中,联邦前向训练的过程中,在每个时间段计算得到的第一中间参数将被发送给同一时间段的第二设备,以供第二设备计算每个时间段的损失梯度,并基于每个时间段的损失梯度更新每个时间段的预设预测模型的模型参数,以计算对应每个时间段的第一本地中间梯度;
基于所述每个时间段的第一本地中间梯度,得到第一循环神经网络模型在每个时间段的第一更新模型参数;
基于所述最后时间段的损失梯度,所述更新的预设预测模型的模型参数以及所述在最后时间段的第一训练时序数据,计算对应最后时间段的第一反向中间梯度,并基于所述最后时间段的第一反向中间梯度,更新第一循环神经网络模型在最后时间段的模型参数和计算最后时间段对应上一时间段的第一反向中间梯度;
基于在最后时间段更新的第一循环神经网络模型的第一更新模型参数和最后时间段对应上一时间段的第一反向中间梯度进行联邦反向训练,直至最初时间段的第一循环神经网络模型的第一更新模型参数得到更新。
9.一种基于循环神经网络的数据处理装置,其特征在于,应用于第二设备,第二设备的第二训练时序数据具有预设标签,所述基于循环神经网络的数据处理方法包括:
第一获取模块,用于获取第二待处理时序数据,将所述第二待处理时序数据输入至第二数据处理模型中;
所述第二数据处理模型为对不同时间段的第二循环神经网络模型进行联邦前向训练后,再对联邦前向训练完成的不同时间段的第二循环神经网络模型进行各个时间段的联邦反向训练后得到的;
其中,联邦前向训练过程中,同一时间段的第二循环神经网络模型还联合同一时间段的第二训练时序数据和同一时间段的第一设备的第一训练时序数据进行训练更新;
第一执行模块,用于基于所述第二数据处理模型对所述第二待处理时序数据执行第二预设数据处理流程,得到所述第二待处理时序数据的目标预测标签。
10.一种基于循环神经网络的数据处理设备,其特征在于,所述基于循环神经网络的数据处理设备包括:存储器、处理器以及存储在存储器上的用于实现所述基于循环神经网络的数据处理方法的程序,
所述存储器用于存储实现基于循环神经网络的数据处理方法的程序;
所述处理器用于执行实现所述基于循环神经网络的数据处理方法的程序,以实现如权利要求1至8中任一项所述基于循环神经网络的数据处理方法的步骤。
11.一种介质,其特征在于,所述介质上存储有实现基于循环神经网络的数据处理方法的程序,所述实现基于循环神经网络的数据处理方法的程序被处理器执行以实现如权利要求1至8中任一项所述基于循环神经网络的数据处理方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010589684.9A CN111738421A (zh) | 2020-06-24 | 2020-06-24 | 基于循环神经网络的数据处理方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010589684.9A CN111738421A (zh) | 2020-06-24 | 2020-06-24 | 基于循环神经网络的数据处理方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111738421A true CN111738421A (zh) | 2020-10-02 |
Family
ID=72650985
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010589684.9A Pending CN111738421A (zh) | 2020-06-24 | 2020-06-24 | 基于循环神经网络的数据处理方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111738421A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021258882A1 (zh) * | 2020-06-24 | 2021-12-30 | 深圳前海微众银行股份有限公司 | 基于循环神经网络的数据处理方法、装置、设备及介质 |
-
2020
- 2020-06-24 CN CN202010589684.9A patent/CN111738421A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021258882A1 (zh) * | 2020-06-24 | 2021-12-30 | 深圳前海微众银行股份有限公司 | 基于循环神经网络的数据处理方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3446260B1 (en) | Memory-efficient backpropagation through time | |
WO2021258882A1 (zh) | 基于循环神经网络的数据处理方法、装置、设备及介质 | |
Song et al. | Asynchronous spiking neural P systems with rules on synapses | |
CN112559007B (zh) | 多任务模型的参数更新方法、装置及电子设备 | |
CN107341547A (zh) | 一种用于执行卷积神经网络训练的装置和方法 | |
Wang et al. | A comparison study of bank data in fractional calculus | |
US11416760B2 (en) | Machine learning based user interface controller | |
CN114004425B (zh) | 物品流转信息预测模型生成方法、信息生成方法、装置 | |
CN113538235B (zh) | 图像处理模型的训练方法、装置、电子设备及存储介质 | |
CN111738422A (zh) | 基于循环神经网络的数据处理方法、设备及介质 | |
Zhang et al. | A comprehensive review on GANs for time-series signals | |
Luo et al. | Fractional chaotic maps with q–deformation | |
CN112562229A (zh) | 结算设备控制方法、装置、电子设备和计算机可读介质 | |
Chiarella et al. | The stochastic bifurcation behaviour of speculative financial markets | |
CN111737921B (zh) | 基于循环神经网络的数据处理方法、设备及介质 | |
CN112000988A (zh) | 因子分解机回归模型构建方法、设备及可读存储介质 | |
CN111737920B (zh) | 基于循环神经网络的数据处理方法、设备及介质 | |
CN111738421A (zh) | 基于循环神经网络的数据处理方法、设备及介质 | |
Zhu et al. | Leveraging neural differential equations and adaptive delayed feedback to detect unstable periodic orbits based on irregularly sampled time series | |
US11157690B2 (en) | Techniques for asynchronous execution of computationally expensive local spreadsheet tasks | |
CN110288444B (zh) | 实现用户相关推荐的方法和系统 | |
CN110991661A (zh) | 用于生成模型的方法和装置 | |
CN106920124A (zh) | 一种数据采集和分析方法及装置 | |
Yang et al. | Efficient knowledge management for heterogenous federated continual learning on resource-constrained edge devices | |
AU2022203778A1 (en) | Function processing method and device and electronic apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |