CN116701972B - 业务数据处理方法、装置、设备以及介质 - Google Patents
业务数据处理方法、装置、设备以及介质 Download PDFInfo
- Publication number
- CN116701972B CN116701972B CN202310993567.2A CN202310993567A CN116701972B CN 116701972 B CN116701972 B CN 116701972B CN 202310993567 A CN202310993567 A CN 202310993567A CN 116701972 B CN116701972 B CN 116701972B
- Authority
- CN
- China
- Prior art keywords
- sample
- service
- clustering
- features
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 93
- 238000012545 processing Methods 0.000 claims description 114
- 238000000605 extraction Methods 0.000 claims description 80
- 238000012549 training Methods 0.000 claims description 77
- 238000003745 diagnosis Methods 0.000 claims description 19
- 230000004913 activation Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 16
- 238000010606 normalization Methods 0.000 claims description 16
- 238000011176 pooling Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 11
- 230000003213 activating effect Effects 0.000 claims description 10
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 description 54
- 230000008569 process Effects 0.000 description 30
- 230000006870 function Effects 0.000 description 28
- 238000010586 diagram Methods 0.000 description 18
- 238000005516 engineering process Methods 0.000 description 12
- 230000004927 fusion Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000013527 convolutional neural network Methods 0.000 description 9
- 238000013473 artificial intelligence Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 229920000642 polymer Polymers 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007500 overflow downdraw method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 208000023504 respiratory system disease Diseases 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种业务数据处理方法、装置、设备以及介质,该方法可应用在人工智能领域。该方法包括:通过第一初始预测模型对N个样本对象的第一样本业务信息进行聚类,得到K个样本业务聚类特征;将K个样本业务聚类特征与样本对象i的样本聚类权重进行加权求和,得到样本业务代理特征;将样本业务代理特征发送至第二设备,第二设备通过第二初始预测模型对样本业务代理特征和样本对象i的第二样本业务信息进行业务分类识别,得到样本预测结果;接收样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i的第一样本业务信息,修正第一初始预测模型的网络参数。通过本申请实施例,可以提高数据安全性。
Description
技术领域
本申请涉及人工智能技术领域,尤其涉及一种业务数据处理方法、装置、设备以及介质。
背景技术
联邦学习(Federated Learning,FL)是指在无需交换多个参与方(例如,参与方A和参与方B)持有的特征数据的前提下,仅通过交换中间结果即可实现分布式模型训练的技术。在联邦学习中,参与方A需要将中间结果(例如,嵌入特征)发送至参与方B,并由参与方B融合所有中间结果(包括参与方A的中间结果和参与方B的中间结果)后执行后续联邦学习。由此可见,参与方B很有可能会根据参与方A发送的中间结果,反推出参与方A的原始数据,从而造成参与方A的数据泄露,降低数据安全性。
发明内容
本申请实施例提供一种业务数据处理方法、装置、设备以及介质,可以提高数据安全性。
本申请实施例一方面提供了一种业务数据处理方法,包括:
获取N个样本对象在第一设备中的第一样本业务信息,通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征;N、K均为正整数,且K小于或等于N;
根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征;
将样本业务代理特征发送至第二设备,以使第二设备通过第二设备中的第二初始预测模型,对样本业务代理特征,以及样本对象i在第二设备中的第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;样本预测结果用于修正第二初始预测模型的网络参数;
接收第二设备返回的样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型;模型梯度参数是基于样本预测结果和样本对象i在第二设备中的样本标签数据所确定的。
本申请实施例一方面提供了一种业务数据处理方法,包括:
接收第一设备发送的与N个样本对象中的样本对象i相关联的样本业务代理特征;样本代理特征是由K个样本业务聚类特征与样本对象i关联的样本聚类权重进行加权求和得到的,K个样本业务聚类特征是通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理得到的,样本对象i关联的样本聚类权重用于表征K个样本业务聚类特征与样本对象i在第一设备中的第一样本业务信息之间的相关程度;
获取样本对象i在第二设备中的第二样本业务信息,通过第二设备中的第二初始预测模型,对样本业务代理特征,以及第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;
获取样本对象i在第二设备中的样本标签数据,根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数;
将模型梯度参数发送至第一设备,以使第一设备根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,得到第一设备中的第一业务预测模型;
根据模型梯度参数对第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为第二设备中的第二业务预测模型。
本申请实施例一方面提供了一种业务数据处理方法,包括:
获取业务对象在第一设备中的第一对象业务信息,将第一对象业务信息输入至第一设备中的第一业务预测模型,根据第一对象业务信息,确定第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;K为正整数;
将K个对象业务聚类特征与对象聚类权重进行加权求和,得到业务对象对应的对象业务代理特征;
将对象业务代理特征发送至第二设备,以使第二设备中的第二业务预测模型,对对象业务代理特征,以及业务对象在第二设备中的第二对象业务信息进行业务分类识别,得到业务对象对应的业务预测结果;第一业务预测模型和第二业务预测模型是采用上述一方面的方法训练得到的。
本申请实施例一方面提供了一种业务数据处理装置,包括:
聚类处理模块,用于获取N个样本对象在第一设备中的第一样本业务信息,通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征;N、K均为正整数,且K小于或等于N;
第一加权求和模块,用于根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征;
第一特征发送模块,用于将样本业务代理特征发送至第二设备,以使第二设备通过第二设备中的第二初始预测模型,对样本业务代理特征,以及样本对象i在第二设备中的第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;样本预测结果用于修正第二初始预测模型的网络参数;
第一模型训练模块,用于接收第二设备返回的样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型;模型梯度参数是基于样本预测结果和样本对象i在第二设备中的样本标签数据所确定的。
其中,聚类处理模块通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,包括:
通过第一设备关联的第一初始预测模型中的特征提取组件,对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到N个样本对象中的每一个样本对象对应的第一样本业务特征;
在N个样本对象中的每一个样本对象对应的第一样本业务特征中选择K个样本中心特征,获取N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数;
根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对K个样本中心特征进行更新,将更新后的K个样本中心特征确定为K个样本业务聚类特征。
其中,聚类处理模块通过第一设备关联的第一初始预测模型中的特征提取组件,对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到N个样本对象中的每一个样本对象对应的第一样本业务特征,包括:
将N个样本对象中的样本对象i对应的第一样本业务信息输入至第一设备关联的第一初始预测模型中的特征提取组件,通过特征提取组件中的卷积层,对样本对象i对应的第一样本业务信息进行卷积处理,得到样本对象i对应的样本卷积特征;
通过特征提取组件中的激活层,对样本对象i对应的样本卷积特征进行激活处理,得到样本对象i对应的样本激活特征;
通过特征提取组件中的池化层,对样本对象i对应的样本激活特征进行池化处理,得到样本对象i对应的第一样本业务特征zi。
其中,聚类处理模块获取N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,包括:
获取样本对象i对应的第一样本业务特征zi与K个样本中心特征中的样本中心特征μj之间的距离;
根据预置聚类参数,以及第一样本业务特征zi和样本中心特征μj之间的距离,确定第一样本业务特征zi和样本中心特征μj之间的样本候选相似度;
对第一样本业务特征zi与各个样本中心特征之间的样本候选相似度进行累加,得到样本候选相似度总值;
将样本候选相似度与样本相似度总值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的样本相似系数。
其中,聚类处理模块根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征,包括:
根据N个样本对象中的每一个样本对象对应的第一样本业务特征与K个样本中心特征之间的样本相似系数,确定K个样本中心特征相关联的第一聚类损失;
对第一聚类损失进行求导运算得到第一聚类梯度参数,根据第一聚类梯度参数对K个样本中心特征进行更新;
若更新后的K个样本中心特征满足停止更新条件,则将停止更新时的K个样本中心特征确定为样本业务聚类特征。
其中,聚类处理模块根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定K个样本中心特征相关联的第一聚类损失,包括:
将样本对象i对应的第一对象业务特征zi与K个样本中心特征中的样本中心特征μj之间的样本相似系数的平方,确定为相似系数平方值;
将第一对象业务特征zi与各个样本中心特征之间的相似系数平方值进行累加,得到相似系数平方累积值;
将相似系数平方值与相似系数平方累积值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的预测相似系数;
获取预测相似系数,以及第一对象业务特征zi与样本中心特征μj之间的样本相似系数的对数差值,将预测相似系数和对数差值之间的乘积,确定为第一样本业务特征zi和样本中心特征μj之间的单位聚类损失;
将第一样本业务特征zi和各个样本中心特征之间的单位聚类损失进行累加,得到样本对象i对应的第一聚类损失。
其中,第一加权求和模块根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,包括:
将样本对象i对应的第一样本业务特征zi和K个样本业务聚类特征中的样本业务聚类特征βj拼接为样本联合特征;第一样本业务特征zi是通过第一初始预测模型中的特征提取组件,对样本对象i对应的第一样本业务信息进行特征提取得到的;
通过第一初始预测模型中的多层感知机对样本联合特征进行特征变换处理,得到样本业务聚类特征βj对应的候选聚类权重;
对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重。
其中,第一加权求和模块对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重,包括:
对样本业务聚类特征βj对应的候选聚类权重进行指数运算,得到样本业务聚类特征βj对应的权重指数值;
将K个样本业务聚类特征中的每一个样本业务聚类特征对应的权重指数值进行累加,得到权重指数总值,将样本业务聚类特征βj对应的权重指数值与权重指数总值之间的比值,确定为样本业务聚类特征βj对应的样本聚类权重。
其中,第一加权求和模块将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征,包括:
将K个样本业务聚类特征中的样本业务聚类特征βj,与样本业务聚类特征βj对应的样本聚类权重之间的点乘,确定为样本业务聚类特征βj对应的单位加权特征;
将K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征进行累加,得到样本对象i对应的样本业务代理特征。
其中,第一模型训练模块根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型,包括:
根据样本对象i对应的第一样本业务特征zi,以及K个样本业务聚类特征中的每一个样本业务聚类特征之间的样本相似系数,确定第二聚类损失;第一样本业务特征zi是通过第一初始预测模型中的特征提取组件,对样本对象i对应的第一样本业务信息进行特征提取得到的;
对第二聚类损失进行求导运算得到第二聚类梯度参数,将模型梯度参数和第二聚类梯度参数之和,确定为第一初始预测模型对应的总梯度参数;
根据总梯度参数对第一初始预测模型的网络参数进行迭代训练,直至更新后的网络参数满足训练结束条件时,停止训练,将训练结束时的第一初始预测模型确定为所述第一设备中的第一业务预测模型。
本申请实施例一方面提供了一种业务数据处理装置,包括:
特征接收模块,用于接收第一设备发送的与N个样本对象中的样本对象i相关联的样本业务代理特征;样本代理特征是由K个样本业务聚类特征与样本对象i关联的样本聚类权重进行加权求和得到的,K个样本业务聚类特征是通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理得到的,样本对象i关联的样本聚类权重用于表征K个样本业务聚类特征与样本对象i在第一设备中的第一样本业务信息之间的相关程度;
业务预测模块,用于获取样本对象i在第二设备中的第二样本业务信息,通过第二设备中的第二初始预测模型,对样本业务代理特征,以及第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;
梯度参数获取模块,用于获取样本对象i在第二设备中的样本标签数据,根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数;
梯度参数发送模块,用于将模型梯度参数发送至第一设备,以使第一设备根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,得到第一设备中的第一业务预测模型;
第二模型训练模块,用于根据模型梯度参数对第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为第二设备中的第二业务预测模型。
其中,梯度参数获取模块根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数,包括:
将样本标签数据与样本预测结果对应的第一对数结果之间的乘积,确定为第一候选损失;
将常量参数与样本预测结果之间的差值进行对数运算,得到第二对数结果;
将第二对数结果,以及常量参数与样本标签数据的差值之间的乘积,确定为第二候选损失;
根据第一候选损失和第二候选损失之和,确定第二初始预测模型对应的模型损失,对模型损失进行求导运算,得到第二初始预测模型对应的模型梯度参数。
本申请实施例一方面提供了一种业务数据处理装置,包括:
对象聚类权重获取模块,用于获取业务对象在第一设备中的第一对象业务信息,将第一对象业务信息输入至第一设备中的第一业务预测模型,根据第一对象业务信息,确定第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;K为正整数;
第二加权求和模块,用于将K个对象业务聚类特征与对象聚类权重进行加权求和,得到业务对象对应的对象业务代理特征;
第二特征发送模块,用于将对象业务代理特征发送至第二设备,以使第二设备中的第二业务预测模型,对对象业务代理特征,以及业务对象在第二设备中的第二对象业务信息进行业务分类识别,得到业务对象对应的业务预测结果;第一业务预测模型和第二业务预测模型是采用上述一方面的方法训练得到的。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器与处理器相连,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得该计算机设备执行本申请实施例中上述一方面提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序适于由处理器加载并执行,以使得具有处理器的计算机设备执行本申请实施例中上述一方面提供的方法。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述一方面提供的方法。
本申请实施例中,可以通过第一初始预测模型对N个样本对象在第一设备中的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,进而可以将K个样本业务聚类特征与N个样本对象中的样本对象i关联的样本聚类权重进行加权求和,得到样本业务代理特征,并将该样本业务代理特征发送至第二设备进行模型训练。由此可见,样本对象i对应的样本业务代理特征是针对样本对象i对应的第一样本业务信息进行一系列处理(例如,聚类处理等)之后得到的特征,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,第二设备无法根据样本业务代理特征反推出样本对象i在第一设备中的第一样本业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种联邦学习平台的结构示意图;
图2是本申请实施例提供的一种预测医疗诊断结果的场景示意图;
图3是本申请实施例提供的一种业务数据处理方法的时序示意图;
图4是本申请实施例提供的一种训练业务预测模型的示意图;
图5是本申请实施例提供的一种业务数据处理方法的流程示意图一;
图6是本申请实施例提供的一种获取样本业务聚类特征的示意图;
图7是本申请实施例提供的一种获取样本业务代理特征的示意图;
图8是本申请实施例提供的一种业务数据处理方法的流程示意图二;
图9是本申请实施例提供的一种业务数据处理装置的结构示意图一;
图10是本申请实施例提供的一种业务数据处理装置的结构示意图二;
图11是本申请实施例提供的一种业务数据处理装置的结构示意图三;
图12是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供了一种基于联邦学习(Federated Learning,FL)的业务数据处理方法。其中,联邦学习属于人工智能(Artificial Intelligence,AI)领域。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
进一步地,本申请实施例提供的基于联邦学习的业务数据处理方法主要涉及人工智能的机器学习/深度学习等方向。其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习及元学习等技术。
此外,本申请实施例所涉及的联邦学习平台可以是以“云”形式(例如,公有云或私有云)对外提供联邦学习服务。其中,私有云(Private Cloud)是将云基础设施与软硬件资源创建在防火墙内,以供机构或企业内各部门共享数据中心内的资源。创建私有云,除了硬件资源外,一般还有云设备软件,例如基础设施即服务(Infrastructure as a Service,IaaS)。私有云计算同样包含云硬件、云平台、云服务三个层次。不同的是,云硬件是对象自己的个人电脑或服务器,而非云计算厂商的数据中心。公有云(Public Cloud)通常指第三方提供商为对象提供的能够使用的云,公有云一般可通过互联网使用,可能是免费或成本低廉的,公有云的核心属性是共享资源服务。这种云有许多实例,可在当今整个开放的公有网络中提供服务。
请参见图1,图1是本申请实施例提供的一种联邦学习平台的结构示意图。如图1所示,本申请实施例所涉及的联邦学习平台可以包括第一设备110和第二设备120,第一设备110与第二设备120之间可以通过有线或者无线网络进行数据交互。其中,第一设备110是联邦学习平台的第一参与方(Host方)所使用的电子设备,第二设备120是联邦学习的第二参与方(Guest方)所使用的电子设备。需要说明的是,图1所示的联邦学习系统是以参与方包含一个第一参与方和一个第二参与方为例进行阐述的,在实际应用中,第一参与方和第二参与方的数量均可以有多个,类似地,第一设备110和第二设备120的数量可以有一个或者有多个,本申请实施例对此不做限定。
第一设备110和第二设备120可以是终端设备。其中,终端设备可以包括但不限于:智能手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)、智能语音交互设备、智能家电(例如智能电视等)、车载设备、飞行器等电子设备,本申请对终端设备的类型不做限定。
第一设备110和第二设备120也可以是服务器。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,本申请对服务器的类型不做限定。
本申请实施例所涉及的联邦学习主要涉及纵向联邦学习,纵向联邦学习能够联合拥有相同的样本空间和不同的特征空间的第一参与方(Host方)和第二参与方(Guest方)进行模型训练,从而增加参与业务预测模型训练的特征量,提升模型训练的精度。根据纵向联邦学习的数据分布特征可知,第一参与方(Host方)和第二参与方(Guest方)持有的样本对象相同,但是样本对象的特征数据不同。
具体地,第一参与方(Host)可以持有样本对象的第一样本业务信息(或称为第一特征空间),该第一样本业务信息中包含样本对象的第一样本业务特征(或称为第一参与方的原始特征)。第二参与方(Guest方)可以持有样本对象的第二样本业务信息(或称为第二特征空间),该第二样本业务信息中包含样本对象的第二样本业务特征(或称为第二参与方的原始特征)。此外,第二参与方(Guest方)还可以持有样本对象的标签空间,该标签空间可以包含样本对象对应的样本标签数据。第一样本业务信息和第二样本业务信息可以认为是样本对象不同的特征数据。例如,第一样本业务信息可以是样本对象在广告投放平台中的广告点击信息,第二样本业务信息可以是样本对象在广告主中的基本信息;又如,第一样本业务信息可以是样本对象在金融领域的样本存单信息,第二样本业务信息可以是样本对象在保险领域的样本保单信息;再如,第一样本业务信息可以是样本对象在线上医疗网站问诊时的样本医疗信息,第二样本业务信息可以是样本对象在线下医院问诊时的样本医疗信息等。
在本申请实施例中,第一参与方可以通过第一设备110中的第一初始预测模型,将自身持有的N个样本对象(N为正整数)的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征(K为小于或者等于N的正整数),进而可以将聚类处理得到的K个业务聚类特征与N个样本对象中的样本对象i关联的样本聚类权重进行加权求和,得到样本业务代理特征,并将样本对象i对应的样本业务代理特征发送至第二参与方对应的第二设备120。第二参与方可以通过第二设备120中的第二初始预测模型,对样本对象i对应的样本业务代理特征,以及样本对象i在第二参与方的第二样本业务特征进行业务分类识别,得到样本对象i对应的样本预测结果,进而可以根据样本对象i对应的样本预测结果以及样本标签数据,对第二初始预测模型进行训练,得到最终训练完成的第二业务预测模型。进一步地,第二参与方可以将样本预测结果关联的模型梯度参数回传给第一参与方,第一参与方可以根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型进行训练,得到最终训练完成的第一业务预测模型。
在本申请实施例中,训练阶段的第一业务预测模型(即未完成训练的第一业务预测模型)可以称为第一初始生成模型,训练阶段的第二业务预测模型(即未完成训练的第二业务预测模型)可以称为第二初始生成模型。也就是说,第一初始预测模型和第一业务预测模型为不同阶段的业务预测模型,第二初始预测模型和第二业务预测模型为不同阶段的业务预测模型;换言之,第一初始预测模型和第一业务预测模型具有相同的网络结构,其两者之间的网络参数可能存在不同,第二初始预测模型和第二业务预测模型具有相同的网络结构,其两者之间的网络参数可能存在不同。
可以理解的是,可以将训练完成的第一业务预测模型和第二业务预测模型应用在任意的业务预测场景中,例如,医疗场景、信息(例如,广告、咨询等)推荐场景等业务预测场景。为便于理解,本申请实施例以医疗场景为例,对业务预测过程进行描述。具体地,请参见图2,图2是本申请实施例提供的一种预测医疗诊断结果的场景示意图。如图2所示,第一设备中可以获取预先训练完成的第一业务预测模型20,第一业务预测模型20可以包括第一特征提取组件20b、聚类组件20d以及注意力组件20f等组件。第二设备中可以获取预先训练完成的第二业务预测模型30,第二业务预测模型30可以包括第二特征提取组件30b,以及业务分类识别组件30d等组件。
第一设备在接收到针对业务对象(例如,患者i)对应的医疗诊断预测请求之后,可以获取患者i对应的第一医疗信息20a,将第一医疗信息20a输入至第一业务预测模型20中。第一医疗信息20a首先输入至第一业务预测模型20中的第一特征提取组件20b,通过第一特征提取组件20b对第一医疗信息20a进行特征提取,得到患者i对应的第一医疗特征20c。类似地,第二设备在接收到针对患者i对应的医疗诊断预测请求之后,可以获取患者i对应的第二医疗信息30a,并将第二医疗信息30a输入至第二业务预测模型30中的第二特征提取组件30b中,通过第二特征提取组件30b对第二医疗信息30a进行特征提取,得到患者i对应的第二医疗特征30c。
其中,第一医疗信息20a和第二医疗信息30a是患者i不同的医疗信息。例如,第一医疗信息20a可以是患者i的呼吸系统疾病就诊记录信息,第二医疗信息30a可以是患者的神经系统疾病就诊记录信息。第一特征提取组件20b和第二特征提取组件30b可以理解为医疗特征提取器,第一特征提取组件20b和第二特征提取组件30b可以具有相同的网络结构,例如,第一特征提取组件20b和第二特征提取组件30b均可以为卷积神经网络(Convolutional Neural Networks,CNN)模型;第一特征提取组件20b和第二特征提取组件30b也可以具有不同的网络结构,例如,第一特征提取组件20b为CNN模型,第二特征提取组件30b为循环神经网络(Recurrent Neural Networks,RNN)模型等,本申请实施例对此不做限定。
如图2所示,第一医疗特征20c可以作为聚类组件20d的输入特征,通过聚类组件20d可以输出对象业务聚类特征20e。对象业务聚类特征20e可以理解为第一业务预测模型20的模型参数,对象业务聚类特征20e可以训练结束时的第一初始预测模型所对应的样本业务聚类特征,样本业务聚类特征的获取方式将在下文进行详细描述。注意力组件20f的输入特征为第一医疗特征20c和对象业务聚类特征20e,其输出特征为对象业务代理特征20g。其中,注意力组件20f可以包括多层感知机(Multilayer Perceptron,MLP)和Softmax层。可以通过注意力组件20f中的多层感知机,对第一医疗特征20c和对象业务聚类特征20e进行特征变换,得到患者i对应的初始聚类权重,进而通过Softmax层对初始聚类权重进行归一化处理,得到对象聚类权重;进一步地,可以通过注意力组件20f对对象业务聚类特征20e与对象聚类权重进行加权求和,从而得到对象业务代理特征20g。
如图2所示,第一设备在通过第一业务预测模型20得到对象业务代理特征20g之后,可以将对象业务代理特征20g发送至第二设备。第二设备可以将对象业务代理特征20g以及患者i对应的第二医疗特征30c进行特征融合处理,得到融合医疗特征,并将融合医疗特征作为第二业务预测模型30中的业务分类识别组件30d的输入特征,通过业务分类识别组件30d对融合医疗特征进行业务分类识别,从而得到患者i对应的医疗诊断结果。医疗诊断结果可以用于表示患者i的患病概率,例如,医疗诊断结果可以是“[A,80%]”,表示患者i针对疾病A的患病概率为80%”。第二设备在得到患者i对应的医疗诊断结果之后,可以将患者i对应的医疗诊断结果发送至第一设备。
在本申请实施例中,业务对象(患者i)对应的对象业务代理特征是针对业务对象对应的第一对象业务信息(第一医疗信息)进行一系列处理之后得到的特征,采用业务对象对应的对象业务代理特征,代替业务对象自身的第一对象业务信息发送给第二设备进行业务分类识别,第二设备无法根据对象业务代理特征反推出患者i在第一设备中的第一对象业务信息(第一医疗信息),从而可以防止第一设备的数据隐私泄露,提高数据安全性。
可以理解的是,上述提及的第一业务预测模型和第二业务预测模型为训练完成的预测模型,也就是说,完成模型训练的第一业务预测模型和第二业务预测模型才能正式应用在业务预测场景中;为便于理解,训练阶段中的第一业务预测模型可以称为第一初始预测模型,相应地,训练阶段中的第二业务预测模型可以称为第二初始预测模型。下面将结合附图3至图7对第一业务预测模型和第二业务预测模型的训练过程进行描述。
请参见图3,图3是本申请实施例提供的一种业务数据处理方法的时序示意图。可以理解地,该业务数据处理方法可以由第一设备(例如,图1所对应实施例中的第一设备110)和第二设备(例如,图1所对应实施例中的第二设备120)交互执行。第一设备可以为服务器,或者可以为终端设备,类似地,第二设备也可以为服务器,或者可以为终端设备,本申请对此不做限定。如图3所示,该业务数据处理方法可以包括以下步骤S101至步骤S108:
步骤S101:获取N个样本对象在第一设备中的第一样本业务信息,通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征。
其中,N表示样本对象的数量,N为正整数,N的具体取值可以是1,2,3,4……;K表示样本业务聚类特征的数量,K为小于或等于N的正整数,K的具体取值可以是1,2,3,4……,N。其中,聚类处理后所得到的样本业务聚类特征的数量K可以是预先设置的固定数值,也可以是在聚类处理过程中确定,本申请实施例对样本业务聚类特征的数量不做限定。
第一样本业务信息可以是存储在第一设备中的N个样本对象的样本业务数据。第一样本业务信息和下文涉及的第二样本业务信息是N个样本对象不同的样本业务信息,第二样本业务信息可以是存储在第二设备中。举例而言,第一样本业务信息可以是N个样本对象的第一医疗信息,相应地,第二样本业务信息可以是N个样本对象的第二医疗信息;第一样本业务信息可以是N个样本对象的第一保单信息,相应地,第二样本业务信息可以是N个样本对象的第二保单信息等等。可以理解的是,在本申请实施例中,N个样本对象中的每一个样本对象均可以对应一个第一样本业务信息。
第一样本业务信息可以存储在第一设备的样本数据库中,第一设备的样本数据库可以是本地数据库,也可以是云数据库。第一设备的样本数据库可以配置有至少一种类型的查询接口,例如,Oracle(一种关系型数据库管理系统)接口、SQL Server(一种关系型数据库管理系统)接口等。第一设备可以将N个样本对象对应的标识信息作为数据查询标识,调用样本数据库对应的查询接口,将样本数据库中与该数据查询标识相匹配的数据记录,确定为N个样本对象对应的第一样本业务信息。
在本申请实施例中,为了防止第二设备反推出第一设备中的N个样本对象对应的第一样本业务信息,导致N个样本对象对应的第一样本业务信息的数据泄露,第一设备可以先通过第一初始预测模型对N个样本对象对应的第一样本业务信息进行一系列的预处理(例如,聚类处理等)。
具体地,在描述第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行预处理过程之前,首先对第一初始预测模型的网络框架进行简单介绍。请参见图4,图4是本申请实施例提供的一种训练业务预测模型的示意图。如图4所示,第一初始预测模型40可以包括第一特征提取组件40b、聚类组件40d以及注意力组件40f等组件。其中,第一特征提取组件40b可以理解为业务特征提取器,第一特征提取组件40b可以是CNN模型、RNN模型、长短期记忆网络(Long Short-Term Memory,LSTM)模型等神经网络模型中的一种或者多种。
如图4所示,第一设备在获得N个样本对象对应的第一样本业务信息40a之后,可以将N个样本对象对应的第一样本业务信息40a输入至第一初始预测模型40中,通过第一初始预测模型40对N个样本对象对应的第一样本业务信息40a进行特征处理。N个样本对象对应的第一样本业务信息40a首先输入至第一初始预测模型40中的第一特征提取组件40b,通过第一特征提取组件40b对N个样本对象对应的第一样本业务信息40a进行特征提取,得到N个样本对象对应的第一样本业务特征40c。其中,第一样本业务特征的具体获取过程可以参见后续图5所示的步骤S201的描述,在此不再进行赘述。
聚类组件40d中可以集成有K-means(均值)聚类算法、均值偏移(Mean shift)聚类算法、DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法、使用高斯混合模型(Gaussian Mixture Model,GMM)的期望最大化(Expectation-maximization,EM)聚类算法、基于KL散度的聚类算法、层次聚类算法等聚类算法中的一种或者多种。如图4所示,N个对象对应的第一样本业务特征40c可以作为聚类组件40d的输入特征,其输出特征可以是K个样本业务聚类特征40e。也就是说,聚类组件40d可以通过上述的一种或者多种聚类算法对N个样本对象对应的第一样本业务信息进行聚类处理,从而得到K个样本业务聚类特征40e。其中,K个样本业务聚类特征的具体获取过程可以参见后续图5所示的步骤S202和S203的描述,在此不再进行赘述。
步骤S102:根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征。
为便于理解,本申请实施例以样本对象i为例,对样本业务代理特征(proxyembedding)的获取方式进行详细描述,类似地,N个样本对象中的其他样本对象对应的样本业务代理特征,可以按照相同的方式获取。样本对象i为N个样本对象中的任意一个样本对象。
在本申请实施例中,样本对象i关联的样本聚类权重可以用于表征K个样本业务聚类特征与样本对象i在第一设备中的第一样本业务信息之间的相关程度。一般而言,样本对象i关联的样本聚类权重越大,K个样本业务聚类特征与样本对象i对应的第一样本业务信息之间的相关程度越高。样本对象i关联的样本聚类权重可以根据样本对象i对应的第一样本业务信息和K个样本业务聚类特征确定,具体的获取方式可以参见后续图5所述的步骤S204至步骤S206的描述,在此不再进行赘述。
样本对象i对应的样本业务代理特征是由K个样本业务聚类特征与样本对象i关联的样本聚类权重进行加权求和得到的,样本对象i对应的样本业务代理特征可以包含样本对象i对应的第一样本业务信息中具有较高权重的特征。也就是说,样本对象i对应的样本业务代理特征可以近似表达样本对象i对应的第一样本业务信息中的相关信息,并且还可以增强样本对象i对应的第一样本业务信息的中间层表示的个性化程度。因此,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,不仅不会导致模型性能降低,还可以提升模型性能。
如图4所示,可以通过注意力组件40f得到样本对象i对应的样本聚类权重。具体地,可以将样本对象i对应的第一样本业务特征和K个样本业务聚类特征40e作为注意力组件40f的输入特征,通过注意力组件40f对样本对象i对应的第一样本业务特征和K个样本业务聚类特征40e进行特征拼接,得到样本联合特征,进而通过注意力组件40f对样本联合特征进行特征变换处理、归一化处理等,得到样本对象i对应的样本聚类权重。
进一步地,可以通过注意力组件40f获取K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征,进而可以将K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征进行累加,输出样本对象i对应的样本业务代理特征40g。为便于理解,本申请实施例以样本业务聚类特征βj为例,对单位加权特征的获取方式进行详细描述,类似地,K个样本业务聚类特征中的其他样本业务聚类特征对应的单位加权特征,可以按照相同的方式获取。
具体地,样本对象i对应的样本业务代理特征的获取方式可以包括:可以将K个样本业务聚类特征中的样本业务聚类特征βj,与样本业务聚类特征βj对应的样本聚类权重之间的点乘,确定为样本业务聚类特征βj对应的单位加权特征;进而将K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征进行累加,得到样本对象i对应的样本业务代理特征。其中,样本对象i对应的样本业务代理特征可以如下述公式(1)所示:
(1)
其中,公式(1)中的表示样本对象i对应的样本业务代理特征;/>表示样本业务聚类特征βj对应的样本聚类权重;/>表示样本业务聚类特征βj,样本业务聚类特征βj可以理解为K个样本业务聚类特征中的第j个样本业务聚类特征,j为小于或等于K的正整数,K表示样本业务聚类特征的数量,/>表示样本业务聚类特征βj对应的单位加权特征。
步骤S103:将样本业务代理特征发送至第二设备。
第一设备在得到样本对象i对应的样本业务代理特征40g之后,可以将样本对象i对应的样本业务代理特征40g发送至第二设备。相应地,第二设备接收第一设备发送的样本对象i对应的样本业务代理特征40g。可以理解的是,第一设备还可以将N个样本对象中的其他对象对应的样本业务代理特征发送至第二设备,与样本对象i对应的样本业务代理特征共同参与模型训练。
步骤S104:接收第一设备发送的样本业务代理特征,获取样本对象i在第二设备中的第二样本业务信息,通过第二设备中的第二初始预测模型,对样本业务代理特征,以及第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果。
样本对象i对应的第二样本业务信息可以存储在第二设备的样本数据库中,第二设备的样本数据库可以是本地数据库,也可以是云数据库。样本对象i对应的第二样本业务信息的具体获取过程可以参见上述图3所示的步骤S101的第一样本业务信息的获取过程的描述,在此不再进行赘述。
在本申请实施例中,业务分类识别可以是指对样本对象i对应的样本业务代理特征和第二样本业务信息进行识别,将样本对象i划分为某一业务类别的过程;业务分类识别可以包括多分类处理,也可以包括二分类处理,本申请实施例对此不做限定。此处的业务类别可以理解为样本对象i对应的样本预测结果,可选地,样本预测结果可以用一个离散值或概率分布来表示样本对象i属于某一业务类别的置信度或者概率。
举例而言,在医疗场景中,业务分类识别可以是多分类处理,例如,可以通过第二设备中的第二初始预测模型,对样本对象i对应的样本业务代理特征和第二样本业务信息(例如,样本对象i的历史疾病诊断结果)进行疾病类型分类,得到样本对象i针对某一疾病的患病概率;例如,样本医疗诊断结果可以是“[A,80%]”,表示样本对象i针对疾病A的患病概率为80%。在信息推荐场景(例如,广告推荐场景)中,业务分类识别可以是二分类处理,例如,可以通过第二设备中的第二初始预测模型,对样本对象i对应的样本业务代理特征和第二样本业务信息(例如,样本对象i针对广告C的历史点击率)进行二分类处理,确定是否向样本对象i推送广告C;例如,样本对象i对应的样本推荐预测结果可以是:“1”或“0”,“1”表示向样本对象i推送广告C,“0”表示不向样本对象i推送广告C。
如图4所示,第二初始预测模型50可以包括第二特征提取组件50b以及业务分类识别组件50d等组件。与第一特征提取组件40b类似,第二特征提取组件50b可以理解为业务特征提取器,第二特征提取组件50b可以是CNN模型、RNN模型、LSTM模型等神经网络模型中的一种或者多种。如图4所示,第二设备在获得样本对象i对应的第二样本业务信息50a之后,可以将样本对象i对应的第二样本业务信息50a输入至第二初始预测模型50中进行处理。样本对象i对应的第二样本业务信息50a首先输入至第二初始预测模型50中的第二特征提取组件50b,通过第二特征提取组件50b对样本对象i对应的第二样本业务信息50a进行特征提取,得到样本对象i对应的第二样本业务特征50c。其中,样本对象i对应的第二样本业务特征的具体获取过程可以参见后续图5所示的步骤S201中获取第一样本业务特征的描述,在此不再进行赘述。
业务分类识别组件50d可以用于输出样本对象i对应的样本预测结果,业务分类识别组件50d具体可以是CNN模型、RNN模型、LSTM模型等神经网络模型中的一种或者多种。如图4所示,第二设备可以通过第二初始预测模型50中的业务分类识别组件50d对第一设备发送的样本对象i对应的样本业务代理特征40g和样本对象i对应的第二样本业务特征50c进行特征融合,得到样本融合特征;其中,特征融合的方式可以包括但不限于:①将样本对象i对应的样本业务代理特征40g和样本对象i对应的第二样本业务特征50c进行特征拼接处理,将拼接后的特征确定为样本融合特征;②计算样本对象i对应的样本业务代理特征40g和样本对象i对应的第二样本业务特征50c之间的平均值,将该平均值确定为样本融合特征。进一步地,业务分类识别组件50d可以对样本融合特征进行业务分类识别,进而得到样本对象i对应的样本预测结果。
步骤S105:获取样本对象i在第二设备中的样本标签数据,根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数。
样本对象i对应的样本标签数据可以用于标识样本对象i的真实信息,样本预测结果可以用于修正第二初始预测模型的网络参数。模型梯度参数可以根据样本预测结果和样本对象i在第二设备中的样本标签数据确定,模型梯度参数可以用于对第二初始预测模型包含的网络参数进行修正。第二初始预测模型包含的网络参数可以包括但不限于:第二特征提取组件50b和业务分类识别组件50d的权重矩阵和偏置向量、学习率等参数。
其中,第二设备可以根据样本对象i对应的样本标签数据和样本预测结果,确定第二初始预测模型对应的模型损失,模型损失可以包括但不限于:均方误差损失、交叉熵损失、对数损失等。在一种可能的实施方式中,第二初始预测模型对应的模型损失的获取方式可以包括:第二设备可以将样本标签数据与样本预测结果对应的第一对数结果之间的乘积,确定为第一候选损失;将常量参数与样本预测结果之间的差值进行对数运算,得到第二对数结果;将第二对数结果,以及常量参数与样本标签数据的差值之间的乘积,确定为第二候选损失;根据第一候选损失和第二候选损失之和,确定第二初始预测模型对应的模型损失。其中,第二初始预测模型对应的模型损失可以如下述公式(2)所示:
(2)
其中,公式(2)中的表示第二初始预测模型对应的模型损失;y表示样本对象i对应的样本标签数据;/>表示样本对象i对应的样本预测结果;log()表示对数运算;表示第一对数结果;/>表示第一候选损失;1表示常量参数;表示第二对数结果;/>表示第二候选损失。
在一种可能的实施方式中,第二初始预测模型对应的模型损失的获取方式还可以包括:第二设备可以将样本预测结果和样本标签数据之间的乘积确定为第三候选损失,将常量参数与第三候选损失之间的差值确定为第四候选损失,对第四候选损失与指数参数进行指数运算,得到修正系数;将修正系数与样本预测结果对应的第一对数结果之间的乘积,确定为第二初始预测模型对应的模型损失。其中,第二初始预测模型对应的模型损失可以如下述公式(3)所示:
(3)
其中,公式(3)中的表示第二初始预测模型对应的模型损失;y表示样本对象i对应的样本标签数据;/>表示样本对象i对应的样本预测结果;log()表示对数运算;/>表示第一对数结果;/>表示指数参数,其具体取值可以根据实际应用进行设置;表示第三候选损失;1表示常量参数;/>表示第四候选损失。
进一步地,可以根据第二初始预测模型对应的模型损失以及链式法则(ChainRule),对第二初始预测模型中需要进行调整的网络参数进行求偏导数运算,得到第二初始预测模型对应的模型梯度参数。需要说明的是,本申请实施例根据样本对象i对应的样本标签数据和样本预测结果对第二初始预测模型进行训练,仅是用于举例,在实际应用中,可以根据需要选择N个样本对象中一个或多个样本对象对应的样本标签数据和样本预测结果对第二初始预测模型进行训练。
步骤S106:根据模型梯度参数对第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为第二设备中的第二业务预测模型。
如图4所示,第二设备可以根据模型梯度参数对第二初始预测模型的网络参数进行迭代训练,直至第二初始预测模型更新后的网络参数满足训练结束条件时,停止训练,并将训练结束时的第二初始预测模型确定为第二设备中的第二业务预测模型。其中,第二初始预测模型的训练结束条件可以包括但不限于:第二初始预测模型的训练次数达到了预先设置的最大迭代次数,或者模型梯度参数的值小于或等于预先设置的误差值,或者第二初始预测模型的网络参数的更新幅度小于预先设置的误差值等,本申请实施例对此不做限定。
举例而言,在第二初始预测模型的训练阶段中,可以使用AdamW(一种优化方法)或者带有动量的梯度下降等优化方法作为优化器进行训练。在第二初始预测模型的训练阶段中,第二初始预测模型可以设置为训练10 epoch(迭代轮次),一个epoch表示完整训练一次样本对象i所包含的样本数据,epoch=10表示完整训练10次样本对象i所包含的样本数据,并将第10个epoch训练结束时的第二初始预测模型确定为第二设备中的第二业务预测模型。
步骤S107:将模型梯度参数发送至第一设备。
在得到第二初始预测模型对应的模型梯度参数之后,第二设备可以将样本预测结果关联的模型梯度参数发送至第一设备,相应地,第一设备接收该模型梯度参数。
需要说明的是,本申请实施例不对步骤S106和步骤S107的执行先后顺序进行限定,第二设备可以先执行步骤S106,再执行步骤S107,或者也可以先执行步骤S107,在执行步骤S106。
步骤S108:接收第二设备返回的样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型。
其中,第一初始预测模型包含的网络参数可以包括但不限于:第一特征提取组件40b和注意力组件40f的权重矩阵和偏置向量、学习率、聚类组件40d中的K个样本业务聚类特征等参数。
如图4所示,第一设备可以根据第二设备传回来的模型梯度参数和第二聚类梯度参数对第一初始预测模型包含的网络参数进行修正,第二聚类梯度参数可以根据K个样本业务聚类特征以及样本对象i对应的第一样本业务信息确定。具体地,第一设备可以根据样本对象i对应的第一样本业务特征zi,以及K个样本业务聚类特征中的每一个样本业务聚类特征之间的样本相似系数,确定第二聚类损失;其中,第一样本业务特征zi可以是通过图4所示的第一初始预测模型40中的特征提取组件40b,对样本对象i对应的第一样本业务信息进行特征提取得到的,第一样本业务特征zi的具体获取过程可以参见后续图5所示的步骤S201的描述,在此不再进行赘述。第二聚类损失可以根据停止更新时的K个样本中心特征(也即K个样本业务聚类特征)和第一样本业务特征zi确定,其具体获取过程可以参见后续图5所示的步骤S203中的第一聚类损失的具体获取过程,在此不再进行赘述。其中,第二聚类损失可以如下述公式(4)所示:
(4)
其中,公式(4)中的表示第二聚类损失;/>表示第一样本业务特征zi和样本业务聚类特征βj之间的预测相似系数,其中,/>,样本业务聚类特征βj是K个样本业务聚类特征中的第j个样本业务聚类特征,j为小于或等于K的正整数,K表示样本业务聚类特征的数量;/>表示第一对象业务特征zi与样本业务聚类特征βj之间的样本相似系数;/>表示相似系数平方值;/>表示相似系数平方累积值/>表示第一样本业务特征zi和样本业务聚类特征βj之间的预测相似系数,以及第一对象业务特征zi与样本业务聚类特征βj之间的样本相似系数的对数差值;/>表示第一样本业务特征zi和样本业务聚类特征βj之间的单位聚类损失。第二聚类损失的具体计算方式可以参见图5所示的步骤S202计算第一样本业务特征与样本中心特征之间的样本相似系数的描述,在此不再进行赘述。
进一步地,第一设备可以对第二聚类损失进行求导运算得到第二聚类梯度参数,将模型梯度参数和第二聚类梯度参数之和,确定为第一初始预测模型对应的总梯度参数;进而可以根据总梯度参数对第一初始预测模型的网络参数进行迭代训练,直至更新后的网络参数满足训练结束条件时,停止训练,并将训练结束时的第一初始预测模型确定为第一设备中的第一业务预测模型。其中,第一初始预测模型对应的训练结束条件可以参考上述第二初始预测模型对应的训练结束条件的描述;第一初始预测模型的训练过程也可以参考上述第二初始预测模型对应的训练过程的描述,在此不再进行赘述。在本申请实施例中,可以将训练结束时的第一初始预测模型所包含的K个样本业务聚类特征,确定为第一业务预测模型的网络参数,在第一业务预测模型中,K个样本业务聚类特征可以称为K个对象业务聚类特征。
在本申请实施例中,第一初始预测模型对应的总梯度参数可以同时包含样本标签数据关联的模型梯度参数、以及K个样本业务聚类特征关联的第二聚类梯度参数,第一初始预测模型中的聚类学习可以无障碍地结合到第一初始预测模型的训练过程中,可以使得第一初始预测模型可以进行端到端训练。换言之,可以同时对第一初始预测模型中的第一特征提取组件、聚类组件以及注意力组件等组件进行训练,第一初始预测模型无需分模块或分阶段进行训练,从而可以节省第一初始预测模型的训练时间,提高第一初始预测模型的训练效率。
本申请实施例中,可以通过第一初始预测模型对N个样本对象在第一设备中的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,进而可以将K个样本业务聚类特征与N个样本对象中的样本对象i关联的样本聚类权重进行加权求和,得到样本业务代理特征,并将该样本业务代理特征发送至第二设备进行模型训练。由此可见,样本对象i对应的样本业务代理特征是针对样本对象i对应的第一样本业务信息进行一系列处理之后得到的特征,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,第二设备无法根据样本业务代理特征反推出样本对象i在第一设备中的第一样本业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
请参见图5,图5是本申请实施例提供的一种业务数据处理方法的流程示意图一。可以理解地,该业务数据处理方法可以由第一设备(例如,图1所对应实施例中的第一设备110)执行。第一设备可以为服务器,或者可以为终端设备,本申请对此不做限定。如图8所示,该业务数据处理方法可以包括以下步骤S201至步骤S209。
步骤S201:获取N个样本对象在第一设备中的第一样本业务信息,通过第一设备关联的第一初始预测模型中的特征提取组件,对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到N个样本对象中的每一个样本对象对应的第一样本业务特征。
其中,N个样本对象中的每一个样本对象可以对应一个第一样本业务特征。可选地,可以将N个样本对象中的每一个样本对象对应的第一样本业务信息,逐个输入到第一初始预测模型中的特征提取组件中进行特征提取,从而使得提取得到的N个样本对象中的每一个样本对象对应的第一样本业务特征具有较高的准确性。可选地,也可以将N个样本对象中的每一个样本对象对应的第一样本业务信息组成一个或多个批次(batch),通过批处理的方式并行地对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,从而提高N个样本对象中的每一个样本对象对应的第一样本业务特征的获取效率。
其中,第一初始预测模型中的特征提取组件可以是如图4所示的第一特征提取组件40b,特征提取组件可以是CNN模型、RNN模型、LSTM模型等神经网络模型中的一种或者多种。为便于理解,本申请实施例以特征提取组件是CNN模型为例,对N个样本对象中的样本对象i对应的第一样本业务特征zi的获取过程进行详细描述。N个样本对象中的其他样本对象对应的第一样本业务特征可以采用相同的方式获取,在此不再进行赘述。
具体地,特征提取组件可以包括卷积层、激活层和池化层等网络层。可以通过特征提取组件中的卷积层,对N个样本对象中的样本对象i对应的第一样本业务信息进行卷积处理,得到样本对象i对应的样本卷积特征。其中,卷积层可以包括一个或者多个卷积核,卷积核的尺寸可以是1×1,也可以是3×3,其具体取值根据实际需要确定,本申请实施例对卷积核的数量和尺寸不做限定。在对第一样本业务信息进行卷积处理的过程中,卷积层中的卷积核可以滑动经过第一样本业务信息,从而提取得到第一样本业务信息对应的样本卷积特征。
进一步地,可以通过特征提取组件中的激活层,对样本对象i对应的样本卷积特征进行激活处理,得到样本对象i对应的样本激活特征。激活层的作用是引入非线性特性,增加样本激活特征的特征表示能力。样本对象i对应的样本卷积特征输入至激活层之后,可以通过激活层中的激活函数对其进行非线性变化处理,从而得到样本对象i对应的样本激活特征。其中。激活函数可以包括但不限于:ReLU函数、Sigmoid函数以及Tanh函数等激活函数中的一种或者多种。
第一设备可以通过特征提取组件中的池化层,对样本对象i对应的样本激活特征进行池化处理,得到样本对象i对应的第一样本业务特征zi。通过池化层输出的样本对象i对应的第一样本业务特征zi,相对于样本激活特征而言,数据维度和参数数量可以显著减少,有助于抑制过拟合现象。池化处理可以是最大池化(Max Pooling)处理,或者也可以是平均池化(Average Pooling)处理,本申请实施例对此不做限定。
步骤S202:在N个样本对象中的每一个样本对象对应的第一样本业务特征中选择K个样本中心特征,获取N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数。
在本申请实施例中,样本相似系数可以用于反映第一样本业务特征与样本业务聚类特征之间的相关程度。一般而言,第一样本业务特征与样本中心特征之间的样本相似系数越大,样本中心特征与第一样本业务特征之间的相似程度越大。
第一设备可以预先设置样本中心特征(embedding,也可以称为群组中心,或者还可以聚类中心等)的数量K。样本中心特征的数量K可以根据经验来设置,如K可以取值为200,也可以采用交叉验证等方法来确定。在本申请实施例中,样本中心特征的维度与第一初始预测模型中的特征提取组件的前向输出(即第一样本业务特征)的维度相同。
在一种可能的实施方式中,K个样本中心特征的获取方式可以包括:可以从N个样本对象对应的第一样本业务特征中随机选择K个第一样本业务特征,将随机选择的K个第一样本业务特征确定为初始的K个样本中心特征。在一种可能的实施方式中,K个样本中心特征的获取方式还可以包括:可以从N个样本对象对应的第一样本业务特征中选择彼此距离尽可能远的K个第一样本业务特征作为初始的样本中心特征。具体选择方式可以是:从N个样本对象对应的第一样本业务特征中随机选择一个第一样本业务特征作为第一个样本中心特征μ1;进而可以从剩余的第一样本业务特征(未被选择的第一样本业务特征)中,选择与第一个样本中心特征μ1距离最远的第一样本业务特征作为第二个样本中心特征μ2;可以计算第一个样本中心特征μ1和第二个样本中心特征μ2之间的中心点(该中心点可以为第一个样本中心特征μ1和第二个样本中心特征μ2之间的平均值所对应的第一样本业务特征,如与该平均值距离最近的第一样本业务特征),从剩余的第一样本业务特征中选择与该中心点距离最远的第一样本业务特征作为第三个样本中心特征μ3;以此类推,直至确定第K个样本中心特征μk,即可以确定K个样本中心特征。
在一种可能的实施方式中,可以将K个样本中心特征中的每一个样本中心特征融合为中心联合特征,进而分别计算N个样本对象中的每一个样本对象对应的第一样本业务特征与中心联合特征之间的样本相似系数,以得到N个样本相似系数。其中,特征融合的方式可以参考上述图3所示的步骤S104的描述,在此不再进行赘述。假设N个样本对象包括样本对象i和样本对象j,K个样本中心特征包括样本中心特征μi和样本中心特征μj,可以将样本中心特征μi和样本中心特征μj进行特征融合,得到中心联合特征,进而计算样本对象i对应的第一样本业务特征zi和中心联合特征之间的样本相似系数,以及计算样本对象j对应的第一样本业务特征zj和中心联合特征之间的样本相似系数,从而得到两个不同的样本相似系数。
在一种可能的实施方式中,可以将N个样本对象中的每一个样本对象对应的第一样本业务特征与K个样本中心特征中的每一个样本中心特征分别进行样本相似系数的计算,得到N×K个样本相似系数。假设N个样本对象包括样本对象i和样本对象j,K个样本中心特征包括样本中心特征μi和样本中心特征μj,在这种情况下,可以计算样本对象i对应的第一样本业务特征zi和样本中心特征μi之间的样本相似系数,可以计算样本对象i对应的第一样本业务特征zi和样本中心特征μj之间的样本相似系数,以及可以计算样本对象j对应的第一样本业务特征zj和样本中心特征μi之间的样本相似系数,可以计算样本对象j对应的第一样本业务特征zj和样本中心特征μj之间的样本相似系数,得到4个不同的样本相似系数。
为便于理解,本申请实施例以计算第一样本业务特征zi和样本中心特征μj之间的样本相似系数为例进行描述,样本相似系数的计算方式均可以采用与之相同的方式获取。其中,第一样本业务特征zi为样本对象i对应的第一样本业务特征,样本中心特征μj为K个样本中心特征中的第j个样本中心特征。
在一种可能的实施方式中,第一样本业务特征zi和样本中心特征μj之间的样本相似系数的计算方式可以包括:可以根据第一样本业务特征zi对应的第一样本业务特征与样本中心特征μj之间的距离,确定第一样本业务特征zi与样本中心特征μj之间的样本相似系数。一般而言,第一样本业务特征zi和样本中心特征μj之间的距离与其对应的样本相似系数成反比,第一样本业务特征zi和样本中心特征μj之间的距离越小,第一样本业务特征zi和样本中心特征μj之间的样本相似系数越大。在本申请实施例中,可以将第一样本业务特征zi和样本中心特征μj之间的距离的倒数,确定为第一样本业务特征zi和样本中心特征μj之间的样本相似系数。第一样本业务特征zi和样本中心特征μj之间的距离所采用的方法可以包括但不限于:欧几里得距离(Eucledian Distance)、曼哈顿距离(Manhattan Distance)、明可夫斯基距离(Minkowski distance)、余弦相似度(Cosine Similarity)。
在一种可能的实施方式中,第一样本业务特征zi和样本中心特征μj之间的的计算方式还可以包括:获取样本对象i对应的第一样本业务特征zi与样本中心特征μj之间的距离,其距离可以包括但不限于:欧几里得距离、曼哈顿距离、明可夫斯基距离,以及余弦相似度等;进而可以根据预置聚类参数,以及第一样本业务特征zi和样本中心特征μj之间的距离,确定第一样本业务特征zi和样本中心特征μj之间的样本候选相似度;对第一样本业务特征zi与各个样本中心特征之间的样本候选相似度进行累加,得到样本候选相似度总值;将样本候选相似度与样本相似度总值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的样本相似系数。其中,第一样本业务特征zi和样本中心特征μj之间的样本相似系数可以如下述公式(5)所示:
(5)
其中,公式(5)中的表示第一样本业务特征zi和样本中心特征μj之间的样本相似系数,其取值可以是在0与1之间;/>表示样本对象i对应的第一样本业务特征;/>是K个样本中心特征中的第j个样本中心特征,j为小于或等于K的正整数,K表示样本中心特征的数量;/>表示预置聚类参数,/>取值一般大于1,其具体的取值可以根据实际需求确定;表示第一样本业务特征zi和样本中心特征μj之间的欧几里得距离;表示第一样本业务特征zi和样本中心特征μj之间的样本候选相似度;表示样本候选相似度总值。
步骤S203:根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征。
请参见图6,图6是本申请实施例提供的一种获取样本业务聚类特征的示意图。如图6所示,假设样本中心特征的数量K为3,可以从N个对象对应的第一样本业务特征40c中选择3个第一样本业务特征作为初始的样本中心特征,例如,选择第一样本业务特征z1作为第一个样本中心特征μ1,第一样本业务特征z2作为第二个样本中心特征μ2,第一样本业务特征z3作为第三个样本中心特征μ3。
进而可以计算N个对象对应的第一样本业务特征40c中每一个第一样本业务特征分别与样本中心特征μ1、样本中心特征μ2以及样本中心特征μ3之间的样本相似系数,将第一样本业务特征划分到样本相似系数最大的样本中心特征所属的集合。可以根据每一个集合中分别包含的第一样本业务特征,更新每一个样本中心特征。具体地,可以计算每一个集合中所包含的所有第一样本业务特征的平均值,根据平均值更新集合对应的样本中心特征,得到一个新的样本中心特征。如图6所示,样本中心特征进行一次更新之后,样本中心特征由样本中心特征μ1更新为样本中心特征μ4,样本中心特征由样本中心特征μ2更新为样本中心特征μ5,样本中心特征由样本中心特征μ3更新为样本中心特征μ6。
如图6所示,可以再次计算N个对象对应的第一样本业务特征40c中每一个第一样本业务特征分别与样本中心特征μ4、样本中心特征μ5以及样本中心特征μ6之间的样本相似系数,可以根据样本相似系数更新样本中心特征μ4、样本中心特征μ5以及样本中心特征μ6所属的集合,进而可以计算新的集合中所包含的所有第一样本业务特征的平均值,根据平均值更新集合对应的样本中心特征,得到新的样本中心特征。不断重复上述过程,直至每一个集合中所包含的第一样本业务特征的更新幅度小于或等于预先设置的误差值,或者样本中心特征的更新次数达到预先设置的最大更新迭代次数。如图6所示,经过多次更新迭代之后,样本中心特征的更新次数达到预先设置的最大更新迭代次数,此时可以将样本中心特征μ8、样本中心特征μ9以及样本中心特征μ10,确定为K个样本业务聚类特征40e。
在一种可能的实施方式中,在得到N个样本对象对应的第一样本业务特征与K个样本中心特征之间的样本相似系数之后,可以根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定K个样本中心特征相关联的第一聚类损失,进而根据K个样本中心特征相关联的第一聚类损失,对K个样本中心特征进行更新,得到K个样本业务聚类特征。
具体地,K个样本中心特征相关联的第一聚类损失的获取方式可以包括:可以将样本对象i对应的第一对象业务特征zi与K个样本中心特征中的样本中心特征μj之间的样本相似系数的平方,确定为相似系数平方值;将第一对象业务特征zi与各个样本中心特征之间的相似系数平方值进行累加,得到相似系数平方累积值;将相似系数平方值与相似系数平方累积值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的预测相似系数;获取预测相似系数,以及第一对象业务特征zi与样本中心特征μj之间的样本相似系数的对数差值,将预测相似系数和对数差值之间的乘积,确定为第一样本业务特征zi和样本中心特征μj之间的单位聚类损失;将第一样本业务特征zi和各个样本中心特征之间的单位聚类损失进行累加,得到样本对象i对应的第一聚类损失。其中,样本对象i对应的第一聚类损失可以如下述公式(6)所示:
(6)
其中,公式(6)中的表示样本对象i对应的第一聚类损失;/>表示第一样本业务特征zi和样本中心特征μj之间的预测相似系数,其中,/>,样本中心特征μj是K个样本中心特征中的第j个样本中心特征,j为小于或等于K的正整数,K表示样本中心特征的数量;/>表示第一对象业务特征zi与样样本中心特征μj之间的样本相似系数;/>表示相似系数平方值;/>表示相似系数平方累积值;/>表示第一样本业务特征zi和样本中心特征μj之间的预测相似系数,以及第一对象业务特征zi与样本中心特征μj之间的样本相似系数的对数差值;/>表示第一样本业务特征zi和样本中心特征μj之间的单位聚类损失。
进一步地,可以对K个样本中心特征相关联的第一聚类损失进行求导运算得到第一聚类梯度参数,例如,可以对K个样本中心特征相关联的第一聚类损失中的样本中心特征进行求偏导数运算,得到第一聚类梯度参数;进而可以根据第一聚类梯度参数对K个样本中心特征进行更新;若更新后的K个样本中心特征满足停止更新条件,则将停止更新时的K个样本中心特征确定为样本业务聚类特征。其中,停止更新条件可以包括但不限于:K个样本中心特征的更新次数达到了预先设置的最大迭代次数,或者第一聚类梯度参数的值小于或等于预先设置的误差值,或者K个样本中心特征中每一个样本中心特征的更新幅度均小于预先设置的误差值等,本申请实施例对此不做限定。
可选地,在得到样本对象i对应的K个样本业务聚类特征之后,第一设备可以将K个样本业务聚类特征中,最大的样本相似系数所对应的样本业务聚类特征,确定为样本对象i对应的样本业务代理特征;或者,也可以将K个样本业务聚类特征中,最小的距离所对应的样本业务聚类特征,确定为样本对象i对应的样本业务代理特征。
步骤S204:将样本对象i对应的第一样本业务特征zi和K个样本业务聚类特征中的样本业务聚类特征βj拼接为样本联合特征。
步骤S205:通过第一初始预测模型中的多层感知机对样本联合特征进行特征变换处理,得到样本业务聚类特征βj对应的候选聚类权重。
其中,样本对象i对应的第一样本业务特征zi是通过第一初始预测模型中的特征提取组件,对样本对象i对应的第一样本业务信息进行特征提取得到的。第一样本业务特征zi的具体获取方式可以参考上文的描述,在此不再进行赘述。样本业务聚类特征βj是K个样本业务聚类特征中的第j个样本业务聚类特征。
在本申请实施例中,可以将样本对象i对应的第一样本业务特征zi和样本业务聚类特征βj进行特征拼接,得到样本联合特征,进而可以通过第一初始预测模型中的注意力组件来学习第一样本业务特征与各个样本业务聚类特征之间的样本聚类权重。
具体地,可以通过注意力组件中的多层感知机对应的隐含权重矩阵和偏置向量,对样本联合特征进行特征变换处理,最终输出样本业务聚类特征βj对应的候选聚类权重。其中,多层感知机可以包括一个输入层、一个或者多个隐藏层,以及一个输出层,层与层之间是全连接(Fully Connected)的,也就是说,多层感知机中可以将上一层节点的输出特征全部连接在一起,作为下一层的输入特征。可选地,多层感知机还可以包括一个或多个激活层,激活层中可以包括ReLU函数、Sigmoid函数以及Tanh函数等一种或者多种激活函数,用于对样本联合特征进行非线性变化处理。
步骤S206:对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重。
步骤S207:将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征。
在本申请实施例中,可以通过注意力组件中的Softmax层对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重。具体地,对样本业务聚类特征βj对应的候选聚类权重进行归一化处理的方式可以包括:对样本业务聚类特征βj对应的候选聚类权重进行指数运算,得到样本业务聚类特征βj对应的权重指数值;将K个样本业务聚类特征中的每一个样本业务聚类特征对应的权重指数值进行累加,得到权重指数总值,将样本业务聚类特征βj对应的权重指数值与权重指数总值之间的比值,确定为样本业务聚类特征βj对应的样本聚类权重。其中,样本业务聚类特征βj对应的样本聚类权重可以如下述公式(7)所示:
(7)
其中,公式(7)中的表示样本业务聚类特征βj对应的样本聚类权重;/>表示样本业务聚类特征βj对应的候选聚类权重;exp()表示指数运算;/>表示样本业务聚类特征βj对应的权重指数值;/>表示权重指数总值。
进一步地,可以将K个样本业务聚类特征与样本聚类权重进行加权求和,从而得到样本对象i对应的样本业务代理特征,样本对象i对应的样本业务代理特征具体的获取方式可以参见图3所示的步骤S102的描述,在此不再进行赘述。
请参见图7,图7是本申请实施例提供的一种获取样本业务代理特征的示意图。为便于理解,如图7所示,假设第一样本业务特征包括样本对象1对应的第一样本业务特征z1、样本对象2对应的第一样本业务特征z2和样本对象3对应的第一样本业务特征z3;样本业务聚类特征包括样本业务聚类特征的数量β1和样本业务聚类特征的数量β2。可以将第一样本业务特征和样本业务聚类特征输入至第一初始预测模型中,通过第一初始预测模型中的多层感知机对第一样本业务特征和样本业务聚类特征进行特征变换处理,得到第一样本业务特征和样本业务聚类特征之间各个候选聚类权重;例如,可以将第一样本业务特征z1和样本业务聚类特征β1拼接为样本联合特征ɵ11,通过多层感知机对样本联合特征ɵ11进行特征变换处理,得到候选聚类权重δ11;可以将第一样本业务特征z1和样本业务聚类特征β2拼接为样本联合特征ɵ12,通过多层感知机对样本联合特征ɵ12进行特征变换处理,得到候选聚类权重δ12;类似地,可以采用相同的方式得到候选聚类权重δ21、候选聚类权重δ22、候选聚类权重δ31和候选聚类权重δ32。
如图7所示,在得到候选聚类权重之后,可以对候选聚类权重进行归一化处理,得到样本聚类权重;例如,可以对候选聚类权重δ11进行归一化处理,得到样本聚类权重ɑ12;可以对候选聚类权重δ12进行归一化处理,得到样本聚类权重ɑ12;类似地,可以采用相同的方式得到样本聚类权重ɑ21、样本聚类权重ɑ22、样本聚类权重ɑ31和样本聚类权重ɑ32。进一步地,可以将样本聚类权重ɑ11和样本业务聚类特征包括样本业务聚类特征的数量β1之间的点乘,确定为单位加权特征η11,可以将样本聚类权重ɑ12和样本业务聚类特征包括样本业务聚类特征的数量β2之间的点乘,确定为单位加权特征η12,进而可以将单位加权特征η11和单位加权特征η12进行累加,得到样本对象1对应的样本业务代理特征1;类似地,可以采用同样的方式得到样本对象2对应的样本业务代理特征2,以及样本对象3对应的样本业务代理特征3。可以理解的是,在本申请实施例中,各个候选聚类权重、各个样本聚类权重,和各个样本业务代理特征可以是并行获取的。
可选地,当样本对象中存在样本聚类权重取值为1的样本聚类权重,则可以认为聚类权重取值为1所对应的样本业务聚类特征与该样本对象对应的第一样本业务信息具有很高的关联程度;假设如图7所示的样本聚类权重ɑ11取值为1,样本对象1对应的第一样本业务特征z1与样本业务聚类特征β1之间的样本相似系数远远高于样本业务聚类特征β2之间的样本相似系数,此时采用样本业务聚类特征β1可以近似表达第一样本业务特征z1的相关信息。在这种情况下,可以将样本业务聚类特征β1样本对象1对应的样本业务代理特征1。
步骤S208:将样本业务代理特征发送至第二设备,以使第二设备通过第二设备中的第二初始预测模型,对样本业务代理特征,以及样本对象i在第二设备中的第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果。
步骤S209:接收第二设备返回的样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型。
其中,步骤S208和步骤S209的具体实现过程可以参见前述图3所对应实施例中的步骤S103至步骤S108的描述,此处不再进行赘述。
本申请实施例中,可以通过第一初始预测模型对N个样本对象在第一设备中的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,进而可以将K个样本业务聚类特征与N个样本对象中的样本对象i关联的样本聚类权重进行加权求和,得到样本业务代理特征,并将该样本业务代理特征发送至第二设备进行模型训练,第一设备无需对第一样本业务信息进行加密处理,从而可以降低第一设备和第二设备之间的通信成本;此外,也无需对第一样本业务信息添加噪声,从而不会导致模型性能降低。
在申请实施例中,样本对象i对应的样本业务代理特征是针对样本对象i对应的第一样本业务信息进行一系列处理之后得到的特征,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,第二设备无法根据样本业务代理特征反推出样本对象i在第一设备中的第一样本业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
可以理解的是,可以将训练完成的第一业务预测模型和第二业务预测模型应用在任意的业务预测场景中,例如,医疗场景、信息推荐场景等业务预测场景中。具体地,请参见图8,图8是本申请实施例提供的一种业务数据处理方法的流程示意图二;可以理解地,该业务数据处理方法可以由第一设备(例如,图1所对应实施例中的第一设备110)执行。第一设备可以为服务器,或者可以为终端设备,本申请对此不做限定。如图8所示,该业务数据处理方法可以包括以下步骤S301至步骤S303:
步骤S301:获取业务对象在第一设备中的第一对象业务信息,将第一对象业务信息输入至第一设备中的第一业务预测模型,根据第一对象业务信息,确定第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;K为正整数。
其中,第一对象业务信息和下文涉及的第二对象业务信息是业务对象不同的对象业务信息,第二对象业务信息可以是存储在第二设备中。举例而言,第一对象业务信息可以是业务对象的第一医疗信息,相应地,第二对象业务信息可以是业务对象的第二医疗信息;第一对象业务信息可以是业务对象的第一保单信息,相应地,第二对象业务信息可以是业务对象的第二保单信息等等。K表示对象业务聚类特征的数量,K为正整数,K的具体取值可以是1,2,3,4……。对象聚类权重用于表征K个对象业务聚类特征与第一对象业务信息之间的相关程度;一般而言,对象聚类权重越大,K个对象业务聚类特征与第一对象业务信息之间的相关程度越高。
具体地,第一设备可以获取预先训练完成的第一业务预测模型,第一业务预测模型的网络结构可以参见图2所示的第一业务预测模型20的网络结构。第一设备可以通过第一业务预测模型中的第一特征提取组件,对业务对象在第一设备中的第一对象业务信息进行特征提取,得到业务对象对应的第一对象业务特征;进而将第一对象业务特征输入至第一业务预测模型中的聚类组件,通过聚类组件输出K个对象业务聚类特征。其中,K个对象业务聚类特征可以理解为第一业务预测模型的模型参数,K个对象业务聚类特征为训练结束时的第一初始预测模型所对应的样本业务聚类特征,样本业务聚类特征的获取方式可以参见上文的描述,在此不再进行赘述。
进一步地,可以将第一对象业务特征和K个对象业务聚类特征输入第一业务预测模型中的注意力组件,通过注意力组件中的多层感知机对第一对象业务特征和K个对象业务聚类特征进行特征拼接,得到对象联合特征,通过多层感知机对对象联合特征进行特征变换处理,得到初始聚类权重;进而可以通过注意力组件中的Softmax层对初始聚类权重进行归一化处理,得到对象聚类权重,归一化处理的具体实现方式可以参见图5所示的步骤S206中对候选聚类权重进行归一化处理的描述,在此不再进行赘述。
步骤S302:将K个对象业务聚类特征与对象聚类权重进行加权求和,得到业务对象对应的对象业务代理特征。
对象业务代理特征是由K个对象业务聚类特征与对象聚类权重进行加权求和得到的。对象业务代理特征可以包含第一对象业务信息中具有较高权重的特征,也就是说,对象业务代理特征可以近似表达第一对象业务信息中的相关信息,因此第一设备采用对象业务代理特征代替第一对象业务信息发送至第二设备进行业务分类识别,不会导致业务预测的准确性降低。
在本申请实施例中,可以通过第一业务预测模型中的注意力组件将K个对象业务聚类特征与对象聚类权重进行加权求和。具体地,可以将K个对象业务聚类特征中的每一个对象业务聚类特征与对象聚类权重进行点乘运算,得到每一个对象业务聚类特征对应的单位点乘结果,进而可以将K个对象业务聚类特征对应的单位点乘结果进行累加,得到业务对象对应的对象业务代理特征。
步骤S303:将对象业务代理特征发送至第二设备,以使第二设备中的第二业务预测模型,对对象业务代理特征,以及业务对象在第二设备中的第二对象业务信息进行业务分类识别,得到业务对象对应的业务预测结果。
第一设备在得到业务对象对应的对象业务代理特征之后,可以将对象业务代理特征发送至第二设备。第二设备可以获取预先训练完成的第二业务预测模型,第二业务预测模型的网络结构可以参见图2所示的第二业务预测模型30的网络结构。第二设备可以通过第二业务预测模型中的第二特征提取组件,对业务对象在第二设备中的第二对象业务信息进行特征提取,得到业务对象对应的第二对象业务特征;进而可以将对象业务代理特征以及第二对象业务特征进行特征融合处理,得到融合对象业务特征,并将融合对象业务特征作为第二业务预测模型中的业务分类识别组件的输入特征,通过业务分类识别组件对融合对象业务特征进行业务分类识别,从而得到业务对象对应的业务预测结果。可以理解的是,当业务预测场景为医疗场景时,业务对象对应的业务预测结果可以是业务对象对应的医疗诊断结果,例如,医疗诊断结果可以用于表示业务对象针对疾病A的患病概率;当业务预测场景为信息推荐场景(例如,广告推荐场景)时,业务对象对应的业务预测结果是业务对象对应的广告推荐结果,例如,广告推荐结果可以用于表示是否向业务对象推送广告C。特征融合的方式可以参见前文图3所示的步骤S104的描述,在此不再进行赘述。第二设备在得到业务对象对应的业务预测结果之后,可以将业务对象对应的业务预测结果发送至第一设备。
本申请实施例中,业务对象对应的对象业务代理特征是针对业务对象对应的第一对象业务信息进行一系列处理之后得到的特征,采用业务对象对应的对象业务代理特征,代替业务对象自身的第一对象业务信息发送给第二设备进行业务分类识别,第二设备无法根据对象业务代理特征反推出业务对象在第一设备中的第一对象业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
可以理解的是,在本申请的具体实施方式中,可能涉及到用户数据(例如,样本对象的第一样本业务信息和第二样本业务信息、业务对象的第一对象业务信息和第二对象业务信息等),当本申请以上实施例运用到具体产品或技术中时,需要获得用户的许可或同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
请参见图9,图9是本申请实施例提供的一种业务数据处理装置的结构示意图一。可以理解的是,该业务数据处理装置1可以应用在图1所示的第一设备110中。如图9所示,该业务数据处理装置1包括:聚类处理模块11、第一加权求和模块12、第一特征发送模块13和第一模型训练模块14,其中:
聚类处理模块11,用于获取N个样本对象在第一设备中的第一样本业务信息,通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征;N、K均为正整数,且K小于或等于N;
第一加权求和模块12,用于根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征;
第一特征发送模块13,用于将样本业务代理特征发送至第二设备,以使第二设备通过第二设备中的第二初始预测模型,对样本业务代理特征,以及样本对象i在第二设备中的第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;样本预测结果用于修正第二初始预测模型的网络参数;
第一模型训练模块14,用于接收第二设备返回的样本预测结果关联的模型梯度参数,根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型;模型梯度参数是基于样本预测结果和样本对象i在第二设备中的样本标签数据所确定的。
在一种可能的实施方式中,聚类处理模块11通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,包括:
通过第一设备关联的第一初始预测模型中的特征提取组件,对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到N个样本对象中的每一个样本对象对应的第一样本业务特征;
在N个样本对象中的每一个样本对象对应的第一样本业务特征中选择K个样本中心特征,获取N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数;
根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征。
在一种可能的实施方式中,聚类处理模块11通过第一设备关联的第一初始预测模型中的特征提取组件,对N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到N个样本对象中的每一个样本对象对应的第一样本业务特征,包括:
将N个样本对象中的样本对象i对应的第一样本业务信息输入至第一设备关联的第一初始预测模型中的特征提取组件,通过特征提取组件中的卷积层,对N个样本对象对应的第一样本业务信息进行卷积处理,得到样本对象i对应的样本卷积特征;
通过特征提取组件中的激活层,对样本对象i对应的样本卷积特征进行激活处理,得到样本对象i对应的样本激活特征;
通过特征提取组件中的池化层,对样本对象i对应的样本激活特征进行池化处理,得到样本对象i对应的第一样本业务特征zi。
在一种可能的实施方式中,聚类处理模块11获取N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,包括:
获取样本对象i对应的第一样本业务特征zi与K个样本中心特征中的样本中心特征μj之间的距离;
根据预置聚类参数,以及第一样本业务特征zi和样本中心特征μj之间的距离,确定第一样本业务特征zi和样本中心特征μj之间的样本候选相似度;
对第一样本业务特征zi与各个样本中心特征之间的样本候选相似度进行累加,得到样本候选相似度总值;
将样本候选相似度与样本相似度总值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的样本相似系数。
在一种可能的实施方式中,聚类处理模块11根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征,包括:
根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定K个样本中心特征相关联的第一聚类损失;
对第一聚类损失进行求导运算得到第一聚类梯度参数,根据第一聚类梯度参数对K个样本中心特征进行更新;
若更新后的K个样本中心特征满足停止更新条件,则将停止更新时的K个样本中心特征确定为样本业务聚类特征。
在一种可能的实施方式中,聚类处理模块11根据N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定K个样本中心特征相关联的第一聚类损失,包括:
将样本对象i对应的第一对象业务特征zi与K个样本中心特征中的样本中心特征μj之间的样本相似系数的平方,确定为相似系数平方值;
将第一对象业务特征zi与各个样本中心特征之间的相似系数平方值进行累加,得到相似系数平方累积值;
将相似系数平方值与相似系数平方累积值之间的比值,确定为第一样本业务特征zi和样本中心特征μj之间的预测相似系数;
获取预测相似系数,以及第一对象业务特征zi与样本中心特征μj之间的样本相似系数的对数差值,将预测相似系数和对数差值之间的乘积,确定为第一样本业务特征zi和样本中心特征μj之间的单位聚类损失;
将第一样本业务特征zi和各个样本中心特征之间的单位聚类损失进行累加,得到样本对象i对应的第一聚类损失。
在一种可能的实施方式中,第一加权求和模块12根据K个样本业务聚类特征和N个样本对象中的样本对象i对应的第一样本业务信息,获取K个样本业务聚类特征对应的样本聚类权重,包括:
将样本对象i对应的第一样本业务特征zi和K个样本业务聚类特征中的样本业务聚类特征βj拼接为样本联合特征;第一样本业务特征zi是通过第一初始预测模型中的特征提取组件,对样本对象i对应的第一样本业务信息进行特征提取得到的;
通过第一初始预测模型中的多层感知机对样本联合特征进行特征变换处理,得到样本业务聚类特征βj对应的候选聚类权重;
对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重。
在一种可能的实施方式中,第一加权求和模块12对样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到样本业务聚类特征βj对应的样本聚类权重,包括:
对样本业务聚类特征βj对应的候选聚类权重进行指数运算,得到样本业务聚类特征βj对应的权重指数值;
将K个样本业务聚类特征中的每一个样本业务聚类特征对应的权重指数值进行累加,得到权重指数总值,将样本业务聚类特征βj对应的权重指数值与权重指数总值之间的比值,确定为样本业务聚类特征βj对应的样本聚类权重。
其中,第一加权求和模块将K个样本业务聚类特征与样本聚类权重进行加权求和,得到样本对象i对应的样本业务代理特征,包括:
将K个样本业务聚类特征中的样本业务聚类特征βj,与样本业务聚类特征βj对应的样本聚类权重之间的点乘,确定为样本业务聚类特征βj对应的单位加权特征;
将K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征进行累加,得到样本对象i对应的样本业务代理特征。
在一种可能的实施方式中,第一模型训练模块14根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为第一设备中的第一业务预测模型,包括:
根据样本对象i对应的第一样本业务特征zi,以及K个样本业务聚类特征中的每一个样本业务聚类特征之间的样本相似系数,确定第二聚类损失;第一样本业务特征zi是通过第一初始预测模型中的特征提取组件,对样本对象i对应的第一样本业务信息进行特征提取得到的;
对第二聚类损失进行求导运算得到第二聚类梯度参数,将模型梯度参数和第二聚类梯度参数之和,确定为第一初始预测模型对应的总梯度参数;
根据总梯度参数对第一初始预测模型的网络参数进行迭代训练,直至更新后的网络参数满足训练结束条件时,停止训练,将训练结束时的第一初始预测模型确定为所述第一设备中的第一业务预测模型。
根据本申请的一种实施例,前文图3和图5所示的业务数据处理方法所涉及的步骤可以由图9所示的业务数据处理装置1中的各个模块来执行。例如,图3所示的步骤S101可由图9所示的聚类处理模块11来执行,图3所示的步骤S102可由图9所示的第一加权求和模块12来执行,图3所示的步骤S103可由图9所示的第一特征发送模块13来执行,图3所示的步骤S108可由图9所示的第一模型训练模块14来执行等。
根据本申请的一个实施例,图9所示的业务数据处理装置1中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,业务数据处理装置1也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
本申请实施例中,可以通过第一初始预测模型对N个样本对象在第一设备中的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,进而可以将K个样本业务聚类特征与N个样本对象中的样本对象i关联的样本聚类权重进行加权求和,得到样本业务代理特征,并将该样本业务代理特征发送至第二设备进行模型训练。由此可见,样本对象i对应的样本业务代理特征是针对样本对象i对应的第一样本业务信息进行一系列处理之后得到的特征,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,第二设备无法根据样本业务代理特征反推出样本对象i在第一设备中的第一样本业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
请参见图10,图10是本申请实施例提供的一种业务数据处理装置的结构示意图二。可以理解的是,该业务数据处理装置2可以应用在图1所示的第二设备120中。如图10所示,该业务数据处理装置2包括:特征接收模块21、业务预测模块22、梯度参数获取模块23、梯度参数发送模块24和第二模型训练模块25,其中:
特征接收模块21,用于接收第一设备发送的与N个样本对象中的样本对象i相关联的样本业务代理特征;样本代理特征是由K个样本业务聚类特征与样本对象i关联的样本聚类权重进行加权求和得到的,K个样本业务聚类特征是通过第一设备中的第一初始预测模型对N个样本对象对应的第一样本业务信息进行聚类处理得到的,样本对象i关联的样本聚类权重用于表征K个样本业务聚类特征与样本对象i在第一设备中的第一样本业务信息之间的相关程度;
业务预测模块22,用于获取样本对象i在第二设备中的第二样本业务信息,通过第二设备中的第二初始预测模型,对样本业务代理特征,以及第二样本业务信息进行业务分类识别,得到样本对象i对应的样本预测结果;
梯度参数获取模块23,用于获取样本对象i在第二设备中的样本标签数据,根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数;
梯度参数发送模块24,用于将模型梯度参数发送至第一设备,以使第一设备根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型的网络参数进行修正,得到第一设备中的第一业务预测模型;
第二模型训练模块25,用于根据模型梯度参数对第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为第二设备中的第二业务预测模型。
在一种可能的实施方式中,梯度参数获取模块23根据样本标签数据和样本预测结果,确定第二初始预测模型对应的模型梯度参数,包括:
将样本标签数据与样本预测结果对应的第一对数结果之间的乘积,确定为第一候选损失;
将常量参数与样本预测结果之间的差值进行对数运算,得到第二对数结果;
将第二对数结果,以及常量参数与样本标签数据的差值之间的乘积,确定为第二候选损失;
根据第一候选损失和第二候选损失之和,确定第二初始预测模型对应的模型损失,对模型损失进行求导运算,得到第二初始预测模型对应的模型梯度参数。
根据本申请的一种实施例,前文图3和图5所示的业务数据处理方法所涉及的步骤可以由图10所示的业务数据处理装置2中的各个模块来执行。例如,图3所示的步骤S104可由图10所示的特征接收模块21和业务预测模块22来执行,图3所示的步骤S105可由图10所示的梯度参数获取模块23来执行,图3所示的步骤S106可由图10所示的梯度参数发送模块24来执行,图3所示的步骤S107可由图10所示的第二模型训练模块25来执行等。
根据本申请的一个实施例,图10所示的业务数据处理装置2中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,业务数据处理装置2也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
本申请实施例中,第二设备可以根据样本对象i对应的样本业务代理特征,以及样本对象i对应的第二样本业务特征,获取样本对象i对应的样本预测结果,进而可以根据样本对象i对应的样本预测结果以及样本标签数据,对第二初始预测模型进行训练,从而可以使得第二业务预测模型(第二初始预测模型训练完成的预测模型)具有较高的预测准确性。进一步地,第二设备可以将样本预测结果关联的模型梯度参数返回至第一设备,第一设备可以根据模型梯度参数、K个样本业务聚类特征以及样本对象i对应的第一样本业务信息,对第一初始预测模型进行训练,从而可以使得第一业务预测模型(第一初始预测模型训练完成的预测模型)具有较高的预测准确性。此外,样本对象i对应的样本业务代理特征是针对样本对象i对应的第一样本业务信息进行一系列处理之后得到的特征,采用样本对象i对应的样本业务代理特征,代替样本对象i自身的第一样本业务信息发送给第二设备进行模型训练,第二设备无法根据样本业务代理特征反推出样本对象i在第一设备中的第一样本业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
请参见图11,图11是本申请实施例提供的一种业务数据处理装置的结构示意图三。可以理解的是,该业务数据处理装置3可以应用在图1所示的第一设备110中。如图11所示,该业务数据处理装置3包括:对象聚类权重获取模块31、第二加权求和模块32和第二特征发送模块33,其中:
对象聚类权重获取模块31,用于获取业务对象在第一设备中的第一对象业务信息,将第一对象业务信息输入至第一设备中的第一业务预测模型,根据第一对象业务信息,确定第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;K为正整数;
第二加权求和模块32,用于将K个对象业务聚类特征与对象聚类权重进行加权求和,得到业务对象对应的对象业务代理特征;
第二特征发送模块33,用于将对象业务代理特征发送至第二设备,以使第二设备中的第二业务预测模型,对对象业务代理特征,以及业务对象在第二设备中的第二对象业务信息进行业务分类识别,得到业务对象对应的业务预测结果;第一业务预测模型和第二业务预测模型是采用上述一方面的方法训练得到的。
根据本申请的一种实施例,前文图8所示的业务数据处理方法所涉及的步骤可以由图11所示的业务数据处理装置3中的各个模块来执行。例如,图8所示的步骤S301可由图11所示的对象聚类权重获取模块31来执行,图8所示的步骤S302可由图11所示的第二加权求和模块32来执行,图8所示的步骤S303可由图11所示的第二特征发送模块33来执行等。
根据本申请的一个实施例,图11所示的业务数据处理装置3中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,业务数据处理装置3也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
本申请实施例中,业务对象对应的对象业务代理特征是针对业务对象对应的第一对象业务信息进行一系列处理之后得到的特征,采用业务对象对应的对象业务代理特征,代替业务对象自身的第一对象业务信息发送给第二设备进行业务分类识别,第二设备无法根据对象业务代理特征反推出业务对象在第一设备中的第一对象业务信息,从而可以防止第一设备的数据隐私泄露,提高数据安全性。
进一步地,请参见图12,图12是本申请实施例提供的一种计算机设备的结构示意图。如图12所示,该计算机设备1000可以为第一设备,例如,上述图1所对应实施例中的第一设备110,还可以为第二设备,例如,上述图1所对应实施例中的第二设备120,第一设备可以为服务器,或者可以为终端设备,类似地,第二设备也可以为服务器,或者可以为终端设备,本申请对此不做限定。为便于理解,本申请以计算机设备为终端设备为例,该计算机设备1000可以包括:处理器1001,网络接口1004和存储器1005,此外,该计算机设备1000还可以包括:用户接口1003,和至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图12所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。
其中,该计算机设备1000中的网络接口1004还可以提供网络通讯功能,且可选用户接口1003还可以包括显示屏(Display)、键盘(Keyboard)。在图12所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3、图5以及图8中任一个实施例中对业务数据处理方法的描述,也可以执行前文图9所对应实施例中对业务数据处理装置1的描述,或者也可以执行前文图10所对应实施例中对业务数据处理装置2的描述,或者还可以执行前文图11所对应实施例中对业务数据处理装置3的描述在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且计算机可读存储介质中存储有前文提及的业务数据处理装置1、业务数据处理装置2和业务数据处理装置3所执行的计算机程序,且计算机程序包括程序指令,当处理器执行程序指令时,能够执行前文图3、图5和图8任一个所对应实施例中对业务数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。作为示例,程序指令可被部署在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行,分布在多个地点且通过通信网络互连的多个计算设备可以组成区块链系统。
此外,需要说明的是:本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序可以包括计算机指令,该计算机指令可以存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器可以执行该计算机指令,使得该计算机设备执行前文图3、图5以及图8中任一个实施例中对业务数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品或者计算机程序实施例中未披露的技术细节,请参照本申请方法实施例的描述。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本申请实施例装置中的模块可以根据实际需要进行合并、划分和删减。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储器(Read-Only Memory,ROM)或随机存储器(Random Access Memory,RAM)等。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (18)
1.一种业务数据处理方法,其特征在于,包括:
获取N个样本对象在第一设备中的第一样本业务信息,通过所述第一设备中的第一初始预测模型对所述N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征;所述第一样本业务信息包括所述N个样本对象存储在所述第一设备中的样本医疗信息;N、K均为正整数,且K小于或等于N;
根据所述K个样本业务聚类特征和所述N个样本对象中的样本对象i对应的第一样本业务信息,获取所述K个样本业务聚类特征对应的样本聚类权重,将所述K个样本业务聚类特征与所述样本聚类权重进行加权求和,得到所述样本对象i对应的样本业务代理特征;
将所述样本业务代理特征发送至第二设备,以使所述第二设备通过所述第二设备中的第二初始预测模型,对所述样本业务代理特征,以及所述样本对象i在所述第二设备中的第二样本业务信息进行业务分类识别,得到所述样本对象i对应的样本预测结果;所述第二样本业务信息包括所述样本对象i存储在所述第二设备中的样本医疗信息,所述样本预测结果用于修正所述第二初始预测模型的网络参数;
接收所述第二设备返回的所述样本预测结果关联的模型梯度参数,根据所述模型梯度参数、所述K个样本业务聚类特征以及所述样本对象i对应的第一样本业务信息,对所述第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为所述第一设备中的第一业务预测模型;所述模型梯度参数是基于所述样本预测结果和所述样本对象i在所述第二设备中的样本标签数据所确定的;所述第一业务预测模型用于输出第一对象业务信息对应的对象业务代理特征,所述对象业务代理特征用于输入至所述第二设备中的第二业务预测模型,所述第二业务预测模型用于根据所述对象业务代理特征和第二对象业务信息识别业务对象对应的业务预测结果;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果。
2.根据权利要求1所述的方法,其特征在于,所述通过所述第一设备中的第一初始预测模型对所述N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征,包括:
通过所述第一设备关联的第一初始预测模型中的特征提取组件,对所述N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到所述N个样本对象中的每一个样本对象对应的第一样本业务特征;
在所述N个样本对象中的每一个样本对象对应的第一样本业务特征中选择K个样本中心特征,获取所述N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数;
根据所述N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对所述K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征。
3.根据权利要求2所述的方法,其特征在于,所述通过所述第一设备关联的第一初始预测模型中的特征提取组件,对所述N个样本对象中的每一个样本对象对应的第一样本业务信息进行特征提取,得到所述样本对象中的每一个样本对象对应的第一样本业务特征,包括:
将所述N个样本对象中的样本对象i对应的第一样本业务信息输入至所述第一设备关联的第一初始预测模型中的特征提取组件,通过所述特征提取组件中的卷积层,对所述样本对象i对应的第一样本业务信息进行卷积处理,得到所述样本对象i对应的样本卷积特征;
通过所述特征提取组件中的激活层,对所述样本对象i对应的样本卷积特征进行激活处理,得到所述样本对象i对应的样本激活特征;
通过所述特征提取组件中的池化层,对所述样本对象i对应的样本激活特征进行池化处理,得到所述样本对象i对应的第一样本业务特征zi。
4.根据权利要求2所述的方法,其特征在于,所述获取所述N个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,包括:
获取所述样本对象i对应的第一样本业务特征zi与所述K个样本中心特征中的样本中心特征μj之间的距离;
根据预置聚类参数,以及所述第一样本业务特征zi和所述样本中心特征μj之间的距离,确定所述第一样本业务特征zi和所述样本中心特征μj之间的样本候选相似度;
对所述第一样本业务特征zi与各个样本中心特征之间的样本候选相似度进行累加,得到样本候选相似度总值;
将所述样本候选相似度与所述样本相似度总值之间的比值,确定为所述第一样本业务特征zi和所述样本中心特征μj之间的样本相似系数。
5.根据权利要求2所述的方法,其特征在于,所述根据所述N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,对所述K个样本中心特征进行更新,将更新后的K个样本中心特征确定为样本业务聚类特征,包括:
根据所述N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定所述K个样本中心特征相关联的第一聚类损失;
对所述第一聚类损失进行求导运算得到第一聚类梯度参数,根据所述第一聚类梯度参数对所述K个样本中心特征进行更新;
若更新后的K个样本中心特征满足停止更新条件,则将停止更新时的K个样本中心特征确定为样本业务聚类特征。
6.根据权利要求5所述的方法,其特征在于,所述根据所述N个样本对象中的每一个样本对象对应的第一样本业务特征与各个样本中心特征之间的样本相似系数,确定所述K个样本中心特征相关联的第一聚类损失,包括:
将所述样本对象i对应的第一对象业务特征zi与所述K个样本中心特征中的样本中心特征μj之间的样本相似系数的平方,确定为相似系数平方值;
将所述第一对象业务特征zi与各个样本中心特征之间的相似系数平方值进行累加,得到相似系数平方累积值;
将所述相似系数平方值与所述相似系数平方累积值之间的比值,确定为所述第一样本业务特征zi和所述样本中心特征μj之间的预测相似系数;
获取所述预测相似系数,以及所述第一对象业务特征zi与所述样本中心特征μj之间的样本相似系数的对数差值,将所述预测相似系数和所述对数差值之间的乘积,确定为所述第一样本业务特征zi和所述样本中心特征μj之间的单位聚类损失;
将所述第一样本业务特征zi和各个样本中心特征之间的单位聚类损失进行累加,得到所述样本对象i的第一聚类损失。
7.根据权利要求1所述的方法,其特征在于,所述根据所述K个样本业务聚类特征和所述N个样本对象中的样本对象i对应的第一样本业务信息,获取所述K个样本业务聚类特征对应的样本聚类权重,包括:
将所述样本对象i对应的第一样本业务特征zi和所述K个样本业务聚类特征中的样本业务聚类特征βj拼接为样本联合特征;所述第一样本业务特征zi是通过所述第一初始预测模型中的特征提取组件,对所述样本对象i对应的第一样本业务信息进行特征提取得到的;
通过所述第一初始预测模型中的多层感知机对所述样本联合特征进行特征变换处理,得到样本业务聚类特征βj对应的候选聚类权重;
对所述样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到所述样本业务聚类特征βj对应的样本聚类权重。
8.根据权利要求7所述的方法,其特征在于,所述对所述样本业务聚类特征βj对应的候选聚类权重进行归一化处理,得到所述样本业务聚类特征βj对应的样本聚类权重,包括:
对所述样本业务聚类特征βj对应的候选聚类权重进行指数运算,得到所述样本业务聚类特征βj对应的权重指数值;
将所述K个样本业务聚类特征中的每一个样本业务聚类特征对应的权重指数值进行累加,得到权重指数总值,将所述样本业务聚类特征βj对应的权重指数值与所述权重指数总值之间的比值,确定为所述样本业务聚类特征βj对应的样本聚类权重。
9.根据权利要求1所述的方法,其特征在于,所述将所述K个样本业务聚类特征与所述样本聚类权重进行加权求和,得到所述样本对象i对应的样本业务代理特征,包括:
将所述K个样本业务聚类特征中的样本业务聚类特征βj,与所述样本业务聚类特征βj对应的样本聚类权重之间的点乘,确定为所述样本业务聚类特征βj对应的单位加权特征;
将所述K个样本业务聚类特征中的每一个样本业务聚类特征对应的单位加权特征进行累加,得到所述样本对象i对应的样本业务代理特征。
10.根据权利要求1所述的方法,其特征在于,所述根据所述模型梯度参数、所述K个样本业务聚类特征以及所述样本对象i对应的第一样本业务信息,对所述第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为所述第一设备中的第一业务预测模型,包括:
根据所述样本对象i对应的第一样本业务特征zi,以及所述K个样本业务聚类特征中的每一个样本业务聚类特征之间的样本相似系数,确定第二聚类损失;所述第一样本业务特征zi是通过所述第一初始预测模型中的特征提取组件,对所述样本对象i对应的第一样本业务信息进行特征提取得到的;
对所述第二聚类损失进行求导运算得到第二聚类梯度参数,将所述模型梯度参数和所述第二聚类梯度参数之和,确定为所述第一初始预测模型对应的总梯度参数;
根据所述总梯度参数对所述第一初始预测模型的网络参数进行迭代训练,直至更新后的网络参数满足训练结束条件时,停止训练,将训练结束时的第一初始预测模型确定为所述第一设备中的第一业务预测模型。
11.一种业务数据处理方法,其特征在于,包括:
接收第一设备发送的与N个样本对象中的样本对象i相关联的样本业务代理特征;所述样本代理特征是由K个样本业务聚类特征与所述样本对象i关联的样本聚类权重进行加权求和得到的,所述K个样本业务聚类特征是通过所述第一设备中的第一初始预测模型对所述N个样本对象对应的第一样本业务信息进行聚类处理得到的,所述样本对象i关联的样本聚类权重用于表征所述K个样本业务聚类特征与所述样本对象i在所述第一设备中的第一样本业务信息之间的相关程度;所述第一样本业务信息包括所述N个样本对象存储在所述第一设备中的样本医疗信息;
获取所述样本对象i在第二设备中的第二样本业务信息,通过所述第二设备中的第二初始预测模型,对所述样本业务代理特征,以及所述第二样本业务信息进行业务分类识别,得到所述样本对象i对应的样本预测结果;所述第二样本业务信息包括所述样本对象i存储在所述第二设备中的样本医疗信息;
获取所述样本对象i在所述第二设备中的样本标签数据,根据所述样本标签数据和所述样本预测结果,确定所述第二初始预测模型对应的模型梯度参数;
将所述模型梯度参数发送至所述第一设备,以使所述第一设备根据所述模型梯度参数、所述K个样本业务聚类特征以及所述样本对象i对应的第一样本业务信息,对所述第一初始预测模型的网络参数进行修正,得到所述第一设备中的第一业务预测模型;
根据所述模型梯度参数对所述第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为所述第二设备中的第二业务预测模型;所述第二业务预测模型用于根据第二对象业务信息和所述第一设备发送的对象业务代理特征识别业务对象对应的业务预测结果,所述对象业务代理特征是由所述第一设备中的第一业务预测模型根据第一对象业务信息得到的;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果。
12.根据权利要求11所述的方法,其特征在于,所述根据所述样本标签数据和所述样本预测结果,确定所述第二初始预测模型对应的模型梯度参数,包括:
将所述样本标签数据与所述样本预测结果对应的第一对数结果之间的乘积,确定为第一候选损失;
将常量参数与所述样本预测结果之间的差值进行对数运算,得到第二对数结果;
将所述第二对数结果,以及所述常量参数与所述样本标签数据的差值之间的乘积,确定为第二候选损失;
根据所述第一候选损失和所述第二候选损失之和,确定所述第二初始预测模型对应的模型损失,对所述模型损失进行求导运算,得到所述第二初始预测模型对应的模型梯度参数。
13.一种业务数据处理方法,其特征在于,包括:
获取业务对象在第一设备中的第一对象业务信息,将所述第一对象业务信息输入至所述第一设备中的第一业务预测模型,根据所述第一对象业务信息,确定所述第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,K为正整数;
将所述K个对象业务聚类特征与所述对象聚类权重进行加权求和,得到所述业务对象对应的对象业务代理特征;
将所述对象业务代理特征发送至第二设备,以使所述第二设备中的第二业务预测模型,对所述对象业务代理特征,以及所述业务对象在所述第二设备中的第二对象业务信息进行业务分类识别,得到所述业务对象对应的业务预测结果;所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果,所述第一业务预测模型是采用权利要求1至10任一项所述的业务数据处理方法训练得到的,所述第二业务预测模型是采用权利要求11或12所述的业务数据处理方法训练得到的。
14.一种业务数据处理装置,其特征在于,包括:
聚类处理模块,用于获取N个样本对象在第一设备中的第一样本业务信息,通过所述第一设备中的第一初始预测模型对所述N个样本对象对应的第一样本业务信息进行聚类处理,得到K个样本业务聚类特征;所述第一样本业务信息包括所述N个样本对象存储在所述第一设备中的样本医疗信息;N、K均为正整数,且K小于或等于N;
第一加权求和模块,用于根据所述K个样本业务聚类特征和所述N个样本对象中的样本对象i对应的第一样本业务信息,获取所述K个样本业务聚类特征对应的样本聚类权重,将所述K个样本业务聚类特征与所述样本聚类权重进行加权求和,得到所述样本对象i对应的样本业务代理特征;
第一特征发送模块,用于将所述样本业务代理特征发送至第二设备,以使所述第二设备通过所述第二设备中的第二初始预测模型,对所述样本业务代理特征,以及所述样本对象i在所述第二设备中的第二样本业务信息进行业务分类识别,得到所述样本对象i对应的样本预测结果;所述第二样本业务信息包括所述样本对象i存储在所述第二设备中的样本医疗信息,所述样本预测结果用于修正所述第二初始预测模型的网络参数;
第一模型训练模块,用于接收所述第二设备返回的所述样本预测结果关联的模型梯度参数,根据所述模型梯度参数、所述K个样本业务聚类特征以及所述样本对象i对应的第一样本业务信息,对所述第一初始预测模型的网络参数进行修正,将包含修正后的网络参数的第一初始预测模型确定为所述第一设备中的第一业务预测模型;所述模型梯度参数是基于所述样本预测结果和所述样本对象i在所述第二设备中的样本标签数据所确定的;所述第一业务预测模型用于输出第一对象业务信息对应的对象业务代理特征,所述对象业务代理特征用于输入至所述第二设备中的第二业务预测模型,所述第二业务预测模型用于根据所述对象业务代理特征和第二对象业务信息识别业务对象对应的业务预测结果;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果。
15.一种业务数据处理装置,其特征在于,包括:
特征接收模块,用于接收第一设备发送的与N个样本对象中的样本对象i相关联的样本业务代理特征;所述样本代理特征是由K个样本业务聚类特征与所述样本对象i关联的样本聚类权重进行加权求和得到的,所述K个样本业务聚类特征是通过所述第一设备中的第一初始预测模型对所述N个样本对象对应的第一样本业务信息进行聚类处理得到的,所述样本对象i关联的样本聚类权重用于表征所述K个样本业务聚类特征与所述样本对象i在所述第一设备中的第一样本业务信息之间的相关程度;所述第一样本业务信息包括所述N个样本对象存储在所述第一设备中的样本医疗信息;
业务预测模块,用于获取所述样本对象i在第二设备中的第二样本业务信息,通过所述第二设备中的第二初始预测模型,对所述样本业务代理特征,以及所述第二样本业务信息进行业务分类识别,得到所述样本对象i对应的样本预测结果;所述第二样本业务信息包括所述样本对象i存储在所述第二设备中的样本医疗信息;
梯度参数获取模块,用于获取所述样本对象i在所述第二设备中的样本标签数据,根据所述样本标签数据和所述样本预测结果,确定所述第二初始预测模型对应的模型梯度参数;
梯度参数发送模块,用于将所述模型梯度参数发送至所述第一设备,以使所述第一设备根据所述模型梯度参数、所述K个样本业务聚类特征以及所述样本对象i对应的第一样本业务信息,对所述第一初始预测模型的网络参数进行修正,得到所述第一设备中的第一业务预测模型;
第二模型训练模块,用于根据所述模型梯度参数对所述第二初始预测模型的网络参数进行修正,将包含修正后的网络参数的第二初始预测模型确定为所述第二设备中的第二业务预测模型;所述第二业务预测模型用于根据第二对象业务信息和所述第一设备发送的对象业务代理特征识别业务对象对应的业务预测结果,所述对象业务代理特征是由所述第一设备中的第一业务预测模型根据第一对象业务信息得到的;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果。
16.一种业务数据处理装置,其特征在于,包括:
对象聚类权重获取模块,用于获取业务对象在第一设备中的第一对象业务信息,将所述第一对象业务信息输入至所述第一设备中的第一业务预测模型,根据所述第一对象业务信息,确定所述第一业务预测模型中的K个对象业务聚类特征对应的对象聚类权重;所述第一对象业务信息包括所述业务对象在所述第一设备中的医疗信息,K为正整数;
第二加权求和模块,用于将所述K个对象业务聚类特征与所述对象聚类权重进行加权求和,得到所述业务对象对应的对象业务代理特征;
第二特征发送模块,用于将所述对象业务代理特征发送至第二设备,以使所述第二设备中的第二业务预测模型,对所述对象业务代理特征,以及所述业务对象在所述第二设备中的第二对象业务信息进行业务分类识别,得到所述业务对象对应的业务预测结果;所述第二对象业务信息包括所述业务对象在所述第二设备中的医疗信息,所述业务预测结果包括医疗诊断结果,所述第一业务预测模型是采用权利要求1至10任一项所述的业务数据处理方法训练得到的,所述第二业务预测模型是采用权利要求11或12所述的业务数据处理方法训练得到的。
17.一种计算机设备,其特征在于,包括存储器和处理器;
所述存储器与所述处理器相连,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1至10任一项所述的方法,执行权利要求11或12所述的方法,或者执行权利要求13所述的方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1至10任一项所述的方法,执行权利要求11或12所述的方法,或者执行权利要求13所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310993567.2A CN116701972B (zh) | 2023-08-09 | 2023-08-09 | 业务数据处理方法、装置、设备以及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310993567.2A CN116701972B (zh) | 2023-08-09 | 2023-08-09 | 业务数据处理方法、装置、设备以及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116701972A CN116701972A (zh) | 2023-09-05 |
CN116701972B true CN116701972B (zh) | 2023-11-24 |
Family
ID=87829749
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310993567.2A Active CN116701972B (zh) | 2023-08-09 | 2023-08-09 | 业务数据处理方法、装置、设备以及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701972B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245510A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 用于预测信息的方法和装置 |
CN110797124A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种模型多端协同训练方法、医疗风险预测方法和装置 |
CN112364943A (zh) * | 2020-12-10 | 2021-02-12 | 广西师范大学 | 一种基于联邦学习的联邦预测方法 |
CN114463063A (zh) * | 2022-01-29 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 数据处理方法及相关装置 |
CN115858886A (zh) * | 2022-12-12 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及可读存储介质 |
CN116010832A (zh) * | 2023-01-18 | 2023-04-25 | 科大讯飞股份有限公司 | 联邦聚类方法、装置、中心服务器、系统和电子设备 |
-
2023
- 2023-08-09 CN CN202310993567.2A patent/CN116701972B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245510A (zh) * | 2019-06-19 | 2019-09-17 | 北京百度网讯科技有限公司 | 用于预测信息的方法和装置 |
CN110797124A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种模型多端协同训练方法、医疗风险预测方法和装置 |
CN112364943A (zh) * | 2020-12-10 | 2021-02-12 | 广西师范大学 | 一种基于联邦学习的联邦预测方法 |
CN114463063A (zh) * | 2022-01-29 | 2022-05-10 | 腾讯科技(深圳)有限公司 | 数据处理方法及相关装置 |
CN115858886A (zh) * | 2022-12-12 | 2023-03-28 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备及可读存储介质 |
CN116010832A (zh) * | 2023-01-18 | 2023-04-25 | 科大讯飞股份有限公司 | 联邦聚类方法、装置、中心服务器、系统和电子设备 |
Non-Patent Citations (2)
Title |
---|
"Anonymizing Data for Privacy-Preserving Federated Learning";Olivia Choudhury et al;《arXiv:2002.09096v1》;第1-8页 * |
"联邦学习中的隐私保护";刘艺璇等;《软件学报》;第33卷(第3期);第1057-1092页 * |
Also Published As
Publication number | Publication date |
---|---|
CN116701972A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
CN109919316B (zh) | 获取网络表示学习向量的方法、装置和设备及存储介质 | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
CN111382868A (zh) | 神经网络结构搜索方法和神经网络结构搜索装置 | |
CN116261731A (zh) | 基于多跳注意力图神经网络的关系学习方法与系统 | |
CN108920717B (zh) | 用于显示信息的方法及装置 | |
US20220245424A1 (en) | Microgenre-based hyper-personalization with multi-modal machine learning | |
WO2024041479A1 (zh) | 一种数据处理方法及其装置 | |
CN110020022B (zh) | 数据处理方法、装置、设备及可读存储介质 | |
CN112085615A (zh) | 图神经网络的训练方法及装置 | |
CN112257841A (zh) | 图神经网络中的数据处理方法、装置、设备及存储介质 | |
CN116684330A (zh) | 基于人工智能的流量预测方法、装置、设备及存储介质 | |
CN113705698B (zh) | 基于点击行为预测的信息推送方法及装置 | |
WO2024067884A1 (zh) | 一种数据处理方法及相关装置 | |
CN115730125A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN116701972B (zh) | 业务数据处理方法、装置、设备以及介质 | |
US20220358366A1 (en) | Generation and implementation of dedicated feature-based techniques to optimize inference performance in neural networks | |
CN111291196B (zh) | 知识图谱的完善方法及装置、数据处理方法及装置 | |
Liu | POI recommendation model using multi-head attention in location-based social network big data | |
CN114357242A (zh) | 基于召回模型的训练评估方法及装置、设备、存储介质 | |
CN113762648A (zh) | 公卫黑天鹅事件预测方法、装置、设备及介质 | |
CN114298961A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN112927810A (zh) | 基于大数据的智慧医疗响应方法及智慧医疗云计算系统 | |
CN111860870A (zh) | 交互行为确定模型的训练方法、装置、设备及介质 | |
WO2022262561A1 (zh) | 多媒体资源的处理方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40092311 Country of ref document: HK |