CN114997286A - 一种基于联邦支持向量机的金融客户分类方法及装置 - Google Patents

一种基于联邦支持向量机的金融客户分类方法及装置 Download PDF

Info

Publication number
CN114997286A
CN114997286A CN202210551170.3A CN202210551170A CN114997286A CN 114997286 A CN114997286 A CN 114997286A CN 202210551170 A CN202210551170 A CN 202210551170A CN 114997286 A CN114997286 A CN 114997286A
Authority
CN
China
Prior art keywords
federal
classification model
financial
support vector
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210551170.3A
Other languages
English (en)
Inventor
杨海旭
付海燕
郭艳卿
刘航
李祎
李卫超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN202210551170.3A priority Critical patent/CN114997286A/zh
Publication of CN114997286A publication Critical patent/CN114997286A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Medical Informatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于联邦支持向量机的金融客户分类方法及装置,方法包括以下步骤:由可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练;可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。本发明将传统机器学习与联邦学习相结合,在保证用户隐私的前提下,最大程度的挖掘数据的价值。

Description

一种基于联邦支持向量机的金融客户分类方法及装置
技术领域
本发明涉及大数据处理技术领域,具体而言,尤其涉及一种基于联邦支持向量机的金融客户分类方法及装置。
背景技术
在大多数行业中,数据是以孤岛的形式存在的,由于行业竞争、隐私安全、行政手续复杂等问题,即使是在同一个公司的不同部门之间实现数据整合也面临着重重阻力,在现实中想要将分散在各地、各个机构的数据进行整合几乎是不可能的,或者说所需的成本是巨大的。
金融服务企业之间的业务范围交叉性较大,也存在自有的个性化服务,导致各金融服务企业之间的客户数据以及数据特征具有很大的应用价值。但在客户数据使用时,一方面需要通过整合数据尽最大可能挖掘出数据价值,另一方面又需要以客户隐私保护为前提获得自身对客户更精准地判断。
发明内容
为了实现在保证用户隐私的前提下,最大程度的挖掘数据的价值,本发明提供了一种基于联邦支持向量机的金融客户分类方法及装置。本发明通过联邦学习搭建一种带有隐私保护、安全加密技术的分布式机器学习框架,既保证了金融服务企业之间客户数据的安全,有能获得更精准的金融客户分类结果。
本发明采用的技术手段如下:
一种基于联邦支持向量机的金融客户分类方法,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接;
所述金融客户分类方法包括以下步骤:
由可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;
各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端;
可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;
各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
进一步地,可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,包括:
判断各金融企业客户端之间的标签是否对齐;
标签对齐则对各初级训练模型参数进行平均处理生成联邦分类模型参数;
标签不对齐则对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
进一步地,标签不对齐则对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,包括:
将联邦支持向量输入各初级训练模型并分别获得预测标签;
将联邦支持向量和预测标签作为训练数据重新训练对应的初级训练模型,得到联邦训练模型参数。
进一步地,各金融企业客户端与可信的第三方服务端通信时,均采用加密方式进行。
本发明还公开了一种基于联邦支持向量机的金融客户分类装置,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接;
所述金融客户分类装置包括:
分类模型分配单元,其用于使可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;
模型初级训练单元,其用于使各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端;
参数聚合单元,其用于使可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;
分类单元,其用于使各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
进一步地,所述参数聚合单元包括:
判断模块,其用于判断各金融企业客户端之间的标签是否对齐;
第一参数生成模块,其用于使标签对齐时对各初级训练模型参数进行平均处理生成联邦分类模型参数;
第二参数生成模块,其用于使标签不对齐时对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
进一步地,所述第二参数生成模块包括:
标签生成子模块,其用于将联邦支持向量输入各初级训练模型并分别获得预测标签;
二次训练子模块,其用于将联邦支持向量和预测标签作为训练数据重新训练对应的初级训练模型,得到联邦训练模型参数。
进一步地,各金融企业客户端与可信的第三方服务端通信时,均采用加密方式进行。
较现有技术相比,本发明具有以下优点:
1、本发明在各个客户端与可信服务器交互时只需要得到模型参数,不影响敏感数据隐私保护。同时在标签不对齐的横向联邦支持向量机上进行了改进。填补了标签不对齐情况下联邦方法的空白。在标签对齐的横向联邦学习过程中,优化了模型的准确率且运行效率较高,尤其对本地模型的准确度提升明显。
此外本发明在处理标签不对齐的横向联邦分类问题时还有一定的优势,一定程度上解决了有关支持向量机的数据孤岛问题。
2、本发明采用支持向量机模型,相较于深度学习的分类器,支持向量机具有能够适用于小样本的数据库,分类更加准确并且不需要消耗大量的训练时的算力,不需要进行多轮训练的优点。并且针对支持向量机的特点,在处理大批量数据库时,其运行效率会急剧下降,联邦算法可以防止这种急剧增加的算力压力并且获得的算法准确度会相对于本地模型有明显提升。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为联邦学习系统构架图。
图2为本发明基于联邦支持向量机的金融客户分类方法流程图。
图3为基于支持向量机进行线性分类原理图。
图4为实施例中标签对齐的客户分类方法执行流程图。
图5为实施例中标签不对齐的客户分类方法执行流程图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
联邦学习是一种可保证数据不出本地,联合多方数据共同建立一个模型以适用所有数据的机器学习方式。联邦学习能够保证各方数据都保留在本地,不泄露隐私也不违反法规;多个参与方联合数据建立虚拟的共有模型,并且共同获益;在联邦学习体系下各个参与方的身份和地位平等;联邦学习的建模效果和将整个数据集放在一处建模的效果相同或相差不大;在用户特征不对齐的情况下也可以在数据间通过交换加密参数达到知识迁移的效果。联邦学习系统构架由三部分构成,如图1所示。
第一部分:加密样本对齐。由于两家企业的用户群体并非完全重合,系统利用基于加密的用户样本对齐技术,在A和B不公开各自数据的前提下确认双方的共有用户,并且不暴露不互相重叠的用户,以便联合这些用户的特征进行建模。
第二部分:加密模型训练。在确定共有用户群体后,就可以利用这些数据训练机器学习模型。为了保证训练过程中数据的保密性,需要借助第三方协作者C进行加密训练。以线性回归模型为例,训练过程可分为以下4步(如图1所示):
第①步:协作者C把公钥分发给A和B,用以对训练过程中需要交换的数据进行加密。
第②步:A和B之间以加密形式交互用于计算梯度的中间结果。
第③步:A和B分别基于加密的梯度值进行计算,同时B根据其标签数据计算损失,并把结果汇总给C,C通过汇总结果计算总梯度值并将其解密。
第④步:C将解密后的梯度分别回传给A和B,A和B根据梯度更新各自模型的参数。
第三部分:效果激励。联邦学习的一大特点就是它解决了为什么不同机构要加入联邦共同建模的问题,即建立模型以后模型的效果会在实际应用中表现出来,并记录在永久数据记录机制(如区块链)上。提供数据多的机构所获得的模型效果会更好,模型效果取决于数据提供方对自己和他人的贡献。这些模型的效果在联邦机制上会分发给各个机构反馈,并继续激励更多机构加入这一数据联邦。以上三部分的实施,既考虑了在多个机构间共同建模的隐私保护和效果,又考虑了以一个共识机制奖励贡献数据多的机构。所以,联邦学习是一个「闭环」的学习机制。
本发明用于联邦学习系统框架中的第二部分:加密模型训练。各独立模型上传到中央服务器C后,中央服务器C在对各独立模型进行聚合时求解出针对每个客户端的各节点参数的最优值并下发给本地后可以获得更好的效果。
具体来说,如图2所示,本发明提供了一种基于联邦支持向量机的金融客户分类方法,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接。所述金融客户分类方法包括以下步骤:
S1、由可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型。
具体来说,支持向量机(SVM)的目的是为了找出一个分类效果好的超平面作为分类器。分类器的好坏的评定依据是分类间隔W=2d的大小,即分类间隔W越大,则认为这个超平面的分类效果越好。
如图3所示,目标函数:求解超平面的问题转换为求解分类间隔W最大化的问题。即d最大化。
Figure BDA0003650812790000061
即目标函数为:min‖ω‖,为方便求导目标函数可记为:
Figure BDA0003650812790000062
若超平面方程能够完全正确地对上图的样本点进行分类,则满足方程:
Figure BDA0003650812790000063
假设决策面正好处于间隔区域的中轴线上,并且相应的支持向量对应的样本点到决策面的距离为d,则方程可转换为:
Figure BDA0003650812790000071
公式两边都除以d,数学模型代表的意义不变,约束方程转换为:
Figure BDA0003650812790000072
得到最终的约束条件:yiTxi+γ)≥1
Figure BDA00036508127900000711
优化目标与约束条件为:
Figure BDA0003650812790000073
s.t.yiTxi+b)≥1,i=1,2,…,n
将有约束的原始目标函数转换为无约束的新构造的拉格朗日目标函数:
Figure BDA0003650812790000074
因此,原含约束优化问题转换为无约束优化问题。
Figure BDA0003650812790000075
Figure BDA0003650812790000076
Figure BDA0003650812790000077
更新参数α,ω,b:
Figure BDA0003650812790000078
Figure BDA0003650812790000079
Figure BDA00036508127900000710
在进行一定次数的更新后,即可得到最终的持久化模型。
F-SVM(Federated Support Vector Machine)是一种将传统SVM算法联邦学习化的机器学习算法。
S2、各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端。各金融客户端的自有数据为包括客户多维度特征信息的数值型表格数据或者图像数据。
在每个客户端中根据各自的数据D1,D2,…DM的样本的数据进行本地模型训练,其中只有一个客户拥有数据标签,在本地训练以及参数模型更新时候,用户端以及可信第三方之间会进行频繁的数据交互,在交互的过程中,数据都是加密传输的。
S3、可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端,包括:
a.判断各金融企业客户端之间的标签是否对齐。本发明中,通过第三方服务端判断数据标签是否对齐,如果未对齐的话,将获得联邦学习模型的一端记为有标签的客户端,也就是说,如果标签不对齐的话,每个客户端相对于自身来说是有标签的,相对于其他客户端来说是没有标签的。
b.标签对齐则对各初级训练模型参数进行平均处理生成联邦分类模型参数;
c.标签不对齐则对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
具体来说,在客户端标签相同的情况下,生成联邦模型的流程如图4所示:
从第1个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000081
从第2个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000082
从第M个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000083
可信任第三方获得参数后对于模型的聚合过程如下:
Figure BDA0003650812790000084
Figure BDA0003650812790000085
将模型下发到客户端:
Figure BDA0003650812790000091
各个客户端以及可信第三方在一定次数的交互后完成联邦学习,各金融企业客户端得到一个可行的聚合模型,该聚合模型的性能优于原模型。
在客户端标签不相同的情况下,生成联邦模型的流程如图5所示::
从第1个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000092
且模型的支持向量为X1
从第2个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000093
且模型的支持向量为X2
从第M个金融企业客户端获得的SVM模型为:
Figure BDA0003650812790000094
且模型的支持向量为XM
此时,可信任第三方可获得每一个金融企业客户端的支持向量,但是无法得到支持向量的标签。
1、在可信第三方将所有得到的支持向量合并:
Figure BDA0003650812790000095
2、对合并后的支持向量进行如下处理:
将X作为数据输入模型1到模型M的判决函数中获得预测标签Y1,,,YM
将Y1和X作为带标签的数据集重新训练得到新的判决函数:y1=(ω'1)Tx1+b'1
将Y2和X作为带标签的数据集重新训练得到新的判决函数:y2=(ω'2)Tx2+b'2
将YM和X作为带标签的数据集重新训练得到新的判决函数:yM=(ω'M)TxM+b'M
然后将模型分别下发到第1至第M个金融企业客户端,每个金融企业客户端可分别得到性能优于本地客户端的模型结构。
图5中,guest代表的是无标签的客户端,联合训练的过程中可以包含多方该类客户端;host代表的是含标签的客户端,有且仅有仅有一方客户端;arbiter为可信第三方,对模型进行处理,在处理标签对齐的横向联邦中,arbiter用于对模型进行参数求均值,在处理标签不对齐的横向联邦时,arbiter用于将获得的支持向量通过有标签客户端的判决函数进行标签预测,然后将支持向量与预测标签作为新的带标签数据训练一个新的模型传递到host。
S4、各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
本发明方法通过联邦学习,在不同金融企业用户与可信第三方之间进行通信,对于不同地区金融企业用户的分类标准相同的情况,我们可以使用图4所示算法进行横向联邦聚合。但是由于不同地区的经济发展水平不尽相同,所以不同地区的金融企业对客户的信贷能力与可支配资产的分类标准很可能会存在差异。例如在A地月收入5000以上可分类为较高收入人群,但在B地可能需要8000元以上才可分类为较高收入群体。这种情况下,为利用不同地区的金融企业数据进行联邦模型训练,可以在加密的状态下将各个金融企业的模型参数与可信第三方之间进行交互,利用图5所示算法对分类标准不同的金融企业分类模型进行训练,最终得到联邦的结果,并分别下发给每个企业,从而更有针对性,高效地向各类用户推荐相应服务。本发明理论基础扎实,性能优良,所以得到的模型准确度较联邦平均算法有所提高,对分类任务的性能提高意义重大。
本发明还公开了一种基于联邦支持向量机的金融客户分类装置,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接;
所述金融客户分类装置包括:
分类模型分配单元,其用于使可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;
模型初级训练单元,其用于使各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端;
参数聚合单元,其用于使可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;
分类单元,其用于使各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
进一步地,所述参数聚合单元包括:
判断模块,其用于判断各金融企业客户端之间的标签是否对齐;
第一参数生成模块,其用于使标签对齐时对各初级训练模型参数进行平均处理生成联邦分类模型参数;
第二参数生成模块,其用于使标签不对齐时对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
进一步地,所述第二参数生成模块包括:
标签生成子模块,其用于将联邦支持向量输入各初级训练模型并分别获得预测标签;
二次训练子模块,其用于将联邦支持向量和预测标签作为训练数据重新训练对应的初级训练模型,得到联邦训练模型参数。
进一步地,各金融企业客户端与可信的第三方服务端通信时,均采用加密方式进行。
对于本发明实施例的而言,由于其与上面实施例中的相对应,所以描述的比较简单,相关相似之处请参见上面实施例中部分的说明即可,此处不再详述。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (8)

1.一种基于联邦支持向量机的金融客户分类方法,其特征在于,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接;
所述金融客户分类方法包括以下步骤:
由可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;
各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端;
可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;
各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
2.根据权利要求1所述的一种基于联邦支持向量机的金融客户分类方法,其特征在于,可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,包括:
判断各金融企业客户端之间的标签是否对齐;
标签对齐则对各初级训练模型参数进行平均处理生成联邦分类模型参数;
标签不对齐则对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
3.根据权利要求2所述的一种基于联邦支持向量机的金融客户分类方法,其特征在于,标签不对齐则对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,包括:
将联邦支持向量输入各初级训练模型并分别获得预测标签;
将联邦支持向量和预测标签作为训练数据重新训练对应的初级训练模型,得到联邦训练模型参数。
4.根据权利要求1所述的一种基于联邦支持向量机的金融客户分类方法,其特征在于,各金融企业客户端与可信的第三方服务端通信时,均采用加密方式进行。
5.一种基于联邦支持向量机的金融客户分类装置,其特征在于,应用于分布式网络系统,所述分布式网络系统包括若干金融企业客户端以及一个可信的第三方服务端,各金融企业客户端与可信的第三方服务端通信连接;
所述金融客户分类装置包括:
分类模型分配单元,其用于使可信的第三方服务端向各金融企业客户端发送统一的客户分类模型,所述客户分类模型为支持向量机模型;
模型初级训练单元,其用于使各金融企业客户端接收到客户分类模型后,基于自有数据对所述客户分类模型进行训练,从而得到各自的初级训练模型参数,各金融企业客户端将各自的初级训练模型参数及支持向量发送至可信的第三方服务端;
参数聚合单元,其用于使可信的第三方服务端对获取的初级训练模型参数和支持向量进行聚合处理,从而生成联邦分类模型参数,将所述联邦分类模型参数反馈至各金融企业客户端;
分类单元,其用于使各金融企业客户端将联邦分类模型参数应用于本地客户分类模型,并基于应用联邦分类模型参数的本地客户分类模型对客户数据进行分类。
6.根据权利要求5所述的一种基于联邦支持向量机的金融客户分类装置,其特征在于,所述参数聚合单元包括:
判断模块,其用于判断各金融企业客户端之间的标签是否对齐;
第一参数生成模块,其用于使标签对齐时对各初级训练模型参数进行平均处理生成联邦分类模型参数;
第二参数生成模块,其用于使标签不对齐时对各支持向量进行合并处理生成联邦支持向量,基于所述联邦支持向量对各初级训练模型进行重新训练,生成联邦分类模型参数。
7.根据权利要求5所述的一种基于联邦支持向量机的金融客户分类装置,其特征在于,所述第二参数生成模块包括:
标签生成子模块,其用于将联邦支持向量输入各初级训练模型并分别获得预测标签;
二次训练子模块,其用于将联邦支持向量和预测标签作为训练数据重新训练对应的初级训练模型,得到联邦训练模型参数。
8.根据权利要求5所述的一种基于联邦支持向量机的金融客户分类装置,其特征在于,各金融企业客户端与可信的第三方服务端通信时,均采用加密方式进行。
CN202210551170.3A 2022-05-18 2022-05-18 一种基于联邦支持向量机的金融客户分类方法及装置 Pending CN114997286A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210551170.3A CN114997286A (zh) 2022-05-18 2022-05-18 一种基于联邦支持向量机的金融客户分类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210551170.3A CN114997286A (zh) 2022-05-18 2022-05-18 一种基于联邦支持向量机的金融客户分类方法及装置

Publications (1)

Publication Number Publication Date
CN114997286A true CN114997286A (zh) 2022-09-02

Family

ID=83028135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210551170.3A Pending CN114997286A (zh) 2022-05-18 2022-05-18 一种基于联邦支持向量机的金融客户分类方法及装置

Country Status (1)

Country Link
CN (1) CN114997286A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934385A (zh) * 2023-09-15 2023-10-24 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116934385A (zh) * 2023-09-15 2023-10-24 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置
CN116934385B (zh) * 2023-09-15 2024-01-19 山东理工昊明新能源有限公司 用户流失预测模型的构建方法、用户流失预测方法及装置

Similar Documents

Publication Publication Date Title
WO2022206510A1 (zh) 联邦学习的模型训练方法、装置、设备及存储介质
WO2021114911A1 (zh) 用户风险评估方法及装置、电子设备、存储介质
WO2021179720A1 (zh) 基于联邦学习的用户数据分类方法、装置、设备及介质
US20220230071A1 (en) Method and device for constructing decision tree
Ou et al. A homomorphic-encryption-based vertical federated learning scheme for rick management
CN112270597A (zh) 业务处理、信用评价模型训练方法、装置、设备及介质
US8224738B2 (en) Methods, software, and systems for over-the-counter trading
WO2020238677A1 (zh) 数据处理方法、装置和计算机可读存储介质
Gao et al. A survey on heterogeneous federated learning
CN112862298B (zh) 一种针对用户画像的信用评估方法
CN112068866B (zh) 更新业务模型的方法及装置
CN111563267A (zh) 用于联邦特征工程数据处理的方法和装置
CN111598143A (zh) 基于信用评估的面向联邦学习中毒攻击的防御方法
CN109064113A (zh) 一种基于区块链的电子合同管理方法及系统
CN114676838A (zh) 联合更新模型的方法及装置
CN111553443A (zh) 裁判文书处理模型的训练方法、训练装置和电子设备
CN114168988B (zh) 一种联邦学习模型聚合方法及电子装置
CN114997286A (zh) 一种基于联邦支持向量机的金融客户分类方法及装置
CN114611008A (zh) 基于联邦学习的用户服务策略确定方法、装置及电子设备
Chen et al. Fed-EINI: An efficient and interpretable inference framework for decision tree ensembles in vertical federated learning
CN112507372B (zh) 实现隐私保护的多方协同更新模型的方法及装置
Chen et al. Fed-EINI: an efficient and interpretable inference framework for decision tree ensembles in federated learning
CN113761350A (zh) 一种数据推荐方法、相关装置和数据推荐系统
CN113221170B (zh) 基于区块链的隐私信息匹配与数据交易方法及系统
US20210090136A1 (en) Ai to ai communication

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination