CN113158230A - 一种基于差分隐私的在线分类方法 - Google Patents
一种基于差分隐私的在线分类方法 Download PDFInfo
- Publication number
- CN113158230A CN113158230A CN202110282401.0A CN202110282401A CN113158230A CN 113158230 A CN113158230 A CN 113158230A CN 202110282401 A CN202110282401 A CN 202110282401A CN 113158230 A CN113158230 A CN 113158230A
- Authority
- CN
- China
- Prior art keywords
- privacy
- data
- classification
- online
- batch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000013598 vector Substances 0.000 claims abstract description 38
- 230000006870 function Effects 0.000 claims abstract description 26
- 239000011159 matrix material Substances 0.000 claims abstract description 26
- 230000035945 sensitivity Effects 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 8
- 238000010606 normalization Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000009826 distribution Methods 0.000 claims description 4
- 238000013145 classification model Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 description 5
- 238000007477 logistic regression Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24568—Data stream processing; Continuous queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/50—Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioethics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种基于差分隐私的在线分类方法,属于分类方法领域,包括:输入待学习的流数据;对流数据进行归一化处理,形成归一化的数据矩阵;确定Logistic分类问题的目标函数的敏感度;确定差分隐私算法的隐私参数;根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt可取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;生成目标扰动的噪声向量;给出目标扰动后Logistic分类问题的目标函数的梯度;更新分类超平面;重复上述步骤得到在线分类器,并给出总的隐私消耗。本发明解决了该模型差分隐私求解问题,保证分类器的学习过程不泄漏数据中个体的隐私。
Description
技术领域
本发明属于分类方法领域,具体涉及一种基于差分隐私的在线分类方法。
背景技术
在线分类问题已受到广泛关注,形成了一系列围绕求解在线问题的快速算法,包括在线梯度下降法,在线牛顿方法等。其中在线梯度下降法是在借鉴传统的梯度信息的基础上,借助批次梯度代替整体梯度,使得算法的时间消耗和计算成本有效降低。在在线梯度下降法的基础上涌现出大量二分类的快速求解问题的研究结果,包括模型,理论等各个方面。但现有方法很少涉及到算法的隐私保护问题。
市场化的今天,高效运行的方法是符合主流需求的算法,但是在处理大量流式数据时,可能会涉及到个人的敏感数据,这同样制约着数据要素的高效配置。因此,在保证个体隐私不被泄露的条件下学习高效的在线分类算法将加速提升数据要素价值。如何实现现有的在线梯度下降法既可用于分析包含隐私敏感信息的数据,又能保证算法运行效率是个亟待解决的问题。
为使得在线梯度下降法可以高效的分析包含敏感信息的数据,本申请在隐私保护的新范式——差分隐私框架下给出在线Logistic回归新的求解算法,提出一种基于差分隐私的在线分类方法。
发明内容
为了克服上述现有技术存在的不足,本发明提供了一种基于差分隐私的在线分类方法。
为了实现上述目的,本发明提供如下技术方案:
一种基于差分隐私的在线分类方法,包括以下步骤:
步骤1:输入待学习的流数据;
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;
步骤3:确定Logistic分类问题的目标函数的敏感度;
步骤4:确定差分隐私算法的隐私参数;
根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt可取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;
步骤5:生成目标扰动的噪声向量;
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;
步骤7:更新分类超平面;
步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗。
优选地,所述步骤1中:
通过一批一批的记录累积得到流数据,将最新一批数据作为输入,记第t批数据为Pt(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。
优选地,所述步骤2中:
对于nt×p的属性数据矩阵Zt,计算每行数据向量的二范数,记其中最大值为Max,令Xt=Zt/Max为归一化的属性数据矩阵,Dt=(Xt,Yt)为归一化的数据矩阵。
优选地,所述步骤3中:
对于分类指标属于{-1,+1}的分类问题,具有罚项的Logistic分类模型的目标函数为:
其中,样本点(xi,yi)为数据集Dt=(Xt,Yt)中的个体,nt为样本量,ωt为待估计的分类超平面,λ为惩罚参数,惩罚参数需预先给定;
对于经过步骤2预处理的归一化数据矩阵Dt=(Xt,Yt),Logistic分类问题的目标函数的L2敏感度为:
这里Dt′为Dt的邻接矩阵,即数据矩阵Dt′与Dt只有一行数据(一个样本)不相同。
优选地,所述步骤5中:
基于步骤3给出的敏感度与步骤4给出的隐私参数生产噪声向量bt,具体的:
bt=B·N
这里B为p维单位球球面的一个随机点,N为抽取自伽马分布的随机数,其中p为形状参数,为尺度参数,尺度参数由步骤3给出的敏感度与步骤4给出的隐私参数共同确定;B的生成方式为首先生成一个[-1,1]上的p维随机向量之后通过将其转化到单位球面上,这里表示随机向量的二范数。
优选地,所述步骤6中:
基于步骤5生成的噪声向量bt,基于目标扰动方法的Logistic分类问题的目标函数为:
其梯度向量为:
优选地,所述步骤7中:
这里ηt为学习率。
优选地,所述步骤8中:
本发明提供的基于差分隐私的在线分类方法具有以下有益效果:
本发明通过各步骤学习的在线分类器满足差分隐私,即具有隐私保护的能力,流数据中个体的隐私不会被泄漏。在保护隐私的同时,分类器还具有较高的可用性,可以判断出目标数据的具体类别。
通过在线Logistic回归模型学习分类器是在线学习中广泛使用的模型,本发明解决了该模型差分隐私求解问题,保证分类器的学习过程不泄漏数据中个体的隐私。
附图说明
为了更清楚地说明本发明实施例及其设计方案,下面将对本实施例所需的附图作简单地介绍。下面描述中的附图仅仅是本发明的部分实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例1的基于差分隐私的在线分类方法的流程图。
具体实施方式
为了使本领域技术人员更好的理解本发明的技术方案并能予以实施,下面结合附图和具体实施例对本发明进行详细说明。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明的技术方案和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定或限定,术语“相连”、“连接”应作广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体式连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以是通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上,在此不再详述。
实施例1
本发明提供了一种基于差分隐私的在线分类方法,具体如图1所示,包括包括以下步骤:
步骤1:输入待学习的流数据;
现实中大量可用数据并非一次获取,而是通过一批一批的记录累积得到流数据,如购物平台每分钟都会收集到新的浏览记录,银行每天会收集到新的信用卡使用记录,在每获得一批新数据后都需要更新学习结果。
在线学习任务的目标数据集无法一次获取,而是通过一批一批的记录累积得到,将最新一批数据作为输入,记第t批数据为Pt=(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;
为给出步骤3中Logistic分类问题的目标函数的敏感度,需要对属性数据矩阵Zt进行归一化处理,要求每个样本的欧几里德范数不大于1,即属性数据矩阵Zt的每一行的欧几里德范数不大于1。
对于nt×p的属性数据矩阵Zt,计算每行数据向量的二范数,记其中最大值为Max,令Xt=Zt/Max为归一化的属性数据矩阵,Dt=(Xt,Yt)为归一化的数据矩阵;
步骤3:确定Logistic分类问题的目标函数的敏感度;
为给出步骤5中的噪声,需要确定Logistic分类问题的目标函数的敏感度。对于分类指标属于{-1,+1}的分类问题,具有罚项的Logistic分类模型的目标函数为:
其中,样本点(xi,yi)为数据集Dt=(Xt,Yt)中的个体,nt为样本量,ωt为待估计的分类超平面,λ为惩罚参数,惩罚参数需预先给定;
对于经过步骤2预处理的归一化数据矩阵Dt=(Xt,Yt),Logistic分类问题的目标函数的L2敏感度为:
这里Dt′为Dt的邻接矩阵,即数据矩阵Dt′与Dt只有一行数据(一个样本)不相同;
步骤4:确定差分隐私算法的隐私参数;
流数据中可能包含个人敏感信息,典型的如购物平台的浏览数据中会包括用户的购物习惯和私密购物行为,信用卡数据中会包括个人的金融信息。在在线学习的过程中需要保护数据中个体的隐私,本技术方案通过差分隐私技术来实现隐私保护的功能。在差分隐私框架中,隐私参数ε精确度量隐私保护的程度,因此要根据数据集所包含隐私信息的重要程度和数据拥有者可接受的隐私泄漏程度等预先给定隐私参数ε。在在线学习中,每批数据中都可能包含新的敏感信息,因此在每批数据的学习中都要设置隐私参数。
根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt可取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;
步骤5:生成目标扰动的噪声向量
基于步骤3给出的敏感度与步骤4给出的隐私参数生产噪声向量bt,具体的:
bt=B·N
这里B为p维单位球球面的一个随机点,N为抽取自伽马分布的随机数,其中p为形状参数,为尺度参数,尺度参数由步骤3给出的敏感度与步骤4给出的隐私参数共同确定;B的生成方式为首先生成一个[-1,1]上的p维随机向量之后通过将其转化到单位球面上,这里表示随机向量的二范数;
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;
基于步骤5生成的噪声向量bt,基于目标扰动方法的Logistic分类问题的目标函数为:
其梯度向量为:
步骤7:更新分类超平面;
这里ηt为学习率;
步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗;
下面,以信用卡数据为例,对上述基于差分隐私的在线分类方法作进一步的举例说明,具体包括以下步骤:
步骤1:以信用卡数据做为输入
该数据集为银行客户的信用卡使用信息。每批数据包含200个样本,每个样本包含14个属性和1个分类标签,属性中包括人口统计因素,信用数据,付款历史和账单信息等,分类标签为是否设置下月默认还款,标签值为1表示用户开启了下月默认还款,标签值为-1表示用户未开启下月默认还款。
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵
为给出步骤3中Logistic分类问题的目标函数的敏感度,需要对属性数据矩阵进行归一化处理,要求每个样本的欧几里德范数不大于1,对于该流数据即要求每个个体的属性向量(14个属性)的欧几里德范数不大于1。
步骤3:确定Logistic分类问题的目标函数的敏感度
为给出步骤5中的噪声,需要确定Logistic分类问题的目标函数的敏感度。给定惩罚参数λ=0.15,对于经过步骤2预处理的归一化数据,Logistic分类问题的目标函数的L2敏感度为1/15。在该实施例中每批数据的样本量均为200,故对于不同批次数据L2敏感度保持不变。
步骤4:确定差分隐私算法的隐私参数
信用卡数据中包含个人的金融信息这一重要隐私,在训练分类器时需保护数据中个体的隐私。为说明本技术方案的效用,分别给定隐私参数εt=0,1/240,1/120,5/120,其中ε=0表示非隐私保护。
步骤5:生成目标扰动的噪声向量
针对步骤4中4种不同的隐私参数设置,分别生成噪声向量bt=B·N。当εt=0时,噪声向量为空向量,对于非零的隐私参数设置,B的生成方式为首先生成一个[-1,1]上的14维随机向量之后通过将其转化到单位球面上,这里表示随机向量的二范数。N分别为抽取自伽马分布Ga(14,32),Ga(14,16)与的随机数。
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度
基于步骤5生成的噪声向量bt,求出基于目标扰动方法的Logistic分类问题的目标函数的梯度向量
步骤7:更新分类超平面
基于第t步(对应第t-1批数据)的更新结果ωt和步骤6给出的梯度向量更新分类超平面,对与第t=1步,给出初始值ω1为14维的单位向量。为充分说明本技术方案的效用,分别给定学习率为ηt=1/t,则具体的更新方式为
步骤8:重复上述步骤学习出分类器,并给出总的隐私消耗
在线学习了T批数据后,总的隐私消耗分别为ε=0,0.5,1,5。针对不同参数设定下的学习结果,在目标数据下测试分类器的准确率可得如下结果。
对比不同参数设置下的准确率(Accuracy)可发现,随着隐私参数的变大准确率逐步提高,符合本技术方案的噪声生成机制。对于合适的学习率,在差分隐私约束下所学习的分类器的分类效果非常接近非隐私分类器,说明本技术方案在保护个体隐私的同时还具有较高的可用性。
以上所述实施例仅为本发明较佳的具体实施方式,本发明的保护范围不限于此,任何熟悉本领域的技术人员在本发明披露的技术范围内,可显而易见地得到的技术方案的简单变化或等效替换,均属于本发明的保护范围。
Claims (8)
1.一种基于差分隐私的在线分类方法,其特征在于,包括以下步骤:
步骤1:输入待学习的流数据;
步骤2:对流数据进行归一化处理,形成归一化的数据矩阵;
步骤3:确定Logistic分类问题的目标函数的敏感度;
步骤4:确定差分隐私算法的隐私参数;
根据对隐私保护程度的具体要求给定第t批数据学习过程中的隐私参数εt,εt取大于0的任何数,εt取值越小代表隐私保护程度越强,反之εt取值越大代表隐私保护程度越弱;
步骤5:生成目标扰动的噪声向量;
步骤6:给出目标扰动后Logistic分类问题的目标函数的梯度;
步骤7:更新分类超平面;
步骤8:重复上述步骤得到在线分类器,并给出总的隐私消耗。
2.根据权利要求1所述的基于差分隐私的在线分类方法,其特征在于,所述步骤1中:
通过一批一批的记录累积得到流数据,将最新一批数据作为输入,记第t批数据为Pt=(Zt,Yt),其中Zt为属性数据矩阵,Yt为类标签数据向量,要求Yt中元素的值属于{-1,+1},给出Pt的样本量nt和Zt的维度p。
3.根据权利要求2所述的基于差分隐私的在线分类方法,其特征在于,所述步骤2中:
对于nt×P的属性数据矩阵Zt,计算每行数据向量的二范数,记其中最大值为Max,令Xt=Zt/Max为归一化的属性数据矩阵,Dt=(Xt,Yt)为归一化的数据矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110282401.0A CN113158230B (zh) | 2021-03-16 | 2021-03-16 | 一种基于差分隐私的在线分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110282401.0A CN113158230B (zh) | 2021-03-16 | 2021-03-16 | 一种基于差分隐私的在线分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113158230A true CN113158230A (zh) | 2021-07-23 |
CN113158230B CN113158230B (zh) | 2024-02-09 |
Family
ID=76887477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110282401.0A Active CN113158230B (zh) | 2021-03-16 | 2021-03-16 | 一种基于差分隐私的在线分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113158230B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046277A (zh) * | 2015-07-15 | 2015-11-11 | 华南农业大学 | 特征显著性在图像质量评价中的鲁棒机理研究方法 |
CN106485705A (zh) * | 2016-10-08 | 2017-03-08 | 西安交通大学 | 基于支持矩阵机的电力设备红外图像异常识别方法 |
CN106557654A (zh) * | 2016-11-16 | 2017-04-05 | 中山大学 | 一种基于差分隐私技术的协同过滤算法 |
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN109190661A (zh) * | 2018-07-26 | 2019-01-11 | 安徽师范大学 | 一种基于差分隐私保护的谱聚类方法 |
CN110097119A (zh) * | 2019-04-30 | 2019-08-06 | 西安理工大学 | 基于对偶变量扰动的差分隐私保护支持向量机分类器算法 |
CN110633402A (zh) * | 2019-09-20 | 2019-12-31 | 东北大学 | 一种带有差分隐私机制的三维时空信息传播预测方法 |
CN111723404A (zh) * | 2020-08-21 | 2020-09-29 | 支付宝(杭州)信息技术有限公司 | 联合训练业务模型的方法及装置 |
US20200320221A1 (en) * | 2019-04-04 | 2020-10-08 | Yucel Altug | Systems and Methods for Optimal Privacy-Preserving Information Revelation |
CN112199702A (zh) * | 2020-10-16 | 2021-01-08 | 鹏城实验室 | 一种基于联邦学习的隐私保护方法、存储介质及系统 |
CN112364380A (zh) * | 2020-11-19 | 2021-02-12 | 陕西数盾慧安数据科技有限公司 | 一种基于差分隐私的网络结构学习方法 |
-
2021
- 2021-03-16 CN CN202110282401.0A patent/CN113158230B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105046277A (zh) * | 2015-07-15 | 2015-11-11 | 华南农业大学 | 特征显著性在图像质量评价中的鲁棒机理研究方法 |
CN106485705A (zh) * | 2016-10-08 | 2017-03-08 | 西安交通大学 | 基于支持矩阵机的电力设备红外图像异常识别方法 |
CN106557654A (zh) * | 2016-11-16 | 2017-04-05 | 中山大学 | 一种基于差分隐私技术的协同过滤算法 |
CN107368752A (zh) * | 2017-07-25 | 2017-11-21 | 北京工商大学 | 一种基于生成式对抗网络的深度差分隐私保护方法 |
CN109190661A (zh) * | 2018-07-26 | 2019-01-11 | 安徽师范大学 | 一种基于差分隐私保护的谱聚类方法 |
US20200320221A1 (en) * | 2019-04-04 | 2020-10-08 | Yucel Altug | Systems and Methods for Optimal Privacy-Preserving Information Revelation |
CN110097119A (zh) * | 2019-04-30 | 2019-08-06 | 西安理工大学 | 基于对偶变量扰动的差分隐私保护支持向量机分类器算法 |
CN110633402A (zh) * | 2019-09-20 | 2019-12-31 | 东北大学 | 一种带有差分隐私机制的三维时空信息传播预测方法 |
CN111723404A (zh) * | 2020-08-21 | 2020-09-29 | 支付宝(杭州)信息技术有限公司 | 联合训练业务模型的方法及装置 |
CN112199702A (zh) * | 2020-10-16 | 2021-01-08 | 鹏城实验室 | 一种基于联邦学习的隐私保护方法、存储介质及系统 |
CN112364380A (zh) * | 2020-11-19 | 2021-02-12 | 陕西数盾慧安数据科技有限公司 | 一种基于差分隐私的网络结构学习方法 |
Non-Patent Citations (6)
Title |
---|
HONG-YEN TRAN 等: "Privacy-preserving big data analytics a comprehensive survey", 《JOURNAL OF PARALLEL AND DISTRIBUTED COMPUTING》, vol. 134, pages 207 - 218, XP085848098, DOI: 10.1016/j.jpdc.2019.08.007 * |
孙枫捷: "提供差分隐私保护的分类方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 6, pages 138 - 51 * |
康海燕 等: "差分隐私保护在数据挖掘中应用综述", 《山东大学学报(理学版)》 * |
康海燕 等: "差分隐私保护在数据挖掘中应用综述", 《山东大学学报(理学版)》, vol. 52, no. 3, 31 July 2017 (2017-07-31), pages 16 - 23 * |
王璞玉 等: "分布式隐私保护–Logistic回归", 《中国科学:信息科学》 * |
王璞玉 等: "分布式隐私保护–Logistic回归", 《中国科学:信息科学》, no. 10, 31 October 2020 (2020-10-31), pages 1511 - 1528 * |
Also Published As
Publication number | Publication date |
---|---|
CN113158230B (zh) | 2024-02-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Keramati et al. | A proposed classification of data mining techniques in credit scoring | |
CN113011888B (zh) | 一种针对数字货币的异常交易行为检测方法、装置、设备及介质 | |
CN107578270A (zh) | 一种金融标签的构建方法、装置及计算设备 | |
CN111784204A (zh) | 一种基于用户用电行为画像的优质用户挖掘方法及系统 | |
CN111242744B (zh) | 低频交易的个体行为建模与欺诈检测方法 | |
CN110084609B (zh) | 一种基于表征学习的交易欺诈行为深度检测方法 | |
CN112700324A (zh) | 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法 | |
CN112270596A (zh) | 基于用户画像构建的风险控制系统及方法 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN115205011B (zh) | 基于lsf-fc算法的银行用户画像模型生成方法 | |
CN116485519A (zh) | 数据处理方法、装置、设备及存储介质 | |
Senthilnayaki et al. | Customer churn prediction | |
CN117787715A (zh) | 基于信息框架生成客户画像的金融风控方法和系统 | |
US11361254B2 (en) | Computerized-system and method for generating a reduced size superior labeled training dataset for a high-accuracy machine learning classification model for extreme class imbalance of instances | |
CN113158230A (zh) | 一种基于差分隐私的在线分类方法 | |
CN116227939A (zh) | 基于图卷积神经网络和em算法的企业信用评级方法和装置 | |
CN113706258B (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 | |
CN115907954A (zh) | 账户的识别方法、装置、计算机设备和存储介质 | |
CN112632219B (zh) | 一种垃圾短信的拦截方法和拦截装置 | |
CN108388913A (zh) | 一种基于约束投影的多决策树信用卡欺诈检测方法及系统 | |
Mundargi et al. | Bank Fixed Term Deposit analysis using Bayesian Logistic Regression | |
CN110570301B (zh) | 风险识别方法、装置、设备及介质 | |
Manickam et al. | Credit Card Fraud Detection Using Machine Learning | |
CN118395249A (zh) | 账户分类方法、电子设备以及存储介质 | |
CN115953166B (zh) | 基于大数据智能匹配的客户信息管理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |