CN115329898B - 基于差分隐私策略的多属性数据发布方法及系统 - Google Patents

基于差分隐私策略的多属性数据发布方法及系统 Download PDF

Info

Publication number
CN115329898B
CN115329898B CN202211231173.5A CN202211231173A CN115329898B CN 115329898 B CN115329898 B CN 115329898B CN 202211231173 A CN202211231173 A CN 202211231173A CN 115329898 B CN115329898 B CN 115329898B
Authority
CN
China
Prior art keywords
data
attribute
noise
strips
newly added
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211231173.5A
Other languages
English (en)
Other versions
CN115329898A (zh
Inventor
钱锦
李昂
王红凯
毛冬
樊立波
孙智卿
韩荣杰
来益博
周鹏
杜猛俊
陈元中
张吉
许敏
周昕悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Original Assignee
Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd, Information and Telecommunication Branch of State Grid Zhejiang Electric Power Co Ltd filed Critical Hangzhou Power Supply Co of State Grid Zhejiang Electric Power Co Ltd
Priority to CN202211231173.5A priority Critical patent/CN115329898B/zh
Publication of CN115329898A publication Critical patent/CN115329898A/zh
Application granted granted Critical
Publication of CN115329898B publication Critical patent/CN115329898B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Feedback Control In General (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于差分隐私策略的多属性数据发布方法及系统,包括:获取与第一发布请求单元内相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;得到新增数据集,获取新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;若判断第一差异数量达到第一数量条件、数据属性特征达到第一特征条件,则将第二数据集发布至第一请求端;根据第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;根据噪音数据数量、噪音属性特征对第一数据集进行更新,得到相对应的第三数据集,将第三数据集发布至第一请求端。

Description

基于差分隐私策略的多属性数据发布方法及系统
技术领域
本发明涉及数据处理技术领域,特别是涉及一种基于差分隐私策略的多属性数据发布方法及系统。
背景技术
随着现代信息技术的快速发展,分布式机器学习在多方合作的应用场景中的作用愈发凸显。拥有规模大质量高的数据集可以提高机器学习模型的质量,这就激励了数据所有者们共享和合并他们的数据集,从而训练得到质量更高的模型。然而,在数据集合并的过程中不可避免地会产生隐私泄露的问题。随着相关隐私法规的完善,分布式机器学习中的隐私保护问题日益受到人们的关注。
在现有的基于差分隐私,进行数据的分布式机器学习过程中,如果两个相邻的数据集相差较少(较为接近),此时两个相邻的数据集之间的样本数据较为接近,对模型训练的参数梯度调整也会较少,并且此时极易造成新增样本的隐私泄露,所以在某些需求场景下,可以根据数据集之间的关系来辅助发布者是否对相应的数据集进行发布,现有技术中,并无法根据数据集内所包括的数据条目之间的关系来辅助发布者对数据集发布进行决策。
发明内容
本发明克服现有技术的缺点,提供一种基于差分隐私策略的多属性数据发布方法及系统,根据数据集内所包括的数据条目之间的关系来辅助发布者对数据集发布进行决策,减少隐私泄漏。
为了解决以上技术问题,本发明的技术方案如下:
本发明实施例提供一种基于差分隐私策略的多属性数据发布方法,包括:
S1,在判断接收到第一请求端的第一发布请求时,获取与第一发布请求相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;
S2,将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;
S3,基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端;
S4,若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;
S5,根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
可选的,所述S1包括:
提取所述第一发布请求所对应的请求标签,根据所述请求标签确定至少一个数据存储单元,每个请求标签具有与其预先对应设置的数据存储单元;
遍历所述数据存储单元内满足预设要求的数据条得到第一数据集,所述第一数据集内的数据条具有与其对应的第一数据标签,统计所有的第一数据标签得到第一标签列表;
获取与所确定的数据存储单元对应的数据发布记录表,所述数据发布记录表中具有每次发布时的发布时间信息、发布起始数据条的起始数据标签、发布终止数据条的终止数据标签;
选取与当前时刻最接近的发布时间信息作为第一发布时间信息,根据第一发布时间信息的起始数据标签、终止数据标签生成第二标签列表,统计数据存储单元内第二标签列表所对应的所有数据条得到第二数据集。
可选的,所述S2包括:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表;
统计数据存储单元内所有的第一新增标签列表对应的数据条,得到新增数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识。
可选的,所述S2包括:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签不完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表,确定第一标签列表内不具有、第二标签列表内具有的第二数据标签,得到第一减少标签列表;
统计数据存储单元内第一新增标签列表对应的所有的数据条,得到新增数据集,统计数据存储单元内第一减少标签列表对应的所有的数据条,得到减少数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识;
统计第一减少标签列表内第一减少数据标签的数量得到第二数据条数量,以及第一减少标签列表内每个第一减少数据标签所对应的数据属性特征,使得每个第一减少数据标签具有相对应的数据属性标识。
可选的,所述S3包括:
基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件;
获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比;
根据数据属性特征的数量、不同类型的数据属性特征的属性特征占比进行计算,得到每种数据属性特征的融合属性占比,若所述融合属性占比位于预设占比区间内,则判断数据属性特征达到第一特征条件,将所述第一数据集发布至所述第一请求端。
可选的,所述基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件,包括:
若判断仅存在第一数据条数量,不存在第二数据条数量,则将第一数据条数量作为第一差异数量;
若判断同时存在第一数据条数量和第二数据条数量,且第一数据条数量大于等于最小数据条数量,则根据第一数据条数量和第二数据条数量进行综合计算,得到第一差异数量,通过以下公式计算第一差异数量,
Figure 255644DEST_PATH_IMAGE001
其中,
Figure 555039DEST_PATH_IMAGE002
为最小数据条数量,
Figure 673167DEST_PATH_IMAGE003
为第一差异数量,
Figure 7197DEST_PATH_IMAGE004
为第一数据条数量,
Figure 818158DEST_PATH_IMAGE005
为第一数据条权重,
Figure 333410DEST_PATH_IMAGE006
为第二数据条数量,
Figure 520809DEST_PATH_IMAGE007
为第二数据条权重;
若判断第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件。
可选的,所述获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比,包括:
统计第一新增数据标签在第
Figure 443765DEST_PATH_IMAGE008
种的数据属性标识的新增数量,以及第一减少数据 标签具在第
Figure 691207DEST_PATH_IMAGE008
种的数据属性标识的减少数量;
统计所有数据属性标识的数量得到属性种类总数量,根据所述属性种类总数量得到属性占比调整趋势值;
根据第
Figure 965194DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识的新增数量、 减少数量进行初步计算,得到第
Figure 97229DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步占比值与0.5比对 得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调整,得到第
Figure 671430DEST_PATH_IMAGE008
种的 数据属性标识的属性特征占比。
可选的,所述根据第
Figure 293035DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识 的新增数量、减少数量进行初步计算,得到第
Figure 319897DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步占比 值与0.5比对得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调整, 得到第
Figure 114677DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比,包括:
Figure 746647DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量分别进行加权处理,除以所有数据属 性标识的新增数量、减少数量,得到第
Figure 742416DEST_PATH_IMAGE008
种数据属性标识的初步占比值;
通过以下公式计算第
Figure 725416DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 386204DEST_PATH_IMAGE009
其中,
Figure 374862DEST_PATH_IMAGE010
为第
Figure 400587DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 605303DEST_PATH_IMAGE011
Figure 210728DEST_PATH_IMAGE008
种数据属性标识的新 增数量,
Figure 82869DEST_PATH_IMAGE012
为新增数量的权重,
Figure 279495DEST_PATH_IMAGE013
Figure 33825DEST_PATH_IMAGE008
种数据属性标识的减少数量,
Figure 239678DEST_PATH_IMAGE014
为减少数量的权 重,
Figure 700746DEST_PATH_IMAGE015
Figure 5957DEST_PATH_IMAGE016
种数据属性标识的新增数量,
Figure 185266DEST_PATH_IMAGE017
为新增数量所对应的数据属性标识的种类的上 限值,
Figure 929231DEST_PATH_IMAGE018
Figure 244806DEST_PATH_IMAGE019
种数据属性标识的减少数量,
Figure 111130DEST_PATH_IMAGE020
为减少数量所对应的数据属性标识的种类 的上限值;
若初步占比值小于0.5,则根据属性占比调整趋势值对初步占比值进行增大调整得到属性特征占比,若初步占比值大于0.5,则根据属性占比调整趋势值对初步占比值进行减小调整得到属性特征占比;
通过以下公式计算第
Figure 777735DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 59812DEST_PATH_IMAGE021
其中,
Figure 495472DEST_PATH_IMAGE022
为第
Figure 142485DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 290527DEST_PATH_IMAGE023
为属性种类总数量,
Figure 376295DEST_PATH_IMAGE024
为预设种类数量,
Figure 666462DEST_PATH_IMAGE025
为种类数量归一化值。
可选的,所述S4包括:
若所有的数据属性标识的属性占比均不位于预设占比区间内,则判断数据属性特征未达到第一特征条件;
将非最大的所有数据属性标识作为待增加的噪音属性标识,根据所述第一差异数量、噪音增加比例计算噪音数据数量;
根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量。
可选的,所述根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量,包括:
统计所有的噪音属性标识的数量,随机生成每种噪音属性标识对应的噪音分配子比例,通过以下公式计算每种噪音属性标识所对应的噪音属性特征的噪音子数量,
Figure 874589DEST_PATH_IMAGE026
其中,
Figure 250207DEST_PATH_IMAGE027
为噪音数据数量,
Figure 874086DEST_PATH_IMAGE028
为噪音增加比例,
Figure 222022DEST_PATH_IMAGE029
为第
Figure 538734DEST_PATH_IMAGE030
种噪音属性标识所 对应的噪音属性特征的噪音子数量,
Figure 401648DEST_PATH_IMAGE031
为第
Figure 891535DEST_PATH_IMAGE030
种噪音属性标识所对应的噪音分配子比 例;
若所有的噪音子数量之和大于噪音数据数量,则将噪音子数量之和所得到的噪音数据数量对先前的噪音数据数量更新处理。
可选的,所述S5包括:
对所选取的任意一个新增数据条按照噪音数据数量进行复制处理,得到复制数据条,调取数据库中的预设名称对复制数据条的名称进行替换调整;
将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
可选的,所述将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端,包括:
提取新增数据内所有第一新增数据标签的最小序号和最大序号,生成相对应的序号段,随机提取序号段中与噪音数据数量相对应数量的序号作为插入序号,为每个复制数据条分配插入序号;
按照所述插入序号将复制数据条插入至第一数据集内相同序号第一数据条后部,在判断所有复制数据条分别插入至第一数据集内后,对所有的复制数据条、第一数据条的序号更新处理,得到相对应的第三数据集。
本发明实施例提供一种基于差分隐私策略的多属性数据发布系统,包括:
获取模块,用于在判断接收到第一请求端的第一发布请求时,获取与第一发布请求单元内相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;
比对模块,用于将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;
第一发布模块,用于基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端;
生成模块,用于若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;
第二发布模块,用于根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
本发明的有益效果是:
1、本方案会以数量和数据属性特征两个维度来判断两个相邻的数据集之间是否相差较少(较为接近),如果是,本方案会对数据集进行数量维度和属性特征维度的分析,得到噪音数据数量、噪音属性特征会对数据进行加噪处理,对即将发布的数据集进行更新,以根据数据集内所包括的数据条目之间的关系来辅助发布者对数据集发布进行决策,避免了在数据集共享的过程中隐私泄露的情况出现。
2、本方案依据不同的场景设置了不同的预设要求,预设要求有两种,一种是按照数据量的方式进行筛选,一直是按照时间的方式进行筛选,预设要求不同时,对数据集的分析方式也有所不同,以确保在不同场景下分析的准确性。另外,本方案在计算数量维度的差异时,不但会结合增加维度的数据,还会结合减少维度的数据,来综合计算差异数量;本方案在对属性特征维度进行分析时,会计算各数据属性所对应的属性特征占比,对属性特征占比进行分析,并在属性特征占比不位于预设占比区间内时,计算非最大的所有数据属性标识所对应的噪音分配子比例,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量,对数据集进行加噪。
3、本方案在进行噪音数据插入时,设置了随机插入的方式,相较于复制数据条完全插入到新增数据的后部或者前部的方式,可以对新增数据和噪音数据进行混淆,确保数据的隐蔽性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例提供一种基于差分隐私策略的多属性数据发布方法的流程示意图;
图2是本发明实施例提供一种基于差分隐私策略的多属性数据发布方法的结构示意图。
具体实施方式
为使本发明的内容更容易被清楚地理解,下面根据具体实施方式并结合附图,对本发明作出进一步详细的说明。
参见图1,是本发明实施例提供一种基于差分隐私策略的多属性数据发布方法的流程是意图,包括S1-S5:
S1,在判断接收到第一请求端的第一发布请求时,获取与第一发布请求相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集。
其中,第一请求端为请求数据的一端,第一请求端在有数据需求时,可以向数据发送端发送第一发布请求,以向数据发送端请求数据,数据发送端可以将相关数据传输给第一请求端。
在本方案的场景中,数据发送端会设置有多个数据存储单元,不同的数据存储单元用于存储不同的数据,例如,数据存储单元A用于存储用电信息的用户数据。本方案的数据发送端在接收到第一请求端的第一发布请求时,会获取与第一发布请求相对应的数据存储单元内的第一数据集。例如,第一发布请求是想要请求用电信息的用户数据,那么本方案的数据发送端会确定到用于存储用电信息的用户数据的数据存储单元A,然后对数据存储单元A内的数据进行统计形成第一数据集。
同时,由于本方案会在多端之间经常共享数据集,为了防止利用相近数据集进行反推,本方案还会确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集。其中,第二请求端是指除了第一请求端之外的其余请求端,也就是说,数据发送端可以将数据发送给多个请求端。
在一些实施例中,所述S1包括S11- S14:
S11,提取所述第一发布请求所对应的请求标签,根据所述请求标签确定至少一个数据存储单元,每个请求标签具有与其预先对应设置的数据存储单元。
本方案会对第一发布请求进行解析,得到第一发布请求中的请求标签,以用电信息为例,请求标签例如是用电信息等,可以理解的是,本方案可以通过请求标签来快速查找到对应的数据存储单元。
S12,遍历所述数据存储单元内满足预设要求的数据条得到第一数据集,所述第一数据集内的数据条具有与其对应的第一数据标签,统计所有的第一数据标签得到第一标签列表。
本方案设置有预设要求,会依据预设要求遍历所述数据存储单元内满足预设要求的数据条得到第一数据集,其中,预设要求可以是用于筛选数据存储单元内相关数据条的条件,在一种方式下,预设要求可以是按照时间要求来筛选,例如是筛选近2个月的数据条,在该实施方式下,第一数据集所对应的数据条是对应近2个月的数据条;在另一种方式下,预设要求可以是按照数据量要求来筛选,例如是筛选数据存储单元内当前的所有数据条。
需要说明的是,第一数据集内的数据条具有与其对应的第一数据标签,统计所有的第一数据标签得到第一标签列表。其中,一个数据条可以对应一个用户信息,第一数据标签可以是用户姓名等标签,本方案可以统计第一数据集内所有的第一数据标签得到第一标签列表。
S13,获取与所确定的数据存储单元对应的数据发布记录表,所述数据发布记录表中具有每次发布时的发布时间信息、发布起始数据条的起始数据标签、发布终止数据条的终止数据标签。
本方案还会得到相应数据存储单元所对应的数据发布记录表,用于提取数据存储单元每次发布时的发布时间信息、发布起始数据条的起始数据标签、发布终止数据条的终止数据标签。
S14,选取与当前时刻最接近的发布时间信息作为第一发布时间信息,根据第一发布时间信息的起始数据标签、终止数据标签生成第二标签列表,统计数据存储单元内第二标签列表所对应的所有数据条得到第二数据集。
本方案会选取与当前时刻最接近的发布时间信息作为第一发布时间信息,然后利用第一发布时间信息的起始数据标签、终止数据标签生成第二标签列表,之后统计数据存储单元内第二标签列表所对应的所有数据条得到第二数据集。
可以理解的是,第二数据集内所对应的数据是上一次发布出去的数据集。
S2,将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征。
在得到第二数据集后,本方案会将第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集。其中,第二数据集内的第二数据条是上一次发布出去的数据,本方案将第二数据集与第一数据集进行比对,可以得到新增数据集。示例性的,第二数据集内的第二数据条有1000个,这1000个数据条分别对应1000个用户,每个数据条对应每个用户的用电数据;第一数据集内有1100个数据条,这1100个数据条分别对应1100个用户,每个数据条对应每个用户的用电数据,那么新增数据集就是100个用户所对应的数据集。
本方案在得到新增数据集之后,会对新增数据集进行分析,得到新增数据集内所有新增数据条的第一数据条数量,以及每个新增数据条的数据属性特征。例如,第一数据条数量为100,每个新增数据条的数据属性特征例如是过量用电、正常用电、过少用电。
在一些实施例中,预设要求如果是按照数据量来筛选,例如是筛选数据存储单元内当前的所有数据条,在这种情况下,所述S2包括S21- S24:
S21,将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表。
本方案在进行比对时,会将第一标签列表与第二标签列表进行比对,如果第一标签列表的所有第一数据标签完全包含第二标签列表的第二数据标签,说明有新增数据,此时,本方案会确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表,第一新增标签列表例如是对应上述示例中100个用户的姓名。
S22,统计数据存储单元内所有的第一新增标签列表对应的数据条,得到新增数据集。
本方案在确定第一新增标签列表后,可以查询数据存储单元内所有的第一新增标签列表对应的数据条,得到新增数据集。
S23,获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征。
其中,数据属性种类可以是用户的用电种类,对应的数据属性特征可以是过量用电、正常用电、过少用电。
S24,统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识。
本方案会计算第一新增标签列表内第一新增数据标签的数量,得到第一数据条数量,同时会统计第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识。
在另一些实施例中,预设要求为按照时间来筛选,例如是筛选数据存储单元内近2个月的数据条,在这种情况下,所述S2包括S21- S25:
S21,将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签不完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表,确定第一标签列表内不具有、第二标签列表内具有的第二数据标签,得到第一减少标签列表。
与上一实施例不同的是,本方案是按照时间来进行筛选的,例如,1月的数据条为1-50,2月的数据条为50-100,3月的数据条为100-150,上一次发送的是1月和2月的数据条,也就是1-100,即对应的第二标签列表为1-100所对应的数据标签,第一标签列表为1-150所对应的数据标签。
在第一标签列表的所有第一数据标签不完全包含第二标签列表的第二数据标签时,说明当前的数据有新增数据,本方案会确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,也就是50-150所对应的第一数据标签,得到第一新增标签列表;同时,本方案会确定第一标签列表内不具有、第二标签列表内具有的第二数据标签,得到第一减少标签列表,也就是1-50所对应的数据标签。
S22,统计数据存储单元内第一新增标签列表对应的所有的数据条,得到新增数据集,统计数据存储单元内第一减少标签列表对应的所有的数据条,得到减少数据集。
本方案会统计数据存储单元内第一新增标签列表对应的所有的数据条,得到新增数据集,即上述的100-150所对应的数据,然后统计数据存储单元内第一减少标签列表对应的所有的数据条,及上述的1-100所对应的数据,得到减少数据集。
S23,获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征。
其中,数据属性种类可以是用户的用电种类,对应的数据属性特征可以是过量用电、正常用电、过少用电。
S24,统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识。
本方案会统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,第一数据条数量例如是50个,同时,本方案会统计第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识。
S25,统计第一减少标签列表内第一减少数据标签的数量得到第二数据条数量,以及第一减少标签列表内每个第一减少数据标签所对应的数据属性特征,使得每个第一减少数据标签具有相对应的数据属性标识。
同时,本方案还会统计第一减少标签列表内第一减少数据标签的数量得到第二数据条数量,第二数据条数量例如是50个,此外,本方案会统计第一减少标签列表内每个第一减少数据标签所对应的数据属性特征,使得每个第一减少数据标签具有相对应的数据属性标识。
S3,基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端。
本方案会新增数据集得到第一差异数量,然后对第一差异数量进行判断,如果第一差异数量达到第一数量条件、数据属性特征达到第一特征条件,说明新增数据的差异度足够,不会产生隐私安全,则本方案会将第一数据集发布至第一请求端。
在一些实施例中,所述S3包括S31- S33:
S31,基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件。
在计算第一差异数量时,本方案会对第一数据条数量和/或第二数据条数量进行综合计算,在得到第一差异数量后,本方案会将第一差异数量与第一预设数量进行比对,如果第一差异数量大于等于第一预设数量,则本方案会判断第一差异数量达到第一数量条件,即新增数据在数量维度上满足了要求。
在一些实施例中,S31(所述基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件)包括S311- S313:
S311,若判断仅存在第一数据条数量,不存在第二数据条数量,则将第一数据条数量作为第一差异数量。
如果判断仅存在第一数据条数量,不存在第二数据条数量,说明对应的场景是按照数据量来筛选的,例如是筛选数据存储单元内当前的所有数据条,这种场景下是不存在第二数据条数量的。此时,本方案会直接将第一数据条数量作为第一差异数量。
S312,若判断同时存在第一数据条数量和第二数据条数量,且第一数据条数量大于等于最小数据条数量,则根据第一数据条数量和第二数据条数量进行综合计算,得到第一差异数量。
如果判断同时存在第一数据条数量和第二数据条数量,说明对应的场景是按照时间来筛选,例如是筛选数据存储单元内近2个月的数据条,这种场景下是存在第二数据条数量的。本方案设置有最小数据条量,会在第一数据条数量大于等于最小数据条数量的情况下,因为只有在第一数据条数量大于等于最小数据条数量时,才具有一定的差异度,在根据第一数据条数量和第二数据条数量进行综合计算,得到第一差异数量。
通过以下公式计算第一差异数量,
Figure 421873DEST_PATH_IMAGE001
其中,
Figure 643907DEST_PATH_IMAGE002
为最小数据条数量,
Figure 931800DEST_PATH_IMAGE003
为第一差异数量,
Figure 897482DEST_PATH_IMAGE004
为第一数据条数量,
Figure 16748DEST_PATH_IMAGE005
为第一数据条权重,
Figure 675262DEST_PATH_IMAGE006
为第二数据条数量,
Figure 512768DEST_PATH_IMAGE007
为第二数据条权重。
可以理解的是,新增数据是具有差异度的,减少数据也是具有差异度的,因此上述 公式中,会综合第一数据条的数量以及第二数据条的数量来计算第一差异度数量,其中,
Figure 344458DEST_PATH_IMAGE032
代表新增维度的差异值,
Figure 583810DEST_PATH_IMAGE033
代表减少维度的差异值,第一数据条权重
Figure 141787DEST_PATH_IMAGE034
和 第二数据条权重
Figure 201010DEST_PATH_IMAGE035
可以是工作人员预先设置的。
S313,若判断第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件。
如果判断第一差异数量大于等于第一预设数量,说明在数量维度是满足预设要求的,本方案会判断第一差异数量达到第一数量条件。
S32,获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比;
需要说明的是,上述实施例中,对数量维度进行了分析,本方案会对数据属性特征维度进行分析。
首先,本方案会得到所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,然后利用每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比。
在一些实施例中,S32(所述获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比)包括S321- S323:
S321,统计第一新增数据标签在第
Figure 711756DEST_PATH_IMAGE008
种的数据属性标识的新增数量,以及第一减 少数据标签具在第
Figure 805614DEST_PATH_IMAGE008
种的数据属性标识的减少数量。
可以理解的是,数据属性标识可以有多种,针对用电数据来说,可以有过量用电、 正常用电和少量用电,本方案会统计第一新增数据标签在第
Figure 540352DEST_PATH_IMAGE008
种的数据属性标识的新增数 量,以及第一减少数据标签具在第
Figure 680347DEST_PATH_IMAGE008
种的数据属性标识的减少数量,对每种数据属性标识 进行分析。
S322,统计所有数据属性标识的数量得到属性种类总数量,根据所述属性种类总数量得到属性占比调整趋势值。
本方案会统计所有数据属性标识的数量得到属性种类总数量,例如,属性种类总数量为3种,分别是过量用电、正常用电和过少用电,然后会利用属性种类总数量得到属性占比调整趋势值。
S323,根据第
Figure 525943DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识的新增 数量、减少数量进行初步计算,得到第
Figure 474307DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步占比值与 0.5比对得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调整,得到 第
Figure 379946DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比。
本方案会根据第
Figure 679341DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识的 新增数量、减少数量进行初步计算,得到第
Figure 531890DEST_PATH_IMAGE008
种数据属性标识的初步占比值。
在得到初步占比值之后,本方案会对初步占比值进行分析,将初步占比值与0.5进 行比对得到比对结果,然后利用比对结果、属性占比调整趋势值对初步占比值进行调整,得 到第
Figure 865920DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比,本方案通过上述方式,可以较为准确的计算出 每种数据属性标识的属性特征占比。
其中,S323(所述根据第
Figure 942460DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性 标识的新增数量、减少数量进行初步计算,得到第
Figure 197992DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步 占比值与0.5比对得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调 整,得到第
Figure 978866DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比)包括S3231- S3232:
S3231,对
Figure 901823DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量分别进行加权处理,除以所有 数据属性标识的新增数量、减少数量,得到第
Figure 149264DEST_PATH_IMAGE008
种数据属性标识的初步占比值;
通过以下公式计算第
Figure 157672DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 142902DEST_PATH_IMAGE009
其中,
Figure 123628DEST_PATH_IMAGE010
为第
Figure 807550DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 303253DEST_PATH_IMAGE011
为第
Figure 832455DEST_PATH_IMAGE008
种数据属性标识的 新增数量,
Figure 261162DEST_PATH_IMAGE012
为新增数量的权重,
Figure 53669DEST_PATH_IMAGE013
Figure 771089DEST_PATH_IMAGE008
种数据属性标识的减少数量,
Figure 103981DEST_PATH_IMAGE014
为减少数量的 权重,
Figure 121616DEST_PATH_IMAGE015
Figure 881761DEST_PATH_IMAGE016
种数据属性标识的新增数量,
Figure 414374DEST_PATH_IMAGE017
为新增数量所对应的数据属性标识的种类的 上限值,
Figure 550957DEST_PATH_IMAGE018
Figure 423098DEST_PATH_IMAGE019
种数据属性标识的减少数量,
Figure 354145DEST_PATH_IMAGE020
为减少数量所对应的数据属性标识的种 类的上限值。
上述公式中,
Figure 249420DEST_PATH_IMAGE036
代表第
Figure 189694DEST_PATH_IMAGE008
种数据属性标识的新增数量维度的数值,
Figure 668341DEST_PATH_IMAGE037
代表第
Figure 35868DEST_PATH_IMAGE008
种数据属性标识的减少数量维度的数值,
Figure 215177DEST_PATH_IMAGE038
代表第
Figure 21459DEST_PATH_IMAGE008
种的数据属 性标识的整体变化量,可以理解的是,整体变化量越大,第
Figure 337033DEST_PATH_IMAGE008
种的数据属性标识的初步占比 值
Figure 141041DEST_PATH_IMAGE039
也就越大,
Figure 542067DEST_PATH_IMAGE040
代表所有数据属性标识的新增数量维度的数值之和,
Figure 27406DEST_PATH_IMAGE041
代表所有数据属性标识的减少数量维度的数值之和。其中,新增数量的权重
Figure 463067DEST_PATH_IMAGE042
、减少数量的权重
Figure 172397DEST_PATH_IMAGE043
可以是工作人员预先设置的。
S3232,若初步占比值小于0.5,则根据属性占比调整趋势值对初步占比值进行增大调整得到属性特征占比,若初步占比值大于0.5,则根据属性占比调整趋势值对初步占比值进行减小调整得到属性特征占比。
可以理解的是,如果初步占比值小于0.5,说明该数据属性标识所对应的初步占比值较小,本方案需要依据属性占比调整趋势值对初步占比值进行增大调整得到属性特征占比。如果初步占比值大于0.5,说明该数据属性标识所对应的初步占比值较大,本方案需要依据属性占比调整趋势值对初步占比值进行减小调整得到属性特征占比。
通过以下公式计算第
Figure 60718DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 208803DEST_PATH_IMAGE044
其中,
Figure 764549DEST_PATH_IMAGE022
为第
Figure 644780DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 223660DEST_PATH_IMAGE023
为属性种类总数量,
Figure 847540DEST_PATH_IMAGE024
为预设种类数量,
Figure 257792DEST_PATH_IMAGE025
为种类数量归一化值。
上述公式中,
Figure 636821DEST_PATH_IMAGE045
代表属性占比调整趋势值,即需要调整的幅度
Figure 765314DEST_PATH_IMAGE046
代表属性种类总数量与预设种类数量的差值,差值越大,说明相差越大,则调 整的幅度可以越大。其中,属性占比调整趋势值
Figure 921446DEST_PATH_IMAGE025
可以是工作人员预先设置的。
S33,若所述属性特征占比位于预设占比区间内,则判断数据属性特征达到第一特征条件,将所述第一数据集发布至所述第一请求端。
本方案预先设置有预设占比区间,在得到属性特征占比后,如果属性特征占比位于预设占比区间内,说明数量维度和属性特征维度都满足了要求,则本方案会判断数据属性特征达到第一特征条件,此时,可以将第一数据集发布至第一请求端。
S4,若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征。
如果说判断第一差异数量达到第一数量条件,数据属性特征未达到第一特征条件,说明数量维度达到了要求,但是数据属性特征未达到要求,需要对数据集进行更新处理。此时,本方案会依据第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征,对数据集进行加噪处理,提高数据集的差异度。
在一些实施例中,所述S4包括S41- S43:
S41,若所有的数据属性标识的属性占比均不位于预设占比区间内,则判断数据属性特征未达到第一特征条件。
如果所有的数据属性标识的属性占比均不位于预设占比区间内,说明数据属性特征未达到第一特征条件。其中,预设占比区间可以是工作人员预先设置的,例如是15%-85%。
示例性的,数据属性标识有3种,过量用电的数据属性标识的属性占比为1%,正常用电的数据属性标识的属性占比为1%,小额用电的数据属性标识的属性占比为98%,预设占比区间为15%-85%,此时,每一种的属性占比均不位于预设占比区间内,本方案会判断数据属性特征未达到第一特征条件。
S42,将非最大的所有数据属性标识作为待增加的噪音属性标识,根据所述第一差异数量、噪音增加比例计算噪音数据数量。
此时,本方案会确定到非最大的所有数据属性标识,将非最大的所有数据属性标识作为待增加的噪音属性标识,然后根据第一差异数量、噪音增加比例计算出噪音数据数量。
示例性的,数据属性标识有3种,过量用电的数据属性标识的属性占比为1%,正常用电的数据属性标识的属性占比为1%,小额用电的数据属性标识的属性占比为98%,此时,确定的待增加的噪音属性标识为过量用电的数据属性标识和正常用电的数据属性标识。本方案会依据第一差异数量、噪音增加比例计算噪音数据数量。
S43,根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量。
本方案会依据噪音属性标识的数量生成噪音分配子比例,例如,噪音属性标识的数量有2个,分别对应过量用电和正常用电,此时,本方案会依据噪音属性标识的数量生成噪音分配子比例,例如分别可以是:过量用电:40%,正常用电:60%。其中的噪音分配子比例可以是随机生成的。
在得到噪音分配子比例后,本方案可以依据噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量。
其中,S43(所述根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量)包括S431- S432:
S431,统计所有的噪音属性标识的数量,随机生成每种噪音属性标识对应的噪音分配子比例,通过以下公式计算每种噪音属性标识所对应的噪音属性特征的噪音子数量,
Figure 186205DEST_PATH_IMAGE026
其中,
Figure 345922DEST_PATH_IMAGE027
为噪音数据数量,
Figure 961711DEST_PATH_IMAGE028
为噪音增加比例,
Figure 255289DEST_PATH_IMAGE029
为第
Figure 374555DEST_PATH_IMAGE030
种噪音属性标识所 对应的噪音属性特征的噪音子数量,
Figure 33069DEST_PATH_IMAGE031
为第
Figure 604996DEST_PATH_IMAGE030
种噪音属性标识所对应的噪音分配子比 例。
上述公式中,
Figure 312052DEST_PATH_IMAGE003
为第一差异数量,本方案会依据第一差异数量和噪音增加比例
Figure 816983DEST_PATH_IMAGE028
计算出噪音数据数量
Figure 708716DEST_PATH_IMAGE027
Figure 767938DEST_PATH_IMAGE047
代表第
Figure 341002DEST_PATH_IMAGE030
种噪音属性标识所对应的噪音属性特征的 噪音子数量。
S432,若所有的噪音子数量之和大于噪音数据数量,则将噪音子数量之和所得到的噪音数据数量对先前的噪音数据数量更新处理。
需要说明的是,如果计算出来的所有的噪音子数量之和大于噪音数据数量,则将噪音子数量之和所得到的噪音数据数量对先前的噪音数据数量更新处理。
可以理解的是,由于有向上取整的计算过程,计算出来的所有的噪音子数量之和可能会大于噪音数据数量,例如,噪音数据数量为10个,所有的噪音子数量之和为11,那么本方案会将先前的噪音数据数量更新处理为11。
S5,根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
本方案会根据噪音数据数量、噪音属性特征对第一数据集进行更新,得到相对应的第三数据集,可以理解的是,第三数据集是加入噪音数据的数据集,此时,本方案可以将第三数据集发布至第一请求端。
在一些实施例中,所述S5包括S51- S52:
S51,对所选取的任意一个新增数据条按照噪音数据数量进行复制处理,得到复制数据条,调取数据库中的预设名称对复制数据条的名称进行替换调整。
本方案可以任意选取一个新增数据条,然后按照噪音数据数量进行复制,得到多个复制数据条,在得到复制数据条之后,本方案会调取数据库中的预设名称对复制数据条的名称进行替换调整,防止复制数据条与新增数据条中的名称重复。
S52,将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
在将复制数据条的名称替换完毕后,本方案会将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,实现属性特征的更新,然后将复制数据条插入至第一数据集内,得到相对应的第三数据集,将第三数据集发布至第一请求端。
在一些实施例中,S52(所述将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端)包括S521-S522:
S521,提取新增数据内所有第一新增数据标签的最小序号和最大序号,生成相对应的序号段,随机提取序号段中与噪音数据数量相对应数量的序号作为插入序号,为每个复制数据条分配插入序号。
本方案在进行复制数据条的插入时,会先提取新增数据内所有第一新增数据标签的最小序号和最大序号,生成相对应的序号段,例如,总共有50个新增数据,最小序号为1,最大序号为50,生成每个新增数据所对应的序号段。
本方案会随机提取序号段中与噪音数据数量相对应数量的序号作为插入序号,为每个复制数据条分配插入序号。
示例性的,总共需要插入10个复制数据条,需要插入的数据有2组,一组是对应过量用电的数据,例如需要插入4个过量用电所对应的复制数据条,一组是对应正常用电的数据,例如需要插入6个正常用电所对应的复制数据条。那么本方案会提取序号段中的序号4,以及序号6。
S522,按照所述插入序号将复制数据条插入至第一数据集内相同序号第一数据条后部,在判断所有复制数据条分别插入至第一数据集内后,对所有的复制数据条、第一数据条的序号更新处理,得到相对应的第三数据集。
本方案会将4个过量用电所对应的复制数据条插入到序号4后部,将6个正常用电所对应的复制数据条插入到序号6后部,实现10个复制条数据的随机插入,在判断所有复制数据条分别插入至第一数据集内后,对所有的复制数据条、第一数据条的序号更新处理,得到相对应的第三数据集。
可以理解的是,本方案通过上述随机插入的方式,相较于复制数据条完全插入到新增数据的后部或者前部的方式,可以对数据进行混淆,确保数据的隐蔽性。
参见图2,是本发明实施例提供的一种基于差分隐私策略的多属性数据发布系统的结构示意图,该基于差分隐私策略的多属性数据发布系统包括:
获取模块,用于在判断接收到第一请求端的第一发布请求时,获取与第一发布请求单元内相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;
比对模块,用于将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;
第一发布模块,用于基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端;
生成模块,用于若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;
第二发布模块,用于根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
除上述实施例外,本发明还可以有其他实施方式;凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (8)

1.基于差分隐私策略的多属性数据发布方法,其特征在于,包括:
S1,在判断接收到第一请求端的第一发布请求时,获取与第一发布请求相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;
S2,将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;
S3,基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端;
S4,若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;
S5,根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端;
所述S1包括:
提取所述第一发布请求所对应的请求标签,根据所述请求标签确定至少一个数据存储单元,每个请求标签具有与其预先对应设置的数据存储单元;
遍历所述数据存储单元内满足预设要求的数据条得到第一数据集,所述第一数据集内的数据条具有与其对应的第一数据标签,统计所有的第一数据标签得到第一标签列表;
获取与所确定的数据存储单元对应的数据发布记录表,所述数据发布记录表中具有每次发布时的发布时间信息、发布起始数据条的起始数据标签、发布终止数据条的终止数据标签;
选取与当前时刻最接近的发布时间信息作为第一发布时间信息,根据第一发布时间信息的起始数据标签、终止数据标签生成第二标签列表,统计数据存储单元内第二标签列表所对应的所有数据条得到第二数据集;
所述S2包括:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表;
统计数据存储单元内所有的第一新增标签列表对应的数据条,得到新增数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识;
所述S2包括:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签不完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表,确定第一标签列表内不具有、第二标签列表内具有的第二数据标签,得到第一减少标签列表;
统计数据存储单元内第一新增标签列表对应的所有的数据条,得到新增数据集,统计数据存储单元内第一减少标签列表对应的所有的数据条,得到减少数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识;
统计第一减少标签列表内第一减少数据标签的数量得到第二数据条数量,以及第一减少标签列表内每个第一减少数据标签所对应的数据属性特征,使得每个第一减少数据标签具有相对应的数据属性标识;
所述S3包括:
基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件;
获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比;
根据数据属性特征的数量、不同类型的数据属性特征的属性特征占比进行计算,得到每种数据属性特征的融合属性占比,若所述融合属性占比位于预设占比区间内,则判断数据属性特征达到第一特征条件,将所述第一数据集发布至所述第一请求端;
所述基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件,包括:
若判断仅存在第一数据条数量,不存在第二数据条数量,则将第一数据条数量作为第一差异数量;
若判断同时存在第一数据条数量和第二数据条数量,且第一数据条数量大于等于最小数据条数量,则根据第一数据条数量和第二数据条数量进行综合计算,得到第一差异数量,通过以下公式计算第一差异数量,
Figure 645188DEST_PATH_IMAGE001
其中,
Figure 232158DEST_PATH_IMAGE002
为最小数据条数量,
Figure 97346DEST_PATH_IMAGE003
为第一差异数量,
Figure 173886DEST_PATH_IMAGE004
为第一数据条数量,
Figure 835943DEST_PATH_IMAGE005
为第一数据条权重,
Figure 288921DEST_PATH_IMAGE006
为第二数据条数量,
Figure 211878DEST_PATH_IMAGE007
为第二数据条权重;
若判断第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件。
2.根据权利要求1所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比,包括:
统计第一新增数据标签在第
Figure 193740DEST_PATH_IMAGE008
种的数据属性标识的新增数量,以及第一减少数据标签具在第
Figure 467727DEST_PATH_IMAGE008
种的数据属性标识的减少数量;
统计所有数据属性标识的数量得到属性种类总数量,根据所述属性种类总数量得到属性占比调整趋势值;
根据第
Figure 193237DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识的新增数量、减少数量进行初步计算,得到第
Figure 501859DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步占比值与0.5比对得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调整,得到第
Figure 185781DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比。
3.根据权利要求2所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述根据第
Figure 410046DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量、所有数据属性标识的新增数量、减少数量进行初步计算,得到第
Figure 408089DEST_PATH_IMAGE008
种数据属性标识的初步占比值,将初步占比值与0.5比对得到比对结果,根据比对结果、属性占比调整趋势值对初步占比值进行调整,得到第
Figure 305638DEST_PATH_IMAGE008
种的数据属性标识的属性特征占比,包括:
Figure 894882DEST_PATH_IMAGE008
种数据属性标识的新增数量、减少数量分别进行加权处理,除以所有数据属性标识的新增数量、减少数量,得到第
Figure 205777DEST_PATH_IMAGE008
种数据属性标识的初步占比值;
通过以下公式计算第
Figure 538670DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 25146DEST_PATH_IMAGE009
其中,
Figure 316450DEST_PATH_IMAGE010
为第
Figure 724429DEST_PATH_IMAGE008
种的数据属性标识的初步占比值,
Figure 392170DEST_PATH_IMAGE011
Figure 201995DEST_PATH_IMAGE008
种数据属性标识的新增数量,
Figure 664200DEST_PATH_IMAGE012
为新增数量的权重,
Figure 90633DEST_PATH_IMAGE013
Figure 358804DEST_PATH_IMAGE008
种数据属性标识的减少数量,
Figure 819872DEST_PATH_IMAGE014
为减少数量的权重,
Figure 187399DEST_PATH_IMAGE015
Figure 569970DEST_PATH_IMAGE016
种数据属性标识的新增数量,
Figure 48356DEST_PATH_IMAGE017
为新增数量所对应的数据属性标识的种类的上限值,
Figure 623651DEST_PATH_IMAGE018
Figure 489976DEST_PATH_IMAGE019
种数据属性标识的减少数量,
Figure 891001DEST_PATH_IMAGE020
为减少数量所对应的数据属性标识的种类的上限值;
若初步占比值小于0.5,则根据属性占比调整趋势值对初步占比值进行增大调整得到属性特征占比,若初步占比值大于0.5,则根据属性占比调整趋势值对初步占比值进行减小调整得到属性特征占比;
通过以下公式计算第
Figure 438657DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 874318DEST_PATH_IMAGE021
Figure 521331DEST_PATH_IMAGE022
其中,
Figure 940811DEST_PATH_IMAGE023
为第
Figure 26578DEST_PATH_IMAGE008
种数据属性标识的属性特征占比,
Figure 582325DEST_PATH_IMAGE024
为属性种类总数量,
Figure 196977DEST_PATH_IMAGE025
为预设种类数量,
Figure 775857DEST_PATH_IMAGE026
为种类数量归一化值。
4.根据权利要求2所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述S4包括:
若所有的数据属性标识的属性占比均不位于预设占比区间内,则判断数据属性特征未达到第一特征条件;
将非最大的所有数据属性标识作为待增加的噪音属性标识,根据所述第一差异数量、噪音增加比例计算噪音数据数量;
根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量。
5.根据权利要求4所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述根据所述噪音属性标识的数量生成噪音分配子比例,根据所述噪音数据数量、噪音分配子比例进行计算,得到每种噪音属性标识所对应的噪音属性特征的噪音子数量,包括:
统计所有的噪音属性标识的数量,随机生成每种噪音属性标识对应的噪音分配子比例,通过以下公式计算每种噪音属性标识所对应的噪音属性特征的噪音子数量,
Figure 399736DEST_PATH_IMAGE027
Figure 809989DEST_PATH_IMAGE028
其中,
Figure 189018DEST_PATH_IMAGE029
为噪音数据数量,
Figure 51931DEST_PATH_IMAGE030
为噪音增加比例,
Figure 479502DEST_PATH_IMAGE031
为第
Figure 744261DEST_PATH_IMAGE032
种噪音属性标识所对应的噪音属性特征的噪音子数量,
Figure 169557DEST_PATH_IMAGE033
为第
Figure 248329DEST_PATH_IMAGE032
种噪音属性标识所对应的噪音分配子比例;
若所有的噪音子数量之和大于噪音数据数量,则将噪音子数量之和所得到的噪音数据数量对先前的噪音数据数量更新处理。
6.根据权利要求5所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述S5包括:
对所选取的任意一个新增数据条按照噪音数据数量进行复制处理,得到复制数据条,调取数据库中的预设名称对复制数据条的名称进行替换调整;
将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端。
7.根据权利要求6所述的基于差分隐私策略的多属性数据发布方法,其特征在于,
所述将所有复制数据条所对应的数据属性特征依次替换为噪音属性特征,将复制数据条插入至第一数据集内,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端,包括:
提取新增数据内所有第一新增数据标签的最小序号和最大序号,生成相对应的序号段,随机提取序号段中与噪音数据数量相对应数量的序号作为插入序号,为每个复制数据条分配插入序号;
按照所述插入序号将复制数据条插入至第一数据集内相同序号第一数据条后部,在判断所有复制数据条分别插入至第一数据集内后,对所有的复制数据条、第一数据条的序号进行更新处理,得到相对应的第三数据集。
8.基于差分隐私策略的多属性数据发布系统,其特征在于,包括:
获取模块,用于在判断接收到第一请求端的第一发布请求时,获取与第一发布请求单元内相对应的数据存储单元内的第一数据集,确定数据存储单元内先前发送至第一请求端或第二请求端的第二数据集;
比对模块,用于将所述第一数据集内的第一数据条与第二数据集内的第二数据条进行比对,得到新增数据集,获取所述新增数据集内所有新增数据条的第一数据条数量以及每个新增数据条的数据属性特征;
第一发布模块,用于基于新增数据集得到第一差异数量,若判断所述第一差异数量达到第一数量条件和数据属性特征达到第一特征条件,则将所述第一数据集发布至所述第一请求端;
生成模块,用于若判断所述第一差异数量达到第一数量条件,且数据属性特征未达到第一特征条件,则根据所述第一差异数量、所有新增数据条的数据属性特征生成噪音数据数量、噪音属性特征;
第二发布模块,用于根据所述噪音数据数量、噪音属性特征对所述第一数据集进行更新,得到相对应的第三数据集,将所述第三数据集发布至所述第一请求端;
所述获取模块用于:
提取所述第一发布请求所对应的请求标签,根据所述请求标签确定至少一个数据存储单元,每个请求标签具有与其预先对应设置的数据存储单元;
遍历所述数据存储单元内满足预设要求的数据条得到第一数据集,所述第一数据集内的数据条具有与其对应的第一数据标签,统计所有的第一数据标签得到第一标签列表;
获取与所确定的数据存储单元对应的数据发布记录表,所述数据发布记录表中具有每次发布时的发布时间信息、发布起始数据条的起始数据标签、发布终止数据条的终止数据标签;
选取与当前时刻最接近的发布时间信息作为第一发布时间信息,根据第一发布时间信息的起始数据标签、终止数据标签生成第二标签列表,统计数据存储单元内第二标签列表所对应的所有数据条得到第二数据集;
所述比对模块用于:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表;
统计数据存储单元内所有的第一新增标签列表对应的数据条,得到新增数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识;
所述比对模块用于:
将第一标签列表与所述第二标签列表进行比对,若判断第一标签列表的所有第一数据标签不完全包含第二标签列表的第二数据标签,则确定第一标签列表内具有、第二标签列表内不具有的第一数据标签,得到第一新增标签列表,确定第一标签列表内不具有、第二标签列表内具有的第二数据标签,得到第一减少标签列表;
统计数据存储单元内第一新增标签列表对应的所有的数据条,得到新增数据集,统计数据存储单元内第一减少标签列表对应的所有的数据条,得到减少数据集;
获取所述数据存储单元内的数据条的数据属性种类,根据所述数据属性种类得到相对应的多个数据属性特征,每个数据属性种类具有与其对应的多个数据属性特征;
统计第一新增标签列表内第一新增数据标签的数量得到第一数据条数量,以及第一新增标签列表内每个第一新增数据标签所对应的数据属性特征,使得每个第一新增数据标签具有相对应的数据属性标识;
统计第一减少标签列表内第一减少数据标签的数量得到第二数据条数量,以及第一减少标签列表内每个第一减少数据标签所对应的数据属性特征,使得每个第一减少数据标签具有相对应的数据属性标识;
所述第一发布模块用于:
基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件;
获取所有的第一新增数据标签的数据属性标识和/或第一减少数据标签具有的数据属性标识,根据每个数据属性标识所对应的数据属性特征,得到相对应的属性特征占比;
根据数据属性特征的数量、不同类型的数据属性特征的属性特征占比进行计算,得到每种数据属性特征的融合属性占比,若所述融合属性占比位于预设占比区间内,则判断数据属性特征达到第一特征条件,将所述第一数据集发布至所述第一请求端;
所述基于第一数据条数量和/或第二数据条数量进行综合计算得到第一差异数量,若所述第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件,包括:
若判断仅存在第一数据条数量,不存在第二数据条数量,则将第一数据条数量作为第一差异数量;
若判断同时存在第一数据条数量和第二数据条数量,且第一数据条数量大于等于最小数据条数量,则根据第一数据条数量和第二数据条数量进行综合计算,得到第一差异数量,通过以下公式计算第一差异数量,
Figure 214010DEST_PATH_IMAGE001
其中,
Figure 333276DEST_PATH_IMAGE002
为最小数据条数量,
Figure 257370DEST_PATH_IMAGE003
为第一差异数量,
Figure 766980DEST_PATH_IMAGE004
为第一数据条数量,
Figure 5194DEST_PATH_IMAGE005
为第一数据条权重,
Figure 775704DEST_PATH_IMAGE006
为第二数据条数量,
Figure 480486DEST_PATH_IMAGE007
为第二数据条权重;
若判断第一差异数量大于等于第一预设数量,则判断第一差异数量达到第一数量条件。
CN202211231173.5A 2022-10-10 2022-10-10 基于差分隐私策略的多属性数据发布方法及系统 Active CN115329898B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211231173.5A CN115329898B (zh) 2022-10-10 2022-10-10 基于差分隐私策略的多属性数据发布方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211231173.5A CN115329898B (zh) 2022-10-10 2022-10-10 基于差分隐私策略的多属性数据发布方法及系统

Publications (2)

Publication Number Publication Date
CN115329898A CN115329898A (zh) 2022-11-11
CN115329898B true CN115329898B (zh) 2023-01-24

Family

ID=83914033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211231173.5A Active CN115329898B (zh) 2022-10-10 2022-10-10 基于差分隐私策略的多属性数据发布方法及系统

Country Status (1)

Country Link
CN (1) CN115329898B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114218602A (zh) * 2021-12-10 2022-03-22 南京航空航天大学 一种基于垂直分割的差分隐私异构多属性数据发布方法
CN115033915A (zh) * 2022-06-06 2022-09-09 大连理工大学 一种基于生成对抗网络的敏感标签轨迹数据差分隐私发布方法
CN115114664A (zh) * 2022-06-24 2022-09-27 浙江大学 一种面向图数据的差分隐私保护发布方法及系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105512247B (zh) * 2015-11-30 2019-03-08 上海交通大学 基于一致性特征的非交互式差分隐私发布模型的优化方法
CN108009437B (zh) * 2016-10-27 2022-11-22 中兴通讯股份有限公司 数据发布方法和装置及终端
CN107871087B (zh) * 2017-11-08 2020-10-30 广西师范大学 分布式环境下高维数据发布的个性化差分隐私保护方法
CN109376549B (zh) * 2018-10-25 2021-09-10 广州电力交易中心有限责任公司 一种基于差分隐私保护的电力交易大数据发布方法
US11386983B2 (en) * 2019-02-19 2022-07-12 International Business Machines Corporation Preserving privacy for data analysis
US20220019689A1 (en) * 2020-07-14 2022-01-20 Apple Inc. Privacy Preserving Server-Side Personalized Content Selection
CN112052475A (zh) * 2020-08-05 2020-12-08 西安电子科技大学 一种用于局部差异隐私下的边际释放的一致自适应边际
CN112417500B (zh) * 2020-11-18 2024-07-19 华南师范大学 一种隐私保护的数据流统计发布方法
CN113614726A (zh) * 2021-06-10 2021-11-05 香港应用科技研究院有限公司 对联邦学习系统的动态差异隐私
CN113127931B (zh) * 2021-06-18 2021-09-03 国网浙江省电力有限公司信息通信分公司 基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法
CN114092729A (zh) * 2021-09-10 2022-02-25 南方电网数字电网研究院有限公司 基于聚类匿名化与差分隐私保护的异构用电数据发布方法
CN113591133B (zh) * 2021-09-27 2021-12-24 支付宝(杭州)信息技术有限公司 基于差分隐私进行特征处理的方法及装置
CN114662152B (zh) * 2022-04-06 2023-05-12 安徽工业大学 一种面向实时数据的本地化差分隐私数据流发布方法
CN114968336A (zh) * 2022-05-30 2022-08-30 平安科技(深圳)有限公司 应用灰度发布方法、装置、计算机设备及存储介质
CN115098882B (zh) * 2022-06-20 2024-08-06 山东大学 基于增量学习的本地差分隐私的多维数据发布方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114218602A (zh) * 2021-12-10 2022-03-22 南京航空航天大学 一种基于垂直分割的差分隐私异构多属性数据发布方法
CN115033915A (zh) * 2022-06-06 2022-09-09 大连理工大学 一种基于生成对抗网络的敏感标签轨迹数据差分隐私发布方法
CN115114664A (zh) * 2022-06-24 2022-09-27 浙江大学 一种面向图数据的差分隐私保护发布方法及系统

Also Published As

Publication number Publication date
CN115329898A (zh) 2022-11-11

Similar Documents

Publication Publication Date Title
US10346620B2 (en) Systems and methods for authentication of access based on multi-data source information
EP2617016B1 (de) Verfahren für die bearbeitung von banknoten
CN109582550B (zh) 一种获取全量业务场景故障集合的方法、装置及服务器
CN107633257B (zh) 数据质量评估方法及装置、计算机可读存储介质、终端
CN109474923B (zh) 对象识别方法及装置、存储介质
CN109461053B (zh) 多推荐渠道的动态分流方法、电子装置及存储介质
CN112037049B (zh) 银行卡收费方法及装置
CN110020099A (zh) 一种视频交友的用户推荐方法和装置
CN109428760B (zh) 一种基于运营商数据的用户信用评估方法
CN109889905A (zh) 一种主播综合价值评估方法、存储介质、设备及系统
CN102521713B (zh) 数据处理装置和数据处理方法
CN115329898B (zh) 基于差分隐私策略的多属性数据发布方法及系统
CN108066990A (zh) 一种从候选用户列表中选择用户的方法、装置及服务器
CN109308770B (zh) 一种银行数据处理方法、装置以及系统
CN108259363B (zh) 一种阶梯式业务流量控制的方法及装置
DE60128059T2 (de) Verfahren und Erzeugnis zum Bereitstellen einer Service-to-role-zuweisung um Anwendungsdienste in einem auf Rollen basierten Rechnersystem aufzurufen
CN105894247A (zh) 工单处理方法及装置
CN115292613A (zh) 线上帖评的内容滤差方法、系统和装置
CN109634741A (zh) 资源分配方法及装置
DE102005059139A1 (de) Verfahren zum Verknüpfen eines digitalen Inhalts mit einer Person
CN108074026A (zh) 核保任务分配的方法和装置
CN115700565A (zh) 横向联邦学习方法及装置
DE112012002268B4 (de) Modifizieren von Paketen zum Einsparen von Speicherplatz
Bojcevski et al. Roll of a farm accountancy data networks (FADN) in agricultural sector in Serbia
CN112291625A (zh) 信息质量处理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant