CN111222164B - 联盟链数据发布的隐私保护方法 - Google Patents

联盟链数据发布的隐私保护方法 Download PDF

Info

Publication number
CN111222164B
CN111222164B CN202010026466.4A CN202010026466A CN111222164B CN 111222164 B CN111222164 B CN 111222164B CN 202010026466 A CN202010026466 A CN 202010026466A CN 111222164 B CN111222164 B CN 111222164B
Authority
CN
China
Prior art keywords
attribute
transaction
cluster
array
representing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010026466.4A
Other languages
English (en)
Other versions
CN111222164A (zh
Inventor
李先贤
蒋权
王利娥
石贞奎
刘鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruihang Zhizhen Technology Co ltd
Original Assignee
Guangxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Normal University filed Critical Guangxi Normal University
Priority to CN202010026466.4A priority Critical patent/CN111222164B/zh
Publication of CN111222164A publication Critical patent/CN111222164A/zh
Application granted granted Critical
Publication of CN111222164B publication Critical patent/CN111222164B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种联盟链数据发布的隐私保护方法,首先对原始数据进行预处理,使得数据易于后续操作并且对标识属性进行加密;然后在聚类分组阶段中交易按属性进行聚类,使得属性相似的记录分到一组,最后基于分组等价类进行属性概化,使得每一个组在属性上取值相同,从而保护区块链使用者的身份隐私和交易隐私。

Description

联盟链数据发布的隐私保护方法
技术领域
本发明涉及数据隐私保护技术领域,具体涉及一种联盟链数据发布的隐私保护方法。
背景技术
从2008年中本聪发明比特币以来,区块链得到飞速的发展,它使得众多互不信任的用户能在没有可信第三方的情况下对某些交易或事务达成共识,可以解决中心化系统中普遍存在的高成本、低效率和数据存储不安全等问题。除了在加密货币的应用外,区块链还在金融、医疗、物联网等各行各业得到了得到了应用。可以说区块链的发展为分布式系统的发展提供了新的思路。
根据实际应用场景和需求,区块链可以分为三类:公有链、联盟链、和私有链。公有链上的各个节点可以自由加入和退出网络,任何节点无需许可即可参与链上的交易和共识,网络中不存在任何中心化的服务端节点。比特币和以太坊都是典型的公有链,同时也是使用率最多的区块链。私有链中各个节点的写入权限由内部控制,读取权限视需求有选择性地对外开放。联盟链的各个节点通常有与之对应的实体机构组织,通过授权后才能加入与退出网络,本质上联盟链也是一种私有链。
在当今的大数据时代,政府、科研人员、企业都对大数据投入了大量的精力,收集大数据信息,挖掘在大数据中的价值,成为了热点。现大数据已经涉及社会发展、经济繁荣、国家安全、群众生活、技术进步等各个领域的各个方面,有诸多应用场景。政府使用大数据了解各地发展状况;监管部门利用大数据统计社会治安状况;企业利用大数据对市场进行分析,调整自己的经营策略。当前,比特币和以太坊等公有链已经上线多年,大量用户参与其中,同时也产生了海量的交易记录,目前仅比特币的区块数据总大小已经超过200Gb,通过对这些数据进行分析可以帮助我们理解区块链的生态系统。目前联盟链管理者由于隐私等原因不发布其中的数据,这就造成巨大的信息浪费,例如在金融联盟链中,数据收集者和研究人员可以通过对大量的交易记录进行分析,分析结果可以帮助管理者了解企业的经营情况从而适当地调整经营策略,投资者也可以从这些数据得到一部分参考以便做出相应的决策。但是如果直接发布区块链中的信息可能会造成信息的泄漏,因为在攻击者可以根据背景知识结合发布在区块链上面的信息获取到用户的历史交易记录。例如攻击者如果知道Alice在t时刻使用区块链进行了一笔交易,价值为v,那么攻击者只需要在区块链上面查找符合条件的交易就可以找出对应的交易以及被攻击者的区块链账号,这样就造成了隐私的泄露。总的来说,区块链中的隐私问题包括2个方面,其中区块链用户的现实身份和区块链地址之间的关联性称为身份隐私,区块链用户所属的全部区块链地址在区块链中的交易行为称为交易隐私。
目前也有关于区块链隐私保护的方法,但是这些方案主要是针对比特币等公有链的,目前主流的方法主要包括混币和零知识证明,其中混币还可以包括中心化的混币的混币和去中心化的混币,不管是混币还是零知识证明,目前公有链的匿名方法都必须通过修改区块链本身的共识算法或验证方法达到目的,但是这类方法大大降低了区块链的性能,这在联盟链很多场景下是不可接受的。
发明内容
本发明提供一种联盟链数据发布的隐私保护方法,其能够使得区块链数据能得到合理运用的同时,区块链参与者的隐私得到保障。
为解决上述问题,本发明是通过以下技术方案实现的:
联盟链数据发布的隐私保护方法,包括步骤如下:
步骤1、将区块链中的交易从区块里提取出来,并对所提取的交易进行预处理,即去掉每条交易记录中与与交易不相关的属性,且对交易记录中的所有标识属性进行匿名后,组成原始交易记录集合;
步骤2、计算原始交易记录集合中每2条交易记录的距离,得到原始交易记录集合的距离矩阵;其中2个交易记录tp和tq之间的距离dist(tp,tq)为:
Figure BDA0002362655080000021
其中,
Figure BDA0002362655080000022
代表交易记录tp和tq在准标识属性s上的差异度,m代表每条交易记录中的准标识属性数目;
步骤3、基于步骤2所得到的原始交易记录集合的距离矩阵,采用基于k-medoids的聚类算法对原始交易记录集合内的交易记录进行聚类,得到包含有若干个聚类的聚类交易记录集合;
步骤4、对聚类交易记录集合的每个聚类中的所有交易记录的准标识属性进行概化,使得属于同一个聚类的所有交易记录在准标识属性上拥有相同的取值,以得到匿名后的交易记录集合;
步骤5、发布步骤4所得的匿名后的交易记录集合。
上述步骤1中,交易记录中的标识属性为交易id和区块链地址。
上述步骤2中,交易记录tp和tq在准标识属性s上的差异度分为2种情况:
1)当准标识属性s是数值型数据属性时,两个交易tp和tq在准标识属性s上的差异度
Figure BDA0002362655080000023
为:
Figure BDA0002362655080000024
其中,
Figure BDA0002362655080000025
代表交易记录tp的准标识属性s的属性值,
Figure BDA0002362655080000026
代表交易记录tq的准标识属性s的属性值,
Figure BDA0002362655080000031
代表原始交易记录集合内所有交易记录中准标识属性s的最大属性值,
Figure BDA0002362655080000032
代表原始交易记录集合内所有交易记录中准标识属性s的最小属性值;
2)当准标识属性s是分类型数据属性时,两个交易tp和tq在准标识属性s上的差异度
Figure BDA0002362655080000033
为:
Figure BDA0002362655080000034
其中,
Figure BDA0002362655080000035
代表交易记录tp和tq准标识属性s在s属性的属性概化树上的最小上界节点,
Figure BDA0002362655080000036
代表交易记录tp的准标识属性s在s属性的属性概化树上所对应的节点,
Figure BDA0002362655080000037
代表交易记录tq的准标识属性s在s属性的属性概化树上所对应的节点,
Figure BDA0002362655080000038
代表s属性的属性概化树上的最外层叶子节点,
Figure BDA0002362655080000039
代表s属性的属性概化树上的根节点,
Figure BDA00023626550800000310
代表s属性的属性概化树上节点
Figure BDA00023626550800000311
到节点
Figure BDA00023626550800000312
的距离,
Figure BDA00023626550800000313
代表s属性的属性概化树上节点
Figure BDA00023626550800000314
到节点
Figure BDA00023626550800000315
的距离,
Figure BDA00023626550800000316
代表s属性的属性概化树上最外层叶子节点
Figure BDA00023626550800000317
到根节点
Figure BDA00023626550800000318
的距离。
上述步骤3的具体过程如下:
步骤3.1、构建队列Q、数组T*和数组V,其中队列Q用于存放要划分的聚类,数组T*用于存放交易记录个数大于等于k的聚类,数组V用户存放交易记录个数小于k的聚类;其中k为设定值;
步骤3.2、将队列Q初始化为原始交易记录集合T,并将数组T*和数组V初始为空集;
步骤3.3、从队列Q中取出一个聚类C,使用k-mediods算法将C划分为两个聚类C1和C2,并用|C1|表示聚类C1中记录的个数,|C2|表示聚类C2中记录的个数;
1)如果|C1|<k且|C2|<k,停止对聚类C继续划分,并且将聚类C加入数组T*中;
2)如果|C1|>=k且|C2|>=k,继续对聚类C1和聚类C2进行划分,将聚类C1和聚类C2入队列Q;
3)如果|C1|>=k且|C2|<k,继续对聚类C1进行划分,停止对聚类C2进行划分,将聚类C1加入队列Q,聚类C2加入数组V中;
步骤3.4、重复执行步骤3.3,直到队列Q为空;
步骤3.5、将数组V中的聚类合并到数组T*中,用|T*|代表数组T*中聚类的数量;
步骤3.6、将数组T*作为聚类交易记录集合输出。
上述步骤3.5中将数组V中的聚类合并到数组T*中的具体方法是:对于数组V中每一个聚类CV,首先计算聚类CV到数组T*中的每一个聚类CT*的距离,再将聚类CV中的所有记录合并到最小距离对应的聚类CT*中。
与现有技术相比,本发明首先对原始数据进行预处理,使得数据易于后续操作并且对标识属性进行加密;然后在聚类分组阶段中交易按属性进行聚类,使得属性相似的记录分到一组,最后基于分组等价类进行属性概化,使得每一个组在属性上取值相同,从而保护区块链使用者的身份隐私和交易隐私。此外,本发明针对区块链里面的交易记录不同于传统的数据库数据类型,在这种数据类型中没有明显的敏感属性和准标识属性的区分,并且交易和交易之间是有关联性的,本发明使用k-匿名模型对区块链中的交易记录进行匿名,使得攻击者利用背景知识关联到任意一条交易记录的概率不超过1/k,从而保护与这条交易相关的个体身份的隐私信息。
附图说明:
图1为属性概化树的示例图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,对本发明进一步详细说明。
一种联盟链数据发布的隐私保护方法,其具体实现过程包括步骤如下:
步骤1、提取区块链中的交易记录,并对交易记录进行预处理。
1)提取交易:
区块链中的数据是以区块为单位存储的,每隔一段时间,网络中的交易被拥有记账权的矿工打包到区块中,每一个区块中都包含若干个交易。在预处理阶段首先将交易从区块里提取出来,在后面的匿名步骤以及数据发布中,均以交易为单位进行处理。假设待发布的交易记录的集合为T,总共包含的共有n条交易记录。
2)去掉一些额外的属性:
由于发布的数据中主要是交易相关的属性,而在区块链中有一些与交易不相关的属性是不需要发布的(比如区块链中的配置信息,与区块相关的属性,以及交易输入里面包含的交易方的签名信息等),因此在进行匿名步骤之前首先去掉这些交易不相关的属性。
3)匿名交易的标识属性:
在每个交易记录中,包括标识属性和准标识属性,其中标识属性是指交易记录中能够唯一标识该交易记录的属性,即只需要这一个标识属性就可以确定是某一交易记录。准标识属性是指一个特殊的属性组,联合准标识属性可以用于推断一个具体记录的相关信息。
由于在交易记录中,交易id和区块链地址都是标识属性,其中交易id能唯一标识一个交易记录。区块链地址能唯一标识一个用户在区块链中的身份,包括输入地址和输出地址,因此需要对交易id和区块链地址进行匿名。
在保护区块链地址隐私的时候,暂时不考虑输入这个属性,因为交易的所有输入都是指向上一个交易的输出,因此只要对所有交易的输出进行匿名,所有的区块链地址都会得到匿名。
对每个交易的交易id和区块链地址这两个属性做匿名处理的方法是对于一个交易的交易id和这个交易输出的所有输出地址进行加密和哈希的操作。
Figure BDA0002362655080000051
表1预处理后的交易
如表1所示,假设表中的交易id和输出地址已经经过匿名处理。其中交易输入代表交易的发起方,交易输出代表交易金额的接收方。在区块链中,一个交易的输入输出可以包多条记录。在表1中,交易id35包含2个输入和2个输出。输入没有单独的取值,而是指向上一个交易的输出,表明输入的来源,每个输入指向某一个交易id的多个输出中的其中一个。输出包含两个属性,其中一个为交易地址,表示收款方的地址,另外一个是交易金额,表中id35中输出1的输出地址为address 20,输出金额为32.5。另外,区块链中的时间通常使用unix时间戳表示,如表中所示。
步骤2、遍历交易记录集合T的交易记录,并计算每2条交易记录的距离,得到该交易记录集合T的距离矩阵。
假设每条交易记录中的准标识属性数为m。假如有2个交易记录tp和tq,则tp和tq之间的距离dist(tp,tq)定义为所有准标识属性差异度的平均值,即为:
Figure BDA0002362655080000052
其中,
Figure BDA0002362655080000053
代表交易记录tp和tq在准标识属性s上的差异度,m代表每条交易记录中的准标识属性数目。
而关于2个交易记录tp和tq在准标识属性s上差异度,则可以分为数值型属性和分类型属性两种情况进行考虑,其中数值型数据指的是年龄、薪酬等这类属性值为数值的属性;分类型属性指职业、爱好等这类属性值离散的属性:
1)当准标识属性s是数值型数据的情况时,两个交易tp和tq在准标识属性s上的差异度
Figure BDA0002362655080000061
定义为:
Figure BDA0002362655080000062
其中,
Figure BDA0002362655080000063
代表交易记录tp的准标识属性s的属性值,
Figure BDA0002362655080000064
代表交易记录tq的准标识属性s的属性值,
Figure BDA0002362655080000065
代表原始交易记录集合内所有交易记录中准标识属性s的最大属性值,
Figure BDA0002362655080000066
代表原始交易记录集合内所有交易记录中准标识属性s的最小属性值;
2)当准标识属性s是分类型数据的情况时,两个交易tp和tq在准标识属性s上的差异度
Figure BDA0002362655080000067
定义为:
Figure BDA0002362655080000068
其中,
Figure BDA0002362655080000069
代表交易记录tp和tq准标识属性s在s属性的属性概化树上的最小上界节点,
Figure BDA00023626550800000610
代表交易记录tp的准标识属性s在s属性的属性概化树上所对应的节点,
Figure BDA00023626550800000611
代表交易记录tq的准标识属性s在s属性的属性概化树上所对应的节点,
Figure BDA00023626550800000612
代表s属性的属性概化树上的最外层叶子节点,
Figure BDA00023626550800000613
代表s属性的属性概化树上的根节点,
Figure BDA00023626550800000614
代表s属性的属性概化树上节点
Figure BDA00023626550800000615
到节点
Figure BDA00023626550800000616
的距离,
Figure BDA00023626550800000617
代表s属性的属性概化树上节点
Figure BDA00023626550800000618
到节点
Figure BDA00023626550800000619
的距离,
Figure BDA00023626550800000620
代表s属性的属性概化树上最外层叶子节点
Figure BDA00023626550800000621
到根节点
Figure BDA00023626550800000622
的距离。
s个属性概化树是利用交易记录集合T中所有交易记录中的s属性的属性值所构建。图1是属性概化树的示例图,图中,叶子节点代表属性的实际取值,父节点是子结点概化后的值。例如对苹果和梨这两个属性来说,它们的最小上界节点是蔷薇科,这里
Figure BDA00023626550800000623
取值为苹果,
Figure BDA00023626550800000624
取值为梨,
Figure BDA00023626550800000625
取值为蔷薇科,则有
Figure BDA00023626550800000626
则有
Figure BDA00023626550800000627
Figure BDA00023626550800000628
为2,计算可得差异度为1/2。
使用上面的距离计算公式可以得出交易记录集合T内所有交易记录之间的距离,得到距离矩阵。
步骤3、基于步骤2所得到的交易记录集合T距离矩阵,对交易记录集合T内的交易记录进行聚类,本发明采用基于k-medoids的聚类算法对交易记录进行划分,基本思想是每次将数据集划分为两个聚类,如果这两个聚类满足k-匿名,就继续对聚类进行划分,否则,停止划分。
在本步骤中,使用了三个数据结构Q、T*和V。其中Q是一个队列,存放要划分的聚类;T*是一个数组,存放交易记录个数大于等于k的聚类;V是一个数组,存放交易记录个数小于k的聚类。
步骤3.1、先对Q、T*和V进行初始化。Q初始化为T,T*和V初始为空集。
步骤3.2、从队列Q中取出一个聚类C,使用k-mediods算法将C划分为两个聚类C1和C2。用|C1|表示C1中记录的个数,|C2|表示C2中记录的个数。
步骤3.3、根据|C1|和|C2|的取值分三种情况:
1)如果|C1|<k且|C2|<k,停止对C继续划分,并且将C加入数组T*中;
2)如果|C1|>=k且|C2|>=k,继续对C1和C2进行划分,将C1和C2入队列Q;
3)如果|C1|和|C2|有一个大于等于k,一个小于k,不妨设|C1|>=k且|C2|<k,继续对C1进行划分,停止对C2进行划分,将C1加入队列Q,C2加入数组V中。
步骤3.4、重复执行步骤3.2和步骤3.3,直到队列Q为空。
步骤3.5、将V中的聚类合并到T*中,用|T*|代表T*中聚类的数量。具体方法:对于V中每一个聚类CV,计算CV到T*中的每一个聚类CT*的距离(这里CV和CT*的距离定义为CV的聚类中心到CT*的聚类中心的距离),这样得到|T*|个距离,将CV中的所有记录合并到最小距离对应的CT*中。
Figure BDA0002362655080000071
表2分组之后的表
表2是表1经过分组之后的表,其中id35和id38对应的交易记录被分到同一组中,id36和id37对应的交易记录被分到同一组中,其中,k=2。
例如在表2中,准标识属性为时间,商品类型,商品数量,输出。其中id35对应的交易输出包含2项,金额之和为2者之和54.0,则在聚类时这个交易的准标识属性取值为(1573525784,苹果,200,54.0)。
经过上面的聚类之后,T*中包含若干个聚类,每个聚类至少包含了k个交易记录。
步骤4、把每个聚类中的交易记录的准标识属性进行概化,在经过概化后,属于同一个聚类的所有记录在准标识属性上拥有相同的取值。具体来说概化也要分为数值型数据和分类型数据两种不同的情况进行处理。
在概化数值型属性时,对于T*中的某个聚类Ci(i=1,2,…,|T*|),假设Ci中数值型属性Sx的取值为集合为A[Sx],则将Ci中的所有记录的Sx属性上的值概化为[min(A[Sx]),max(A[Sx])];
对于分类型属性,需要按照预先建立的属性概化树进行概化,各个属性值被概化为可以概括各原有属性值的范围更广的最小类型值,从概化树上看,就是多个原节点的最小上界节点,例如,在图1中,对于苹果和梨来说,可以概括这两个属性的值是蔷薇科。如果有三个属性苹果、梨和香蕉,则概化为水果。
Figure BDA0002362655080000081
表3概化之后的表
表3是表2经过概化后的表,经过概化后得到了一个2-匿名的表。
步骤5、数据发布
上面的步骤已经对交易进行了匿名处理,在这一步骤发布交易信息,每隔一个固定的时间发布在这个时间段生成的所有区块包含的所有交易信息。
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。

Claims (3)

1.联盟链数据发布的隐私保护方法,其特征是,包括步骤如下:
步骤1、将区块链中的交易从区块里提取出来,并对所提取的交易进行预处理,即去掉每条交易记录中与交易不相关的属性,且对交易记录中的所有标识属性进行匿名后,组成原始交易记录集合;
步骤2、计算原始交易记录集合中每2条交易记录的距离,得到原始交易记录集合的距离矩阵;其中2个交易记录tp和tq之间的距离dist(tp,tq)为:
Figure FDA0003502117750000011
其中,
Figure FDA0003502117750000012
代表交易记录tp和tq在准标识属性s上的差异度,m代表每条交易记录中的准标识属性数目;
上述交易记录tp和tq在准标识属性s上的差异度分为2种情况:
1)当准标识属性s是数值型数据属性时,两个交易tp和tq在准标识属性s上的差异度
Figure FDA0003502117750000013
为:
Figure FDA0003502117750000014
其中,
Figure FDA0003502117750000015
代表交易记录tp的准标识属性s的属性值,
Figure FDA0003502117750000016
代表交易记录tq的准标识属性s的属性值,
Figure FDA0003502117750000017
代表原始交易记录集合内所有交易记录中准标识属性s的最大属性值,
Figure FDA0003502117750000018
代表原始交易记录集合内所有交易记录中准标识属性s的最小属性值;
2)当准标识属性s是分类型数据属性时,两个交易tp和tq在准标识属性s上的差异度
Figure FDA0003502117750000019
为:
Figure FDA00035021177500000110
其中,
Figure FDA00035021177500000111
代表交易记录tp和tq准标识属性s在s属性的属性概化树上的最小上界节点,
Figure FDA00035021177500000112
代表交易记录tp的准标识属性s在s属性的属性概化树上所对应的节点,
Figure FDA00035021177500000113
代表交易记录tq的准标识属性s在s属性的属性概化树上所对应的节点,
Figure FDA00035021177500000114
代表s属性的属性概化树上的最外层叶子节点,
Figure FDA00035021177500000115
代表s属性的属性概化树上的根节点,
Figure FDA00035021177500000116
代表s属性的属性概化树上节点
Figure FDA00035021177500000117
到节点
Figure FDA00035021177500000118
的距离,
Figure FDA00035021177500000119
代表s属性的属性概化树上节点
Figure FDA00035021177500000120
到节点
Figure FDA00035021177500000121
的距离,
Figure FDA00035021177500000122
代表s属性的属性概化树上最外层叶子节点
Figure FDA00035021177500000123
到根节点
Figure FDA00035021177500000124
的距离;
步骤3、基于步骤2所得到的原始交易记录集合的距离矩阵,采用基于k-medoids的聚类算法对原始交易记录集合内的交易记录进行聚类,得到包含有若干个聚类的聚类交易记录集合;即:
步骤3.1、构建队列Q、数组T*和数组V,其中队列Q用于存放要划分的聚类,数组T*用于存放交易记录个数大于等于k的聚类,数组V用户存放交易记录个数小于k的聚类;其中k为设定值;
步骤3.2、将队列Q初始化为原始交易记录集合T,并将数组T*和数组V初始为空集;
步骤3.3、从队列Q中取出一个聚类C,使用k-mediods算法将C划分为两个聚类C1和C2,并用|C1|表示聚类C1中记录的个数,|C2|表示聚类C2中记录的个数;
1)如果|C1|<k且|C2|<k,停止对聚类C继续划分,并且将聚类C加入数组T*中;
2)如果|C1|>=k且|C2|>=k,继续对聚类C1和聚类C2进行划分,将聚类C1和聚类C2入队列Q;
3)如果|C1|>=k且|C2|<k,继续对聚类C1进行划分,停止对聚类C2进行划分,将聚类C1加入队列Q,聚类C2加入数组V中;
步骤3.4、重复执行步骤3.3,直到队列Q为空;
步骤3.5、将数组V中的聚类合并到数组T*中,用|T*|代表数组T*中聚类的数量;
步骤3.6、将数组T*作为聚类交易记录集合输出;
步骤4、对聚类交易记录集合的每个聚类中的所有交易记录的准标识属性进行概化,使得属于同一个聚类的所有交易记录在准标识属性上拥有相同的取值,以得到匿名后的交易记录集合;
步骤5、发布步骤4所得的匿名后的交易记录集合。
2.根据权利要求1所述的联盟链数据发布的隐私保护方法,其特征是,步骤1中,交易记录中的标识属性为交易id和区块链地址。
3.根据权利要求1所述的联盟链数据发布的隐私保护方法,其特征是,步骤3.5中将数组V中的聚类合并到数组T*中的具体方法是:对于数组V中每一个聚类CV,首先计算聚类CV到数组T*中的每一个聚类CT*的距离,再将聚类CV中的所有记录合并到最小距离对应的聚类CT*中。
CN202010026466.4A 2020-01-10 2020-01-10 联盟链数据发布的隐私保护方法 Active CN111222164B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010026466.4A CN111222164B (zh) 2020-01-10 2020-01-10 联盟链数据发布的隐私保护方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010026466.4A CN111222164B (zh) 2020-01-10 2020-01-10 联盟链数据发布的隐私保护方法

Publications (2)

Publication Number Publication Date
CN111222164A CN111222164A (zh) 2020-06-02
CN111222164B true CN111222164B (zh) 2022-03-25

Family

ID=70828369

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010026466.4A Active CN111222164B (zh) 2020-01-10 2020-01-10 联盟链数据发布的隐私保护方法

Country Status (1)

Country Link
CN (1) CN111222164B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112508203B (zh) * 2021-02-08 2021-06-15 同盾控股有限公司 基于联邦学习的数据聚类处理方法、装置、设备及介质
CN113450091B (zh) * 2021-06-21 2023-06-02 北京理工大学 一种基于混合器技术的联盟链隐私保护方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106796628A (zh) * 2014-09-03 2017-05-31 陈颂雄 基于合成基因组变体的安全交易设备、系统和方法
CN107358116A (zh) * 2017-06-29 2017-11-17 华中科技大学 一种多敏感属性数据发布中的隐私保护方法
CN107832633A (zh) * 2017-11-22 2018-03-23 广西师范大学 关系事务数据发布的隐私保护方法
CN108027867A (zh) * 2015-07-14 2018-05-11 Fmr有限责任公司 计算高效的转账处理、审计以及搜索装置、方法和系统
CN108959956A (zh) * 2018-06-07 2018-12-07 广西师范大学 基于贝叶斯网络的差分隐私数据发布方法
CN110399615A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 交易风险监控方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190108499A1 (en) * 2017-10-09 2019-04-11 Bing Liu Decentralized Digital Token within an App Ecosystem
CN107992621A (zh) * 2017-12-22 2018-05-04 杭州云象网络技术有限公司 一种基于区块链多链技术融合的智能电影产业服务系统
CN108880863B (zh) * 2018-05-26 2021-02-19 江西理工大学 一种基于区块链技术的智能电网设备安全诊断服务系统
CN110555316B (zh) * 2019-08-15 2023-04-18 石家庄铁道大学 基于聚类匿名的隐私保护表数据共享方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106796628A (zh) * 2014-09-03 2017-05-31 陈颂雄 基于合成基因组变体的安全交易设备、系统和方法
CN108027867A (zh) * 2015-07-14 2018-05-11 Fmr有限责任公司 计算高效的转账处理、审计以及搜索装置、方法和系统
CN107358116A (zh) * 2017-06-29 2017-11-17 华中科技大学 一种多敏感属性数据发布中的隐私保护方法
CN107832633A (zh) * 2017-11-22 2018-03-23 广西师范大学 关系事务数据发布的隐私保护方法
CN108959956A (zh) * 2018-06-07 2018-12-07 广西师范大学 基于贝叶斯网络的差分隐私数据发布方法
CN110399615A (zh) * 2019-07-29 2019-11-01 中国工商银行股份有限公司 交易风险监控方法及装置

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Decentralizing Privacy: Using Blockchain to Protect Personal Data;Guy Zyskind等;《网页在线公开:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=7163223&tag=1》;20150720;第1-5页 *
基于医疗联盟链的数据安全保护方法;孙回等;《南京信息工程大学学报》;20191204;第11卷(第5期);第567-572页 *
基于联盟区块链的智能电网数据安全存储与共享系统;吴振铨等;《计算机应用》;20171109;第37卷(第10期);第2742-2747页 *
差分隐私的数据流关键模式挖掘方法;王金艳等;《软件学报》;20190424;第30卷(第3期);第648-666页 *
移动商务推荐系统中的一种基于P2P的隐私保护策略;王利娥等;《计算机科学》;20171020;第44卷(第9期);第178-183页 *

Also Published As

Publication number Publication date
CN111222164A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
JP7292365B2 (ja) ブロックチェーンからのデータのセキュアな抽出のための暗号方法及びシステム
TWI694350B (zh) 基於區塊鏈的資訊監管方法及裝置
CN109117669B (zh) MapReduce相似连接查询的隐私保护方法及系统
Yin et al. An improved anonymity model for big data security based on clustering algorithm
CN111222164B (zh) 联盟链数据发布的隐私保护方法
Nagarajan et al. Blockchain single and interval valued neutrosophic graphs
Zapechnikov Privacy-preserving machine learning as a tool for secure personalized information services
Yadav et al. Big data hadoop: Security and privacy
Ruiz Public-permissioned blockchains as common-pool resources
Liagouris et al. Secrecy: Secure collaborative analytics on secret-shared data
Yu et al. Technology and security analysis of cryptocurrency based on blockchain
Kabulov et al. Systematic analysis of blockchain data storage and sharing technology
CN116628360A (zh) 一种基于差分隐私的社交网络直方图发布方法及装置
CN115729994B (zh) 一种公共数据开发利用的一体化大数据应用方法
Zhu Personal information security environment monitoring and law protection using big data analysis
Wang et al. Towards on blockchain data privacy protection with cryptography and software architecture approach
CN112035884A (zh) 基于区块链技术的金融机具管理云平台
Garg et al. BlockChain and Decentralized Apps
Yu et al. Research on an Intelligent Logistics Blockchain Consensus Algorithm
Ding Research and application of privacy protection technology based on big data environment
Tripathy et al. A classification based framework for privacy preserving data mining
Hu et al. The Tango Between Blockchain and Deep Learning: An Outlook
Sansiya et al. Integrate Hybrid Cloud Computing Server With Automated Remote Monitoring for Blockchain as a Service
Yang et al. A Decision Tree Approach for Assessing and Mitigating Background and Identity Disclosure Risks
Kadhim et al. A Survey of Blockchain From the Perspectives of Architecture and Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230718

Address after: No. 291, Commercial Building 2, Building 1, Jianxiyuan Zhongli, Haidian District, Beijing, 100000

Patentee after: Beijing Ruihang Zhizhen Technology Co.,Ltd.

Address before: 541004 No. 15 Yucai Road, Qixing District, Guilin, the Guangxi Zhuang Autonomous Region

Patentee before: Guangxi Normal University

TR01 Transfer of patent right