CN113538152B - 一种保护数据隐私的数据交易平台 - Google Patents
一种保护数据隐私的数据交易平台 Download PDFInfo
- Publication number
- CN113538152B CN113538152B CN202110878288.2A CN202110878288A CN113538152B CN 113538152 B CN113538152 B CN 113538152B CN 202110878288 A CN202110878288 A CN 202110878288A CN 113538152 B CN113538152 B CN 113538152B
- Authority
- CN
- China
- Prior art keywords
- data
- value
- values
- node
- confusion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013499 data model Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims abstract description 30
- 238000012546 transfer Methods 0.000 claims abstract description 6
- 239000000284 extract Substances 0.000 claims abstract description 5
- 238000004364 calculation method Methods 0.000 claims description 14
- 230000001174 ascending effect Effects 0.000 claims description 9
- 238000013475 authorization Methods 0.000 claims description 9
- 238000004806 packaging method and process Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 abstract description 6
- 230000000694 effects Effects 0.000 abstract description 4
- 210000002569 neuron Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/64—Protecting data integrity, e.g. using checksums, certificates or signatures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Business, Economics & Management (AREA)
- Bioethics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Technology Law (AREA)
- Biomedical Technology (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及大数据技术领域,具体涉及一种保护数据隐私的数据交易平台,包括:用户注册节点,为注册账号在区块链上开设虚拟账户;数据登记节点,数据源方提取数据行的哈希值,作为数据哈希值;若干个存储节点,接收数据行;数据交易节点,展示批次数据的数据介绍和定价;数据模型节点,接收数据需求方提供的数据处理模型,数据需求方将相应数量的代币转账到数据交易节点的虚拟账户上,数据模型节点从若干个存储节点处恢复数据行,并代入数据处理模型执行并计费,将执行结果发送给数据需求方,将计费结果发送给数据交易节点。本发明的实质性效果是:有效保护了数据的隐私,减少数据的暴露时长,保护数据的安全性。
Description
技术领域
本发明涉及大数据技术领域,具体涉及一种保护数据隐私的数据交易平台。
背景技术
近年来随着大数据的广泛普及和应用,数据资源的价值逐步得到重视和认可,数据交易需求也在不断增加。相关政策明确提出要引导培育大数据交易市场,开展面向应用的数据交易市场试点,探索开展大数据衍生产品交易,鼓励产业链各环节的市场主体进行数据交换和交易,促进数据资源流通。数据交易平台是数据交易行为的重要载体,可以促进数据资源整合、规范交易行为、降低交易成本、增强数据流动性,成为当前各地促进数据要素流通的主要举措之一。阻碍数据流通的问题主要集中为三个方面,一是数据结构多样问题,二是出于隐私保护或政策限制,部分数据的流动受到限制,三是对账和结算复杂,多方建模中数据需求方和多个数据源方的对账、资金结算和分配问题。数据结构问题通过标准化接口能够解决。对于隐私保护和资金结算问题,目前尚缺乏有效的解决方案。
中国专利CN111461818A,公开日2020年7月28日,数据交易方法、数据交易平台,包括:依据联合建模产品的供应单发布流程,引导第一供方和第二供方在交易平台上发布待交易的联合建模产品的供应单;依据联合建模产品的供应单订单流程,引导需方在交易平台上对待交易的联合建模产品的供应单下订单;依据联合建模产品的接口调用流程,引导需方、第一供方和第二供方按照联合建模产品的订单进行数据交易,包括:提示需方输入订单号和标识信息;提示第一供方对联合建模产品的数据进行建模,并发送给第二供方;提示第二供方对联合建模产品的数据进行二次建模,并发送给需方。其技术方案实现了联合建模的大数据产品的交易,且需方无需对不同供方提供的数据资源进行整合建模,大大减轻了需方的负担。但其仅仅是将数据整合的工作量由数据需求方转移给了数据源方,并没有解决数据隐私问题和资金结算不便的问题。
发明内容
本发明要解决的技术问题是:目前缺乏有效保护数据隐私的数据交易平台的技术问题。提出了一种保护数据隐私的数据交易平台,能够有效保护数据交易过程中数据的隐私。
为解决上述技术问题,本发明所采取的技术方案为:一种保护数据隐私的数据交易平台,包括:用户注册节点,接受数据源方和数据需求方的账号注册的请求,为注册账号在区块链上开设虚拟账户;数据登记节点,数据源方提取数据行的哈希值,作为数据哈希值,将批次数据包含的全部数据哈希值打包发送给数据登记节点,数据登记节点为批次数据分配批次编号,数据登记节点检查数据哈希值是否已被登记过,为未被登记过的数据哈希值分配数据编号,将批次编号和数据编号反馈给数据源方;若干个存储节点,数据源方将数据行拆分为若干个子部分,将子部分关联批次编号和数据编号,分别发送给若干个存储节点存储,若干个存储节点将若干个子部分拼合复原数据行,验证复原的数据行的哈希值是否与数据哈希值匹配,若匹配则通知数据登记节点已接收数据行;数据交易节点,数据登记节点将以被存储节点接收的数据行的批次编号、数据编号及数据哈希值发送给数据交易节点,数据源方按批次撰写数据介绍提交给数据交易节点,并为数据行定价,所述数据交易节点展示批次数据的数据介绍和定价,数据模型节点,接收数据需求方提供的数据处理模型,为数据处理模型分配模型编号,若数据需求方欲购买数据,则将批次编号、数据编号及模型编号发送给数据交易节点,并将相应数量的代币转账到数据交易节点的虚拟账户上,所述数据交易节点向数据模型节点发出调用授权,所述调用授权包含对应的数据编号,所述数据模型节点使用调用授权从若干个存储节点处恢复数据行,并代入数据处理模型执行并计费,将执行结果发送给数据需求方,将计费结果发送给数据交易节点,数据交易节点将计费结果对应的代币转账到数据源方的虚拟账户。
作为优选,所述数据哈希值为16进制数,所述数据登记节点将数据哈希值按前N位分组,每组包含的数据哈希值以链式存储方式存储,并按升/降序排列,数据登记节点检查数据哈希值是否已被登记过时,提取数据行的数据哈希值,按照数据哈希值的前N位找到分组,查找数据哈希值在升/降序排列中的位置,若位置上有相同的数据哈希值,则判定数据行已被登记,反之,则判定数据行未被登记,同时将数据行哈希值插入到分组的升/降序排列中。
作为优选,数据登记节点将存储节点的数量发送给数据源方,数据源方为数据行制作若干个副本,所述副本的数量与存储节点的数量匹配,为数据行的每个非数值型字段生成一个混淆值,所述混淆值落入字段真实值取值范围内,将数据行字段的真实值随机分散到若干个副本存储,副本中未被分配到真实值的字段填入混淆值,为数据行的每个数值型字段生成若干个加数和一个混淆值,加数的正负属性与真实值一致,所述加数的数量小于存储节点的数量减3,所述加数的数量为预设值,将数值型字段的真实值和若干个加数分别分配给若干个副本,未被分配到值的副本填入混淆值,将若干个副本分配给若干个存储节点存储,复原数据行时,读取全部副本,每个非数值型字段将有一个真实值和若干个混淆值,根据取值相同的数量可分辨出真实值,每个数值型字段将有一个真实值、若干个加数和至少2个混淆值,容易分辨混淆值,剩余值中绝对值最大的即为真实值,完成数据行的复原。
作为优选,所述混淆值与数据编号具有预设的函数关系,所述数据模型节点执行数据处理模型时,判断是否存在对数值型字段进行加权求和的计算式,若存在,则将权系数发送给若干个存储节点,若干个存储节点恢复出存储的数据行,将存储的对应数值型字段的值与对应的权系数相乘后求和,将和加密发送给所述数据模型节点,所述数据模型节点接收到全部和后再次求和,获得汇总和,所述数据模型节点根据数据行编号和预设的函数计算出混淆值,根据加数的数量推断出混淆值的数量,将混淆值与对应权系数相乘,再乘以混淆值数量,获得混淆和,汇总和减去混淆和后,再除以2,即为计算式的结果。
作为优选,数据登记节点将存储节点的数量发送给数据源方,数据源方为数据行制作若干个副本,所述副本的数量与存储节点的数量匹配,为数据行的每个非数值型字段生成一个混淆值,所述混淆值落入字段真实值取值范围内,将数据行字段的真实值随机分配给若干个副本存储,副本中未被分配到真实值的字段填入混淆值,为数据行的每个数值型字段生成若干个加数和混淆值,所述加数的绝对值小于真实值的绝对值,混淆值成对生成并被使用,成对的混淆值互为相反数,所述加数的数量小于存储节点的数量减3,将数值型字段的真实值和若干个加数分别分配给若干个副本,未被分配到值的副本填入混淆值,将若干个副本分配给若干个存储节点存储,复原数据行时,读取全部副本,每个非数值型字段将有一个真实值和若干个混淆值,根据取值相同的数量可分辨出真实值,每个数值型字段将有一个真实值、若干个加数和互为相反数的混淆值对,容易分辨混淆值,剩余值中绝对值最大的即为真实值,完成数据行的复原。
作为优选,所述数据模型节点执行数据处理模型时,判断是否存在对数值型字段进行加权求和的计算式,若存在,则将权系数发送给若干个存储节点,若干个存储节点恢复出存储的数据行,将存储的对应数值型字段的值与对应的权系数相乘后求和,将和加密发送给所述数据模型节点,所述数据模型节点接收到全部和后再次求和,获得汇总和,汇总和除以2,即为计算式的结果。
作为优选,所述数据模型节点为数据处理模型建立有历史执行记录,所述历史执行记录记载已被代入数据处理模型的数据行的数据哈希值,所述数据模型节点获得恢复数据行时,将恢复数据行的哈希值与历史执行记录对比,若历史执行记录中存在恢复数据行的哈希值,则跳过恢复数据行,且不计费,若历史执行记录中不存在恢复数据行的哈希值,则将恢复数据行代入数据处理模型,并计费。
本发明的实质性效果是:通过数据处理模型使数据需求方在使用数据时,不需要接触到数据,有效保护了数据的隐私;接收数据前判断同样的数据是否已被接收过,避免一数多售,净化数据市场,保护数据需求方的利益;通过分布式存储使数据在长时间的存储过程中,仍然能够保持较高的安全性,仅在被调用时才临时恢复,并在调用后及时销毁,减少数据的暴露时长,保护数据的安全性。
附图说明
图1为实施例一数据交易平台结构示意图。
图2为实施例一非数值型字段存储示意图。
图3为实施例一数值型字段存储示意图。
图4为实施例一执行数据处理模型示意图。
图5为实施例一数据行计费示意图。
其中:10、数据源方,20、数据登记节点,21、数据行,22、真实值,23、混淆值,24、副本,25、加数,30、存储节点,40、数据交易节点,50、用户注册节点,60、区块链,70、数据模型节点,80、数据需求方,210、字段。
具体实施方式
下面通过具体实施例,并结合附图,对本发明的具体实施方式作进一步具体说明。
实施例一:
一种保护数据隐私的数据交易平台,请参阅附图1,本实施例包括:用户注册节点50,接受数据源方10和数据需求方80的账号注册的请求,为注册账号在区块链60上开设虚拟账户;数据登记节点20,数据源方10提取数据行21的哈希值,作为数据哈希值,将批次数据包含的全部数据哈希值打包发送给数据登记节点20,数据登记节点20为批次数据分配批次编号,数据登记节点20检查数据哈希值是否已被登记过,为未被登记过的数据哈希值分配数据编号,将批次编号和数据编号反馈给数据源方10;若干个存储节点30,数据源方10将数据行21拆分为若干个子部分,将子部分关联批次编号和数据编号,分别发送给若干个存储节点30存储,若干个存储节点30将若干个子部分拼合复原数据行21,验证复原的数据行21的哈希值是否与数据哈希值匹配,若匹配则通知数据登记节点20已接收数据行21;数据交易节点40,数据登记节点20将以被存储节点30接收的数据行21的批次编号、数据编号及数据哈希值发送给数据交易节点40,数据源方10按批次撰写数据介绍提交给数据交易节点40,并为数据行21定价,数据交易节点40展示批次数据的数据介绍和定价,数据模型节点70,接收数据需求方80提供的数据处理模型,为数据处理模型分配模型编号,若数据需求方80欲购买数据,则将批次编号、数据编号及模型编号发送给数据交易节点40,并将相应数量的代币转账到数据交易节点40的虚拟账户上,数据交易节点40向数据模型节点70发出调用授权,调用授权包含对应的数据编号,数据模型节点70使用调用授权从若干个存储节点30处恢复数据行21,并代入数据处理模型执行并计费,将执行结果发送给数据需求方80,将计费结果发送给数据交易节点40,数据交易节点40将计费结果对应的代币转账到数据源方10的虚拟账户。为了方便数据需求方80自行制定数据处理模型,数据源方10需要公开若干条示例数据,并且需要公开每个字段210的取值范围。每个批次数据的来源情况、完整程度和真实程度,也都应当被说明,并由数据需求方80所得知,用以促成数据的交易。这些信息均由数据源方10撰写提供。数据需求方80可以首先制定验证模型提交给执行服务器执行,比如验证模型读取某个数值型字段210,输出该字段210的最大值、最小值和空值率,用以和数据源方10公开的介绍对比,判断数据源方10公开的数据取值范围是否真实,及声称的空值率是否满足。用以降低数据需求方80购买数据的风险。本实施例使用的代币为稳定币,即与法定货比兑换比例固定不变的代币。为配合本实施例还需要存在一个区块链代币与法币进行兑换的节点。兑换节点可以由本平台开设,也可以借助于现有技术中已经存在的区块链及兑换节点。
数据哈希值为16进制数,数据登记节点20将数据哈希值按前N位分组,每组包含的数据哈希值以链式存储方式存储,并按升/降序排列,数据登记节点20检查数据哈希值是否已被登记过时,提取数据行21的数据哈希值,按照数据哈希值的前N位找到分组,查找数据哈希值在升/降序排列中的位置,若位置上有相同的数据哈希值,则判定数据行21已被登记,反之,则判定数据行21未被登记,同时将数据行21哈希值插入到分组的升/降序排列中。
数据登记节点20将存储节点30的数量发送给数据源方10,数据源方10为数据行21制作若干个副本24,副本24的数量与存储节点30的数量匹配。请参阅附图2,数据源方10为数据行21的每个非数值型字段210生成一个混淆值23,混淆值23落入字段210真实值22取值范围内,将数据行21字段210的真实值22随机分配给若干个副本24存储,副本24中未被分配到真实值22的字段210填入混淆值23。请参阅附图3,数据源方10为数据行21的每个数值型字段210生成若干个加数25和一个混淆值23,加数25的正负属性与真实值22一致,加数25的数量小于存储节点30的数量减3,加数25的数量为预设值,将数值型字段210的真实值22和若干个加数25分别分配给若干个副本24,未被分配到值的副本24填入混淆值23,将若干个副本24分配给若干个存储节点30存储,复原数据行21时,读取全部副本24,每个非数值型字段210将有一个真实值22和若干个混淆值23,根据取值相同的数量可分辨出真实值22,每个数值型字段210将有一个真实值22、若干个加数25和至少2个混淆值23,容易分辨混淆值23,剩余值中绝对值最大的即为真实值22,完成数据行21的复原。如真实数据包括:消费者年龄,33,月均消费金额:10,000.00元,月均消费频次:16次。存储节点30共有6个,为消费者年龄生成混淆数为56,生成的加数25为:33=12+8+13,6个副本24分配到的数值分别为:33,12,8,13,56,56,分别分配给6个存储节点30存储。通过两个相同的值56可以判断混淆值23为56,剩下的数能够组成一个等式,可得真实值22为33,其余为加数25。
混淆值23与数据编号具有预设的函数关系,如消费者年龄的混淆值23=数据行21编号 mod 120,获得混淆数。请参阅附图4,数据模型节点70执行数据处理模型时,执行以下步骤:步骤A01)判断是否存在对数值型字段210进行加权求和的计算式;步骤A02)若存在,则将权系数发送给若干个存储节点30;步骤A03)若干个存储节点30恢复出存储的数据行21,将存储的对应数值型字段210的值与对应的权系数相乘后求和;步骤A04)将和加密发送给数据模型节点70;步骤A05)数据模型节点70接收到全部和后再次求和,获得汇总和;步骤A06)数据模型节点70根据数据行21编号和预设的函数计算出混淆值23;步骤A07)根据加数25的数量推断出混淆值23的数量,将混淆值23与对应权系数相乘,再乘以混淆值23数量,获得混淆和;步骤A08)汇总和减去混淆和后,再除以2,即为计算式的结果。
如在一个神经网络模型中,输入层有三个神经元,分别对应消费者年龄、月均消费金额和月均消费频次,第一层神经元有两个,其中一个连接输入层的三个神经元,激发函数为sigmod函数,权系数以a11、a12和a13表示,偏移量以b1表示,则其输出等于sigmod(x),其中第一层神经元为全连接,则x= a11*消费者年龄+ a12*月均消费金额+ a13*月均消费频次+b1。
为月均消费金额生成混淆数为56,生成的加数25为:10,000.00=3,000.00+1,000.00+6,000.00,6个副本24分配到的数值分别为:10,000.00, 3,000.00, 1,000.00, 6,000.00, 56.00,56.00。为月均消费频次生成混淆数为56,生成的加数25为:16=3+17+6,6个副本24分配到的数值分别为:16, 3, 7, 6, 56,56。
打乱顺序分配给6个存节点后,假设第一个存储节点30存储的数据为:33, 6,000.00,56,则第一个存储节点30计算的和为:a11*33+ a12*6,000.00+ a13*56,以此类推,全部6个存储节点30发送的和,再求和,所得结果为:
汇总和=a11*(33+12+8+13+56+56)+ a12*(10,000.00+ 3,000.00+ 1,000.00+ 6,000.00+ 56.00+56.00)+ a13*(16+ 3+ 7+ 6+ 56+56)。计算出混淆数56后,计算混淆和=2*(a11*56+ a12*56+ a13*56),将汇总和减去混淆和,所得结果即为真实值22被两次加权求和的结果,因而再除以2即可,加上偏移值b1,即获得x的值,代入sigmod(x)函数即得到神经元的输出。其中神经元的输出计算过程中,涉及到求x的值,x的值即为数值型字段210的加权求和。在计算过程中,原始的真实值22混杂在多个混淆值23和加数25中,从而得以隐藏,难以被准确发现,提高了数据的隐私性和安全性。
请参阅附图5,数据模型节点70进行计费时,执行以下步骤:步骤B01)数据模型节点70为数据处理模型建立有历史执行记录,历史执行记录记载已被代入数据处理模型的数据行21的数据哈希值;步骤B02)数据模型节点70获得恢复数据行21时,将恢复数据行21的哈希值与历史执行记录对比;步骤B03)若历史执行记录中存在恢复数据行21的哈希值,则跳过恢复数据行21,且不计费;步骤B04)若历史执行记录中不存在恢复数据行21的哈希值,则将恢复数据行21代入数据处理模型,并计费。
本实施例的有益技术效果为:通过数据处理模型使数据需求方80在使用数据时,不需要接触到数据,有效保护了数据的隐私。接收数据前判断同样的数据是否已被接收过,避免一数多售,净化数据市场,保护数据需求方80的利益。
通过分布式存储使数据在长时间的存储过程中,仍然能够保持较高的安全性,仅在被调用时才临时恢复,并在调用后及时销毁,减少数据的暴露时长,保护数据的安全性。
实施例二:
一种保护数据隐私的数据交易平台,相对于实施例一,本实施例对数据的存储提出了替代方案。在本实施例中,数据登记节点20将存储节点30的数量发送给数据源方10,数据源方10为数据行21制作若干个副本24,副本24的数量与存储节点30的数量匹配,为数据行21的每个非数值型字段210生成一个混淆值23,混淆值23落入字段210真实值22取值范围内,将数据行21字段210的真实值22随机分配给若干个副本24存储,副本24中未被分配到真实值22的字段210填入混淆值23,为数据行21的每个数值型字段210生成若干个加数25和混淆值23,加数25的绝对值小于真实值22的绝对值,混淆值23成对生成并被使用,成对的混淆值23互为相反数,加数25的数量小于存储节点30的数量减3,将数值型字段210的真实值22和若干个加数25分别分配给若干个副本24,未被分配到值的副本24填入混淆值23,将若干个副本24分配给若干个存储节点30存储,复原数据行21时,读取全部副本24,每个非数值型字段210将有一个真实值22和若干个混淆值23,根据取值相同的数量可分辨出真实值22,每个数值型字段210将有一个真实值22、若干个加数25和互为相反数的混淆值23对,容易分辨混淆值23,剩余值中绝对值最大的即为真实值22,完成数据行21的复原。
相应的数据模型节点70执行数据处理模型时,判断是否存在对数值型字段210进行加权求和的计算式,若存在,则将权系数发送给若干个存储节点30,若干个存储节点30恢复出存储的数据行21,将存储的对应数值型字段210的值与对应的权系数相乘后求和,将和加密发送给数据模型节点70,数据模型节点70接收到全部和后再次求和,获得汇总和,汇总和除以2,即为计算式的结果。其余部分同实施例一。相对于实施例一,本实施例中混淆值23不需要与数据编号存在函数关系,能够达到更好的混淆效果,同时简化了加权求和的计算。对数据的字段210进行加权求和经常被应用在神经网络模型中,而神经网络模型是目前大数据应用的主要方式之一,因而具有很好的应用前景。
以上所述的实施例只是本发明的一种较佳的方案,并非对本发明作任何形式上的限制,在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。
Claims (7)
1.一种保护数据隐私的数据交易平台,其特征在于,
包括:
用户注册节点,接受数据源方和数据需求方的账号注册的请求,为注册账号在区块链上开设虚拟账户;
数据登记节点,数据源方提取数据行的哈希值,作为数据哈希值,将批次数据包含的全部数据哈希值打包发送给数据登记节点,数据登记节点为批次数据分配批次编号,数据登记节点检查数据哈希值是否已被登记过,为未被登记过的数据哈希值分配数据编号,将批次编号和数据编号反馈给数据源方;
若干个存储节点,数据源方将数据行拆分为若干个子部分,将子部分关联批次编号和数据编号,分别发送给若干个存储节点存储,若干个存储节点将若干个子部分拼合复原数据行,验证复原的数据行的哈希值是否与数据哈希值匹配,若匹配则通知数据登记节点已接收数据行;
数据交易节点,数据登记节点将以被存储节点接收的数据行的批次编号、数据编号及数据哈希值发送给数据交易节点,数据源方按批次撰写数据介绍提交给数据交易节点,并为数据行定价,所述数据交易节点展示批次数据的数据介绍和定价;
数据模型节点,接收数据需求方提供的数据处理模型,为数据处理模型分配模型编号,若数据需求方欲购买数据,则将批次编号、数据编号及模型编号发送给数据交易节点,并将相应数量的代币转账到数据交易节点的虚拟账户上,所述数据交易节点向数据模型节点发出调用授权,所述调用授权包含对应的数据编号,所述数据模型节点使用调用授权从若干个存储节点处恢复数据行,并代入数据处理模型执行并计费,将执行结果发送给数据需求方,将计费结果发送给数据交易节点,数据交易节点将计费结果对应的代币转账到数据源方的虚拟账户。
2.根据权利要求1所述的一种保护数据隐私的数据交易平台,其特征在于,
所述数据哈希值为16进制数,所述数据登记节点将数据哈希值按前N位分组,每组包含的数据哈希值以链式存储方式存储,并按升/降序排列,数据登记节点检查数据哈希值是否已被登记过时,提取数据行的数据哈希值,按照数据哈希值的前N位找到分组,查找数据哈希值在升/降序排列中的位置,若位置上有相同的数据哈希值,则判定数据行已被登记,反之,则判定数据行未被登记,同时将数据行哈希值插入到分组的升/降序排列中。
3.根据权利要求1或2所述的一种保护数据隐私的数据交易平台,其特征在于,
数据登记节点将存储节点的数量发送给数据源方,数据源方为数据行制作若干个副本,所述副本的数量与存储节点的数量匹配,为数据行的每个非数值型字段生成一个混淆值,所述混淆值落入字段真实值取值范围内,将数据行的非数值型字段的真实值随机分散到若干个副本存储,副本中未被分配到真实值的非数值型字段填入混淆值,为数据行的每个数值型字段生成若干个加数和一个混淆值,加数的正负属性与真实值一致,所述加数的数量小于存储节点的数量减3,所述加数的数量为预设值,将数值型字段的真实值和若干个加数分别分配给若干个副本,未被分配到值的副本填入混淆值,将若干个副本分配给若干个存储节点存储,复原数据行时,读取全部副本,每个非数值型字段将有一个真实值和若干个混淆值,根据取值相同的数量可分辨出真实值,每个数值型字段将有一个真实值、若干个加数和至少2个混淆值,容易分辨混淆值,剩余值中绝对值最大的即为真实值,完成数据行的复原。
4.根据权利要求3所述的一种保护数据隐私的数据交易平台,其特征在于,
所述混淆值与数据编号具有预设的函数关系,所述数据模型节点执行数据处理模型时,判断是否存在对数值型字段进行加权求和的计算式,若存在,则将权系数发送给若干个存储节点,若干个存储节点恢复出存储的数据行,将存储的对应数值型字段的值与对应的权系数相乘后求和,将和加密发送给所述数据模型节点,所述数据模型节点接收到全部和后再次求和,获得汇总和,所述数据模型节点根据数据行编号和预设的函数计算出混淆值,根据加数的数量推断出混淆值的数量,将混淆值与对应权系数相乘,再乘以混淆值数量,获得混淆和,汇总和减去混淆和后,再除以2,即为计算式的结果。
5.根据权利要求1或2所述的一种保护数据隐私的数据交易平台,其特征在于,
数据登记节点将存储节点的数量发送给数据源方,数据源方为数据行制作若干个副本,所述副本的数量与存储节点的数量匹配,为数据行的每个非数值型字段生成一个混淆值,所述混淆值落入字段真实值取值范围内,将数据行字段的真实值随机分配给若干个副本存储,副本中未被分配到真实值的字段填入混淆值,为数据行的每个数值型字段生成若干个加数和混淆值,所述加数的绝对值小于真实值的绝对值,混淆值成对生成并被使用,成对的混淆值互为相反数,所述加数的数量小于存储节点的数量减3,将数值型字段的真实值和若干个加数分别分配给若干个副本,未被分配到值的副本填入混淆值,将若干个副本分配给若干个存储节点存储,复原数据行时,读取全部副本,每个非数值型字段将有一个真实值和若干个混淆值,根据取值相同的数量可分辨出真实值,每个数值型字段将有一个真实值、若干个加数和互为相反数的混淆值对,容易分辨混淆值,剩余值中绝对值最大的即为真实值,完成数据行的复原。
6.根据权利要求5所述的一种保护数据隐私的数据交易平台,其特征在于,
所述数据模型节点执行数据处理模型时,判断是否存在对数值型字段进行加权求和的计算式,若存在,则将权系数发送给若干个存储节点,若干个存储节点恢复出存储的数据行,将存储的对应数值型字段的值与对应的权系数相乘后求和,将和加密发送给所述数据模型节点,所述数据模型节点接收到全部和后再次求和,获得汇总和,汇总和除以2,即为计算式的结果。
7.根据权利要求1或2所述的一种保护数据隐私的数据交易平台,其特征在于,
所述数据模型节点为数据处理模型建立有历史执行记录,所述历史执行记录记载已被代入数据处理模型的数据行的数据哈希值,所述数据模型节点获得恢复数据行时,将恢复数据行的哈希值与历史执行记录对比,若历史执行记录中存在恢复数据行的哈希值,则跳过恢复数据行,且不计费,若历史执行记录中不存在恢复数据行的哈希值,则将恢复数据行代入数据处理模型,并计费。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110878288.2A CN113538152B (zh) | 2021-08-02 | 2021-08-02 | 一种保护数据隐私的数据交易平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110878288.2A CN113538152B (zh) | 2021-08-02 | 2021-08-02 | 一种保护数据隐私的数据交易平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113538152A CN113538152A (zh) | 2021-10-22 |
CN113538152B true CN113538152B (zh) | 2024-01-05 |
Family
ID=78121751
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110878288.2A Active CN113538152B (zh) | 2021-08-02 | 2021-08-02 | 一种保护数据隐私的数据交易平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113538152B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423980A (zh) * | 2017-07-11 | 2017-12-01 | 厦门易功成信息技术有限公司 | 一种供应链上数据交易征信平台及方法 |
CN109379397A (zh) * | 2018-08-31 | 2019-02-22 | 阿里巴巴集团控股有限公司 | 基于区块链的交易共识处理方法及装置、电子设备 |
KR20190059813A (ko) * | 2017-11-23 | 2019-05-31 | 염혜진 | 가상계좌 기반 가상화폐거래소 정산 방법 |
CN109978546A (zh) * | 2019-04-08 | 2019-07-05 | 北京邮电大学 | 一种联盟区块链架构及其分级存储和交易穿孔方法 |
CN110069345A (zh) * | 2019-04-23 | 2019-07-30 | 江苏大学 | 基于区块链的众包资源分布式匿名配给方法及其配给系统 |
CN111913833A (zh) * | 2020-06-28 | 2020-11-10 | 华南理工大学 | 一种基于区块链的医疗物联网交易系统 |
WO2021003985A1 (zh) * | 2019-07-08 | 2021-01-14 | 深圳壹账通智能科技有限公司 | 区块链数据归档存储方法、装置、计算机设备和存储介质 |
-
2021
- 2021-08-02 CN CN202110878288.2A patent/CN113538152B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423980A (zh) * | 2017-07-11 | 2017-12-01 | 厦门易功成信息技术有限公司 | 一种供应链上数据交易征信平台及方法 |
KR20190059813A (ko) * | 2017-11-23 | 2019-05-31 | 염혜진 | 가상계좌 기반 가상화폐거래소 정산 방법 |
CN109379397A (zh) * | 2018-08-31 | 2019-02-22 | 阿里巴巴集团控股有限公司 | 基于区块链的交易共识处理方法及装置、电子设备 |
CN109978546A (zh) * | 2019-04-08 | 2019-07-05 | 北京邮电大学 | 一种联盟区块链架构及其分级存储和交易穿孔方法 |
CN110069345A (zh) * | 2019-04-23 | 2019-07-30 | 江苏大学 | 基于区块链的众包资源分布式匿名配给方法及其配给系统 |
WO2021003985A1 (zh) * | 2019-07-08 | 2021-01-14 | 深圳壹账通智能科技有限公司 | 区块链数据归档存储方法、装置、计算机设备和存储介质 |
CN111913833A (zh) * | 2020-06-28 | 2020-11-10 | 华南理工大学 | 一种基于区块链的医疗物联网交易系统 |
Non-Patent Citations (2)
Title |
---|
"基于区块链的个人基因数据共享平台研究";李华龙;《中国优秀硕士学位论文全文数据库(基础科学A辑)》;全文 * |
"基于区块链的数据管理设计模式";姚浩男 等;《计算机系统应用》(第7期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113538152A (zh) | 2021-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Manchala | Trust metrics, models and protocols for electronic commerce transactions | |
Manasse | The Millicent Protocols for Electronic Commerce. | |
Tygar | Atomicity in electronic commerce | |
US20180189753A1 (en) | Infrastructure for obligation management and validation | |
JP3133243B2 (ja) | オンラインショッピングシステム | |
CN104574050B (zh) | 在线结算的方法、装置及系统 | |
CN111062805B (zh) | 一种供应链金融服务管理平台 | |
EP0796480B1 (en) | Method and apparatus for conducting computerized commerce | |
US5839119A (en) | Method of electronic payments that prevents double-spending | |
US20020087481A1 (en) | System, method and program for enabling an electronic commerce heterogeneous network | |
US20020087483A1 (en) | System, method and program for creating and distributing processes in a heterogeneous network | |
CN113268760B (zh) | 一种基于区块链的分布式数据融合平台 | |
Tygar et al. | Atomicity versus anonymity: Distributed transactions for electronic commerce | |
EP1230602A2 (en) | A system, method and article of manufacture for an internet based distribution architecture | |
CN111899107B (zh) | 一种基于区块链智能合约的科技服务交易方法 | |
EP1072025A1 (en) | Computer-based method and system for aiding transactions | |
US20020087613A1 (en) | System, Method and program for bidding for best solution process execution in a heterogeneous network | |
WO2002031614A2 (en) | Automated multi-level marketing system | |
CN109118102B (zh) | 一种公平的基于区块链的双向组合云资源分配方法及系统 | |
JPH0981634A (ja) | ネットワーク課金方法 | |
CN113283957B (zh) | 一种基于区块链的实体产品交易方法 | |
CN113536357B (zh) | 一种基于区块链的数据共享平台 | |
US20020087473A1 (en) | System, method and program for creating an authenticatable, non-repudiatable transactional identity in a heterogeneous network | |
JP7219612B2 (ja) | 故障検知システム | |
JP2002342688A (ja) | 電子商取引方法、決済代行方法、使い捨て後払い方式情報発行方法、および決済依頼方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |