CN117235804B - 一种数据集确权方法、系统、装置及介质 - Google Patents
一种数据集确权方法、系统、装置及介质 Download PDFInfo
- Publication number
- CN117235804B CN117235804B CN202311516901.1A CN202311516901A CN117235804B CN 117235804 B CN117235804 B CN 117235804B CN 202311516901 A CN202311516901 A CN 202311516901A CN 117235804 B CN117235804 B CN 117235804B
- Authority
- CN
- China
- Prior art keywords
- data set
- target data
- data
- result
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000006870 function Effects 0.000 claims abstract description 114
- 238000000605 extraction Methods 0.000 claims abstract description 37
- 238000010200 validation analysis Methods 0.000 claims description 109
- 238000013475 authorization Methods 0.000 claims description 58
- 230000008569 process Effects 0.000 claims description 27
- 238000012795 verification Methods 0.000 claims description 22
- 238000012790 confirmation Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 11
- 238000011217 control strategy Methods 0.000 claims description 9
- 230000001960 triggered effect Effects 0.000 claims description 3
- 238000012986 modification Methods 0.000 abstract description 5
- 230000004048 modification Effects 0.000 abstract description 5
- 238000012549 training Methods 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000013502 data validation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012419 revalidation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种数据集确权方法、系统、装置及介质,涉及区块链技术领域,解决传统方案中存在的确权准确性低、效率低的问题。该方案接收目标数据集对应的数据包并上链;将数据包发送至可信第三方使可信第三方基于目标数据集的特征值、待比较数据集的特征值和确权函数确定确权结果。可见,本申请使用基于多个特征提取函数计算的多个特征值,并与待比较数据集的特征值进行比较,可以增强确权的准确性,避免出现由于数据集修改或调整顺序导致无法判别数据所有权或发现数据泄露的情况。此外,利用区块链系统使得数据集的确权结果可以被公开查询和验证,提高了数据集的确权和溯源的透明度,还通过可信第三方提高了确权结果的准确性。
Description
技术领域
本申请涉及区块链技术领域,特别涉及一种数据集确权方法、系统、装置及介质。
背景技术
人工智能训练数据集具有规模大、类型多、格式一致的特点,但其共享面临着训练数据集泄露后难确权、难追溯的问题。目前的解决方法主要通过查询搜索、哈希比对、语义分析等方法实现确权功能,而这种方式在解决少量关键数据问题上有效,但对于规模大的人工智能训练数据则效率不高。例如,哈希比对是一种过于精确的算法,且哈希函数本身具有雪崩效应,查询搜索也是具有相对准确性的计算方法,而人工智能训练数据集的多样性使得数据集被修改或调整后,导致以精确为目标的哈希函数、查询检索计算难以判别数据所有权或发现数据泄露。例如,小幅度修改源数据不会影响训练结果但无法被哈希函数对比检测;恶意修改内容或顺序以逃避确权检验;部分使用相同的公开数据以完善数据集等。因此,目前的解决办法在面向人工智能训练数据集确权应用时准确性低、效率低。
发明内容
本申请的目的是提供一种数据集确权方法、系统、装置及介质,使用基于特征提取函数计算的特征值,并与待比较数据集的特征值进行比较,可以增强确权的准确性,避免出现由于数据集修改或调整顺序导致无法判别数据所有权或发现数据泄露的情况。此外,利用区块链系统使得数据集的确权结果可以被公开查询和验证,提高了数据集的确权和溯源的透明度,还通过可信第三方提高了确权结果的准确性。
为解决上述技术问题,本申请提供了一种数据集确权方法,应用于区块链系统,包括:
接收目标数据集对应的数据包,并对所述数据包进行上链操作,所述数据包包括与所述目标数据集对应的多个特征值和确权函数,多个所述特征值是基于与所述目标数据集对应的多个特征提取函数计算的;
将所述数据包发送至可信第三方和/或区块链系统中的用户,触发所述可信第三方和/或所述区块链系统中的用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,将所述确权结果反馈至数据所有者并将所述确权结果上链。
在一种实施例中,接收目标数据集对应的数据包,包括:
接收数据所有者发送的目标数据集对应的数据包,所述数据包中还包括所述数据所有者的身份信息;
对所述数据包进行上链操作之前,还包括:
验证所述数据所有者的身份信息的有效性和信用度;
在所述数据所有者的身份信息的有效性和信用度满足预设要求时,进入对所述数据包进行上链操作的步骤。
在一种实施例中,基于所述目标数据集对应的特征值、若干个待比较数据集的多个特征值和所述确权函数确定所述目标数据集的确权结果,包括:
基于所述目标数据集对应的多个特征值、若干个所述待比较数据集的特征值计算所述目标数据集和各个所述待比较数据集的相似度;
根据各个所述相似度确定所述目标数据集的确权结果。
在一种实施例中,根据各个所述相似度确定所述目标数据集的确权结果,包括:
判断所述目标数据集与各个所述待比较数据集的相似度是否大于相似度阈值;
统计所述相似度大于所述相似度阈值的待比较数据集的个数;
根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的确权结果。
在一种实施例中,所述可信第三方中包括若干个指定用户时,根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的确权结果,包括:
各个所述指定用户根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果,并对所述初步确权结果上链;
还包括:
接收各个所述指定用户发送的初步确权结果;
根据各个所述初步确权结果确定最终确权结果。
在一种实施例中,各个所述指定用户根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果,包括:
各个所述指定用户根据预设公式确定所述相似度大于所述相似度阈值的待比较数据集的个数,根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果;
所述预设公式为:
,其中,n表示与所述目标数据集对应的待比较数据集的个数,i表示第i个特征,/>为所述相似度阈值,/>为所述目标数据集,x为所述目标数据集的标识,/>为所述待比较数据集,y为所述待比较数据集的标识,/>为所述目标数据集对应的第i个特征的特征提取函数,/>为所述目标数据集和所述待比较数据集在所述第i个特征上的相似度与相似度阈值的比较函数,所述比较函数输出0时表示所述目标数据集和所述待比较数据集在所述第i个特征上的相似度小于所述相似度阈值,所述比较函数输出1时表示所述目标数据集和所述待比较数据集在所述第i个特征上的相似度大于所述相似度阈值,/>表示所述目标数据集和各所述待比较数据集的相似度大于所述相似度阈值的待比较数据集的个数。
在一种实施例中,根据各个所述初步确权结果确定最终确权结果,包括:
根据各个所述初步确权结果中所述相似度大于所述相似度阈值的待比较数据集的个数和所有所述待比较数据集的个数确定所述最终确权结果。
在一种实施例中,根据各个所述初步确权结果中所述相似度大于所述相似度阈值的待比较数据集的个数和所有所述待比较数据集的个数确定所述最终确权结果,包括:
判断所述相似度大于所述相似度阈值的待比较数据集的个数与所有所述待比较数据集的个数比值是否大于预设阈值,若大于所述预设阈值,则对所述目标数据集予以确权,否则,不予以确权。
在一种实施例中,接收目标数据集对应的数据包,并对所述数据包进行上链操作之后,还包括:
通过广播向所述可信第三方和/或所述区块链系统中的用户发送确权请求;
将所述数据包发送至可信第三方和/或所述区块链系统中的用户,触发所述可信第三方和/或所述区块链系统中的用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,包括:
将所述数据包发送至所述可信第三方和/或区块链系统中的用户中接受所述确权请求的指定用户,以使所述指定用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果。
在一种实施例中,接收目标数据集对应的数据包,并对所述数据包进行上链操作之前,还包括:
触发数据所有者获取所述目标数据集的类型,并根据所述目标数据集的类型和类型-函数的对应关系确定与所述目标数据集对应的多个特征提取函数和确权函数,使用各所述特征提取函数计算所述目标数据集的各特征值,并将计算的多个所述特征值、所述确权函数发送至所述区块链系统。
在一种实施例中,将所述确权结果反馈至数据所有者并将所述确权结果上链之后,还包括:
触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,向所述可信第三方申请对称加密密钥;
触发所述数据所有者接收所述可信第三方生成并发送的对称加密密钥并使用所述对称加密密钥对所述目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统。
在一种实施例中,将所述确权结果反馈至数据所有者并将所述确权结果上链之前,还包括:
对所述确权结果进行签名,得到签名信息;
将所述确权结果反馈至数据所有者并将所述确权结果上链,包括:
将所述确权结果和所述签名信息反馈至所述数据所有者,并将所述确权结果和所述签名信息上链。
在一种实施例中,触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,向所述可信第三方申请对称加密密钥之前,还包括:
触发所述数据所有者获取所述签名信息,在并在签名信息验证通过时,进入触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,向所述可信第三方申请对称加密密钥的步骤。
在一种实施例中,所述可信第三方生成所述对称加密密钥之后,还包括:
基于所述对称加密密钥生成访问密钥。
在一种实施例中,还包括:
接收数据使用者发送的目标数据集的访问申请;
在所述数据使用者满足预设访问条件时,将所述访问密钥分为若干个份额;
将部分所述访问密钥的份额分配给所述数据使用者,以授权所述数据使用者访问所述目标数据集;
触发所述数据使用者将所述访问密钥的份额与所述云计算系统中各个数据集的访问密钥进行匹配,并在匹配成功时,允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问。
在一种实施例中,触发所述数据所有者接收所述可信第三方生成并发送的对称加密密钥并使用所述对称加密密钥对所述目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统之后,还包括:
生成与所述目标数据集对应的访问控制策略,并将所述访问控制策略上传至所述区块链系统和所述云计算系统;
允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问,包括:
根据所述访问控制策略允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问。
在一种实施例中,接收数据使用者发送的目标数据集的访问申请之后,还包括:
对所述数据使用者的身份有效性及信用度进行验证;
在所述数据使用者的身份有效性及信用度满足预设要求时,判定所述数据使用者满足所述预设访问条件。
在一种实施例中,还包括:
在所述数据使用者访问所述目标数据集的过程中,重新进入将所述数据包发送至可信第三方,触发所述可信第三方基于所述目标数据集对应的特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果的步骤。
为解决上述技术问题,本申请还提供了一种数据集确权系统,应用于区块链系统,包括:
数据包接收单元,用于接收目标数据集对应的数据包,并对所述数据包进行上链操作,所述数据包包括与所述目标数据集对应的多个特征值和确权函数,多个所述特征值是基于与所述目标数据集对应的多个特征提取函数计算的;
确权单元,用于将所述数据包发送至可信第三方和/或区块链系统中的用户,触发所述可信第三方和/或区块链系统中的用户基于所述目标数据集对应的特征值、若干个待比较数据集的多个特征值和所述确权函数确定所述目标数据集的确权结果,将所述确权结果反馈至数据所有者并将所述确权结果上链。
为解决上述技术问题,本申请还提供了一种数据集确权装置,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现如上述所述的数据集确权方法的步骤。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的数据集确权方法的步骤。
本申请提供了一种数据集确权方法、系统、装置及介质,涉及区块链技术领域,解决传统方案中存在的确权准确性低、效率低的问题。该方案接收目标数据集对应的数据包并上链;将数据包发送至可信第三方使可信第三方基于目标数据集的特征值、待比较数据集的特征值和确权函数确定确权结果。可见,本申请使用基于多个特征提取函数计算的多个特征值,并与待比较数据集的特征值进行比较,可以增强确权的准确性,避免出现由于数据集修改或调整顺序导致无法判别数据所有权或发现数据泄露的情况。此外,利用区块链系统使得数据集的确权结果可以被公开查询和验证,提高了数据集的确权和溯源的透明度,还通过可信第三方提高了确权结果的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种数据集确权方法的流程示意图;
图2为本申请提供的一种数据集确权方法的具体实施例的流程图;
图3为本申请提供的一种访问密钥共享示意图;
图4为本申请提供的一种链上授权和链下访问协同工作示意图;
图5为本申请提供的一种数据集确权系统的示意图;
图6为本申请提供的一种数据集确权装置的示意图;
图7为本申请提供的一种计算机可读存储介质的示意图。
具体实施方式
本申请的核心是提供一种数据集确权方法、系统、装置及介质,使用基于特征提取函数计算的特征值,并与待比较数据集的特征值进行比较,可以增强确权的准确性,避免出现由于数据集修改或调整顺序导致无法判别数据所有权或发现数据泄露的情况。此外,利用区块链系统使得数据集的确权结果可以被公开查询和验证,提高了数据集的确权和溯源的透明度,还通过可信第三方提高了确权结果的准确性。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供了一种数据集确权方法,如图1所示,该方法应用于区块链系统,包括:
S11:接收目标数据集对应的数据包,并对数据包进行上链操作,数据包包括与目标数据集对应的多个特征值和确权函数,多个特征值是基于与目标数据集对应的多个特征提取函数计算的;
本申请中的方法应用于区块链系统中。在这一步中,首先接收目标数据集对应的数据包,这个数据包至少包括两部分:特征值和确权函数。特征值是通过与目标数据集对应的特征提取函数计算得到的。特征提取函数是针对目标数据集的一种算法或方法,用于提取该数据集的特征,以便后续进行确权操作。通过特征提取函数的计算,目标数据集的特征值可以得到。确权函数是用于对目标数据集进行确权的算法或方法。确权函数可以根据目标数据集的特征值以及其他一些待比较数据集的特征值来确定目标数据集的确权结果。确权函数的具体实现可以是基于相似度比较的算法,例如比较特征值之间的距离或相似性,并根据设定的阈值来决定是否认定为同一数据集。
在本步骤中,确定目标数据集的特征提取函数至少为两个,并使用各个特征提取函数提取目标数据集的特征值,以得到多个特征值,从而基于多个特征值对目标数据集进行确权处理,提高后续确权过程及确权结果的可靠性。
在本步骤中,数据包会被进行上链操作,也就是将这个数据包的信息存储到区块链中。通过上链操作,可以确保数据包的内容不被篡改,并且具有不可改变性和不可抵赖性,从而保证了确权的可信性。
S12:将数据包发送至可信第三方和/或区块链系统中的用户,触发可信第三方和/或区块链系统中的用户基于目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果。
本步骤中,数据包中包含了目标数据集的特征值,这些特征值是通过与目标数据集对应的特征提取函数计算得到的。特征提取函数可以对目标数据集进行处理,提取出与数据集本身相关的特征信息。这些特征值可以用于表征目标数据集的特征,从而用来进行确权判断。其次,可信第三方和/或区块链系统中的用户在收到数据包后,使用目标数据集的特征值、以及预先准备好的若干个待比较数据集(根据目标数据集确定的待比较数据集)的特征值和确权函数来确定目标数据集的确权结果(在一种实施例中,用户指的是可信第三方中的用户以及区块链系统中的与用户)。确权函数可能包含一系列的算法或逻辑,用于比较目标数据集与待比较数据集之间的相似性或差异性,以判断目标数据集的确权情况。通过比较目标数据集与其他数据集的特征值,并结合确权函数的判断逻辑,可信第三方和/或区块链系统中的用户可以确定目标数据集的确权结果,提高数据集确权的准确性和效率。
在一种实施例中,将数据包发送至可信第三方,触发可信第三方基于目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果之后,还包括:
将确权结果反馈至数据所有者并将确权结果上链。
本实施例描述了在数据包发送至可信第三方并触发可信第三方进行确权结果确定后的进一步操作。具体来说,确定了目标数据集的确权结果后,还将结果反馈至数据所有者,这就意味着数据所有者将获得目标数据集确权的结果信息。此外,除了反馈至数据所有者,确权结果还将被上链,这意味着确权的结果信息将被记录在区块链系统中,具有不可篡改性和可验证性。
本实施例进一步提供了确权过程的完整性和透明性。数据所有者不仅能够获得确权结果的反馈,还能够通过区块链上的记录来验证确权结果的真实性和准确性,这有助于确保数据所有者对其数据集的权益得到保护。
在一种实施例中,接收目标数据集对应的数据包,包括:
接收数据所有者发送的目标数据集对应的数据包,数据包中还包括数据所有者的身份信息;
对数据包进行上链操作之前,还包括:
验证数据所有者的身份信息的有效性和信用度;
在数据所有者的身份信息的有效性和信用度满足预设要求时,进入对数据包进行上链操作的步骤。
进一步的,接收数据所有者发送的目标数据集对应的数据包,若数据包中还包括数据所有者的身份信息,身份信息可以包括数据所有者的姓名、身份证号码、注册号等标识信息。验证数据所有者的身份信息的有效性和信用度。在上一步中收到的身份信息需要进行验证,以确保其有效并具备一定的有效性和信用度。其中,有效性通过检测该数据所有者是否为注册的有效用户来确定,若是有效用户,则身份信息具有有效性,否则不具有有效性。信用度可以通过与数据所有者进行身份核实,比对其身份证明文件或注册证书等方式来实现。或者通过检索区块链系统中是否存储有与该数据所有者对应的欺诈行为,若存在欺诈行为,则信用度不通过。在数据所有者的身份信息的有效性和信用度满足预设要求时,进入对数据包进行上链操作的步骤。
在验证数据所有者的身份信息后,需要确保其有效性和信用度满足预设的要求。只有当数据所有者满足要求时,才可以进行数据包的上链操作。上链操作将目标数据集对应的数据包中的特征值和确权函数等信息存储到区块链系统中,以确保数据的不可篡改性和可验证性。
通过以上步骤,本实施例确保了对数据所有者身份的验证和可信度评估,并只有在验证合格的情况下才进行数据包的上链操作,从而提高了数据集确权方法的安全性和可靠性。
在一种实施例中,基于目标数据集对应的多个特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果,包括:
基于目标数据集对应的多个特征值、若干个待比较数据集的特征值计算目标数据集和各个待比较数据集的相似度;
根据各个相似度确定目标数据集的确权结果。
本实施例中给出了一种得到确权结果的具体实现方式,具体而言,基于目标数据集对应的多个特征值、以及若干个待比较数据集的特征值和确权函数来确定目标数据集的确权结果。然后,根据目标数据集对应的特征值、以及待比较数据集的特征值,计算目标数据集和每个待比较数据集之间的相似度。这个相似度的计算可以采用各种方式,例如余弦相似度、欧氏距离等,具体的计算方法可以根据实际情况进行选择。最后,根据各个相似度的计算结果,确定目标数据集的确权结果。这意味着通过比较目标数据集和待比较数据集之间的相似度,可以确定目标数据集是否与待比较数据集相似,或者说是否属于同一数据集。
总体来说,本实施例提供了更加详细的步骤和方法。通过计算目标数据集和待比较数据集之间的相似度,可以确定目标数据集的确权结果,即确定目标数据集是否与待比较数据集相似,并进一步确权。
在一种实施例中,根据各个相似度确定目标数据集的确权结果,包括:
判断目标数据集与各个待比较数据集的相似度是否大于相似度阈值;
统计相似度大于相似度阈值的待比较数据集的个数;
根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的确权结果。
本实施例中描述了一种根据相似度阈值确定目标数据集的确权结果的方法。具体来说,首先判断相似度:通过计算目标数据集与各个待比较数据集的相似度,判断各个待比较数据集的相似度是否大于相似度阈值。相似度可通过特征值的比较得出,一般是通过相似度计算方法将特征值转换为数值进行比较。然后统计相似度大于相似度阈值的待比较数据集个数:对于所有相似度大于相似度阈值的待比较数据集,进行统计计数。这意味着只有当待比较数据集与目标数据集的相似度超过设定的阈值时,才会被纳入计算。最后确定目标数据集的确权结果:根据相似度大于相似度阈值的待比较数据集的个数来决定目标数据集的确权结果。一般而言,可以通过将相似度大于相似度阈值的待比较数据集的个数和相似个数阈值来判断,其中相似个数阈值和相似度阈值的确定可以根据需求来设定。例如,如果设定相似个数阈值为2,则在有至少2个待比较数据集与目标数据集的相似度大于相似度阈值时,确定上述目标数据集不予确权。
通过以上步骤,该方法可以根据相似度阈值来确定目标数据集的确权结果。通过设定合适的相似度阈值和相似个数阈值,可以灵活地控制确权的要求,达到更精准的数据确权。
在一种实施例中,可信第三方中包括若干个指定用户时,根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的确权结果,包括:
各个指定用户根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的初步确权结果,并对初步确权结果上链;
还包括:
接收各个指定用户发送的初步确权结果;
根据各个初步确权结果确定最终确权结果。
本实施例中提到的场景是在可信第三方中包括若干个指定用户的情况下,根据相似度大于相似度阈值的待比较数据集的个数来确定目标数据集的确权结果。具体过程为:各个指定用户根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的初步确权结果,并将这些结果上链。这意味着每个指定用户会对目标数据集进行相似度计算,并得出初步确权结果。如果某个指定用户认为目标数据集与待比较数据集的相似度超过了设定的相似度阈值,他们会在区块链系统中上链记录这一信息。然后区块链系统接收各个指定用户发送的初步确权结果。在这一步骤中,区块链系统会收集各个指定用户对目标数据集的初步确权结果。这些初步确权结果会作为评估目标数据集确权结果的依据。最后,根据各个初步确权结果确定最终确权结果。区块链系统会对所有初步确权结果进行统计和分析,并依据这些结果来确定目标数据集的最终确权结果。例如,如果超过预设个数的指定用户的初步确权结果一致,则区块链系统会将这个结果作为最终确权结果。
通过本实施例实现了在可信第三方存在多个指定用户的情况下,利用初步确权结果来确定最终确权结果的方法。这种做法可以提高数据集确权的准确性和可信度,因为它考虑了多个用户的意见和判断,避免了个别用户对确权结果的不当影响。
在一种实施例中,各个指定用户根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的初步确权结果,包括:
各个指定用户根据预设公式确定相似度大于相似度阈值的待比较数据集的个数,根据相似度大于相似度阈值的待比较数据集的个数确定目标数据集的初步确权结果;
预设公式为:
,其中,n表示与目标数据集对应的待比较数据集的个数,i表示第i个特征,/>为相似度阈值,/>为目标数据集,x为目标数据集的标识,/>为待比较数据集,y为待比较数据集的标识,/>为目标数据集对应的第i个特征的特征提取函数,/>为目标数据集和待比较数据集在第i个特征上的相似度与相似度阈值的比较函数,比较函数输出0时表示目标数据集和待比较数据集在第i个特征上的相似度小于相似度阈值,比较函数输出1时表示目标数据集和待比较数据集在第i个特征上的相似度大于相似度阈值,/>表示目标数据集和各待比较数据集的相似度大于相似度阈值的待比较数据集的个数。
在一种实施例中,根据各个初步确权结果确定最终确权结果,包括:
根据各个初步确权结果中相似度大于相似度阈值的待比较数据集的个数和所有待比较数据集的个数确定最终确权结果。
本实施例描述了确定最终确权结果的具体步骤。首先,根据各个初步确权结果中相似度大于相似度阈值的待比较数据集的个数和所有待比较数据集的个数,来确定最终确权结果。具体而言,通过统计相似度大于相似度阈值的待比较数据集的个数,可以对目标数据集与这些数据集之间的相似度进行评估。如果有多个待比较数据集的相似度大于相似度阈值,说明目标数据集与这些数据集之间具有较高的相似性,即目标数据集更有可能与这些数据集有关联。而对所有待比较数据集的个数进行考虑,则是为了将目标数据集与其他数据集的关联程度进行全面的评估。如果所有待比较数据集的个数较少,可能会导致结果不够准确或可靠,因此需要综合考虑大量的数据集来确定最终确权结果。
综上,本实施例描述了通过比较目标数据集与所有待比较数据集之间的相似度,并根据相似度大于相似度阈值的待比较数据集的个数和所有待比较数据集的个数,来最终确定目标数据集的确权结果。这样可以提高确权过程的准确性和可靠性。
在一种实施例中,根据各个初步确权结果中相似度大于相似度阈值的待比较数据集的个数和所有待比较数据集的个数确定最终确权结果,包括:
判断相似度大于相似度阈值的待比较数据集的个数与所有待比较数据集的个数比值是否大于预设阈值,若大于预设阈值,则对目标数据集予以确权,否则,不予以确权。
本实施例是对数据集的确权结果进行确定的一种方法。在这个方法中,首先计算目标数据集与若干个待比较数据集的相似度。然后,判断相似度大于相似度阈值的待比较数据集的个数和所有待比较数据集的个数的比值是否大于预设阈值。如果满足这个条件,就对目标数据集进行确权;否则,不对目标数据集进行确权。
换句话说,通过计算目标数据集与待比较数据集的相似度,可以判断目标数据集是否与待比较数据集相似。如果有足够多的待比较数据集与目标数据集相似,即相似度大于相似度阈值的待比较数据集的个数与所有待比较数据集的个数的比值大于预设阈值,那么可以认为目标数据集的确权是被认可的,即对目标数据集进行确权。相反,如果待比较数据集与目标数据集的相似度不够高,即相似度大于相似度阈值的待比较数据集的个数与所有待比较数据集的个数的比值小于预设阈值,那么就不能对目标数据集进行确权。
这样的确权方法可以根据数据集之间的相似度来确定数据集的确权结果,从而保护数据集的权利。
在一种实施例中,接收目标数据集对应的数据包,并对数据包进行上链操作之后,还包括:
通过广播向可信第三方和/或区块链系统中的用户发送确权请求;
将数据包发送至可信第三方和/或区块链系统中的用户,触发可信第三方和/或区块链系统中的用户基于目标数据集对应的多个特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果,包括:
将数据包发送至可信第三方和/或区块链系统中的用户中接受确权请求的指定用户,以使指定用户基于目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果。
本实施例进一步详细说明了数据集确权方法的实施步骤。首先,在接收目标数据集对应的数据包之后,进行上链操作,将数据包存储在区块链系统中。接着,通过广播的方式向可信第三方和/或区块链系统中的用户发送确权请求,通知可信第三方和/或区块链系统中的用户进行确权操作。同时,数据包也会被发送至可信第三方和/或区块链系统中的用户,触发可信第三方和/或区块链系统中的用户进行确权操作。在这一步骤中,可信第三方和/或区块链系统中的用户需要使用目标数据集对应的多个特征值、若干个待比较数据集的特征值以及确权函数,来确定目标数据集的确权结果。
此外,在具体实施时,数据包具体会被发送至可信第三方和/或区块链系统中的用户中接受确权请求的指定用户。指定用户根据目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数来确定目标数据集的确权结果。
综上,本实施例详细说明了数据集确权方法的实施步骤,包括上链操作、广播确权请求、可信第三方和/或区块链系统中的用户确定确权结果以及指定用户参与确权操作。这一方法可以保证数据集的确权过程被记录在不可篡改的区块链上,并通过多方参与确权操作来增加可信度和准确性。
在一种实施例中,接收目标数据集对应的数据包,并对数据包进行上链操作之前,还包括:
触发数据所有者获取目标数据集的类型,并根据目标数据集的类型和类型-函数的对应关系确定与目标数据集对应的多个特征提取函数和确权函数,使用各特征提取函数计算目标数据集的各特征值,并将计算的多个特征值、确权函数发送至区块链系统。
本实施例进一步定义了在接收目标数据集对应的数据包并进行上链操作之前的一系列预处理步骤。这些步骤包括:其一,触发数据所有者获取目标数据集的类型:在确定目标数据集的特征提取函数和确权函数之前,需要触发数据所有者来获取目标数据集的类型。这可以通过与数据所有者进行通信来实现;其二,根据目标数据集的类型和类型-函数的对应关系确定与目标数据集对应的多个特征提取函数和确权函数:根据获取的目标数据集类型和预先定义的类型-函数对应关系,确定与目标数据集对应的多个特征提取函数和确权函数。这些函数是为了计算目标数据集的特征值和确权结果而设计的;其三,使用特征提取函数计算目标数据集的特征值:根据确定的多个特征提取函数,对目标数据集进行计算,生成目标数据集的多个特征值。特征值是通过对目标数据集进行特征提取得到的,用于后续确权操作的参考;其四,将多个特征值、确权函数发送至区块链系统:将计算得到的多个特征值和确权函数发送至区块链系统,以便进行后续的上链操作。这些信息将在区块链系统中使用,以确保数据集的确权操作可追溯和验证。
本实施例的目的是在进行数据集确权操作之前,通过获取数据集类型和确定必要的函数,确保数据集的确权过程的准确性和可信度。这样可以通过预先定义的函数和特征值来支持数据集的确权判断,并将相关信息记录在区块链系统中,以增加数据集确权结果的透明度和可靠性。
在一种实施例中,将确权结果反馈至数据所有者并将确权结果上链之后,还包括:
触发数据所有者获取确权结果,并在确权结果为予以确权时,向可信第三方申请对称加密密钥;
触发数据所有者接收可信第三方生成并发送的对称加密密钥并使用对称加密密钥对目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统。
本实施例描述了在数据集确权方法的实施中的一种额外步骤。具体而言,在可信第三方完成对目标数据集的确权操作后,数据所有者将被通知以获取确权的结果。这意味着数据所有者将被告知目标数据集是否已被确权。如果确权结果显示目标数据集已被确权,数据所有者将与可信第三方发起交互来进行下一步操作。交互的目的是为了确保数据的机密性。下一步操作为:数据所有者将向可信第三方申请对称加密密钥。对称加密密钥用于后续对目标数据集进行加密处理。可信第三方将生成一个对称加密密钥,并将该密钥发送给数据所有者。这个对称加密密钥将用于对目标数据集进行加密。数据所有者收到对称加密密钥后,将使用该密钥对目标数据集进行加密处理。通过将目标数据集加密,数据的机密性得到保护。最后,数据所有者将加密后的目标数据集上传至云计算系统。这确保只有具有正确密钥的授权用户才能够解密和访问这些数据。
本实施例的目的是保护数据的机密性,确保只有经过确权且获得授权的用户才能够解密和访问目标数据集。这通过使用对称加密密钥对数据进行加密来实现。
在一种实施例中,将确权结果反馈至数据所有者并将确权结果上链之前,还包括:
对确权结果进行签名,得到签名信息;
将确权结果反馈至数据所有者并将确权结果上链,包括:
将确权结果和签名信息反馈至数据所有者,并将确权结果和签名信息上链。
本实施例描述了在确权结果反馈给数据所有者并上链之前的操作。首先,在确权结果生成后,需要对确权结果进行签名操作,得到签名信息(区块链系统的签名信息)。签名操作是为了确保确权结果的完整性和真实性,以便后续验证确权结果的有效性。接下来,将确权结果和签名信息反馈给数据所有者。数据所有者接收到确权结果和签名信息后,可以验证签名的有效性,以确认确权结果的来源和完整性。这步操作可以防止任何人对确权结果进行篡改或伪造。最后,将确权结果和签名信息上链。在此步骤中,确权结果和签名信息会被记录到区块链系统中,以保证数据的永久存储和不可篡改性。区块链作为一个分布式的去中心化数据库,可以提供高度安全的数据存储和验证机制。
在一种实施例中,触发数据所有者获取确权结果,并在确权结果为予以确权时,向可信第三方申请对称加密密钥之前,还包括:
触发数据所有者获取签名信息,在并在签名信息验证通过时,进入触发数据所有者获取确权结果,并在确权结果为予以确权时,向可信第三方申请对称加密密钥的步骤。
本实施例中,在上述实施例中还包括签名信息时,数据所有者需要先获取与确权结果相关的签名信息,然后对签名进行验证。验证签名的目的是确保签名是由正确的实体生成的,并且确权结果没有被篡改。只有在签名经过验证后,才能继续后续的操作。一旦签名信息验证通过,数据所有者可以进一步触发操作,以获取确权结果。当确权结果为予以确权时,数据所有者可以继续触发操作,向可信第三方申请对称加密密钥。
本实施例确保了数据所有者在获取确权结果之前,先进行签名信息验证以确保数据的完整性和真实性,然后再申请对称加密密钥进行数据的保护和安全传输。这样可以在确权过程中提供更高的数据安全保障。
在一种实施例中,可信第三方生成对称加密密钥之后,还包括:
基于对称加密密钥生成访问密钥。
本实施例中,在可信第三方生成对称加密密钥后,还基于该对称加密密钥生成访问密钥。这里的对称加密密钥是一种加密算法中使用的密钥,用于对目标数据集进行加密处理,保护数据的安全性。生成访问密钥是为了在后续的数据访问过程中,实现对加密后的目标数据集的解密和访问控制。访问密钥是基于对称加密密钥生成的,它可以用于解密目标数据集,并且只有持有该访问密钥的用户才能成功解密和访问数据。生成访问密钥的过程涉及一些密钥派生算法或密钥管理系统,这样可以确保生成的访问密钥的安全性。只有获取了正确的访问密钥的用户才能进行数据解密和访问操作,其他未授权的人员无法获取有效的访问密钥,从而保证了数据的安全和隐私。
在一种实施例中,还包括:
接收数据使用者发送的目标数据集的访问申请;
在数据使用者满足预设访问条件时,将访问密钥分为若干个份额;
将部分访问密钥的份额分配给数据使用者,以授权数据使用者访问目标数据集;
触发数据使用者将访问密钥的份额与云计算系统中各个数据集的访问密钥进行匹配,并在匹配成功时,允许数据使用者对云计算系统中存储的目标数据集进行访问。
本实施例描述了一种针对数据使用者的链上访问授权以及链下访问的过程。这一实施例的原理是通过链上访问授权和链下访问的方式确保目标数据集的合法访问控制,并保障数据的安全性和隐私保护。
该过程包括以下步骤:数据使用者向系统发送请求,要求访问目标数据集。区块链系统根据事先设定的条件判断数据使用者是否满足访问要求(这些条件可以包括用户身份验证、访问权限、访问时间等),如果满足,则将访问密钥拆分成若干份。区块链系统将拆分后的访问密钥份额分发给数据使用者,以授权其对目标数据集进行访问。数据使用者使用其获得的密钥份额与云计算系统中存储的各个数据集的访问密钥进行匹配。如果数据使用者的密钥份额与云计算系统中的相应密钥匹配成功,系统将允许数据使用者对存储在云计算系统中的目标数据集进行访问。
例如,访问密钥可以分为授权密钥、路径密钥和验证密钥三个份额,用户能够获取授权密钥和路径密钥两个份额(此步骤可以确保数据使用者满足预设的访问条件,并获得有效的密钥份额才能访问目标数据集。这样可以保障数据的安全性和隐私保护),云计算系统获取路径密钥和验证密钥两个份额,数据使用者转发通过区块链系统获取到的授权密钥和路径密钥至云计算系统与云计算系统中的路径密钥和验证密钥进行匹配,若二者的路径密钥相同时,确定对应的训练数据集为目标数据集,从而数据使用者可以对云计算系统存储的目标数据集进行访问申请。
通过以上步骤,可以确保了对目标数据集的合法访问控制。数据使用者需要满足预设的访问条件,并获得有效的密钥份额才能访问目标数据集,从而确保数据的安全性和隐私保护。
此外,本实施例中的方式相比于单纯的链上授权访问,本实施例采用链上授权和链下访问的方式,可以减轻区块链系统的存储压力。因为链上存储空间有限,通过链下访问可以避免在链上存储过多的目标数据集。此外,数据使用者也无需实时在线。相比于单纯的链下授权访问而言,将授权过程公开,以便于了解所有访问的数据使用者。这样可以方便追溯访问记录,增加了可追溯性。
在一种实施例中,触发数据所有者接收可信第三方生成并发送的对称加密密钥并使用对称加密密钥对目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统之后,还包括:
生成与目标数据集对应的访问控制策略,并将访问控制策略上传至区块链系统和云计算系统;
允许数据使用者对云计算系统中存储的目标数据集进行访问,包括:
根据访问控制策略允许数据使用者对云计算系统中存储的目标数据集进行访问。
本实施例进一步描述了在确权后,数据所有者需要生成与目标数据集对应的访问控制策略,并将此策略上传至区块链系统和云计算系统。访问控制策略是一种定义了谁能够访问数据、何时可以访问、以及访问权限级别的规则集合。一旦访问控制策略被上传至区块链系统和云计算系统,该策略就会与目标数据集相关联,并作为一个关键要素用于控制数据使用者对云计算系统中存储的目标数据集的访问。
在这种实施例中,数据使用者可以提交访问申请,数据所有者接收并处理此申请。当数据使用者满足预设访问条件时,访问密钥将被分成若干个份额,并将部分份额授权给数据使用者。接着,数据使用者需要将其访问密钥的份额与云计算系统中各个数据集的访问密钥进行匹配。如果匹配成功,数据使用者将被允许对云计算系统中存储的目标数据集进行访问。整个访问控制过程是基于上传的访问控制策略进行的。数据使用者的访问权限是由访问控制策略决定的,只有当数据使用者满足访问控制策略中定义的条件时,才能成功访问目标数据集。
通过区块链系统的透明性和不可篡改性,确权后的访问控制策略可以有效地保护目标数据集的安全性和可控性。任何人都可以通过区块链系统验证数据所有者上传的访问控制策略,并确保数据使用者的访问行为符合确权后设定的规则。
在一种实施例中,接收数据使用者发送的目标数据集的访问申请之后,还包括:
对数据使用者的身份有效性及信用度进行验证;
在数据使用者的身份有效性及信用度满足预设要求时,判定数据使用者满足预设访问条件。
本实施例进一步描述了在接收数据使用者发送的目标数据集的访问申请之后,进行数据使用者身份验证和信用度评估的过程,以判断数据使用者是否满足预设的访问条件。在这个实施例中,数据使用者的身份有效性和信用度验证是为了确保只有合法的用户可以访问目标数据集,并且能够信任这些用户不会滥用或泄露数据。验证和评估的过程包括以下步骤:验证数据使用者提供的身份信息是否有效。这可能涉及验证用户的姓名、组织或单位、身份证件号码等信息的真实性和合法性。可以通过与相关机构或数据库进行信息比对,检查数据使用者是否具有合法的身份。评估数据使用者的信用度,包括其过去的行为记录等。可以考虑使用信用数据机构或第三方平台的信用评估服务,对数据使用者进行信用评分或信用等级的划分。评估的结果将有助于判断数据使用者是否可信。根据预设的访问条件,对经过身份验证和信用度评估的数据使用者进行判定。预设要求可能基于不同的因素,如用户的身份类型、信用评分、付款能力、访问目的等。只有当数据使用者满足预设要求时,才能继续进行后续操作。
数据使用者的身份验证和信用度评估有助于确保目标数据集的访问仅限于合法和可信的用户。通过这种方式,可以增强数据集的安全性和隐私保护,防止未经授权的访问和数据滥用。
在一种实施例中,还包括:
在数据使用者访问目标数据集的过程中,重新进入将数据包发送至可信第三方,触发可信第三方基于目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果的步骤。
本实施例描述了一种链上再确权的步骤,具体的,在数据使用者访问目标数据集的过程中,重新触发确权操作的步骤。该步骤的目的是确保在数据使用者访问目标数据集时,数据集的确权结果仍然有效且可信。
具体而言,该步骤包括可以包括:数据使用者发起对目标数据集的访问请求。在接收到访问请求后,区块链系统重新触发将数据包发送至可信第三方的操作。进而可信第三方基于目标数据集对应的特征值、若干个待比较数据集的特征值和确权函数,再次确定目标数据集的确权结果。根据重新确权的结果,区块链系统判断目标数据集的确权结果是否发生变化。如果确权结果没有发生变化,则允许数据使用者继续对云计算系统中存储的目标数据集进行访问。
通过重新触发确权操作,可以及时检测到目标数据集是否发生篡改或未经授权的访问,并确保数据使用者在访问目标数据集时得到的是最新的确权结果。这样可以提高数据的安全性和可信度,保护数据所有者的合法权益。
为进一步对本申请进行说明,本申请在此提供一个具体实施例:
本申请具体实施以图像类型的人工智能训练数据集为例,其中涉及身份及签名验证过程均使用签名/验签公私钥对,涉及安全传输信息的均使用加密/解密的公/私钥对,详细过程中不再重复描述,其他过程主要概括为七个部分,分别为(1)初始化,(2)预处理,(3)链上授权,(4)链下存储,(5)链上授权,(6)链下访问,(7)链上再授权,如图2所示,以下将对这7个过程进行详细描述:
(1)初始化
步骤1.1:初始化可信第三方,包括但不限于:配置访问地址、数据格式标准{标签,1024*1024数据};配置部署基于RSA加密与签名系统,用于生成参与者的密钥,其中包含可信第三方用于签名/验签、加密/解密的公/私钥对;配置可信第三方的数据交易中心维护的链上已确权数据集等。/>
步骤1.2:初始化云计算系统,包括但不限于:配置访问地址;向步骤1.1中可信第三方申请用于签名/验签、加密/解密的公/私钥对;配置身份认证及系统、文件(训练数据集)的访问控制策略。
步骤1.3:初始化区块链系统,包括但不限于:配置访问地址;向步骤1.1中可信第三方申请用于签名/验签、加密/解密的公/私钥对;配置身份认证及系统访问控制策略;设置特征提取函数及其特征相似度阈值/>,用于提取不同训练数据集的不同特征值并根据特征相似度阈值判定两个数据集是否相似,其中:/>代表哈希函数(如50%以上特征值不同则代表确权)、/>代表所有数据元素按二进制位执行异或计算(如相同位置上50%以上二进制位不同则代表确权),/>代表所有数据元素按二进制位计算汉明距离(如50%以上汉明距离值不同则代表确权);设置所有图像数据集类型均需要/>两个特征提取函数提取特征值,以配置确权策略(相似度阈值小于50%则代表确权);设置如下确权函数F及其确权阈值/>用于多个参与者提交确权结果时区块链系统判定并输出最终确权结果,例如确权函数F为:
,(在上述实施例中以对F中的各个参数的函数进行解释,在此不再赘述)。
步骤1.4:数据所有者和数据使用者(统称:用户)选择身份标识信息并注册成为步骤1.1-1.3系统中的合法用户,并向步骤1.1中可信第三方申请用于签名/验签、加密/解密的公/私钥对。
(2)预处理
步骤2.1:数据所有者对数据集进行清洗、整理及格式化等操作形成标准化的数据集。
步骤2.2:数据所有者根据步骤2.1中数据集类型及步骤1.3中区块链系统设置的确权策略,选择上链确权所需的多特征提取函数/>并输出确权函数:
,其中/>(此两个公式的参数含义在上述实施例中已经给出,在此不再赘述,其中相似度阈值为0.5,待比较数据集的个数为2)。
步骤2.3:数据所有者根据步骤2.2中多特征提取函数对数据集进行预处理计算获取目标数据集的特征值,将特征值与确权函数/>以及身份等相关信息进行签名并上传区块链系统申请上链、确权。
(3)链上确权
步骤3.1:区块链系统接收步骤2.3中数据所有者上传的数据包,首先验证签名以确认数据所有者的身份有效性以及信任度,若身份有效性验证通过且信任度满足系统要求,则对接收的数据执行上链操作(打包上传数据并进行签名作为区块链系统的区块)。
步骤3.2:区块链系统通过广播向数据交易中心以及区块链系统用户(也即可信第三方)发送确权请求,并向接受确权请求的数据交易中心和区块链系统用户发送步骤3.1中申请上链的目标数据集的特征值及其确权函数。
步骤3.3:接受步骤3.2中确权请求的数据交易中心和系统用户(统称:指定用户)收到上链的目标数据集的特征值及其确权函数后,根据可获取的其他待比较数据集进行数据集的相似性对比计算:
,(公式的参数含义在上述实施例中已经给出,在此不再赘述)。
步骤3.4:步骤3.3中指定用户对其输出的确权结果以及待比较数据集标识进行签名,并将签名信息上传区块链。
步骤3.5:区块链系统收到步骤3.4中签名信息后,首先验证签名有效性及其信用度,以便获取确权结果的有效性,若予以确权令,否则/>。其中,/>为各指定用户得到的确权结果中不予确权的待比较数据集的个数(即为确权函数/>的输出值),/>为予以确权的对比数据集个数,/>为所有指定用户输出的确权结果中予以确权的待比较数据集的个数,/>为所有指定用户输出的确权结果中不予以确权的待比较数据集的个数,/>初始状态下为零。
步骤3.6:区块链系统根据要求收集完成步骤3.5中确权反馈结果后,计算:
,/>为予以确权的待比较数据集的个数和所有待比较数据集的个数的比值,若/>则对数据所有者提交的目标数据集予以确权(即予以确权的对比数据集个数占全部对比数据集个数的90%以上),否则不予确权。最后,将确权结果及其签名(统称:签名信息)反馈数据所有者,并上传区块链。
(4)链下存储
步骤4.1:数据所有权者收到区块链系统反馈签名信息后,验证签名有效性并提取确权结果。如果予以确权则向可信第三方转发步骤3.6中签名信息并申请对称加密密钥;否则结束该过程。
步骤4.2:可信第三方收到步骤4.1中申请后,验证转发的签名信息并为数据所有权者生成对称加密密钥,并将该密钥以安全信道发送给数据所有权者;同时基于对称加密密钥为云计算系统和区块链系统创建并访问密钥。
步骤4.3:数据所有权者收到步骤4.2中对称加密密钥后,对目标数据集进行加密,并上传至云计算系统进行外包存储,同时制定相应的访问控制策略并同步区块链系统和云计算系统。
(5)链上授权
步骤5.1:数据使用者向区块链系统发送访问申请,请求访问目标(训练)数据集。
步骤5.2:区块链系统验证步骤5.1访问申请中数据使用者的身份有效性及其信用度,如果身份有效且信用度满足系统要求,则通过访问密钥的份额授权该用户访问目标数据集。如图3所示,访问密钥/>可以分为授权密钥/>、路径密钥/>和验证密钥/>三个份额(即:/>),数据使用者能够获取授权密钥和路径密钥两个份额(图4中2.授权的过程)。
步骤5.3:区块链系统通过访问密钥的其他份额与云计算系统建立访问控制映射关系。例如:步骤5.2中,云计算系统获取路径密钥和验证密钥两个份额。/>
(6)链下访问
步骤6.1:数据使用者通过转发步骤5.2中获取到的授权份额(如授权密钥和路径密钥两个份额)及其签名信息至云计算系统对存储的目标数据集进行访问申请。
步骤6.2:如果云计算系统通过步骤6.1中数据使用者的访问请求验证(签名+秘密恢复的双重验证,其中秘密恢复的验证为:收到的授权密钥、路径密钥和验证密钥是否能正确恢复共享的访问控制密钥),则根据步骤4.3中数据所有者制定的访问控制策略允许数据使用者对目标数据集执行读、写等权限的访问。
(7)链上再确权
步骤7.1:数据使用者在访问目标数据集的过程中,可以利用已知的数据集与区块链系统进行交互,执行步骤3.3-3.6中的确权操作对访问的目标数据进行再确权,以增加数据使用者本身的信用度。如果予以确权则区块链增加该数据使用者的确权信息并提升该数据使用者信用度,若不予确权则需提供相应证据以便可信第三方、区块链系统等参与者进行再次确认,以完善数据使用者的信用度及保护数据所有者的权益。
步骤7.2:数据使用者根据服务模式,在允许再授权的情况下转发步骤5.2中的信息给其他数据使用者进行再授权访问(需执行步骤6.1-6.2)以及再授权(需执行步骤7.1)。
综上,本实施例具有以下有益效果:(1)安全、高效、灵活的链上确权:数据所有者通过数据集预处理技术获取数据集的多个特征并上传区块链系统;区块链系统通过多特征相似度对比技术对实现安全、高效的数据确权;(2)安全、实用的链下存储:数据所有者将数据集进行加密并存储到云计算系统,同时在区块链与云计算系统之间建立共享密钥,支持安全、灵活的链上链下协同认证授权与访问控制;(3)安全、精准的链上授权:区块链系统通过公钥加密与签名认证技术,实现对数据使用者的精确身份认证与基于秘密共享的安全授权(共享秘密份额的安全分发);(4)安全、灵活的链下访问:区块链系统通过秘密共享为数据使用者、云计算系统分发访问控制密钥的共享秘密份额;云计算系统通过秘密恢复实现安全的访问请求验证与灵活的数据集访问控制;(5)实用的信用与服务管理:通过区块链的信用管理和服务管理功能,支持数据集的再授权与再确权,增强数据所有者的权益保护,最大限度的促进数据流通与价值最大化。
为解决上述技术问题,本申请还提供了一种数据集确权系统,如图5所示,该系统应用于区块链系统,包括:
数据包接收单元51,用于接收目标数据集对应的数据包,并对数据包进行上链操作,数据包包括与目标数据集对应的多个特征值和确权函数,多个特征值是基于与目标数据集对应的多个特征提取函数计算的;
确权单元52,用于将数据包发送至可信第三方和/或区块链系统中的用户,触发可信第三和/或区块链系统中的用户方基于目标数据集对应的多个特征值、若干个待比较数据集的特征值和确权函数确定目标数据集的确权结果。
对于数据集确权系统的介绍请参照上述实施例,本申请在此不再赘述。
为解决上述技术问题,本申请还提供了一种数据集确权装置,如图6所示,包括:
存储器61,用于存储计算机程序;
处理器62,用于在存储计算机程序时,实现如上述的数据集确权方法的步骤。
对于数据集确权装置的介绍请参照上述实施例,本申请在此不再赘述。
为解决上述技术问题,本申请还提供了一种计算机可读存储介质70,如图7所示,计算机可读存储介质70上存储有计算机程序71,计算机程序71被处理器62执行时实现如上述的数据集确权方法的步骤。对于计算机可读存储介质70的介绍请参照上述实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (21)
1.一种数据集确权方法,其特征在于,应用于区块链系统,包括:
接收目标数据集对应的数据包,并对所述数据包进行上链操作,所述数据包包括与所述目标数据集对应的多个特征值和确权函数,多个所述特征值是基于与所述目标数据集对应的多个特征提取函数计算的;
将所述数据包发送至可信第三方和/或区块链系统中的用户,触发所述可信第三方和/或所述区块链系统中的用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,将所述确权结果反馈至数据所有者并将所述确权结果上链。
2.如权利要求1所述的数据集确权方法,其特征在于,接收目标数据集对应的数据包,包括:
接收数据所有者发送的目标数据集对应的数据包,所述数据包中还包括所述数据所有者的身份信息;
对所述数据包进行上链操作之前,还包括:
验证所述数据所有者的身份信息的有效性和信用度;
在所述数据所有者的身份信息的有效性和信用度满足预设要求时,进入对所述数据包进行上链操作的步骤。
3.如权利要求1所述的数据集确权方法,其特征在于,基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,包括:
基于所述目标数据集对应的多个特征值、若干个所述待比较数据集的特征值计算所述目标数据集和各个所述待比较数据集的相似度;
根据各个所述相似度确定所述目标数据集的确权结果。
4.如权利要求3所述的数据集确权方法,其特征在于,根据各个所述相似度确定所述目标数据集的确权结果,包括:
判断所述目标数据集与各个所述待比较数据集的相似度是否大于相似度阈值;
统计所述相似度大于所述相似度阈值的待比较数据集的个数;
根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的确权结果。
5.如权利要求4所述的数据集确权方法,其特征在于,所述可信第三方中包括若干个指定用户时,根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的确权结果,包括:
各个所述指定用户根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果,并对所述初步确权结果上链;
还包括:
接收各个所述指定用户发送的初步确权结果;
根据各个所述初步确权结果确定最终确权结果。
6.如权利要求5所述的数据集确权方法,其特征在于,各个所述指定用户根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果,包括:
各个所述指定用户根据预设公式确定所述相似度大于所述相似度阈值的待比较数据集的个数,根据所述相似度大于所述相似度阈值的待比较数据集的个数确定所述目标数据集的初步确权结果;
所述预设公式为:
,其中,n表示与所述目标数据集对应的待比较数据集的个数,i表示第i个特征,/>为所述相似度阈值,/>为所述目标数据集,x为所述目标数据集的标识,/>为所述待比较数据集,y为所述待比较数据集的标识,/>为所述目标数据集对应的第i个特征的特征提取函数,/>为所述目标数据集和所述待比较数据集在所述第i个特征上的相似度与相似度阈值的比较函数,所述比较函数输出0时表示所述目标数据集和所述待比较数据集在所述第i个特征上的相似度小于所述相似度阈值,所述比较函数输出1时表示所述目标数据集和所述待比较数据集在所述第i个特征上的相似度大于所述相似度阈值,/>表示所述目标数据集和各所述待比较数据集的相似度大于所述相似度阈值的待比较数据集的个数。
7.如权利要求5所述的数据集确权方法,其特征在于,根据各个所述初步确权结果确定最终确权结果,包括:
根据各个所述初步确权结果中所述相似度大于所述相似度阈值的待比较数据集的个数和所有所述待比较数据集的个数确定所述最终确权结果。
8.如权利要求7所述的数据集确权方法,其特征在于,根据各个所述初步确权结果中所述相似度大于所述相似度阈值的待比较数据集的个数和所有所述待比较数据集的个数确定所述最终确权结果,包括:
判断所述相似度大于所述相似度阈值的待比较数据集的个数与所有所述待比较数据集的个数比值是否大于预设阈值,若大于所述预设阈值,则对所述目标数据集予以确权,否则,不予以确权。
9.如权利要求1所述的数据集确权方法,其特征在于,接收目标数据集对应的数据包,并对所述数据包进行上链操作之后,还包括:
通过广播向所述可信第三方和/或所述区块链系统中的用户发送确权请求;
将所述数据包发送至可信第三方和/或区块链系统中的用户,触发所述可信第三方和/或所述区块链系统中的用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,包括:
将所述数据包发送至所述可信第三方和/或所述区块链系统中的用户中接受所述确权请求的指定用户,以使所述指定用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果。
10.如权利要求1所述的数据集确权方法,其特征在于,接收目标数据集对应的数据包,并对所述数据包进行上链操作之前,还包括:
触发所述数据所有者获取所述目标数据集的类型,并根据所述目标数据集的类型和类型-函数的对应关系确定与所述目标数据集对应的多个特征提取函数和确权函数,使用各所述特征提取函数计算所述目标数据集的各特征值,并将计算的多个所述特征值、所述确权函数发送至所述区块链系统。
11.如权利要求1-10任一项所述的数据集确权方法,其特征在于,将所述确权结果反馈至数据所有者并将所述确权结果上链之后,还包括:
触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,向所述可信第三方申请对称加密密钥;
触发所述数据所有者接收所述可信第三方生成并发送的对称加密密钥并使用所述对称加密密钥对所述目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统。
12.如权利要求11所述的数据集确权方法,其特征在于,将所述确权结果反馈至数据所有者并将所述确权结果上链之前,还包括:
对所述确权结果进行签名,得到签名信息;
将所述确权结果反馈至数据所有者并将所述确权结果上链,包括:
将所述确权结果和所述签名信息反馈至所述数据所有者,并将所述确权结果和所述签名信息上链。
13.如权利要求12所述的数据集确权方法,其特征在于,触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,向所述可信第三方申请对称加密密钥之前,还包括:
触发所述数据所有者获取所述签名信息,并在签名信息验证通过时,进入触发所述数据所有者获取所述确权结果,并在所述确权结果为予以确权时,进入向所述可信第三方申请对称加密密钥的步骤。
14.如权利要求11所述的数据集确权方法,其特征在于,还包括:
基于所述对称加密密钥生成访问密钥。
15.如权利要求14所述的数据集确权方法,其特征在于,还包括:
接收数据使用者发送的目标数据集的访问申请;
在所述数据使用者满足预设访问条件时,将所述访问密钥分为若干个份额;
将部分所述访问密钥的份额分配给所述数据使用者,以授权所述数据使用者访问所述目标数据集;
触发所述数据使用者将所述访问密钥的份额与所述云计算系统中各个数据集的访问密钥进行匹配,并在匹配成功时,允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问。
16.如权利要求15所述的数据集确权方法,其特征在于,触发所述数据所有者接收所述可信第三方生成并发送的对称加密密钥并使用所述对称加密密钥对所述目标数据集进行加密处理,并将加密后的目标数据集上传至云计算系统之后,还包括:
生成与所述目标数据集对应的访问控制策略,并将所述访问控制策略上传至所述区块链系统和所述云计算系统;
允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问,包括:
根据所述访问控制策略允许所述数据使用者对所述云计算系统中存储的目标数据集进行访问。
17.如权利要求15所述的数据集确权方法,其特征在于,接收数据使用者发送的目标数据集的访问申请之后,还包括:
对所述数据使用者的身份有效性及信用度进行验证;
在所述数据使用者的身份有效性及信用度满足预设要求时,判定所述数据使用者满足所述预设访问条件。
18.如权利要求15所述的数据集确权方法,其特征在于,还包括:
在所述数据使用者访问所述目标数据集的过程中,重新进入将所述数据包发送至可信第三方,触发所述可信第三方基于所述目标数据集对应的特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果的步骤。
19.一种数据集确权系统,其特征在于,应用于区块链系统,包括:
数据包接收单元,用于接收目标数据集对应的数据包,并对所述数据包进行上链操作,所述数据包包括与所述目标数据集对应的多个特征值和确权函数,多个所述特征值是基于与所述目标数据集对应的多个特征提取函数计算的;
确权单元,用于将所述数据包发送至可信第三方和/或区块链系统中的用户,触发所述可信第三方和/或所述区块链系统中的用户基于所述目标数据集对应的多个特征值、若干个待比较数据集的特征值和所述确权函数确定所述目标数据集的确权结果,将所述确权结果反馈至数据所有者并将所述确权结果上链。
20.一种数据集确权装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现如权利要求1-18任一项所述的数据集确权方法的步骤。
21.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-18任一项所述的数据集确权方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311516901.1A CN117235804B (zh) | 2023-11-15 | 2023-11-15 | 一种数据集确权方法、系统、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311516901.1A CN117235804B (zh) | 2023-11-15 | 2023-11-15 | 一种数据集确权方法、系统、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117235804A CN117235804A (zh) | 2023-12-15 |
CN117235804B true CN117235804B (zh) | 2024-02-23 |
Family
ID=89084693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311516901.1A Active CN117235804B (zh) | 2023-11-15 | 2023-11-15 | 一种数据集确权方法、系统、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117235804B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114401138A (zh) * | 2022-01-14 | 2022-04-26 | 中国工商银行股份有限公司 | 认证方法、装置、计算机设备和存储介质 |
CN116305185A (zh) * | 2023-01-09 | 2023-06-23 | 招商银行股份有限公司 | 数据处理方法、系统及计算机可读存储介质 |
CN116488816A (zh) * | 2022-01-13 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 一种基于区块链网络的数据处理方法、装置及存储介质 |
CN117061538A (zh) * | 2022-05-05 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 一种基于区块链网络的共识处理方法及相关装置 |
-
2023
- 2023-11-15 CN CN202311516901.1A patent/CN117235804B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116488816A (zh) * | 2022-01-13 | 2023-07-25 | 腾讯科技(深圳)有限公司 | 一种基于区块链网络的数据处理方法、装置及存储介质 |
CN114401138A (zh) * | 2022-01-14 | 2022-04-26 | 中国工商银行股份有限公司 | 认证方法、装置、计算机设备和存储介质 |
CN117061538A (zh) * | 2022-05-05 | 2023-11-14 | 腾讯科技(深圳)有限公司 | 一种基于区块链网络的共识处理方法及相关装置 |
CN116305185A (zh) * | 2023-01-09 | 2023-06-23 | 招商银行股份有限公司 | 数据处理方法、系统及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117235804A (zh) | 2023-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108876332B (zh) | 一种基于生物特征标记认证的区块链安全交易方法及装置 | |
CN110383757B (zh) | 用于安全处理电子身份的系统和方法 | |
US8474025B2 (en) | Methods and apparatus for credential validation | |
JP4460763B2 (ja) | 生物測定データを用いた暗号キー発生法 | |
US20190205547A1 (en) | Providing and checking the validity of a virtual document | |
CN112926092A (zh) | 保护隐私的身份信息存储、身份认证方法及装置 | |
CN110990827A (zh) | 一种身份信息验证方法、服务器及存储介质 | |
US10771441B2 (en) | Method of securing authentication in electronic communication | |
US20090293111A1 (en) | Third party system for biometric authentication | |
US20200274714A1 (en) | System for, method of, and server computer system for implementing transformation of an original entity into a verifiably authenticable entity in a heterogeneous communications network environment | |
CN108616531B (zh) | 一种射频信号安全通信方法及系统 | |
KR20170141976A (ko) | 전자 서명 서비스 시스템 및 방법 | |
CN104065487A (zh) | 一种基于数字指纹随机密值ibc身份认证方法 | |
CN112231366B (zh) | 一种基于区块链的企业信用报告查询方法、装置及系统 | |
CN110737915B (zh) | 基于隐式证书的抗量子计算匿名身份识别方法及系统 | |
US11444784B2 (en) | System and method for generation and verification of a subject's identity based on the subject's association with an organization | |
US7739500B2 (en) | Method and system for consistent recognition of ongoing digital relationships | |
KR101876672B1 (ko) | 블록 체인을 이용한 전자 서명 방법 및 이를 실행하는 시스템 | |
KR20200016506A (ko) | 익명 디지털 아이덴티티 수립 방법 | |
CN117235804B (zh) | 一种数据集确权方法、系统、装置及介质 | |
US11729159B2 (en) | System security infrastructure facilitating protecting against fraudulent use of individual identity credentials | |
KR101868564B1 (ko) | 사용자 본인 확인(identification) 등록과 로컬 인증을 연계한 사용자 인증 장치 및 방법 | |
CN113761530A (zh) | 数据的提供方法、装置和系统 | |
CN111600721A (zh) | 一种基于多人投票机制的资产管理系统、方法及装置 | |
CN116561739B (zh) | 数据交易方法以及装置、电子设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |