CN115906166A - 区块链共享私有数据的信息处理方法及装置 - Google Patents

区块链共享私有数据的信息处理方法及装置 Download PDF

Info

Publication number
CN115906166A
CN115906166A CN202211493939.7A CN202211493939A CN115906166A CN 115906166 A CN115906166 A CN 115906166A CN 202211493939 A CN202211493939 A CN 202211493939A CN 115906166 A CN115906166 A CN 115906166A
Authority
CN
China
Prior art keywords
data
node
private data
characteristic parameter
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211493939.7A
Other languages
English (en)
Inventor
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211493939.7A priority Critical patent/CN115906166A/zh
Publication of CN115906166A publication Critical patent/CN115906166A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种区块链共享私有数据的信息处理方法及装置,涉及区块链技术领域,其中该方法包括:从公共数据池获取各节点共享的多个私有数据,根据预设的特征参数值将符合条件的私有数据拆分为数据项,并经聚类处理得到分类数据,将分类数据按照区块链共识算法、签名机制及数据大小顺序,生成一套可供不同区块链各节点共享的区块数据链,发布至公共数据池。本发明实现了不同区块链网络节点的私有数据的汇总,并通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,确保了私有数据信息汇总的安全性和可靠性。

Description

区块链共享私有数据的信息处理方法及装置
技术领域
本发明涉及区块链技术领域,尤其涉及一种区块链共享私有数据的信息处理方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着区块链技术的发展,各大机构纷纷推出各自的区块链应用,并且随着实际应用场景的拓展,各机构及企业也纷纷加入到不同区块链应用中,成为多个应用中的节点。节点中的数据量越来越大,覆盖的应用场景与领域也越来越多,在大数据分析及人工智能发展的背景下,不同领域的数据多元互动交流,不同区块链网络的节点之间通过多种方式进行数据信息共享,最大化利用全景数据视图,挖掘数据价值。在这种情况下,不同区块链系统的多个节点之间按照业务场景进行分享的隐私数据信息汇总整合的需求逐渐显露出来了,但是现有的区块链共享私有数据的信息处理方法中主要是针对不同区块链网络之间的数据进行收集或汇总,通常会有一个中心化的组织或机构完成这项工作,并没有针对不同区块链网络的节点之间共享的私有数据进行安全可靠的信息汇总处理,区块链网络自身的隐私机制使得节点之间私有数据的信息处理变得困难,因为不同区块链网络的架构及底层技术可能不同,数据存储结构与加密机制也就不同。同时,考虑到区块数据的技术上的特殊性以及复杂度,中心化的信息汇总方案无法解决节点之间的信任问题,保证数据的隐私性,同时不同节点会因不同应用场景对数据信息有不同的定制化需求,目前的解决方案中并不能很好的做到以上两点。
发明内容
本发明实施例提供一种区块链共享私有数据的信息处理方法,用以将不同区块链网络节点的私有数据进行汇总,并保证各区块链网络节点的私有数据的私密性和完整性,确保私有数据信息汇总的安全性和可靠性,该方法应用于区块链中的每一节点,该方法包括:
从公共数据池获取各节点共享的多个私有数据;
以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
对拆分获得的数据项进行聚类,获得分类数据;
将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
本发明实施例还提供一种区块链共享私有数据的信息处理装置,用以将不同区块链网络节点的私有数据进行汇总,并保证各区块链网络节点的私有数据的私密性和完整性,确保私有数据信息汇总的安全性和可靠性,该装置应用于区块链中的每一节点,该装置包括:
数据获取模块,用于从公共数据池获取各节点共享的多个私有数据;
数据校验模块,用于以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
特征参数加工模块,用于对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
数据项拆分模块,用于以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
聚类模块,用于对拆分获得的数据项进行聚类,获得分类数据;
信息整合模块,用于将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述区块链共享私有数据的信息处理方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述区块链共享私有数据的信息处理方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述区块链共享私有数据的信息处理方法。
本发明实施例中区块链共享私有数据的信息处理方法,从公共数据池获取各节点共享的多个私有数据,根据预设的特征参数值将符合条件的私有数据拆分为数据项,并经聚类处理得到分类数据,将分类数据按照区块链共识算法、签名机制及数据大小顺序,生成一套可供不同区块链各节点共享的区块数据链,发布至公共数据池,实现了不同区块链网络节点的私有数据的汇总,并通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,确保了私有数据信息汇总的安全性和可靠性,各节点将区块数据链发布到公共数据池后,与其他节点共享各自的区块数据链,实现按需数据信息分组,为其他应用场景提供模块化数据。
随着区块链技术的发展,各区块链节点中的数据量越来越大,覆盖的应用场景与领域也越来越多,在大数据分析及人工智能发展的背景下,本发明实施例为不同领域的区块数据多元互动交流提供一种安全可靠的信息处理方法,保证区块链的私有数据信息汇总时各私有数据的独立、安全、可靠、可追溯及不被篡改,能够使得不同区块链网络的节点最大化利用全景数据视图,挖掘数据价值,提高数据利用率满足各类场景需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中区块链共享私有数据的信息处理方法的流程示意图;
图2为本发明实施例中区块链共享私有数据的信息处理方法的一具体实例;
图3为本发明实施例中区块链共享私有数据的信息处理方法的一具体实例;
图4为本发明实施例中区块链共享私有数据的信息处理装置的结构示意图;
图5为本发明实施例中计算机设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
首先对本发明涉及的技术名词进行解释。
层次聚类算法与K-means算法:
层次聚类算法将数据集划分为一层一层的簇,后面一层生成的簇基于前面一层的结果。层次聚类算法一般分为两类:Agglomerative层次聚类:又称自底向上(bottom-up)的层次聚类,每一个对象最开始都是一个簇,每次按一定的准则将最相近的两个簇合并生成一个新的簇,如此往复,直至最终所有的对象都属于一个簇;Divisive层次聚类:又称自顶向下(top-down)的层次聚类,最开始所有的对象均属于一个簇,每次按一定的准则将某个簇划分为多个簇,如此往复,直至每个对象均是一个簇;k-means算法是一种划分式聚类方法,通过确定聚类中心及反复迭代对数据集进行划分。
签名机制:
数字签名(又称公钥数字签名)是只有信息的发送者才能产生的别人无法伪造的一段数字串,这段数字串同时也是对信息的发送者发送信息真实性的一个有效证明。
共识算法:
区块链是一种去中心化的分布式账本系统,可以用于登记和发行数字化资产、产权凭证、积分等,并以点对点的方式进行转账、支付和交易。区块链系统与传统中心化系统相比,具有公开透明、不可篡改、防止多重支付等优点,并且不依赖于任何的可信第三方。由于点对点网络下存在较高的网络延迟,各个节点所观察到的事务先后顺序不可能完全一致。因此,区块链系统需要设计一种机制对在差不多时间内发生的事务的先后顺序进行共识。这种对一个时间窗口内的事务的先后顺序达成共识的算法被称为“共识机制”。在区块链这样的分布式账本系统中,保障整个系统的安全性和适应性十分重要,这也是共识算法出现的根本原因。
申请人发现,现有的区块链共享私有数据的信息处理方法中主要是针对不同区块链网络之间的数据进行收集或汇总,并没有针对不同区块链网络的节点之间共享的私有数据进行安全可靠的信息汇总处理,另外基于不同区块链网络的节点进行数据共享,在技术实现上存在一定难度,无法解决节点之间的信任问题,保证数据的隐私性,也不能满足各区块链网络节点的个性化需求。为此,申请人提出了一种区块链共享私有数据的信息处理方法,针对不同区块链网络的不同节点之间的多维度的共享的私有数据,提供一种去中心化、安全、可定制的信息汇总机制。
需要说明的是,本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
图1为本发明实施例中区块链共享私有数据的信息处理方法的流程示意图,如图1所示,该方法包括:
步骤101、从公共数据池获取各节点共享的多个私有数据;
步骤102、以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
步骤103、对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
步骤104、以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
步骤105、对拆分获得的数据项进行聚类,获得分类数据;
步骤106、将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
从图1所示流程可以看出,本发明实施例中区块链共享私有数据的信息处理方法,从公共数据池获取各节点共享的多个私有数据,根据预设的特征参数值将符合条件的私有数据拆分为数据项,并经聚类处理得到分类数据,将分类数据按照区块链共识算法、签名机制及数据大小顺序,生成一套可供不同区块链各节点共享的区块数据链,发布至公共数据池,实现了不同区块链网络节点的私有数据的汇总,并通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,确保了私有数据信息汇总的安全性和可靠性,各节点将区块数据链发布到公共数据池后,与其他节点共享各自的区块数据链,实现按需数据信息分组,为其他应用场景提供模块化数据。
下面对本发明实施例的技术方案进行详细解释。
首先,本发明实施例提出一种基于业务分享规则的可定制化的特征参数加工方法,根据需求提取出对应的特征参数,并将其向量化,特征参数可分为三类业务特征参数、技术特征参数、公共参数,用于对数据进行特征画像。各节点可根据实际需求情况定制化上述参数,形成预设的特征参数值,通过预设的特征参数值去获取其他区块链网络的节点共享的私有数据;另外,各节点也可以生成一个验证数据,即当前节点的密钥标签,这些参数定义了多元数据组合分片的方式。
具体实施时,在各区块链网络节点设置特征参数加工模块,在特征参数加工模块中,根据业务分享规则及定制化数据需求,提取出定制化的三类特征参数值:业务特征参数b1,b2,b3...bn、技术特征参数t1,t2,t3...tn、公共参数c1,c2,c3...cn,验证数据密钥标签V由各节点签名机制生成,每个节点各不相同。然后对三类特征参数进行向量化处理,处理后的数据形式增加预设的特征参数的强度数值,该预设的特征参数的强度数值采用-1到1之间的数值表示,代表预期的、想要获取的其他区块链网络节点共享的私有数据与本节点实际需求的数据的符合程度。
例如,一区块链节点想要获取喜好运动的客户信息,该节点可根据自己的需求和业务分享规则,形成预设的特征参数值以及密钥标签,然后利用本节点的预设的特征参数值以及密钥标签到公共数据池中获取符合条件的喜好运动的客户信息,并经过本发明实施例的方法将最后的信息处理结果共享至公共数据池中,与其他节点共享本节点生成的区块数据链,实现按需数据信息分组,为其他应用场景提供模块化数据。
各区块链网络的节点共享的私有数据信息首先初步汇总到一个公共数据池中,各区块链网络的节点可通过网络公开访问获取,进行本节点的信息汇总工作,既可以根据需求获取想要的数据,也可以上传、共享私有数据,经本发明实施例提供的方法将汇总结果再发布到公共数据池中供其他节点共享。
具体实施时,本发明实施例中所述私有数据包括私有数据块。在步骤101和步骤102中,首先从公共数据池获取各节点共享的多个私有数据,然后以本节点的密钥标签对各私有数据进行校验;在一个实施例中,可以以本节点的密钥标签对各私有数据中哈希值及数字签名进行校验;根据校验结果分类对私有数据块添加不同标签,例如标签取值0或1,表示该私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成。
在步骤103和步骤104中,根据本节点预设的特征参数值以及密钥标签,对获取的其他节点共享的私有数据进行如下拆分。
一级拆分:对允许被本节点访问的私有数据块,提取各私有数据块中的特征参数,将特征参数向量化,得到特征参数向量,分别为业务特征参数向量B′(b1,b2,b3...bn)、技术特征参数向量T′(t1,t2,t3...tn)、公共参数向量C′(c1,c2,c3...cn)。
二级拆分:针对一级拆分后允许本节点访问的私有数据块,将私有数据块内的数据项看作为三维向量,以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项。
例如,预设的特征参数值为业务特征参数向量B(b1,b2,b3...bn)、技术特征参数向量T(t1,t2,t3...tn)、公共参数向量C(c1,c2,c3...cn),则按如下公式计算差异:
Figure BDA0003964761250000071
Figure BDA0003964761250000072
Figure BDA0003964761250000073
如上公式,计算同一私有数据块的特征参数向量与预设的特征参数值的差异,将同一私有数据块的所有特征参数向量与预设的特征参数值的差异求和或者取平均值,作为私有数据块的差异;将私有数据块的差异由小到大进行排序,然后按照设定好的阈值,依次将满足阈值条件的每个私有数据块拆分为单个或多个数据项。
在一个实施例中,为了提高区块链共享私有数据信息汇总处理的安全性和可靠性,以特征参数向量为三维维度,采用相似度度量准则曼哈顿距离,计算特征参数向量与预设的特征参数值的差异。
在一个实施例中,对私有数据拆分出的每个数据项,保留原始加密状态,加入私有数据的特征参数向量与预设的特征参数值的差异、预设的特征参数值、本节点的密钥标签,其中预设的特征参数值可以包括预设的特征参数的强度数值,便于数据追溯。
通过以上两级拆分模式,原始共享的私有数据在保证数据独立安全的前提下,被拆分为细粒度可直接汇总加工的数据形式。
在步骤105中,对拆分获得的数据项进行聚类,获得分类数据。
图2为本发明实施例中区块链共享私有数据的信息处理方法的一具体实例,如图2所示,对拆分获得的数据项进行聚类,获得分类数据,可以包括:
步骤201、采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果;
步骤202、采用K-means算法,对多层类簇结果进行聚类,获得分类数据。
实施时,根据层次聚类算法,将每一个数据项作为一个类簇,即,上述拆分获得的每一个数据项最开始都是一个类簇,每次按一定的准则将最相近的两个类簇合并生成一个新的类簇,生成一层类簇结果,依次类推,直至所有的数据项都属于一个类簇。这里一定的准则可以是每个数据项中记录的其所属的私有数据块的差异,例如将私有数据块的差异以差异度数值形式表示,按私有数据块差异度数值最相近的原则,将拆分获得的数据项聚类处理,生成多层类簇结果。每进行一次合并,都会产生一层新的合并数据项。每次将最相近的两个类簇合并生成一个新的类簇时,采用平均值方法重新计算合并后的数据项的差异。
例如,将十个数据项,x1、x 2、x 3、x 4、x 5、x 6、x 7、x 8、x 9、x 10,采用层次聚类算法,进行聚类,每一次聚类根据每个数据项中记录的其所属的私有数据块的差异进行合并,合并后重新计算差异,再根据差异最相近原则进行合并,最终生成四层类簇结果:
1层:x1、x 2、x 3、x 4、x 5、x 6、x 7、x 8、x 9、x 10;
2层:(x1、x 5、x 6)、(x 2、x 3、x 8)、(x 4、x 9)、(x 7、x 10);
3层:(x1、x 5、x 6、x 4、x 9)、(x 2、x 3、x 8、x 7、x 10);
4层:(x1、x 2、x 3、x 4、x 5、x 6、x 7、x 8、x 9、x 10);
得到多层类簇结果之后,再针对每一层的类簇结果利用改进的K-means算法进行下一步计算。在一个实施例中,根据预设的特征参数值的三维组合数据,确定K-means算法的初始质心,对多层类簇结果的每一层类簇结果进行聚类,获得分类数据。
例如,按照预设的特征参数值:业务特征参数向量B(b1,b2,b3...bn)、技术特征参数向量T(t1,t2,t3...tn)、公共参数向量C(c1,c2,c3...cn)的三维组合数,以与预设的特征参数值差异最小的私有数据块作为初始质心,对每一层的类簇结果再次划分类簇。
最后,在步骤106中,将分类数据按区块链共识算法、签名机制及数据大小顺序,生成一套供各节点共享的区块数据链,发布至公共数据池,通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,发布到公共数据池后,与其他区块链节点共享各自的信息汇总结果,实现按需数据信息分组,为其他应用场景提供模块化数据。
图3为本发明实施例中区块链共享私有数据的信息处理方法的一具体实例,如图3所示,该方法包括:区块链节点根据需求,形成预设的特征参数值,并增加预设的特征参数的强度数值;从公共数据池获取各节点共享的多个私有数据;以本节点的密钥标签对各私有数据进行校验;采用两级拆分模式,对允许被本节点访问的私有数据块,提取各私有数据块中的特征参数并向量化,得到私有数据的特征参数向量;计算私有数据的特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果;采用K-means算法,对多层类簇结果进行聚类,获得分类数据;将分类数据按区块链共识算法、签名机制及数据大小顺序,生成一套供各节点共享的区块数据链,发布至公共数据池中。
综上,本发明实施例针对不同区块链网络的不同节点之间多维度的共享私有数据,提供一种去中心化、安全、可定制的信息汇总机制。在本发明实施例中,各节点共享的私有数据信息初步汇总到一个公共数据池中,各节点可通过网络公开访问获取,进行本节点的信息汇总工作,最终将汇总结果再发布到数据池中供其他节点共享。通过基于业务分享规则的可定制化的特征参数加工方法、两级拆分模式以及基于层次聚类算法与改进的K-means算法的信息处理方法,既保留了原始共享的私有数据的隐私加密状态不被破坏与篡改,同时又可以根据各类应用场景定制化划分数据块,将分类数据按照特定的区块链共识算法与签名机制及数据大小顺序,生成一套可供不同节点分享的区块数据链,通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,各节点将计算结果发布到公共数据池中,与其他节点共享各自的信息汇总结果,实现按需数据信息分组,为其他应用场景提供模块化数据。
本发明实施例中还提供了一种区块链共享私有数据的信息处理装置,如下面的实施例所述。由于该装置解决问题的原理与区块链共享私有数据的信息处理方法相似,因此该装置的实施可以参见区块链共享私有数据的信息处理方法的实施,重复之处不再赘述。
图4为本发明实施例中区块链共享私有数据的信息处理装置的结构示意图,如图4所示,该装置应用于区块链中的每一节点,该装置包括:
数据获取模块401,用于从公共数据池获取各节点共享的多个私有数据;
数据校验模块402,用于以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
特征参数加工模块403,用于对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
数据项拆分模块404,用于以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
聚类模块405,用于对拆分获得的数据项进行聚类,获得分类数据;
信息整合模块406,用于将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
在一个实施例中,数据校验模块402具体用于:
以本节点的密钥标签对各私有数据中哈希值及数字签名进行校验。
在一个实施例中,数据项拆分模块404具体用于:
以特征参数向量为三维维度,采用相似度度量准则曼哈顿距离,计算特征参数向量与预设的特征参数值的差异。
在一个实施例中,数据项拆分模块404具体用于:
对私有数据拆分出的每个数据项,保留原始加密状态,加入私有数据的特征参数向量与预设的特征参数值的差异、预设的特征参数值、本节点的密钥标签。
在一个实施例中,聚类模块405具体用于:
采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果;
采用K-means算法,对多层类簇结果进行聚类,获得分类数据。
在一个实施例中,聚类模块405具体用于:
将每一个数据项作为一个类簇,每次将最相近的两个类簇合并生成一个新的类簇,生成一层类簇结果,以此类推,直至所有的数据项都属于一个类簇。
在一个实施例中,聚类模块405具体用于:
每次将最相近的两个类簇合并生成一个新的类簇时,采用平均值方法重新计算合并后的数据项加入的差异。
在一个实施例中,聚类模块405具体用于:
根据预设的特征参数值的三维组合数据,确定K-means算法的初始质心,对多层类簇结果的每一层类簇结果进行聚类,获得分类数据。
图5为本发明实施例中计算机设备的示意图,如图5所示,本发明实施例还提供一种计算机设备500,包括处理器501、存储器502及存储在存储器502上并可在处理器501上运行的计算机程序503,所述处理器501执行所述计算机程序503时实现上述区块链共享私有数据的信息处理方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述区块链共享私有数据的信息处理方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述区块链共享私有数据的信息处理方法。
本发明实施例中区块链共享私有数据的信息处理方法,从公共数据池获取各节点共享的多个私有数据,根据预设的特征参数值将符合条件的私有数据拆分为数据项,并经聚类处理得到分类数据,将分类数据按照区块链共识算法、签名机制及数据大小顺序,生成一套可供不同区块链各节点共享的区块数据链,发布至公共数据池,实现了不同区块链网络节点的私有数据的汇总,并通过共识算法与签名机制,保证了各节点内私有数据的私密性和完整性,确保了私有数据信息汇总的安全性和可靠性,各节点将区块数据链发布到公共数据池后,与其他节点共享各自的区块数据链,实现按需数据信息分组,为其他应用场景提供模块化数据。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (19)

1.一种区块链共享私有数据的信息处理方法,其特征在于,应用于区块链中的每一节点,包括:
从公共数据池获取各节点共享的多个私有数据;
以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
对拆分获得的数据项进行聚类,获得分类数据;
将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
2.如权利要求1所述的方法,其特征在于,以本节点的密钥标签对各私有数据进行校验,包括:
以本节点的密钥标签对各私有数据中哈希值及数字签名进行校验。
3.如权利要求1所述的方法,其特征在于,以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,包括:
以特征参数向量为三维维度,采用相似度度量准则曼哈顿距离,计算特征参数向量与预设的特征参数值的差异。
4.如权利要求1所述的方法,其特征在于,依次将差异小于阈值的私有数据拆分为数据项,包括:
对私有数据拆分出的每个数据项,保留原始加密状态,加入私有数据的特征参数向量与预设的特征参数值的差异、预设的特征参数值、本节点的密钥标签。
5.如权利要求1所述的方法,其特征在于,对拆分获得的数据项进行聚类,获得分类数据,包括:
采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果;
采用K-means算法,对多层类簇结果进行聚类,获得分类数据。
6.如权利要求5所述的方法,其特征在于,采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果,包括:
将每一个数据项作为一个类簇,每次将最相近的两个类簇合并生成一个新的类簇,生成一层类簇结果,以此类推,直至所有的数据项都属于一个类簇。
7.如权利要求6所述的方法,其特征在于,每次将最相近的两个类簇合并生成一个新的类簇,包括:
每次将最相近的两个类簇合并生成一个新的类簇时,采用平均值方法重新计算合并后的数据项加入的差异。
8.如权利要求5所述的方法,其特征在于,采用K-means算法,对多层类簇结果进行聚类,获得分类数据,包括:
根据预设的特征参数值的三维组合数据,确定K-means算法的初始质心,对多层类簇结果的每一层类簇结果进行聚类,获得分类数据。
9.一种区块链共享私有数据的信息处理装置,其特征在于,应用于区块链中的每一节点,包括:
数据获取模块,用于从公共数据池获取各节点共享的多个私有数据;
数据校验模块,用于以本节点的密钥标签对各私有数据进行校验,根据校验结果为各私有数据添加标签,以表示私有数据是否允许被本节点访问;其中,密钥标签由本节点根据本节点签名机制生成;
特征参数加工模块,用于对允许被本节点访问的私有数据,提取各私有数据中的特征参数,将特征参数向量化,得到特征参数向量,其中,特征参数包括业务特征参数、技术特征参数和公共参数;
数据项拆分模块,用于以特征参数向量为三维维度,计算特征参数向量与预设的特征参数值的差异,将各私有数据按差异由小到大排序,依次将差异小于阈值的私有数据拆分为数据项;
聚类模块,用于对拆分获得的数据项进行聚类,获得分类数据;
信息整合模块,用于将分类数据按区块链共识算法、签名机制及数据大小顺序,生成供各节点共享的区块数据链,发布至公共数据池。
10.如权利要求9所述的装置,其特征在于,数据校验模块具体用于:
以本节点的密钥标签对各私有数据中哈希值及数字签名进行校验。
11.如权利要求9所述的装置,其特征在于,数据项拆分模块具体用于:
以特征参数向量为三维维度,采用相似度度量准则曼哈顿距离,计算特征参数向量与预设的特征参数值的差异。
12.如权利要求9所述的装置,其特征在于,数据项拆分模块具体用于:
对私有数据拆分出的每个数据项,保留原始加密状态,加入私有数据的特征参数向量与预设的特征参数值的差异、预设的特征参数值、本节点的密钥标签。
13.如权利要求9所述的装置,其特征在于,聚类模块具体用于:
采用层次聚类算法,将拆分获得的数据项进行聚类,生成多层类簇结果;
采用K-means算法,对多层类簇结果进行聚类,获得分类数据。
14.如权利要求13所述的装置,其特征在于,聚类模块具体用于:
将每一个数据项作为一个类簇,每次将最相近的两个类簇合并生成一个新的类簇,生成一层类簇结果,以此类推,直至所有的数据项都属于一个类簇。
15.如权利要求14所述的装置,其特征在于,聚类模块具体用于:
每次将最相近的两个类簇合并生成一个新的类簇时,采用平均值方法重新计算合并后的数据项加入的差异。
16.如权利要求13所述的装置,其特征在于,聚类模块具体用于:
根据预设的特征参数值的三维组合数据,确定K-means算法的初始质心,对多层类簇结果的每一层类簇结果进行聚类,获得分类数据。
17.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一所述方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至8任一所述方法。
CN202211493939.7A 2022-11-25 2022-11-25 区块链共享私有数据的信息处理方法及装置 Pending CN115906166A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211493939.7A CN115906166A (zh) 2022-11-25 2022-11-25 区块链共享私有数据的信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211493939.7A CN115906166A (zh) 2022-11-25 2022-11-25 区块链共享私有数据的信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN115906166A true CN115906166A (zh) 2023-04-04

Family

ID=86480202

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211493939.7A Pending CN115906166A (zh) 2022-11-25 2022-11-25 区块链共享私有数据的信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN115906166A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648723A (zh) * 2024-01-30 2024-03-05 北京点聚信息技术有限公司 一种基于人工智能的电子签章数据安全监管方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117648723A (zh) * 2024-01-30 2024-03-05 北京点聚信息技术有限公司 一种基于人工智能的电子签章数据安全监管方法及系统
CN117648723B (zh) * 2024-01-30 2024-03-29 北京点聚信息技术有限公司 一种基于人工智能的电子签章数据安全监管方法及系统

Similar Documents

Publication Publication Date Title
CN110084377B (zh) 用于构建决策树的方法和装置
CN112632045B (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN110598376A (zh) 基于区块链的版权认证方法、装置、设备及存储介质
CN109314636A (zh) 用于从区块链中安全提取数据的密码方法和系统
CN105468371B (zh) 一种基于主题聚类的业务流程图合并方法
CN111784528A (zh) 异常社群检测方法、装置、计算机设备及存储介质
CN110199305A (zh) 用于确定使用区块链实现的机器可执行合约的状态的计算机实现的系统和方法
CN111461751B (zh) 基于区块链的房产信息链上组织方法、历史状态追溯方法及装置
Starnini et al. Smurf-based anti-money laundering in time-evolving transaction networks
CN115906166A (zh) 区块链共享私有数据的信息处理方法及装置
CN109800251A (zh) 一种关系发现方法和装置、计算机可读存储介质
Karampidis et al. File type identification-computational intelligence for digital forensics
He et al. An efficient solution to detect common topologies in money launderings based on coupling and connection
US20230129227A1 (en) System and method for generating a table-driven mutable blockchain
CN112766320B (zh) 一种分类模型训练方法及计算机设备
CN115310606A (zh) 基于数据集敏感属性重构的深度学习模型去偏方法及装置
CN114064801A (zh) 基于知识图谱的区块链数据监管方法、系统及计算机设备
CN114429190A (zh) 基于联邦学习的模型构建方法、授信评估方法及装置
Pereira et al. Data clustering using topological features
CN113810185A (zh) 一种抗陷门泄露的链上数据修复系统及方法
CN110796546A (zh) 一种基于区块链的分布式聚类算法
CN111652718A (zh) 基于关系网络图的价值流向监控方法、装置、设备和介质
Thin et al. Formal Analysis of a PoS Blockchain
Farea Privacy preserving data mining
US11989276B2 (en) Intelligent authentication of users in Metaverse leveraging non-fungible tokens and behavior analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination