基于区块链的数据对比及共识方法
技术领域
本发明涉及大数据分析出来领域,具体地,涉及一种基于区块链的数据对比及共识方法。
背景技术
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法。
区块链(Blockchain)是比特币的一个重要概念,它本质上是一个去中心化的数据库,同时作为比特币的底层技术。区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块
越来越多的数据加入区块链中,使得区块链中的数据越来越多,在进行区块链的数据对比及共识时,若遍历所有的数据,则由于数据量庞大,工作量大,计算复杂,效率较低,若只对比或共识部分数据,则对比或共识的准确率会下降,导致对比或共识的准确率较低。
发明内容
本发明提供了一种基于区块链的数据对比及共识方法,解决了现有的数据对比及共识方法效率较低或准确率较低技术问题,实现了方法设计合理,数据对比及共识效率和准确率较高的技术效果。
为实现上述发明目的,本申请提供了基于区块链的数据对比及共识方法,所述方法应用于区块链系统中,区块链系统中包括若干服务器,所述方法包括:
对将存入服务器的数据进行分析,获得数据对应的存储编号,然后将数据存入服务器,对数据和对应的存储编号进行广播;
在区块链中进行数据共识时,对需要共识的第一数据进行分析,获得第一数据对应的第一共识编号,基于第一共识编号,在区块链数据库中获得与第一共识编号相似程度符合要求的第一存储编号,基于第一存储编号获得与第一数据对应的共识数据;
在区块链中进行对比数据时,对服务器中需要对比的第二数据和第三数据进行分析,获得第二数据对应的第一对比编号,获得第三数据对应的第二对比编号,将第一对比编号与第二对比编号进行比较,获得两个编号的相似度信息,基于两个编号的相似度信息,获得第二数据和第三数据对比结果。
其中,本发明的原来为,对将存入服务器的数据进行分析,获得数据对应的存储编号,然后将数据存入服务器,对数据和对应的存储编号进行广播;在数据进行共识或对比时,基于编号的相识度进行,避免了传统的遍历所有数据,工作量和计算量下降,效率较高,并且是利用准确的编号对应数据进行比较,准确率较高。
进一步的,所述方法中对数据进行分析,并进行编号具体包括:
对数据是否加密进行分析,若数据为加密数据则编码第一位为+;若数据为非加密数据则编码第一位为-;
对数据的关键字进行提取,基于关键字与行业类型的对应关系,获得数据对应的行业类型,基于行业类型编号表获得数据的行业编号,将数据的行业编号作为编码第二位;
对数据内容进行分析,获得数据对应的类型:当数据中的文本数据超过该数据总量的50%时,则判断为文本数据;当数据中的数字数据超过该数据总量的50%时,则判断为数字数据;当数据中的图像数据超过该数据总量的50%时,则判断为图像数据;当数据中的代码数据超过该数据总量的50%时,则判断为代码数据;依次类推,当没有某项类型的数据超过该数据总量的50%时,则判断为综合数据;基于数据类型编号表获得数据的类型编号,将数据的类型编号作为编码第三位;
对数据大小进行分析,获得数据大小,当数据小于等于1G编号为A,当数据大于1G小于等于1T编号为B,当数据大于1T小于等于500T编号为C,当数据大于500T编号为D;将数据的大小编号作为编码第四位;
对数据的发布者信息进行分析,提取出数据发布者单位或公司或个人名称,基于企业或个人或单位信用管理系统,查询企业或个人或单位的信用值;基于网络搜索引擎,对企业或个人或单位进行网络搜索,基于搜索结果获得企业或个人或单位的网络影响力信息,基于工商管理数据库,获得企业的营业信息;基于单位资质获得单位权威信息;基于个人学历和研究背景信息获得个人权威信息;
基于信用值、网络影响力信息或企业的营业信息或单位权威信息或个人权威信息,综合计算出数据发布者单位或公司或个人的影响力信息,影响力信息包括:强、中、低;其中强、中、低影响力分别对应不同的编号,将数据发布者的影响力编号作为编码第五位。
通过上述特殊的设计,能够获得准确的与数据本身贴合的,准确反映数据本身的编号,进而通过准确的编号才能够保障数据共识和对比的准确性,若编号没有准确的反映数据,那么对比和共识的结果必将不准确。
进一步的,所述方法还包括:当获得第二数据和第三数据对比结果,用户对对比结果进行打分,当打分低于阈值时,则对第一对比编号和第二对比编号进行校对。当对比的结果不准确时,则表明编号出现了问题,则对编号进行校对,通过对编号进行校对,保障数据对比和共识的准确性。
进一步的,对数据对应的对比编号进行校对,具体包括:
对数据的关键字进行重新提取,更新关键字与行业类型的对应关系,基于重新提取的关键字与更新后行业类型的对应关系,更新获得数据对应的行业类型,基于更新后的行业类型编号表获得数据的行业编号;
对数据内容进行二次分析,重新获得数据对应的类型,将数据的类型编号作为编码第三位;
对数据大小进行重新分析,更新获得数据大小,将更新数据的大小编号作为编码第四位;
对数据的发布者信息进行二次分析,提取出数据发布者单位或公司或个人名称,基于企业或个人或单位更新后的信用管理系统,查询企业或个人或单位的信用值;基于更新后的实时网络搜索引擎,对企业或个人或单位进行网络搜索,基于搜索结果获得企业或个人或单位的网络影响力信息,基于更新后的工商管理数据库,获得企业的营业信息。
经过研发发现,大多数情况的编号不准确是因为编号是基于前段时间的对应关系获得,但是某些行业或者领域,如计算机,其更新速度较快,因此需要实时更新对应的编码对应关系,才能够保障编码的准确性,进而保障数据对比和共识的准确性。
进一步的,所述方法还包括:当获得第二数据和第三数据对比结果,用户对对比结果进行打分,当打分低于阈值时,将第二数据对应的第一对比编号进行重新排序获得调整后的第一对比编号组;将第三数据对应的第二对比编号进行重新排序获得调整后的第二对比编号组;基于第一对比编号组获得第一数据组列;基于第二对比编号组获得第二数据组列;将第一数据组列和第二数据组列进行对比,获得对比结果。
经过研究发现,用户对对比结果不满意还存在用户关注的点与大众的点不同,可能他对于数据的行业影响力或数据的权威程度或数据的类型更加关注,因此,本方法设计了在用户对当前的对比结果不满意时,将编码进行重新排序,获得一组对比结果供用户进行选择,该组对比结果则包括了更多的侧重点,提高了对比结果的全面性。
进一步的,所述方法还包括步骤:自动生成行业数据报告,具体包括:
当数据存入区块链时,对数据进行分析,获得数据对应的存储编号,基于存储编号中的行业编号,将该数据与对应的行业进行匹配,
将区块链找某个行业编号对应所有数据提取出,生成行业数据报告。
由于本方法中存储了大量的数据,且对数据根据行业进行了编号,则利用这些优势则能够快速方便的生成行业报告,与传统的需要获取大量的数据,然后进行繁琐的整理不同,效率较高。
进一步的,所述方法还包括:将行业数据报告中的重复数据剔除,将对应影响力信息为低的数据从行业报告中剔除。初步生成的行业报告找具有部分无效数据,则将这些无效的数据剔除。
进一步的,所述方法还包括实时统计区块链系统中的服务器数量,新增服务器则服务器数量加1,失联或失效服务器则服务器数量减1,当服务器数量出现连续下降时,则通知管理员进行报警。服务器数量是区块链的健康程度标准之一,对服务器数据量即区块链系统的健康状况进行实时监控,有利于对数据对比和共识的健康发展。
上述本申请实施例中的技术方案,至少具有如下的技术效果或优点:
解决了现有的数据对比及共识方法效率较低或准确率较低技术问题,实现了方法设计合理,数据对比及共识效率和准确率较高的技术效果。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定;
图1是本申请中基于区块链的数据对比及共识方法的流程示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
请参考图1,本申请提供了一种基于区块链的数据对比及共识方法,所述方法应用于区块链系统中,区块链系统中包括若干服务器,所述方法包括:
对将存入服务器的数据进行分析,获得数据对应的存储编号,然后将数据存入服务器,对数据和对应的存储编号进行广播;
在区块链中进行数据共识时,对需要共识的第一数据进行分析,获得第一数据对应的第一共识编号,基于第一共识编号,在区块链数据库中获得与第一共识编号相似程度符合要求的第一存储编号,基于第一存储编号获得与第一数据对应的共识数据;
在区块链中进行对比数据时,对服务器中需要对比的第二数据和第三数据进行分析,获得第二数据对应的第一对比编号,获得第三数据对应的第二对比编号,将第一对比编号与第二对比编号进行比较,获得两个编号的相似度信息,基于两个编号的相似度信息,获得第二数据和第三数据对比结果。
其中,本发明的原来为,对将存入服务器的数据进行分析,获得数据对应的存储编号,然后将数据存入服务器,对数据和对应的存储编号进行广播;在数据进行共识或对比时,基于编号的相识度进行,避免了传统的遍历所有数据,工作量和计算量下降,效率较高,并且是利用准确的编号对应数据进行比较,准确率较高。
进一步的,所述方法中对数据进行分析,并进行编号具体包括:
对数据是否加密进行分析,若数据为加密数据则编码第一位为+;若数据为非加密数据则编码第一位为-;
对数据的关键字进行提取,基于关键字与行业类型的对应关系,获得数据对应的行业类型,基于行业类型编号表获得数据的行业编号,将数据的行业编号作为编码第二位;
对数据内容进行分析,获得数据对应的类型:当数据中的文本数据超过该数据总量的50%时,则判断为文本数据;当数据中的数字数据超过该数据总量的50%时,则判断为数字数据;当数据中的图像数据超过该数据总量的50%时,则判断为图像数据;当数据中的代码数据超过该数据总量的50%时,则判断为代码数据;依次类推,当没有某项类型的数据超过该数据总量的50%时,则判断为综合数据;基于数据类型编号表获得数据的类型编号,将数据的类型编号作为编码第三位;
对数据大小进行分析,获得数据大小,当数据小于等于1G编号为A,当数据大于1G小于等于1T编号为B,当数据大于1T小于等于500T编号为C,当数据大于500T编号为D;将数据的大小编号作为编码第四位;
对数据的发布者信息进行分析,提取出数据发布者单位或公司或个人名称,基于企业或个人或单位信用管理系统,查询企业或个人或单位的信用值;基于网络搜索引擎,对企业或个人或单位进行网络搜索,基于搜索结果获得企业或个人或单位的网络影响力信息,基于工商管理数据库,获得企业的营业信息;基于单位资质获得单位权威信息;基于个人学历和研究背景信息获得个人权威信息;
基于信用值、网络影响力信息或企业的营业信息或单位权威信息或个人权威信息,综合计算出数据发布者单位或公司或个人的影响力信息,影响力信息包括:强、中、低;其中强、中、低影响力分别对应不同的编号,将数据发布者的影响力编号作为编码第五位。
通过上述特殊的设计,能够获得准确的与数据本身贴合的,准确反映数据本身的编号,进而通过准确的编号才能够保障数据共识和对比的准确性,若编号没有准确的反映数据,那么对比和共识的结果必将不准确。
进一步的,所述方法还包括:当获得第二数据和第三数据对比结果,用户对对比结果进行打分,当打分低于阈值时,则对第一对比编号和第二对比编号进行校对。当对比的结果不准确时,则表明编号出现了问题,则对编号进行校对,通过对编号进行校对,保障数据对比和共识的准确性。
进一步的,对数据对应的对比编号进行校对,具体包括:
对数据的关键字进行重新提取,更新关键字与行业类型的对应关系,基于重新提取的关键字与更新后行业类型的对应关系,更新获得数据对应的行业类型,基于更新后的行业类型编号表获得数据的行业编号;
对数据内容进行二次分析,重新获得数据对应的类型,将数据的类型编号作为编码第三位;
对数据大小进行重新分析,更新获得数据大小,将更新数据的大小编号作为编码第四位;
对数据的发布者信息进行二次分析,提取出数据发布者单位或公司或个人名称,基于企业或个人或单位更新后的信用管理系统,查询企业或个人或单位的信用值;基于更新后的实时网络搜索引擎,对企业或个人或单位进行网络搜索,基于搜索结果获得企业或个人或单位的网络影响力信息,基于更新后的工商管理数据库,获得企业的营业信息。
经过研发发现,大多数情况的编号不准确是因为编号是基于前段时间的对应关系获得,但是某些行业或者领域,如计算机,其更新速度较快,因此需要实时更新对应的编码对应关系,才能够保障编码的准确性,进而保障数据对比和共识的准确性。
进一步的,所述方法还包括:当获得第二数据和第三数据对比结果,用户对对比结果进行打分,当打分低于阈值时,将第二数据对应的第一对比编号进行重新排序获得调整后的第一对比编号组;将第三数据对应的第二对比编号进行重新排序获得调整后的第二对比编号组;基于第一对比编号组获得第一数据组列;基于第二对比编号组获得第二数据组列;将第一数据组列和第二数据组列进行对比,获得对比结果。
经过研究发现,用户对对比结果不满意还存在用户关注的点与大众的点不同,可能他对于数据的行业影响力或数据的权威程度或数据的类型更加关注,因此,本方法设计了在用户对当前的对比结果不满意时,将编码进行重新排序,获得一组对比结果供用户进行选择,该组对比结果则包括了更多的侧重点,提高了对比结果的全面性。
进一步的,所述方法还包括步骤:自动生成行业数据报告,具体包括:
当数据存入区块链时,对数据进行分析,获得数据对应的存储编号,基于存储编号中的行业编号,将该数据与对应的行业进行匹配,
将区块链找某个行业编号对应所有数据提取出,生成行业数据报告。
由于本方法中存储了大量的数据,且对数据根据行业进行了编号,则利用这些优势则能够快速方便的生成行业报告,与传统的需要获取大量的数据,然后进行繁琐的整理不同,效率较高。
进一步的,所述方法还包括:将行业数据报告中的重复数据剔除,将对应影响力信息为低的数据从行业报告中剔除。初步生成的行业报告找具有部分无效数据,则将这些无效的数据剔除。
进一步的,所述方法还包括实时统计区块链系统中的服务器数量,新增服务器则服务器数量加1,失联或失效服务器则服务器数量减1,当服务器数量出现连续下降时,则通知管理员进行报警。服务器数量是区块链的健康程度标准之一,对服务器数据量即区块链系统的健康状况进行实时监控,有利于对数据对比和共识的健康发展。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。