CN113360501A - 一种基于区块链的分布式数据存储方法及系统 - Google Patents

一种基于区块链的分布式数据存储方法及系统 Download PDF

Info

Publication number
CN113360501A
CN113360501A CN202110624722.4A CN202110624722A CN113360501A CN 113360501 A CN113360501 A CN 113360501A CN 202110624722 A CN202110624722 A CN 202110624722A CN 113360501 A CN113360501 A CN 113360501A
Authority
CN
China
Prior art keywords
data
block chain
database
node
fragments
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110624722.4A
Other languages
English (en)
Inventor
王保春
张蛟鹏
余洋
莫恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiaqiao Shenzhen Investment Co ltd
Original Assignee
Yongqi Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yongqi Beijing Technology Co Ltd filed Critical Yongqi Beijing Technology Co Ltd
Priority to CN202110624722.4A priority Critical patent/CN113360501A/zh
Publication of CN113360501A publication Critical patent/CN113360501A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/219Managing data history or versioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Bioethics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于区块链的分布式数据存储方法及系统,该方法包括:S1,接收区块链节点上传的数据;S2,采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;S3,通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;S4,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;S5,将剩余数据片段进行归类存储至对应类型的数据库节点。本发明通过哈希算法根据数据特征进行分类存储,明确了数据存储节点,并通过比对删除冗余重复数据,减少数据存储负荷的同时,确保数据存储的有效性。

Description

一种基于区块链的分布式数据存储方法及系统
技术领域
本发明涉及区块链技术领域,特别是涉及一种基于区块链的分布式数据存储方法及系统。
背景技术
随着网络的不断发展,网络数据量不断增加,分布式存储作为一种新兴的网络在线存储技术得到了越来越广泛的应用。依托区块链的去中心化、可追溯性特点,基于区块链的分布式存储有效保证了存储与通信的机密性、可信性,推动了基于区块链的分布式数据存储的发展和应用。
目前,大规模分布式数据存储时,仍会面临以下技术问题:第一,当数据量大的情况下,大量镜像的数据严重耗费空间,存储利用率低,在大数据前提下,数据存储的具体存储节点存在紊乱性,无法具体定位至数据信息存储的准确存储节点,数据的存储路径和读取具有不明确性;第二,现有的解决方式大多采用抛弃过期数据减少数据负荷,但过期数据的减少往往跟不上新数据的诞生,此外,过期数据难以判定,存在后期需要的可能性,这种永久损失数据完整性的方式不可取。因此,需要提供一种新的分布式数据存储方法以解决区块链中的数据存储压力。
发明内容
本发明的目的是提供一种基于区块链的分布式数据存储方法及系统,通过哈希算法根据数据特征进行分类存储,明确了数据存储节点,并通过比对删除冗余重复数据,减少数据存储负荷的同时,确保数据存储的有效性。
为实现上述目的,本发明提供了如下方案:
一种基于区块链的分布式数据存储方法,所述的区块链包括区块链节点,每个区块链节点均与多个数据库节点连接,包括以下步骤:
S1,接收区块链节点上传的数据;
S2,采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
S3,通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
S4,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
S5,将剩余数据片段进行归类存储至对应类型的数据库节点。
进一步的,所述方法还包括:
S6,数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
进一步的,所述步骤S4中,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段,具体包括:
比对结果的相似率在90%以上,则认为比对成功,删除重复的数据片段;
比对失败后进入二次比对,若数据的连续相似率达到70%以上,对相似部分进行删除,若低于70%则不作任何处理。
进一步的,所述步骤S5,将剩余数据片段进行归类存储至对应类型的数据库节点,具体包括:
将所述步骤S4处理后的数据片段依次按照顺序发送至各数据库节点;
根据各数据片段存储顺序生成私密秘钥。
进一步的,所述根据各数据片段存储顺序生成私密秘钥,具体包括:
选取最先分段数据对应的数据库节点信息作为该数据的私密秘钥的第一秘钥数据;
依次根据时间戳和数据库节点整理私密秘钥的数据;
组合获取的私密秘钥数据生成私密秘钥。
本发明还提供了一种基于区块链的分布式数据存储系统,应用于上述的基于区块链的分布式数据存储方法,包括:
数据接收模块,用于接收区块链节点上传的数据;
数据分类模块,用于采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
数据查重模块,用于通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
数据去冗余处理模块,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
数据存储模块,将剩余数据片段进行归类存储至对应类型的数据库节点。
进一步的,所述系统还包括:
数据查询处理模块,用于数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的基于区块链的分布式数据存储方法及系统,通过哈希算法根据特征信息对数据进行分类标记,并通过分段式处理提高数据处理效率,最后将数据存储在匹配类型的数据库节点中,实现了数据信息分布式存储并明确了数据存储节点,对后期数据读取具有明确的指向性,提高数据存取效率;其中,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列,按照排列顺序逐一与历史数据中的高频重复数据进行比对,比对成功后在转换后的数据内删除重复数据,极大地降低数据冗余量;此外,根据时间戳、分段式顺序和特征标记作为私密秘钥生成的数据基础,提高了秘钥的复杂程度,提高了数据存储的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于区块链的分布式数据存储方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于区块链的分布式数据存储方法及系统,通过哈希算法根据数据特征进行分类存储,明确了数据存储节点,并通过比对删除冗余重复数据,减少数据存储负荷的同时,确保数据存储的有效性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1所示,本发明实施例提供的基于区块链的分布式数据存储方法,所述的区块链包括区块链节点,每个区块链节点均与多个数据库节点连接,包括以下步骤:
S1,接收区块链节点上传的数据;
S2,采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
S3,通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
S4,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
S5,将剩余数据片段进行归类存储至对应类型的数据库节点;
所述方法还包括步骤S6,数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
其中,所述步骤S4中,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段,具体包括:
比对结果的相似率在90%以上,则认为比对成功,删除重复的数据片段;
比对失败后进入二次比对,若数据的连续相似率达到70%以上,对相似部分进行删除,若低于70%则不作任何处理。
所述步骤S5,将剩余数据片段进行归类存储至对应类型的数据库节点,具体包括:
将所述步骤S4处理后的数据片段依次按照顺序发送至各数据库节点;
根据各数据片段存储顺序生成私密秘钥,具体包括:
选取最先分段数据对应的数据库节点信息作为该数据的私密秘钥的第一秘钥数据;
依次根据时间戳和数据库节点整理私密秘钥的数据;
组合获取的私密秘钥数据生成私密秘钥。
此外,本方法还可以进行数据同步,所述区块链节点在处理预设数量的出具存储交易后,根据最新区块的哈希值生成核查数据特征值,发送所述核查数据特征值至其他区块链节点,并判断该核查数据特征值与来自所述其他区块链节点的核查数据特征值是否相同;如果不相同,则该区块链节点发起数据同步。
此外,数据库节点之间建立对等连接,互相对操作信息进行合法性验证的公开和存储信息的开放。
本发明还提供了一种基于区块链的分布式数据存储系统,应用于上述的基于区块链的分布式数据存储方法,包括:
数据接收模块,用于接收区块链节点上传的数据;
数据分类模块,用于采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
数据查重模块,用于通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
数据去冗余处理模块,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
数据存储模块,将剩余数据片段进行归类存储至对应类型的数据库节点;
数据查询处理模块,用于数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
本发明提供的基于区块链的分布式数据存储方法及系统,通过哈希算法根据特征信息对数据进行分类标记,并通过分段式处理提高数据处理效率,最后将数据存储在匹配类型的数据库节点中,实现了数据信息分布式存储并明确了数据存储节点,对后期数据读取具有明确的指向性,提高数据存取效率;其中,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列,按照排列顺序逐一与历史数据中的高频重复数据进行比对,比对成功后在转换后的数据内删除重复数据,极大地降低数据冗余量;此外,根据时间戳、分段式顺序和特征标记作为私密秘钥生成的数据基础,提高了秘钥的复杂程度,提高了数据存储的安全性。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基于区块链的分布式数据存储方法,所述的区块链包括区块链节点,每个区块链节点均与多个数据库节点连接,其特征在于,包括以下步骤:
S1,接收区块链节点上传的数据;
S2,采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
S3,通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
S4,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
S5,将剩余数据片段进行归类存储至对应类型的数据库节点。
2.根据权利要求1所述的基于区块链的分布式数据存储方法,其特征在于,所述方法还包括:
S6,数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
3.根据权利要求1所述的基于区块链的分布式数据存储方法,其特征在于,所述步骤S4中,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段,具体包括:
比对结果的相似率在90%以上,则认为比对成功,删除重复的数据片段;
比对失败后进入二次比对,若数据的连续相似率达到70%以上,对相似部分进行删除,若低于70%则不作任何处理。
4.根据权利要求1所述的基于区块链的分布式数据存储方法,其特征在于,所述步骤S5,将剩余数据片段进行归类存储至对应类型的数据库节点,具体包括:
将所述步骤S4处理后的数据片段依次按照顺序发送至各数据库节点;
根据各数据片段存储顺序生成私密秘钥。
5.根据权利要求4所述的基于区块链的分布式数据存储方法,其特征在于,所述根据各数据片段存储顺序生成私密秘钥,具体包括:
选取最先分段数据对应的数据库节点信息作为该数据的私密秘钥的第一秘钥数据;
依次根据时间戳和数据库节点整理私密秘钥的数据;
组合获取的私密秘钥数据生成私密秘钥。
6.一种基于区块链的分布式数据存储系统,应用于权利要求1-5任一所述的基于区块链的分布式数据存储方法,包括:
数据接收模块,用于接收区块链节点上传的数据;
数据分类模块,用于采用哈希算法计算数据的特征信息,并根据特征信息对数据进行分类标记,记录数据的类型特征;
数据查重模块,用于通过区块链技术对分类标记后的数据根据类型特征进行分段式处理,对分段后的数据片段进行扫描,将扫描结果按照重复频率进行排列;
数据去冗余处理模块,按照排列顺序逐一与历史数据库中的高频重复数据进行比对,比对成功后,删除重复的数据片段;
数据存储模块,将剩余数据片段进行归类存储至对应类型的数据库节点。
7.根据权利要求6所述的基于区块链的分布式数据存储系统,其特征在于,所述系统还包括:
数据查询处理模块,用于数据库节点接收数据片段对应的数据,并利用哈希算法计算每条数据内容对应的摘录,存在区块链节点上,区块链节点接收数据查询请求,调取与查询内容对应的摘录,数据库节点返回与对应摘录一致的被查询数据内容。
CN202110624722.4A 2021-06-04 2021-06-04 一种基于区块链的分布式数据存储方法及系统 Pending CN113360501A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110624722.4A CN113360501A (zh) 2021-06-04 2021-06-04 一种基于区块链的分布式数据存储方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110624722.4A CN113360501A (zh) 2021-06-04 2021-06-04 一种基于区块链的分布式数据存储方法及系统

Publications (1)

Publication Number Publication Date
CN113360501A true CN113360501A (zh) 2021-09-07

Family

ID=77532391

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110624722.4A Pending CN113360501A (zh) 2021-06-04 2021-06-04 一种基于区块链的分布式数据存储方法及系统

Country Status (1)

Country Link
CN (1) CN113360501A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277179A (zh) * 2022-07-26 2022-11-01 湖南三湘银行股份有限公司 一种基于多步保护的开放平台综合安全保护方法
WO2024098862A1 (zh) * 2022-11-07 2024-05-16 腾讯科技(深圳)有限公司 一种基于区块链的数据处理方法、装置、设备及介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193490A (zh) * 2017-05-16 2017-09-22 北京中星仝创科技有限公司 一种基于区块链的分布式数据存储系统及方法
CN109101830A (zh) * 2018-09-03 2018-12-28 安徽太阳石科技有限公司 基于区块链的实时数据安全防护方法和系统
CN109117096A (zh) * 2018-09-03 2019-01-01 安徽太阳石科技有限公司 基于区块链的分布式数据存储方法和系统
CN109492432A (zh) * 2018-11-08 2019-03-19 安徽太阳石科技有限公司 基于区块链的实时数据安全防护方法和系统
CN111832682A (zh) * 2020-07-13 2020-10-27 成都翔宇致远文化传播有限公司 一种基于区块链技术的分布式存储数据优化方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193490A (zh) * 2017-05-16 2017-09-22 北京中星仝创科技有限公司 一种基于区块链的分布式数据存储系统及方法
CN109101830A (zh) * 2018-09-03 2018-12-28 安徽太阳石科技有限公司 基于区块链的实时数据安全防护方法和系统
CN109117096A (zh) * 2018-09-03 2019-01-01 安徽太阳石科技有限公司 基于区块链的分布式数据存储方法和系统
CN109492432A (zh) * 2018-11-08 2019-03-19 安徽太阳石科技有限公司 基于区块链的实时数据安全防护方法和系统
CN111832682A (zh) * 2020-07-13 2020-10-27 成都翔宇致远文化传播有限公司 一种基于区块链技术的分布式存储数据优化方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115277179A (zh) * 2022-07-26 2022-11-01 湖南三湘银行股份有限公司 一种基于多步保护的开放平台综合安全保护方法
WO2024098862A1 (zh) * 2022-11-07 2024-05-16 腾讯科技(深圳)有限公司 一种基于区块链的数据处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
EP3693886A1 (en) Optimizations for verification of interactions system and method
CN107193490B (zh) 一种基于区块链的分布式数据存储系统及方法
CN105868305B (zh) 一种支持模糊匹配的云存储数据去重复方法
US11468044B2 (en) Optimizations for verification of interactions system and method using probability density functions
CN113360501A (zh) 一种基于区块链的分布式数据存储方法及系统
US7257711B2 (en) Efficient authenticated dictionaries with skip lists and commutative hashing
CN113326317A (zh) 基于同构多链架构的区块链存证方法及系统
CN113535706B (zh) 两阶段布谷鸟过滤器及基于两阶段布谷鸟过滤器的重复数据删除方法
CN109101830A (zh) 基于区块链的实时数据安全防护方法和系统
Li et al. Integrity-verifiable conjunctive keyword searchable encryption in cloud storage
CN110619019B (zh) 数据的分布式存储方法及系统
CN108898032A (zh) 一种基于区块链技术的电子数据存证的高效处理方法
CN112015674A (zh) 基于多层级的缓存资源访问方法、装置和计算机设备
CN110958109B (zh) 基于层次默克尔哈希树的轻型动态数据完整性审计方法
TWI715036B (zh) 檔案驗證方法、檔案驗證系統與檔案驗證伺服器
CN106603561A (zh) 一种云存储中的块级加密方法及多粒度去重复方法
CN113378148A (zh) 一种基于区块链的物联网设备身份认证系统及方法
CN109492432A (zh) 基于区块链的实时数据安全防护方法和系统
CN113076319B (zh) 基于离群值检测技术和位图索引的动态数据库填充方法
CN114791788B (zh) 一种基于区块链的数据存储方法及装置
Zheng et al. An efficient multikeyword fuzzy ciphertext retrieval scheme based on distributed transmission for Internet of Things
CN115499244A (zh) 一种基于数据湖的流式数据安全传输和存储方法
CN112598501B (zh) 一种银行电子证据的处理方法与系统
CN115129781A (zh) 数据处理方法、装置、电子设备和存储介质
CN111209272B (zh) 一种话单查重方法、装置及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20221009

Address after: Room 305, No. 188, Zhugushi Road, Wulian, Central City, Longgang Street, Longgang District, Shenzhen, Guangdong 518100

Applicant after: Jiaqiao (Shenzhen) Investment Co.,Ltd.

Address before: D-1908, 19th floor, building 222, Wangjing Xiyuan, Chaoyang District, Beijing

Applicant before: Yongqi (Beijing) Technology Co.,Ltd.

TA01 Transfer of patent application right