CN114329528A - 一种基于区块链的档案数据管理方法及系统 - Google Patents
一种基于区块链的档案数据管理方法及系统 Download PDFInfo
- Publication number
- CN114329528A CN114329528A CN202111562149.5A CN202111562149A CN114329528A CN 114329528 A CN114329528 A CN 114329528A CN 202111562149 A CN202111562149 A CN 202111562149A CN 114329528 A CN114329528 A CN 114329528A
- Authority
- CN
- China
- Prior art keywords
- archive
- data
- file
- digital
- block chain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Storage Device Security (AREA)
Abstract
本申请公开了一种基于区块链的档案数据管理方法,其特征在于,包括由区块链化数字档案馆、系统服务、数字档案馆联盟区块链等构建的系统架构,来完成档案分布式存储与效验;所述区块链化数字档案馆由超级账本中多个节点组成,属同一档案馆中的节点在同一通道;在档案存储模块,建立主从库复制机制,并采用粒度感知的方法,将大文件存储在IPFS上并获取哈希地址,将小文件直接存储上链;出一种实用、安全的跨档案库数据共享方案,以此来串联各档案馆数据传输;通过定义锚节点选举和普通节点的生成来完成档案馆的线下注册,通过生成Token并存储上链的形式来完成普通用户的线上注册。本申请还同时公开了一种基于区块链的档案数据管理系统,具有上述有益效果。
Description
技术领域
本申请属于计算机应用技术领域,尤其涉及一种基于区块链的档案数据管理方法及系统。
背景技术
在大数据时代,传统档案存储与管理方式很难有效处理档案管理过程中所面临的效率与安全问题。互联网、云技术和移动终端的迅速发展推动了政府部门大力发展数字化手段来提升档案的存储与管理效率,并迎合用户对档案数据深度利用的需求,为政府部门的无纸化办公和电子政务的信息接轨创造有利条件。但现有基于互联网通讯技术的数字档案管理方法为档案的管理带来便利的同时,也存在以下弊端:(1)现有数字档案系统大多通过数字签名和数字水印来解决数据安全保护问题,数据遭受破坏后很难恢复;(2)各地区档案馆都是独立存储档案的信息“孤岛”,缺乏安全有效的信息共享渠道;(3)档案系统的真实性和原始性过分依赖系统中心或第三方实体,中心化的档案数据库异遭受数据篡改、黑客攻击、信息纠纷等安全隐患;(4)相较于传统纸质档案,数字档案作为存储在物理介质上的比特字节,档案在处理、传输和存储过程中具有高度易变性。
比较中心化数字档案技术和区块链技术,二者针对的都是存储在磁性介质上的电子信息。数字档案技术存储的信息包括数字化档案数据、用户数据和用户操作记录。其中数字档案数据是数字档案的核心要素,数据一旦受损,对个人、社会、企业乃至国家将造成不可弥补的后果;用户操作记录是受理人对档案信息进行编辑、入档、修改、出档等操作所形成的操作痕迹,此类记录具有较高的可追溯性,是档案信息的重要凭证;传统分布式文件存储技术带来高效存储的同时仍未摆脱中心化结构和管理方式,为档案数据和文件寻求一个可靠、安全的存储技术具有现实意义。区块链的去中心化、多方维护、防篡改和可信存储等优点同数字档案管理相结合,解决数字档案管理中普遍存在的安全性低、共享性差和不可追溯历史等问题。
发明内容
本申请的目的在于解决上述现有档案数据管理的问题,提供一种基于区块链的档案数据管理方法及系统,即将区块链技术的去中心化、透明、可追溯等特性应用于数字档案管理中,并结合分布式数据管理工具,来完成对档案信息和操作信息的存储、备份和安全性验证工作,搭建一个兼顾高性能、经济性和灵活性的新型档案数据管理系统。
第一方面,本申请提供了一种基于区块链的档案数据管理方法,包括:
该方法定义了由区块链化数字档案馆、系统服务、数字档案馆联盟区块链、公有区块链、IPFS集群和外部用户共同构建的网络拓扑。各组件承担的功能和角色的特征如下:
1)一个区块链化数字档案馆(以下简称数字档案馆)是由联盟链技术超级账本中的多个Peer节点参与到区块链网络中组成,属同一数字档案馆中的节点在同一通道,节点享有档案验证、查询、保护、共享等服务;
2)系统服务包含数据抽取模块和RESTful服务两个部分,其中RESTful服务为数字档案管理系统提供对区块链智能合约和IPFS的接口调用,数据抽取模块则用于实现异构档案数据的安全存储;
3)数字档案馆联盟区块链(以下简称联盟链)采用联盟链平台超级账本(Hyperledger Fabric,以下简称Fabric)技术,并采用基于Kafka和Zookeeper集群的消息队列排序共识插件;
4)公有区块链采用基于PoW共识机制的以太坊区块链平台,该公有区块链会定期存储联盟链区块快照信息,强化联盟链Fabric的数据保护;
5)IPFS集群存储加密档案的原始信息,并通过哈希表、块交换等技术保障信息安全。
进一步地,在数据存储方面,提出一种高效的异构档案数据存储方法,该方法可拆分为数据和文件抽取阶段、数据加密存储阶段、电子文件分布式存储阶段。
1)在数据和文件抽取阶段,通过实时监听节点抽取新增事务日志,记录、解析事务日志并抽取档案电子文件,并完成主从复制,具体指:
a)主库完成事务操作更新并将更新数据详情记录在日志文件或日志表中;
b)通过与主库开启一个监听线程来建立一个中间客户端连接,实现对主库事务日志的抽取;
c)中间客户端抽取到操作日志并通过加密信道存储至私有网络,并通过解析日志中文件存储路径来获取电子文件并存储在IPFS网络中;
d)从库可根据同步需求复现存储在区块链上的事务日志来重建数据。
2)在数据加密存储阶段,数据加密存储的过程描述为:将日志对象转化为json格式后再转化为字符串;对日志字符加密并生成密文;封装档案数据;封装元数据;将存储的所有信息封装成区块链交易;向区块链发布交易并得到交易ID。
3)在电子文件分布式存储阶段,摒弃传统文件存储系统,具体描述为:
a)采用私有IPFS分布式文件存储系统,当文件内存大于256KB时,将文件拆分为多个IPFS存储子对象,每个子对象包含当前对象的data和链接下级对象的links,而区块默克尔根链接下级对象的links则设置为空;
b)提出粒度感知的文件存储方法,根据文件存储路径抽取档案电子文件,若文件大于65536字节(64KB),则将文件存储在IPFS上并获取其哈希地址,当小于65536字节则直接存储。
进一步地,结合本申请所述档案数据管理方法中整体架构,提出一种实用、安全的数字档案数据共享方法。该方法使得数字档案馆之间或数字档案馆与外部用户之间通过智能合约、IPFS和混合加密机制实现安全、实用的档案数据共享,安全高效地将传统档案系统同区块链技术结合,从而保护档案数据安全。
进一步地,在所述档案数据管理方法中,提出一种高效、可靠的数字档案馆预注册与快速认证方法。其中预注册分为线下注册和线上注册两部分。
1)线下注册包括锚节点(Leader Peer)的选举和普通节点的生成,锚节点选举步骤包括:
a)联盟链内各节点提议自己为leader并广播该消息;
b)在P2P网络内各节点在规定的等待时间内收集提议;
c)等待收集后,将自己的节点ID的哈希值同其他节点ID的哈希值进行比较;
d)若自己的ID的哈希值比其他任何节点ID的哈希值小,则声明自己为锚节点,否则放弃选举过程。
普通节点生成步骤包括:
a)Peer线下认定时,CA核对其申请材料的真实性;
b)档案馆确认管理员后,CA用RSA密码算法生成Peer的公钥P_Peer私钥S_Peer;
c)CA为Peer颁发证书Cert_Peer;
d)Leader Peer则存储Peer的公共参数、证书信息和其公、私钥;
e)CA记录各数字档案馆和其Leader Peer身份的映射关系。
2)线上注册指普通用户的身份注册,其步骤包括:
a)临近Peer会自动为注册用户生成公私钥对{P_User,S_User},并将P_User、Peer证书中的区域号附上时间戳,并构成Token,向Leader Peer发送对该Token的注册请求;
b)Leader Peer对其进行初步的PKI身份认证,确保公钥不在撤销列表并确认Token中的区域号与Peer证书中的一致;
c)各节点收到注册信息后分别进行验证,若满足半数以上的节点返回成功结果,则触发智能合约,将Token存储上链。
3)快速认证交互过程,其步骤包括:
a)User_A将自己的Token_A和时间戳T签名后发送给User_B;
b)User_B附加自己Token_B的组成认证请求,并用临近Peer的公钥加密后发送给Leader Peer;
c)Leader Peer用Peer私钥解密请求后触发智能合约来检索区块链,查看区块链链中是否记载Token_A和Token_B,并验证签名和时间戳;
d)Peer将该认证成功的签名Sign_Leader和随机生成的Token_Peer发送给User_ B;
e)User_B将Sign_Leader和Token_Peer发送给User_A,User_A验证Sign_Leader无误后确定Token_Peer为他们共同的临时会话秘钥。
第二方面,本申请提供了一种基于区块链的档案数据管理系统,包括:
该系统具备前述基于区块链的档案数据管理方法的所有有益特征及效果,定义该系统由上述数字档案馆联盟链、公有链和IPFS集群组成;一个区块链化数据档案馆作为联盟链超级账本中的一个组织,该组织由超级账本总的主节点和若干普通节点组成,并定义在同一通道内;上述方法中所述系统服务符合该基于区块链的档案数据管理系统的功能化设计。
进一步地,通过以下步骤完成系统内各组件的档案数据传输:
1)数字档案馆向联盟链Fabric存储档案哈希和各种操作合约记录;
2)数字档案馆向IPFS私有集群存储加密档案原始信息并通过调用联盟链档案哈希实现对数据真实性的验证;
3)IPFS私有集群通过存储档案内容计算档案指纹并传输给联盟链Fabric;
4)联盟链Fabric将生成的区块哈希传输给公有区块链以太坊完成快照存储,实现档案数据的锚定。
该系统满足上述所述异构档案数据存储方法、数字档案数据共享方法和数字档案馆预注册与快速认证方法的所有特性,可实时生成多个区块链化数字档案馆,并达到各数字档案馆独立自治和数据互通,具有联盟链的可扩展性。
与现有技术相比,本申请的优势在于:保持档案存储应用到区块链去中心化、可信存储和可追溯的同时,也能兼顾到数据存储的性能、经济性和灵活性;保障各自档案馆维护自身的数据与隐私安全的同时,又能在实际应用中完成馆与馆之间部分档案数据安全共享;实现了联盟链内各数字档案馆的内部自治和身份安全。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,应当理解,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是基于区块链的档案数据管理系统的整体架构图。
图2是数字档案数据流图。
图3是异构档案数据安全存储方法图。
图4是粒度感知文件存储模型。
图5是数字档案数据共享流程图。
图6是快速认证过程图。
具体实施方式
为了将本申请的技术方法、目的及优势更加清楚地阐明,本申请结合以下实施例及实施例附图,对其申请内容进行更深刻完整地描述。应当理解,此处描述的具体实施例用于解释本申请,并不能限定本申请,所描述的实施例是仅指本申请的一部分实施例,而不是全部实施例。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。基于本申请的实施例,相关领域技术人员在没有做创造性劳动前所获得的其它实施例均属于本申请保护的范畴。
本申请提出一种基于区块链的档案数据管理方法及系统,通过结合区块链联盟链技术和分布式数据管理工具来解决目前数字档案管理存在的问题,在保持档案存储应用到区块链去中心化、可信存储和可追溯的同时,也能兼顾到高性能、经济性和灵活性。结合上述思想,本申请首先设计一种高效的异构档案数据存储方法,该方法旨在解决采用区块链存储数据时各文件类型、内存均不相同且部分文件内存占比较大带来的存储问题;其次,在保障各自档案馆维护自身的数据与隐私安全的同时,又能在实际应用中完成馆与馆之间部分档案数据安全共享,本申请提出一种实用、安全的数字档案数据共享方法;最后,提出一种高效、可靠的数字档案馆预注册与快速认证方法,实现了联盟链内各数字档案馆的内部自治和身份安全。
一、整体架构。
如图1所示,本申请实施例的基于区块链的档案数据管理方法及系统由区块链化数字档案馆、系统服务(数据抽取模块、RESTful服务)、数字档案馆联盟区块链、公有区块链、IPFS集群和外部用户构成系统协同完成,其中联盟链、公有区块链和IPFS集群共同完成对档案信息和操作信息的存储、备份和安全性验证工作。各部分内容详述如下:
1)区块链化数字档案馆:一个数字档案馆是由超级账本(Hyperledger Fabric)中的多个Peer节点参与到超级账本联盟链中组成(该图中显示有A、B两个数字档案馆),属同一数字档案馆中的节点在同一通道,属不同数字档案馆的节点在不同通道,节点享有档案验证、查询、保护、共享等服务;
2)系统服务:系统服务包含数据抽取模块和RESTful服务两个部分。其中RESTful是一种网络应用程序的设计风格和开发方式,基于HTTP,它本身也是一种去中心化应用(DApp),不存储任何档案数据信息,本方法采用以RESTful接口的形式为数字档案管理系统提供对区块链智能合约和IPFS接口的调用。数据抽取模块则通过抽取档案数据库事务日志和电子文件,针对不同档案数据尺寸设计数据安全存储模型,并与联盟链和IPFS集群对接,实现异构档案数据的安全存储;
3)数字档案馆联盟区块链:联盟链采用联盟链平台超级账本(HyperledgerFabric),并基于Kafka和Zookeeper集群的排序共识机制,通过RESTful接口调用智能合约存储系统的数字身份信息和档案摘要信息,实现数据的访问控制并完成业务逻辑;
4)公有区块链:公有区块链采用基于PoW共识机制的以太坊区块链平台,该链会定期存储联盟链区块快照信息,强化联盟链Fabric的数据保护。反之,联盟链Fabric也会定期同该链通过锚定的方式来强化保护数据的原始性和真实性;
5)IPFS集群:IPFS分布式文件系统,该系统具有自我认证、哈希表、块交换等技术优点,具有内容可寻址、不可篡改和去中心化等特点。IPFS在存储文件时会通过文件内容计算出文件指纹,该指纹在读取文件时可为用户起到验证作用。采用IPFS私有集群,具有相同swarm-key的节点才能参与到网络中。IPFS集群存储了加密档案的原始信息,并通过哈希表、块交换等技术保障信息安全。
由上所述,基于联盟链Hyperledger Fabric、公有区块链以太坊和私有IPFS集群结合的系统数据传输流如图2所示。具体可描述为:
S201:数字档案馆向联盟链Fabric存储档案哈希和各种操作合约记录;
S202:数字档案馆向IPFS私有集群存储加密档案原始信息并通过调用联盟链档案哈希实现对数据真实性的验证;
S203:IPFS私有集群通过存储档案内容计算档案指纹并传输给联盟链Fabric;
S204:联盟链Fabric将生成的区块哈希传输给公有区块链以太坊完成快照存储,实现档案数据的锚定。
二、异构档案数据安全存储方法。
从数字档案馆中提取的数据流大体按数据格式类型可分为两类,即档案数据库日志和档案电子文件。数据库记录的每条事务日志同区块链中的每笔交易(transaction)类似,因此在区块链上存储事务日志是切实可行的;而针对档案电子文件,各文件的类型、内存均不相同,且文件内存所占比特较大,采用区块链交易存储的方式不再是必要的。现有中心化的、基于主库从库复制的数据备份方法一般通过设置中间库来完成目标数据库行为日志的存储,该方法只用于备份数据库,并未考虑档案文件,同时易造成单点故障。为解决上述问题,本申请提出一种异构档案数据安全存储方法,该方法对应到图1中的数据抽取模块。
事务日志是数据库的核心组件之一,数据库创建后的各项操作都将被记录在该组件中。这类事务日志信息可帮助系统在发生故障时完成数据恢复,并支持在不对现有上层档案业务造成影响的情况下实现事务复制以达到数据备份的目的。本方法提出联盟链和IPFS集群相协调的数据存储方法,通过抽取档案的事务日志和电子文件,对不同尺寸数据设计粒度感知的安全存储模型,实现异构档案数据安全存储,该方法模型可参见图3。
方法的具体实施可分为三个阶段,分别是数据和文件抽取阶段、数据加密存储阶段、电子文件分布式存储阶段。各阶段详述如下:
1)数据和文件抽取阶段。
通过实时监听节点抽取新增事务日志,记录、解析事务日志并抽取档案电子文件,并完成主从复制。具体步骤如下:
a)档案数据库(主库)完成事务操作更新并将更新数据详情记录在日志文件或日志表中;
b)通过与主库开启一个监听线程来建立一个中间客户端连接,实现对主库事务日志的抽取;
c)中间客户端抽取到操作日志并通过加密信道存储至私有网络,而涉及到对新增档案电子文件的操作,通过解析日志中文件存储路径来获取电子文件并存储在IPFS网络中;
d)备份数据库(从库)可根据同步需求复现存储在区块链上的事务日志来重建数据。
该主库从库复制方式较为灵活,区块链上存储的日志信息可充当主库的中继站,其他数据库则通过获取完整操作日志,实现数据同步,保障从库和主库的数据一致性。
2)数据加密存储阶段。
在档案信息的传输与存储过程中,为保障数据隐私性和安全性,对抽取的档案事务日志设计一种加密处理方式。基于BigchainDB的交易格式,定义Tx_log为封装后的区块链交易,sk_user为用户私钥(用于对封装交易进行签名),Data_asset为交易资产(由加密后的事务日志组成),Data_meta为元数据(用于描述资产类别和内容),每笔交易的输入为资产、元数据和用户私钥,满足Tx_log = {Data_asset,Data_meta,sk_user};定义事务编号为scn,操作者名为os_user,ENC_AES(log,pk_user)表示通过用户密码pk_user对事务日志log进行AES加密,则满足Data_asset = {scn,os_user,ENC_AES(log,pk_user)}。
基于上述定义,整个事务日志加密处理流程为:将日志对象转化为json格式后再转化为字符串;对日志字符加密并生成密文;封装Data_asset;封装Data_meta;将存储的所有信息封装成区块链交易;向区块链发布交易并得到交易ID。
3)电子文件分布式存储阶段。
目前基于区块链的大型数据与异构文件存储方法,通常采用第三方文件系统同区块链系统结合的链上、链下方式来实现。这种结合方式造成以下问题:链下文件系统采用中心化或分布式存储和管理方式,不能完全保障数据安全性和一致性;当链下文件被破坏后,区块链仅作为一个文件验证工具,并不能对恢复文件提供帮助。
结合数字档案馆的管理场景,如图4所示的整体流程,本申请提供以下方法:
1)摒弃传统文件存储系统,采用私有IPFS分布式文件存储系统,该系统具备去中心化、不可篡改、哈希寻址、块交换等特点,同区块链技术协同,可强化数据存储的真实性完整性;
2)提出粒度感知的文件存储方法,将小尺寸文件处理后直接上链,将大尺寸文件存入IPFS并将指纹存储上链。
为方便论述,本方法的具体实施步骤可划分为以下几个部分:
1)定义一个文件存储在IPFS上的数据对象结构体(IPFSobject),该结构体包含链接IPFS对象的一个数组(links),该数组为IPFSLink结构体类型,还包含一个byte类型的二进制对象(data),用于存储不高于256KB的数据,其中IPFSLink结构体包含的元素有链接名称(Name)、链接对象哈希值(Hash)和链接对象累积大小(Size);
2)基于上述定义的数据结构,当文件内存大于256KB时,将文件拆分为多个IPFS存储子对象,每个子对象包含当前对象的data和链接下级对象的links,而区块默克尔根链接下级对象的links则设置为空。数据links中的IPFSLink对象则存储该链接的Name、Hash和Size;
3)设定64KB为下界,大于64KB的档案文件为大尺寸文件,反之则为小尺寸文件。解析抽取的事务日志,根据文件存储路径抽取档案电子文件,若文件大于65536字节(64KB),则将文件存储在IPFS上并获取其哈希地址,当小于65536字节则直接存储;
4)根据解析的事务日志,进一步判断当前档案文件密级属性,若为公开文件,则直接按相关参数融合打包,若为私密文件,则使用共享秘钥加密后再根据相关参数融合打包。
三、数字档案数据共享方法。
数字档案馆联盟链中各数字档案馆之间的数据是跨通道隔离应用,以此来确保各字档案馆维护自身的数据安全与隐私,但在实际应用中普遍需要进行馆与馆之间部分档案数据共享的业务,结合本申请整体架构,本申请提出一种上述联盟链架构下各数字档案馆之间的档案数据共享方法。具体指:
数字档案馆联盟成员间或档案馆联盟与外部用户之间通过智能合约、IPFS和混合加密机制实现安全、实用的档案数据共享,安全高效地将传统档案系统同区块链系统结合,从而保护档案数据安全。
若定义一个数字档案馆A向目标数字档案馆B共享数据的方法模型,该模型还需定义如下联盟链智能合约功能:
1)档案权限控制合约:用于数字档案权限控制的;
2)档案共享存储合约:用于存储档案馆分享的档案信息,其中包括档案编号、档案馆身份标识和分享时间等;
3)数字身份管理合约:通过民主投票的方式竞选出档案馆内部部分Peer节点实现档案馆联盟数字身份内部自治。
请注意,此处我们仅简单描述智能合约的功能,并不对其做详细描述,该内容也不作为本申请的论述重点。
方法的具体步骤如图5所示:
S501:若所述数字档案馆A使用自己的私钥SK_A对待共享档案的档案编号Record_ ID和目标档案馆B的身份标识Identity_B等信息进行签名背书,并通过调用RESTful服务接口将签名背书发到到智能合约。档案共享存储智能合约接收到请求后,先调用档案权限控制合约,通过检验签名来对档案馆身份进行核查,核查通过后,将目标档案馆B的身份信息写入到合约中档案编号Record_ID对应的分享列表;
S502:若所述数字档案馆B使用自己的私钥SK_B对待共享档案的档案编号Record_ ID和其身份标识Identity_B进行签名并发送到智能合约。档案共享存储合约在收到请求后,先调用档案权限控制合约对数字档案馆B进行权限检查,检查通过后,返回档案指纹和对应的哈希值;
S503:若所述数字档案馆B依赖从合约中获取的档案指纹,从私有IPFS集群中异步获取加密的档案对象RecordJson。进一步地,数字档案馆B通过异步HTTPS请求将其身份标识Identity_B和档案编号Record_ID发送给数字档案馆A,并获取加密档案对象RecordJson的解密秘钥;
S504:若所述数字档案馆A收到档案馆B的请求后,根据档案编号Record_ID和身份标识Identity_B等参数,通过档案共享存储合约来检验共享数据的真实性,并从数字身份管理合约中获取Identity_B对应的PK_B。随后使用PK_B对解密秘钥edk进行基于椭圆曲线的非对称加密,并返回给数字档案馆B;
S505:若所述数字档案馆B在收到档案馆A的返还数据后,使用私钥SK_B解密得到原始加密前的edk,然后使用edk对RecordJson进行解密,得到原始的档案对象;或通过JSON结构中的档案附件指纹从IPFS中获取附件密文并通过edk解密后查看档案数据。
四、数字档案馆预注册与快速认证。
定义数字档案馆中的节点身份和用户身份是系统参与到联盟链Fabric的前提,是数字档案信息保护与数据共享的基础。基于上述构建的系统整体架构,我们提出一种高效、可靠的数字档案馆预注册与快速认证方法。
预注册又包括线下注册和线上注册两部分。
线下注册指锚节点的选定和普通节点的生成。
所述线下注册的实施例,具体可描述为:
所述锚节点是联盟链Fabric网络中是一种特殊节点,也称为主节点,当存在跨档案馆通信时,源档案馆需要获得目标档案馆至少一个节点通信地址,锚节点则作为该档案馆的路口点。锚节点(Leader Peer)的产生是一个动态选举的过程,具体指联盟链内各节点提议自己为Leader并广播该消息;随后在P2P网络内各节点在规定的等待时间内收集提议;等待收集后,将自己的节点ID的哈希值同其他节点ID的哈希值进行比较,若自己的ID的哈希值比其他任何节点ID的哈希值小,则声明自己为主节点,否则放弃选举过程。请注意档案馆生成使联盟链会默认为其设置至少两个Peer节点。
在普通节点(以下简称Peer)部署前,联盟链Fabric-CA为每个线下认定的Peer颁发证书Cert_Peer。Peer线下认定时,CA会核对其申请材料的真实性,记录下数字档案馆管理员的真实身份和公钥的映射关系,并为其颁发证书。具体指:数字档案馆确认管理员用户后,CA用RSA密码算法生成Peer的公钥P_Peer和私钥S_Peer,并颁发证书Cert_Peer。该证书中包含:Peer的公钥、证书有效日期、CA的私钥签名、Peer所部署的档案馆区域编号N_Peer等信息。Leader Peer则存储Peer的公共参数、证书信息和其公、私钥。CA则记录各数字档案馆和其Leader Peer身份的映射关系。由此可知,CA负责生成各档案馆Leader Peer和Peer代表身份的公私钥对,CA负责管理Leader Peer的身份,而Leader Peer则负责管理Peer的身份。
所述线上注册的实施例,具体可描述为:
所述各数字档案馆内的节点构建各自通道内的小型联盟链网络,Leader Peer在网络中暴露自己的身份信息。
1)当普通用户需要注册账户时,临近的Peer会自动为其生成公私钥对{P_user,S_ user},随后将P_user、Peer证书中的区域号附上时间戳,并构成Token,向Leader Peer发送对该Token的注册请求。
2)Leader Peer用私钥解密该Peer发来的用户注册请求,对其进行初步的PKI身份认证,确保公钥不在撤销列表并确认Token中的区域号与Peer证书中的一致。
3)验证通过后用户注册的消息在该档案馆各节点内同步;各节点收到消息后分别进行验证,若满足半数以上的节点返回成功结果,则触发智能合约并生成用户Token与其公钥的映射关系,并将Token存储上链。
在这里,Peer具备为普通用户生成身份的权利,而Leader Peer拥有验证普通用户的权利。该方式削弱了档案馆内小型网络中心化的程度,同时又减轻了Fabric-CA的负担。
所述快速认证的实施例,具体可描述为:
同一数字档案馆内的普通用户在完成线上注册后,若需要进行彼此通信,则需要发起一个线上身份的快速认证,该认证方法可简述为User_A向用户User_B发送身份信息,用户B可向任意临近的节点请求认证用户A的身份,并生成会话秘钥,否则中断通信。图6给出了快速认证的交互过程,具体内容描述如下:
S601:User_A将自己的Token_A和时间戳T签名后发送给User_B;
S602:User_B将从User_A接收的的身份信息附加自己的Token_B组成认证请求,并用临近Peer的公钥加密后发送给Leader Peer;
S603:Leader Peer用Peer私钥解密请求后触发智能合约来检索区块链,查看区块链链中是否记载Token_A和Token_B,若都存在且时间未过期则验证Peer的签名,验证通过后最后检查消息时间戳是否有效;
S604:上述条件均满足则Leader Peer会向Peer返回认证成功Success,并对其签名,Peer将该认证成功的签名Sign_Leader和随机生成的Token_Peer利用User_B的公钥加密后发送给User_B;
S605:User_B解密消息后利用User_A的公钥将Sign_Leader和Token_Peer发送给User_A,User_A验证Sign_Leader无误后确定Token_Peer为他们共同的临时会话秘钥。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。本领域的普通技术人员可以对本申请的技术方法进行修改或者等同替换,而不脱离本申请的精神和范围,本申请的保护范围应以权利要求所述为准。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
Claims (10)
1.一种基于区块链的档案数据管理方法,其特征在于,包括:
定义区块链化数字档案馆、系统服务、数字档案馆联盟区块链、公有区块链、IPFS集群和外部用户在内的所有角色,其中数字档案馆联盟区块链、公有区块链和IPFS集群共同完成对档案信息和操作信息的存储、备份和安全性验证工作;
所述区块链化数字档案馆由超级账本中的多个Peer节点组成,属于同一数字档案馆中的节点在同一通道,属于不同数字档案馆的节点在不同通道,节点享有档案验证、查询、保护、共享服务;
所述系统服务通过RESTful接口格式为档案数据存储、应用管理提供区块链智能合约和IPFS接口的调用,数据抽取模块通过抽取档案数据库事务日志和电子文件,并针对不同档案数据尺寸设计数据安全存储模型,来完成数字档案馆联盟区块链和IPFS集群对接,从而实现异构档案数据的安全存储;
所述数字档案馆联盟区块链采用超级账本技术,通过RESTful接口调用智能合约存储系统的数字身份信息和档案摘要信息,实现数据的访问控制并完成业务逻辑;
所述数字档案馆联盟区块链的区块定期向公有区块链存储快照信息,强化档案数据保护;
所述IPFS集群存储加密档案的原始信息,并通过哈希表、块交换技术保障信息安全;
结合所述方法中提出的整体架构,首先设计一种高效的异构档案数据存储方法;其次,提出一种实用、安全的数字档案数据共享方法;最后,提出一种区块链化数字档案馆预注册与快速认证方法。
2.根据权利要求1所述的方法,其特征在于,结合权利要求1中所述所有角色组成的整体架构,其档案数据传输流描述为:区块链化数字档案馆向数字档案馆联盟区块链存储档案哈希和各种操作合约记录;区块链化数字档案馆向IPFS私有集群存储加密档案原始信息并通过调用数字档案馆联盟区块链档案哈希实现对数据真实性的验证;IPFS私有集群通过存储档案内容计算档案数据指纹并传输给数字档案馆联盟区块链;数字档案馆联盟区块链将生成的区块哈希传输给公有区块链以太坊完成快照存储,实现档案数据的锚定。
3.根据权利要求1所述的方法,其特征在于,所述异构档案数据安全存储方案旨在将档案管数据流分为事务日志和电子文件,通过抽取档案的事务日志和电子文件,对不同尺寸数据设计粒度感知的安全存储模型,实现异构档案数据安全存储,实时划分为数据和文件抽取阶段、数据加密存储阶段、电子文件分布式存储阶段。
4.根据权利要求3所述的方法,其特征在于,所述数据和文件抽取阶段包括实时监听节点抽取新增事务日志,记录、解析事务日志并抽取档案电子文件,并完成主从复制;
具体指:主库完成事务操作更新并将更新数据详情记录在日志文件或日志表中;通过与主库开启一个监听线程来建立一个中间客户端连接,实现对主库事务日志的抽取;中间客户端抽取到操作日志并通过加密信道存储至私有网络,而涉及到对新增档案电子文件的操作,通过解析日志中文件存储路径来获取电子文件并存储在IPFS网络中;从库根据同步需求复现存储在区块链上的事务日志来重建数据。
5.根据权利要求3所述的方法,其特征在于,所述数据加密存储阶段基于BigchainDB的交易格式,将日志对象转化为json格式后再转化为字符串,对日志字符加密并生成密文,随后封装成区块链交易,最后向区块链发布交易并得到交易ID。
6.根据权利要求3所述的方法,其特征在于,所述电子文件分布式存储阶段包括解析抽取的事务日志,根据文件存储路径抽取档案电子文件,若文件大于64KB,则将文件存储在IPFS上并获取其哈希地址,当小于64KB则直接存储;
此外,根据解析的事务日志,进一步判断当前档案文件密级属性,若为公开文件,则直接按相关参数融合打包,若为私密文件,则使用共享秘钥加密后再根据相关参数融合打包。
7.根据权利要求1所述的方法,其特征在于,所述数字档案数据共享方法定义了一个数字档案馆A向目标数字档案馆B共享数据的方法模型,还包括多个智能合约功能,其中:
档案权限控制合约:用于数字档案权限控制;
档案共享存储合约:用于存储档案馆分享的档案信息,其中包括档案编号、档案馆身份标识和分享时间;
数字身份管理合约:通过民主投票的方式竞选出档案馆内部部分Peer节点实现数字档案馆联盟区块链中数字身份的内部自治。
8.根据权利要求1所述的方法,其特征在于,所述区块链化数字档案馆在数字档案馆联盟区块链中预注册,包括线下注册和线上注册,线下注册包括锚节点的选举和普通节点的生成,线上注册指普通用户的身份注册;
所述线上注册中锚节点的产生是一个动态选举的过程,其中包括:
所述联盟链内各节点提议自己为Leader并广播提议;随后在P2P网络内各节点在规定的等待时间内收集提议;等待收集后,将自己的节点ID的哈希值同其他节点ID的哈希值进行比较,若自己的ID的哈希值比其他任何节点ID的哈希值小,则声明自己为主节点,否则放弃选举过程;
所述普通节点生成指CA负责生成各档案馆锚节点和普通节点代表身份的公私钥对,CA负责管理锚节点的身份,而锚节点则负责管理普通节点的身份;
所述线上注册指普通节点具备为普通用户生成身份的权利,而锚节点拥有验证普通用户的权利;当所述普通用户注册账户的时候,临近节点会自动为用户生成公私钥对,随后将公钥、节点证书中的区域号和时间戳构成一个Token,并向锚节点发送对Token的注册请求,Token会记录上链并在链上维护一个用户注册与撤销列表;
所述快速认证旨在通信的双方通过临近节点向链上请求用户的注册Token,Token验证用户身份无误,通信双方协商会话秘钥,否则中断通信。
9.一种基于区块链的档案数据管理系统,其特征在于,包括:
具有上述基于区块链的档案数据管理方法的所有有益效果,定义系统由上述数字档案馆联盟区块链、公有区块链和IPFS集群组成;一个区块链化数据档案馆作为联盟链超级账本中的一个组织,组织由超级账本总的主节点和若干普通节点组成,并定义在同一通道内;权利要求1所述的系统服务符合基于区块链的档案数据管理系统的功能化设计。
10.根据权利要求9所述的系统,其特征在于,所述系统具备权利要求1所述的方法的所有特征,其中还包括:权利要求2所述数据传输流、权利要求3所述档案数据安全存储方法、权利要求7所述数字档案数据共享方法和权利要求8所述区块链化数字档案馆在数字档案馆联盟区块链中预注册与快速认证方法;系统实时生成多个区块链化数字档案馆,并达到各数字档案馆独立自治和数据互通。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562149.5A CN114329528A (zh) | 2021-12-20 | 2021-12-20 | 一种基于区块链的档案数据管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111562149.5A CN114329528A (zh) | 2021-12-20 | 2021-12-20 | 一种基于区块链的档案数据管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114329528A true CN114329528A (zh) | 2022-04-12 |
Family
ID=81053521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111562149.5A Pending CN114329528A (zh) | 2021-12-20 | 2021-12-20 | 一种基于区块链的档案数据管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114329528A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115174277A (zh) * | 2022-09-07 | 2022-10-11 | 浙江省邮电工程建设有限公司 | 基于区块链的数据通信和档案交换方法 |
CN115270193A (zh) * | 2022-09-27 | 2022-11-01 | 武汉市香芋科技有限公司 | 基于区块链及协同同步下的数据档案安全共享方法及装置 |
CN117978553A (zh) * | 2024-04-01 | 2024-05-03 | 山东科技大学 | 一种面向城市区域交叉口的交通数据管理系统及方法 |
CN118171306A (zh) * | 2024-05-13 | 2024-06-11 | 中国地质科学院地质研究所 | 一种基于区块链的成果档案管理方法 |
-
2021
- 2021-12-20 CN CN202111562149.5A patent/CN114329528A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115174277A (zh) * | 2022-09-07 | 2022-10-11 | 浙江省邮电工程建设有限公司 | 基于区块链的数据通信和档案交换方法 |
CN115270193A (zh) * | 2022-09-27 | 2022-11-01 | 武汉市香芋科技有限公司 | 基于区块链及协同同步下的数据档案安全共享方法及装置 |
CN115270193B (zh) * | 2022-09-27 | 2023-02-10 | 武汉市香芋科技有限公司 | 基于区块链及协同同步下的数据档案安全共享方法及装置 |
CN117978553A (zh) * | 2024-04-01 | 2024-05-03 | 山东科技大学 | 一种面向城市区域交叉口的交通数据管理系统及方法 |
CN118171306A (zh) * | 2024-05-13 | 2024-06-11 | 中国地质科学院地质研究所 | 一种基于区块链的成果档案管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110569675B (zh) | 一种基于区块链技术的多Agent交易信息保护方法 | |
CN109409122B (zh) | 文件存储方法及其电子设备、存储介质 | |
CN111144881B (zh) | 对资产转移数据的选择性访问 | |
WO2022042301A1 (zh) | 一种数据处理方法、装置、智能设备及存储介质 | |
WO2023050555A1 (zh) | 一种高性能分布式存储区块数据、时间戳、跨链通信与数据协同方法 | |
WO2021179661A1 (zh) | 跨区块链的数据互存方法、装置、设备及存储介质 | |
CN111881099B (zh) | 数据库私有文档共享 | |
US11895248B2 (en) | Method and apparatus for generating blockchain transaction | |
JP2021512569A (ja) | ブロックチェーンのデータ処理方法、管理側、クライアント側、変換装置及び媒体 | |
CN114329528A (zh) | 一种基于区块链的档案数据管理方法及系统 | |
WO2023024742A1 (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
JP2022549581A (ja) | Dag構造のブロックチェーンにおいてブロックの連続的順序を決定するためのコンピューティング・システム、方法、非一時的コンピュータ可読媒体及びコンピュータ・プログラム | |
CN109472164A (zh) | 合同数据的验证方法及其网络和电子设备 | |
US8806206B2 (en) | Cooperation method and system of hardware secure units, and application device | |
CN111753002B (zh) | 基于同意的数据管理 | |
CN113065961A (zh) | 一种电力区块链数据管理系统 | |
CN109491965A (zh) | 购售电合同的存储方法及其网络和电子设备 | |
US20210334801A1 (en) | Managing transaction requests in ledger systems | |
EP3834157B1 (en) | Managing transaction requests in ledger systems | |
US20220020008A1 (en) | Smart Contract-Based Electronic Contract Preservation System | |
CN111698198B (zh) | 秘密生成和份额分发 | |
CN113255014B (zh) | 一种基于区块链的数据处理方法以及相关设备 | |
CN111831740A (zh) | 对等体的同步 | |
Li et al. | A survey on integrity auditing for data storage in the cloud: from single copy to multiple replicas | |
CN118333577B (zh) | 电子印章制作方法以及电子印章制作系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |