CN116305003B - 一种基于区块链的pdf文档版权保护系统 - Google Patents

一种基于区块链的pdf文档版权保护系统 Download PDF

Info

Publication number
CN116305003B
CN116305003B CN202310524267.XA CN202310524267A CN116305003B CN 116305003 B CN116305003 B CN 116305003B CN 202310524267 A CN202310524267 A CN 202310524267A CN 116305003 B CN116305003 B CN 116305003B
Authority
CN
China
Prior art keywords
pdf document
pdf
document
user
blockchain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310524267.XA
Other languages
English (en)
Other versions
CN116305003A (zh
Inventor
高光勇
万心语
郭崇韬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN202310524267.XA priority Critical patent/CN116305003B/zh
Publication of CN116305003A publication Critical patent/CN116305003A/zh
Application granted granted Critical
Publication of CN116305003B publication Critical patent/CN116305003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6209Protecting access to data via a platform, e.g. using keys or access control rules to a single file or object, e.g. in a secure envelope, encrypted and accessed using a key, or with access control rules appended to the object itself
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本发明公开了一种基于区块链的PDF文档版权保护系统,涉及区块链版权保护技术领域,通过基于区块链的PDF文档版权保护系统对PDF文档进行审核,替代传统的线下纸质审核,审核便捷;通过对用户上传的PDF文档进行查重,保证文档的原创性;通过对PDF文档嵌入版权信息,保护文档的版权;通过将PDF文档和版权证据存储在IPFS星际文件系统中,可以减少系统存储开销,提高版权保护的效率;通过将版权登记信息和交易信息上传到区块链中,利用区块链的不可篡改性,在处理版权纠纷等问题时提供可靠的证据。

Description

一种基于区块链的PDF文档版权保护系统
技术领域
本发明涉及区块链版权保护技术领域,特别是涉及一种基于区块链的PDF文档版权保护系统。
背景技术
版权保护在图像、音乐等数字媒体作品取得很大的进步,许多传统的数字内容保护技术,如加密、数字版权管理DRM、水印和数字指纹,已经被设计用来保护数字版权,然而,由于PDF文档的特性,PDF文档的版权保护进展缓慢,目前,人们的版权意识相对薄弱,为了打击目前市场上的侵权行为,研究人员希望通过技术手段解决目前维权难的局面。
然而,传统的版权内容市场存在着版权确认可信度低、权利溯源困难等问题,由于网络盗版,以创新为核心的版权业务面临巨大挑战,近年来,区块链作为一种新颖的技术,它的发展为解决数字版权保护所面临的困难创造了新的机遇。
区块链技术可以提高数字版权保护的效率,为证据收集、数字资产交易和版权人的权利保护提供新的途径,与传统出版技术相比,这种技术具有更高的透明度和中心性,区块链版权保护系统可以迅速打通创作者、平台方和消费者之间的信息通道,让版权请求方可以在任何时间、任何地点联系创作者进行交易,区块链对版权登记和交易的数量没有上限,可以满足即将进入高速发展正轨的文化产业对版权的大规模需求。
传统的版权管理平台通常采用中心化的数据库,这种架构缺乏透明度,安全性较差。目前基于区块链的版权保护系统注重对版权登记和交易过程的保证,缺乏对PDF文件本身的保护措施。
发明内容
为了解决以上技术问题,本发明提供一种基于区块链的PDF文档版权保护系统,包括
用户管理模块,用于按照负责业务的不同将用户分为三种不同类型的用户,分别为普通用户、业务管理员以及区块链管理员;
版权登记模块,用于在用户上传PDF文档和版权信息后,经过PDF文档版权保护系统对版权信息的验证和对PDF文档的查重,并将版权信息嵌入到PDF文档中后,通过智能合约将版权信息上传至区块链,并返回版权证书;
版权交易模块,用于供用户向版权所有者购买文档以获得PDF文档对应的权限;
版权查询模块,用于供用户在系统中查询登记的版权;
区块链配置模块,用于供区块链管理员在区块链配置模块中配置公有区块链环境以及部署相应的智能合约,实现系统数据的上链和溯源功能。
本发明进一步限定的技术方案是:
进一步的,用户管理模块中,普通用户包括购买者和版权作者,购买者即购买PDF文档的用户,版权作者即上传PDF文档的用户;业务管理员的职责包括管理普通用户、维护系统业务以及处理版权纠纷;区块链管理员的职责包括配置底层区块链环境和更新智能合约的地址;不同用户的权限设置为不同,登录系统后显示的用户页面不同,系统后端根据用户的类型赋予相应的权限。
前所述的一种基于区块链的PDF文档版权保护系统,版权登记模块中,版权登记的方法包括以下步骤:
A1、用户上传PDF文档和拟设置的PDF所有者密码至PDF文档版权保护系统;
A2、PDF文档版权保护系统对PDF文档进行查重,如果查重不合格,则执行下一步骤;如果查重合格,则执行步骤A5;
A3、系统将PDF文档退回给用户,并判断用户对系统查重是否有异议,如果无异议,则版权登记失败;如果有异议,则执行下一步骤;
A4、申请人工审核,系统将查重文档和原始PDF文档发送给业务管理员进行人工查重,如果查重不合格,则版权登记失败;如果查重合格,则执行下一步骤;
A5、将版权信息嵌入到PDF文档中,再使用PDF所有者密码对PDF进行加密,接着将加密后的PDF文档上传到IPFS中,且将PDF所有者密码保存到密钥数据库中;
A6、调用版权登记合约将对应的版权信息打包成交易发送至区块链中;
A7、返回给用户交易的哈希值和版权证书;
A8、版权登记成功。
前所述的一种基于区块链的PDF文档版权保护系统,步骤A5中,系统数据库中仅存储PDF文档在IPFS中对应的哈希值。
前所述的一种基于区块链的PDF文档版权保护系统,步骤A5中,使用基于增量更新的PDF文档信息隐藏算法将版权信息嵌入到PDF文档中,包括以下步骤:
A5.1、读取原始PDF文件流;
A5.2、读取版权信息,按照固定长度L对版权信息进行分段,得到x个版权信息段;若分割的最后一个版权信息段长度小于L,则在其末尾补上0,直至其长度等于L;利用Logistic映射对每个版权信息段进行置乱,记录可调参数作为置乱参数,对置乱后的版权信息段进行FlateDecoded压缩,记录置乱参数;
A5.3、根据关键字Catalog查找并确认原始PDF文件流的文档目录,根据关键字Pages查找并确认页面树,根据关键字obj查找并确认文件中的最大对象号,根据关键字trailer查找文件尾并记录文件尾格式;
A5.4、将最大对象号加1作为新文档目录的对象号,将最大对象号加2作为新页面树的对象号,新文档目录中引用新页面树对象;
A5.5、将最大对象号加3作为新页面的第一个对象号,依次生成x个新页面,记录最后页面的对象号,新页面树中引用新生成的所有页面;
A5.6、将最后页面的对象号加1作为新内容流的第一个对象号,将压缩后的版权信息段作为新内容流中记录的数据,依次生成x个的新内容流对象;
A5.7、新页面中引用新内容流,两者对象号差值为版权信息段的数量;
A5.8、按照对象号的升序将文档目录、页面树、新页面以及内容流依次写入原始PDF文档中,记录文档目录、页面数、所有新页面和内容流的地址偏移量;
A5.9、根据步骤A5.8中的地址偏移量写入新对象对应的交叉引用表,将每个对象对应的词条中状态设为f,交叉引用表第二行的前一个数字为最大对象号加1,后一个数字为2x+2,根据步骤A5.3中记录的文件尾格式写入新文件尾,其中size属性为原文件尾size值加上新增对象数量,即加上2x+2, 修改startxref所记录的地址偏移量,完成增量更新;
A5.10、输出处理后的PDF文档、置乱参数和文档目录的地址偏移量作为密钥。
前所述的一种基于区块链的PDF文档版权保护系统,版权交易模块的版权交易包括以下步骤:
B1、用户选择需要购买的PDF文档并支付相应的金额;
B2、系统调用智能合约将交易数据打包上传至区块链中,交易数据包括用户编号、用户姓名、PDF文档编号、PDF文档名称、日期以及金额;
B3、系统收到用户的购买请求后,根据数据库中存储的哈希值从IPFS中下载加密的PDF文档;
B4、系统根据PDF文档编号获取存储在密钥数据库中的PDF所有者密码,然后利用PDF权限与密码的特性,生成用户密码,并使用用户密码对PDF进行二次加密;
B5、系统将PDF文档与用户密码返回给用户。
前所述的一种基于区块链的PDF文档版权保护系统,区块链配置模块中,智能合约包括:
注册合约,供版权所有者和用户进行登记注册,并将系统中的用户ID与该用户在以太坊区块链中的地址进行绑定,且用于在确认版权归属时根据以太坊中的交易辨别用户的真实身份;
版权登记和交易合约,供版权所有者对PDF文档的版权进行注册,并定义PDF文档的访问控制规则,将审核后的版权信息上传至区块链,实现版权登记功能;供用户购买PDF文档的使用权,通过将版权交易信息上传至区块链实现版权交易功能;
验证合约,用于生成PDF文档的证明,并验证PDF文档的合法性,同时用于记录用户的不良行为;
溯源合约,用于查询PDF文档的交易历史和版权归属,为解决版权纠纷问题提供版权证据。
前所述的一种基于区块链的PDF文档版权保护系统,区块链配置模块中,系统数据的溯源包括以下步骤:
C1、用户上传PDF文档;
C2、系统根据基于增量更新的PDF文档信息隐藏算法,提取隐藏到PDF文档中的版权信息;
C3、系统根据从PDF文档中提取的版权信息,查询与验证区块链中的版权相关信息,版权相关信息包括版权登记信息和版权交易信息。
前所述的一种基于区块链的PDF文档版权保护系统,步骤C2中,提取隐藏到PDF文档中的版权信息的方法包括以下步骤:
C1.1、读取带版权信息的PDF文件流和密钥;
C1.2、根据密钥中内容流的地址偏移量,在PDF文件流中根据查找并确认以增量更新方式追加的新文档目录,根据文档目录中记录的页面树对象号查找并确认新页面树;根据页面树中记录的页面对象号查找并确认新页面;
C1.3、根据新页面中引用的内容流的对象号,查找并确认内容流;
C1.4、提取所确定的内容流中的数据,并使用zlib对其进行解压缩;
C1.5、根据密钥中的置乱参数,将解压缩后的内容流中的数据进行反置乱;
C1.6、将反置乱后的数据顺序组合输出,删去末尾添加的0,得到隐藏的版权信息。
本发明的有益效果是:
本发明中,通过基于区块链的PDF文档版权保护系统对PDF文档进行审核,替代传统的线下纸质审核,审核便捷;通过对用户上传的PDF文档进行查重,保证文档的原创性;通过将PDF文档和版权证据存储在IPFS星际文件系统中,可以减少系统存储开销,提高版权保护的效率;通过将版权登记信息和交易信息上传到区块链中,利用区块链的不可篡改性,在处理版权纠纷等问题时提供可靠的证据。
附图说明
图1为本发明的整体架构示意图;
图2为本发明中版权登记的流程示意图;
图3为本发明中版权信息嵌入的流程示意图;
图4为本发明中智能合约的交互示意图;
图5为本发明中版权交易的流程示意图;
图6为本发明中提取隐藏的版权信息的流程示意图。
实施方式
本实施例提供的一种基于区块链的PDF文档版权保护系统,利用区块链不可篡改性的特点有效地保护PDF文档版权,如图1所示,PDF文档版权保护系统包括用户管理模块、版权登记模块、版权交易模块、版权查询模块以及区块链配置模块。
用户管理模块,用于按照负责业务的不同将用户分为三种不同类型的用户,分别为普通用户、业务管理员以及区块链管理员;
普通用户包括购买者和版权作者,购买者即购买PDF文档的用户,版权作者即上传PDF文档的用户;业务管理员的职责包括管理普通用户、维护系统业务以及处理版权纠纷;区块链管理员的职责包括配置底层区块链环境和更新智能合约的地址;不同用户的权限设置为不同,登录系统后显示的用户页面不同,系统后端根据用户的类型赋予相应的权限。
版权登记模块,用于在用户上传PDF文档和版权信息后,经过PDF文档版权保护系统对版权信息的验证和对PDF文档的查重,并将版权信息嵌入到PDF文档中后,通过智能合约将版权信息上传至区块链,并返回版权证书。
版权交易模块,用于供用户向版权所有者购买文档以获得PDF文档对应的权限。
版权查询模块,用于供用户在系统中查询登记的版权,查询方式包括但不限于根据文档名和作者名进行模糊查询。
区块链配置模块,用于供区块链管理员在区块链配置模块中配置公有区块链环境以及部署相应的智能合约,实现系统数据的上链和溯源功能。
如图2所示,版权登记模块中,版权登记的方法包括以下步骤:
A1、用户上传PDF文档和拟设置的PDF所有者密码至PDF文档版权保护系统;
A2、PDF文档版权保护系统采用Simhash算法对PDF文档进行查重,将用户上传的PDF文档与系统中已有的PDF文档进行一一对比,对比后如果重复率大于20%,则判定为查重不合格,执行下一步骤;对比后如果重复率小于等于20%,则判定为查重合格,执行步骤A5;
A3、系统将PDF文档退回给用户,并判断用户对系统查重是否有异议,如果无异议,则版权登记失败;如果有异议,则执行下一步骤;
A4、申请人工审核,系统将查重文档和原始PDF文档发送给业务管理员进行人工查重,如果查重不合格,则不予进行版权登记,版权登记失败,且将结果反馈给用户;如果查重合格,则执行下一步骤;
A5、将版权信息嵌入到PDF文档中,再使用PDF所有者密码对PDF进行加密,接着将加密后的PDF文档上传到星际文件系统IPFS中,且将PDF所有者密码保存到密钥数据库中;且系统数据库中仅存储PDF文档在IPFS中对应的哈希值,以达到减少系统存储开销的目的;
A6、调用版权登记合约将对应的版权信息打包成交易发送至区块链中;
A7、返回给用户交易的哈希值和版权证书;
A8、版权登记成功。
如图3所示,步骤A5中,使用基于增量更新的PDF文档信息隐藏算法将版权信息嵌入到PDF文档中,包括以下步骤:
A5.1、读取原始PDF文件流;
A5.2、读取版权信息,按照固定长度L对版权信息进行分段,得到x个版权信息段;若分割的最后一个版权信息段长度小于L,则在其末尾补上0,直至其长度等于L;利用Logistic映射对每个版权信息段进行置乱,记录可调参数作为置乱参数,对置乱后的版权信息段进行FlateDecoded压缩,记录置乱参数;
A5.3、根据关键字Catalog查找并确认原始PDF文件流的文档目录,根据关键字Pages查找并确认页面树,根据关键字obj查找并确认文件中的最大对象号,根据关键字trailer查找文件尾并记录文件尾格式;
A5.4、将最大对象号加1作为新文档目录的对象号,将最大对象号加2作为新页面树的对象号,新文档目录中引用新页面树对象;
A5.5、将最大对象号加3作为新页面的第一个对象号,依次生成x个新页面,记录最后页面的对象号,新页面树中引用新生成的所有页面;
A5.6、将最后页面的对象号加1作为新内容流的第一个对象号,将压缩后的版权信息段作为新内容流中记录的数据,依次生成x个的新内容流对象;
A5.7、新页面中引用新内容流,两者对象号差值为版权信息段的数量;
A5.8、按照对象号的升序将文档目录、页面树、新页面以及内容流依次写入原始PDF文档中,记录文档目录、页面数、所有新页面和内容流的地址偏移量;
A5.9、根据步骤A5.8中的地址偏移量写入新对象对应的交叉引用表,将每个对象对应的词条中状态设为f,交叉引用表第二行的前一个数字为最大对象号加1,后一个数字为2x+2,根据步骤A5.3中记录的文件尾格式写入新文件尾,其中size属性为原文件尾size值加上新增对象数量,即加上2x+2, 修改startxref所记录的地址偏移量,完成增量更新;
A5.10、输出处理后的PDF文档、置乱参数和文档目录的地址偏移量作为密钥。
如图4所示,版权交易模块的版权交易包括以下步骤:
B1、用户选择需要购买的PDF文档并支付相应的金额;
B2、系统调用智能合约将交易数据打包上传至区块链中,交易数据包括用户编号、用户姓名、PDF文档编号、PDF文档名称、日期以及金额;
B3、系统收到用户的购买请求后,根据数据库中存储的哈希值从IPFS中下载加密的PDF文档;
B4、系统根据PDF文档编号获取存储在密钥数据库中的PDF所有者密码,然后利用PDF权限与密码的特性,生成用户密码,并使用用户密码对PDF进行二次加密;
B5、系统将PDF文档与用户密码返回给用户。
步骤B4中,PDF权限与密码的特性是指根据PDF规范标准,一个PDF文档最多可以使用两个密码,即用户密码和所有者密码,所有者密码用于限制PDF文档的所有权限,如编辑、复制、添加注释以及其他权利,用户只能获得所有者的不受限制的PDF文档权限;用户购买后获得PDF文档,同时获得PDF文档的用户密码;使用该密码打开PDF文档,用户只能获得PDF文档的部分权限,而文档的修改权限被限制,这样更有利于保护PDF文档版权。
区块链配置模块中,配置公有区块链环境包括链码的安装、智能合约的设计与部署、系统后端与智能合约的交互以及IPFS节点配置;系统实现在以太坊区块链平台,智能合约通过Solidity语言编写,使用truffle将智能合约部署至区块链平台,使用web3.j实现系统后端与区块链平台之间的交互。
区块链配置模块中,智能合约包括注册合约、版权登记和交易合约、验证合约以及溯源合约,其交互如图5所示;
注册合约RC,供版权所有者和用户进行登记注册,并将系统中的用户ID与该用户在以太坊区块链中的地址进行绑定,且用于在确认版权归属时根据以太坊中的交易辨别用户的真实身份;从而便于法院等机构以后可以找到用户的真实身份,以获得更多关于该事件的信息;且版权登记和交易合约、验证合约以及溯源合约可以通过注册合约查找用户的身份;
版权登记和交易合约RTC,供版权所有者对PDF文档的版权进行注册,并定义PDF文档的访问控制规则,将审核后的版权信息上传至区块链,实现版权登记功能;供用户购买PDF文档的使用权,通过将版权交易信息上传至区块链实现版权交易功能;
验证合约VMC,用于生成PDF文档的证明,并验证PDF文档的合法性,此外验证合约还记录了用户的不良行为;
溯源合约TC,用于查询PDF文档的交易历史和版权归属,为解决版权纠纷问题提供版权证据;溯源合约将PDF文档的哈希值作为输入,并输出被查询的PDF文档的交易历史,由于溯源合约不能搜索区块链以获得相关的交易哈希值,通过溯源合约查询存储在验证合约和版权登记和交易合约的交易历史和版权信息,以实现PDF文档的可追溯性。
区块链配置模块中,溯源功能是用户上传PDF文档或者交易的哈希值,如上传PDF文档,则溯源合约根据PDF文档获取该文档哈希值,然后根据文档哈希值获取交易的哈希值;溯源合约根据交易哈希值查询交易信息;最后根据确区块链版权登记、PDF文档交易记录以及版权证书确认PDF文档版权的归属。
PDF文档的溯源包括以下步骤:
C1、用户上传PDF文档;
C2、系统根据基于增量更新的PDF文档信息隐藏算法,提取隐藏到PDF文档中的版权信息;
C3、系统根据从PDF文档中提取的版权信息,查询与验证区块链中的版权相关信息,版权相关信息包括版权登记信息和版权交易信息。
如图6所示,步骤C2中,提取隐藏到PDF文档中的版权信息的方法包括以下步骤:
C1.1、读取带版权信息的PDF文件流和密钥;
C1.2、根据密钥中内容流的地址偏移量,在PDF文件流中根据查找并确认以增量更新方式追加的新文档目录,根据文档目录中记录的页面树对象号查找并确认新页面树;根据页面树中记录的页面对象号查找并确认新页面;
C1.3、根据新页面中引用的内容流的对象号,查找并确认内容流;
C1.4、提取所确定的内容流中的数据,并使用zlib对其进行解压缩;
C1.5、根据密钥中的置乱参数,将解压缩后的内容流中的数据进行反置乱;
C1.6、将反置乱后的数据顺序组合输出,删去末尾添加的0,得到隐藏的版权信息。
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。

Claims (9)

1.一种基于区块链的PDF文档版权保护系统,其特征在于:包括
用户管理模块,用于按照负责业务的不同将用户分为三种不同类型的用户,分别为普通用户、业务管理员以及区块链管理员;
版权登记模块,用于在用户上传PDF文档和版权信息后,经过PDF文档版权保护系统对版权信息的验证和对PDF文档的查重,并将版权信息嵌入到PDF文档中后,通过智能合约将版权信息上传至区块链,并返回版权证书;
版权交易模块,用于供用户向版权所有者购买文档以获得PDF文档对应的权限;
版权查询模块,用于供用户在系统中查询登记的版权;
区块链配置模块,用于供区块链管理员在区块链配置模块中配置公有区块链环境以及部署相应的智能合约,实现系统数据的上链和溯源功能。
2.根据权利要求1所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述用户管理模块中,普通用户包括购买者和版权作者,购买者即购买PDF文档的用户,版权作者即上传PDF文档的用户;业务管理员的职责包括管理普通用户、维护系统业务以及处理版权纠纷;区块链管理员的职责包括配置底层区块链环境和更新智能合约的地址;不同用户的权限设置为不同,登录系统后显示的用户页面不同,系统后端根据用户的类型赋予相应的权限。
3.根据权利要求1所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述版权登记模块中,版权登记的方法包括以下步骤:
A1、用户上传PDF文档和拟设置的PDF所有者密码至PDF文档版权保护系统;
A2、PDF文档版权保护系统对PDF文档进行查重,如果查重不合格,则执行下一步骤;如果查重合格,则执行步骤A5;
A3、系统将PDF文档退回给用户,并判断用户对系统查重是否有异议,如果无异议,则版权登记失败;如果有异议,则执行下一步骤;
A4、申请人工审核,系统将查重文档和原始PDF文档发送给业务管理员进行人工查重,如果查重不合格,则版权登记失败;如果查重合格,则执行下一步骤;
A5、将版权信息嵌入到PDF文档中,再使用PDF所有者密码对PDF进行加密,接着将加密后的PDF文档上传到IPFS中,且将PDF所有者密码保存到密钥数据库中;
A6、调用版权登记合约将对应的版权信息打包成交易发送至区块链中;
A7、返回给用户交易的哈希值和版权证书;
A8、版权登记成功。
4.根据权利要求3所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述步骤A5中,系统数据库中仅存储PDF文档在IPFS中对应的哈希值。
5.根据权利要求3所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述步骤A5中,使用基于增量更新的PDF文档信息隐藏算法将版权信息嵌入到PDF文档中,包括以下步骤:
A5.1、读取原始PDF文件流;
A5.2、读取版权信息,按照固定长度L对版权信息进行分段,得到x个版权信息段;若分割的最后一个版权信息段长度小于L,则在其末尾补上0,直至其长度等于L;利用Logistic映射对每个版权信息段进行置乱,记录可调参数作为置乱参数,对置乱后的版权信息段进行FlateDecoded压缩,记录置乱参数;
A5.3、根据关键字Catalog查找并确认原始PDF文件流的文档目录,根据关键字Pages查找并确认页面树,根据关键字obj查找并确认文件中的最大对象号,根据关键字trailer查找文件尾并记录文件尾格式;
A5.4、将最大对象号加1作为新文档目录的对象号,将最大对象号加2作为新页面树的对象号,新文档目录中引用新页面树对象;
A5.5、将最大对象号加3作为新页面的第一个对象号,依次生成x个新页面,记录最后页面的对象号,新页面树中引用新生成的所有页面;
A5.6、将最后页面的对象号加1作为新内容流的第一个对象号,将压缩后的版权信息段作为新内容流中记录的数据,依次生成x个的新内容流对象;
A5.7、新页面中引用新内容流,两者对象号差值为版权信息段的数量;
A5.8、按照对象号的升序将文档目录、页面树、新页面以及内容流依次写入原始PDF文档中,记录文档目录、页面数、所有新页面和内容流的地址偏移量;
A5.9、根据步骤A5.8中的地址偏移量写入新对象对应的交叉引用表,将每个对象对应的词条中状态设为f,交叉引用表第二行的前一个数字为最大对象号加1,后一个数字为2x+2,根据步骤A5.3中记录的文件尾格式写入新文件尾,其中size属性为原文件尾size值加上新增对象数量,即加上2x+2, 修改startxref所记录的地址偏移量,完成增量更新;
A5.10、输出处理后的PDF文档、置乱参数和文档目录的地址偏移量作为密钥。
6.根据权利要求1所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述版权交易模块的版权交易包括以下步骤:
B1、用户选择需要购买的PDF文档并支付相应的金额;
B2、系统调用智能合约将交易数据打包上传至区块链中,交易数据包括用户编号、用户姓名、PDF文档编号、PDF文档名称、日期以及金额;
B3、系统收到用户的购买请求后,根据数据库中存储的哈希值从IPFS中下载加密的PDF文档;
B4、系统根据PDF文档编号获取存储在密钥数据库中的PDF所有者密码,然后利用PDF权限与密码的特性,生成用户密码,并使用用户密码对PDF进行二次加密;
B5、系统将PDF文档与用户密码返回给用户。
7.根据权利要求1所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述区块链配置模块中,智能合约包括:
注册合约,供版权所有者和用户进行登记注册,并将系统中的用户ID与该用户在以太坊区块链中的地址进行绑定,且用于在确认版权归属时根据以太坊中的交易辨别用户的真实身份;
版权登记和交易合约,供版权所有者对PDF文档的版权进行注册,并定义PDF文档的访问控制规则,将审核后的版权信息上传至区块链,实现版权登记功能;供用户购买PDF文档的使用权,通过将版权交易信息上传至区块链实现版权交易功能;
验证合约,用于生成PDF文档的证明,并验证PDF文档的合法性,同时用于记录用户的不良行为;
溯源合约,用于查询PDF文档的交易历史和版权归属,为解决版权纠纷问题提供版权证据。
8.根据权利要求1所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述区块链配置模块中,系统数据的溯源包括以下步骤:
C1、用户上传PDF文档;
C2、系统根据基于增量更新的PDF文档信息隐藏算法,提取隐藏到PDF文档中的版权信息;
C3、系统根据从PDF文档中提取的版权信息,查询与验证区块链中的版权相关信息,版权相关信息包括版权登记信息和版权交易信息。
9.根据权利要求8所述的一种基于区块链的PDF文档版权保护系统,其特征在于:所述步骤C2中,提取隐藏到PDF文档中的版权信息的方法包括以下步骤:
C1.1、读取带版权信息的PDF文件流和密钥;
C1.2、根据密钥中内容流的地址偏移量,在PDF文件流中根据查找并确认以增量更新方式追加的新文档目录,根据文档目录中记录的页面树对象号查找并确认新页面树;根据页面树中记录的页面对象号查找并确认新页面;
C1.3、根据新页面中引用的内容流的对象号,查找并确认内容流;
C1.4、提取所确定的内容流中的数据,并使用zlib对其进行解压缩;
C1.5、根据密钥中的置乱参数,将解压缩后的内容流中的数据进行反置乱;
C1.6、将反置乱后的数据顺序组合输出,删去末尾添加的0,得到隐藏的版权信息。
CN202310524267.XA 2023-05-11 2023-05-11 一种基于区块链的pdf文档版权保护系统 Active CN116305003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310524267.XA CN116305003B (zh) 2023-05-11 2023-05-11 一种基于区块链的pdf文档版权保护系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310524267.XA CN116305003B (zh) 2023-05-11 2023-05-11 一种基于区块链的pdf文档版权保护系统

Publications (2)

Publication Number Publication Date
CN116305003A CN116305003A (zh) 2023-06-23
CN116305003B true CN116305003B (zh) 2023-08-15

Family

ID=86801589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310524267.XA Active CN116305003B (zh) 2023-05-11 2023-05-11 一种基于区块链的pdf文档版权保护系统

Country Status (1)

Country Link
CN (1) CN116305003B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145617A (zh) * 2018-08-07 2019-01-04 蜘蛛网(广州)教育科技有限公司 一种基于区块链的数字版权保护方法及系统
WO2019141295A2 (en) * 2019-05-20 2019-07-25 Alibaba Group Holding Limited Identifying copyrighted material using copyright information embedded in electronic files
CN111753278A (zh) * 2020-06-17 2020-10-09 北京版信通技术有限公司 一种电子版权认证证书的综合管理系统及方法
CN114722355A (zh) * 2022-03-16 2022-07-08 江苏大学 一种基于区块链和ipfs的版权保护系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109145617A (zh) * 2018-08-07 2019-01-04 蜘蛛网(广州)教育科技有限公司 一种基于区块链的数字版权保护方法及系统
WO2019141295A2 (en) * 2019-05-20 2019-07-25 Alibaba Group Holding Limited Identifying copyrighted material using copyright information embedded in electronic files
CN111753278A (zh) * 2020-06-17 2020-10-09 北京版信通技术有限公司 一种电子版权认证证书的综合管理系统及方法
CN114722355A (zh) * 2022-03-16 2022-07-08 江苏大学 一种基于区块链和ipfs的版权保护系统及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于区块链技术的数字版权交易保护与内容监管;田帅;梅雪莲;王冠楠;;广播电视信息(第S1期);全文 *

Also Published As

Publication number Publication date
CN116305003A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN101351805B (zh) 用于提供数字权利管理系统之间互操作性的方法和装置
US11372994B2 (en) Security application for data security formatting, tagging and control
DE10084964B3 (de) Verfahren zum sicheren Speichern, Übertragen und Wiedergewinnen inhaltsadresssierbarer Informationen
US7913313B2 (en) Method and system for invisibly embedding into a text document the license identification of the generating licensed software
US7228293B2 (en) Copy detection for digitally-formatted works
US20080140433A1 (en) Rights Management Systems and Methods Using Content Identifiers
WO2001095125A1 (en) Processing electronic documents with embedded digital signatures
US6751632B1 (en) Method of creating authenticated verifiable reproductions of electronic documents
WO2001095078A1 (en) Creating and verifying electronic documents
US20050219076A1 (en) Information management system
CN111966968A (zh) 基于区块链的版权保护方法及系统
CN101853349B (zh) 一种数字产品的许可管理系统
US20230109369A1 (en) First copyright holder authentication system using blockchain, and method therefor
CN116596708A (zh) 一种基于联盟链的涉农知识产权数据确权方法
CN101739522B (zh) Drm文件完整性的保护方法及装置
CN114722355A (zh) 一种基于区块链和ipfs的版权保护系统及方法
CN116305003B (zh) 一种基于区块链的pdf文档版权保护系统
CN117632855A (zh) 一种基于四包结构的单套制电子档案归档系统、方法、设备及存储介质
Wolf et al. Complementing DRM with digital watermarking: mark, search, retrieve
JP4842836B2 (ja) 認証コードを復旧する方法
CN109033788B (zh) 一种基于区块链技术的证书管理方法和装置
Stefik et al. Libraries and digital property rights
Mumtaz et al. Development of a methodology for piracy protection of software installations
KR102666241B1 (ko) 하이브리드 스마트 컨트랙트를 이용한 디지털 저작물 및 저작권 관리 시스템 및 방법
US20230368186A1 (en) Process for Creation storage retrieval of immutable NFT Non-fungible token based electronic book publishing on a decentralized proof ofstake blockchain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant