CN114756837B - 一种基于区块链的数字内容溯源方法及系统 - Google Patents

一种基于区块链的数字内容溯源方法及系统 Download PDF

Info

Publication number
CN114756837B
CN114756837B CN202210681807.0A CN202210681807A CN114756837B CN 114756837 B CN114756837 B CN 114756837B CN 202210681807 A CN202210681807 A CN 202210681807A CN 114756837 B CN114756837 B CN 114756837B
Authority
CN
China
Prior art keywords
digital content
information
tracing
block chain
knowledge graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210681807.0A
Other languages
English (en)
Other versions
CN114756837A (zh
Inventor
童晓雯
张茂华
邓念诗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Changjiang Media Digital Publishing Co ltd
Original Assignee
Hubei Changjiang Media Digital Publishing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Changjiang Media Digital Publishing Co ltd filed Critical Hubei Changjiang Media Digital Publishing Co ltd
Priority to CN202210681807.0A priority Critical patent/CN114756837B/zh
Publication of CN114756837A publication Critical patent/CN114756837A/zh
Application granted granted Critical
Publication of CN114756837B publication Critical patent/CN114756837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/432Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于区块链的数字内容溯源方法及系统,其方法包括:部署用以数字内容的溯源的第一区块链和第二区块链;基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据其生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;将所述第一溯源信息与第二溯源信息的进行匹配;基于Ripple共识,将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。本发明通过区块链和知识图谱的结合,将不同路径的溯源信息进行特征提取和哈希匹配,从而实现了多源数字内容的高效溯源。

Description

一种基于区块链的数字内容溯源方法及系统
技术领域
本发明属于区块链与信息溯源技术领域,具体涉及一种基于区块链的数字内容溯源方法及系统。
背景技术
作品版权登记是版权保护的重要手段。版权登记有助于解决因版权归属造成的版权纠纷,并能为解决版权纠纷或溯源提供司法证据。然而,传统版权登记仍存在的登记周期长、登记成本高、著作权人登记积极性不高等问题。
近年来,随着区块链技术的不断发展,利用分布式存储、时间戳、共识算法等技术实现数字内容的信息数据不可篡改,达到其版权归属明晰和证据固化作用,完成原创数字作品版权登记认证过程。利用区块链能够极大简化传统版权向监管部门版权认证申请,即“创作-申请-注册-登记”登记流程,将登记认证时间从7至30天缩短为5至10分钟,实现作品注册登记和作品创作完成额几乎同步完成。
另一方面,随着短视频平台的流行,大量通过剪辑、拼接、改编或汇编等手段的短视频与原视频共存,导致用户无法区分其真实来源,而现有基于区块链的确权技术虽然可以实现快速认证,却无法区分和识别这些改编作品或数字内容的原创性,无法适应数字内容的快速传播的需要。
发明内容
为解决现有区块链确权技术中难以区分改编作品导致其溯源难的问题,以及提高数字内容溯源的效率和准确性,在本发明的第一方面提供了一种基于区块链的数字内容溯源方法,包括:部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点,所述第二区块链的节点为未验证异源节点;基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。
在一些实施例中,所述基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息包括:根据数字内容的类型,将待溯源的数字内容解析为一个或多个子数字内容;根据每个子数字内容的文件类型确定不同的哈希码;根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息。
进一步的,所述根据每个子数字内容的文件类型确定不同的哈希码包括:若子数字内容被确定为图像文件,则将图像文件的图像统计特征、轮廓特征和语义特征中的一个或多个特征嵌入到第一哈希码中;若子数字内容被确定为文本文件,则将提取到的所述文本文件的关键词、词频统计分布嵌入到第二哈希码中;若子数字内容被确定为音频文件,则从所述音频文件提取音频指纹,将其中一个或多个特征点嵌入到第三哈希码中;若子数字内容根据所述文件类型被确定为视频文件,则将视频的关键帧和视频摘要嵌入到第四哈希码中。
进一步的,所述根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息包括:根据已溯源的数字内容及其子数字内容的哈希码和版权信息,构建第二知识图谱;解析待溯源的数字内容,并确定其每个子数字内容的哈希码;将所述每个子数字内容的哈希码与第二知识图谱进行反向匹配,得到第二溯源信息。
在一些实施例中,所述基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱包括:若第一溯源信息与第二溯源信息语义相似度达到第一预设阈值,则将所述第一溯源信息与第二溯源信息合并去重,并通过Ripple共识分别写入到第一区块链和第二区块链的帕特里夏树中;若第一溯源信息与第二溯源信息语义相似度达到第二预设阈值且小于第一预设阈值,则判断第二区块链获取的目标数字内容为副本;若第一溯源信息与第二溯源信息语义相似度低于第二预设阈值,则将第二溯源信息加入到第一知识图谱中。
上述实施例中,所述第二区块链部署在联邦学习网络中,且其包括:解析节点,用于将目标数字内容解析为一个或多个子数字内容;卷积节点,用于提取每个子数字内容的图像特征或音频特征,并根据其生成哈希码;栈式自动编码节点,用于个子数字内容的文本特征,并根据其生成哈希码;语义分析节点,用于根据每个子数字内容的语义特征,并根据其生成哈希码。
本发明的第二方面,提供了一种基于区块链的数字内容溯源系统,包括:部署模块,用于部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点,所述第二区块链的节点为未验证异源节点;匹配模块,用于基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;判断模块,用于比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。
本发明的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明在第一方面提供的方法。
本发明的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本发明在第一方面提供的基于区块链的数字内容溯源方法。
本发明的有益效果是:
本发明通过部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点(可信节点),所述第二区块链的节点为未验证异源节点(非可信节点);基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。即通过不同渠道获取溯源信息,然后利用各自溯源信息建立知识图谱,并通过相关的哈希码和语义相似度验证关联性,进而判断和区分了原创数字内容、改编或转载数字内容;从而多源数字内容的高效溯源,并提高了准确率和效率。
附图说明
图1为本发明的一些实施例中的基于区块链的数字内容溯源方法的原理框架示意图;
图2为本发明的一些实施例中的基于区块链的数字内容溯源方法的基本流程示意图;
图3为本发明的一些实施例中的区块链中的各节点通过Ripple共识交互过程示意图;
图4为本发明的一些实施例中的帕特里夏树写入过程示意图;
图5为本发明的一些实施例中的基于区块链的数字内容溯源系统的基本结构示意图;
图6为本发明的一些实施例中的电子设备的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
参考图1与图2,在本发明的第一方面,提供了一种基于区块链的数字内容溯源方法,包括:S100.部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点,所述第二区块链的节点为未验证异源节点;S200.基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;S300.比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。
需要说明的是,图1中的目标数字内容通常为待验证或待溯源的数字内容,数字内容数字内容是将图像、文字、影音等内容通过数字技术进行整合应用的产品或服务的总体,其包括但不限于以下形式:数字游戏、计算机动画、数字学习、数字影音应用、移动应用服务、网络服务、内容软件、数字出版与典藏。图中的子数字内容通过将原数字内容通过解析、分解或拆分、提取等方式获取到的具有独立著作权的数字内容。因此,第一知识图谱或第二图谱基于以上数字内容形式,建立的至少包括作者、内容摘要、著录信息等具有可溯源的信息,知识图谱中的实体中至少包括作者署名和出版方(发布方),其余信息通过边或点的形式实现。图中的第一溯源信息或第二溯源信息仅为示例,基于上述数字内容的形式第一溯源信息或第二溯源信息还可包括版本号、出版时间(发布时间)、发行量、数字内容的占用存储空间等,哈希码可通过SHA-256、Keccak-256、RIPEMD-160等哈希算法通过对原始数字内容的局部或全部加密得到。标准文号可以是数字对象唯一标识符,包括DOI、CDOI,或是由DCI等标准化组织确定数字电影的位移识别码。
基于数字内容的溯源信息获取的多样性,在一些实施例的步骤S100中,部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点,所述第二区块链的节点为未验证异源节点。同源节点即为可信或已验证信息来源的出版商、版权管理机构、版权第三方认定机构、公信力可靠的发布平台(例如各大视频网站、短视频平台、阅读平台等);未验证异源节点包括通过搜索引擎、未经验证(认证)的发布平台(例如自媒体)等。
在一些实施例的步骤S200中,所述基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息包括:S201.根据数字内容的类型,将待溯源的数字内容解析为一个或多个子数字内容;S202.根据每个子数字内容的文件类型确定不同的哈希码;S203.根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息。
具体地,在步骤S202中,所述根据每个子数字内容的文件类型确定不同的哈希码包括:若子数字内容被确定为图像文件,则将图像文件的图像统计特征、轮廓特征和语义特征中的一个或多个特征嵌入到第一哈希码中;若子数字内容被确定为文本文件,则将提取到的所述文本文件的关键词、词频统计分布嵌入到第二哈希码中;若子数字内容被确定为音频文件,则从所述音频文件提取音频指纹,将其中一个或多个特征点嵌入到第三哈希码中;若子数字内容根据所述文件类型被确定为视频文件,则将视频的关键帧和视频摘要嵌入到第四哈希码中。
哈希的目的是把原始特征空间中的特征向量映射到汉明空间中的二值码,其中这个映射过程通常是由一组哈希函数实现的。一般而言,可以采用任何合适的哈希嵌入学习函数,线性的或者非线性的。例如,谱哈希(Spectral Hashing,SH),二值重建嵌入(BinaryReconstructive Embdedding,BRE)、PCA哈希(PCA Hashing,PCAH)、迭代量化(IterativeQuantization,PCA-ITQ)、基于角度量化的二值码(Angular Quantization-based BinaryCodes,AQBC)、各向同性哈希(Isotropic Hashing,IsoHash)、球形哈希(SphericalHashing, SpH)、 流型诱导哈希(Inductive Manifold Hashing,IMH)、锚点图哈希(AnchorGraph Hashing,AGH)、离散图哈希(Discrete Graph Hashing,DGH)、可扩展图形哈希(Scalable Graph Hashing,SGH)、非对称内积二值码( Asymmetric Inner-productBinaryCoding,AIBC)。
具体地,在步骤S203中,所述根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息包括:根据已溯源的数字内容及其子数字内容的哈希码和版权信息,构建第二知识图谱;解析待溯源的数字内容,并确定其每个子数字内容的哈希码;将所述每个子数字内容的哈希码与第二知识图谱进行反向匹配,得到第二溯源信息。
可以理解,上述正向匹配表示根据目标数字内容的一个或多个标记(例如,溯源信息中的唯一识别码或哈希码)从知识图谱中匹配目标数字内容的过程;相应地,反向匹配表示根据目标数字内容本身匹配一个或多个溯源信息并追溯其来源的过程。语义相似度的计算通过现有GPT系列或BERT框架实现,也可通过一个或多个语义相似度距离计算(欧式距离、汉明距离)等。
参考图3和图4,在一些实施例的步骤S300中,所述基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱包括:S301.若第一溯源信息与第二溯源信息语义相似度达到第一预设阈值,则将所述第一溯源信息与第二溯源信息合并去重,并通过Ripple共识分别写入到第一区块链和第二区块链的帕特里夏树中;S302.若第一溯源信息与第二溯源信息语义相似度达到第二预设阈值且小于第一预设阈值,则判断第二区块链获取的目标数字内容为副本;S303.若第一溯源信息与第二溯源信息语义相似度低于第二预设阈值,则将第二溯源信息加入到第一知识图谱中。
应理解,图3其示出了Ripple共识的一般性交互过程;即在本公开中,第一区块链和第二区块链中,根据功能可划分为追踪节点、验证节点,其他验证节点代表目标数字内容来源的获取节点,也可省略。交易过程一般为账本信息写入区块链并验证的过程,在本公开中其代表匹配后的第一溯源信息与第二溯源信息写入区块链并验证的过程。
还应理解,图4示出了第一溯源信息与第二溯源信息通过帕特里夏树将匹配后的信息写入到区块链的过程中,prefix表示该节点的前驱节点,MPT树(帕特里夏树中的一种)中的节点包括空节点、叶子节点、扩展结点和分支节点。其具体包括:
1、空节点(NULL):表示为空;
2、叶子节点(leaf):2元组[key,value]。第一个字段是剩下的Key的RLP编码,第二个字段是value值;
3、拓展节点(extension):也是[key,value],但是这里的value是其他节点的hash,通过这个hash链接到其他节点;
4、分支节点(branch):MPT中的key被序列化成一种特殊的16进制编码,在加上最后的value,所以分支节点是一个长度为17的list,前16个元素对应着key中的16个可能的十六进制字符,如果有一个[key,value]对在这个分支节点终止,最后一个元素代表一个值(例如,有三个key,分别是(abc,abd,ab)第17个字段存储了ab节点的值)即分支节点既可以搜索路径的终止(end)也可以是路径的中间节点(branch)。图中ETH原本表示交易过程中的虚拟货币量,在这里可表示溯源的计算量或信息量。
上述实施例中,所述第二区块链部署在联邦学习网络中,且其包括:解析节点,用于将目标数字内容解析为一个或多个子数字内容;卷积节点,用于提取每个子数字内容的图像特征或音频特征,并根据其生成哈希码;栈式自动编码节点,用于个子数字内容的文本特征,并根据其生成哈希码;语义分析节点,用于根据每个子数字内容的语义特征,并根据其生成哈希码。可选的,由于transform的通用性,上述无论是语义特征、图像特征、音频特征可通过一个transform模型实现。
实施例2
参考图5,本发明的第二方面,提供了一种基于区块链的数字内容溯源系统1,包括:部署模块11,用于部署用以数字内容的溯源的第一区块链和第二区块链,第一区块链中的可信同源节点,所述第二区块链的节点为未验证异源节点;匹配模块12,用于基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;判断模块13,用于比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱。
进一步的,所述判断模块13包括第一判断单元和第二判断单元,所述第一判断单元,用于根据第一溯源信息与第二溯源信息语义相似度是否达到第一预设阈值,将所述第一溯源信息与第二溯源信息合并去重,并通过Ripple共识分别写入到第一区块链和第二区块链的帕特里夏树中;所述第二判断单元,用于根据第一溯源信息与第二溯源信息语义相似度是否达到第二预设阈值,将判断第二区块链获取的目标数字内容为副本或将第二溯源信息加入到第一知识图谱中。
实施例3
参考图6,本发明的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明在第一方面的方法。
电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所描述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个计算机程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++、Python,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于区块链的数字内容溯源方法,其特征在于,包括:
部署用以数字内容的溯源的第一区块链和第二区块链,所述第一区块链中的节点为可信同源节点,所述第二区块链的节点为未验证异源节点;
基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;所述正向匹配表示根据目标数字内容的一个或多个标记从知识图谱中匹配目标数字内容的过程,所述反向匹配表示根据目标数字内容本身匹配一个或多个溯源信息并追溯其来源的过程;
比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱:若第一溯源信息与第二溯源信息语义相似度达到第一预设阈值,则将所述第一溯源信息与第二溯源信息合并去重,并通过Ripple共识分别写入到第一区块链和第二区块链的帕特里夏树中;若第一溯源信息与第二溯源信息语义相似度达到第二预设阈值且小于第一预设阈值,则判断第二区块链获取的目标数字内容为副本;若第一溯源信息与第二溯源信息语义相似度低于第二预设阈值,则将第二溯源信息加入到第一知识图谱中。
2.根据权利要求1所述的基于区块链的数字内容溯源方法,其特征在于,所述基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息包括:
根据数字内容的类型,将待溯源的数字内容解析为一个或多个子数字内容;
根据每个子数字内容的文件类型确定不同的哈希码;
根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息。
3.根据权利要求2所述的基于区块链的数字内容溯源方法,其特征在于,所述根据每个子数字内容的文件类型确定不同的哈希码包括:
若子数字内容被确定为图像文件,则将图像文件的图像统计特征、轮廓特征和语义特征中的一个或多个特征嵌入到第一哈希码中;
若子数字内容被确定为文本文件,则将提取到的所述文本文件的关键词、词频统计分布嵌入到第二哈希码中;
若子数字内容被确定为音频文件,则从所述音频文件提取音频指纹,将其中一个或多个特征点嵌入到第三哈希码中;
若子数字内容根据所述文件类型被确定为视频文件,则将视频的关键帧和视频摘要嵌入到第四哈希码中。
4.根据权利要求2所述的基于区块链的数字内容溯源方法,其特征在于,所述根据待溯源的数字内容的一个或多个哈希码反向匹配第二知识图谱,得到第二溯源信息包括:
根据已溯源的数字内容及其子数字内容的哈希码和版权信息,构建第二知识图谱;
解析待溯源的数字内容,并确定其每个子数字内容的哈希码;
将所述每个子数字内容的哈希码与第二知识图谱进行反向匹配,得到第二溯源信息。
5.根据权利要求1至4任一项所述的基于区块链的数字内容溯源方法,其特征在于,所述第二区块链部署在联邦学习网络中,且其包括:
解析节点,用于将目标数字内容解析为一个或多个子数字内容;
卷积节点,用于提取每个子数字内容的图像特征或音频特征,并根据其生成哈希码;
栈式自动编码节点,用于个子数字内容的文本特征,并根据其生成哈希码;
语义分析节点,用于根据每个子数字内容的语义特征,并根据其生成哈希码。
6.一种基于区块链的数字内容溯源系统,其特征在于,包括:
部署模块,用于部署用以数字内容的溯源的第一区块链和第二区块链,所述第一区块链中的节点为可信同源节点,所述第二区块链的节点为未验证异源节点;
匹配模块,用于基于第一区块链,通过正向匹配第一知识图谱,得到目标数字内容的第一溯源信息;基于第二区块链,解析目标数字内容,并根据解析后的目标数字内容生成哈希码,基于所述哈希码反向匹配第二知识图谱,得到第二溯源信息;所述正向匹配表示根据目标数字内容的一个或多个标记从知识图谱中匹配目标数字内容的过程,所述反向匹配表示根据目标数字内容本身匹配一个或多个溯源信息并追溯其来源的过程;
判断模块,用于比较所述第一溯源信息与第二溯源信息的语义相似度,判断是否匹配;基于Ripple共识,根据匹配的结果将第一溯源信息与第二溯源信息分别写入到第一区块链和第二区块链中,并同步第一知识图谱和第二知识图谱:若第一溯源信息与第二溯源信息语义相似度达到第一预设阈值,则将所述第一溯源信息与第二溯源信息合并去重,并通过Ripple共识分别写入到第一区块链和第二区块链的帕特里夏树中;若第一溯源信息与第二溯源信息语义相似度达到第二预设阈值且小于第一预设阈值,则判断第二区块链获取的目标数字内容为副本;若第一溯源信息与第二溯源信息语义相似度低于第二预设阈值,则将第二溯源信息加入到第一知识图谱中。
7.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1至5任一项所述的基于区块链的数字内容溯源方法。
8.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的基于区块链的数字内容溯源方法。
CN202210681807.0A 2022-06-16 2022-06-16 一种基于区块链的数字内容溯源方法及系统 Active CN114756837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210681807.0A CN114756837B (zh) 2022-06-16 2022-06-16 一种基于区块链的数字内容溯源方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210681807.0A CN114756837B (zh) 2022-06-16 2022-06-16 一种基于区块链的数字内容溯源方法及系统

Publications (2)

Publication Number Publication Date
CN114756837A CN114756837A (zh) 2022-07-15
CN114756837B true CN114756837B (zh) 2022-08-30

Family

ID=82337153

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210681807.0A Active CN114756837B (zh) 2022-06-16 2022-06-16 一种基于区块链的数字内容溯源方法及系统

Country Status (1)

Country Link
CN (1) CN114756837B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177080A (zh) * 2019-12-31 2020-05-19 西安理工大学 一种基于区块链和ipfs的知识图谱存储与验证方法
CN111581397A (zh) * 2020-05-07 2020-08-25 南方电网科学研究院有限责任公司 一种基于知识图谱的网络攻击溯源方法、装置及设备
WO2020222404A1 (ko) * 2019-04-30 2020-11-05 (주)에스투더블유랩 지식 그래프를 이용하여 사이버 시큐리티를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN113454621A (zh) * 2019-02-19 2021-09-28 艾斯图文莱博有限公司 用于从多域收集数据的方法、装置和计算机程序
CN113688252A (zh) * 2021-08-09 2021-11-23 广西师范大学 基于多特征协同知识图谱和区块链的安全跨域推荐方法
CN114064815A (zh) * 2021-10-26 2022-02-18 西安理工大学 一种基于区块链的水利施工领域内可信知识图谱构建方法
CN114417009A (zh) * 2021-12-30 2022-04-29 航天科工网络信息发展有限公司 一种责任人定位与疑证溯源的法治邮局系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170124464A1 (en) * 2015-10-28 2017-05-04 Fractal Industries, Inc. Rapid predictive analysis of very large data sets using the distributed computational graph

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113454621A (zh) * 2019-02-19 2021-09-28 艾斯图文莱博有限公司 用于从多域收集数据的方法、装置和计算机程序
WO2020222404A1 (ko) * 2019-04-30 2020-11-05 (주)에스투더블유랩 지식 그래프를 이용하여 사이버 시큐리티를 제공하는 방법, 장치 및 컴퓨터 프로그램
CN111177080A (zh) * 2019-12-31 2020-05-19 西安理工大学 一种基于区块链和ipfs的知识图谱存储与验证方法
CN111581397A (zh) * 2020-05-07 2020-08-25 南方电网科学研究院有限责任公司 一种基于知识图谱的网络攻击溯源方法、装置及设备
CN113688252A (zh) * 2021-08-09 2021-11-23 广西师范大学 基于多特征协同知识图谱和区块链的安全跨域推荐方法
CN114064815A (zh) * 2021-10-26 2022-02-18 西安理工大学 一种基于区块链的水利施工领域内可信知识图谱构建方法
CN114417009A (zh) * 2021-12-30 2022-04-29 航天科工网络信息发展有限公司 一种责任人定位与疑证溯源的法治邮局系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
区块链在国内图情档领域的应...研究——基于文献计量分析法;徐琪;《江苏科技信息》;20210710;第10-16页 *

Also Published As

Publication number Publication date
CN114756837A (zh) 2022-07-15

Similar Documents

Publication Publication Date Title
US10713391B2 (en) Tamper protection and video source identification for video processing pipeline
US20150244737A1 (en) Detecting malicious advertisements using source code analysis
US11184174B2 (en) System and method for decentralized digital structured data storage, management, and authentication using blockchain
US8875227B2 (en) Privacy aware authenticated map-reduce
CN104050217A (zh) 媒体内容替换方法和系统
US20220029787A1 (en) Citation and Attribution Management Methods and Systems
Aronson et al. Towards an engineering approach to file carver construction
EP3537319A1 (en) Tamper protection and video source identification for video processing pipeline
US20200065074A1 (en) Devices, systems, and methods of program identification, isolation, and profile attachment
CN111259282A (zh) Url去重方法、装置、电子设备及计算机可读存储介质
EP3227855A1 (en) System and method for interacting with information posted in the media
US20190311746A1 (en) Indexing media content library using audio track fingerprinting
CN110895548A (zh) 用于处理信息的方法和装置
CN114756837B (zh) 一种基于区块链的数字内容溯源方法及系统
CN112434506A (zh) 电子协议签订处理方法、装置、计算机设备及介质
US11995215B2 (en) Verification of authenticity of documents based on search of segment signatures thereof
CN111090992A (zh) 一种文本预处理方法、装置及存储介质
CN108563396B (zh) 一种安全的云端对象存储方法
CN114780932A (zh) 管理三化平台的跨区块链数据交互验证方法、系统及设备
US11144310B2 (en) Span limited lexical analysis
CN111967001A (zh) 一种基于双容器的解码与编码安全隔离方法
US8745750B2 (en) Origination verification using execution transparent marker context
CN113627938B (zh) 一种区块链的数据删除方法、装置、设备及存储介质
US11989266B2 (en) Method for authenticating digital content items with blockchain and writing digital content items data to blockchain
CN115296821B (zh) 一种用于数字藏品管理的数据处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant