CN110781460A - 版权认证方法、装置、设备、系统及计算机可读存储介质 - Google Patents
版权认证方法、装置、设备、系统及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110781460A CN110781460A CN201911093190.5A CN201911093190A CN110781460A CN 110781460 A CN110781460 A CN 110781460A CN 201911093190 A CN201911093190 A CN 201911093190A CN 110781460 A CN110781460 A CN 110781460A
- Authority
- CN
- China
- Prior art keywords
- authenticated
- work
- works
- copyright authentication
- examination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000012545 processing Methods 0.000 claims abstract description 150
- 238000013145 classification model Methods 0.000 claims abstract description 117
- 239000013598 vector Substances 0.000 claims description 113
- 230000011218 segmentation Effects 0.000 claims description 67
- 238000004364 calculation method Methods 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 19
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000012552 review Methods 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 9
- 230000008569 process Effects 0.000 description 24
- 208000001613 Gambling Diseases 0.000 description 10
- 238000012550 audit Methods 0.000 description 7
- 239000002574 poison Substances 0.000 description 7
- 231100000614 poison Toxicity 0.000 description 7
- 230000035945 sensitivity Effects 0.000 description 7
- 238000012706 support-vector machine Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000013527 convolutional neural network Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/65—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Life Sciences & Earth Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Storage Device Security (AREA)
Abstract
本发明涉及金融科技技术领域,公开了一种版权认证方法、装置、设备、系统及计算机可读存储介质。该版权认证方法包括:在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。本发明能够缩短版权认证周期,提高版权认证效率。
Description
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种版权认证方法、装置、设备、系统及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
目前作品版权认证主要通过线下人工受理的方式完成,具体流程为:1)作品著作人向知识产权代理人提交个人信息及作品;2)由知识产权代理人判断作品是否具备登记条件,判定版权登记类型;3)若作品符合版权申请条件,由知识产权代理人向版权中心提交作品登记申请表;4)版权中心接到申请后,对申请资料进行审核,并决定是否下发作品的著作权登记证书。整个流程大约需要20~30个工作日,周期较长。随着互联网技术的普及,网络上每天都会产生十万级的原创数字作品,线下人工受理作品版权认证的方式由于存在耗时耗力、成本高、效率低和周期长等缺陷,已经无法满足当下的需求,使得大量侵权盗版作品在网络上传播。因此,亟需一种数字作品的版权认证方法,以缩短版权认证周期、提高版权认证效率,及时对作品著作人的版权进行保护。
发明内容
本发明的主要目的在于提供一种版权认证方法、装置、设备、系统及计算机可读存储介质,旨在缩短版权认证周期,提高版权认证效率。
为实现上述目的,本发明提供一种版权认证方法,所述版权认证方法包括:
在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
可选地,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型;
基于所述第一处理策略对所述待认证数字作品进行切词处理,得到第一切词文本;
将所述第一切词文本输入预设词向量模型,得到所述第一切词文本中各切词的第一词向量;
根据所述第一词向量得到所述待认证数字作品对应的第一文档向量,其中,所述目标输入对象为所述第一文档向量。
可选地,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型;
基于所述第二处理策略对所述待认证数字作品进行预处理,得到输入图片,其中,所述预处理包括缩放处理和灰度处理,所述目标输入对象为所述输入图片。
可选地,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型;
基于所述第三处理策略将所述待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品;
对所述转换后的待认证数字作品进行切词处理,得到第二切词文本;
将所述第二切词文本输入预设词向量模型,得到所述第二切词文本中各切词的第二词向量;
根据所述第二词向量得到所述转换后的待认证数字作品对应的第二文档向量,其中,所述目标输入对象为所述第二文档向量。
可选地,所述目标审查分类模型包括多个,所述审查结果的数量与所述目标审查分类模型的数量相同,所述基于所述审查结果判断审查是否通过的步骤包括:
检测多个所述审查结果是否均为审查合格;
若多个所述审查结果均为审查合格,则判定审查通过;
若多个所述审查结果中至少存在一个为审查不合格,则判定审查不通过。
可选地,若所述作品类型为文字作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值;
根据所述第一相似度值从所述已认证文字作品中筛选得到第一预设数量的相似文字作品;
计算所述相似文字作品与所述待认证数字作品之间的第一最长公共子序列,并根据所述第一最长公共子序列的长度计算所述相似文字作品与所述待认证数字作品之间的长度比值,得到第一计算结果;
检测所述第一计算结果中是否存在大于第一预设阈值的长度比值;
若存在大于第一预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第一预设阈值的长度比值,则判定版权认证通过。
可选地,所述通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值的步骤包括:
通过预设文档搜索引擎对所述待认证数字作品进行分词处理,得到分词集;
通过所述预设文档搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引,并根据所述倒排索引结果计算所述分词集中各分词对应的分值;
对各分词的分值进行加和处理,得到所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。
可选地,若所述作品类型为图片作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
通过预设图像检索引擎计算所述待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值;
根据所述第二相似度值从所述已认证图片作品中筛选得到第二预设数量的相似图片作品;
提取所述待认证数字作品的第一尺度不变特征变换SIFT特征向量,并提取所述相似图片作品的第二SIFT特征向量;
计算所述第一SIFT特征向量与所述第二SIFT特征向量之间的余弦距离,得到第二计算结果;
检测所述第二计算结果中是否存在大于第二预设阈值的余弦距离;
若存在大于第二预设阈值的余弦距离,则判定版权认证不通过;
若不存在大于第二预设阈值的余弦距离,则判定版权认证通过。
可选地,若所述作品类型为音频作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
将所述待认证数字作品转换成文字作品类型,得到待认证音频文字作品;
通过预设文档搜索引擎计算所述待认证音频文字作品与预设认证作品库中的已认证音频文字作品之间的第三相似度值;
根据所述第三相似度值从所述已认证音频文字作品中检索得到第三预设数量的相似音频文字作品;
计算所述相似音频文件作品与所述待认证音频文字作品之间的第二最长公共子序列,并根据所述第二最长公共子序列的长度计算所述相似音频文字作品与所述待认证音频文字作品之间的长度比值,得到第三计算结果;
检测所述第三计算结果中是否存在大于第三预设阈值的长度比值;
若存在大于第三预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第三预设阈值的长度比值,则判定版权认证通过。
可选地,所述版权认证方法还包括:
在版权认证通过时,获取所述待认证数字作品的作品信息;
基于所述作品信息生成对应的版权认证信息,并根据所述版权认证信息生成数据上链请求;
将所述数据上链请求发送至版权认证联盟链,以使得所述版权认证联盟链基于所述数据上链请求完成对所述待认证数字作品的上链操作。
此外,为实现上述目的,本发明还提供一种版权认证装置,所述版权认证装置包括:
第一获取模块,用于在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
处理模块,用于根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
审查模块,用于将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
版权认证模块,用于在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
此外,为实现上述目的,本发明还提供一种版权认证设备,所述版权认证设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的版权认证程序,所述版权认证程序被所述处理器执行时实现如上所述的版权认证方法的步骤。
此外,为实现上述目的,本发明还提供一种版权认证系统,所述版权认证系统包括版权认证设备和版权认证联盟链;其中,
所述版权认证设备为如上所述的版权认证设备;
所述版权认证联盟链,用于接收所述版权认证设备发送的数据上链请求;
基于所述数据上链请求获取待上链数据信息,并基于共识算法完成对所述待上链数据信息的上链操作。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有版权认证程序,所述版权认证程序被处理器执行时实现如上所述的版权认证方法的步骤。
本发明提供一种版权认证方法、装置、设备、系统及计算机可读存储介质,在接收到数字作品版权认证请求时,根据数字作品版权认证请求获取待认证数字作品和作品类型;根据作品类型确定对应的处理策略和目标审查分类模型,基于处理策略对待认证数字作品进行处理,得到目标输入对象;将目标输入对象输入至目标审查分类模型中,得到审查结果,并基于审查结果判断审查是否通过;并在在审查通过时,将待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。通过上述方式,可实现对数字作品版权的在线认证,可以针对不同类型的数字作品在秒级的时间复杂度内完成版权认证,相比于现有技术中通过人工进行版权认证,本发明可降低人力成本、缩短版权认证周期、提高版权认证效率,从而可及时对作品著作人的版权进行保护。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图;
图2为本发明版权认证方法第一实施例的流程示意图;
图3为本发明版权认证系统的系统结构示意图;
图4为本发明版权认证装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例版权认证设备可以是智能手机,也可以是PC(Personal Computer,个人计算机)、平板电脑、便携计算机等终端设备。
如图1所示,该版权认证设备可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的版权认证设备结构并不构成对版权认证设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及版权认证程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的版权认证程序,并执行以下版权认证方法的各个步骤。
基于上述硬件结构,提出本发明版权认证方法的各实施例。
本发明提供一种版权认证方法。
参照图2,图2为本发明版权认证方法第一实施例的流程示意图。
在本实施例中,该版权认证方法包括:
步骤S10,在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
在本实施例中,该版权认证方法应用于版权认证系统中,该版权认证系统包括版权认证设备和版权认证联盟链,其中,本实施例的版权认证方法是由版权认证设备实现的,该设备搭载有版权认证系统。版权认证联盟链可以由版权认证机构节点、公证机构节点、司法机构节点以及外联节点组成,用于接收版权认证设备发送的数据上链请求,进而基于数据上链请求获取待上链数据信息,然后基于共识算法完成对该待上链数据信息的上链操作,即实现基于区块链的版权认证。
在本实施例中,当用户需要对其作品进行版权认证时,可通过用户端(如PC个人计算机、智能手机等)的对应软件上传其数字作品(如文字作品、图片作品和音频作品等),并填写相关信息(包括但不限于作品类型、著作人信息等),进而触发数字作品版权认证请求,此时,版权认证系统在接收到数字作品版权认证请求时,根据数字作品版权认证请求获取待认证数字作品和作品类型。当然,可以理解,在具体实施时,用户在触发数字作品版权认证请求时,可以只上传其数字作品,版权认证系统可在获取到待认证数字作品后,可根据其格式判断其对应的作品类型。
步骤S20,根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
在获取到待认证数字作品和作品类型后,根据作品类型确定对应的处理策略和目标审查分类模型,基于处理策略对待认证数字作品进行处理,得到目标输入对象。
具体的,若作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型;然后,基于第一处理策略对待认证数字作品进行切词处理,得到第一切词文本;将第一切词文本输入预设词向量模型,得到第一切词文本中各切词的第一词向量;进而根据第一词向量得到待认证数字作品对应的第一文档向量,其中,目标输入对象为第一文档向量。
若作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型;基于第二处理策略对待认证数字作品进行预处理,得到输入图片,其中,预处理包括缩放处理和灰度处理,目标输入对象为输入图片。
若作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型;基于第三处理策略将待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品;然后按与文字作品的处理方法进行处理,即,对转换后的待认证数字作品进行切词处理,得到第二切词文本;进而将第二切词文本输入预设词向量模型,得到第二切词文本中各切词的第二词向量;根据第二词向量得到转换后的待认证数字作品对应的第二文档向量,其中,目标输入对象为第二文档向量。
具体的执行过程可参照下述第二实施例,此处不作赘述。
步骤S30,将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
在得到目标输入对象之后,将目标输入对象输入至目标审查分类模型中,得到审查结果,并基于审查结果判断审查是否通过。其中,在审查时,主要是为了审查用户提交的作品是否涉及恐怖宣传、邪教宣传、政治敏感以及黄、赌、毒,对应的目标审查分类模型可以包括6类。即,目标审查分类模型可以包括恐怖宣传类审查分类模型、邪教宣传类审查分类模型、政治敏感类审查分类模型、涉黄类审查分类模型、涉赌类审查分类模型、涉毒类审查分类模型。当目标审查分类模型可以包括多个时,审查结果的数量与目标审查分类模型的数量相同,即对应的审查结果也包括多个。在基于多个审查结果判断审查是否通过时,需检测多个审查结果是否均为审查合格;若多个所述审查结果均为审查合格,则说明待认证数字作品不涉及不良信息(恐怖宣传/邪教宣传/政治敏感/黄/赌/毒),此时判定审查通过;若多个所述审查结果中至少存在一个为审查不合格,则说明待认证数字作品涉及不良信息(恐怖宣传/邪教宣传/政治敏感/黄/赌/毒)中一种或多种,此时判定审查不通过。
当然,在具体实施例中,还可以针对各类型数字作品分别构建一个审查分类,对应的,审查结果只有一个,此时,则只需检测该审查结果是否为审查合格。
步骤S40,在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
在审查通过时,将待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。具体的,需针对不同类型的待认证数字作品采用不同的版权认证方法,具体的版权认证过程可参照下述第四实施例,此处不作赘述。通过将待认证数字作品与预设认证作品库中的已认证数字作品进行比对,可检测待认证作品与已认证作品之间是否存处在引用/抄袭关系,以确定是否对版本进行认证。
本发明实施例提供一种版权认证方法,在接收到数字作品版权认证请求时,根据数字作品版权认证请求获取待认证数字作品和作品类型;根据作品类型确定对应的处理策略和目标审查分类模型,基于处理策略对待认证数字作品进行处理,得到目标输入对象;将目标输入对象输入至目标审查分类模型中,得到审查结果,并基于审查结果判断审查是否通过;并在在审查通过时,将待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。通过上述方式,可实现对数字作品版权的在线认证,可以针对不同类型的数字作品在秒级的时间复杂度内完成版权认证,相比于现有技术中通过人工进行版权认证,本发明实施例可降低人力成本、缩短版权认证周期、提高版权认证效率,从而可及时对作品著作人的版权进行保护。
进一步的,基于图2所示的第一实施例,提出本发明版权认证方法的第二实施例。
在本实施例中,作为其中一实施方式,步骤S20可以包括:
步骤a11,若所述作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型;
步骤a12,基于所述第一处理策略对所述待认证数字作品进行切词处理,得到第一切词文本;
步骤a13,将所述第一切词文本输入预设词向量模型,得到所述第一切词文本中各切词的第一词向量;
步骤a14,根据所述第一词向量得到所述待认证数字作品对应的第一文档向量,其中,所述目标输入对象为所述第一文档向量。
在本实施例中,对于文字作品的处理过程如下:
若作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型。其中,第一审查分类模型是预先训练好的,其类型可以为SVM(Support Vector Machine,支持向量机)模型、贝叶斯模型、逻辑回归模型、卷积神经网络模型等二分类模型,下述训练过程以SVM模型进行说明。对于目标审查分类模型,以目标审查分类模型包括恐怖宣传类审查分类模型、邪教宣传类审查分类模型、政治敏感类审查分类模型、涉黄类审查分类模型、涉赌类审查分类模型、涉毒类审查分类模型这6类为例进行说明,对应的,第一审查分类模型也包括6类,其训练过程为:分别取已标注的5万条涉及和5万条不涉及恐怖宣传的文字作品,对每个文字作品进行切词后,通过预设词向量模型(可选地为word2vec模型)得到词向量后,对词向量按对应维度进行相加,得到各文字作品对应的文档向量,然后根据上述10万个文档向量训练一个SVM分类模型。接下来利用同样的方法,分别训练用于判断作品是否涉及邪教宣传、是否涉及政治敏感、是否涉黄、是否涉赌、是否涉毒的5个SVM分类模型。
在确定得到第一处理策略后,基于第一处理策略对待认证数字作品进行切词处理,得到第一切词文本,其中,切词处理可采用预设的工具,如中科院NLPIR、哈工大LTP、结巴分词等。具体的分词过程与现有技术相一致,此处不作赘述。
然后,将第一切词文本输入预设词向量模型,得到第一切词文本中各切词的第一词向量。其中,预设词向量模型可选地为word2vec(word to vector,用来产生词向量的相关模型),word2vec将每一个中文词汇映射为一个高维向量(通常取200维向量),且对于任意两个中文词汇,语义上越相近,映射后得到的向量距离也越近。因此可以根据词向量之间的距离来描述中文词汇的语义相似性。
最后,根据第一词向量得到待认证数字作品对应的第一文档向量,其中,目标输入对象为第一文档向量,即后续将第一文档向量输入至对应的第一审查分类模型中,以得到审查结果。对于第一文档向量的获取,是对第一词向量按对应维度进行相加,即可得到对应的第一文档向量。
通过上述方式,可实现对文字作品类的数字作品进行处理,得到对应的目标输入对象,以便于后续输入至目标审查分类模型中,得到审查结果。
作为又一实施方式,步骤S20还可以包括:
步骤a21,若所述作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型;
步骤a22,基于所述第二处理策略对所述待认证数字作品进行预处理,得到输入图片,其中,所述预处理包括缩放处理和灰度处理,所述目标输入对象为所述输入图片。
在本实施例中,对于图片作品的处理过程如下:
若作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型。其中,第二审查分类模型是预先训练好的,其类型可选地为基于卷积神经网络的分类模型。对于目标审查分类模型,以目标审查分类模型包括恐怖宣传类审查分类模型、邪教宣传类审查分类模型、政治敏感类审查分类模型、涉黄类审查分类模型、涉赌类审查分类模型、涉毒类审查分类模型这6类为例进行说明,对应的,第二审查分类模型也包括6类,其训练过程为:分别取已标注的5万条涉及和5万条不涉及恐怖宣传的图片作品,对每个图片作品进行预处理,预处理过程包括缩放处理和灰度处理,其中,缩放处理即为将图片的大小缩放为一预设尺寸,例如128像素*128像素,灰度处理即将缩放后的图片转换为灰度图片,然后根据上述10万张预处理后的图片训练一个基于卷积神经网络的分类模型。接下来利用同样的方法,分别训练用于判断作品是否涉及邪教宣传、是否涉及政治敏感、是否涉黄、是否涉赌、是否涉毒的5个基于卷积神经网络的分类模型。
在确定得到第二处理策略后,基于第二处理策略对待认证数字作品进行预处理,得到输入图片,其中,预处理包括缩放处理和灰度处理,缩放处理即为将图片的大小缩放为一预设尺寸,例如128像素*128像素,灰度处理即将缩放后的图片转换为灰度图片,目标输入对象为输入图片,即后续将输入图片输入至对应的第二审查分类模型中,以得到审查结果。
通过上述方式,可实现对图片作品类的数字作品进行处理,得到对应的目标输入对象,以便于后续输入至目标审查分类模型中,得到审查结果。
作为另一实施方式,步骤S20还可以包括:
步骤a31,若所述作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型;
步骤a32,基于所述第三处理策略将所述待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品;
步骤a33,对所述转换后的待认证数字作品进行切词处理,得到第二切词文本;
步骤a34,将所述第二切词文本输入预设词向量模型,得到所述第二切词文本中各切词的第二词向量;
步骤a35,根据所述第二词向量得到所述转换后的待认证数字作品对应的第二文档向量,其中,所述目标输入对象为所述第二文档向量。
在本实施例中,对于音频作品的处理过程如下:
若作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型。其中,第三审查分类模型是预先训练好的,其类型可以为SVM(Support Vector Machine,支持向量机)模型、贝叶斯模型、逻辑回归模型、卷积神经网络模型等二分类模型,其中,第三审查分类模型可以与第一审查分类模型相同,也可以基于第一审查分类模型的训练方法训练得到的其他类型的二分类模型。
在确定得到第三处理策略后,先基于第三处理策略将待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品。具体的,可以通过语音识别工具将音频作品转换为文字作品类型。然后,对转换后的待认证数字作品进行切词处理,得到第二切词文本,其中,切词处理可采用预设的工具,如中科院NLPIR、哈工大LTP、结巴分词等。具体的分词过程与现有技术相一致,此处不作赘述。
然后,将第二切词文本输入预设词向量模型,得到第二切词文本中各切词的第二词向量。其中,预设词向量模型可选地为word2vec(word to vector,用来产生词向量的相关模型)。
最后,根据第二词向量得到待认证数字作品对应的第二文档向量,其中,目标输入对象为第二文档向量,即后续将第二文档向量输入值对应的第三审查分类模型中,以得到审查结果。对于第二文档向量的获取,是对第二词向量按对应维度进行相加,即可得到对应的第二文档向量。
通过上述方式,可实现对音频作品类的数字作品进行处理,得到对应的目标输入对象,以便于后续输入至目标审查分类模型中,得到审查结果。
基于上述第一实施例和第二实施例,提出本发明版权认证方法的第三实施例。
在本实施例中,所述目标审查分类模型包括多个,所述审查结果的数量与所述目标审查分类模型的数量相同,步骤“基于所述审查结果判断审查是否通过”包括:
步骤b1,检测多个所述审查结果是否均为审查合格;
步骤b2,若多个所述审查结果均为审查合格,则判定审查通过;
步骤b3,若多个所述审查结果中至少存在一个为审查不合格,则判定审查不通过。
在本实施例中,目标审查分类模型可以包括多个,审查结果的数量与目标审查分类模型的数量相同,对应的审查结果也包括多个。对于审查是否通过的判断过程为:检测多个审查结果是否均为审查合格。
若多个所述审查结果均为审查合格,则说明待认证数字作品不涉及不良信息(恐怖宣传/邪教宣传/政治敏感/黄/赌/毒),此时判定审查通过;
若多个所述审查结果中至少存在一个为审查不合格,则说明待认证数字作品涉及不良信息(恐怖宣传/邪教宣传/政治敏感/黄/赌/毒)中一种或多种,此时判定审查不通过。
进一步的,基于上述第一实施例,提出本发明版权认证方法的第四实施例。
在本实施例中,若所述作品类型为文字作品,步骤S40包括:
步骤c11,通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值;
步骤c12,根据所述第一相似度值从所述已认证文字作品中筛选得到第一预设数量的相似文字作品;
步骤c13,计算所述相似文字作品与所述待认证数字作品之间的第一最长公共子序列,并根据所述第一最长公共子序列的长度计算所述相似文字作品与所述待认证数字作品之间的长度比值,得到第一计算结果;
步骤c14,检测所述第一计算结果中是否存在大于第一预设阈值的长度比值;
步骤c15,若存在大于第一预设阈值的长度比值,则判定版权认证不通过;
步骤c16,若不存在大于第一预设阈值的长度比值,则判定版权认证通过。
其中,步骤c11包括:
步骤c111,通过预设文档搜索引擎对所述待认证数字作品进行分词处理,得到分词集;
步骤c112,通过所述预设文档搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引,并根据所述倒排索引结果计算所述分词集中各分词对应的分值;
步骤c113,对各分词的分值进行加和处理,得到所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。
在本实施例中,若作品类型为文字作品,其对应的版权认证过程如下:
通过预设文档搜索引擎计算待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。其中,预设文档搜索引擎可选地为ES(Elastic Search,弹性检索)搜索引擎,ES是一个分布式、高扩展、高实时的搜索与数据分析引擎,它能很方便的使大量数据具有搜索、分析和探索的能力。具体的,先通过ES搜索引擎对待认证数字作品进行分词处理,得到分词集,其中ES搜索引擎中自带分词器,可以对待认证数字作品进行分词。然后,通过ES搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引,并根据倒排索引结果计算分词集中各分词对应的分值。在通过ES搜索引擎对已认证文字作品进行倒排索引时,也是先通过ES搜索引擎自带的分词器进行分词,并会得到各分词的词频信息和位置信息,进而建立各分词与作品文档之间的倒排索引,其中倒排索引是一个字典类数据结构(key-value),字典的键(key)是一个个的分词,值(value)是包含该分词的作品列表,以及该分词在每个作品中的位置信息与词频信息,通过倒排索引,可以根据分词快速获取包含这个分词的文档列表及词频信息。在根据倒排索引结果计算分词集中各分词对应的分值时,可以根据倒排索引结果获取包含分词的文档、及分词在文档中的词频和逆文档频率,进而根据词频和逆文档频率计算各分词的分值。例如,对待认证数字作品进行分词后得到包含分词“A”、“B”、“C”、“D”、“E”和“F”的分词集,先基于已认证文字作品的倒排索引找到包含分词“A”的作品集,并计算分词“A”对应的分值,具体的,可以先计算作品集中每个作品的分值,每个作品的分值可以为作品中分词A的词频与词A的逆文档频率的乘积(当然也可以根据实际情况设定其他计算方式,如基于词频、逆文档频率和位置信息计算),进而对每个作品的分值进行加和得到分词“A”对应的分值;在得到分词“A”对应的分值之后,对分词“B”、“C”、“D”、“E”、“F”执行相同的操作,以得到分词“B”、“C”、“D”、“E”、“F”分别对应的分值。此外,可以理解,预设认证作品库中的已认证文字作品,可预先采用ES搜索引擎按特定的索引结构进行存储,此时则无需执行“通过所述预设文档搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引”这一步骤。在得到的各分词对应的分值之后,对各分词的分值进行加和处理,得到待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。
在得到待认证数字作品与已认证文字作品之间的第一相似度值之后,根据第一相似度值从已认证文字作品中筛选得到第一预设数量的相似文字作品,其中,第一预设数量可以根据实际需要进行设定,例如,可设定为一预设数值,如1000,还可以设定为第一相似度值大于一预设值的数量,此处不作具体限定。在筛选时,将第一相似度值按从大到小的顺序进行排序,取排名在前的第一预设数量的文字作品,作为相似文字作品。需要说明的是,考虑到两篇文字作品存在抄袭关系的前提是两篇作品的用词是一致的,且每个词语前后相邻的词语也是一致的。如果两篇作品的用词都不相同,那么这两篇新闻也一定不会存在抄袭关系。因此,此处通过ES搜索引擎初步判断用词是否一致,以进行初步的筛选,其目的在于从已认证文字作品中筛选得到包含待认证文字作品中的全部或大部分切词的文字作品,以缩小认证比对的范围,节省服务器资源,进一步提高文字作品版权认证的效率。此外,需要说明的是,在具体实施时,当然也可以直接基于计算最长公告子序列的方式来计算待认证数字作品与预设认证作品库中的已认证文字作品之间的相似度值,进而基于该相似度值判定版权认证是否通过,但是相比而言,通过ES搜索引擎进行初筛的计算过程的复杂程度显然低于最长公共子序列的计算复杂程度,借助ES搜索引擎从千万级的已认证文字作品中检索出与待认证数字作品用词一致的相似度值为前1000作品集的耗时为毫秒级,因此,本实施例中通过ES搜索引擎先进行初筛,再与后续计算最长公共子序列相结合,相比于直接基于最长公共子序列计算相似度值的方式,可进一步提高作品版权认证效率。
然后,计算相似文字作品与待认证数字作品之间的第一最长公共子序列,其中,第一最长公共子序列中的“第一”并无实质含义,仅用于与后续的第二最长公告子序列进行区分。最长公共子序列,即找出两个序列的最长的公共子序列,例如,给定两个字符串X=<x1,x2,x3,…,xn>,Y=<y1,y2,y3,…,ym>,存在两个长度为k的下标序列<i1,i2,…,ik>,<j1,j2,…,jk>,使得字符串X和Y在对应下标i和j的位置的字符相等,满足上述要求的最长的下标序列对应的子字符串即为X和Y之间的最长公共子序列。如字符串ABCDE和字符串XAYCDZ之间的最长公共子序列为ACD。然后,根据第一最长公共子序列的长度计算相似文字作品与待认证数字作品之间的长度比值,得到第一计算结果。第一最长公共子序列的数量对应的与相似文字作品的数量相同。对于长度比值的计算,例如,某一相似文字作品的第一最长公共子序列包括100个字符时,则其长度为100,若待认证数字作品包括1000个字符,则长度比值为100/1000=0.1。
然后,检测第一计算结果中是否存在大于第一预设阈值的长度比值,其中,第一预设阈值可根据实际需要设定,例如可设为0.8,此处不作具体限定。若存在大于第一预设阈值的长度比值,则认为存在引用/抄袭关系,此时判定版权认证不通过;若不存在大于第一预设阈值的长度比值,则判定版权认证通过。
需要说明的是,在具体实施时,“计算相似文字作品与待认证数字作品之间的第一最长公共子序列,并根据第一最长公共子序列的长度计算相似文字作品与待认证数字作品之间的长度比值”与“检测是否存在大于第一预设阈值的长度比值”的过程可同时进行,即,依次计算各相似文字作品与待认证数字作品之间的第一最长公共子序列,然后根据第一最长公共子序列的长度计算相似文字作品与待认证数字作品之间的长度比值,进而该长度比值是否大于第一预设阈值,一旦检测到某一相似文字作品对应的长度比值大于第一预设阈值,则认为存在引用/抄袭关系,即可判定版权认证不通过,此时则无需计算其他相似文字作品与待认证数字作品之间的第一最长公共子序列及后续步骤,可节省服务器资源,进一步提高版权认证的效率。
通过上述方式,可检测待认证作品与已认证作品之间是否存处在引用/抄袭关系,以确定是否对版本进行认证。
在本实施例中,若所述作品类型为图片作品,步骤S40还可以包括:
步骤c21,通过预设图像检索引擎计算所述待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值;
步骤c22,根据所述第二相似度值从所述已认证图片作品中筛选得到第二预设数量的相似图片作品;
步骤c23,提取所述待认证数字作品的第一尺度不变特征变换SIFT特征向量,并提取所述相似图片作品的第二SIFT特征向量;
步骤c24,计算所述第一SIFT特征向量与所述第二SIFT特征向量之间的余弦距离,得到第二计算结果;
步骤c25,检测所述第二计算结果中是否存在大于第二预设阈值的余弦距离;
步骤c26,若存在大于第二预设阈值的余弦距离,则判定版权认证不通过;
步骤c27,若不存在大于第二预设阈值的余弦距离,则判定版权认证通过。
在本实施例中,若所述作品类型为图片作品,其对应的版权认证过程如下:
通过预设图像检索引擎计算待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值。其中,预设图像检索引擎可选地为CBIR(Content-based imageretrieval,基于内容的图像检索)引擎,CBIR引擎的核心是使用图像的可视特征对图像进行检索。本质上讲,它是一种近似匹配技术,融合了计算机视觉、图像处理、图像理解和数据库等多个领域的技术成果,其中的特征提取和索引的建立可由计算机自动完成,避免了人工描述的主观性。用户检索的过程一般是提供一个样例图像(Queryby Example)或描绘一幅草图(Queryby Sketch),系统抽取该查询图像的特征,然后与数据库中的特征进行比较,并将与查询特征相似的图像返回给用户。需要说明的是,由于预设认证作品库中的已认证图片作品都是按预设尺寸存储的,故需对图片类的待认证数字作品进行对应的缩放处理,得到同样预设尺寸的待认证数字作品,再通过预设图像检索引擎计算缩放后的待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值。
在得到待认证数字作品与已认证图片作品之间的第二相似度值之后,根据第二相似度值从已认证图片作品中筛选得到第二预设数量的相似图片作品,其中,第二预设数量可以与第一预设数量相同或不同,可以根据实际需要进行设定,此处不作具体限定。在筛选时,将第二相似度值按从大到小的顺序进行排序,取排名在前的第二预设数量的文字作品,作为相似文字作品。需要说明的是,考虑到两个图片作品存在抄袭关系的前提是两个图片作品的颜色、形状、纹理等低层次特征是一致的,且各特征的排列方式也是一致的。如果两个图片作品的低层次特征都不相似,那么这两个图片作品也一定不会存在抄袭关系。因此,此处通过CBIR引擎进行初步筛选的目的在于从已认证图片作品中筛选得到包含较多待认证图片作品中特征(如颜色特征、形状特征、纹理特征等)的图片作品,以缩小认证比对的范围,节省服务器资源,进一步提高图片作品版权认证的效率。当然,需要说明的是,在具体实施时,也可以直接基于SIFT特征向量的方式来计算待认证数字作品与预设认证作品库中的已认证图片作品之间的相似度值,进而基于该相似度值判定版权认证是否通过,但是相比而言,通过CBIR引擎进行特征提取和相似度计算,相比于提取SIFT特征向量,其计算过程更为简单,效率更高,因此,本实施例中先通过CBIR引擎先进行初筛,再与后续基于SIFT特征向量计算相似度值相结合,相比于直接基于SIFT特征向量计算相似度值的方式,可进一步提高作品版权认证效率。
然后,分别提取待认证数字作品和相似图片作品的SIFT(Scale-invariantfeature transform,尺度不变特征变换)特征向量,即提取待认证数字作品的第一SIFT特征向量,并提取相似图片作品的第二SIFT特征向量。其中,SIFT特征向量的提取过程为:在图像中检测出一系列的关键点,这些关键点对尺度缩放,旋转以及亮度变化无关,然后对上述关键点分配梯度方向值,就可以得到一幅图像的SIFT特征向量。具体的提取过程与现有技术相一致,此处不作具体描述。
进而,计算第一SIFT特征向量与第二SIFT特征向量之间的余弦距离,得到第二计算结果。本实施例中采用余弦距离表征两特征向量之间的相似度,在具体实施例中,还可以采用其他参数来表征,如欧式距离等。最后,检测第二计算结果中是否存在大于第二预设阈值的余弦距离;其中,第二预设阈值可以与第一预设阈值相同或不同,可根据实际需要设定,例如也可设为0.8,此处不作具体限定。若存在大于第二预设阈值的余弦距离,则认为存在引用/抄袭关系,判定版权认证不通过;若不存在大于第二预设阈值的余弦距离,则判定版权认证通过。
同样的,在具体实施时,“提取待认证数字作品的第一SIFT特征向量,并提取相似图片作品的第二SIFT特征向量,然后计算第一SIFT特征向量与第二SIFT特征向量之间的余弦距离”与“检测是否存在大于第二预设阈值的余弦距离”的过程可同时进行,一旦检测到某一相似图片作品对应的余弦距离大于第二预设阈值,则认为存在引用/抄袭关系,即可判定版权认证不通过,此时则无需提取其他相似图片作品与待认证数字作品的SIFT特征向量,也无需计算对应的余弦距离及后续检测步骤,可节省服务器资源,进一步提高版权认证的效率。
在本实施例中,若所述作品类型为音频作品,步骤S40还可以包括:
步骤c31,将所述待认证数字作品转换成文字作品类型,得到待认证音频文字作品;
步骤c32,通过预设文档搜索引擎计算所述待认证音频文字作品与预设认证作品库中的已认证音频文字作品之间的第三相似度值;
步骤c33,根据所述第三相似度值从所述已认证音频文字作品中检索得到第三预设数量的相似音频文字作品;
步骤c34,计算所述相似音频文件作品与所述待认证音频文字作品之间的第二最长公共子序列,并根据所述第二最长公共子序列的长度计算所述相似音频文字作品与所述待认证音频文字作品之间的长度比值,得到第三计算结果;
步骤c35,检测所述第三计算结果中是否存在大于第三预设阈值的长度比值;
步骤c36,若存在大于第三预设阈值的长度比值,则判定版权认证不通过;
步骤c37,若不存在大于第三预设阈值的长度比值,则判定版权认证通过。
在本实施例中,若作品类型为音频作品,其对应的版权认证过程如下:
将所述待认证数字作品转换成文字作品类型,得到待认证音频文字作品,然后,通过预设文档搜索引擎计算待认证数字作品与预设认证作品库中的已认证音频文字作品之间的第三相似度值。其中,预设文档搜索引擎可选地为ES搜索引擎。预设认证作品库中的已认证音频文字作品,是基于语音识别工具将音频作品转换为文字作品类型得到的,可预先采用ES搜索引擎按特定的索引结构进行存储,以便于后续进行搜索。
在得到待认证数字作品与已认证音频文字作品之间的第三相似度值之后,根据第三相似度值从已认证音频文字作品中筛选得到第三预设数量的相似文字作品,其中,第三预设数量可以与第一预设数量和第二预设数量相同或不同,可根据实际需要进行设定,此处不作具体限定。在筛选时,将第三相似度值按从大到小的顺序进行排序,取排名在前的第三预设数量的文字作品,作为相似文字作品。需要说明的是,此处筛选的目的在于从已认证音频文字作品中筛选得到包含待认证音频文字作品中的全部或大部分切词的文字作品,以缩小认证比对的范围,节省服务器资源,进一步提高版权认证的效率。
然后,计算相似文字音频作品与待认证音频文字作品之间的第二最长公共子序列,其中,第二最长公共子序列中的“第二”并无实质含义,仅用于与上述第一最长公告子序列进行区分。进而根据第二最长公共子序列的长度计算相似文字音频作品与待认证数字作品之间的长度比值,得到第三计算结果,并检测第三计算结果中是否存在大于第三预设阈值的长度比值,其中,第三预设阈值可以与第一预设阈值和第二预设阈值相同或不同,可根据实际需要设定,例如可设为0.8,此处不作具体限定。若存在大于第三预设阈值的长度比值,则认为存在引用/抄袭关系,此时判定版权认证不通过;若不存在大于第三预设阈值的长度比值,则判定版权认证通过。
需要说明的是,在具体实施时,“计算相似音频文字作品与待认证数字作品之间的第二最长公共子序列,并根据第二最长公共子序列的长度计算相似音频文字作品与待认证数字作品之间的长度比值”与“检测是否存在大于第三预设阈值的长度比值”的过程可同时进行,即,依次计算各相似音频文字作品与待认证数字作品之间的第二最长公共子序列,然后根据第二最长公共子序列的长度计算相似音频文字作品与待认证数字作品之间的长度比值,进而该长度比值是否大于第三预设阈值,一旦检测到某一相似音频文字作品对应的长度比值大于第三预设阈值,则认为存在引用/抄袭关系,即可判定版权认证不通过,此时则无需计算其他相似音频文字作品与待认证数字作品之间的第二最长公共子序列及后续步骤,可节省服务器资源,进一步提高版权认证的效率。
进一步地,基于上述第一、第二和第四实施例,提出本发明版权认证方法的第五实施例。
在本实施例中,在步骤S40之后,该版权认证方法还可以包括:
步骤A,在版权认证通过时,获取所述待认证数字作品的作品信息;
在本实施例中,在版权认证通过时,获取待认证数字作品的作品信息,其中,作品信息中的其中一部分信息(如作品作者、作品类型等)可以根据数字作品版权认证请求获取得到,也可以生成对应的提示窗口,在用户基于提示窗口填写对应的作品信息后获取得到;另一部分信息可由版权认证系统生成,例如认证时间、作品的md5(Message-DigestAlgorithm,信息摘要算法)值,其中认证时间可直接获取版权认证通过时的时间,作品的md5值可在获取到待认证数字作品后,通过对应的程序获取,例如,获取文件的byte(字节)信息,第二步通过MessageDigest(信息摘要)类进行md5加密,第三步转换成16进制的md5码值。作品信息可以包括但不限于:作品作者、作品类型、认证时间及待认证数字作品的md5值。
步骤B,基于所述作品信息生成对应的版权认证信息,并根据所述版权认证信息生成数据上链请求;
然后,基于作品信息生成对应的版权认证信息,具体的,可以将作品信息转换成预设数据格式,如json(一种轻量级的数据交换格式)数据结构,以得到版权认证信息。在生成版权认证信息之后,进而根据版权认证信息生成数据上链请求,具体的,可以采用sha256(Secure Hash Algorithm 256,安全散列算法256)算法生成该版权认证信息的哈希值,进而基于该哈希值生成数据上链请求。
步骤C,将所述数据上链请求发送至版权认证联盟链,以使得所述版权认证联盟链基于所述数据上链请求完成对所述待认证数字作品的上链操作。
最后,将数据上链请求发送至版权认证联盟链,以使得版权认证联盟链基于数据上链请求完成对待认证数字作品的上链操作。其中,版权认证联盟链主要由版权认证机构节点、公证机构节点、司法机构节点以及外联节点组成,可以将数据上链请求发送至版权认证联盟链中的外联节点,然后通过所有节点一起基于通用的共识算法完成对待认证数字作品的上链操作,即将数据上链请求中的哈希值写入联盟连中永久保留。
当然,可以理解的是,在版权认证通过时,除上报版权认证联盟链对数据上链外,还可以将该版权认证通过的待认证数字作品存储至预设已认证作品库中,用于检测后续作品是否存在抄袭已认证作品的情况;同时,向用户端返回版权认证成功的消息提示,已告知用户。
在本实施例中,版权认证系统在判定版权认证通过时,可生成对应的数据上链请求,并发送至版权认证联盟链,以使得版权认证联盟链基于数据上链请求完成上链操作,基于区块链具有不可修改的特性,可实现对数字作品版权的保护,后续一旦出现未经授权对他人作品进行传播的情况,版权所有者即可根据区块链上的认证信息对侵权行为进行申诉,降低维权的难度。
在现有技术中,也存在基于区块链的版权认证方案,例如,版权认证机构、公证机构、司法机构以及若干自媒体人分别作为一个节点,共同构成一个版权认证区块链平台,以对数字作品的版权进行审查认证。但是其对作品的审查以及版权认证环节还是在线下通过人工完成,而仅仅把最终的认证结果写入区块链平台,这样的方式并没有缩短认证周期,提高版权认证效率。同时,当前基于区块链的方案,多采用公链方式组织区块链,以此来保证系统运行的稳定性,此外还要求自媒体人或者创作者申请并加入区块链平台,增加创作者的使用成本,且他人可知晓各节点的操作行为,无法有效保证数据隐私性。对此,本发明还提供一种版权认证系统。
参照图3,图3为本发明版权认证系统的系统架构示意图。
在本实施例中,如图3所示,版权认证系统包括版权认证设备和版权认证联盟链;当然,还可以包括用户端。
其中,版权认证设备为如图1所示的版权认证设备;用于执行上述版权认证方法实施例中的各步骤,具体的功能和实现过程可参照上述实施例,此处不作赘述。
所述版权认证联盟链,用于接收所述版权认证设备发送的数据上链请求;
基于所述数据上链请求获取待上链数据信息,并基于共识算法完成对所述待上链数据信息的上链操作。
在本实施例中,版权认证联盟链,可以用于接收版权认证设备发送的数据上链请求,其中,版权认证联盟链主要由版权认证机构节点、公证机构节点、司法机构节点以及外联节点组成,可通过外链节点接收版权认证设备发送的数据上链请求。进而基于数据上链请求获取待上链数据信息,其中,该待上链数据信息可以为基于版权认证信息生成的哈希值,然后基于共识算法完成对该哈希值的上链操作,即将该哈希值写入联盟链中永久保留。
此外,为保证版权认证的权威性和安全性,通常只对来自版权认证设备的请求进行响应,对应的,外联节点在接收到数据上链请求时,可获取对应的设备IP(InternetProtocol,互联网协议地址),进而检测该设备IP是否为预设的版权认证设备的IP,若是,则基于数据上链请求获取待上链数据信息,并基于共识算法完成对待上链数据信息的上链操作。
通过构建上述版权认证系统,可通过版权认证设备实现对数字作品版权的在线认证,可以针对不同类型的数字作品在秒级的时间复杂度内完成版权认证,相比于现有技术中通过人工进行版权认证,本发明可降低人力成本、缩短版权认证周期、提高版权认证效率,从而可及时对作品著作人的版权进行保护。此外,本实施例中,自媒体人或者创作者无需申请并加入区块链平台、即可实现版权认证和保护,从而可减少创作者的使用成本,同时,他人也无法获取创作者的行为操作,可保证数据隐私性。
本发明还提供一种版权认证装置。
参照图4,图4为本发明版权认证装置第一实施例的功能模块示意图。
如图4所示,所述版权认证装置包括:
第一获取模块10,用于在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
处理模块20,用于根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
审查模块30,用于将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
版权认证模块40,用于在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
进一步地,所述处理模块20具体用于:
若所述作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型;
基于所述第一处理策略对所述待认证数字作品进行切词处理,得到第一切词文本;
将所述第一切词文本输入预设词向量模型,得到所述第一切词文本中各切词的第一词向量;
根据所述第一词向量得到所述待认证数字作品对应的第一文档向量,其中,所述目标输入对象为所述第一文档向量。
进一步地,所述处理模块20还具体用于:
若所述作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型;
基于所述第二处理策略对所述待认证数字作品进行预处理,得到输入图片,其中,所述预处理包括缩放处理和灰度处理,所述目标输入对象为所述输入图片。
进一步地,所述处理模块20还具体用于:
若所述作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型;
基于所述第三处理策略将所述待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品;
对所述转换后的待认证数字作品进行切词处理,得到第二切词文本;
将所述第二切词文本输入预设词向量模型,得到所述第二切词文本中各切词的第二词向量;
根据所述第二词向量得到所述转换后的待认证数字作品对应的第二文档向量,其中,所述目标输入对象为所述第二文档向量。
进一步地,所述目标审查分类模型包括多个,所述审查结果的数量与所述目标审查分类模型的数量相同,所述审查模块30具体用于:
检测多个所述审查结果是否均为审查合格;
若多个所述审查结果均为审查合格,则判定审查通过;
若多个所述审查结果中至少存在一个为审查不合格,则判定审查不通过。
进一步地,若所述作品类型为文字作品,所述版权认证模块40具体用于:
通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值;
根据所述第一相似度值从所述已认证文字作品中筛选得到第一预设数量的相似文字作品;
计算所述相似文字作品与所述待认证数字作品之间的第一最长公共子序列,并根据所述第一最长公共子序列的长度计算所述相似文字作品与所述待认证数字作品之间的长度比值,得到第一计算结果;
检测所述第一计算结果中是否存在大于第一预设阈值的长度比值;
若存在大于第一预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第一预设阈值的长度比值,则判定版权认证通过。
进一步地,所述版权认证模块40还具体用于:
通过预设文档搜索引擎对所述待认证数字作品进行分词处理,得到分词集;
通过所述预设文档搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引,并根据所述倒排索引结果计算所述分词集中各分词对应的分值;
对各分词的分值进行加和处理,得到所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。
进一步地,若所述作品类型为图片作品,所述版权认证模块40还具体用于:
通过预设图像检索引擎计算所述待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值;
根据所述第二相似度值从所述已认证图片作品中筛选得到第二预设数量的相似图片作品;
提取所述待认证数字作品的第一尺度不变特征变换SIFT特征向量,并提取所述相似图片作品的第二SIFT特征向量;
计算所述第一SIFT特征向量与所述第二SIFT特征向量之间的余弦距离,得到第二计算结果;
检测所述第二计算结果中是否存在大于第二预设阈值的余弦距离;
若存在大于第二预设阈值的余弦距离,则判定版权认证不通过;
若不存在大于第二预设阈值的余弦距离,则判定版权认证通过。
进一步地,若所述作品类型为音频作品,所述版权认证模块40还具体用于:
将所述待认证数字作品转换成文字作品类型,得到待认证音频文字作品;
通过预设文档搜索引擎计算所述待认证音频文字作品与预设认证作品库中的已认证音频文字作品之间的第三相似度值;
根据所述第三相似度值从所述已认证音频文字作品中检索得到第三预设数量的相似音频文字作品;
计算所述相似音频文件作品与所述待认证音频文字作品之间的第二最长公共子序列,并根据所述第二最长公共子序列的长度计算所述相似音频文字作品与所述待认证音频文字作品之间的长度比值,得到第三计算结果;
检测所述第三计算结果中是否存在大于第三预设阈值的长度比值;
若存在大于第三预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第三预设阈值的长度比值,则判定版权认证通过。
进一步地,所述版权认证装置还包括:
第二获取模块,用于在版权认证通过时,获取所述待认证数字作品的作品信息;
生成模块,用于基于所述作品信息生成对应的版权认证信息,并根据所述版权认证信息生成数据上链请求;
发送模块,用于将所述数据上链请求发送至版权认证联盟链,以使得所述版权认证联盟链基于所述数据上链请求完成对所述待认证数字作品的上链操作。
其中,上述版权认证装置中各个模块的功能实现与上述版权认证方法实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储有版权认证程序,所述版权认证程序被处理器执行时实现如以上任一项实施例所述的版权认证方法的步骤。
本发明计算机可读存储介质的具体实施例与上述版权认证方法各实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (14)
1.一种版权认证方法,其特征在于,所述版权认证方法包括:
在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
2.如权利要求1所述的版权认证方法,其特征在于,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为文字作品,则确定对应的处理策略为第一处理策略,并确定目标审查分类模型为第一审查分类模型;
基于所述第一处理策略对所述待认证数字作品进行切词处理,得到第一切词文本;
将所述第一切词文本输入预设词向量模型,得到所述第一切词文本中各切词的第一词向量;
根据所述第一词向量得到所述待认证数字作品对应的第一文档向量,其中,所述目标输入对象为所述第一文档向量。
3.如权利要求1所述的版权认证方法,其特征在于,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为图片作品,则确定对应的处理策略为第二处理策略,并确定目标审查分类模型为第二审查分类模型;
基于所述第二处理策略对所述待认证数字作品进行预处理,得到输入图片,其中,所述预处理包括缩放处理和灰度处理,所述目标输入对象为所述输入图片。
4.如权利要求1所述的版权认证方法,其特征在于,所述根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象的步骤包括:
若所述作品类型为音频作品,则确定对应的处理策略为第三处理策略,并确定目标审查分类模型为第三审查分类模型;
基于所述第三处理策略将所述待认证数字作品转换成文字作品类型,得到转换后的待认证数字作品;
对所述转换后的待认证数字作品进行切词处理,得到第二切词文本;
将所述第二切词文本输入预设词向量模型,得到所述第二切词文本中各切词的第二词向量;
根据所述第二词向量得到所述转换后的待认证数字作品对应的第二文档向量,其中,所述目标输入对象为所述第二文档向量。
5.如权利要求1至4中任一项所述的版权认证方法,其特征在于,所述目标审查分类模型包括多个,所述审查结果的数量与所述目标审查分类模型的数量相同,所述基于所述审查结果判断审查是否通过的步骤包括:
检测多个所述审查结果是否均为审查合格;
若多个所述审查结果均为审查合格,则判定审查通过;
若多个所述审查结果中至少存在一个为审查不合格,则判定审查不通过。
6.如权利要求1所述的版权认证方法,其特征在于,若所述作品类型为文字作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值;
根据所述第一相似度值从所述已认证文字作品中筛选得到第一预设数量的相似文字作品;
计算所述相似文字作品与所述待认证数字作品之间的第一最长公共子序列,并根据所述第一最长公共子序列的长度计算所述相似文字作品与所述待认证数字作品之间的长度比值,得到第一计算结果;
检测所述第一计算结果中是否存在大于第一预设阈值的长度比值;
若存在大于第一预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第一预设阈值的长度比值,则判定版权认证通过。
7.如权利要求6所述的版权认证方法,其特征在于,所述通过预设文档搜索引擎计算所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值的步骤包括:
通过预设文档搜索引擎对所述待认证数字作品进行分词处理,得到分词集;
通过所述预设文档搜索引擎对预设认证作品库中的已认证文字作品进行倒排索引,并根据所述倒排索引结果计算所述分词集中各分词对应的分值;
对各分词的分值进行加和处理,得到所述待认证数字作品与预设认证作品库中的已认证文字作品之间的第一相似度值。
8.如权利要求1所述的版权认证方法,其特征在于,若所述作品类型为图片作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
通过预设图像检索引擎计算所述待认证数字作品与预设认证作品库中的已认证图片作品之间的第二相似度值;
根据所述第二相似度值从所述已认证图片作品中筛选得到第二预设数量的相似图片作品;
提取所述待认证数字作品的第一尺度不变特征变换SIFT特征向量,并提取所述相似图片作品的第二SIFT特征向量;
计算所述第一SIFT特征向量与所述第二SIFT特征向量之间的余弦距离,得到第二计算结果;
检测所述第二计算结果中是否存在大于第二预设阈值的余弦距离;
若存在大于第二预设阈值的余弦距离,则判定版权认证不通过;
若不存在大于第二预设阈值的余弦距离,则判定版权认证通过。
9.如权利要求1所述的版权认证方法,其特征在于,若所述作品类型为音频作品,所述将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证的步骤包括:
将所述待认证数字作品转换成文字作品类型,得到待认证音频文字作品;
通过预设文档搜索引擎计算所述待认证音频文字作品与预设认证作品库中的已认证音频文字作品之间的第三相似度值;
根据所述第三相似度值从所述已认证音频文字作品中检索得到第三预设数量的相似音频文字作品;
计算所述相似音频文件作品与所述待认证音频文字作品之间的第二最长公共子序列,并根据所述第二最长公共子序列的长度计算所述相似音频文字作品与所述待认证音频文字作品之间的长度比值,得到第三计算结果;
检测所述第三计算结果中是否存在大于第三预设阈值的长度比值;
若存在大于第三预设阈值的长度比值,则判定版权认证不通过;
若不存在大于第三预设阈值的长度比值,则判定版权认证通过。
10.如权利要求1至4、6至9中任一项所述的版权认证方法,其特征在于,所述版权认证方法还包括:
在版权认证通过时,获取所述待认证数字作品的作品信息;
基于所述作品信息生成对应的版权认证信息,并根据所述版权认证信息生成数据上链请求;
将所述数据上链请求发送至版权认证联盟链,以使得所述版权认证联盟链基于所述数据上链请求完成对所述待认证数字作品的上链操作。
11.一种版权认证装置,其特征在于,所述版权认证装置包括:
第一获取模块,用于在接收到数字作品版权认证请求时,根据所述数字作品版权认证请求获取待认证数字作品和作品类型;
处理模块,用于根据所述作品类型确定对应的处理策略和目标审查分类模型,基于所述处理策略对所述待认证数字作品进行处理,得到目标输入对象;
审查模块,用于将所述目标输入对象输入至所述目标审查分类模型中,得到审查结果,并基于所述审查结果判断审查是否通过;
版权认证模块,用于在审查通过时,将所述待认证数字作品与预设认证作品库中的已认证数字作品进行比对,以进行版权认证。
12.一种版权认证设备,其特征在于,所述版权认证设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的版权认证程序,所述版权认证程序被所述处理器执行时实现如权利要求1至10中任一项所述的版权认证方法的步骤。
13.一种版权认证系统,其特征在于,所述版权认证系统包括版权认证设备和版权认证联盟链;其中,
所述版权认证设备为如权利要求12所述的版权认证设备;
所述版权认证联盟链,用于接收所述版权认证设备发送的数据上链请求;
基于所述数据上链请求获取待上链数据信息,并基于共识算法完成对所述待上链数据信息的上链操作。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有版权认证程序,所述版权认证程序被处理器执行时实现如权利要求1至10中任一项所述的版权认证方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911093190.5A CN110781460A (zh) | 2019-11-11 | 2019-11-11 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
PCT/CN2020/126232 WO2021093643A1 (zh) | 2019-11-11 | 2020-11-03 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911093190.5A CN110781460A (zh) | 2019-11-11 | 2019-11-11 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110781460A true CN110781460A (zh) | 2020-02-11 |
Family
ID=69390433
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911093190.5A Pending CN110781460A (zh) | 2019-11-11 | 2019-11-11 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110781460A (zh) |
WO (1) | WO2021093643A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111488555A (zh) * | 2020-04-02 | 2020-08-04 | 上海七印信息科技有限公司 | 版权认证方法、装置、计算机设备和存储介质 |
CN111552829A (zh) * | 2020-05-07 | 2020-08-18 | 北京海益同展信息科技有限公司 | 用于分析图像素材的方法和装置 |
CN112131859A (zh) * | 2020-08-25 | 2020-12-25 | 中央民族大学 | 藏文作文抄袭检测原型系统 |
CN112163243A (zh) * | 2020-10-09 | 2021-01-01 | 成都乐链科技有限公司 | 基于区块链的数字资产审查与存证方法、确权方法及装置 |
CN112487088A (zh) * | 2020-11-26 | 2021-03-12 | 中国搜索信息科技股份有限公司 | 一种基于区块链的融媒体资源版权保护方法 |
WO2021093643A1 (zh) * | 2019-11-11 | 2021-05-20 | 深圳前海微众银行股份有限公司 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
CN113515664A (zh) * | 2021-09-14 | 2021-10-19 | 北京远鉴信息技术有限公司 | 异常音频的确定方法、装置、电子设备及可读存储介质 |
CN113536288A (zh) * | 2021-06-23 | 2021-10-22 | 上海派拉软件股份有限公司 | 数据认证方法、装置、认证设备及存储介质 |
CN113949515A (zh) * | 2021-09-09 | 2022-01-18 | 卓尔智联(武汉)研究院有限公司 | 一种数字版权信息处理方法及装置、存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033278B (zh) * | 2022-06-29 | 2024-04-30 | 苏州浪潮智能科技有限公司 | 一种产品硬件认证配置管控方法、装置及存储介质 |
CN115495712B (zh) * | 2022-09-28 | 2024-04-16 | 支付宝(杭州)信息技术有限公司 | 数字作品处理方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645117B (zh) * | 2008-08-06 | 2011-11-30 | 武汉大学 | 一种媒体发布网络中的发布内容控制方法 |
CN101826099B (zh) * | 2010-02-04 | 2012-09-05 | 蓝盾信息安全技术股份有限公司 | 一种相似文档识别、文档扩散度确定的方法及系统 |
CN106874253A (zh) * | 2015-12-11 | 2017-06-20 | 腾讯科技(深圳)有限公司 | 识别敏感信息的方法及装置 |
CN105550381B (zh) * | 2016-03-17 | 2019-04-05 | 北京工业大学 | 一种基于改进sift特征的高效图像检索方法 |
CN107832384A (zh) * | 2017-10-28 | 2018-03-23 | 北京安妮全版权科技发展有限公司 | 侵权检测方法、装置、存储介质和电子设备 |
CN109145529B (zh) * | 2018-09-12 | 2021-12-03 | 重庆工业职业技术学院 | 一种用于版权认证的文本相似性分析方法与系统 |
CN110781460A (zh) * | 2019-11-11 | 2020-02-11 | 深圳前海微众银行股份有限公司 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
-
2019
- 2019-11-11 CN CN201911093190.5A patent/CN110781460A/zh active Pending
-
2020
- 2020-11-03 WO PCT/CN2020/126232 patent/WO2021093643A1/zh active Application Filing
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021093643A1 (zh) * | 2019-11-11 | 2021-05-20 | 深圳前海微众银行股份有限公司 | 版权认证方法、装置、设备、系统及计算机可读存储介质 |
CN111488555A (zh) * | 2020-04-02 | 2020-08-04 | 上海七印信息科技有限公司 | 版权认证方法、装置、计算机设备和存储介质 |
CN111552829A (zh) * | 2020-05-07 | 2020-08-18 | 北京海益同展信息科技有限公司 | 用于分析图像素材的方法和装置 |
CN111552829B (zh) * | 2020-05-07 | 2023-06-27 | 京东科技信息技术有限公司 | 用于分析图像素材的方法和装置 |
CN112131859A (zh) * | 2020-08-25 | 2020-12-25 | 中央民族大学 | 藏文作文抄袭检测原型系统 |
CN112163243A (zh) * | 2020-10-09 | 2021-01-01 | 成都乐链科技有限公司 | 基于区块链的数字资产审查与存证方法、确权方法及装置 |
CN112487088A (zh) * | 2020-11-26 | 2021-03-12 | 中国搜索信息科技股份有限公司 | 一种基于区块链的融媒体资源版权保护方法 |
CN112487088B (zh) * | 2020-11-26 | 2021-08-24 | 中国搜索信息科技股份有限公司 | 一种基于区块链的融媒体资源版权保护方法 |
CN113536288A (zh) * | 2021-06-23 | 2021-10-22 | 上海派拉软件股份有限公司 | 数据认证方法、装置、认证设备及存储介质 |
CN113536288B (zh) * | 2021-06-23 | 2023-10-27 | 上海派拉软件股份有限公司 | 数据认证方法、装置、认证设备及存储介质 |
CN113949515A (zh) * | 2021-09-09 | 2022-01-18 | 卓尔智联(武汉)研究院有限公司 | 一种数字版权信息处理方法及装置、存储介质 |
CN113515664A (zh) * | 2021-09-14 | 2021-10-19 | 北京远鉴信息技术有限公司 | 异常音频的确定方法、装置、电子设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021093643A1 (zh) | 2021-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110781460A (zh) | 版权认证方法、装置、设备、系统及计算机可读存储介质 | |
WO2018166116A1 (zh) | 车损识别方法、电子装置及计算机可读存储介质 | |
US9218364B1 (en) | Monitoring an any-image labeling engine | |
CN111767228B (zh) | 基于人工智能的界面测试方法、装置、设备和介质 | |
US20200004815A1 (en) | Text entity detection and recognition from images | |
US9037600B1 (en) | Any-image labeling engine | |
CN110929125B (zh) | 搜索召回方法、装置、设备及其存储介质 | |
CN108491866B (zh) | 色情图片鉴定方法、电子装置及可读存储介质 | |
CN107609389B (zh) | 一种基于图像内容相关性的验证方法及系统 | |
CN110569350B (zh) | 法条推荐方法、设备和存储介质 | |
CN111612081B (zh) | 识别模型的训练方法、装置、设备及存储介质 | |
CN112925898B (zh) | 基于人工智能的问答方法、装置、服务器及存储介质 | |
WO2022134580A1 (zh) | 证件信息的获取方法及装置、存储介质、计算机设备 | |
CN114398681A (zh) | 训练隐私信息分类模型、识别隐私信息的方法和装置 | |
CN111553241A (zh) | 掌纹的误匹配点剔除方法、装置、设备及存储介质 | |
US11875114B2 (en) | Method and system for extracting information from a document | |
CN113537206A (zh) | 推送数据检测方法、装置、计算机设备和存储介质 | |
CN111767543A (zh) | 重放攻击漏洞确定方法、装置、设备及可读存储介质 | |
CN113888760B (zh) | 基于软件应用的违规信息监控方法、装置、设备及介质 | |
CN112989820B (zh) | 法律文书定位方法、装置、设备及存储介质 | |
CN111382383A (zh) | 网页内容敏感类型确定方法、装置、介质和计算机设备 | |
CN114528908A (zh) | 网络请求数据分类模型训练方法、分类方法及存储介质 | |
CN113704623A (zh) | 一种数据推荐方法、装置、设备及存储介质 | |
CN112990147A (zh) | 一种涉政图像的识别方法、装置、电子设备及存储介质 | |
CN112084979A (zh) | 食品成分识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |