CN114090962A - 一种基于大数据的智能出版系统及方法 - Google Patents
一种基于大数据的智能出版系统及方法 Download PDFInfo
- Publication number
- CN114090962A CN114090962A CN202210076773.2A CN202210076773A CN114090962A CN 114090962 A CN114090962 A CN 114090962A CN 202210076773 A CN202210076773 A CN 202210076773A CN 114090962 A CN114090962 A CN 114090962A
- Authority
- CN
- China
- Prior art keywords
- publishing
- nodes
- digital content
- learning model
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 19
- 238000013136 deep learning model Methods 0.000 claims abstract description 43
- 238000001914 filtration Methods 0.000 claims abstract description 19
- 238000004590 computer program Methods 0.000 claims description 12
- 238000012795 verification Methods 0.000 claims description 11
- 238000007621 cluster analysis Methods 0.000 claims description 5
- 238000004806 packaging method and process Methods 0.000 claims description 3
- 238000012856 packing Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 239000004744 fabric Substances 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000000644 propagated effect Effects 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Technology Law (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于大数据的智能出版系统,其系统包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,且:每个所述用户节点,用于通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。本发明通过结合RIPPLE共识协议和多标签深度学习模型,使得可信全节点实现数字内容的智能出版,缩短发行时间,有效满足了用户的个性化需求。
Description
技术领域
本发明属于数字出版技术领域,具体涉及一种基于大数据的智能出版系统及方法。
背景技术
随着互联网和数字出版技术的繁荣,自出版成为一种不可忽视的现象。当前我国出版语境下的自出版,主要指以网络平台为媒介的自出版,即网络自出版;将自出版中“自”的内涵进一步分解为“六个自”:自创作品、自持版权、自筹资金、自主经营、自担风险、自享收益;在这种模式中,传统出版社、平台运营商、版权代理机构仅作为出版服务商发挥作用,而整个自出版流程由作者主导完成。
另一方面,出版方与市场需求总是存在一定的滞后性,导致出版物无法与市场需求合理适配,无法针对读者与客户群体进行个性化的数字出版、信息定制,用户的粘性与兴趣关注点就会转移,从而失去读者和客户;现有的数字出版技术缺少基于以数据平台为中心的个性化信息推荐分析系统,无法针对读者与客户群体进行个性化的数字出版、信息定制、精准定向出版,用户的粘性与兴趣关注点就会转移,从而失去读者和客户。
发明内容
为有效利用出版信息和用户需求信息,满足读者或客户群体的个性化的数字出版、信息定制、精准定向出版,在本发明的第一方面提供了一种基于大数据的智能出版系统,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,且:每个所述用户节点,用于通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
在本发明的一些实施例中,所述多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并根据聚类分析结果自动生成一个或多个出版任务包括:将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上;对多个所述需求信息进行过滤和聚类分析,利用训练完成的多标签深度学习模型和聚类分析结果,自动生成一个或多个出版任务。
进一步的,所述对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务包括:对多个所述需求信息进行过滤和聚类分析,得到一个或多个聚类中心,利用TF-IDF算法提取每个聚类中心的一个或多个关键词,并将每个关键词作为多标签深度学习模型的标签;利用训练完成的多标签深度学习模型,将属于一个聚类中心的多个关键词打包成一个或多个出版任务。
在本发明的一些实施例中,所述通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中包括:利用训练完成的多标签深度学习模型验证待发行的数字内容:若验证通过,通过RIPPLE共识协议将数字内容和发行模板打包成区块;否则,将待发行的数字内容返回给对应的用户节点。
进一步的,所述利用训练完成的多标签深度学习模型验证待发行的数字内容包括:将待发行的数字内容输入到多标签深度学习模型中,得到一个或多个标签;将得到的一个或多个标签与其对应的出版发行任务中的标签进行匹配,若两者的相似度高于阈值,则通过验证;否则,验证不通过。
在上述的实施例中,所述用户节点包括读者节点和作者节点,所述用户节点,用于通过联盟链购买数字内容以及向出版节点发送需求信息;所述作者节点,用于接收出版任务或向联盟链发布数字内容。
本发明的第二方面,提供了一种基于大数据的智能出版方法,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,包括:每个用户节点通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;多个所述出版节点,对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
进一步的,所述将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上。
本发明的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明在第二方面提供的基于大数据的智能出版方法。
本发明的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本发明在第二方面提供的基于大数据的智能出版方法。
本发明的有益效果是:
1.本发明通过结合RIPPLE共识协议和多标签深度学习模型,使得可信全节点实现数字内容的智能出版,缩短发行时间,有效满足了用户的个性化需求;
2.利用多标签深度学习模型能充分发掘联盟链的需求信息,同时将多标签深度学习模型部署在联盟链上,通过提取到的特征标签化及匹配机制,实现需求发布和需求验证一体化;
3.Ring-allreduce架构加快了多标签深度学习模型的收敛速度,充分利用了通信带宽,减少内存消耗。
附图说明
图1为本发明的一些实施例中的大数据的智能出版系统的结构示意图;
图2为本发明的一些实施例中的多标签深度学习模型通过Ring-allreduce架构部署;
图3为本发明的一些实施例中的大数据的智能出版系统的具体结构示意图;
图4本发明的一些实施例中的大数据的智能出版的流程示意图;
图5为本发明的一些实施例中的电子设备的结构示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
参考图1,在本发明的第一方面,提供了一种基于大数据的智能出版系统,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,且:每个所述用户节点,用于通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
可以理解,利用传统的认证加密鉴权等功能,便能实现出版节点和用户节点的可信验证,由此便可利用RIPPLE共识协议无需挖矿便能将相关数字内容或任务需求作为一种资产(通证)写入联盟链的区块中,利用区块中的,默克尔树能实现快速溯源和认证。数字内容是将图像、文字、影音等内容通过数字技术进行整合应用的产品或服务的总体,是数字媒体技术与文化创意结合的产物。数字内容之主要范畴,在于将图像文字影像语音等数据运用信息技术加以数字化并整合应用之产品或服务。数字内容产业涵盖八大领域,包括数字游戏、计算机动画、数字学习、数字影音应用、移动应用服务、网络服务、内容软件、数字出版与典藏。
示意性地,图1示出了基于大数据的智能出版系统的基本结构,用户过SDK(共识协议及其相关联盟链的智能合约等接口的抽象)访问部署在云端(或由多个普通节点、可信全节点组成的网络)的用户节点(peer)权限的内容,作为出版方提供一个或多个出版节点,用于接收出版任务或向联盟链发布数字内容。
参考图2,在本发明的一些实施例中,所述多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并根据聚类分析结果自动生成一个或多个出版任务包括:将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上;对多个所述需求信息进行过滤和聚类分析,利用训练完成的多标签深度学习模型和聚类分析结果,自动生成一个或多个出版任务。
示意性地,图2中示出了部署在8个出版节点多标签深度学习模型,在Ring-allreduce架构中,各个设备都是worker,并且形成一个环,没有中心节点来聚合所有worker计算的梯度。在一个迭代过程,每个worker完成自己的mini-batch训练,计算出梯度,并将梯度传递给环中的下一个worker,同时它也接收从上一个worker的梯度。对于一个包含N个worker的环,各个worker需要收到其它N-1个worker的梯度后就可以更新模型参数。
进一步的,所述对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务包括:对多个所述需求信息进行过滤和聚类分析,得到一个或多个聚类中心,利用TF-IDF算法提取每个聚类中心的一个或多个关键词,并将每个关键词作为多标签深度学习模型的标签;利用训练完成的多标签深度学习模型,将属于一个聚类中心的多个关键词打包成一个或多个出版任务。
具体地,需求信息最终反映为出版内容(主题)、出版形式(图书、视频、音频)、出版篇幅(长篇、中篇、短篇)的要求,因此聚类中心可按照语义或类型对需求信息进行聚类,因此可利用相应的提取算法提取数字内容中的音频、图像和文字,通过提取后的语义对原数字内容进行聚类。例如,一篇讲述摄影的视频,分为若干个章节,每个章节对应了不同的主题(风景、人物、建筑等),其即可以通过“摄影”这一主题与其他相关的数字内容(摄影的教程)进行聚类,也可根据其中的风景、人物或建筑与其他相关的数字内容进行聚类。可以理解,通过设置聚类中心的个数(发布任务的关键词个数),相当于设置了满足发布任务的阈值,提高了用户需求与数字内容的匹配程度,减少重复出版。
此外,多标签深度学习模型通过如下步骤进行训练:获取数字内容的推荐数据集,将所述推荐数据集进行合并去重、清洗之后,得到训练集;所述标签包括类型、主题、领域、风格、篇幅和评价信息;从所述多个标签中随机选取其中一个为主标签,余下的一个或多个标签作为副标签,利用训练集训练。应理解,推荐数据集包括BookCrossing数据集、Retailrocket数据集、GroupLens等包括数字内容的数据集。
在本发明的一些实施例中,所述通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中包括:利用训练完成的多标签深度学习模型验证待发行的数字内容:若验证通过,通过RIPPLE共识协议将数字内容和发行模板打包成区块;否则,将待发行的数字内容返回给对应的用户节点。
进一步的,所述利用训练完成的多标签深度学习模型验证待发行的数字内容包括:将待发行的数字内容输入到多标签深度学习模型中,得到一个或多个标签;将得到的一个或多个标签与其对应的出版发行任务中的标签进行匹配,若两者的相似度高于阈值,则通过验证;否则,验证不通过。相似度通过汉明距离、欧式距离等L2级距离度量。
在上述的实施例中,所述用户节点包括读者节点和作者节点,所述用户节点,用于通过联盟链购买数字内容以及向出版节点发送需求信息;所述作者节点,用于接收出版任务或向联盟链发布数字内容。
特别地,为了避免数据的泄漏,可见作者节点和用户节点部署在不同的联盟链上,多个联盟链通过相同的版权节点(可信全节点)实现相互的访问,由于RIPPLE共识协议是基于选举机制,当联盟链中的可信节点受到攻击不可信或失效时,可通过RIPPLE共识协议选举出新的一个或多个版权节点;可选的,所述联盟链包括Hyperledger Fabric、EnterpriseEthereum或R3 Corda,优选Hyperledger Fabric。
参考图3,基于RIPPLE共识协议下的联盟链部署在Fabric区块链中,版权节点通过中间服务器实现,中心服务器又可通过分布式架构部署在Fabric-CA集群中,每个Fabric-CA节点根据数据库的类型不同存储不同的数字内容或多标签深度学习模型的训练数据。数字内容的作者或用户可以通过客户端访问Fabric区块链的普通节点(peer节点),购买数字内容以及向出版节点发送需求信息,接收出版任务或向联盟链发布数字内容。
特别地,随着数字社区和弹幕文化的兴起,大量用户提供的评论或具有一定原创性的内容可以满足其他用户在同一兴趣或领域的数字内容的需求。因此,联盟链部署中的版权节点的功能可由一个或多个具有影响力的用户节点来承担,从而实现了用户自发的网络自出版。也即是,联盟链实现完全的去中心化。
应理解,上述出版节点和可信节点是基于现有中心化的网络体系为基础;随着边缘节点的算力提升和通信技术的发展,出版节点和可信节点不再有明确的界限,即:一种基于大数据的智能出版系统,包括运行在联盟链上的多个第一类节点和多个第二类节点,其中第一类节点为可信全节点,第二类节点为普通节点,且:
每个所述第一类节点,用于通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;
多个所述第二类节点,用于对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中;且第一类节点通过第二类节点通过共识机制选举得出。
实施例2
参考图4,本发明的第二方面,提供了一种基于大数据的智能出版方法,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,包括:S100.每个用户节点通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;S200.多个所述出版节点,对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
进一步的,所述将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上。
实施例3
参考图5,本发明的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明在第一方面的方法。
电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所描述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个计算机程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++、Python,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的智能出版系统,其特征在于,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,且:
每个所述用户节点,用于通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;
多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
2.根据权利要求1所述的基于大数据的智能出版系统,其特征在于,所述多个所述出版节点,用于对多个所述需求信息进行过滤和聚类分析,并根据聚类分析结果自动生成一个或多个出版任务包括:
将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上;
对多个所述需求信息进行过滤和聚类分析,利用训练完成的多标签深度学习模型和聚类分析结果,自动生成一个或多个出版任务。
3.根据权利要求2所述的基于大数据的智能出版系统,其特征在于,所述对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务包括:
对多个所述需求信息进行过滤和聚类分析,得到一个或多个聚类中心,利用TF-IDF算法提取每个聚类中心的一个或多个关键词,并将每个关键词作为多标签深度学习模型的标签;
利用训练完成的多标签深度学习模型,将属于一个聚类中心的多个关键词打包成一个或多个出版任务。
4.根据权利要求1所述的基于大数据的智能出版系统,其特征在于,所述通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中包括:
利用训练完成的多标签深度学习模型验证待发行的数字内容:若验证通过,通过RIPPLE共识协议将数字内容和发行模板打包成区块;
否则,将待发行的数字内容返回给对应的用户节点。
5.根据权利要求4所述的基于大数据的智能出版系统,其特征在于,所述利用训练完成的多标签深度学习模型验证待发行的数字内容包括:
将待发行的数字内容输入到多标签深度学习模型中,得到一个或多个标签;
将得到的一个或多个标签与其对应的出版发行任务中的标签进行匹配,若两者的相似度高于阈值,则通过验证;否则,验证不通过。
6.根据权利要求1至5任一项所述的基于大数据的智能出版系统,其特征在于,所述用户节点包括读者节点和作者节点,
所述用户节点,用于通过联盟链购买数字内容以及向出版节点发送需求信息;
所述作者节点,用于接收出版任务或向联盟链发布数字内容。
7.一种基于大数据的智能出版方法,包括运行在联盟链上的多个用户节点和多个出版节点,其中出版节点为可信全节点,用户节点为普通节点,其特征在于,包括:
每个用户节点通过联盟链购买数字内容、向出版节点发送需求信息,以及接收出版任务或向联盟链发布数字内容;
多个所述出版节点,对多个所述需求信息进行过滤和聚类分析,并利用训练完成的多标签深度学习模型自动生成一个或多个出版任务;以及通过联盟链的RIPPLE共识协议将认证通过的数字内容发行到联盟链中。
8.根据权利要求7所述的基于大数据的智能出版方法,其特征在于,所述将多标签深度学习模型通过Ring-allreduce架构部署在多个出版节点上。
9.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求7至8任一项所述的基于大数据的智能出版方法。
10.一种计算机可读介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求7至8任一项所述的基于大数据的智能出版方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210076773.2A CN114090962B (zh) | 2022-01-24 | 2022-01-24 | 一种基于大数据的智能出版系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210076773.2A CN114090962B (zh) | 2022-01-24 | 2022-01-24 | 一种基于大数据的智能出版系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114090962A true CN114090962A (zh) | 2022-02-25 |
CN114090962B CN114090962B (zh) | 2022-05-13 |
Family
ID=80309238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210076773.2A Active CN114090962B (zh) | 2022-01-24 | 2022-01-24 | 一种基于大数据的智能出版系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114090962B (zh) |
Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109146645A (zh) * | 2018-09-05 | 2019-01-04 | 深圳正品创想科技有限公司 | 基于区块链的商品推荐方法、区块链节点及系统 |
CN110110498A (zh) * | 2019-05-10 | 2019-08-09 | 中南大学 | 一种基于联盟链的数字版权确权方法与系统 |
CN110113388A (zh) * | 2019-04-17 | 2019-08-09 | 四川大学 | 一种基于改进型聚类算法的区块链系统共识的方法和装置 |
CN110490330A (zh) * | 2019-08-16 | 2019-11-22 | 安徽航天信息有限公司 | 一种基于区块链的分布式机器学习系统 |
US20200184448A1 (en) * | 2018-12-10 | 2020-06-11 | International Business Machines Corporation | Cognitive blockchain for customized interchange determination |
US20200184278A1 (en) * | 2014-03-18 | 2020-06-11 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
CN111460323A (zh) * | 2020-06-17 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 基于人工智能的焦点用户挖掘方法和装置 |
CN111553744A (zh) * | 2020-05-08 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 联邦产品推荐方法、装置、设备及计算机存储介质 |
US20200342014A1 (en) * | 2019-04-29 | 2020-10-29 | American Express Travel Related Services Company, Inc. | Data indexing system using dynamic tags |
CN112015825A (zh) * | 2020-10-22 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 基于区块链的模型登记方法、装置及电子设备 |
CN112104892A (zh) * | 2020-09-11 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种多媒体信息处理方法、装置、电子设备及存储介质 |
CN112464179A (zh) * | 2020-11-26 | 2021-03-09 | 浙江传媒学院 | 一种基于区块链与表情识别的短视频版权存储算法 |
CN112487103A (zh) * | 2020-12-25 | 2021-03-12 | 昆明理工大学 | 一种基于区块链智能合约的深度学习数据集可信共享系统 |
CN112597300A (zh) * | 2020-12-15 | 2021-04-02 | 中国平安人寿保险股份有限公司 | 文本聚类方法、装置、终端设备及存储介质 |
CN112801827A (zh) * | 2020-10-29 | 2021-05-14 | 西安纸贵互联网科技有限公司 | 一种基于区块链的知识产权管理系统 |
CN112989186A (zh) * | 2021-02-25 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 资讯信息推荐模型训练方法、装置、电子设备及存储介质 |
US20210233099A1 (en) * | 2020-01-27 | 2021-07-29 | Hewlett Packard Enterprise Development Lp | Systems and methods for monetizing data in decentralized model building for machine learning using a blockchain |
CN113298525A (zh) * | 2021-06-30 | 2021-08-24 | 立信(重庆)数据科技股份有限公司 | 基于区块链的数据资产交易方法 |
CN113393225A (zh) * | 2021-06-30 | 2021-09-14 | 杭州链网科技有限公司 | 数字货币加密支付方法及系统 |
CN113469152A (zh) * | 2021-09-03 | 2021-10-01 | 腾讯科技(深圳)有限公司 | 相似视频检测方法及装置 |
CN113918714A (zh) * | 2021-09-29 | 2022-01-11 | 北京百度网讯科技有限公司 | 一种分类模型训练方法、聚类方法及电子设备 |
-
2022
- 2022-01-24 CN CN202210076773.2A patent/CN114090962B/zh active Active
Patent Citations (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200184278A1 (en) * | 2014-03-18 | 2020-06-11 | Z Advanced Computing, Inc. | System and Method for Extremely Efficient Image and Pattern Recognition and Artificial Intelligence Platform |
CN109146645A (zh) * | 2018-09-05 | 2019-01-04 | 深圳正品创想科技有限公司 | 基于区块链的商品推荐方法、区块链节点及系统 |
US20200184448A1 (en) * | 2018-12-10 | 2020-06-11 | International Business Machines Corporation | Cognitive blockchain for customized interchange determination |
CN110113388A (zh) * | 2019-04-17 | 2019-08-09 | 四川大学 | 一种基于改进型聚类算法的区块链系统共识的方法和装置 |
US20200342014A1 (en) * | 2019-04-29 | 2020-10-29 | American Express Travel Related Services Company, Inc. | Data indexing system using dynamic tags |
CN110110498A (zh) * | 2019-05-10 | 2019-08-09 | 中南大学 | 一种基于联盟链的数字版权确权方法与系统 |
CN110490330A (zh) * | 2019-08-16 | 2019-11-22 | 安徽航天信息有限公司 | 一种基于区块链的分布式机器学习系统 |
US20210233099A1 (en) * | 2020-01-27 | 2021-07-29 | Hewlett Packard Enterprise Development Lp | Systems and methods for monetizing data in decentralized model building for machine learning using a blockchain |
CN111553744A (zh) * | 2020-05-08 | 2020-08-18 | 深圳前海微众银行股份有限公司 | 联邦产品推荐方法、装置、设备及计算机存储介质 |
CN111460323A (zh) * | 2020-06-17 | 2020-07-28 | 腾讯科技(深圳)有限公司 | 基于人工智能的焦点用户挖掘方法和装置 |
CN112104892A (zh) * | 2020-09-11 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种多媒体信息处理方法、装置、电子设备及存储介质 |
CN112015825A (zh) * | 2020-10-22 | 2020-12-01 | 支付宝(杭州)信息技术有限公司 | 基于区块链的模型登记方法、装置及电子设备 |
CN112801827A (zh) * | 2020-10-29 | 2021-05-14 | 西安纸贵互联网科技有限公司 | 一种基于区块链的知识产权管理系统 |
CN112464179A (zh) * | 2020-11-26 | 2021-03-09 | 浙江传媒学院 | 一种基于区块链与表情识别的短视频版权存储算法 |
CN112597300A (zh) * | 2020-12-15 | 2021-04-02 | 中国平安人寿保险股份有限公司 | 文本聚类方法、装置、终端设备及存储介质 |
CN112487103A (zh) * | 2020-12-25 | 2021-03-12 | 昆明理工大学 | 一种基于区块链智能合约的深度学习数据集可信共享系统 |
CN112989186A (zh) * | 2021-02-25 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 资讯信息推荐模型训练方法、装置、电子设备及存储介质 |
CN113298525A (zh) * | 2021-06-30 | 2021-08-24 | 立信(重庆)数据科技股份有限公司 | 基于区块链的数据资产交易方法 |
CN113393225A (zh) * | 2021-06-30 | 2021-09-14 | 杭州链网科技有限公司 | 数字货币加密支付方法及系统 |
CN113469152A (zh) * | 2021-09-03 | 2021-10-01 | 腾讯科技(深圳)有限公司 | 相似视频检测方法及装置 |
CN113918714A (zh) * | 2021-09-29 | 2022-01-11 | 北京百度网讯科技有限公司 | 一种分类模型训练方法、聚类方法及电子设备 |
Non-Patent Citations (2)
Title |
---|
唐俊杰: "区块链技术在出版产业的应用展望", 《中国编辑》 * |
杨谊等: "标签相关度加权的协同过滤个性化推荐算法", 《现代计算机》 * |
Also Published As
Publication number | Publication date |
---|---|
CN114090962B (zh) | 2022-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111401558B (zh) | 数据处理模型训练方法、数据处理方法、装置、电子设备 | |
US10521505B2 (en) | Cognitive mediator for generating blockchain smart contracts | |
CN111816252B (zh) | 一种药物筛选方法、装置及电子设备 | |
US10528800B2 (en) | Automated facial recognition detection | |
CN115511501A (zh) | 一种数据处理方法、计算机设备以及可读存储介质 | |
US20200167427A1 (en) | Training an artificial intelligence to generate an answer to a query based on an answer table pattern | |
CN112070608B (zh) | 信息处理方法、装置、介质及电子设备 | |
CN110929806B (zh) | 基于人工智能的图片处理方法、装置及电子设备 | |
US20210383205A1 (en) | Taxonomy Construction via Graph-Based Cross-domain Knowledge Transfer | |
US11341179B1 (en) | Media authenticity analysis service | |
CN109979439B (zh) | 基于区块链的语音识别方法、装置、介质及电子设备 | |
US20220284069A1 (en) | Entity validation of a content originator | |
Verma et al. | Web application implementation with machine learning | |
CN109543068A (zh) | 用于生成视频的评论信息的方法和装置 | |
Hossain et al. | Collaborative analysis model for trending images on social networks | |
US11321397B2 (en) | Composition engine for analytical models | |
CN110555482A (zh) | 基于人工智能的低俗图片识别方法、装置及电子设备 | |
CN114090962B (zh) | 一种基于大数据的智能出版系统及方法 | |
CN113362852A (zh) | 一种用户属性识别方法和装置 | |
WO2022188599A1 (en) | Selective redaction of images | |
JP7236501B2 (ja) | 文書類似度学習に基づくディープラーニングモデルの転移学習方法およびコンピュータ装置 | |
CN113762040B (zh) | 视频识别方法、装置、存储介质及计算机设备 | |
CN115168609A (zh) | 一种文本匹配方法、装置、计算机设备和存储介质 | |
CN111125301B (zh) | 文本方法及装置、电子设备和计算机可读存储介质 | |
CN112669000A (zh) | 政务事项处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |