CN113568978A - 一种基于区块链中双链技术的数据共享系统及方法 - Google Patents
一种基于区块链中双链技术的数据共享系统及方法 Download PDFInfo
- Publication number
- CN113568978A CN113568978A CN202110877562.4A CN202110877562A CN113568978A CN 113568978 A CN113568978 A CN 113568978A CN 202110877562 A CN202110877562 A CN 202110877562A CN 113568978 A CN113568978 A CN 113568978A
- Authority
- CN
- China
- Prior art keywords
- chain
- module
- task
- data
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012549 training Methods 0.000 claims abstract description 74
- 238000012795 verification Methods 0.000 claims abstract description 40
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims abstract description 9
- 238000012360 testing method Methods 0.000 claims description 12
- 238000013527 convolutional neural network Methods 0.000 claims description 7
- 238000013524 data verification Methods 0.000 claims description 6
- 201000010099 disease Diseases 0.000 claims description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 4
- 239000002699 waste material Substances 0.000 abstract description 3
- 238000013500 data storage Methods 0.000 abstract description 2
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 7
- 238000009434 installation Methods 0.000 description 5
- HPTJABJPZMULFH-UHFFFAOYSA-N 12-[(Cyclohexylcarbamoyl)amino]dodecanoic acid Chemical compound OC(=O)CCCCCCCCCCCNC(=O)NC1CCCCC1 HPTJABJPZMULFH-UHFFFAOYSA-N 0.000 description 3
- 241000607479 Yersinia pestis Species 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 241001478315 Candidatus Liberibacter asiaticus Species 0.000 description 1
- 235000005976 Citrus sinensis Nutrition 0.000 description 1
- 240000002319 Citrus sinensis Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于区块链中双链技术的数据共享系统及方法,该系统包括资源链模块与任务链模块,资源链模块包括:数据上传模块,数据特征提取模块和数据判断验证模块;任务链模块包括:任务发布模块,模型训练模块,模型共识模块,模型存储模块;本方法中的资源链模块与任务链模块使用不同的共识算法,资源链模块使用拜占庭算法进行数据存储,实现数据共享、激励机制和版权保护;任务链模块将区块链中的POW算力用来进行基于大数据的深度学习模型训练,降低了成本,节约了社会资源,将算力用到有意义的工作上;任务链读取资源链上的数据,资源链加载任务链信息,双链即独立又统一。数据存好、用好、循环好,有效解决数据共享与算力浪费问题。
Description
技术领域
本发明涉及区块链技术领域,尤其涉及一种基于区块链中双链技术的数据共享系统及方法。
背景技术
区块链是最近比较时兴的一项技术,它采用分布式的存储,利用块链式数据结构来验证与存储数据,利用分布式节点共识算法来生成和更新数据,利用密码学的方式保证数据传输和访问的安全,利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新分布式基础架构与计算范式。
在智慧农业中,涉及到许多病虫害数据的分类任务,要想获得较高的分类精确度,病虫害图片的数量是一个很关键因素,因此病虫害图片数据具有较高的研究与利用价值,但是目前由于缺少有效激励机制以及版权问题,一般的个人或者机构不愿意数据共享,数据共享度低;另一方面,现有的区块链技术所采用计算哈希的工作量证明(Proof Of Work,POW)共识算法,造成了极大的算力浪费。
发明内容
有鉴于此,本发明提出一种基于区块链中的双链技术的数据共享系统及方法,以解决数据共享程度低以及存在的数据版权问题,同时也解决算力浪费问题,节省社会资源。
第一方面,提供了一种基于区块链中双链技术的数据共享系统,包括资源链模块与任务链模块, 其中,
资源链模块:用于数据上传与存储,包含数据上传模块,数据特征提取模块,数据判断验证模块;
任务链模块:用于发布训练任务,进行任务训练以及模型提交验证,包含任务发布模块,模型训练模块,模型共识模块,模型存储模块。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据上传模块,用户使用电脑或者手机将图片数据上传至客户端服务器中,并进行暂时存储,等待后续数据验证,其中的客户端服务器是Linux服务器。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据特征提取模块,用于对上传的图片运用深度卷积神经网络进行特征提取。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的资源链模块中的数据判断验证模块,运用拜占庭算法,验证提交的图片是否是新图片(数据)。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的任务发布模块,用于管理员发布模型训练任务,等待节点进行模型训练。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型训练模块,各节点读取任务中的数据的地址,根据地址从资源链模块中获取训练图像,利用自己的算力进行线下模型训练。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型共识模块,基于POW共识机制原理,当节点训练过程中准确率超过阈值a时,将模型存储到缓冲数据库中并广播模型存储地址,等待其他子节点的读取和验证,验证通过则将模型信息写入区块中,并给与奖励,否则验证不成功则继续训练。
进一步,所述的一种基于区块链中双链技术的数据共享系统中,所述的任务链模块中的模型存储模块,将验证成功的模型信息存储在区块链的区块中,并将验证成功的模型文件存储在Hadoop中。
第二方面,提供了一种基于区块链中双链技术的数据共享方法,包括资源链上链过程以及任务链上链过程,其中资源链上链过程包括如下步骤:
S101)数据上传:用户使用手机或者电脑提交图片数据到资源服务器,在上传图片同时用户需要选择图片所属类别,所述的类别包括作物种类和疾病种类两类,然后将图片暂时存储在客户端上,其中客户端是一台服务器, 下称客户端。
S102)数据验证,数据上传模块内置了二分类模型,可以对用户上传的图片进行初步判断,如果图片属于用户上传图片时选择的类别则验证通过,进行S103)操作,否则验证失败返回失败信息。
S103) 特征提取:将验证通过的图片使用卷积神经网络进行特征提取,形成唯一图片ID,其中图片ID为提取后的图像特征。
S104)提交上链请求:系统使用拜占庭算法进行广播和验证,具体包含如下步骤:
S104.1)客户端向资源链主节点发送验证请求:客户端将图像ID广播至资源链主节点,其中资源链主节点就是资源链服务器。
S104.2)资源链主节点将验证请求和图像ID广播至所有资源链子节点,其中资源链子节点是资源链中除主节点服务器外的其他服务器。
S104.3)所有资源链子节点都执行验证请求,并将结果发回客户端,具体步骤如下:
SA1)资源链子节点将区块链上的区块数据下载到本地,将新图ID与区块中的图片ID进行余弦相似度比较;
SA2)若ID相似度超过阈值b则说明该图片已经存储在区块链上,返回“验证不通过”信息,若余弦相似度小于阈值b时,返回“验证通过”信息。
S104.4)客户端需要等待不低于(n-1)/3 个资源链子节点发回“验证通过”的结果,作为上链依据,其中n为系统中所有节点的个数。
S104.5) 由资源链中心节点将该图片ID,写入区块中并给予图片上传用户积分奖励A1,所述的上传用户即为同过手机或者电脑上传图片至客户端的用户。
进一步,所述的一种基于区块链中双链技术的数据共享方法中,所述的任务链上链过程包括如下步骤:
S201)提交训练任务:区块链中的任务链中心节点随机选择数量为c的图片,形成任务文件,然后将任务广播到区块链中的任务链子节点。
S202) 模型训练:子节点接受到训练任务后,加载任务文件中的图片地址从Hadoop中下载图片,形成训练集,然后使用AutoML对其进行训练,不断调整模型类别和参数,直至模型在测试集上准确率超过阈值d,如果训练集或者测试集中包含用户上传的图片,则给予用户积分奖励A2。
S203)模型共识:当某一任务链节点训练的模型在测试集上的准确率超过阈值d时,如任务链子节点e,会对整个网络进行广播,并将训练好的模型存储在Hadoop中,等待任务链其他子节点验证:子节点将模型在测试集上进行验证,如果准确率超过阈值d,则返回成功信息,如果没有则返回失败信息。
S204)模型存储:如果返回成功信息的数量多于f,则任务链子节点e将模型信息写入区块链中并获得一定的奖励A3,用户的总积分是上述A1、A2、A3积分的总和,总积分可以换取商品或者获取更多数据的下载权限或者是其他订阅服务。
进一步,所述步骤S202)模型训练中所述的AutoML模型训练方式,使用基于谷歌TensorFlow的AutoKeras进行模型训练工作。
本发明的有益效果是:
(1)通过积分机制,激励用户上传数据,实现数据共享,解决了深度学习过程中数据集少而导致的模型训练准确率不高的问题;
(2)对上传的数据进行验证,解决数据共享中的版权问题,保护了用户切身利益;
(3)运用POW算力用来进行大数据的深度学习模型训练,降低了成本,节约了社会资源,将算力用到有意义的工作上,有效解决算力浪费问题;
(4)任务链读取资源链上的数据,资源链可以加载任务链信息,双链即独立又统一,实现了数据存好、数据用好、数据循环好。
附图说明
图1 是本发明实施例中提供的基于区块链中双链技术的数据共享系统的系统总模块图;
图2是本发明实施例中提供的基于区块链中双链技术的数据共享方法中资源链上链流程图;
图3是本发明实施例中提供的基于区块链中双链技术的数据共享方法中任务链上链流程图;
图4是本发明实施例中提供的基于区块链中双链技术的数据共享方法中资源链区块结构图;
图5是本发明实施例中提供的基于区块链中双链技术的数据共享方法中任务链区块结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例中,一种基于区块链中双链技术的数据共享系统,图1示出了本发明实施例提供的基于区块链中双链技术的数据共享系统及方法系统总模块图。
参照图1,该系统包括资源链模块11与任务链模块12。
资源链模块11:用于数据上传与存储,包含数据上传模块,数据特征提取模块,数据判断验证模块。
数据上传模块,用户使用电脑或者手机将图片数据上传至客户端服务器中,并进行暂时存储,等待后续数据验证,其中的客户端服务器是Linux服务器,安装在服务器上使用JAVA WEB开发,负责将用户上传的图片进行接受并暂时存储在MySQL数据库中,同时可以调用超级账本中心节点完成数据上传到区块链的操作,同时安装有Python解释器和卷积神经网络算法进行二分类识别,卷积神经网络使用ResNet。
数据特征提取模块,用于对上传的图片运用深度卷积神经网络进行特征提取,安装有训练好的ResNet101模型,最后全连接层修改为128个神经元,负责输出图像特征,其中训练使用的数据来源于PlantVillage数据集,使用TensorFlow实现ResNet101模型并将最后一层的Softmax激活函数去除并把最后一层神经元从1000修改为128最后输出1x128维向量,向量中的每个数值保留两位小数并归一化为0-1之间,首位以此链接形成图片ID,至此ResNet101作为植物图片特征提取器。
数据判断验证模块,运用拜占庭算法,验证提交的图片是否是新图片(数据)。
任务链模块12:用于发布训练任务,进行任务训练以及模型提交验证,包含任务发布模块,模型训练模块,模型共识模块,模型存储模块。
任务发布模块,用于管理员发布模型训练任务,等待节点进行模型训练。
模型训练模块,各节点读取任务中的数据的地址,根据地址从资源链模块中获取训练图像,利用自己的算力进行线下模型训练。
模型共识模块,基于POW共识机制原理,当节点训练过程中准确率超过阈值a时,将模型存储到缓冲数据库中并广播模型存储地址,等待其他子节点的读取和验证,验证通过则将模型信息写入区块中,并给与奖励,否则验证不成功则继续训练。
模型存储模块,将验证成功的模型信息存储在区块链的区块中,并将验证成功的模型文件存储在Hadoop中。
对应于上文实施例所述的基于区块链中双链技术的数据共享系统的系统总模块图,本发明提供一种基于区块链中双链技术的数据共享方法,包括资源链上链过程与任务链上链过程。
参照图2,资源链上链过程包括如下步骤:
S101)数据上传:如图2中的21所示,用户使用手机或者电脑提交图片数据到客户端服务器,下称客户端,客户端安装的JAVA WEB和MySQL环境,用于获取用户上传的图片数据和类别选项,其中类别选项为包括作物种类和疾病种类两类,如脐橙,黄龙病,果实部位,上传的图片数据和类别选项暂时存储在客户端上,
S102)数据验证:如图2中的22所示,数据上传模块内置了二分类模型,可以对用户上传的图片进行初步判断,如果图片属于用户上传图片时选择的类别则验证通过,具体过程为将暂存的图片数据输入到训练好的ResNet二分类模型中,得出该图片是否与用户选择的类别选项已知,如果一致则等进行S103)操作如果不一致则返回错误信息,否则验证失败返回失败信息,让用户重新上传。
S103) 特征提取:如图2中的23所示,将验证通过的图片使用卷积神经网络进行特征提取,形成唯一图片ID,其中图片ID为提取后的图像特征。
S104)提交上链请求:系统使用拜占庭算法进行广播和验证,具体包含如下步骤:
S104.1)客户端向资源链主节点发送验证请求:如图2中的24.1所示,首先客户端使用超级账本提供的SDK将把上链请求发送到区块链节点上,其中上链请求中包含图像ID,时间戳,以往数据的哈希值,中心节点会把上链请求和智能合约发送至资源链主节点,其中资源链主节点就是资源链服务器。
S104.2)如图2中的24.2所示,资源链主节点将验证请求和图像ID广播至所有资源链子节点,其中资源链子节点是资源链中除主节点外的其他节点。
S104.3)如图2中的24.3所示,所有资源链子节点都执行验证请求,并将结果发回客户端,具体步骤如下:
SA1)资源链子节点将区块链上的区块数据下载到本地,将新图ID与区块中的图片ID进行余弦相似度比较;
SA2)若ID相似度超过阈值b则说明该图片已经存储在区块链上,返回“验证不通过”信息,若余弦相似度小于阈值b时,返回“验证通过”信息。
所述的阈值b的取值范围为0到1,越接近1说明新图片与区块中已有的某一张图片越相似,则不同意上链,此实施例中b取值为0.6。
S104.4)如图2中的24.4所示客户端需要等待不低于(n-1)/3 个资源链子节点发回“验证通过”的结果,作为上链依据,其中n为系统中所有节点的个数。
S104.5) 如图2中的24.5所示,由资源链中心节点将该图片ID,写入区块中并给予图片上传用户积分奖励A1,所述的上传用户即为同过手机或者电脑上传图片至客户端的用户。
图4示出了本发明实施例中提供的基于区块链中双链技术的数据共享方法中资源链区块结构图。用户的ID和图片ID会写入资源链区块体中,并会生成数据的哈希值,确保数据不会被篡改。
参照图3,任务链上链过程包括如下步骤:
S201)提交训练任务:如图3中的31所示,区块链中的任务链中心节点随机选择数量为c的图片,此实施例中c取值5000,c的值根据节点算力和已有的图片数量进行动态调整,选取出来的图片形成任务文件,然后将任务广播到区块链中的任务链子节点。
所述的c的值根据节点算力和已有图片数量进行动态调整,即节点使用英伟达显卡进行计算,全部节点的算力总和代表集群的计算能力,动态调整图片数量使训练时间维持在15分钟左右。
S202) 模型训练:如图3中的32所示,子节点接受到训练任务后,加载任务文件中的图片地址从Hadoop中下载图片,形成训练集,然后使用AutoML对其进行训练,不断调整模型类别和参数,直至模型在测试集上准确率超过阈值d,如果训练集或者测试集中包含用户上传的图片,则给予用户积分奖励A2。
所述的AutoML 模型训练方式,使用基于谷歌TensorFlow的AutoKeras进行模型训练工作。
S203)模型共识:如图3中的33所示,当某一任务链节点训练的模型在测试集上的准确率超过阈值d时,如任务链子节点e,会对整个网络进行广播,并将训练好的模型存储在Hadoop中,等待任务链其他子节点验证:子节点将模型在测试集上进行验证,如果准确率超过阈值d,则返回成功信息,如果没有则返回失败信息。
所述的阈值d会根据所选图片质量进行动态调整,此实施例中设置为0.8。如果最快训练完成节点训练时间小于15分钟,则下次任务的d设置为:此次训练实际与15分钟相比,每少1分钟d值增加0.01,不满1分钟按照1分钟算,最高0.95;如果最快训练完成节点训练完成时间超过15分钟,则下次任务的d取值为:此次训练实际与15分钟相比,每多1分钟d值减少0.01,不满1分钟按照1分钟算,最低0.65;如果某次设置阈值为0.65,节点最快训练完成时间超过30分钟或者30分钟内无节点报告训练完成,则此次任务失效重新选择图片进行任务分发与训练。
S204)模型存储:如图3中的34所示,如果返回成功信息的数量多于f,则任务链子节点e将模型信息写入区块链中并获得一定的奖励A3,用户的总积分是上述A1、A2、A3积分的总和,总积分可以换取商品或者获取更多数据的下载权限或者是其他订阅服务。
图5示出了本发明实施例中提供的基于区块链中双链技术的数据共享方法中任务链区块结构图。用户的ID、任务ID和模型地址会写入任务链区块体中,并会生成数据的哈希值,确保数据不会被篡改。
本发明实施例中基于区块链中双链技术的数据共享方法,每个节点上安装“算力应用组件包”,其中“算力应用组件包”中包含有英伟达CUDA安装文件、CUDNN 深度学习训练驱动、Python3.6安装文件、TensorFlow的GPU版本安装包以及快速安装脚本。用户双击快速安装脚本,电脑会首先安装CUDA然后将CUDNN复制到CUDA根目录下,然后安装Python3.6然后安装TensorFlow的GPU 版本,最后安装一些必要的Python第三方库比如pyhdfs操作Hadoop文件系统,全部安装成果后等待任务链发放任务。谷歌TensorFlow的AutoKeras工具,在安装上述“算力应用组件包”时同时安装。
Claims (6)
1.一种基于区块链中双链技术的数据共享系统,其特征在于,包括资源链模块与任务链模块;
资源链模块:用于数据上传与存储,包含数据上传模块,数据特征提取模块,数据判断验证模块;
任务链模块:用于发布训练任务,进行任务训练以及模型提交验证,包含任务发布模块,模型训练模块,模型共识模块,模型存储模块。
2.根据权利要求1所述的一种基于区块链中双链技术的数据共享系统,其特征在于,所述的资源链模块中的数据上传模块,用户使用电脑或者手机将图片数据上传至客户端服务器中,并进行暂时存储,等待后续数据验证,上述客户端服务器是Linux服务器;
所述的资源链模块中的数据特征提取模块,用于对上传的图片运用深度卷积神经网络进行特征提取;
所述的资源链模块中的数据判断验证模块,运用拜占庭算法,验证提交的图片是否是新图片(数据)。
3.根据权利要求1所述的一种基于区块链中双链技术的数据共享系统,其特征在于,
所述的任务链模块中的任务发布模块,用于管理员发布模型训练任务,等待节点进行模型训练;
所述的任务链模块中的模型训练模块,各节点读取模型训练任务中的数据的地址,根据地址从资源链模块中获取训练图像,利用自己的算力进行线下模型训练;
所述的任务链模块中的模型共识模块,基于工作量证明(Proof Of Work, POW)共识机制原理,当某一节点训练过程中准确率超过阈值a时,将模型存储到缓冲数据库中并广播模型存储地址,等待其他子节点的读取和验证,验证通过则将模型信息写入区块中,并给与奖励,否则验证不成功则继续训练;
所述的任务链模块中的模型存储模块,将验证成功的模型信息存储在区块链的区块中,并将验证成功的模型文件存储在Hadoop中。
4.一种基于区块链中双链技术的数据共享方法,其特征在于包含资源链上链过程与任务链上链过程,其中资源链上链过程包括如下步骤:
401)数据上传:用户使用手机或者电脑提交图片数据到资源服务器,在上传图片同时用户需要选择图片所属类别,所述的类别包括作物种类和疾病种类两类,然后将图片暂时存储在客户端上,其中客户端是一台服务器,下称客户端;
402)数据验证:数据上传模块内置了二分类模型,可以对用户上传的图片进行初步判断,如果图片属于用户上传图片时选择的类别则验证通过,进行403)操作,否则验证失败返回失败信息;
403)特征提取:将验证通过的图片使用卷积神经网络进行特征提取,形成唯一图片ID,其中图片ID为提取后的图像特征;
404)提交上链请求:系统使用拜占庭算法进行广播和验证,具体包含如下步骤:
404.1)客户端向资源链主节点发送验证请求:客户端将图像ID发送至资源链主节点,其中资源链主节点就是资源链服务器;
404.2)资源链主节点将验证请求和图像ID广播至所有资源链子节点,其中资源链子节点是资源链中除主节点服务器外的其他服务器;
404.3)所有资源链子节点都执行验证请求,并将结果发回客户端,具体步骤如下:
S1)资源链子节点将区块链上的区块数据下载到本地,将新图片ID与区块中的图片ID进行余弦相似度比较;
S2)若ID相似度超过阈值b 则说明该图片已经存储在区块链上,返回“验证不通过”信息,若余弦相似度小于阈值b时,返回“验证通过”信息;
404.4)客户端需要等待不低于(n-1)/3个资源链子节点发回“验证通过”的结果,作为上链依据,其中n为系统中所有节点的个数;
404.5)由资源链中心节点将该图片ID,写入区块中并给予图片上传用户积分奖励A1,所述的上传用户即为同过手机或者电脑上传图片至客户端的用户。
5.根据权利要求4所述的一种基于区块链中双链技术的数据共享方法,其特征在于,所述的任务链上链过程包括如下步骤:
501)提交训练任务:区块链中的任务链中心节点随机选择数量为c的图片,形成任务文件,然后将任务广播到区块链中的任务链子节点;
502)模型训练:子节点接受到训练任务后,加载任务文件中的图片地址从Hadoop中下载图片,形成训练集,然后使用AutoML对其进行训练,不断调整模型类别和参数,直至模型在测试集上准确率超过阈值d,如果训练集或者测试集中包含用户上传的图片,则给予用户积分奖励A2;
503)模型共识:当某一任务链节点训练的模型在测试集上的准确率超过阈值d时,如任务链子节点e,会对整个网络进行广播,并将训练好的模型存储在Hadoop中,等待任务链其他子节点验证:子节点将模型在测试集上进行验证,如果准确率超过阈值d,则返回成功信息,如果没有则返回失败信息;
504)模型存储:如果返回成功信息的数量多于f,则任务链子节点e将模型信息写入区块链中并获得一定的奖励A3,用户的总积分是上述A1、A2、A3积分的总和,总积分可以换取商品或者获取更多数据的下载权限或者是其他订阅服务。
6.根据权利要求5所述的一种基于区块链中双链技术的数据共享方法,其特征在于所述的AutoML模型训练方式,使用基于谷歌TensorFlow的AutoKeras进行模型训练工作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110877562.4A CN113568978A (zh) | 2021-08-01 | 2021-08-01 | 一种基于区块链中双链技术的数据共享系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110877562.4A CN113568978A (zh) | 2021-08-01 | 2021-08-01 | 一种基于区块链中双链技术的数据共享系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113568978A true CN113568978A (zh) | 2021-10-29 |
Family
ID=78169815
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110877562.4A Withdrawn CN113568978A (zh) | 2021-08-01 | 2021-08-01 | 一种基于区块链中双链技术的数据共享系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113568978A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113517057A (zh) * | 2021-09-10 | 2021-10-19 | 南通剑烽机械有限公司 | 基于数据表示和神经网络的医疗图像信息识别存储方法 |
CN114268633A (zh) * | 2021-11-01 | 2022-04-01 | 北京交通大学 | 一种以任务驱动的短时区块链系统及方法 |
CN115208665A (zh) * | 2022-07-15 | 2022-10-18 | 河南农业大学 | 一种基于区块链的种质资源数据安全共享方法及系统 |
-
2021
- 2021-08-01 CN CN202110877562.4A patent/CN113568978A/zh not_active Withdrawn
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113517057A (zh) * | 2021-09-10 | 2021-10-19 | 南通剑烽机械有限公司 | 基于数据表示和神经网络的医疗图像信息识别存储方法 |
CN114268633A (zh) * | 2021-11-01 | 2022-04-01 | 北京交通大学 | 一种以任务驱动的短时区块链系统及方法 |
CN114268633B (zh) * | 2021-11-01 | 2022-11-18 | 北京交通大学 | 一种以任务驱动的短时区块链系统及方法 |
CN115208665A (zh) * | 2022-07-15 | 2022-10-18 | 河南农业大学 | 一种基于区块链的种质资源数据安全共享方法及系统 |
CN115208665B (zh) * | 2022-07-15 | 2023-05-05 | 河南农业大学 | 一种基于区块链的种质资源数据安全共享方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113568978A (zh) | 一种基于区块链中双链技术的数据共享系统及方法 | |
CN110782042B (zh) | 横向联邦和纵向联邦联合方法、装置、设备及介质 | |
JP6883111B2 (ja) | イベント駆動型ブロックチェーンワークフロー処理 | |
CN111949395B (zh) | 基于区块链的共享算力数据处理方法、系统及存储介质 | |
CN108492108A (zh) | 区块链跨链通信方法、系统和计算机可读存储介质 | |
CN109951547B (zh) | 事务请求并行处理方法、装置、设备和介质 | |
CN107870845A (zh) | 面向微服务架构应用的管理方法及系统 | |
CN111861482B (zh) | 一种区块链对账方法和系统 | |
CN109063049B (zh) | 一种区块链网络的账号处理方法、装置、设备及存储介质 | |
WO2020082611A1 (zh) | 基于区块链平台进行深度学习的方法、电子装置 | |
CN112527912B (zh) | 基于区块链网络的数据处理方法、装置及计算机设备 | |
CA3106991A1 (en) | Task completion using a blockchain network | |
CN111275448A (zh) | 人脸数据处理方法、装置和计算机设备 | |
CN110033373A (zh) | 区块链中背书的装置、方法及存储介质 | |
CN111460394A (zh) | 一种版权文件的验证方法、装置及计算机可读存储介质 | |
CN113867782A (zh) | 灰度发布方法、装置、计算机设备和存储介质 | |
CN115297008B (zh) | 基于智算网络的协同训练方法、装置、终端及存储介质 | |
CN115358401A (zh) | 一种推理服务的处理方法、装置、计算机设备及存储介质 | |
CN113420323B (zh) | 数据共享方法及终端设备 | |
CN113873004A (zh) | 一种任务执行方法和装置以及分布式计算系统 | |
CN111951112A (zh) | 基于区块链的智能合约执行方法、终端设备和存储介质 | |
CN115633034A (zh) | 一种跨集群的资源调度方法、装置、设备及存储介质 | |
CN113628052A (zh) | 基于预言机的区块链资产与合约处理方法、系统及装置 | |
CN113537504A (zh) | 一种基于边缘节点的迁移学习方法、装置与系统 | |
CN111949394B (zh) | 一种共享算力资源的方法、系统及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211029 |