CN114677563A - 基于区块链的神经网络在线学习方法及系统 - Google Patents
基于区块链的神经网络在线学习方法及系统 Download PDFInfo
- Publication number
- CN114677563A CN114677563A CN202210363411.1A CN202210363411A CN114677563A CN 114677563 A CN114677563 A CN 114677563A CN 202210363411 A CN202210363411 A CN 202210363411A CN 114677563 A CN114677563 A CN 114677563A
- Authority
- CN
- China
- Prior art keywords
- medical image
- training set
- initial
- trained
- feature matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 38
- 239000011159 matrix material Substances 0.000 claims abstract description 110
- 238000012549 training Methods 0.000 claims abstract description 99
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 10
- 230000005856 abnormality Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 235000009508 confectionery Nutrition 0.000 claims description 2
- 238000009826 distribution Methods 0.000 description 7
- 230000003902 lesion Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012360 testing method Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000013101 initial test Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/27—Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及神经网络在线学习技术领域,具体涉及一种基于区块链的神经网络在线学习方法及系统。方法包括:根据区块链上存储的训练好的初始DNN网络,得到初始训练集中各医疗图像对应的特征矩阵以及准确率;计算期望特征矩阵;得到待训练数据集中各医疗图像对应的特征矩阵以及准确率;根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵,计算初始训练集中各医疗图像对应的关注程度;判定其是否大于设定关注程度阈值,若大于,则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络,并存储在区块链上。本发明根据初始训练集中各医疗图像的关注程度,得到一个新的训练集对DNN网络进行更新和训练,使DNN网络能够快速收敛。
Description
技术领域
本发明涉及神经网络在线学习技术领域,具体涉及一种基于区块链的神经网络在线学习方法及系统。
背景技术
随着医疗技术的不断进步,医疗图像数据已成为病情诊断和疾病治疗的重要分析数据。同时,伴随着人工智能技术的发展,利用神经网络来分析处理图像数据已成为数据分析领域的发展趋势。
但是由于医疗图像数据的标注需要专业人士来完成,因此数据集难以获取并且数量少。又由于不同医院之间很难大规模的共享数据集,导致每个医院利用自身数据集训练的神经网络准确率低,容易出现过拟合或欠拟合的问题。而现有的联邦学习方法或者其他方法给出了一种在医院不共享数据集的情况下利用所有医院的数据集的特征训练一个准确的神经网络的方法。不过随着新的图像数据被标注标签,新的数据集不断产生,数据集规模不断变大,此时需要用新的数据集去重新训练之前旧的神经网络的参数。
现有技术存在以下缺陷:现有的方法是将新的数据集和之前的旧的数据集作为一个大的数据集在旧的神经网络上进行参数的重新训练,但是这种方法需要所有旧的数据集参与训练,没有充分利用神经网络已经学习到的特征,导致网络重新训练时收敛的慢。
发明内容
为了解决上述技术问题,本发明的目的在于提供一种基于区块链的神经网络在线学习方法及系统,所采用的技术方案具体如下:
第一方面,本发明一个实施例提供了一种基于区块链的神经网络在线学习方法及系统,该方法包括以下步骤:
根据区块链上存储的训练好的初始DNN网络,得到初始训练集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率;
根据初始训练集中各医疗图像对应的特征矩阵以及各特征矩阵对应的准确率,计算期望特征矩阵;
将待训练数据集中各医疗图像输入到所述初始DNN网络的编码器中,得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率;
根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵,计算初始训练集中各医疗图像对应的关注程度;
判定初始训练集中各医疗图像对应的关注程度是否大于设定关注程度阈值,若大于,则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络,并将更新后的DNN网络存储在区块链上。
第二方面,本发明另一个实施例提供了一种基于区块链的神经网络在线学习系统,包括存储器和处理器,所述处理器执行所述存储器存储的计算机程序,以实现上述所述的基于区块链的神经网络在线学习方法。
优选的,所述计算初始训练集中各医疗图像对应的关注程度的方法包括:
根据所述期望特征矩阵、所述待训练数据集中各医疗图像对应的特征矩阵以及对应的准确率,得到各特征矩阵对应的异常程度;
根据所述初始训练集中各医疗图像对应的特征矩阵和所述期望特征矩阵,计算出初始训练集差异;
根据所述初始训练集中各医疗图像对应的特征矩阵和所述待训练数据集中各医疗图像对应的特征矩阵,计算出训练集差异;
根据所述异常程度、初始训练集差异以及训练集差异,计算初始训练集中各医疗图像对应的子关注程度;
将初始训练集中各医疗图像对应的多个子关注程度求和,得到初始训练集中各医疗图像对应关注程度。
优选的,所述子关注程度的计算公式为:
其中,F(f,d)为根据待训练集中医疗图像d计算得到的初始训练集中医疗图像f对应的子关注程度,gd为待训练数据集中医疗图像d对应的异常程度,Ff为初始训练集中医疗图像f对应的特征矩阵,Fd为待训练数据集中医疗图像d对应的特征矩阵,F0为所述期望特征矩阵。
优选的,采用如下计算公式计算所述异常程度:
gd=exp(-αd)||Fd-F0||2
其中,αd为待训练数据集中的医疗图像d在初始DNN网络上的准确率,|| ||2为L2范式。
优选的,所述期望特征矩阵的计算公式为:
αf为初始训练集中医疗图像f在初始DNN网络上对应的准确率,S为初始训练集中医疗图像对应的特征矩阵的集合。
优选的,所述训练好的初始DNN网络是采用联邦学习方法进行训练得到的。
本发明实施例具有如下有益效果:
本发明根据已经训练好的DNN网络获得初始训练集中医疗图像的特征矩阵、特征矩阵对应的准确率和待训练数据集中的特征矩阵,进而计算得到初始训练集中各医疗图像的关注程度,关注程度能够反映的是DNN网络对初始训练集中各医疗图像的特征的学习程度,关注程度越大,说明对初始训练集中医疗图像的特征学习的越差,关注程度越小,说明对初始训练集中医疗图像的特征学习的越差。根据关注程度是否大于设定关注程度阈值来判断将初始训练集中哪些医疗图像与待训练数据集共同用于更新初始DNN网络;使医院在不断产生新的标注数据后,DNN网络能够快速的学习到更多更准确的特征,从而降低欠拟合和过拟合的风险,同时也可以使DNN网络快速的收敛。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例所提供的一种基于区块链的神经网络在线学习方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功能效果,以下结合附图及较佳实施例,对依据本发明提出的一种基于区块链的神经网络在线学习方法及系统进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
由于医疗图像数据的标注需要专业人士来完成,因此数据集难以被获取,并且数量少。又由于不同医院之间很难大规模共享数据集,导致每个医院利用自身数据集训练的神经网络准确率低,容易出现过拟合或欠拟合问题。而现有的联邦学习方法给出了一种在医院不共享数据集的情况下利用所有医院的数据集的特征训练一个准确的神经网络的方法,但是当医院产生新的数据集时,现有的方法使新的数据集与之前旧的数据集共同重新对网络进行训练,这样的方法没有充分利用神经网络已经学习到的特征,导致网络重新训练时收敛的慢,也不利于新的数据集中数据特征的学习。
本发明的在线学习方法主要是在有新的数据集产生时,各医院都能够获取初始DNN网络,并针对性选取初始训练集的部分图像作为样本与新产生的数据集共同更新DNN网络。本发明的主要构思是:根据初始训练集中各医疗图像对应的特征矩阵、特征矩阵对应的准确率以及待训练数据集对应的医疗图像,计算初始训练集中的各图像关注程度,此关注程度的大小决定了旧训练集中的图像是否参与DNN网络的更新,来使DNN网络能够快速收敛,并学习到更多更准确的特征。
下面结合附图具体的说明本发明所提供的一种基于区块链的神经网络在线学习方法及系统的具体方案。
基于区块链的神经网络在线学习方法实施例
如图1所示,本实施例的基于区块链的神经网络在线学习方法包括以下步骤:
步骤S1,根据区块链上存储的训练好的初始DNN网络,得到初始训练集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率。
本实施例初始DNN网络是由所有医院的各自的数据集通过联邦学习的方法训练出来的,其中每个医院的数据集分为训练集和测试集。这个训练好的DNN网络称为训练好的初始DNN网络,每个医院参与该DNN网络训练的训练集称为初始训练集,用于测试该DNN网络准确率的测试集称为初始测试集。
每个医院为新的医疗图像标注了标签,即每个医院拥有了新的数据集,这个数据集的80%作为新的训练集,余下20%作为新的测试集,这个新的训练集称为待训练数据集,这个待训练数据集还没有参与过初始DNN网络的训练。
本实施例中初始DNN网络已经被存储在区块链上,每个医院从区块链上读取出初始DNN网络,将医院的初始训练集中的所有图像数据输入到DNN网络中,获取到DNN网络的编码器输出的所有特征图,我们将特征图称为特征矩阵。
具体来说,该DNN网络的结构是编码器-解码器的结构,这种结构是神经网络设计中的一种重要结构。其中,编码器的作用是对图像进行高维特征的提取和下采样。将图像输入到编码器中,编码器中包含多个卷积层,每个卷积层都会输出一个多通道的特征图,编码器最终输出的一个特征图,该特征图F就是本发明所述的特征矩阵。该特征图F的大小远比输入的图像低,但是该特征图具有较高的通道数,这个特征图包含了图像的高维特征。本实施例的所述DNN网络的任务是对图像进行语义分割,用于获取医疗图像上的病灶区域,因此该特征图F表征的应该是病灶的特征;而在编码器中输出特征图F之前,靠近输入的其他卷积层输出的特征图f,也包含了病灶特征,但是还包含了其他特征;总的来说,特征图f包含的特征多,信息熵大,因此,输入的图像不同,包含的特征也会不同;但是对于特征图F,包含的是高维、更加抽象、信息熵更小的特征,表征的是病灶特征,虽然输入的医疗图像不同,但是这些医疗图像对应的病灶特征不会有太大差别,因此输入不同图像获得的特征图具有相似性。
另外将特征图F输入到解码器中,解码器对特征图F进行上采样,输出一个语义区域,即解码器的作用是将包含特征矩阵的特征图F解码成一个可视化的病灶区域。
每个医院将获取到的所有特征矩阵,以及初始DNN网络在每个医院的初始测试集上的准确率共享并存储到区块链上。
具体来说,对于一个医院a,医院a将初始训练集上的所有医疗图像输入到初始DNN网络后,得到了一个特征矩阵的集合,并将该集合共享出去;同时医院a将初始DNN网络在医院a的初始测试集上的准确率也共享出去。
本实施例选择待训练数据集中医疗图像数量最大的医院,使该医院创建新的区块,然后将所有医院共享出的特征矩阵和准确率存储在新创建区块上,然后将这个区块连接在区块链上。之后给予该医院奖励。作为其他实施方式,也可以指定一家医院进行创建区块,存储数据以及将区块链接到区块链上的工作。
步骤S2,根据初始训练集中各医疗图像对应的特征矩阵以及各特征矩阵对应的准确率,计算期望特征矩阵。
对于一个医院a,医院a读取出存储在区块链上的所有特征矩阵,以及每个特征矩阵对应的准确率,然后根据所有特征矩阵和每个特征矩阵对应的准确率计算出一个质心位置F0,称为期望特征矩阵。
具体期望特征矩阵的计算公式为:
其中,S为所有特征矩阵的集合,Ff为S中的任意一个特征矩阵,这个特征矩阵是将初始训练集中的医疗图像f输入到初始DNN网络的编码器中获得的,其对应的准确率为αf。
其中,特征矩阵Ff是一个三维的矩阵,可以视为高维空间的一个特征点。所有这些特征点的分布表示了初始数据集中病症的分布情况。理想情况下,初始训练集数量足够多,无异常数据并且图像数据分布广泛时,这些特征点应该是集中分布在一起的,原因是本发明所标注的数据集是用不同患者患某种疾病时的医疗图像,这些医疗图像的内容可能并不相同,但是所体现的特征矩阵是相同的。但是由于训练初始DNN网络的数据集不充足,初始训练集中图像数据分布不平衡,例如有的患病情况采集了很多医疗图像,有的患病情况的医疗图像却很少,再加上数据标注异常或者引入异常样本数据,就会导致这些特征点可能是离散分布的,或者说分布不够集中,这可能是由于初始DNN网络过拟合或欠拟合导致的,具体跟初始数据集中的数据分布有关。但是不论是过拟合还是欠拟合,这些特征点的分布依然能够大致确定真实期望的特征矩阵是如何分布的,即能够体现出患病特征的期望值F0是什么,该期望值用于表征理想情况下这些特征点应该集中在哪个值附近。
步骤S3,将待训练数据集中各医疗图像输入到所述初始DNN网络的编码器中,得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率。
对于一个医院a,首先医院a从区块链上读取出初始DNN网络,然后获取医院a的待训练数据集中的一个医疗图像d,将d输入DNN网络的编码器中输出对应的特征矩阵,此对应的特征矩阵称为Fd,同时,得到特征矩阵Fd对应的准确率。
步骤S4,根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵,计算初始训练集中各医疗图像对应的关注程度。
本实施例计算的初始训练集中各医疗图像对应的关注程度是根据待训练医疗图像对应的特征矩阵的异常程度计算得到的,具体的,本实施例根据期望特征矩阵、待训练医疗图像对应的特征矩阵以及对应的准确率,得到各特征矩阵对应的异常程度,本实施例计算特征矩阵的异常程度的公式为:
gd=exp(-αd)||Fd-F0||2
其中,gd表示的是特征矩阵Fd的异常程度,αd表示的是以待训练数据集中的一个图像数据d为测试集时,初始DNN网络在这个数据集上的准确率;||Fd-F0||2表示图像数据d对应的特征矩阵与期望特征矩阵的偏离程度。当αd越小同时||Fd-F0||2越大,则gd越大。造成差异的原因有三种,一是F0的取值有偏差,也就是说计算的所有的特征矩阵分布的期望值不是F0而是其他值,这是由于初始训练集不够好导致的;二是Fd取值有偏差,也就是说把待训练数据集中的一个医疗图像d输入DNN网络中获得的特征矩阵是错误的,说明初始DNN网络没有学到医疗图像d的特征;三是Fd和F0都存在偏差。
本实施例更倾向于第三种原因,因为:一方面是由于F0是根据大量的初始训练集获得的,因此就算有偏差,偏差程度也不会太大,所以不管F0的真实取值是多少,所计算出的F0还是能大致反应特征矩阵该如何分布。另一方面Fd是由医疗图像d获得的,但是初始DNN网络并没有去学习d的特征,而d的特征与初始训练集中的医疗图像存在差异,从而导致Fd出现偏差。
本实施例先假设F0是正确的,利用医疗图像d来更新初始DNN网络的参数,然后更新完初始DNN网络参数后再重新获取F0;通过d取不同的医疗图像迭代更新DNN网络参数和F0,最终使得DNN网络能够学习到正确的合理的符合真实情况的特征。
图像数据d表示的是待训练集中的一张医疗图像,在实际过程中需要使用待训练集的全部数据来为初始训练集中的各医疗图像分配关注程度。
由于在短时间内新数据产生的少,所以需要结合初始训练集,其次是由于初始训练集中有些数据的特征没有被DNN网络正确的学习到,所以需要结合关注程度引入初始训练集中的部分医疗图像,来使训练前后的DNN网络所能提取到的特征保持一致。
关注程度用于表征初始训练集中医疗图像是否需要参与到初始DNN网络的训练之中,本实施例中关注程度是根据待训练数据集中各医疗图像对应的特征矩阵计算得到的,其中,先根据训练数据集中单个医疗图像对应的特征矩阵计算得到的初始训练集中医疗图像对应的子关注程度,然后通过对子关注程度求和的方式计算初始训练集中医疗图像对应的关注程度。
本实施例中子关注程度的计算公式为:
其中,f为初始训练集中的任意一个医疗图像,Ff为f对应的特征矩阵,F(f,d)为在给定待训练数据集的前提下,为f分配的子关注程度。
其中,gd越大说明DNN网络在医疗图像d上提取的特征准确率越低、偏离期望值越远,那么就越需要将医疗图像d和其他医疗图像(比如医疗图像f)结合在一起去引导训练DNN网络来学习医疗图像d的特征。
此外,若越大,表示初始DNN网络越没有学习到特征矩阵Ff和特征矩阵Fd对应的样本的特征,也就是说初始DNN网络就越需要通过更新参数来使得特征矩阵Ff和特征矩阵Fd更加趋近与期望特征矩阵F0,避免DNN网络对这两个特征对应的样本欠拟合;若越小,表示初始DNN网络越可能已经学习到了特征矩阵Ff和特征矩阵Fd对应的样本的特征,也就是说初始DNN网络越不需要通过更新参数来使得特征矩阵Ff和特征矩阵Fd更加趋近与期望特征矩阵F0,避免过拟合。
医院a为区块链上存储的所有特征矩阵获取对应的关注程度之后,将这些关注程度共享出去。同理其他医院也将获取到的关注特征共享出去,通过所有医院共享出的特征矩阵对应的关注程度来看,每个特征矩阵又对应了多个关注程度。选取关注程度之和最大的医院,由于关注程度之和最大,所以说明该医院的待训练数据集的数据特征对初始DNN网络的参数更新具有重要意义;该医院将每个特征矩阵对应的多个关注程度求和,使得到的结果作为每个特征矩阵的最终关注程度。该医院将最终的关注程度存储进新产生的区块中,然后将这个区块连接到区块链上,并给予该医院奖励。
步骤S1和步骤S4所述的决定哪个医院能产生新区块,并将新区块连接到区块链上的过程就是共识机制,这一做法有利于通过奖励激励医院去标注出一些有利于初始DNN网络特征学习的数据集,对DNN网络准确率的提升和表征能力的提升具有重要意义。
步骤S5,判定初始训练集中各医疗图像对应的关注程度是否大于设定关注程度阈值,若大于,则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络,并将更新后的DNN网络存储在区块链上。
具体来说,假设医院a,读取出区块链上存储的每个图像样本对应的关注程度,然后根据关注程度进行判定,若任一医疗图像对应的关注程度大于设定阈值且该医疗图像来自于医院a,则选取该医疗图像与待训练集合并在一起构成一个新的训练集,去更新初始DNN网络。
所有医院利用新的训练集更新训练初始DNN网络的参数,具体方法为:一个医院从区块链上读取出DNN网络的最新的参数,该医院利用其新的训练集更新训练一轮DNN网络的参数,然后将更新后的参数存储在区块上,然后将这个区块连接在区块链上。之后依次选择其他医院来继续读取出DNN网络最新的、最近更新后的参数,然后利用其获取到的新的训练集更新训练一轮DNN网络的参数,并且也将更新后的、最新的参数存储在区块上。不断重复这个过程,直至每个医院都更新训练一轮。将更新后的DNN网络视为初始DNN网络参与后续的计算,重复步骤S2和步骤S3,直至DNN网络收敛;在这个过程中期望特征矩阵F0也会一直在更新变化,当DNN网络收敛时,所有的特征矩阵都会趋近于期望值F0。
本实施例根据已经训练好的DNN网络获得初始训练集中医疗图像的特征矩阵、特征矩阵对应的准确率和待训练数据集中的特征矩阵,进而计算得到初始训练集中各医疗图像的关注程度,根据关注程度是否大于设定关注程度阈值来判断将初始训练集中哪些医疗图像与待训练数据集共同用于更新初始DNN网络;使医院在不断产生新的标注数据后,DNN网络能够快速的学习到更多更准确的特征,从而降低欠拟合和过拟合的风险,同时也可以使DNN网络快速的收敛。
基于区块链的神经网络在线学习系统实施例
本实施例基于区块链的神经网络在线学习系统包括存储器和处理器,所述处理器执行所述存储器存储的计算机程序,以实现上述所述的基于区块链的神经网络在线学习方法。
由于基于区块链的神经网络在线学习方法已经在基于区块链的神经网络在线学习方法实施例中进行了说明,所以本实施例不再对基于区块链的神经网络在线学习方法进行赘述。
需要说明的是:以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于区块链的神经网络在线学习方法,其特征在于,该方法包括以下步骤:
根据区块链上存储的训练好的初始DNN网络,得到初始训练集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率;
根据初始训练集中各医疗图像对应的特征矩阵以及各特征矩阵对应的准确率,计算期望特征矩阵;
将待训练数据集中各医疗图像输入到所述初始DN网络的编码器中,得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率;
根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵,计算初始训练集中各医疗图像对应的关注程度;
判定初始训练集中各医疗图像对应的关注程度是否大于设定关注程度阈值,若大于,则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络,并将更新后的DNN网络存储在区块链上。
2.根据权利要求1所述的基于区块连的神经网络在线学习方法,其特征在于,所述计算初始训练集中各医疗图像对应的关注程度的方法包括:
根据所述期望特征矩阵、所述待训练数据集中各医疗图像对应的特征矩阵以及对应的准确率,得到各特征矩阵对应的异常程度;
根据所述初始训练集中各医疗图像对应的特征矩阵和所述期望特征矩阵,计算出初始训练集差异;
根据所述初始训练集中各医疗图像对应的特征矩阵和所述待训练数据集中各医疗图像对应的特征矩阵,计算出训练集差异;
根据所述异常程度、初始训练集差异以及训练集差异,计算初始训练集中各医疗图像对应的子关注程度;
将初始训练集中各医疗图像对应的多个子关注程度求和,得到初始训练集中各医疗图像对应关注程度。
3.根据权利要求2所述的基于区块链的神经网络在线学习方法,其特征在于,所述子关注程度的计算公式为:
F(f,d)=gd×(||Ff-F0||2+||Ff-Fd||2)
其中,F(f,d)为根据待训练集中医疗图像d计算得到的初始训练集中医疗图像f对应的子关注程度,gd为待训练数据集中医疗图像d对应的异常程度,Ff为初始训练集中医疗图像f对应的特征矩阵,Fd为待训练数据集中医疗图像d对应的特征矩阵,F0为所述期望特征矩阵。
4.根据权利要求3所述的基于区块链的神经网络在线学习方法,其特征在于,采用如下计算公式计算所述异常程度:
gd=exp(-αd)||Fd-F0||2
其中,αd为待训练数据集中的医疗图像d在初始DNN网络上的准确率,|| ||2为L2范式。
6.根据权利要求1所述的基于区块链的神经网络在线学习方法,其特征在于,所述训练好的初始DNN网络是采用联邦学习方法进行训练得到的。
7.一种基于区块链的神经网络在线学习系统,包括存储器和处理器,其特征在于,所述处理器执行所述存储器存储的计算机程序,以实现如权利要求1-6任一项所述的基于区块链的神经网络在线学习方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210363411.1A CN114677563A (zh) | 2022-04-08 | 2022-04-08 | 基于区块链的神经网络在线学习方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210363411.1A CN114677563A (zh) | 2022-04-08 | 2022-04-08 | 基于区块链的神经网络在线学习方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114677563A true CN114677563A (zh) | 2022-06-28 |
Family
ID=82077529
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210363411.1A Pending CN114677563A (zh) | 2022-04-08 | 2022-04-08 | 基于区块链的神经网络在线学习方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114677563A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160093048A1 (en) * | 2014-09-25 | 2016-03-31 | Siemens Healthcare Gmbh | Deep similarity learning for multimodal medical images |
US20180373999A1 (en) * | 2017-06-26 | 2018-12-27 | Konica Minolta Laboratory U.S.A., Inc. | Targeted data augmentation using neural style transfer |
CN109508741A (zh) * | 2018-11-09 | 2019-03-22 | 哈尔滨工业大学 | 基于深度学习筛选训练集的方法 |
US20190122258A1 (en) * | 2017-10-23 | 2019-04-25 | Adbank Inc. | Detection system for identifying abuse and fraud using artificial intelligence across a peer-to-peer distributed content or payment networks |
CN109902202A (zh) * | 2019-01-08 | 2019-06-18 | 国家计算机网络与信息安全管理中心 | 一种视频分类方法及装置 |
CN110843870A (zh) * | 2019-11-21 | 2020-02-28 | 北京交通大学 | 一种非正常事件下高铁路网图定能力保持方法 |
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN111523434A (zh) * | 2020-04-18 | 2020-08-11 | 李亚茹 | 基于区块链与bim的工地人员异常聚集检测系统 |
KR102166371B1 (ko) * | 2020-05-11 | 2020-10-15 | 오한상 | IoT 기반의 인공지능 마케팅 장치 및 방법 |
US20210342427A1 (en) * | 2019-01-18 | 2021-11-04 | Samsung Electronics Co., Ltd. | Electronic device for performing user authentication and operation method therefor |
CN113990454A (zh) * | 2021-10-27 | 2022-01-28 | 河南工程学院 | 基于联邦学习和特征提取的恶意行为识别方法 |
-
2022
- 2022-04-08 CN CN202210363411.1A patent/CN114677563A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160093048A1 (en) * | 2014-09-25 | 2016-03-31 | Siemens Healthcare Gmbh | Deep similarity learning for multimodal medical images |
US20180373999A1 (en) * | 2017-06-26 | 2018-12-27 | Konica Minolta Laboratory U.S.A., Inc. | Targeted data augmentation using neural style transfer |
US20190122258A1 (en) * | 2017-10-23 | 2019-04-25 | Adbank Inc. | Detection system for identifying abuse and fraud using artificial intelligence across a peer-to-peer distributed content or payment networks |
WO2020082732A1 (zh) * | 2018-10-26 | 2020-04-30 | 平安科技(深圳)有限公司 | 图片自动分类方法、装置及计算机可读存储介质 |
CN109508741A (zh) * | 2018-11-09 | 2019-03-22 | 哈尔滨工业大学 | 基于深度学习筛选训练集的方法 |
CN109902202A (zh) * | 2019-01-08 | 2019-06-18 | 国家计算机网络与信息安全管理中心 | 一种视频分类方法及装置 |
US20210342427A1 (en) * | 2019-01-18 | 2021-11-04 | Samsung Electronics Co., Ltd. | Electronic device for performing user authentication and operation method therefor |
CN110843870A (zh) * | 2019-11-21 | 2020-02-28 | 北京交通大学 | 一种非正常事件下高铁路网图定能力保持方法 |
CN111523434A (zh) * | 2020-04-18 | 2020-08-11 | 李亚茹 | 基于区块链与bim的工地人员异常聚集检测系统 |
KR102166371B1 (ko) * | 2020-05-11 | 2020-10-15 | 오한상 | IoT 기반의 인공지능 마케팅 장치 및 방법 |
CN113990454A (zh) * | 2021-10-27 | 2022-01-28 | 河南工程学院 | 基于联邦学习和特征提取的恶意行为识别方法 |
Non-Patent Citations (1)
Title |
---|
陈先来;杨路明;: "基于均矢量相似性的机器学习样本集划分", 中南大学学报(自然科学版), no. 06, 26 December 2009 (2009-12-26) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022057078A1 (zh) | 基于集成知识蒸馏的实时肠镜影像分割方法及装置 | |
CN110675406A (zh) | 基于残差双注意力深度网络的ct图像肾脏分割算法 | |
US8938113B2 (en) | Adaptive visualization for direct physician use | |
CN107292086A (zh) | 图像分析问答 | |
CN111047605B (zh) | 一种脊椎ct分割网络模型的构建方法及分割方法 | |
CN110660484A (zh) | 骨龄预测方法、装置、介质及电子设备 | |
CN111242233B (zh) | 一种基于融合网络的阿尔兹海默病分类方法 | |
CN115036002B (zh) | 一种基于多模态融合模型的治疗效果预测方法及终端设备 | |
CN113011509B (zh) | 肺部支气管的分类方法、装置、电子设备和存储介质 | |
CN112927799A (zh) | 融合多示例学习和多任务深度影像组学的生存期分析系统 | |
CN112381846A (zh) | 一种基于非对称网络的超声甲状腺结节分割方法 | |
CN115035127A (zh) | 一种基于生成式对抗网络的视网膜血管分割方法 | |
CN116884561B (zh) | 基于自监督联合学习的胃部诊断报告生成系统 | |
CN116452592B (zh) | 脑血管病ai认知功能评测模型的构建方法、装置及系统 | |
CN113222975A (zh) | 一种基于改进U-net的高精度视网膜血管分割方法 | |
CN114677563A (zh) | 基于区块链的神经网络在线学习方法及系统 | |
Carrillo-Perez et al. | Synthetic whole-slide image tile generation with gene expression profile-infused deep generative models | |
CN116564458A (zh) | 一种基于电子病历的数据处理方法、系统、设备及介质 | |
CN111209946A (zh) | 三维图像处理方法、图像处理模型训练方法及介质 | |
CN112397195A (zh) | 用于生成体格检查模型的方法、装置、电子设备和介质 | |
CN114519722A (zh) | 一种基于卷积神经网络的颈动脉提取方法 | |
CN113298827B (zh) | 一种基于DP-Net网络的图像分割方法 | |
CN114049315B (zh) | 关节识别方法、电子设备、存储介质及计算机程序产品 | |
CN115659991A (zh) | 一种基于共现关系分层注意力的脑ct医学报告自动生成方法 | |
CN113096086B (zh) | 一种ki67指数确定方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |