CN114677563A

CN114677563A - 基于区块链的神经网络在线学习方法及系统

Info

Publication number: CN114677563A
Application number: CN202210363411.1A
Authority: CN
Inventors: 李燕秋
Original assignee: Individual
Current assignee: Individual
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2022-06-28

Abstract

本发明涉及神经网络在线学习技术领域，具体涉及一种基于区块链的神经网络在线学习方法及系统。方法包括：根据区块链上存储的训练好的初始DNN网络，得到初始训练集中各医疗图像对应的特征矩阵以及准确率；计算期望特征矩阵；得到待训练数据集中各医疗图像对应的特征矩阵以及准确率；根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵，计算初始训练集中各医疗图像对应的关注程度；判定其是否大于设定关注程度阈值，若大于，则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络，并存储在区块链上。本发明根据初始训练集中各医疗图像的关注程度，得到一个新的训练集对DNN网络进行更新和训练，使DNN网络能够快速收敛。

Description

基于区块链的神经网络在线学习方法及系统

技术领域

本发明涉及神经网络在线学习技术领域，具体涉及一种基于区块链的神经网络在线学习方法及系统。

背景技术

随着医疗技术的不断进步，医疗图像数据已成为病情诊断和疾病治疗的重要分析数据。同时，伴随着人工智能技术的发展，利用神经网络来分析处理图像数据已成为数据分析领域的发展趋势。

但是由于医疗图像数据的标注需要专业人士来完成，因此数据集难以获取并且数量少。又由于不同医院之间很难大规模的共享数据集，导致每个医院利用自身数据集训练的神经网络准确率低，容易出现过拟合或欠拟合的问题。而现有的联邦学习方法或者其他方法给出了一种在医院不共享数据集的情况下利用所有医院的数据集的特征训练一个准确的神经网络的方法。不过随着新的图像数据被标注标签，新的数据集不断产生，数据集规模不断变大，此时需要用新的数据集去重新训练之前旧的神经网络的参数。

现有技术存在以下缺陷：现有的方法是将新的数据集和之前的旧的数据集作为一个大的数据集在旧的神经网络上进行参数的重新训练，但是这种方法需要所有旧的数据集参与训练，没有充分利用神经网络已经学习到的特征，导致网络重新训练时收敛的慢。

发明内容

为了解决上述技术问题，本发明的目的在于提供一种基于区块链的神经网络在线学习方法及系统，所采用的技术方案具体如下：

第一方面，本发明一个实施例提供了一种基于区块链的神经网络在线学习方法及系统，该方法包括以下步骤：

根据区块链上存储的训练好的初始DNN网络，得到初始训练集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率；

根据初始训练集中各医疗图像对应的特征矩阵以及各特征矩阵对应的准确率，计算期望特征矩阵；

将待训练数据集中各医疗图像输入到所述初始DNN网络的编码器中，得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率；

根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵，计算初始训练集中各医疗图像对应的关注程度；

判定初始训练集中各医疗图像对应的关注程度是否大于设定关注程度阈值，若大于，则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络，并将更新后的DNN网络存储在区块链上。

第二方面，本发明另一个实施例提供了一种基于区块链的神经网络在线学习系统，包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述所述的基于区块链的神经网络在线学习方法。

优选的，所述计算初始训练集中各医疗图像对应的关注程度的方法包括：

根据所述期望特征矩阵、所述待训练数据集中各医疗图像对应的特征矩阵以及对应的准确率，得到各特征矩阵对应的异常程度；

根据所述初始训练集中各医疗图像对应的特征矩阵和所述期望特征矩阵，计算出初始训练集差异；

根据所述初始训练集中各医疗图像对应的特征矩阵和所述待训练数据集中各医疗图像对应的特征矩阵，计算出训练集差异；

根据所述异常程度、初始训练集差异以及训练集差异，计算初始训练集中各医疗图像对应的子关注程度；

将初始训练集中各医疗图像对应的多个子关注程度求和，得到初始训练集中各医疗图像对应关注程度。

优选的，所述子关注程度的计算公式为：

其中，F(f,d)为根据待训练集中医疗图像d计算得到的初始训练集中医疗图像f对应的子关注程度，g_d为待训练数据集中医疗图像d对应的异常程度，F_f为初始训练集中医疗图像f对应的特征矩阵，F_d为待训练数据集中医疗图像d对应的特征矩阵，F₀为所述期望特征矩阵。

优选的，采用如下计算公式计算所述异常程度：

g_d＝exp(-α_d)||F_d-F₀||₂

其中，α_d为待训练数据集中的医疗图像d在初始DNN网络上的准确率，|| ||₂为L2范式。

优选的，所述期望特征矩阵的计算公式为：

α_f为初始训练集中医疗图像f在初始DNN网络上对应的准确率，S为初始训练集中医疗图像对应的特征矩阵的集合。

优选的，所述训练好的初始DNN网络是采用联邦学习方法进行训练得到的。

本发明实施例具有如下有益效果：

本发明根据已经训练好的DNN网络获得初始训练集中医疗图像的特征矩阵、特征矩阵对应的准确率和待训练数据集中的特征矩阵，进而计算得到初始训练集中各医疗图像的关注程度，关注程度能够反映的是DNN网络对初始训练集中各医疗图像的特征的学习程度，关注程度越大，说明对初始训练集中医疗图像的特征学习的越差，关注程度越小，说明对初始训练集中医疗图像的特征学习的越差。根据关注程度是否大于设定关注程度阈值来判断将初始训练集中哪些医疗图像与待训练数据集共同用于更新初始DNN网络；使医院在不断产生新的标注数据后，DNN网络能够快速的学习到更多更准确的特征,从而降低欠拟合和过拟合的风险，同时也可以使DNN网络快速的收敛。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案和优点，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为本发明一个实施例所提供的一种基于区块链的神经网络在线学习方法的流程图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功能效果，以下结合附图及较佳实施例，对依据本发明提出的一种基于区块链的神经网络在线学习方法及系统进行详细说明如下。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

由于医疗图像数据的标注需要专业人士来完成，因此数据集难以被获取，并且数量少。又由于不同医院之间很难大规模共享数据集，导致每个医院利用自身数据集训练的神经网络准确率低，容易出现过拟合或欠拟合问题。而现有的联邦学习方法给出了一种在医院不共享数据集的情况下利用所有医院的数据集的特征训练一个准确的神经网络的方法，但是当医院产生新的数据集时，现有的方法使新的数据集与之前旧的数据集共同重新对网络进行训练，这样的方法没有充分利用神经网络已经学习到的特征，导致网络重新训练时收敛的慢，也不利于新的数据集中数据特征的学习。

本发明的在线学习方法主要是在有新的数据集产生时，各医院都能够获取初始DNN网络，并针对性选取初始训练集的部分图像作为样本与新产生的数据集共同更新DNN网络。本发明的主要构思是：根据初始训练集中各医疗图像对应的特征矩阵、特征矩阵对应的准确率以及待训练数据集对应的医疗图像，计算初始训练集中的各图像关注程度，此关注程度的大小决定了旧训练集中的图像是否参与DNN网络的更新，来使DNN网络能够快速收敛，并学习到更多更准确的特征。

下面结合附图具体的说明本发明所提供的一种基于区块链的神经网络在线学习方法及系统的具体方案。

基于区块链的神经网络在线学习方法实施例

如图1所示，本实施例的基于区块链的神经网络在线学习方法包括以下步骤：

步骤S1，根据区块链上存储的训练好的初始DNN网络，得到初始训练集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率。

本实施例初始DNN网络是由所有医院的各自的数据集通过联邦学习的方法训练出来的，其中每个医院的数据集分为训练集和测试集。这个训练好的DNN网络称为训练好的初始DNN网络，每个医院参与该DNN网络训练的训练集称为初始训练集，用于测试该DNN网络准确率的测试集称为初始测试集。

每个医院为新的医疗图像标注了标签，即每个医院拥有了新的数据集，这个数据集的80％作为新的训练集，余下20％作为新的测试集，这个新的训练集称为待训练数据集，这个待训练数据集还没有参与过初始DNN网络的训练。

本实施例中初始DNN网络已经被存储在区块链上，每个医院从区块链上读取出初始DNN网络，将医院的初始训练集中的所有图像数据输入到DNN网络中，获取到DNN网络的编码器输出的所有特征图，我们将特征图称为特征矩阵。

具体来说，该DNN网络的结构是编码器-解码器的结构，这种结构是神经网络设计中的一种重要结构。其中，编码器的作用是对图像进行高维特征的提取和下采样。将图像输入到编码器中，编码器中包含多个卷积层，每个卷积层都会输出一个多通道的特征图，编码器最终输出的一个特征图，该特征图F就是本发明所述的特征矩阵。该特征图F的大小远比输入的图像低，但是该特征图具有较高的通道数，这个特征图包含了图像的高维特征。本实施例的所述DNN网络的任务是对图像进行语义分割，用于获取医疗图像上的病灶区域，因此该特征图F表征的应该是病灶的特征；而在编码器中输出特征图F之前，靠近输入的其他卷积层输出的特征图f，也包含了病灶特征，但是还包含了其他特征；总的来说，特征图f包含的特征多，信息熵大，因此，输入的图像不同，包含的特征也会不同；但是对于特征图F，包含的是高维、更加抽象、信息熵更小的特征，表征的是病灶特征，虽然输入的医疗图像不同，但是这些医疗图像对应的病灶特征不会有太大差别，因此输入不同图像获得的特征图具有相似性。

另外将特征图F输入到解码器中，解码器对特征图F进行上采样，输出一个语义区域，即解码器的作用是将包含特征矩阵的特征图F解码成一个可视化的病灶区域。

每个医院将获取到的所有特征矩阵，以及初始DNN网络在每个医院的初始测试集上的准确率共享并存储到区块链上。

具体来说，对于一个医院a，医院a将初始训练集上的所有医疗图像输入到初始DNN网络后，得到了一个特征矩阵的集合，并将该集合共享出去；同时医院a将初始DNN网络在医院a的初始测试集上的准确率也共享出去。

本实施例选择待训练数据集中医疗图像数量最大的医院，使该医院创建新的区块，然后将所有医院共享出的特征矩阵和准确率存储在新创建区块上，然后将这个区块连接在区块链上。之后给予该医院奖励。作为其他实施方式，也可以指定一家医院进行创建区块，存储数据以及将区块链接到区块链上的工作。

步骤S2，根据初始训练集中各医疗图像对应的特征矩阵以及各特征矩阵对应的准确率，计算期望特征矩阵。

对于一个医院a，医院a读取出存储在区块链上的所有特征矩阵，以及每个特征矩阵对应的准确率，然后根据所有特征矩阵和每个特征矩阵对应的准确率计算出一个质心位置F₀，称为期望特征矩阵。

具体期望特征矩阵的计算公式为：

其中，S为所有特征矩阵的集合，F_f为S中的任意一个特征矩阵,这个特征矩阵是将初始训练集中的医疗图像f输入到初始DNN网络的编码器中获得的，其对应的准确率为α_f。

其中，特征矩阵F_f是一个三维的矩阵，可以视为高维空间的一个特征点。所有这些特征点的分布表示了初始数据集中病症的分布情况。理想情况下，初始训练集数量足够多，无异常数据并且图像数据分布广泛时，这些特征点应该是集中分布在一起的，原因是本发明所标注的数据集是用不同患者患某种疾病时的医疗图像，这些医疗图像的内容可能并不相同，但是所体现的特征矩阵是相同的。但是由于训练初始DNN网络的数据集不充足，初始训练集中图像数据分布不平衡，例如有的患病情况采集了很多医疗图像，有的患病情况的医疗图像却很少，再加上数据标注异常或者引入异常样本数据，就会导致这些特征点可能是离散分布的，或者说分布不够集中，这可能是由于初始DNN网络过拟合或欠拟合导致的，具体跟初始数据集中的数据分布有关。但是不论是过拟合还是欠拟合，这些特征点的分布依然能够大致确定真实期望的特征矩阵是如何分布的，即能够体现出患病特征的期望值F₀是什么，该期望值用于表征理想情况下这些特征点应该集中在哪个值附近。

步骤S3，将待训练数据集中各医疗图像输入到所述初始DNN网络的编码器中，得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率。

对于一个医院a，首先医院a从区块链上读取出初始DNN网络，然后获取医院a的待训练数据集中的一个医疗图像d，将d输入DNN网络的编码器中输出对应的特征矩阵，此对应的特征矩阵称为F_d，同时，得到特征矩阵F_d对应的准确率。

步骤S4，根据所述期望特征矩阵与待训练数据集中各医疗图像对应的特征矩阵，计算初始训练集中各医疗图像对应的关注程度。

本实施例计算的初始训练集中各医疗图像对应的关注程度是根据待训练医疗图像对应的特征矩阵的异常程度计算得到的，具体的，本实施例根据期望特征矩阵、待训练医疗图像对应的特征矩阵以及对应的准确率，得到各特征矩阵对应的异常程度，本实施例计算特征矩阵的异常程度的公式为：

g_d＝exp(-α_d)||F_d-F₀||₂

其中，g_d表示的是特征矩阵F_d的异常程度，α_d表示的是以待训练数据集中的一个图像数据d为测试集时，初始DNN网络在这个数据集上的准确率；||F_d-F₀||₂表示图像数据d对应的特征矩阵与期望特征矩阵的偏离程度。当α_d越小同时||F_d-F₀||₂越大，则g_d越大。造成差异的原因有三种，一是F₀的取值有偏差，也就是说计算的所有的特征矩阵分布的期望值不是F₀而是其他值，这是由于初始训练集不够好导致的；二是F_d取值有偏差，也就是说把待训练数据集中的一个医疗图像d输入DNN网络中获得的特征矩阵是错误的，说明初始DNN网络没有学到医疗图像d的特征；三是F_d和F₀都存在偏差。

本实施例更倾向于第三种原因，因为：一方面是由于F₀是根据大量的初始训练集获得的，因此就算有偏差，偏差程度也不会太大，所以不管F₀的真实取值是多少，所计算出的F₀还是能大致反应特征矩阵该如何分布。另一方面F_d是由医疗图像d获得的，但是初始DNN网络并没有去学习d的特征，而d的特征与初始训练集中的医疗图像存在差异，从而导致F_d出现偏差。

本实施例先假设F₀是正确的，利用医疗图像d来更新初始DNN网络的参数，然后更新完初始DNN网络参数后再重新获取F₀；通过d取不同的医疗图像迭代更新DNN网络参数和F₀，最终使得DNN网络能够学习到正确的合理的符合真实情况的特征。

图像数据d表示的是待训练集中的一张医疗图像，在实际过程中需要使用待训练集的全部数据来为初始训练集中的各医疗图像分配关注程度。

由于在短时间内新数据产生的少，所以需要结合初始训练集，其次是由于初始训练集中有些数据的特征没有被DNN网络正确的学习到，所以需要结合关注程度引入初始训练集中的部分医疗图像，来使训练前后的DNN网络所能提取到的特征保持一致。

关注程度用于表征初始训练集中医疗图像是否需要参与到初始DNN网络的训练之中，本实施例中关注程度是根据待训练数据集中各医疗图像对应的特征矩阵计算得到的，其中，先根据训练数据集中单个医疗图像对应的特征矩阵计算得到的初始训练集中医疗图像对应的子关注程度，然后通过对子关注程度求和的方式计算初始训练集中医疗图像对应的关注程度。

本实施例中子关注程度的计算公式为：

其中，f为初始训练集中的任意一个医疗图像，F_f为f对应的特征矩阵，F(f,d)为在给定待训练数据集的前提下，为f分配的子关注程度。

表示特征矩阵F_f和期望特征矩阵F₀的差异，即初始训练集差异，该值越大表示特征矩阵F_f偏离期望值越远；

表示特征矩阵F_f和特征矩阵F_d的差异，即训练集差异，该值越大表示差异越大。

其中，g_d越大说明DNN网络在医疗图像d上提取的特征准确率越低、偏离期望值越远，那么就越需要将医疗图像d和其他医疗图像(比如医疗图像f)结合在一起去引导训练DNN网络来学习医疗图像d的特征。

此外，若

越大，表示初始DNN网络越没有学习到特征矩阵F_f和特征矩阵F_d对应的样本的特征，也就是说初始DNN网络就越需要通过更新参数来使得特征矩阵F_f和特征矩阵F_d更加趋近与期望特征矩阵F₀，避免DNN网络对这两个特征对应的样本欠拟合；若

越小，表示初始DNN网络越可能已经学习到了特征矩阵F_f和特征矩阵F_d对应的样本的特征，也就是说初始DNN网络越不需要通过更新参数来使得特征矩阵F_f和特征矩阵F_d更加趋近与期望特征矩阵F₀，避免过拟合。

医院a为区块链上存储的所有特征矩阵获取对应的关注程度之后，将这些关注程度共享出去。同理其他医院也将获取到的关注特征共享出去，通过所有医院共享出的特征矩阵对应的关注程度来看，每个特征矩阵又对应了多个关注程度。选取关注程度之和最大的医院，由于关注程度之和最大，所以说明该医院的待训练数据集的数据特征对初始DNN网络的参数更新具有重要意义；该医院将每个特征矩阵对应的多个关注程度求和，使得到的结果作为每个特征矩阵的最终关注程度。该医院将最终的关注程度存储进新产生的区块中，然后将这个区块连接到区块链上，并给予该医院奖励。

步骤S1和步骤S4所述的决定哪个医院能产生新区块，并将新区块连接到区块链上的过程就是共识机制，这一做法有利于通过奖励激励医院去标注出一些有利于初始DNN网络特征学习的数据集，对DNN网络准确率的提升和表征能力的提升具有重要意义。

步骤S5，判定初始训练集中各医疗图像对应的关注程度是否大于设定关注程度阈值，若大于，则将对应的医疗图像和所述待训练数据集共同用于更新初始DNN网络，并将更新后的DNN网络存储在区块链上。

具体来说，假设医院a，读取出区块链上存储的每个图像样本对应的关注程度，然后根据关注程度进行判定，若任一医疗图像对应的关注程度大于设定阈值且该医疗图像来自于医院a，则选取该医疗图像与待训练集合并在一起构成一个新的训练集，去更新初始DNN网络。

所有医院利用新的训练集更新训练初始DNN网络的参数，具体方法为：一个医院从区块链上读取出DNN网络的最新的参数，该医院利用其新的训练集更新训练一轮DNN网络的参数，然后将更新后的参数存储在区块上，然后将这个区块连接在区块链上。之后依次选择其他医院来继续读取出DNN网络最新的、最近更新后的参数，然后利用其获取到的新的训练集更新训练一轮DNN网络的参数，并且也将更新后的、最新的参数存储在区块上。不断重复这个过程，直至每个医院都更新训练一轮。将更新后的DNN网络视为初始DNN网络参与后续的计算，重复步骤S2和步骤S3，直至DNN网络收敛；在这个过程中期望特征矩阵F₀也会一直在更新变化，当DNN网络收敛时，所有的特征矩阵都会趋近于期望值F₀。

本实施例根据已经训练好的DNN网络获得初始训练集中医疗图像的特征矩阵、特征矩阵对应的准确率和待训练数据集中的特征矩阵，进而计算得到初始训练集中各医疗图像的关注程度，根据关注程度是否大于设定关注程度阈值来判断将初始训练集中哪些医疗图像与待训练数据集共同用于更新初始DNN网络；使医院在不断产生新的标注数据后，DNN网络能够快速的学习到更多更准确的特征,从而降低欠拟合和过拟合的风险，同时也可以使DNN网络快速的收敛。

基于区块链的神经网络在线学习系统实施例

本实施例基于区块链的神经网络在线学习系统包括存储器和处理器，所述处理器执行所述存储器存储的计算机程序，以实现上述所述的基于区块链的神经网络在线学习方法。

由于基于区块链的神经网络在线学习方法已经在基于区块链的神经网络在线学习方法实施例中进行了说明，所以本实施例不再对基于区块链的神经网络在线学习方法进行赘述。

需要说明的是：以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于区块链的神经网络在线学习方法，其特征在于，该方法包括以下步骤：

将待训练数据集中各医疗图像输入到所述初始DN网络的编码器中，得到待训练数据集中各医疗图像对应的特征矩阵以及特征矩阵对应的准确率；

2.根据权利要求1所述的基于区块连的神经网络在线学习方法，其特征在于，所述计算初始训练集中各医疗图像对应的关注程度的方法包括：

3.根据权利要求2所述的基于区块链的神经网络在线学习方法，其特征在于，所述子关注程度的计算公式为：

F(f，d)＝g_d×(||F_f-F₀||₂+||F_f-F_d||₂)

其中，F(f，d)为根据待训练集中医疗图像d计算得到的初始训练集中医疗图像f对应的子关注程度，g_d为待训练数据集中医疗图像d对应的异常程度，F_f为初始训练集中医疗图像f对应的特征矩阵，F_d为待训练数据集中医疗图像d对应的特征矩阵，F₀为所述期望特征矩阵。

4.根据权利要求3所述的基于区块链的神经网络在线学习方法，其特征在于，采用如下计算公式计算所述异常程度：

g_d＝exp(-α_d)||F_d-F₀||₂

5.根据权利要求3所述的基于区块链的神经网络在线学习方法，其特征在于，所述期望特征矩阵的计算公式为：

6.根据权利要求1所述的基于区块链的神经网络在线学习方法，其特征在于，所述训练好的初始DNN网络是采用联邦学习方法进行训练得到的。

7.一种基于区块链的神经网络在线学习系统，包括存储器和处理器，其特征在于，所述处理器执行所述存储器存储的计算机程序，以实现如权利要求1-6任一项所述的基于区块链的神经网络在线学习方法。