CN114566277A - 一种基于联邦元学习的罕见疾病分类方法 - Google Patents
一种基于联邦元学习的罕见疾病分类方法 Download PDFInfo
- Publication number
- CN114566277A CN114566277A CN202210173273.0A CN202210173273A CN114566277A CN 114566277 A CN114566277 A CN 114566277A CN 202210173273 A CN202210173273 A CN 202210173273A CN 114566277 A CN114566277 A CN 114566277A
- Authority
- CN
- China
- Prior art keywords
- meta
- model
- learning
- classification
- rare
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 208000035977 Rare disease Diseases 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 48
- 201000010099 disease Diseases 0.000 claims abstract description 39
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 32
- 230000004927 fusion Effects 0.000 claims abstract description 21
- 238000012360 testing method Methods 0.000 claims abstract description 15
- 238000010200 validation analysis Methods 0.000 claims abstract description 13
- 238000003745 diagnosis Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 7
- 238000007499 fusion processing Methods 0.000 claims description 6
- 238000005728 strengthening Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 abstract description 8
- 230000002787 reinforcement Effects 0.000 abstract description 7
- 238000007781 pre-processing Methods 0.000 abstract 1
- 230000000694 effects Effects 0.000 description 13
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 101100455978 Arabidopsis thaliana MAM1 gene Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013209 evaluation strategy Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明属于医疗领域,公开了一种基于联邦元学习的罕见疾病分类方法,包括:对本地医疗数据进行预处理,将常见疾病分为用于元模型训练的支持集和查询集,将罕见疾病分为测试集和验证集;基于强化分类的元学习方法,对支持集和查询集进行动态更新分类,得到训练后的元模型;以F分数对训练后的元模型动态筛选,并进行动态特征融合,得到更新后的全局模型;将更新后的全局模型参数下发给本地元模型初始化,开始下一轮训练;直至获取各个本地收敛的元模型,根据收敛后的元模型获取罕见疾病概率值。本发明将基于强化分类的元学习与基于动态融合策略的联邦学习应用于联邦元学习框架,有助于提高模型对于罕见疾病分类准确度和模型间的通信效率。
Description
技术领域
本发明涉及医疗领域和联邦学习技术领域,更具体的说是涉及一种基于联邦元学习的罕见疾病分类方法。
背景技术
目前,申请号为202010843441.3的专利,该方法借助元学习技术可以发现未见过疾病类别的能力来进行疾病诊断;申请号为202011107453.6的专利,该发明根据获取数据不平衡问题对模型的影响,通过对概率分布分析来对标签识别准确度进行修正,根据异常数据问题对模型的影响,提出了加密数据共享,通过对异常数据处理对各参与方或计算结点的加权系数进行修改,保证联邦学习诊断的准确性;申请号为202011633747.2的专利,该申请通过元学习算法,仅需少量训练就能够快速收敛到其最优解,初始模型就能够保证在以后相似的任务上都能够快速收敛,得到对应的结果模型,节省了计算资源,有利于系统的良性运转;论文Feature-context driven Federated Meta-Learning for Rare DiseasePrediction虽然对元学习和联邦学习进行改进,然而其动态融合策略中以准确率作为主要参数,忽略了样本类别不均衡时对模型效果造成的负面影响,其次使用模型参数较大的Transformer作为基模型,在元学习框架中进行二次梯度计算时需要巨大的显存空间,降低模型通信效率,另外其使用MAML框架进行采用固定的学习率进行模型训练,预测效果较为有限。
上述专利虽然针对不同的问题进行了一定的改进,然而对联邦学习或元学习方法的改进仍有不足,没有很好的解决罕见疾病分类不准确以及模型通信效率低的问题。
因此,如何提供一种能够提高罕见疾病分类准确度以及模型间通信效率的分类方法是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于联邦元学习的罕见疾病分类方法,通过一种基于强化分类的元学习方法,提高疾病分类准确度,有助于提高罕见疾病的识别效果;本发明提出一种动态特征融合策略,即在每个医院仅上传比全局模型F分数高的元模型,并且融合不再仅以数据量为权重,而是对模型的F分数、准确率和数据量进行动态特征融合,以保证联邦学习检测的准确性。本发明将基于强化分类的元学习方法与动态融合策略的联邦学习方法应用于联邦元学习框架,提高了罕见疾病分类准确度,有助于提高模型对于罕见疾病的诊断精度以及模型间通信效率。
为了实现上述目的,本发明采用如下技术方案:
一种基于联邦元学习的罕见疾病分类方法,具体步骤如下:
S1、对本地医疗数据分为常见疾病与罕见疾病,常见疾病分为用于元模型训练的支持集和查询集,罕见疾病分为测试集和验证集;
S2、基于强化分类的元学习方法,支持集和查询集对元模型进行动态更新分类处理,得到训练后的元模型;
S3、本地服务器在测试集上将训练后的元模型进行评估并筛选;
S4、本地服务器将筛选后的元模型上传至中心服务器,中心服务器进行动态特征融合,得到更新后的全局模型;
S5、中心服务器将更新后的全局模型参数下发至各个本地服务器,本地服务器对各元模型进行初始化,并开启新一轮元模型的训练;
S6、进行步骤S3-S5的迭代,直至本地服务器获取收敛后的元模型;
S7、将所述验证集输入至收敛后的元模型中,获取罕见疾病分类结果。
优选的,所述S1中,具体步骤如下:
S11、定义常见疾病与罕见疾病:根据医疗专家经验,将样本数量大的疾病类别作为常见疾病,剩余的疾病类别则为罕见疾病;
S12、对常见疾病进行任务划分,得到用于元模型训练的支持集:随机选取N类所述常见疾病的K个样本,构成一个任务,选取多个任务构成元模型训练的所述支持集;
S13、对常见疾病进行任务划分,得到用于元模型训练的查询集:选取与所述支持集相同的N类所述常见疾病,每类随机选择3K个样本构成一个任务,采用与所述支持集个数相同、分布相同的任务构成所述查询集;
S14、将罕见疾病划分为测试集和验证集:选择罕见疾病各类的一个样本作为测试集对训练后的元模型进行调整,然后将未参与训练的罕见疾病样本作为验证集进行分类诊断。
优选的,所述S2中,具体包括以下步骤:
S21、在进行元学习内循环中,基于损失函数计算所述支持集的损失,并根据所述损失及梯度信息确定内循环更新参数;
S22、在进行元学习外循环中,根据所述查询集和所述内循环更新参数对所述元模型参数进行外循环参数训练,得到外循环更新参数;根据所述外循环更新参数进行元模型训练。
优选的,所述S3中,具体包括以下步骤:
S31、本地服务器在测试集上对训练后的元模型评估分数;
S32、本地服务器选择F分数高于上一轮全局模型F分数的元模型进行上传。
优选的,所述S4中,具体包括以下步骤:
中心服务器以筛选后的元模型F分数、准确率和数据量计算权重,中心服务器对筛选后的元模型进行动态特征融合处理,得到更新后的全局模型;
所述动态特征融合过程包括:
筛选后的元模型分别以F分数、准确率和数据量计算权重,公式如下:
全局模型更新过程的公式如下:
F(θ,lr)为该轮更新所得的全局模型,θ为模型的初始化参数,lr表示学习率,fj(θ,lr)表示当前第j个医院上传的元模型。
优选的,所述S21中,所述内循环强化分类条件,动态更新参数过程如下:
在分类任务中,某类别概率p(x)可表示为:
p(x)=softmax(<z,w>)
其中z表示输入向量,w为对应的权重,<z,w>表示内积计算;
假设:
w=(w1,w2,...wn)
则:
p(x)=softmax(<z,w1>,<z,w2>,...,<z,wn>)
若将z,wi(i=1,2...n)做L2范数归一化处理:
其中,ci表示经过L2范数处理后的乘积,使用交叉熵函数计算损失可得:
其中,t表示目标标签,由于模型在识别边缘样本时效果较差,因此通过强化分类条件来更新模型训练的每轮损失,公式如下:
其中v表示当前线性层的样本权值,在强化分类条件的基础上,对于边缘样本,v值较小,样本距离较大,分类条件应略微宽泛;对于中心样本,v值较大,类内距离较小,分类条件较为严格;
本地服务器通过随机梯度下降方式更新模型参数,具体公式如下:
优选的,所述S22中,在所述查询集中计算损失,并根据所述损失和所述内循环更新参数得到外循环更新参数,过程如下:
本地服务器通过随机梯度下降方式更新模型参数,同时动态更新所述基模型参数θc和所述基模型学习率α,具体公式如下:
其中,β代表模型外循环的学习率,θc′为所述元模型的参数,P(T)代表任务的分布。
经由上述的技术方案可知,与现有技术相比,本发明具有以下有益效果:
(1)采用了一种基于强化分类的元学习方法,通过动态更新分类条件以提高模型对边缘样本的识别精度,提高疾病分类准确度,有助于提高罕见疾病的识别精度;
(2)本发明为缓解联邦学习中模型平均融合对诊断准确率的负面影响,提出一种动态特征融合策略,即每个医院仅上传F分数比全局模型F分数高的元模型,并且融合不再仅以数据量为权重,而是综合考虑模型的F分数、准确率和数据量进行动态特征融合,以保证联邦学习分类的准确性;
(3)本发明将基于强化分类的元学习方法与基于动态融合策略的联邦学习方法应用于联邦元学习框架,有助于提高模型对于罕见疾病的分类精度和模型间的通信效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1附图为本发明的流程示意图。
图2附图为本发明的基于强化分类的元模型结构示意图。
图3附图为本发明的基于动态特征融合的联邦元学习原理示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于联邦元学习的罕见疾病分类方法,此方法可以用于医院以及疾病研究所,能够为研究所以及医院提供大量罕见疾病的医疗数据以及将罕见疾病快速分类,有助于快速识别罕见疾病的类别,提升科研效率以及罕见疾病的识别速度。
分类方法具体步骤如下:
S1、将本地医疗数据分为常见疾病与罕见疾病,对常见疾病进行任务划分,得到用于元模型训练的支持集和查询集,将罕见疾病分为测试集和验证集;
S2、本地服务器利用基于强化分类的元学习方法,结合支持集和查询集通过动态更新分类条件对元模型进行训练,得到训练后的元模型;本发明能够提高模型对边缘样本的检测效率,还有助于提高各医院的元模型对罕见疾病的检测分类效果;
S3、本发明的分类模型采用F分数,公式如下:
其中,Precision为准确率,Recall为召回率,β是用于平衡Precision与Recall的权重;
即本地服务器根据F分数对训练后的各元模型进行筛选并上传至中心服务器;本发明借助联邦学习方法,在保护医疗数据隐私的同时,使得各医院的元模型能够学习更多常见疾病的特征,通过模型筛选不但进一步提高罕见疾病诊断的效果,而且有助于提高模型间的通信效率;
S4、中心服务器对筛选后的元模型进行动态特征融合,得到更新后的全局模型;本发明为缓解联邦学习中模型平均融合对诊断效果的负面影响,设计一种动态特征融合策略,再次有助于提高罕见疾病的诊断效果;
S5、中心服务器将更新后的全局模型参数下发至本地服务器,本地服务器对各元模型进行初始化,并开启新一轮元模型的训练;
S6、进行步骤S3-S5的迭代,直至本地服务器获取收敛后的元模型;
S7、将验证集输入至收敛后的元模型中,获取罕见疾病的分类结果。
在本实施例中,S1具体包括以下步骤:
S11、定义常见疾病与罕见疾病:将样本数量大的疾病类别作为常见疾病,剩余的疾病类别则为罕见疾病;
S12、对常见疾病进行划分,得到用于元模型训练的支持集:随机选取N类常见疾病的K个样本,构成一个任务,以P(T)的分布方式选取多个任务构成元模型训练的支持集;
S13、对常见疾病进行划分,得到用于元模型训练的查询集:选取与S12中支持集相同的N类常见疾病,每类随机选择3K个样本构成一个任务,采用与支持集个数相同、分布相同的任务构成查询集;
S14、将罕见疾病划分为测试集和验证集:选择罕见疾病各类的一个样本作为测试集对训练后的元模型进行调整,然后将未参与训练的罕见疾病样本作为验证集进行分类诊断。
在本实施例中,为提高模型对罕见疾病的诊断准确率,设计基于强化分类的元学习方法,其模型结构示意图如图2所示;根据边缘样本和中心样本动态更新分类条件,以提高元模型对罕见疾病的分类效果,S2具体包括以下步骤:
S21、在进行元学习内循环中,本地服务器基于损失函数计算支持集的损失,并根据损失及梯度信息确定内循环更新参数,具体如下;
内循环强化分类条件,动态更新参数过程如下:
在分类任务中,某类别概率p(x)可表示为:
p(x)=softmax(<z,w>)
其中z表示输入向量,w为对应的权重,<z,w>表示内积计算;
假设:
w=(w1,w2,...wn)
则:
p(x)=softmax(<z,w1>,<z,w2>,...,<z,wn>)
若将z,wi(i=1,2...n)做L2范数归一化处理:
其中,ci表示经过L2范数处理后的乘积,使用交叉熵函数计算损失可得:
其中,t表示目标标签,由于模型在识别边缘样本时效果较差,因此通过强化分类条件来更新模型训练的每轮损失,公式如下:
其中v表示当前线性层的样本权值,在强化分类条件的基础上,对于边缘样本,v值较小,样本距离较大,分类条件应略微宽泛;对于中心样本,v值较大,类内距离较小,分类条件较为严格;
本地服务器通过随机梯度下降方式更新模型参数,具体公式如下:
S22、在进行元学习外循环中,本地服务器根据查询集和内循环更新参数对元模型参数进行外循环参数训练,得到外循环更新参数;根据外循环更新参数进行元模型训练,具体如下:
本地服务器通过随机梯度下降方式更新模型参数,同时动态更新所述基模型参数θc和所述基模型学习率α,具体公式如下:
其中,β代表模型外循环的学习率,θc′为所述元模型的参数,P(T)代表任务的分布。
在模型特征提取过程中,采用融合空间注意力的卷积神经网络进行特征提取:针对医疗图像样本,一个空间注意力对应一个高×宽的矩阵,每个位置对原特征图对应位置的像素就是一个注意力分数。具体而言,基于通道对特征图进行最大池化和平均池化操作,然后将二者进行拼接并通过卷积将通道降为1维,最后将结果经过激活函数生成注意力分数,与特征图对应位置做乘法,通过为特征增加空间注意力,以提高卷积神经网络的特征提取能力。此外,在模型中使用AdamW优化器,将学习率定义为0.0001,以进行罕见疾病诊断。
在本实施例中,借助联邦学习方法,在保护医疗数据隐私的同时,增加常见疾病的类别,使S2步骤中各医院元模型能够学习更多种类常见疾病的特征,从而提高罕见疾病诊断的准确率,S3具体包括以下步骤:
S31、本地服务器在测试集上对训练后的元模型进行评估分数;
S32、本地服务器选择F分数高于全局模型F分数的元模型进行上传至中心服务器。
在本实施例中,为减弱S3步骤联邦学习中模型平均融合对诊断效果的负面影响,设计了一种动态特征融合策略,其原理如图3所示,进一步提高罕见疾病的诊断效果,S4具体包括以下步骤:
中心服务器以筛选后的元模型准确率作为权重,中心服务器对筛选后的元模型进行动态特征融合处理,得到更新后的全局模型。
动态特征融合过程如下:
筛选后元模型分别以F分数、准确率和数据量计算权重,公式如下:
全局模型更新过程的公式如下:
F(θ,lr)为该轮更新所得的全局模型,θ为模型的初始化参数,lr表示学习率,fj(θ,lr)表示当前第j个医院上传的元模型。
本发明将基于强化分类的元学习方法与动态融合策略的联邦学习方法相结合,将联邦元学习框架用于罕见疾病分类,并对默认设置的联邦元学习框架进行了改进,各医院的诊断效果都有了显著的提升。
在评估方法是否有效时,判断各元模型准确率是否比改进前各元模型效果有所提升,以此作为评估策略。此外,本发明以F分数、准确率同时作为评价指标,充分考虑了样本不均衡时,准确率难以有效评价模型效果的不足。本发明的改进方法使得每个医院元模型的诊断效果以及模型通信效率都比默认设置联邦元学习中各元模型有显著提升。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (7)
1.一种基于联邦元学习的罕见疾病分类方法,其特征在于:具体步骤如下:
S1、将本地医疗数据分为常见疾病与罕见疾病,常见疾病分为用于元模型训练的支持集和查询集,罕见疾病分为测试集和验证集;
S2、基于强化分类的元学习方法,支持集和查询集对元模型进行动态更新分类处理,得到训练后的元模型;
S3、本地服务器在测试集上将训练后的元模型进行评估并筛选;
S4、本地服务器将筛选后的元模型上传至中心服务器,中心服务器进行动态特征融合,得到更新后的全局模型;
S5、中心服务器将更新后的全局模型参数下发至各个本地服务器,本地服务器对各元模型进行初始化,并开启新一轮元模型的训练;
S6、进行步骤S3-S5的迭代,直至本地服务器获取收敛后的元模型;
S7、将所述验证集输入至收敛后的元模型中,获取罕见疾病分类结果。
2.根据权利要求1所述的一种基于联邦元学习的罕见疾病分类方法,其特征在于:所述S1中,具体步骤如下:
S11、定义常见疾病与罕见疾病:根据医疗专家经验,将样本数量大的疾病类别作为常见疾病,剩余的疾病类别则为罕见疾病;
S12、对常见疾病进行任务划分,得到用于元模型训练的支持集:随机选取N类所述常见疾病的K个样本,构成一个任务,选取多个任务构成元模型训练的所述支持集;
S13、对常见疾病进行任务划分,得到用于元模型训练的查询集:选取与所述支持集相同的N类所述常见疾病,每类随机选择3K个样本构成一个任务,采用与所述支持集个数相同、分布相同的任务构成所述查询集;
S14、将罕见疾病划分为测试集和验证集:选择罕见疾病各类的一个样本作为测试集对训练后的元模型进行调整,然后将未参与训练的罕见疾病样本作为验证集进行分类诊断。
3.根据权利要求2所述的一种基于联邦元学习的罕见疾病分类方法,其特征在于:所述S2中,具体包括以下步骤:
S21、在进行元学习内循环中,基于损失函数计算所述支持集的损失,并根据所述损失及梯度信息确定内循环更新参数;
S22、在进行元学习外循环中,所述查询集和所述内循环更新参数对所述元模型参数进行外循环参数训练,得到外循环更新参数;并根据所述外循环更新参数进行元模型训练。
4.根据权利要求1所述的一种基于联邦元学习的罕见疾病分类方法,其特征在于:所述S3中,具体包括以下步骤:
S31、本地服务器在测试集上对训练后的元模型评估分数;
S32、本地服务器选择F分数高于上一轮全局模型F分数的元模型进行筛选并上传至中心服务器。
5.根据权利要求4所述的一种基于联邦元学习的罕见疾病分类方法,其特征在于:所述S4中,具体包括以下步骤:
中心服务器以筛选后的元模型F分数、准确率和数据量计算权重,中心服务器对筛选后的元模型进行动态特征融合处理,得到更新后的全局模型;
所述动态特征融合过程包括:
筛选后的元模型分别以F分数、准确率和数据量计算权重,公式如下:
全局模型更新过程的公式如下:
F(θ,lr)为该轮更新所得的全局模型,θ为模型的初始化参数,lr表示学习率,fj(θ,lr)表示当前第j个医院上传的元模型。
6.根据权利要求3所述的一种基于联邦元学习的罕见疾病分类方法,其特征在于:所述S21中,所述内循环强化分类条件,动态更新参数过程如下:
在分类任务中,某类别概率p(x)可表示为:
p(x)=softmax(<z,w>)
其中z表示输入向量,w为对应的权重,<z,w>表示内积计算;
假设:
w=(w1,w2,...wn)
则:
o(x)=sofmtmax(<z,w1>,<z,w2>,...,<z,wn>)
若将z,wi(i=1,2...n)做L2范数归一化处理:
其中,ci表示经过L2范数处理后的乘积,使用交叉熵函数计算损失可得:
其中,t表示目标标签,由于模型在识别边缘样本时效果较差,因此通过强化分类条件来更新模型训练的每轮损失,公式如下:
其中v表示当前线性层的样本权值,在强化分类条件的基础上,对于边缘样本,v值较小,样本距离较大,分类条件应略微宽泛;对于中心样本,v值较大,类内距离较小,分类条件较为严格;
本地服务器通过随机梯度下降方式更新模型参数,具体公式如下:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210173273.0A CN114566277B (zh) | 2022-02-24 | 2022-02-24 | 一种基于联邦元学习的罕见疾病分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210173273.0A CN114566277B (zh) | 2022-02-24 | 2022-02-24 | 一种基于联邦元学习的罕见疾病分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114566277A true CN114566277A (zh) | 2022-05-31 |
CN114566277B CN114566277B (zh) | 2024-09-06 |
Family
ID=81716525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210173273.0A Active CN114566277B (zh) | 2022-02-24 | 2022-02-24 | 一种基于联邦元学习的罕见疾病分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114566277B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114943308A (zh) * | 2022-07-04 | 2022-08-26 | 北京交通大学 | 一种基于联邦学习的数据分类方法及装置 |
CN116108364A (zh) * | 2023-01-11 | 2023-05-12 | 浙江大学 | 一种基于元学习的集成式深度模型分类方法 |
CN116936048A (zh) * | 2023-07-04 | 2023-10-24 | 吉林大学 | 异构医疗信息的联邦学习医院选择方法、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111477336A (zh) * | 2020-04-07 | 2020-07-31 | 中南大学 | 传染病诊断数据的融合方法、系统及存储介质 |
CN112201342A (zh) * | 2020-09-27 | 2021-01-08 | 博雅正链(北京)科技有限公司 | 基于联邦学习的医疗辅助诊断方法、装置、设备及存储介质 |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
CN112420187A (zh) * | 2020-10-15 | 2021-02-26 | 南京邮电大学 | 一种基于迁移联邦学习的医疗疾病分析方法 |
-
2022
- 2022-02-24 CN CN202210173273.0A patent/CN114566277B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111477336A (zh) * | 2020-04-07 | 2020-07-31 | 中南大学 | 传染病诊断数据的融合方法、系统及存储介质 |
CN112201342A (zh) * | 2020-09-27 | 2021-01-08 | 博雅正链(北京)科技有限公司 | 基于联邦学习的医疗辅助诊断方法、装置、设备及存储介质 |
CN112420187A (zh) * | 2020-10-15 | 2021-02-26 | 南京邮电大学 | 一种基于迁移联邦学习的医疗疾病分析方法 |
AU2020103613A4 (en) * | 2020-11-23 | 2021-02-04 | Agricultural Information and Rural Economic Research Institute of Sichuan Academy of Agricultural Sciences | Cnn and transfer learning based disease intelligent identification method and system |
Non-Patent Citations (1)
Title |
---|
刘艳;王田;彭绍亮;王国军;贾维嘉: "基于边缘的联邦学习模型清洗和设备聚类方法", 计算机学报, vol. 44, no. 012, 31 December 2021 (2021-12-31) * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114943308A (zh) * | 2022-07-04 | 2022-08-26 | 北京交通大学 | 一种基于联邦学习的数据分类方法及装置 |
CN116108364A (zh) * | 2023-01-11 | 2023-05-12 | 浙江大学 | 一种基于元学习的集成式深度模型分类方法 |
CN116936048A (zh) * | 2023-07-04 | 2023-10-24 | 吉林大学 | 异构医疗信息的联邦学习医院选择方法、设备及存储介质 |
CN116936048B (zh) * | 2023-07-04 | 2024-03-19 | 吉林大学 | 异构医疗信息的联邦学习医院选择方法、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114566277B (zh) | 2024-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114566277A (zh) | 一种基于联邦元学习的罕见疾病分类方法 | |
Liu et al. | Progressive neural architecture search | |
CN110782015A (zh) | 神经网络的网络结构优化器的训练方法、装置及存储介质 | |
CN104933428B (zh) | 一种基于张量描述的人脸识别方法及装置 | |
CN111047563B (zh) | 一种应用于医学超声图像的神经网络构建方法 | |
CN110879982B (zh) | 一种人群计数系统及方法 | |
CN111241992B (zh) | 人脸识别模型构建方法、识别方法、装置、设备及存储介质 | |
CN111127390B (zh) | 基于迁移学习的x射线影像处理方法及系统 | |
CN111105045A (zh) | 一种基于改进的蝗虫优化算法构建预测模型的方法 | |
CN114841257A (zh) | 一种基于自监督对比约束下的小样本目标检测方法 | |
CN110689523A (zh) | 基于元学习个性化图像信息评价方法、信息数据处理终端 | |
CN117611932B (zh) | 基于双重伪标签细化和样本重加权的图像分类方法及系统 | |
CN109598307A (zh) | 数据筛选方法、装置、服务器及存储介质 | |
CN111242176B (zh) | 计算机视觉任务的处理方法、装置及电子系统 | |
CN113688787A (zh) | 花生叶片病害识别方法 | |
WO2022252694A1 (zh) | 神经网络优化方法及其装置 | |
CN112436992A (zh) | 基于图卷积网络的虚拟网络映射方法及装置 | |
CN112348360B (zh) | 一种基于大数据技术的中药生产工艺参数分析系统 | |
CN110796260A (zh) | 一种基于类扩张学习的神经网络模型优化方法 | |
CN113052217A (zh) | 预测结果标识及其模型训练方法、装置及计算机存储介质 | |
CN114997377B (zh) | 面向超大规模图的架构搜索方法、装置、设备及存储介质 | |
CN108924196B (zh) | 工业互联网绿色能源管理系统 | |
CN114120367B (zh) | 元学习框架下基于圆损失度量的行人重识别方法及系统 | |
CN114037660B (zh) | Oct视网膜病变图像识别方法及系统 | |
CN115312158A (zh) | 元数据与图像特征双重感知的个性化联邦学习方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |