CN112447298A - 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 - Google Patents
基于联邦迁移学习的神经退行性疾病建模装置及相关设备 Download PDFInfo
- Publication number
- CN112447298A CN112447298A CN202011329754.3A CN202011329754A CN112447298A CN 112447298 A CN112447298 A CN 112447298A CN 202011329754 A CN202011329754 A CN 202011329754A CN 112447298 A CN112447298 A CN 112447298A
- Authority
- CN
- China
- Prior art keywords
- training
- data
- neural network
- network model
- patient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了基于联邦迁移学习的神经退行性疾病建模装置及相关设备,涉及人工智能技术领域,可应用于智慧医院系统中,装置包括:数据集获取单元,用于获取第一类神经退行性疾病患者的病历数据集A和病历数据集B;交集选取单元,用于从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;模型训练单元,用于基于所述训练集样本,对原始神经网络模型进行训练;联邦迁移单元,用于基于多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。本发明解决了建模过程的数据孤岛问题,可有效预测患者患病程度。
Description
技术领域
本发明涉及人工智能技术领域,特别涉及基于联邦迁移学习的神经退行性疾病建模装置及相关设备。
背景技术
神经退行性疾病是由神经元和其髓鞘的功能丧失所致的,且会随着时间的推移而恶化,出现各种功能障碍。国内老龄化人口数量的日益增长,我国患神经退行性疾病的老年人越来越多。随着世界各国医疗科研水平的不断发展,各医疗机构对神经退行性疾病的研究方法日趋完善。业内现对于神经退行性疾病的研究聚焦在不同病种的成因研究,同时也有很多治疗的新思路提出。目前的研究成果表明,神经退行性疾病的成因通常有氧化应激、线粒体功能障碍、兴奋性毒素和免疫炎症。该病症种类繁多,包括认知和行为障碍等方面。同时,病理变化不可逆,往往在患者出现认知障碍的时候病程已到中晚期,此时治疗只能延缓病情的发展,不能从根本上逆转神经网络的损伤。因此,对神经性疾病应该尽早诊断与治疗。
在病理研究方面,业内更多的聚焦在单一疾病的病理研究方面,因为患者的检测信息是隐私信息,不方便直接获取与使用;同时,神经退行性疾病的患病人的区域分布不均导致数据采集不便利。另外,在疾病治疗方面,大部分医生从医多年只能遇到几例患者导致了学者无法通过大量的病情数据去详细且完整地对神经退行性疾病的具体病因进行研究,也不利于对症诊治。各医疗机构在智慧医疗场景下提出了诸多设想方案,但由于各机构可供研究的数据量不足,医疗数据预处理及标注所需投入巨大,当前医疗场景下的智能诊断系统尚且不完善,在神经退行性疾病患病程度预测方面的诸多设想暂未落地。
发明内容
本发明的目的是提供基于联邦迁移学习的神经退行性疾病建模装置及相关设备,旨在解决现有神经退行性疾病患病程度预测装置无法在保证隐私前提下有效建模的问题。
第一方面,本发明实施例提供一种基于联邦迁移学习的神经退行性疾病建模装置,其中,包括:
数据集获取单元,用于获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;
交集选取单元,用于从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;
模型训练单元,用于基于所述训练集样本,对原始神经网络模型进行训练;
联邦迁移单元,用于基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
第二方面,本发明实施例提供一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现以下步骤:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
第三方面,本发明实施例提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如下步骤:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
本发明实施例提供了基于联邦迁移学习的神经退行性疾病建模装置及相关设备,装置包括:数据集获取单元,用于获取第一类神经退行性疾病患者的病历数据集A和病历数据集B;交集选取单元,用于从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;模型训练单元,用于基于所述训练集样本,对原始神经网络模型进行训练;联邦迁移单元,用于基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。本发明实施例解决了预测模型建模过程中的数据孤岛问题,可有效预测患者神经退行性疾病的患病程度。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的示意性框图;
图2为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的子单元示意性框图;
图3为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的另一子单元示意性框图;
图4为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的另一子单元示意性框图;
图5为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的另一子单元示意性框图;
图6为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置的另一子单元示意性框图;
图7为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1为本发明实施例提供的基于联邦迁移学习的神经退行性疾病建模装置100的示意性框图,该装置包括数据集获取单元101、交集选取单元102、模型训练单元103和联邦迁移单元104:
数据集获取单元101,用于获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;
交集选取单元102,用于从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;
模型训练单元103,用于基于所述训练集样本,对原始神经网络模型进行训练;
联邦迁移单元104,用于基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
本实施例中,所述数据集获取单元101中,所述病历数据集A和所述病历数据集B均包括多条数据,并且病历数据集A和所述病历数据集B的数据类型有交叉的部分也有不交叉的部分。具体的,所述病历数据集A中包含由第一特征项集描述的多条数据,第一特征项集包括用于描述患者身份的特征项(例如张三,男性,65岁等)以及用于描述患者患病状态的特征项(例如患帕金森综合症程度20%)。所述病历数据集B包括由第二特征项集描述的多条数据,其中第二特征项集包括用于描述患者身份的特征项(其与第一特征项集对应的特征项相同,例如张三,男性,65岁等)以及用于描述患者临床表现数据的特征项(例如睡眠少,行动能力减弱,间歇性狂躁等)。
其中的第一类神经退行性疾病可以是任意一种神经退行性疾病,例如帕金森综合症、强制性脊柱侧索硬化症或亨廷顿综合症。本发明实施例优选的是采用帕金森综合症,因为需要利用第一类神经退行性疾病进行原始模型的建模和训练,所以需要一些基础的数据量,故采用帕金森综合症有利于原始模型的训练。
在所述交集选取单元102中,从所述病例数据集A和病例数据集B之间选取交集数据。因数据来源不同,故会存在数据缺失、不完整等情况,交集数据为病例中记录的某位患者既记录了临床表现,又记录了患病状态的数据。
本发明实施例可以取病历数据集A和病历数据集B的交集数据作为训练集样本,这样可以使得模型能够最大化学习病历数据集A与病历数据集B的共同特征,也避免了样本差异化对模型产生的影响。
在所述模型训练单元103中,利用前面得到的训练集样本,对原始神经网络模型进行训练。本单元是先对原始神经网络模型进行训练,后续单元中再将此训练的原始神经网络模型泛化到其他神经退行性疾病的患病程度预测当中。
在一实施例中,如图2所示,所述模型训练单元103包括:
数据输入单元201,用于将所述训练集样本中用于描述患者患病状态的特征项的数据,作为所述原始神经网络模型的标签;以及将用于描述患者临床表现数据的特征项的数据,作为所述原始神经网络模型的输入数据;
模型训练子单元202,用于基于所述输入数据对所述原始神经网络模型进行训练,得到训练好的所述原始神经网络模型。
在本实施例中,利用用于描述患者患病状态的特征项的数据,作为所述原始神经网络模型的标签,以及将用于描述患者临床表现数据的特征项的数据,作为所述原始神经网络模型的输入数据,这样可以使得患者表现与患病状态呈现对应关系,该原始神经网络模型是基于患者行为及其特征对患者的患病程度进行预测的。在模型训练子单元202中,可利用联邦学习的方式对原始神经网络模型进行训练,从而得到用于预测第一类神经退行性疾病患病程度的原始神经网络模型。
在一实施例中,所述数据输入单元201包括:
加密单元,用于采用同态加密技术对所述训练集样本中的数据进行加密。
即在训练时,可采用同态加密技术对样本数据进行加密,以保护数据隐私。然后再将加密后用于描述患者患病状态的特征项的数据,作为原始神经网络模型的标签;以及将加密后用于描述患者临床表现数据的特征项的数据,作为原始神经网络模型的输入数据。
在一实施例中,如图3所示,所述模型训练单元103还包括:
测试集选取单元301,用于将所述病例数据集A和病例数据集B之间的非交集数据作为测试集样本;
测试单元302,用于基于所述测试集样本对所述原始神经网络模型进行测试。
本实施例中,由于神经退行性疾病的病情数据较少,本发明实施例为了充分利用现有的数据,还获取所述病例数据集A和病例数据集B之间的非交集数据,并将非交集数据作为测试集样本,利用所述测试集样本对训练后的原始神经网络模型进行测试,从而原始神经网络模型预测效果更准确。
在一实施例中,如图4所示,所述联邦迁移单元104包括:
模型获取单元401,用于获取所述训练好的所述原始神经网络模型;
联邦迁移学习单元402,用于利用各节点存储的各类神经退行性疾病的训练集样本对所述原始神经网络模型进行联邦迁移学习;
梯度更新单元403,用于利用各节点训练得到的梯度值对所述原始神经网络模型进行更新,得到最终神经网络模型。
本发明实施例中,可以先获取训练好的该原始神经网络模型,然后将该原始神经网络模型泛化到各类神经退行性疾病的训练中。
即在联邦迁移学习单元中,利用各节点存储的各类神经退行性疾病的训练集样本进行联邦迁移学习,在神经退行性疾病中,帕金森综合症、亨廷顿综合症和强制性脊柱侧索硬化症三种疾病在病因,临床表现以及病患人群三个方面均有共同点。例如,三种疾病患者病理上均有神经组织的氧化损伤,脑内线粒体增加的现象,部分患者同时具有三种疾病的临床表现等。联邦迁移学习能够在保证患者隐私的前提下完成疾病检测模型的训练,同时将训练好的模型泛化到其他神经退行性疾病的检测中,最终训练出一个可检测神经退行性疾病患病程度的模型。
具体地,所述的节点可以是医院本地端,各医院本地端所拥有的训练集样本不同,可能节点A拥有帕金森综合症的训练集样本,节点B拥有亨廷顿综合症的训练集样本,节点C拥有强制性脊柱侧索硬化症的训练集样本,所以可以在各个节点本地对所述原始神经网络模型进行训练,这样各个节点的数据不会外泄,保护了数据的隐私。然后利用各个节点训练得到的梯度值对原始神经网络模型进行更新,从而得到最终神经网络模型。
在一实施例中,如图5所示,所述联邦迁移学习单元402包括:
权重判断单元501,用于在每一轮联邦迁移学习的训练过程中,获取各节点的模型权重,判断各节点的模型权重是否相等;
权重更新单元502,用于若各节点的模型权重不相等,则对各节点的模型权重进行更新,以用于本轮联邦迁移学习的训练过程。
在本实施例中,每一轮联邦迁移学习训练过程中,若不同节点的模型权重不等,则需要对各节点的模型权重进行更新,由此使得各节点能够在样本存在差异的情况下依然具有一致的学习效果。
在一实施例中,所述权重更新单元502包括:
权重更新子单元,用于按下述公式对各节点的模型权重进行更新:
ωk+1←ωk+μFk(ωk)
ωk表示当前节点在当前训练轮次的模型权重,ωk+1表示当前节点更新后的模型权重,μ为学习率,Fk表示当前节点的训练数据量占所有节点的总训练数据量的比重。
按照上述更新方式进行权重更新之后进行模型训练,然后在下一轮联邦迁移学习的训练过程中,继续判断模型权重是否相等,直到各模型权值相等,训练停止,此过程中的模型权重均使用同态加密技术进行加密以保证数据安全。
在一实施例中,如图6所示,所述梯度更新单元403包括:
加权平均单元601,用于按各节点的模型权重对各节点训练得到的梯度值进行加权平均,得到平均梯度;
梯度更新子单元602,用于利用所述平均梯度对所述原始神经网络模型进行更新,得到最终神经网络模型。
本实施例中,对于各节点训练后得到的梯度值,采用对应节点的模型权重进行加权平均,从而得到平均梯度,该平均梯度代表了各个节点的样本训练提供的贡献,然后利用利用平均梯度对原始神经网络模型进行更新,从而得到最终神经网络模型。
在得到最终神经网络模型后,可以将各个病历数据集中待测数据依次输入最终神经网络模型中进行计算,得到的结果即为各自对应的患病状态。
本发明实施例提供的装置解决了预测模型建模过程中的数据孤岛问题,可有效预测患者神经退行性疾病的患病程度。
上述基于联邦迁移学习的神经退行性疾病建模装置100可以实现为计算机程序的形式,该计算机程序可以在如图7所示的计算机设备上运行。
请参阅图7,图7是本发明实施例提供的计算机设备的示意性框图。该计算机设备700是服务器,服务器可以是独立的服务器,也可以是多个服务器组成的服务器集群。
参阅图7,该计算机设备700包括通过系统总线701连接的处理器702、存储器和网络接口705,其中,存储器可以包括非易失性存储介质703和内存储器704。
该非易失性存储介质703可存储操作系统7031和计算机程序7032。
该处理器702用于提供计算和控制能力,支撑整个计算机设备700的运行。
该内存储器704为非易失性存储介质703中的计算机程序7032的运行提供环境。
该网络接口705用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图7中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备700的限定,具体的计算机设备700可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器702用于运行存储在存储器中的计算机程序7032,以实现如下功能:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
在一实施例中,处理器702在执行所述基于所述训练集样本,对原始神经网络模型进行训练的步骤时,执行如下操作:将所述训练集样本中用于描述患者患病状态的特征项的数据,作为所述原始神经网络模型的标签;以及将用于描述患者临床表现数据的特征项的数据,作为所述原始神经网络模型的输入数据;基于所述输入数据对所述原始神经网络模型进行训练,得到训练好的所述原始神经网络模型。
在一实施例中,处理器702在执行所述基于所述训练集样本,对原始神经网络模型进行训练的步骤时,还执行如下操作:将所述病例数据集A和病例数据集B之间的非交集数据作为测试集样本;基于所述测试集样本对所述原始神经网络模型进行测试。
在一实施例中,处理器702在执行所述基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型的步骤时,还执行如下操作:获取所述训练好的所述原始神经网络模型;利用各节点存储的各类神经退行性疾病的训练集样本对所述原始神经网络模型进行联邦迁移学习;利用各节点训练得到的梯度值对所述原始神经网络模型进行更新,得到最终神经网络模型。
在一实施例中,处理器702在执行所述利用各节点存储的各类神经退行性疾病的训练集样本对所述原始神经网络模型进行联邦迁移学习的步骤时,执行如下操作:在每一轮联邦迁移学习的训练过程中,获取各节点的模型权重,判断各节点的模型权重是否相等;若各节点的模型权重不相等,则对各节点的模型权重进行更新,以用于本轮联邦迁移学习的训练过程。
在一实施例中,处理器702在执行所述若各节点的模型权重不相等,则对各节点的模型权重进行更新,以用于本轮联邦迁移学习的训练过程的步骤时,执行如下操作:按下述公式对各节点的模型权重进行更新:ωk+1←ωk+μFk(ωk),ωk表示当前节点在当前训练轮次的模型权重,ωk+1表示当前节点更新后的模型权重,μ为学习率,Fk表示当前节点的训练数据量占所有节点的总训练数据量的比重。
在一实施例中,处理器702在执行所述利用各节点训练得到的梯度值对所述原始神经网络模型进行更新,得到最终神经网络模型的步骤时,执行如下操作:按各节点的模型权重对各节点训练得到的梯度值进行加权平均,得到平均梯度;利用所述平均梯度对所述原始神经网络模型进行更新,得到最终神经网络模型。
在一实施例中,处理器702在执行所述将所述训练集样本中用于描述患者患病状态的特征项的数据,作为所述原始神经网络模型的标签;以及将用于描述患者临床表现数据的特征项的数据,作为所述原始神经网络模型的输入数据的步骤时,执行如下操作:采用同态加密技术对所述训练集样本中的数据进行加密。
本领域技术人员可以理解,图7中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图7所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器702可以是中央处理单元(CentralProcessingUnit,CPU),该处理器702还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,包括:
数据集获取单元,用于获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;
交集选取单元,用于从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;
模型训练单元,用于基于所述训练集样本,对原始神经网络模型进行训练;
联邦迁移单元,用于基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
2.根据权利要求1所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述模型训练单元包括:
数据输入单元,用于将所述训练集样本中用于描述患者患病状态的特征项的数据,作为所述原始神经网络模型的标签;以及将用于描述患者临床表现数据的特征项的数据,作为所述原始神经网络模型的输入数据;
模型训练子单元,用于基于所述输入数据对所述原始神经网络模型进行训练,得到训练好的所述原始神经网络模型。
3.根据权利要求1所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述模型训练单元还包括:
测试集选取单元,用于将所述病例数据集A和病例数据集B之间的非交集数据作为测试集样本;
测试单元,用于基于所述测试集样本对所述原始神经网络模型进行测试。
4.根据权利要求1所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述联邦迁移单元包括:
模型获取单元,用于获取所述训练好的所述原始神经网络模型;
联邦迁移学习单元,用于利用各节点存储的各类神经退行性疾病的训练集样本对所述原始神经网络模型进行联邦迁移学习;
梯度更新单元,用于利用各节点训练得到的梯度值对所述原始神经网络模型进行更新,得到最终神经网络模型。
5.根据权利要求4所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述联邦迁移学习单元包括:
权重判断单元,用于在每一轮联邦迁移学习的训练过程中,获取各节点的模型权重,判断各节点的模型权重是否相等;
权重更新单元,用于若各节点的模型权重不相等,则对各节点的模型权重进行更新,以用于本轮联邦迁移学习的训练过程。
6.根据权利要求5所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述权重更新单元包括:
权重更新子单元,用于按下述公式对各节点的模型权重进行更新:
ωk+1←ωk+μFk(ωk)
ωk表示当前节点在当前训练轮次的模型权重,ωk+1表示当前节点更新后的模型权重,μ为学习率,Fk表示当前节点的训练数据量占所有节点的总训练数据量的比重。
7.根据权利要求5所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述梯度更新单元包括:
加权平均单元,用于按各节点的模型权重对各节点训练得到的梯度值进行加权平均,得到平均梯度;
梯度更新子单元,用于利用所述平均梯度对所述原始神经网络模型进行更新,得到最终神经网络模型。
8.根据权利要求2所述的基于联邦迁移学习的神经退行性疾病建模装置,其特征在于,所述数据输入单元包括:
加密单元,用于采用同态加密技术对所述训练集样本中的数据进行加密。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现以下步骤:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行如下步骤:获取第一类神经退行性疾病患者的病历数据集A和病历数据集B,所述病历数据集A包括由第一特征项集描述的多条数据,所述病历数据集B包括由第二特征项集描述的多条数据;第一特征项集包括用于描述患者身份的特征项以及用于描述患者患病状态的特征项;第二特征项集包括用于描述患者身份的特征项以及用于描述患者临床表现数据的特征项;从所述病例数据集A和病例数据集B之间选取交集数据,将所述交集数据作为训练集样本;基于所述训练集样本,对原始神经网络模型进行训练;基于包含第一类神经退行性疾病在内的多类神经退行性疾病的训练集样本,对所述原始神经网络模型进行联邦迁移学习,得到用于预测神经退行性疾病患病程度的最终神经网络模型。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011329754.3A CN112447298A (zh) | 2020-11-24 | 2020-11-24 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
PCT/CN2021/096645 WO2022110719A1 (zh) | 2020-11-24 | 2021-05-28 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011329754.3A CN112447298A (zh) | 2020-11-24 | 2020-11-24 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112447298A true CN112447298A (zh) | 2021-03-05 |
Family
ID=74737826
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011329754.3A Pending CN112447298A (zh) | 2020-11-24 | 2020-11-24 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112447298A (zh) |
WO (1) | WO2022110719A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113057587A (zh) * | 2021-03-17 | 2021-07-02 | 上海电气集团股份有限公司 | 一种病症预警方法、装置、电子设备及存储介质 |
WO2022110719A1 (zh) * | 2020-11-24 | 2022-06-02 | 平安科技(深圳)有限公司 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115223709B (zh) * | 2022-07-26 | 2024-01-23 | 内蒙古卫数数据科技有限公司 | 基于布病诊断神经网络模型的缺失值填补迁移学习方法 |
CN116759100B (zh) * | 2023-08-22 | 2023-10-31 | 中国人民解放军总医院 | 基于联邦学习构建慢性心血管疾病大模型方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492420A (zh) * | 2018-12-28 | 2019-03-19 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法、终端、系统及介质 |
CN110399742A (zh) * | 2019-07-29 | 2019-11-01 | 深圳前海微众银行股份有限公司 | 一种联邦迁移学习模型的训练、预测方法及装置 |
CN110444263A (zh) * | 2019-08-21 | 2019-11-12 | 深圳前海微众银行股份有限公司 | 基于联邦学习的疾病数据处理方法、装置、设备及介质 |
CN110874484A (zh) * | 2019-10-16 | 2020-03-10 | 众安信息技术服务有限公司 | 基于神经网络和联邦学习的数据处理方法和系统 |
CN111091200A (zh) * | 2019-12-20 | 2020-05-01 | 深圳前海微众银行股份有限公司 | 训练模型的更新方法、系统、智能体、服务器及存储介质 |
CN111428881A (zh) * | 2020-03-20 | 2020-07-17 | 深圳前海微众银行股份有限公司 | 识别模型的训练方法、装置、设备及可读存储介质 |
CN111477336A (zh) * | 2020-04-07 | 2020-07-31 | 中南大学 | 传染病诊断数据的融合方法、系统及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2027559B1 (en) * | 2006-06-09 | 2012-05-23 | Bracco S.P.A. | Method of processing multichannel and multivariate signals and method of classifying sources of multichannel and multivariate signals operating according to such processing method |
CN109686441A (zh) * | 2018-12-21 | 2019-04-26 | 质直(上海)教育科技有限公司 | 一种大数据医疗数据特征提取和智能分析预测方法 |
CN110459324B (zh) * | 2019-06-27 | 2023-05-23 | 平安科技(深圳)有限公司 | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 |
CN111915584B (zh) * | 2020-07-29 | 2024-06-07 | 杭州健培科技有限公司 | 一种基于ct影像的病灶随访评估方法及系统 |
CN112447298A (zh) * | 2020-11-24 | 2021-03-05 | 平安科技(深圳)有限公司 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
-
2020
- 2020-11-24 CN CN202011329754.3A patent/CN112447298A/zh active Pending
-
2021
- 2021-05-28 WO PCT/CN2021/096645 patent/WO2022110719A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109492420A (zh) * | 2018-12-28 | 2019-03-19 | 深圳前海微众银行股份有限公司 | 基于联邦学习的模型参数训练方法、终端、系统及介质 |
CN110399742A (zh) * | 2019-07-29 | 2019-11-01 | 深圳前海微众银行股份有限公司 | 一种联邦迁移学习模型的训练、预测方法及装置 |
CN110444263A (zh) * | 2019-08-21 | 2019-11-12 | 深圳前海微众银行股份有限公司 | 基于联邦学习的疾病数据处理方法、装置、设备及介质 |
CN110874484A (zh) * | 2019-10-16 | 2020-03-10 | 众安信息技术服务有限公司 | 基于神经网络和联邦学习的数据处理方法和系统 |
CN111091200A (zh) * | 2019-12-20 | 2020-05-01 | 深圳前海微众银行股份有限公司 | 训练模型的更新方法、系统、智能体、服务器及存储介质 |
CN111428881A (zh) * | 2020-03-20 | 2020-07-17 | 深圳前海微众银行股份有限公司 | 识别模型的训练方法、装置、设备及可读存储介质 |
CN111477336A (zh) * | 2020-04-07 | 2020-07-31 | 中南大学 | 传染病诊断数据的融合方法、系统及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022110719A1 (zh) * | 2020-11-24 | 2022-06-02 | 平安科技(深圳)有限公司 | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 |
CN113057587A (zh) * | 2021-03-17 | 2021-07-02 | 上海电气集团股份有限公司 | 一种病症预警方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022110719A1 (zh) | 2022-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112447298A (zh) | 基于联邦迁移学习的神经退行性疾病建模装置及相关设备 | |
Fonteijn et al. | An event-based model for disease progression and its application in familial Alzheimer's disease and Huntington's disease | |
Men et al. | Estimate the incubation period of coronavirus 2019 (COVID-19) | |
US6741888B2 (en) | Method and apparatus for estimating degree of neuronal impairment in brain cortex | |
Hassan-Smith et al. | Epidemiology and diagnosis of multiple sclerosis | |
Li et al. | Nonparametric and semiparametric estimation of the three way receiver operating characteristic surface | |
JP7141711B2 (ja) | 予後予測システム、予後予測プログラム作成装置、予後予測装置、予後予測方法及び予後予測プログラム | |
WO2019223508A1 (zh) | 阿尔兹海默病症分级评估模型创建方法及计算机装置 | |
Solmaz et al. | Assessing connectivity related injury burden in diffuse traumatic brain injury | |
US20130191153A1 (en) | Assessing Variation In Clinical Response Data Based On A Computational Representation Of Neural Or Psychological Processes Underlying Performance On A Brain Function Test | |
Vandermosten et al. | White matter pathways mediate parental effects on children’s reading precursors | |
JP2023519581A (ja) | 網膜信号データを処理し、状態を識別するためのシステムおよび方法 | |
Guo et al. | Enhanced effective connectivity in mild occipital stroke patients with hemianopia | |
Stankeviciute et al. | Population graph GNNs for brain age prediction | |
Gold et al. | Correspondence between symptoms and preference-based health status measures in the STOP study | |
Keator et al. | Application of the dual stream model to neurodegenerative disease: evidence from a multivariate classification tool in primary progressive aphasia | |
Liu et al. | The application of the machine learning method in electromyographic data | |
Heinssen et al. | Overcoming barriers to research in early serious mental illness: issues for future collaboration | |
WO2023216293A1 (zh) | 预测痴呆症或轻度认知障碍的系统和方法 | |
Maini et al. | Artificial intelligence-futuristic pediatric healthcare | |
KR102142694B1 (ko) | 뇌신경 질환 진단 시스템 및 방법 | |
Oskooyee et al. | Predicting the severity of major depression disorder with the Markov chain model | |
JP2022551325A (ja) | 診断ツール | |
Naseri et al. | Data-efficient machine learning methods in the ME-TIME study: Rationale and design of a longitudinal study to detect atrial fibrillation and heart failure from wearables | |
Oliveira | Evaluation and prediction of multiple sclerosis disease progression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40041526 Country of ref document: HK |
|
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210305 |
|
RJ01 | Rejection of invention patent application after publication |