CN112289448A

CN112289448A - 一种基于联合学习的健康风险预测方法和装置

Info

Publication number: CN112289448A
Application number: CN202011231941.8A
Authority: CN
Inventors: 黄信
Original assignee: Ennew Digital Technology Co Ltd
Current assignee: Ennew Digital Technology Co Ltd
Priority date: 2020-11-06
Filing date: 2020-11-06
Publication date: 2021-01-29

Abstract

本发明公开了一种基于联合学习的健康风险预测方法和装置，包括生成健康风险预测的初始模型；根据所述初始模型，获取加密的训练参数或梯度；聚合所述训练参数或梯度，对所述初始模型进行更新；将所述联合学习预测模型发送给参与训练的医疗机构；检测所述联合学习预测模型的训练信息，其中所述训练信息包含模型精度和训练次数；当所述训练信息满足预设条件时，完成所述联合学习预测模型的更新。本发明在保证数据敏感隐私信息的基础上，使多个医疗机构参与者可以在本地共同构建模型，不需要相互传输数据，从而解决了诸如数据孤岛、数据隐私、数据访问权、数据量小等关键问题。

Description

一种基于联合学习的健康风险预测方法和装置

技术领域

本发明涉及计算机技术领域，特别涉及一种基于联合学习的健康风险预测方法、装置、可读存储介质及计算设备。

背景技术

在医学领域中，风险预测是一个具有前瞻性和重大现实意义的研究任务，往往需要大量长时间连续的数据，而现实生活中，绝大多数医疗机构的慢病患者都存在数据量少，数据质量差的问题，不足以支撑慢病风险预测的实现。

人工智能传统的处理方式是通过集中不同节点的数据实现训练样本数的扩充，然而，现代社会对数据隐私、安全的要求越来越严格，相关数据隐私法律法规的出现对人工智能传统的处理方式提出新的挑战。比方说，在医疗保健领域，不同医院、不同人群的电子病历、体检数据、影像数据等非常敏感，它们之间没有办法集中数据，加之考虑到用户隐私、商业利益、监管的要求等，我们面临的是小数据和一个个数据孤岛，而人工智能需要的恰恰是大数据，很难在合规的前提下得到充分有效的利用。

发明内容

本发明旨在至少在一定程度上解决上述技术问题中的至少一个。

为此，本发明的第一个目的在于提出一种基于联合学习的健康风险预测方法，即在保证数据敏感隐私信息的基础上，使多个医疗机构参与者可以在本地共同构建模型，不需要相互传输数据，实现敏感小数据的“聚沙成塔”，从而解决了诸如数据隐私，数据访问权，小数据等关键问题。

本发明的第二个目的在于提出一种基于联合学习的健康风险预测装置，即在保证数据敏感隐私信息的基础上，使多个医疗机构参与者可以在本地共同构建模型，不需要相互传输数据，实现敏感小数据的“聚沙成塔”，从而解决了诸如数据隐私，数据访问权，小数据等关键问题。

本发明的第三个目的在于提出一种可读存储介质。

本发明的第四个目的在于提出一种计算设备。

第一方面，本发明实施例提供了一种基于联合学习的健康风险预测方法，包括：

生成健康风险预测的初始模型；

根据所述初始模型，获取加密的训练参数或梯度；其中，所述训练参数或梯度由医疗机构根据其医疗样本对所述初始模型训练获得；

聚合所述训练参数或梯度，对所述初始模型进行更新，以得到联合学习预测模型；

将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构根据其医疗样本对所述联合学习预测模型训练获得训练参数或梯度；

检测所述联合学习预测模型的训练信息，其中所述训练信息包含模型精度和训练次数；

当所述训练信息满足预设条件时，完成所述联合学习预测模型的更新。

可选地，所述生成健康风险预测的初始模型，包括：

将参与训练的全部医疗机构的全部本地预测模型中符合预设条件的本地预测模型作为所述初始模型。

可选地，所述根据所述初始模型，获取加密的训练参数或梯度，包括：

将所述初始模型发送给各个参与训练的所述医疗机构；

接收所述医疗机构上传的加密训练参数或梯度，其中所述训练参数或梯度由各个所述医疗机构根据其本地医疗样本对所述初始模型训练获得；所述加密的方法包括同态加密、多方安全计算和差分隐私。

可选地，所述聚合所述训练参数或梯度，对所述初始模型进行更新，以得到联合学习预测模型，包括：

计算全部所述训练参数或梯度的均值，将获得的均值作为更新参数；

使用所述更新参数对所述初始模型进行更新，获得所述联合学习预测模型。

可选地，该健康风险预测方法还包括：

当所述训练信息不满足预设条件时，将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构对所述联合学习预测模型获得训练参数或梯度，直到所述训练信息满足预设条件。

第二方面，本发明实施例提供了一种基于联合学习的健康风险预测装置，该装置包括：模型初始化模块、参数获取模块、参数更新模块、模型发送模块、训练检测模块和停止训练模块，其中，

所述模型初始化模块，用于生成健康风险预测的初始模型；

所述参数获取模块，用于根据所述初始模型，获取加密的训练参数或梯度；其中，所述训练参数或梯度由医疗机构根据其医疗样本对所述初始模型训练获得；

所述参数更新模块，用于聚合所述训练参数或梯度，对所述初始模型进行更新，以得到联合学习预测模型；

所述模型发送模块，用于将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构根据其医疗样本对所述联合学习预测模型训练获得训练参数或梯度；

所述训练检测模块，用于检测所述联合学习预测模型的训练信息，其中所述训练信息包含模型精度和训练次数；

所述停止训练模块，用于当所述训练信息满足预设条件时，完成所述联合学习预测模型的更新。

可选地，所述模型初始化模块具体用于将参与训练的全部医疗机构的全部本地预测模型中符合预设条件的本地预测模型作为所述初始模型。

可选地，所述参数获取模块包括模型分发单元和参数接收单元，其中，

所述模型分发单元，用于将所述初始模型发送给各个参与训练的所述医疗机构；

所述参数接收单元，用于接收所述医疗机构上传的加密训练参数或梯度，其中所述训练参数或梯度由各个所述医疗机构根据其本地医疗样本对所述初始模型训练获得；所述加密的方法包括同态加密、多方安全计算和差分隐私。

可选地，所述参数更新模块包括参数计算单元和参数替换单元，其中，

所述参数计算单元，用于计算全部所述训练参数或梯度的均值，将获得的均值作为更新参数；

所述参数替换单元，用于使用所述更新参数对所述初始模型进行更新，获得所述联合学习预测模型。

可选地，所述停止训练模块还用于当所述训练信息不满足预设条件时，将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构对所述联合学习预测模型获得训练参数或梯度，直到所述训练信息满足预设条件。

第三方面，本发明实施例提供了一种可读存储介质，其上具有可执行指令，当可执行指令被执行时，使得计算机执行如第一方面中的所包括的方法。

第四方面，本发明实施例提供了一种计算设备，包括：一个或多个处理器、存储器，以及一个或多个程序，其中，所述一个或多个程序存储在所述存储器中并被配置为由所述一个或多个处理器执行如第一方面中所包括的方法。

与现有技术相比，本发明至少具有以下有益效果：

本发明在保证数据敏感隐私信息的基础上，使多个医疗机构参与者可以在本地共同构建模型，不需要相互传输数据，实现敏感小数据的“聚沙成塔”，从而解决了诸如数据孤岛、数据隐私、数据访问权、数据量小等关键问题，适用于参与者慢病类型相同但触达患者不同的情况，比如不同地区、不同医疗机构的糖尿病患者或者高血压患者等，虽然慢病类型相同，但患者样本量不同。并且附加的优点会在下面的具体实施例中给出，也会在下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的一种基于联合学习的健康风险预测方法流程示意图；

图2是本发明一个实施例提供的一种基于联合学习的健康风险预测装置结构框图；

图3是本发明一个实施例提供的一种基于联合学习的健康风险预测系统的结构框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种基于联合学习的健康风险预测方法，包括：

生成健康风险预测的初始模型；

检测所述联合学习预测模型的训练信息，其中所述训练信息包含模型精度和循环次数；

在该实施例中，在保证数据敏感隐私信息的基础上，使多个医疗机构参与者可以在本地共同构建模型，不需要相互传输数据，实现敏感小数据的“聚沙成塔”，从而解决了诸如数据孤岛、数据隐私、数据访问权、小数据等关键问题。

值得说明的是，在该实施例中，生成健康风险预测的初始模型、获取加密的训练参数或梯度、聚合训练参数或梯度，对初始模型进行更新、将联合学习预测模型发送给参与训练的医疗机构以及检测联合学习预测模型的训练信息均可以由服务器完成，各个医疗机构对服务器进行响应，配合服务器完成健康风险预测。对于更新完成的联合学习预测模型可以对用户进行健康风险预测。

在本发明一个实施例中，所述生成健康风险预测的初始模型，包括：

在该实施例中，联邦学习的目标是各方共同训练一个模型，所以要求模型的网络结构相同，参与训练各方都在初始模型的结构下进行训练，关于初始模型的选择，通用的机器学习、深度学习模型等都可以。而在该实施例中从参与训练的医疗机构的全部本地预测模型中选择相对成熟模型作为初始模型，可以减少联邦学习的训练开销，比如，有n家医院参与训练，n家医院中有m个本地预测模型，那么就从m个本地预测模型中选择一个相对好的(从数据质量、模型效果等考虑来设定选择条件)作为初始模型。

在本发明一个实施例中，所述根据所述初始模型，获取加密的训练参数或梯度，包括：

将所述初始模型发送给各个参与训练的所述医疗机构；

在该实施例中，在初始化的时候，把初始模型发给参与训练的各个医院节点也就是医疗机构，每个参与训练的医院节点方利用本地数据训练模型，并把训练参数或梯度加密之后上传给服务器。本地数据包括本地医疗样本，根据不同的预测目的选择不同的模型使用相应的医疗样本进行模型的训练。

参与训练的各个医院节点，利用本地数据对初始模型进行训练，得到了各个医院节点相应的训练参数(权重和偏置)，各个医院节点训练出来的训练参数只适合该医院节点的数据，不适合其它的参与训练的医院节点的数据，所以全部参与训练的医院节点需要把自身的训练参数加密上传，进而聚合得到一个更加普适的参数。对训练参数的加密上传涉及的加密方法有同态加密、多方安全计算、差分隐私等。

在本发明一个实施例中，所述聚合所述训练参数或梯度，对所述初始模型进行更新，以得到联合学习预测模型，包括：

在该实施例中，采取的聚合方式为梯度平均，比如说服务器收到不同医院节点的训练参数或梯度以后进行平均，而不是用原始的训练参数或梯度，此时即为更新，服务器把平均之后的训练参数或梯度返回给各个医院节点，各个医院节点在新的训练参数或梯度基础上进行训练。

在本发明中，该健康风险预测方法还包括：

在该实施例中，重复训练过程，直到初始模型被训练后的精度到达需求，或者到达一定的训练次数。初始模型更新训练参数或梯度即为训练一次。根据实际业务需求模型的精度要求和模型的训练次数要求可进行相应的设定。

为了更好理解本发明的方法，下面结合实例对本发明进行说明。如对慢性病糖尿病的风险预测，假设联合了3家医疗机构，每家医疗机构有连续5年跟踪分析的个人数据分别为m、n和k条，要预测个体未来1-3年的患病几率，有效期到体检数据和生活方式发生变化为止，方法可以包括：

服务器生成一个初始模型；

将初始模型下发给3家医疗机构，每家医疗机构在各自本地的数据集上进行初始模型的训练，将训练得到的训练参数或梯度加密之后发送给服务器；

服务器聚合(比如求平均值或中位数值)3家医疗机构的训练参数或梯度并更新初始模型的参数，并将更新后的参数梯度下发给3家医疗机构；

重复以上训练过程，直至初始模型达到一定的循环次数或精度要求。

本发明实施例通过对分布在不同医疗机构的数据开展横向联邦学习，即样本的联合，解决数据孤岛、数据隐私的问题，适用于参与者慢病类型相同但触达患者不同的情况，比如不同地区、不同医疗机构的糖尿病患者或者高血压患者，虽然慢病类型相同，但患者样本量不同。使多个参与者可以在本地共同构建模型，不仅保护参与者隐私，还提升单个模型的表现效果。

如图2所示，本发明实施例提供了一种基于联合学习的健康风险预测装置，该装置包括：模型初始化模块、参数获取模块、参数更新模块、模型发送模块、训练检测模块和停止训练模块，其中，

所述模型初始化模块，用于生成健康风险预测的初始模型；

所述训练检测模块，用于检测所述联合学习预测模型的训练信息，其中所述训练信息包含模型精度和循环次数；

在本发明一个实施例中，所述模型初始化模块具体用于将参与训练的全部医疗机构的全部本地预测模型中符合预设条件的本地预测模型作为所述初始模型。

在本发明一个实施例中，所述参数获取模块包括模型分发单元和参数接收单元，其中，

在本发明一个实施例中，所述参数更新模块包括参数计算单元和参数替换单元，其中，

在本发明一个实施例中，所述停止训练模块还用于当所述训练信息不满足预设条件时，将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构对所述联合学习预测模型获得训练参数或梯度，直到所述训练信息满足预设条件。

上述装置内的各模块和单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

如图3所示，本发明实施例提供了一种医疗风险预测模型训练系统，该医疗风险预测系统包括：具有基于联合学习的健康风险预测装置的服务器和至少两个参与训练的训练节点。

例如慢性病糖尿病风险预测案例，假设联合了3家医院(作为训练节点)，每家医院连续5年跟踪分析的个人数据分别为m、n、k条，预测的是个体未来1-3年的患病几率，有效期到体检数据和生活方式发生变化为止，步骤如下：

服务器(具有基于联合学习的健康风险预测装置)生成一个初始模型，下发给3家医院，每家医院在各自本地的数据集上进行训练，将训练好的参数或梯度加密之后发送给服务器，服务器聚合(比如求平均值或中位数值)3家医院的参数或梯度并更新模型参数，并将更新后的参数梯度返回给3家医院，重复以上训练，直至初始模型达到一定的循环次数或精度要求。

本发明通过对分布在不同医疗机构的数据开展横向联邦学习，即样本的联合，解决数据孤岛、数据隐私的问题，适用于参与者慢病类型相同但触达患者不同的情况，比如不同地区、不同医疗机构的糖尿病患者或者高血压患者，虽然慢病类型相同，但患者样本量不同。

应当理解，这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如软盘、CD-ROM、硬盘驱动器或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被该机器执行时，该机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的该程序代码中的指令，执行本发明的各种方法。

以示例而非限制的方式，计算机可读介质包括计算机存储介质和通信介质。计算机可读介质包括计算机存储介质和通信介质。计算机存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在计算机可读介质的范围之内。

应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面发明的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所发明的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中发明的所有特征以及如此发明的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中发明的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的发明是说明性的，而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种基于联合学习的健康风险预测方法，其特征在于，包括：

生成健康风险预测的初始模型；

2.根据权利要求1所述基于联合学习的健康风险预测方法，其特征在于，所述生成健康风险预测的初始模型，包括：

3.根据权利要求1所述基于联合学习的健康风险预测方法，其特征在于，所述根据所述初始模型，获取加密的训练参数或梯度，包括：

将所述初始模型发送给各个参与训练的所述医疗机构；

4.根据权利要求1所述基于联合学习的健康风险预测方法，其特征在于，所述聚合所述训练参数或梯度，对所述初始模型进行更新，以得到联合学习预测模型，包括：

5.根据权利要求1-4任一所述基于联合学习的健康风险预测方法，其特征在于，该健康风险预测方法还包括：

6.一种基于联合学习的健康风险预测装置，其特征在于，该装置包括：模型初始化模块、参数获取模块、参数更新模块、模型发送模块、训练检测模块和停止训练模块，其中，

所述模型初始化模块，用于生成健康风险预测的初始模型；

7.根据权利要求6所述基于联合学习的健康风险预测装置，其特征在于，所述模型初始化模块具体用于将参与训练的全部医疗机构的全部本地预测模型中符合预设条件的本地预测模型作为所述初始模型。

8.根据权利要求6所述基于联合学习的健康风险预测装置，其特征在于，所述参数获取模块包括模型分发单元和参数接收单元，其中，

9.根据权利要求6所述基于联合学习的健康风险预测装置，其特征在于，所述参数更新模块包括参数计算单元和参数替换单元，其中，

10.根据权利要求6-9任一所述基于联合学习的健康风险预测装置，其特征在于，所述停止训练模块还用于当所述训练信息不满足预设条件时，将所述联合学习预测模型发送给参与训练的医疗机构，以使所述医疗机构对所述联合学习预测模型获得训练参数或梯度，直到所述训练信息满足预设条件。