CN112447299A - 医护资源预测模型训练方法、装置、设备及存储介质 - Google Patents
医护资源预测模型训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112447299A CN112447299A CN202011384348.7A CN202011384348A CN112447299A CN 112447299 A CN112447299 A CN 112447299A CN 202011384348 A CN202011384348 A CN 202011384348A CN 112447299 A CN112447299 A CN 112447299A
- Authority
- CN
- China
- Prior art keywords
- model
- parameters
- training
- local
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 146
- 238000000034 method Methods 0.000 title claims abstract description 52
- 230000002776 aggregation Effects 0.000 claims abstract description 74
- 238000004220 aggregation Methods 0.000 claims abstract description 74
- 230000006870 function Effects 0.000 claims description 52
- 201000010099 disease Diseases 0.000 claims description 29
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000003745 diagnosis Methods 0.000 claims description 11
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000007405 data analysis Methods 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 6
- 238000006116 polymerization reaction Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 238000010276 construction Methods 0.000 description 4
- 208000001647 Renal Insufficiency Diseases 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 201000006370 kidney failure Diseases 0.000 description 3
- 208000002251 Dissecting Aneurysm Diseases 0.000 description 2
- 206010002895 aortic dissection Diseases 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 208000022540 Consciousness disease Diseases 0.000 description 1
- 208000028782 Hereditary disease Diseases 0.000 description 1
- 208000002682 Hyperkalemia Diseases 0.000 description 1
- 206010020802 Hypertensive crisis Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 208000024556 Mendelian disease Diseases 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请涉及人工智能领域,可应用于智慧城市的智慧医疗领域中,具体公开了一种医护资源预测模型训练方法、装置、设备及存储介质,所述方法包括:分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。以提高训练得到的医护资源推荐配置模型的预测准确率。
Description
技术领域
本申请涉及模型构建领域,尤其涉及一种医护资源预测模型训练方法、装置、设备及存储介质。
背景技术
随着人们平均寿命的增长,全国各类医疗机构的入院人数也不断增加,入院患者数量的增加一方面增加了医疗数据的数据量,另一方面也导致医护人员的工作量加大,需要对医护资源进行合理配置,以便于实现医护资源的效益最大化。尤其是当出现突发流行性疾病时,大量患者在一段时间内聚集入院,更需要对医护资源进行合理的配置,应对突发事件。
为了对医护资源进行合理配置,可以利用大量的医疗数据来训练医护资源推荐配置模型,以便于医疗机构根据预测结果来对医护资源进行配置。但由于不同医疗机构之间医疗数据不流通,导致大量的医疗数据不能够进行合理的利用,导致训练出的医护资源推荐配置模型的预测准确率较低。
发明内容
本申请提供了一种医护资源预测模型训练方法、装置、设备及存储介质,以提高训练得到的医护资源推荐配置模型的预测准确率。
第一方面,本申请提供了一种医护资源预测模型训练方法,所述方法包括:
分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
第二方面,本申请还提供了一种医护资源预测模型训练装置,所述装置包括:
本地训练模块,用于分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;参数发送模块,用于分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;模型更新模块,用于接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;更新完成模块,用于当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的医护资源预测模型训练方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的医护资源预测模型训练方法。
本申请公开了一种医护资源预测模型训练方法、装置、设备及存储介质,通过获取本地的样本医疗数据,根据服务器下发的初始模型参数和样本医疗数据训练本地模型,然后分别计算本地模型的模型中间参数,将模型中间参数发送至服务器,使服务器基于模型中间参数进行计算,得到聚合参数;最终接收服务器下发的聚合参数,并根据聚合参数更新本地模型,得到更新后的本地模型,当更新后的本地模型均收敛时,完成模型训练,将更新后的本地模型作为医护资源预测模型。利用联邦学习的方式训练医护资源预测模型,避免了不同参与方之间的数据共享,保证了数据的隐私性,同时也能够扩大用于模型训练的样本数量,提高了训练得到的医护资源预测模型的预测准确度。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种医护资源预测模型训练方法的示意流程图;
图2是本申请实施例提供的训练本地模型的步骤示意图;
图3是本申请实施例提供的另一种医护资源预测模型训练方法的示意流程图;
图4为本申请实施例提供的一种医护资源预测模型装置的示意性框图;
图5为本申请实施例提供的另一种医护资源预测模型装置的示意性框图;
图6为本申请实施例提供的一种计算机设备的结构示意性框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
本申请的实施例提供了一种医护资源预测模型训练方法、装置、计算机设备及存储介质。医护资源预测模型训练方法可用于训练医护资源预测模型,用于预测入院患者所需要配备的医护资源,以便于根据预测结果对医护资源进行合理的调配。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种医护资源预测模型训练方法的示意流程图。该医护资源预测模型训练方法通过使用联邦学习的方法,实现多个客户端进行模型的联合训练,既保证了数据的隐私性,也提高了训练得到的医护资源预测模型的预测准确度。本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。
如图1所示,该医护资源预测模型训练方法,具体包括:步骤S101至步骤S104。
S101、分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型。
对于不同区域、不同类型的医疗机构,其医疗数据并不互通,因此,对于每个参与训练医护资源预测模型的医疗机构(以下称参与方),分别获取其本地的样本医疗数据。并且服务器向各个参与方发送模型初始参数,各个参与方基于服务器下发的模型初始参数和样本医疗数据各自在本地训练本地模型。
在一实施例中,样本医疗数据包括患者的患者信息和诊疗记录。请参阅图2,训练本地模型的步骤可以包括步骤S1011至步骤S1013。
S1011、对所述患者的诊疗记录进行数据分析,得到所述患者的患病类型、患病程度和医护配置。
其中,患者的患者信息包括患者的年龄和性别,此外,患者的患者信息还可以包括其他信息,比如民族、家庭住址、工作单位、婚姻状况等,为了提高加快本地模型的收敛速度以及训练得到的本地模型的预测准确度,患者的患者信息可以仅包括与疾病相关性较大的信息,例如,年龄和性别。
患者的诊疗记录包括患者的现病史、既往史、个人史、家族史和就诊过程。现病史是指患者自当次疾病发病后至入院后进行初步检查后得出的检查结论。既往史是指患者的过往病史以及过往病史的诊疗过程。个人史是指患者的历史生活环境以及生活习惯,例如是否有疫区、疫情、疫水居住史,是否有毒品接触史,是否有饮酒、吸烟史等。家族史是指患者是否家族中有传染病或有家族性遗传病。就诊过程包括了患者在一次疾病治疗过程中的主治医生、管床医生、护士、护工等信息。
在获取到患者的诊疗记录后,首先对患者的诊疗记录进行数据分析,得到患者的患病类型、患病程度和医护配置。
其中,在进行数据分析时,可利用关键词提取的方式从患者的诊疗记录中得到患者的患病类型、患病程度和医护配置。
在患者因突发性疾病或慢性疾病入院治疗时,医生在进行诊断后会在现病史中写入患者的患病类型和患病程度。在医生进行诊断后,患者的诊疗记录中即会留下该医生的姓名和职位等信息,并且患者每接触一个医生、护士或者护工,都会在患者的诊疗记录中进行记录。
以患者因某种突发性疾病就医为例,当患者被收入急诊抢救间后,在患者的诊疗记录中的现病史部分中出现“以意识障碍;高血压危象;高钾血症;肾功能衰竭收入急诊抢救间”等字样,因此可以通过对诊疗记录进行关键词提取,从中提取出急诊医生对于患者病情的诊断结果。
S1012、根据所述患者的患者信息、患病类型和患病程度构建训练样本,并将所述患者的医护配置作为所述训练样本的样本标签。
根据一个患者的患者信息、患病类型和患病程度构建一个训练样本,然后将该患者的医护配置作为此训练样本的样本标签。将各个患者的患者信息、患病类型和患病程度分别与患者的医护配置进行一一对应,从而构建出多个训练样本,以便于根据构建出的多个训练样本进行模型训练。
例如,患者年龄45岁,患肾功能衰竭,患病程度严重,配备一个主治医生、一个管床医生和一个护士,共三位负责人。构建的训训练样本为年龄45岁,患肾功能衰竭,患病程度严重,样本标签为三。
又例如,患者年龄17岁,患主动脉夹层,患病程度严重,配备两个主治医生、一个管床医生和一个护士,共四位负责人。构建的训练样本为年龄17岁,患主动脉夹层,患病程度严重,样本标签为四。
S1013、将所述训练样本和所述训练样本的样本标签输入深度神经网络进行模型训练,当训练的深度神经网络模型收敛时,得到本地模型。
将训练样本和训练样本的样本标签分别输入深度神经网络中,对深度神经网络进行模型训练,并计算深度神经网络的损失函数值,当深度神经网络的损失函数值为0、或者在经过多次迭代训练损失函数值已为最小值时、或者深度神经网络进行迭代训练的次数已经达到预设次数时,认为训练的深度神经网络模型已经收敛,将收敛的深度神经网络模型作为本地模型。
各个参与方可以将患者的患者信息、患病类型和患病程度作为本地模型的输入,由本地模型预测患者所应该配置的医护配置。
S102、分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数。
在各个参与方均训练好各自的本地模型后,分别计算各自训练的本地模型的模型中间参数,然后将计算出的模型中间参数发送给服务器,使服务器根据各个参与方发送的模型中间参数计算聚合参数。
在一实施例中,分别计算各个所述本地模型的模型中间参数,包括:分别计算各个所述本地模型的损失函数;基于第一计算公式,根据所述损失函数分别计算各个本地模型的模型中间参数;所述第一计算公式为:
各个参与方分别计算自己训练的本地模型的损失函数,在具体实施过程中,各个参与方在训练本地模型时所使用的损失函数可以是相同的。
然后基于第一计算公式,根据损失函数分别计算各个本地模型的模型中间参数。采用梯度下降法最小化损失函数,当损失函数最小化时,认为此时本地模型已经训练完成,将此时的模型参数作为模型中间参数发送给服务器,使服务器计算聚合参数。
在一实施例中,由于各个参与方本地的数据量不同,导致各个参与方训练本地模型的训练速度也不同,因此,服务器可以接收部分参与方发送的模型中间参数,根据部分参与方的模型中间参数来计算聚合参数。
在接收部分参与方发送的模型中间参数计算聚合参数后,服务器将聚合参数发送给所有的参与方,也即将聚合参数发送给已经完成训练的参与方和尚未完成训练的参与方。已经完成训练的参与方和尚未完成训练的参与方均按照聚合参数更新本地模型的参数,进行进一步的迭代训练。
在一实施例中,所述将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数,包括:将所述模型中间参数发送至所述服务器,使所述服务器基于聚合公式对所述模型中间参数进行计算得到聚合参数;所述聚合公式为:
各个参与方将计算出的模型中间参数发送给服务器,使服务器根据模型中间参数计算出聚合参数。由于服务器在不断根据各个参与方上传的模型中间参数计算聚合参数,因此,当服务器需要计算在t时刻的聚合参数时,采用梯度下降法最小化在t-1时刻的损失函数,并根据t-1时刻的聚合参数来确定t时刻的聚合参数。
S103、接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型。
服务器在计算出聚合参数后,将计算的聚合参数下发至各个参与方,各个参与方在接收到服务器下发的聚合参数后,根据聚合参数更新本地模型的参数,得到更新后的本地模型。
S104、当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
当各个参与方在更新完本地模型后,判断各自更新后的本地模型是否收敛,若每个参与方均判断更新后的本地模型收敛,则认为此时模型已经训练完成,将该更新后的本地模型作为训练得到的医护资源预测模型。
若有任意一个或多个参与方判断出更新后的本地模型未收敛,则继续根据本地的样本医疗数据对更新后的本地模型继续进行训练,并将训练完成的本地模型的模型中间参数发送给服务器,由服务器计算聚合参数,再次根据聚合参数更新本地模型,判断更新后的本地模型是否收敛。循环该过程直至所有的参与方均判断更新后的本地模型收敛,完成模型训练。
上述实施例提供的医护资源预测模型训练方法,通过获取本地的样本医疗数据,根据服务器下发的初始模型参数和样本医疗数据训练本地模型,然后分别计算本地模型的模型中间参数,将模型中间参数发送至服务器,使服务器基于模型中间参数进行计算,得到聚合参数;最终接收服务器下发的聚合参数,并根据聚合参数更新本地模型,得到更新后的本地模型,当更新后的本地模型均收敛时,完成模型训练,将更新后的本地模型作为医护资源预测模型。利用联邦学习的方式训练医护资源预测模型,避免了不同参与方之间的数据共享,保证了数据的隐私性,同时也能够扩大用于模型训练的样本数量,提高了训练得到的医护资源预测模型的预测准确度。
请参阅图3,图3是本申请实施例提供的另一种医护资源预测模型训练方法的示意流程图。
如图3所示,该医护资源预测模型训练方法,具体包括:步骤S201至步骤S204。
S201、分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型。
对于不同区域、不同类型的医疗机构,其医疗数据并不互通,因此,对于每个参与训练医护资源预测模型的医疗机构(以下称参与方),分别获取其本地的样本医疗数据。并且服务器向各个参与方发送模型初始参数,各个参与方基于服务器下发的模型初始参数和样本医疗数据各自在本地训练本地模型。
在一实施例中,训练本地模型的步骤具体包括:获取新增医疗数据,并根据所述新增医疗数据对所述样本医疗数据进行更新,得到更新后的样本医疗数据;基于服务器下发的模型初始参数和所述更新后的样本医疗数据训练本地模型。
由于各个参与方在实时接收患者,因此,参与方本地的医疗数据在不断进行更新,因此,参与方可以获取新增加的新增医疗数据,并根据新增加的新增医疗数据对样本医疗数据进行更新,得到更新后的样本医疗数据,然后基于服务器下发的模型初始参数和所述更新后的样本医疗数据训练本地模型。
其中,新增医疗数据是指相对于上一次迭代训练新增的医疗数据。
例如,本地模型在t时刻进行第一次迭代训练,此时所使用的样本医疗数据为D1,根据样本医疗数据D1对本地模型进行训练。
本地模型在t+1时刻进行第二次迭代训练时,本地产生新增医疗数据D2,此时,根据新增医疗数据D2对样本医疗数据D1进行更新,得到更新后的样本医疗数据为D1+D2,根据更新后的样本医疗数据D1+D2对本地模型进行训练。
本地模型在t+2时刻进行第三次迭代训练时,本地产生新增医疗数据D3,此时,根据新增医疗数据D3对样本医疗数据D1+D2进行更新,得到更新后的样本医疗数据为D1+D2+D3,根据更新后的样本医疗数据D1+D2+D3对本地模型进行训练。
S202、分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数。
在各个参与方均训练好各自的本地模型后,分别计算各自训练的本地模型的模型中间参数,然后将计算出的模型中间参数发送给服务器,使服务器根据各个参与方发送的模型中间参数计算聚合参数。
在一实施例中,所述将所述模型中间参数发送至所述服务器,包括:对所述模型中间参数进行数据加密,并将加密后的所述模型中间参数发送至所述服务器。
各个参与方在将模型中间参数发送给服务器时,可以对模型中间参数进行加密,然后将加密后的模型中间参数发送给服务器,保证在与服务器进行数据交互过程中数据的安全性。其中,加密方法可以采用例如同态加密等多种加密方式。
在一实施例中,所述分别计算各个所述本地模型的模型中间参数,包括:分别计算各个所述本地模型的损失函数;基于第一计算公式,根据所述损失函数分别计算各个本地模型的模型中间参数;所述第一计算公式为:
各个参与方分别计算自己训练的本地模型的损失函数,在具体实施过程中,各个参与方在训练本地模型时所使用的损失函数可以是相同的。
然后基于第一计算公式,根据损失函数分别计算各个本地模型的模型中间参数。采用梯度下降法最小化损失函数,当损失函数最小化时,认为此时本地模型已经训练完成,将此时的模型参数作为模型中间参数发送给服务器,使服务器计算聚合参数。
在一实施例中,所述分别计算各个所述本地模型的损失函数,包括:基于损失函数公式,分别计算各个所述本地模型的损失函数;所述损失函数公式为:
其中,F表示本地模型的损失函数,C表示样本医疗数据的更新次数,|c|表示样本医疗数据中的元素数量,w表示服务器下发的模型初始参数,Fc()表示每次利用更新后的样本医疗数据和模型初始参数训练出的本地模型的损失函数。
由于参与方本地的医疗数据在不断进行更新,因此,在本地模型的迭代训练过程中,本地模型在每次迭代训练时所使用的样本医疗数据可能不完全相同,进而可能会导致本地模型在每次迭代训练时的损失函数有所不同。
因此,可以记录本地模型每次迭代训练时的损失函数,然后根据样本医疗数据的更新次数来计算本地模型最终的损失函数,当得到的最终的损失函数最小时,认为此时本地模型已经训练完成。
在上述损失函数公式中,若本地模型在迭代训练过程中样本医疗数据一直未发生更新,也即本地模型的多次迭代训练所使用的样本医疗数据相同,此时C取值为1,也即C的最小值为1,当样本医疗数据发生一次更新时,C取值为2,以此类推。
S203、接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型。
服务器在计算出聚合参数后,将计算的聚合参数下发至各个参与方,各个参与方在接收到服务器下发的聚合参数后,根据聚合参数更新本地模型的参数,得到更新后的本地模型。
S204、当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
当各个参与方在更新完本地模型后,判断各自更新后的本地模型是否收敛,若每个参与方均判断更新后的本地模型收敛,则认为此时模型已经训练完成,将该更新后的本地模型作为训练得到的医护资源预测模型。
若有任意一个或多个参与方判断出更新后的本地模型未收敛,则继续根据本地的样本医疗数据对更新后的本地模型继续进行训练,并将训练完成的本地模型的模型中间参数发送给服务器,由服务器计算聚合参数,再次根据聚合参数更新本地模型,判断更新后的本地模型是否收敛。循环该过程直至所有的参与方均判断更新后的本地模型收敛,完成模型训练。
上述实施例提供的医护资源预测模型训练方法,通过获取本地的样本医疗数据,根据服务器下发的初始模型参数和样本医疗数据训练本地模型,然后分别计算本地模型的模型中间参数,将模型中间参数发送至服务器,使服务器基于模型中间参数进行计算,得到聚合参数;最终接收服务器下发的聚合参数,并根据聚合参数更新本地模型,得到更新后的本地模型,当更新后的本地模型均收敛时,完成模型训练,将更新后的本地模型作为医护资源预测模型。利用联邦学习的方式训练医护资源预测模型,避免了不同参与方之间的数据共享,保证了数据的隐私性,同时也能够扩大用于模型训练的样本数量,提高了训练得到的医护资源预测模型的预测准确度。
请参阅图4,图4是本申请的实施例提供的一种医护资源预测模型装置的示意性框图,该医护资源预测模型装置用于执行前述的医护资源预测模型方法。其中,该医护资源预测模型装置可以配置于服务器或终端中。
其中,服务器可以为独立的服务器,也可以为服务器集群。该终端可以是手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等电子设备。
如图4所示,医护资源预测模型装置300包括:本地训练模块301、参数发送模块302、模型更新模块303和更新完成模块304。
本地训练模块301,用于分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型。
其中,本地训练模块301包括数据分析子模块3011、样本构建子模块3012和模型训练子模块3013。
具体地,数据分析子模块3011,用于对所述患者的诊疗记录进行数据分析,得到所述患者的患病类型、患病程度和医护配置;样本构建子模块3012,用于根据所述患者的患者信息、患病类型和患病程度构建训练样本,并将所述患者的医护配置作为所述训练样本的样本标签;模型训练子模块3013,用于将所述训练样本和所述训练样本的样本标签输入深度神经网络进行模型训练,当训练的深度神经网络模型收敛时,得到本地模型。
参数发送模块302,用于分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数。
模型更新模块303,用于接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型。
更新完成模块304,用于当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
请参阅图5,图5是本申请的实施例提供的另一种医护资源预测模型装置的示意性框图。
如图5所示,医护资源预测模型装置400包括:本地训练模块401、参数发送模块402、模型更新模块403和更新完成模块404。
本地训练模块401,用于分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型。
参数发送模块402,用于分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数。
模型更新模块403,用于接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型。
更新完成模块404,用于当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的医护资源预测模型装置和各模块的具体工作过程,可以参考前述医护资源预测模型方法实施例中的对应过程,在此不再赘述。
上述的医护资源预测模型装置可以实现为一种计算机程序的形式,该计算机程序可以在如图6所示的计算机设备上运行。
请参阅图6,图6是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。
参阅图6,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种医护资源预测模型方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种医护资源预测模型方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
在一个实施例中,所述处理器在实现所述样本医疗数据包括患者的患者信息和诊疗记录;所述基于所述样本医疗数据训练本地模型时,用于实现:对所述患者的诊疗记录进行数据分析,得到所述患者的患病类型、患病程度和医护配置;根据所述患者的患者信息、患病类型和患病程度构建训练样本,并将所述患者的医护配置作为所述训练样本的样本标签;将所述训练样本和所述训练样本的样本标签输入深度神经网络进行模型训练,当训练的深度神经网络模型收敛时,得到本地模型。
在一个实施例中,所述处理器在实现所述基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型时,用于实现:获取新增医疗数据,并根据所述新增医疗数据对所述样本医疗数据进行更新,得到更新后的样本医疗数据;基于服务器下发的模型初始参数和所述更新后的样本医疗数据训练本地模型。
在一个实施例中,所述处理器在实现所述分别计算各个所述本地模型的模型中间参数时,用于实现:分别计算各个所述本地模型的损失函数;基于第一计算公式,根据所述损失函数分别计算各个本地模型的模型中间参数;所述第一计算公式为:
在一个实施例中,所述处理器在实现所述分别计算各个所述本地模型的损失函数时,用于实现:基于损失函数公式,分别计算各个所述本地模型的损失函数;所述损失函数公式为:
其中,F表示本地模型的损失函数,C表示样本医疗数据的更新次数,|Dc|表示样本医疗数据中的元素数量,w表示服务器下发的模型初始参数,Fc(w)表示每次利用更新后的样本医疗数据和模型初始参数训练出的本地模型的损失函数。
在一个实施例中,所述处理器在实现所述将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数时,用于实现:将所述模型中间参数发送至所述服务器,使所述服务器基于聚合公式对所述模型中间参数进行计算得到聚合参数;所述聚合公式为:
在一个实施例中,所述处理器在实现所述将所述模型中间参数发送至所述服务器时,用于实现:对所述模型中间参数进行数据加密,并将加密后的所述模型中间参数发送至所述服务器。
本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项医护资源预测模型方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种医护资源预测模型训练方法,其特征在于,包括:
分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;
分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;
接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;
当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
2.根据权利要求1所述的医护资源预测模型训练方法,其特征在于,所述样本医疗数据包括患者的患者信息和诊疗记录;所述基于所述样本医疗数据训练本地模型,包括:
对所述患者的诊疗记录进行数据分析,得到所述患者的患病类型、患病程度和医护配置;
根据所述患者的患者信息、患病类型和患病程度构建训练样本,并将所述患者的医护配置作为所述训练样本的样本标签;
将所述训练样本和所述训练样本的样本标签输入深度神经网络进行模型训练,当训练的深度神经网络模型收敛时,得到本地模型。
3.根据权利要求1所述的医护资源预测模型训练方法,其特征在于,所述基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型,包括:
获取新增医疗数据,并根据所述新增医疗数据对所述样本医疗数据进行更新,得到更新后的样本医疗数据;
基于服务器下发的模型初始参数和所述更新后的样本医疗数据训练本地模型。
7.根据权利要求1所述的医护资源预测模型训练方法,其特征在于,所述将所述模型中间参数发送至所述服务器,包括:
对所述模型中间参数进行数据加密,并将加密后的所述模型中间参数发送至所述服务器。
8.一种医护资源预测模型训练装置,其特征在于,包括:
本地训练模块,用于分别获取本地的样本医疗数据,并基于服务器下发的模型初始参数和所述样本医疗数据训练本地模型;
参数发送模块,用于分别计算各个所述本地模型的模型中间参数,并将所述模型中间参数发送至所述服务器,使所述服务器基于所述模型中间参数进行计算得到聚合参数;
模型更新模块,用于接收所述服务器下发的聚合参数,并根据所述聚合参数更新所述本地模型,得到更新后的本地模型;
更新完成模块,用于当各个所述更新后的本地模型均收敛时,完成模型训练,将所述更新后的本地模型作为训练得到的医护资源预测模型。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如权利要求1至7中任一项所述的医护资源预测模型训练方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至7中任一项所述的医护资源预测模型训练方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011384348.7A CN112447299A (zh) | 2020-12-01 | 2020-12-01 | 医护资源预测模型训练方法、装置、设备及存储介质 |
PCT/CN2021/083259 WO2022116429A1 (zh) | 2020-12-01 | 2021-03-26 | 医护资源预测模型训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011384348.7A CN112447299A (zh) | 2020-12-01 | 2020-12-01 | 医护资源预测模型训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112447299A true CN112447299A (zh) | 2021-03-05 |
Family
ID=74738924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011384348.7A Pending CN112447299A (zh) | 2020-12-01 | 2020-12-01 | 医护资源预测模型训练方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112447299A (zh) |
WO (1) | WO2022116429A1 (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113658689A (zh) * | 2021-08-25 | 2021-11-16 | 深圳前海微众银行股份有限公司 | 多智能体模型的训练方法、装置、电子设备及存储介质 |
CN113724845A (zh) * | 2021-08-30 | 2021-11-30 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的医护人员配比检测方法及相关装置 |
CN114327671A (zh) * | 2021-12-03 | 2022-04-12 | 北京达佳互联信息技术有限公司 | 参数配置方法、装置、设备及存储介质 |
CN114418132A (zh) * | 2021-12-27 | 2022-04-29 | 海信集团控股股份有限公司 | 家庭健康管理模型的使用与训练方法 |
WO2022116429A1 (zh) * | 2020-12-01 | 2022-06-09 | 平安科技(深圳)有限公司 | 医护资源预测模型训练方法、装置、设备及存储介质 |
WO2022217784A1 (zh) * | 2021-04-15 | 2022-10-20 | 腾讯云计算(北京)有限责任公司 | 数据处理方法、装置、设备以及介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115081642B (zh) * | 2022-07-19 | 2022-11-15 | 浙江大学 | 一种多方协同更新业务预测模型的方法及系统 |
CN115881306B (zh) * | 2023-02-22 | 2023-06-16 | 中国科学技术大学 | 基于联邦学习的网络化icu智能医疗决策方法及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680661A (zh) * | 2016-08-02 | 2018-02-09 | 百度(美国)有限责任公司 | 用于估计医疗资源需求的系统和方法 |
CN109003660A (zh) * | 2018-06-27 | 2018-12-14 | 南京邮电大学 | 智能医疗服务预测管理方法及系统、可读存储介质和终端 |
CN111027715A (zh) * | 2019-12-11 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 基于蒙特卡洛的联邦学习模型训练方法及装置 |
CN111931950A (zh) * | 2020-09-28 | 2020-11-13 | 支付宝(杭州)信息技术有限公司 | 一种基于联邦学习进行模型参数更新的方法及系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912500B (zh) * | 2016-03-30 | 2017-11-14 | 百度在线网络技术(北京)有限公司 | 机器学习模型生成方法和装置 |
CN110444263B (zh) * | 2019-08-21 | 2024-04-26 | 深圳前海微众银行股份有限公司 | 基于联邦学习的疾病数据处理方法、装置、设备及介质 |
CN111784002B (zh) * | 2020-09-07 | 2021-01-19 | 腾讯科技(深圳)有限公司 | 分布式数据处理方法、装置、计算机设备及存储介质 |
CN112447299A (zh) * | 2020-12-01 | 2021-03-05 | 平安科技(深圳)有限公司 | 医护资源预测模型训练方法、装置、设备及存储介质 |
-
2020
- 2020-12-01 CN CN202011384348.7A patent/CN112447299A/zh active Pending
-
2021
- 2021-03-26 WO PCT/CN2021/083259 patent/WO2022116429A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680661A (zh) * | 2016-08-02 | 2018-02-09 | 百度(美国)有限责任公司 | 用于估计医疗资源需求的系统和方法 |
CN109003660A (zh) * | 2018-06-27 | 2018-12-14 | 南京邮电大学 | 智能医疗服务预测管理方法及系统、可读存储介质和终端 |
CN111027715A (zh) * | 2019-12-11 | 2020-04-17 | 支付宝(杭州)信息技术有限公司 | 基于蒙特卡洛的联邦学习模型训练方法及装置 |
CN111931950A (zh) * | 2020-09-28 | 2020-11-13 | 支付宝(杭州)信息技术有限公司 | 一种基于联邦学习进行模型参数更新的方法及系统 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022116429A1 (zh) * | 2020-12-01 | 2022-06-09 | 平安科技(深圳)有限公司 | 医护资源预测模型训练方法、装置、设备及存储介质 |
WO2022217784A1 (zh) * | 2021-04-15 | 2022-10-20 | 腾讯云计算(北京)有限责任公司 | 数据处理方法、装置、设备以及介质 |
CN113658689A (zh) * | 2021-08-25 | 2021-11-16 | 深圳前海微众银行股份有限公司 | 多智能体模型的训练方法、装置、电子设备及存储介质 |
CN113724845A (zh) * | 2021-08-30 | 2021-11-30 | 平安国际智慧城市科技股份有限公司 | 基于人工智能的医护人员配比检测方法及相关装置 |
CN113724845B (zh) * | 2021-08-30 | 2023-06-23 | 深圳平安智慧医健科技有限公司 | 基于人工智能的医护人员配比检测方法及相关装置 |
CN114327671A (zh) * | 2021-12-03 | 2022-04-12 | 北京达佳互联信息技术有限公司 | 参数配置方法、装置、设备及存储介质 |
CN114418132A (zh) * | 2021-12-27 | 2022-04-29 | 海信集团控股股份有限公司 | 家庭健康管理模型的使用与训练方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2022116429A1 (zh) | 2022-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112447299A (zh) | 医护资源预测模型训练方法、装置、设备及存储介质 | |
US11488694B2 (en) | Method and system for predicting patient outcomes using multi-modal input with missing data modalities | |
Poppas et al. | Telehealth is having a moment: will it last? | |
Nayak et al. | Telemedicine and remote monitoring: supporting the patient on peritoneal dialysis | |
CN110709938A (zh) | 用于生成患者数字孪生的方法和系统 | |
Krishnan | Application of analytics to big data in healthcare | |
Rahman et al. | An IoT and blockchain-based multi-sensory in-home quality of life framework for cancer patients | |
Portela et al. | A pervasive approach to a real-time intelligent decision support system in intensive medicine | |
US20210151140A1 (en) | Event Data Modelling | |
Golmohammadi et al. | Prediction modeling and pattern recognition for patient readmission | |
CN114175173A (zh) | 用于患者历程映射的学习平台 | |
Bagga et al. | Applications of mobile agents in healthcare domain: A literature survey | |
Lombardo et al. | Digital twins federation for remote medical care of de-hospitalized patients | |
Narula | Are we up to speed? From big data to rich insights in CV imaging for a hyperconnected world | |
Roy et al. | Integrating wearable devices and recommendation system: towards a next generation healthcare service delivery | |
CN105701330B (zh) | 健康信息处理方法及系统 | |
CN117037986A (zh) | 医疗或健康记录管理系统及方法 | |
Balakhontceva et al. | Holistic modeling of chronic diseases for recommendation elaboration and decision making | |
Tamiziniyan et al. | Future of Healthcare: Biomedical Big Data Analysis and IoMT | |
CN115862881A (zh) | 医嘱信息的确定方法、装置、存储介质及电子设备 | |
CN109920554A (zh) | 远程诊断方法及系统 | |
Buzachis et al. | Towards osmotic computing: Future prospect for the health information technology (HIT) systems of ISASI-CNR (ME) | |
Nithya | Study on predictive analytics practices in health care system | |
CN117059279A (zh) | 基于虚拟数字人体模型的医疗服务平台、方法和装置 | |
Vilas-Boas et al. | Distributed and real time data mining in the intensive care unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40041538 Country of ref document: HK |
|
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |