CN112055878B - 基于第二组训练数据调整机器学习模型 - Google Patents

基于第二组训练数据调整机器学习模型 Download PDF

Info

Publication number
CN112055878B
CN112055878B CN201980029535.2A CN201980029535A CN112055878B CN 112055878 B CN112055878 B CN 112055878B CN 201980029535 A CN201980029535 A CN 201980029535A CN 112055878 B CN112055878 B CN 112055878B
Authority
CN
China
Prior art keywords
machine learning
learning model
output
training data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980029535.2A
Other languages
English (en)
Other versions
CN112055878A (zh
Inventor
E·高希
L·J·埃谢曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV filed Critical Koninklijke Philips NV
Publication of CN112055878A publication Critical patent/CN112055878A/zh
Application granted granted Critical
Publication of CN112055878B publication Critical patent/CN112055878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Image Analysis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

用于基于第二组训练数据来调整采取临床数据作为输入的第一机器学习模型的系统和方法。所述第一机器学习模型已经在第一组训练数据上被训练。方法包括:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。

Description

基于第二组训练数据调整机器学习模型
技术领域
本文中的公开内容涉及用于基于第二组训练数据调整机器学习模型的系统和方法。
背景技术
一般背景是在临床设置中使用(例如在临床决策支持系统中使用以进行临床预测、分析或诊断)的机器学习模型中。机器学习模型(诸如基于经验的预测模型)可以在特定训练数据集上使用数据集的特性特征来训练。如果在使用中经训练的模型被用于对未在用于训练模型的训练数据集中表示的数据(例如来自与用于训练模型的(一个或多个)群体相比不同的群体的新数据)进行分类或处理,那么其也不能够执行。这样一来,机器学习模型通常仅能够用在与用于训练模型的训练数据集类似的群体上。由于非常难以创建涵盖所有可能的群体(例如所有不同疾病类型、医院类型、地理和经济环境)的范例的训练数据集,此类机器学习模型因此能够不适于与不同的患者群体一起使用,例如不适于在具有不同护理实践的不同医院或区域处处置的具有不同慢性状况的患者。
发明内容
如上面指出的,在与特定患者群体有关的训练数据上训练的机器学习模型可能不产生针对其他患者群体的准确的输出。
解决这种问题的一种标准方法是例如使用特异于该群体的训练数据训练针对每个群体的新的模型(或使用新的训练数据重新训练老的模型)。这实质上针对模型被训练的每一个数据集创建了新的模型。然而,这种方法会是资源密集的。其还能够导致非常不同的模型,例如,如果模型在其能够被部署之前需要监管批准,则这会造成问题。不同的模型也会使模型的接口与工作流的集成更困难。此外,临床决策支持工具的不同版本将理想地对类似的患者具有类似的寻找输出。如果模型已经被使用并且想要部署其用于具有不同状况或特征的患者,这些问题会是更成问题的。
每次重新训练模型的备选方法是使用新的状况/特征训练新的模型,并且然后集成(例如平均或以其他方式组合)两个经训练的模型的输出。用于组合两个或更多个模型的输出的现有技术解决方案被称为“堆叠”。尽管这种方法使用原始模型的输出,当与第二完全分开的模型的输出组合时,组合的输出可能与原始模型的输出几乎没有相似之处。这会削弱对输出的信任,并且最终输出会缺乏透明性,例如讲述输出如何通过堆叠过程改变会是不容易的。
因此存在对以透明和鲁棒的方式改进上面描述的解决方案以使得机器学习模型能够基于额外训练数据更新的系统和方法的需要。
根据第一方面,提供了一种根据权利要求1所述的方法。
根据第二方面,提供了一种根据权利要求14所述的系统。
根据第三方面,提供了一种根据权利要求15所述的计算机程序产品。
根据本文中的实施例,添加包括第二机器学习模型的调整模块使得第一机器学习模型的输出能够基于第二组训练数据被调节,而非被完全重新计算。因此,第一机器学习模型的输出拓扑(例如输出的形式)可以被广泛地重新训练,同时执行调节以考虑第二组训练数据。例如,在模型经受监管批准的情况下,这是有用的,因为原始(监管批准的)输出被广泛地重新训练,并且因此仅额外调节会需要进一步批准,而非每当新的训练数据变得可用时需要针对全新的模型采集的批准。
将意识到,本文中的教导不被仅仅限制于临床领域,而是可以更一般地适用于依据新的训练数据调节任何预先训练的机器学习模型。例如,一般来说,本文中的教导可以适用于其他领域,由此评分(诸如风险评分)是使用机器学习模型来计算的。因此,本文中的教导可以例如被应用于诸如金融、会计或保险的领域中,由此描述风险的信用评分或其他评分被计算。其他可能的领域可以包括气象学,由此天气报告是根据评分或风险来描述的。
根据第四方面,提供了一种基于第二组训练数据来调整第一机器学习模型的方法,所述第一机器学习模型采取数据作为输入,所述第一机器学习模型已经在第一组训练数据上被训练。所述方法包括:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。
根据第五方面,提供了一种用于基于第二组训练数据来调整第一机器学习模型的系统,所述第一机器学习模型采取数据作为输入,所述第一机器学习模型已经在第一组训练数据上被训练。所述系统包括存储器和处理器,所述存储器包括表示一组指令的指令数据,所述处理器被配置为与所述存储器通信并且执行所述一组指令。所述一组指令当由所述处理器执行时使所述处理器:将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的输出作为输入并且提供经调节的输出。
根据第六方面,提供了一种包括非瞬态计算机可读介质的计算机程序产品,所述计算机可读介质具有被实现在其中的计算机可读代码,所述计算机可读代码被配置为使得在由合适的计算机或处理器执行时使所述计算机或处理器执行第四方面的方法。
参考下文所述的实施例,本发明的这些和其他方面将显而易见并且得到阐述。
附图说明
为了更好地理解并且为了更清楚地示出其可以如何被执行,现在将仅通过范例参考附图,其中:
图1是根据本文中的一些实施例的基于第二组训练数据调整第一机器学习模型的方法的范例的流程图;
图2示出了图示根据本文中的一些实施例的范例映射关系的曲线图;
图3是示出根据本文中的范例实施例的第一机器学习模型和调整模块的输入和输出的示意性图示;
图4是示出根据范例本文中的实施例的第一机器学习模型和调整模块的输入和输出的示意性图示;并且
图5示出了根据本文中的一些实施例的用于基于第二组训练数据调整第一机器学习模型的范例系统。
具体实施方式
图1示出了根据本文中的一些实施例的基于第二组训练数据调整第一机器学习模型的计算机实施的方法100,所述第一机器学习模型采取临床数据作为输入。方法100用于在预先训练的模型上使用,例如在第一机器学习模型已经在第一组训练数据上训练的情况下使用。在方框102中,方法100包括将调整模块添加到第一机器学习模型,所述调整模块包括第二机器学习模型。在第二方框104中,所述方法包括使用第二组训练数据来训练第二机器学习模型,以采取第一机器学习模型的输出作为输入并且提供经调节的输出。
第一机器学习模型可以包括任何类型的机器学习模型,诸如逻辑回归模型、提升模型(诸如Adaboost)、神经网络模型或任何其他机器学习模型。技术人员一般会熟悉机器学习模型。简言之,逻辑回归类似于线性回归,除了其可以用于确定概率,例如0和1之间的归一化评分。例如,在第一机器学习模型被用于输出诸如风险评分(如将在下面更详细地描述的)的评分的实施例,可以使用逻辑回归模型。
关于提升模型,提升模型(或过程)在为分类或回归问题创建一组弱分类器(例如弱规则或弱学习器)比单个强(例如更准确)分类器容易得多的前提下工作。然而,当被组合时,单个强分类器可以根据这样一组弱分类器来确定。
Adaboost是也将为技术人员所熟悉的提升过程的类型。Adaboost模型使用一组训练数据来训练。训练以不同轮的方式执行,由此在每轮中,训练数据的不同加权用于确定弱分类器(例如弱规则或弱“学习器”)。每条训练数据初始相等地加权,其中,各条训练数据的权重在针对各条的各轮之间增加,由此弱分类器不能作出准确的预测,以这种方式,提升过程更加注意在每一轮中针对其作出差的输出或预测的训练数据。来自每轮的弱分类器最终被组合成最终强分类器。
在(简单)范例中,每个弱分类器可以包括阈值函数,其针对输入参数的值的不同范围指定应当被增加或从Adaboost模型的最终输出减去的增量。例如,如果模型采取参数“糖尿病状态”作为输入,针对该参数的弱分类器可以包括例如指定以下项的阈值函数:如果“糖尿病状态”是“可定”,则Adaboost模型应当将0.2添加到最终输出,并且如果“糖尿病状态”是否定,则Adaboost模型应当从最终输出减去0.2。对于诸如心率的数值输入,阈值函数可以根据与一个或多个阈值相比心率的值落至何处而指定Adaboost模型添加增量或从输出减去增量(例如用于心率的弱分类器可以包括这样的阈值函数:指定Adaboost模型如果心率小于60次每分钟则将输出增加0.1、如果心率在60和80次每分钟之间则将输出减小0.1并且如果心率高于80次每分钟则将输出减小0.2)。
正式地提出,Adaboost模型的输出被计算如下(例如,最终“强分类器”采取以下形式):
其中,每个ft(x)包括弱分类器。换言之,Adaboost模型的输出可以包括多个分类器的总和,每个分类器对应于输入参数(例如包括输入参数的阈值函数)。
如上面提及的,第一机器学习模型先前已经在第一组训练数据上进行训练。在这种意义上,第一机器学习模型包括预先训练的模型。用于训练第一机器学习模型的第一组训练数据可以包括从特定患者组或群体(诸如与特定医院、医院系统、医院组、地理位置或临床状况相关联的患者)采集的范例临床数据(例如,范例患者数据)。
第一组训练数据可以包括(例如被分成)第一组输入参数(或特征)。第一组输入参数可以包括可以实时采集或更新的参数(例如,来自临床机器的读数或测量结果、或实验室结果)。备选地或额外地,第一组输入参数可以包括可以为静态(例如不随着时间而改变)的参数(例如与慢性状况、吸烟状态、地理位置有关的参数)。更一般地,可以被包括在第一组输入参数中的参数的范例包括来自临床机器的读数或测量结果(例如,诸如来自心率监测器、SpO2监测器或任何其他临床监测器的读数)、临床图像、医学记录或其他医学参数,诸如例如,与慢性状况有关的参数,诸如患者的糖尿病状态。对于每条训练数据(例如针对第一组输入参数的每组范例值),第一组训练数据还可以包括(范例)分类。分类可以已经由人类注释、预先计算或检查。分类可以被认为表示“真实数据(ground truth)”,例如第一机器学习模型应当针对该条训练数据产生的输出的范例。
第一机器学习模型先前已经被训练为产生输出,例如第一机器学习模型先前已经在第一组训练数据上被训练为针对每条训练数据(例如,针对第一组输入参数的每组值)确定相应的(范例)分类。在一些实施例中,输出(例如,分类)可以是以评分或似然(例如百分比似然)的形式。例如,输出可以包括描述患者具有或将会发展特定状况的似然的风险评分。例如,输出可以描述患者将恶化(例如进入心脏停搏)的风险。输出可以包括临床决策支持(CDS)评分。在其他实施例中,输出可以包括可以由机器学习模型产生的任何其他类型的输出。
如上面大致指出的,第一机器学习模型(例如第一机器学习模型的输出)可以已经由监管机构批准。
返回到图1,方法100可以用于基于(例如考虑)第二组训练数据来调整第一机器学习模型。如上面指出的,方法100的方框102包括将调整模块添加到第一机器学习模型,所述调整模块包括第二机器学习模型。
更详细地,第二机器学习模型通常可以包括任何类型的机器学习模型,诸如例如,如在上面关于第一机器学习模型描述的逻辑回归模型、提升模型或神经网络。在一些实施例中,第二机器学习模型可以包括提升模型(诸如Adaboost模型)。
在一些实施例中,第二机器学习模型包括与第一机器学习模型不同类型的机器学习模型。例如,在一些实施例中,第一机器学习模型可以包括逻辑回归机器学习模型,并且第二机器学习模型可以包括提升模型,诸如Adaboost模型。
在方框104中,该方法包括训练第二机器学习模型采取第一机器学习模型的输出作为输入,并且基于第二组训练数据提供经调节的输出(例如诸如,经调节的CDS评分)。
在一些实施例中,第二组训练数据可以包括不形成第一组训练数据的部分的额外训练数据(例如额外训练范例)。例如,在一些实施例中,第二组训练数据与患者群体有关。例如,与第一组训练数据的患者群体不同的患者群体。在方框104中,方法100然后可以包括使用第二组训练数据训练第二机器学习模型(例如在第二组训练数据上训练第二机器学习模型)以产生经调节的输出。
例如,在一些实施例中,与第二组数据相关联的患者群体可以包括与以下中的一项或多项相关联的患者:医院、医院系统、地理区域和/或临床状况。以这种方式,方法100可以用于调整机器学习模型(例如在从初始患者群体采取的训练数据上训练的模型),从而使机器学习模型适于患者群体(例如另一患者群体),而无需重新训练全新的机器学习模型。以这种方式,经调整的第一机器学习模型的输出是经调节的输出而非全新的输出,并且因此经调节的输出可以类似于第一机器学习模型的输出,这可以帮助数据保证(特别是如果第一机器学习模型经受监管批准)。
在一些实施例中,方法100还可以包括一起部署第一机器学习模型和调整模块以用于在针对患者群体产生经调节的输出时使用。例如,经训练的第一机器学习模型和包括经训练的第二机器学习模型的调整模块可以被安装在由临床医师可访问的临床位点或服务器上,使得其可以用于针对从该位点处的患者采集的新的数据产生经调节的输出。因此可以产生适于该群体的模型而不必训练全新的模型。
技术人员将意识到,该过程可以针对其他患者群体被重复。例如,该方法还可以包括重复添加和训练的步骤以产生针对(一个或多个)其他患者群体的(一个或多个)额外调整模块。
额外地或备选地,第二组训练数据可以包括与第一组输入参数不同的额外输入参数(例如额外特征)。例如,第一组训练数据可以包括第一组输入参数,并且第二组训练数据可以包括与第一组输入参数的参数不同的一个或多个额外输入参数。在方框104中,方法100可以包括使用第二组训练数据训练第二机器学习模型,以在考虑额外输入参数的情况下产生经调节的输出。
通常,额外输入参数可以包括任何类型的可用数据。例如,在上面关于第一组输入参数列出的时间的类型中的任一种。例如,额外输入参数可以包括临床数据(例如患者数据),诸如来自临床机器的读数或测量结果(例如,诸如来自心率监测器、SpO2监测器或任何其他临床监测器的读数)、临床图像、医学记录或其他医学参数,诸如例如,与诸如患者的糖尿病状态的慢性状况有关的参数。额外输入参数可以包括可以实时采集或更新的参数(例如,上面提到的来自临床机器的读数或测量结果、或实验室结果)。备选地或额外地,额外输入参数可以包括可以为静态(例如在短时间尺度上通常不改变)的参数(例如与慢性状况、吸烟状态和/或地理位置有关的参数)。
通过以这种方式使用额外输入参数,当新类型的临床数据变得可用时,方法100因此可以用于调节第一机器学习模型的输出。例如,在医院或临床位点具有不同的监测装备的情况下或当先前不可用的新的或额外医学设备变得可用时,这可以是相关的。
本文中的实施例的另一应用在于组合诸如患者历史和慢性状况的背景信息与来自当前住院期的患者数据。机器学习模型可以被训练为基于诸如在患者住院期期间测量的生命体征测量结果和实验室结果的特征来确定患者的风险评分。此类参数是未来事件的重要预测器。然而,关于诊断、并发状况、慢性历史的信息以及其他此类背景信息可以修改患者恶化的风险和发展状况的风险。如本文中描述的调整模块可以用于在修改患者的风险因子时考虑背景信息的效应。因此一般来说,第二机器学习模型可以被训练为接收“原始”临床决策支持评分,并且基于背景对它们进行调节。
因此,在一些实施例中,第一组输入参数可以包括与例如实时临床测量结果(诸如心率或SPO2水平)有关的输入参数,并且额外输入参数可以包括与例如患者的状态或患者的静态或慢性状况(例如,诸如患者的糖尿病状态或体重)有关的输入参数。以这种方式,方法100可以用于调整机器学习模型,从而依据患者的长期状况或其他“静态”因子考虑或预测输出(例如基于实时测量结果确定的)能够需要修改的方式。这可以提供对长期或静态参数影响输出的方式的见解。
如上面描述的,本文中描述的方法和系统的目的是调节经训练的第一机器学习模型的输出,同时尽可能多保留第一机器学习模型的决策过程。这样一来,期望经调节的输出(诸如风险调节评分)类似于第一机器学习模型的输出(例如“原始”输出或评分),但是依据第二组训练数据(或第二组训练数据的额外参数/特征)被调节。一个目标是经调节的输出反映原始模型的输出形貌(例如预测),但是稍微被偏移并扭曲,从而反映新的特征值的贡献。
为了确保第二机器学习模型的输出在此类情况下保留第一机器学习模型的输出,在一些实施例中,方法100还可以包括使用第一机器学习模型的输出初始化第二机器学习模型,使得当/在对应于第二组训练数据的数据(例如对应于第二组训练数据的输入参数或特征的数据)不可用时,第二机器学习模型产生与第一机器学习模型等效的输出(例如针对新的数据)。换言之,第二模型的初始化可以确保,当仅存在于第一组训练数据中的参数可用于进行分类时第二机器学习模型产生相同的或等效的输出(例如相同的或等效的输出分类、值或评分)。这意味着在不存在与被包括在第二组训练数据中的参数有关的任何额外数据的情况下,第二机器学习模型将产生与第一机器学习模型等效的(例如相同的或相似的)输出。
在第二机器学习模型包括诸如Adaboost模型的提升模型的实施例中,如上面描述的,提升模型可以被配置为基于多个分类器的总和来确定经调节的输出。在一些实施例中,每个分类器可以对应于第二组训练数据中的输入参数。
根据本文中的一些实施例,提升模型可以被配置为基于第一机器学习模型的输出将初始偏移应用于多个分类器的总和,从而将提升模型初始化为如果对应于第二组训练数据的数据不可用则产生与第一机器学习模型等效的输出。以这种方式,初始偏移可以用于设置提升模型(例如Adaboost模型)的初始状态。
更正式地提出,在一些实施例中,针对提升模型的等式 (如上面描述的)可以被修改使得Adaboost模型的输出根据以下来计算:
其中,项m(x)是基于第一机器学习模型的输出的初始偏移。
在一些实施例中,方法100可以包括确定用于将第一机器学习模型的输出转换成初始偏移(例如m(x))的映射关系。
映射关系可以通过映射模型来确定(在映射阶段中)。映射模型可以包括与第二机器学习模型相同类型的机器学习模型。例如,如果Adaboost被用作第二机器学习模型,那么映射模型也可以包括Adaboost模型。
映射模型可以用于确定从第一机器学习模型的输出到针对第二机器学习模型(的输出)的初始偏移的映射。例如,如果第一机器学习模型包括逻辑回归模型并且第二机器学习模型包括Adaboost模型,那么映射模型可以包括被用于确定从逻辑回归类型评分到针对Adaboost类型评分的初始偏移的映射的Adaboost模型。
在一些实施例中,确定映射关系包括向映射模型提供第一机器学习模型的多个输出和多个相应的分类(例如通过向映射模型提供映射训练数据),并且根据映射模型的输出确定映射关系。
例如,第一组训练数据可以被提供给映射模型,但是代替于将第一组参数输入到映射模型中,第一模型的输出可以连同参考(例如真实数据)分类一起被替代地输入。
在第二机器学习模型包括Adaboost模型(并且因此映射模型包括Adaboost模型)的实施例中,将映射模型应用于此类数据集可以产生阈值函数(或阶跃函数)。在该实施例中,阈值函数可以用于将第一机器学习模型的输出映射到能够被用作针对第二机器学习模型的初始偏移的Adaboost类型评分。
现在转向更详细的范例实施例,其中,第一机器学习模型包括逻辑回归模型并且第二模型包括Adaboost模型,第一和第二组训练数据可以包括具有针对每个训练范例(或每条训练数据)的行的矩阵。第一组列可以包括用于训练第一机器学习模型的第一组训练数据的第一组参数(或特征),所述第一机器学习模型可以被标记“f1”,并且第二组列可以包括用于训练第二机器学习模型的第二组训练数据的参数(或特征),所述第二机器学习模型可以被标记“f2”。(或备选地,可以存在具有相同行数的两个矩阵,f1矩阵和f2矩阵)。在该范例中,还可以存在表示期望结果(例如针对每条训练数据的真实数据)的分类(或类标签)的向量。此类向量可以包括针对矩阵中的每个行的值,例如针对每条训练数据的一个分类。
矩阵可以被提供给第一机器学习模型,其基于第一组输入参数f1产生输出的向量,针对每个训练范例,一个输出。第一机器学习模型的输出向量然后可以连同分类的向量一起被提供给映射模型(如上面指出的,该实施例中的第二机器学习模型包括Adaboost模型,并且因此该实施例中的映射模型也包括Adaboost模型)。将映射模型应用于第一机器学习模型的输出向量和分类的向量将第一机器学习模型的输出映射到Adaboost类型评分中。
映射模型产生与输入向量和分类向量相同长度的输出向量(例如每条训练数据,一个映射值)。映射模型的输出向量的值被用作针对第二机器学习模型的初始偏移值。映射查找表可以根据第一机器学习模型的输出向量和用于确定映射关系的映射模型的输出向量来生成。
矩阵(包括来自用于确定适当映射的模型的输出)然后可以被提供给第二机器学习模型,所述第二机器学习模型在该范例中包括Adaboost模型。所映射的输出(即初始偏移)用于(例如在提升轮开始之前)将Adaboost模型的输出向量初始化到由来自第一机器学习模型的弱分类器所产生的评分。
以这种方式,例如当不存在可用的f2参数数据时,保留第一机器学习模型的输出。此外,第二机器学习模型从第一机器学习模型的输出开始,并且对第一机器学习模型的输出直接进行调节。这样一来,第一机器学习模型的输出拓扑依据第二组训练数据被重新训练并且微调或调节。这使输出更透明,并且因此帮助数据保证(在第一和或第二模型需要监管批准的情况下)。
以这种方式的映射的使用初始化第二机器学习模型(例如Adaboost模型),使得其表现得像第一机器学习模型(例如产生第一机器学习模型的输出)。即使一个不被用于原始算法,映射步骤允许将增量改进算法用于新的算法。以这种方式,经调整的机器学习算法的输出继续看起来类似于第一机器学习模型的输出。
应注意,对于完整性,如果第一机器学习模型和第二模型机器学习模型两者使用Adaboost,那么映射可以不是必要的,因为来自第一机器学习模型的输出采用用于初始化第二机器学习模型的正确形式。例如,第一Adaboost模型的输出可以被直接用作初始化第二Adaboost模型的初始偏移。如果第一机器学习模型利用Adaboost来训练并且输出用于初始化第二机器学习模型(也利用Adaboost来训练),那么这等效于针对N1轮利用第一组特征来训练Adaboost并且针对剩余N2轮利用第二组特征来训练Adaboost。(并且在这种情况下可以不需要映射)
在图2中示出了范例映射关系,图2示出了根据一个范例的如由线206图示的用于将来自逻辑回归输出202的输出转换为Adaboost输出204的映射关系。
在一些实施例中,映射关系可以是平滑的,如通过图2中的线208示出的。
在图3中可以总结本文中的实施例中的一些,图3示出了根据实施例的第一机器学习模型302。在该实施例中,第一机器学习模型已经在第一组训练数据上被训练。第一机器学习模型被训练为采取第一组输入参数306作为输入,并且输出一个或多个输出308。
第一机器学习模型302基于第二组训练数据借助于调整模块304来调整。调整模块304包括第二机器学习模型320。在一些实施例中,第二机器学习模型320已经基于第二组训练数据被训练,以采取第一机器学习模型302的输出308作为输入316(例如在一些实施例中,输出308与输入316相同)。在此类实施例中,如上面描述的,第一机器学习模型的输出被用作到第二机器学习模型的输入参数(例如输入特征)。
在其他实施例中,调整模块304还包括映射模块312,映射模块312包括映射关系。映射模块采取第一机器学习模型的输出308(例如在一些实施例中,输出308与输入310相同)作为输入,将第一机器学习模型的输出映射到初始偏移314,并且将初始偏移314作为输入316提供给第二机器学习模型320(例如在一些实施例中,第一机器学习模型302的输出308在其被输入到第二机器学习模型320内之前被映射)。在此类实施例中,如上面描述的,初始偏移由第二机器学习模型用于初始化第二机器学习模型(例如代替于被用作输入参数或特征,初始偏移可以用于设置第二机器学习模型的初始状态)。如上面描述的,初始化可以被执行以确保第二机器学习模型的输出包括对第一机器学习模型的输出的调节(而非完全独立导出的输出)。
以这种方式,根据本文中的实施例,第二机器学习模型320输出可以反映第一机器学习模型302的输出308和第二组训练数据两者的经调节的输出318。
在使用中,在训练104第二机器学习模型之后,第一机器学习模型和调整模块(包括第二机器学习模型)可以被一起部署用于在针对新的(例如未见过的)临床数据确定经调节的输出时使用。
在一些实施例中,方法100因此还包括使用经调整的机器学习模型(例如第一机器学习模型和包括第二机器学习模型的调整模块的组合)来针对新的(例如先前未见的且不形成第一或第二训练组的部分的)临床数据产生经调节的输出。
例如,在一些实施例中,该方法可以包括将新的临床数据作为输入提供给第一机器学习模型,从第一机器学习模型采集新的输出,将新的输出作为输入提供给调整模块,并且从调整模块接收新的经调节的输出。
在实施例中,其中,如上面描述的,第二机器学习模型包括提升模型并且方法100包括确定将第一机器学习模型的输出值转换成初始偏移的映射关系,在使用中,该方法可以包括调整模块使用所确定的映射关系将新的输出映射到初始偏移。调整模块然后可以使用初始偏移初始化第二机器学习模型(例如提升模型)。
这在图4中图示,图4示出了在使用中(例如当第一机器学习模型与包括第二机器学习模型的调整模块一起部署时)的根据实施例的第二机器学习模型408的输入和输出。在该实施例中,新的临床数据402被转换成一组参数404(例如第一组输入参数和/或额外输入参数,如上面描述的)。参数可以包括例如诊断、患者的医学历史的方面、入院类型、患者的介入或流程的细节和/或患者的(一个或多个)药物的细节。参数404作为输入参数404被提供给第二机器学习模型408。除了N个特征之外,第一机器学习模型的新的输出406也被输入到第二机器学习模型408。如上面描述的,第一机器学习模型的新的输出可以已经使用如上面描述的映射关系被映射以产生初始偏移。基于这些输入,第二机器学习模型408确定经调节的新的输出410。
在一些实施例中,方法100还可以包括输出新的输出406和经调节的新的输出410。以这种方式,第一机器学习模型的输出依据额外的新的数据被调整的方式可以更容易地被意识到。这可以帮助解决方案的透明性并且因此用户信心和采用。
现在转向图5,存在被配置用于基于第二组训练数据调整第一机器学习模型的系统500。第一机器学习模型已经在第一组训练数据上被训练,并且采取临床数据作为输入。系统500包括存储器504,存储器504包括表示一组指令的指令数据。系统500还包括处理器502,处理器502被配置为与存储器504通信并且执行该组指令。当由处理器执行,该组指令可以使处理器执行如本文中描述的方法100的实施例中的任一个。
在一些实施方式中,指令数据能够包括多个软件和/或硬件模块,其均被配置为执行或用于执行文中描述的方法的个体或多个步骤。在一些实施例中,存储器504可以是也包括系统500的一个或多个其他部件(例如,系统500的处理器502和/或一个或多个其他部件)的设备的部分。在备选实施例中,存储器504可以是与系统500的其他部件分开的设备的部分。
在一些实施例中,存储器504可以包括多个子存储器,每个子存储器能够存储一条指令数据。在其中存储器504包括多个子存储器的一些实施例中,表示该组指令的指令数据可以被存储在单个子存储器处。在其中存储器504包括多个子存储器的其他实施例中,表示该组指令的指令数据可以被存储在多个子存储器处。因此,根据一些实施例,表示不同指令的指令数据可以被存储在系统500中的一个或多个不同位置处。在一些实施例中,存储器504可以用于存储信息,诸如与由系统500的处理器502进行的计算或确定相关或来自系统500的任何其他部件的数据。
处理器502能够包括被配置或编程为以本文中描述的方式控制系统500的一个或多个处理器、处理单元、多核处理器和/或模块。在一些实施方式中,例如,处理器502可以包括被配置用于分布式处理的多个(例如,互操作的)处理器、处理单元、多核处理器和/或模块。本领域技术人员将意识到,此类处理器、处理单元、多核处理器和/或模块可以被定位于不同的位置中,并且可以执行本文中描述的方法的不同步骤和/或单个步骤的不同部分。
简短地,当由处理器502执行时,该组指令使处理器502将调整模块添加到第一机器学习模型,所述调整模块包括第二机器学习模型。当由处理器502执行时,该组指令还使处理器502使用第二组训练数据训练第二机器学习模型,以采取第一机器学习模型的输出作为输入并且提供经调节的输出。将调整模块添加到第一机器学习模型并且训练第二机器学习模型在上面关于方法100被描述,并且其中的细节将被理解为同样适用于系统500的操作。
根据一些实施例,还存在一种包括非瞬态计算机可读介质的计算机程序产品,所述计算机可读介质具有被实现在其中的计算机可读代码,所述计算机可读代码被配置为使得在由合适的计算机或处理器执行时使所述计算机或处理器执行方法100。
如本文所使用的,术语“模块”旨在包括诸如被配置为执行特定功能的处理器或处理器的部件的硬件部件,或诸如在由处理器执行时具有特定功能的一组指令数据的软件部件。
将意识到,本发明的实施例还适用于适于使本发明付诸实践的计算机程序,特别是在载体上或载体中的计算机程序。该程序可以采取源代码、目标代码、代码中间源和目标代码的形式,诸如部分编译的形式,或者适于使用在根据本发明的实施例的方法的实施方式中的任何其他形式。还将意识到,此类程序可以具有许多不同的架构设计。例如,实施根据本发明的方法或系统的功能的程序代码可以被细分为一个或多个子例程。在这些子例程中间分配功能的许多不同方式对于技术人员而言将是显而易见的。子例程可以一起存储在一个可执行文件中,以形成一个独立的程序。这样的可执行文件可以包括计算机可执行指令,例如,处理器指令和/或解释器指令(例如,Java解释器指令)。备选地,一个或多个或所有子例程可以被存储在至少一个外部库文件中,并且静态地或动态地(例如,在运行时)与主程序链接。主程序包含对子例程中至少一个的至少一个调用。子例程还可以包括彼此的函数调用。与计算机程序产品有关的实施例包括与本文阐述的方法中的至少一个方法的每个处理阶段相对应的计算机可执行指令。这些指令可以细分为子例程和/或存储在可以静态或动态链接的一个或多个文件中。与计算机程序产品有关的另一实施例包括与本文阐述的系统和/或产品中至少一个的每个模块相对应的计算机可执行指令。这些指令可以细分为子例程和/或存储在可以静态或动态链接的一个或多个文件中。
计算机程序的载体可以是能够承载程序的任何实体或设备。例如,载体可以包括数据存储设备,诸如ROM,例如,CD ROM或半导体ROM、或者磁记录介质,例如,硬盘。此外,载体可以是可传输的载体,诸如电或光信号,其可以经由电缆或光缆或通过无线电或其他模块来传达。当程序以此类信号实现时,载体可以由此类线缆或其他设备或模块构成。备选地,载体可以是其中嵌入程序的集成电路,该集成电路适于执行相关方法或在相关方法的执行中使用。
通过研究附图、公开内容和所附权利要求,本领域技术人员在实践所要求保护的发明时可以理解和实现所公开的实施例的变型。在权利要求中,“包括”一词不排除其他元件或步骤,并且词语“一”或“一个”不排除多个。单个处理器或其他单元可以履行权利要求中所记载的若干项目的功能。尽管在互不相同的从属权利要求中记载了特定措施,但是这并不指示不能有利地使用这些措施的组合。计算机程序可以存储在/分布在合适的介质上,例如与其他硬件一起提供或作为其他硬件的部分提供的光学存储介质或固态介质,但是计算机程序也可以以其他形式分布,例如经由因特网或其他有线或无线电信系统分布。权利要求中的任何附图标记不应被解释为对范围的限制。

Claims (14)

1.一种基于第二组训练数据来调整第一机器学习模型的输出的方法,所述第一机器学习模型采取临床数据作为输入并且提供所述输出,所述第一机器学习模型已经在第一组训练数据上被训练,所述第一组训练数据包括第一组输入参数,所述方法包括:
将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且
使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的所述输出作为输入并且在考虑一个或多个额外输入参数的情况下调节所述输出以提供经调节的输出,所述第二组训练数据包括与所述第一组输入参数中的参数不同的所述一个或多个额外输入参数。
2.根据权利要求1所述的方法,其中,所述经调节的输出类似于所述第一机器学习模型的所述输出,但是依据所述第二组训练数据而被调节。
3.根据权利要求1所述的方法,其中,所述第二组训练数据与患者群体有关,并且任选地,其中,所述患者群体包括与以下中的一项或多项相关联的患者:
医院;
地理区域;以及
临床状况。
4.根据权利要求3所述的方法,还包括:
将所述第一机器学习模型和所述调整模块一起部署以用于在产生针对所述患者群体的经调节的输出时使用。
5.根据权利要求2、3或4中的任一项所述的方法,还包括重复添加和训练的步骤以产生针对另一患者群体的额外调整模块。
6.根据权利要求1至4中的任一项所述的方法,其中,所述第二机器学习模型包括提升模型,所述提升模型被配置为基于多个分类器的总和来确定所述经调节的输出。
7.根据权利要求6所述的方法,其中,所述提升模型还被配置为:
基于所述第一机器学习模型的所述输出将初始偏移应用于所述多个分类器的所述总和,从而将所述提升模型初始化为在对应于所述第二组训练数据的数据不可用的情况下产生与所述第一机器学习模型等效的输出。
8.根据权利要求7所述的方法,还包括:
确定用于将所述第一机器学习模型的输出转换成初始偏移的映射关系。
9.根据权利要求8所述的方法,其中,确定映射关系包括:
将所述第一机器学习模型的多个输出和多个相应的分类提供给映射模型;并且
根据所述映射模型的输出来确定映射关系。
10.根据权利要求8-9中的任一项所述的方法,还包括:
将新的临床数据作为输入提供给所述第一机器学习模型;
从所述第一机器学习模型采集新的输出;
将所述新的输出作为输入提供给所述调整模块;并且
从所述调整模块接收新的经调节的输出。
11.根据权利要求10所述的方法,还包括所述调整模块:
使用所确定的映射关系将所述新的输出映射到初始偏移;并且
使用所述初始偏移来初始化所述第二机器学习模型。
12.根据权利要求10所述的方法,还包括输出所述新的输出和经调节的新的输出。
13.一种用于基于第二组训练数据来调整第一机器学习模型的输出的系统,所述第一机器学习模型采取临床数据作为输入并且提供所述输出,所述第一机器学习模型已经在第一组训练数据上被训练,所述第一组训练数据包括第一组输入参数,所述系统包括:
存储器,其包括表示一组指令的指令数据;
处理器,其被配置为与所述存储器通信并且执行所述一组指令,其中,所述一组指令当由所述处理器执行时使所述处理器:
将调整模块添加到所述第一机器学习模型,所述调整模块包括第二机器学习模型;并且
使用所述第二组训练数据来训练所述第二机器学习模型,以采取所述第一机器学习模型的所述输出作为输入并且在考虑一个或多个额外输入参数的情况下调节所述输出以提供经调节的输出,所述第二组训练数据包括与所述第一组输入参数中的参数不同的所述一个或多个额外输入参数。
14.一种包括非瞬态计算机可读介质的计算机程序产品,所述计算机可读介质具有被实现在其中的计算机可读代码,所述计算机可读代码被配置为使得在由合适的计算机或处理器执行时使所述计算机或处理器执行根据权利要求1至12中的任一项所述的方法。
CN201980029535.2A 2018-04-30 2019-04-16 基于第二组训练数据调整机器学习模型 Active CN112055878B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862664365P 2018-04-30 2018-04-30
US62/664,365 2018-04-30
PCT/EP2019/059718 WO2019211089A1 (en) 2018-04-30 2019-04-16 Adapting a machine learning model based on a second set of training data

Publications (2)

Publication Number Publication Date
CN112055878A CN112055878A (zh) 2020-12-08
CN112055878B true CN112055878B (zh) 2024-04-02

Family

ID=66379874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980029535.2A Active CN112055878B (zh) 2018-04-30 2019-04-16 基于第二组训练数据调整机器学习模型

Country Status (4)

Country Link
US (1) US20210042667A1 (zh)
EP (1) EP3788627A1 (zh)
CN (1) CN112055878B (zh)
WO (1) WO2019211089A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210217523A1 (en) * 2018-05-18 2021-07-15 Shimadzu Corporation Diagnosis assistance system and diagnosis assistance device
US11373758B2 (en) * 2018-09-10 2022-06-28 International Business Machines Corporation Cognitive assistant for aiding expert decision
SE1951443A1 (en) * 2019-12-12 2021-06-13 Assa Abloy Ab Improving machine learning for monitoring a person
US11562828B2 (en) 2019-12-26 2023-01-24 Kpn Innovations, Llc. Methods and systems for customizing treatments
US20220067433A1 (en) * 2020-08-26 2022-03-03 International Business Machines Corporation Domain adaptation
US11687620B2 (en) 2020-12-17 2023-06-27 International Business Machines Corporation Artificial intelligence generated synthetic image data for use with machine language models
CN113040711B (zh) * 2021-03-03 2023-08-18 吾征智能技术(北京)有限公司 一种脑卒中发病风险预测系统、设备、存储介质
CN116049084A (zh) * 2021-10-28 2023-05-02 华为技术有限公司 一种模型训练系统和方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN107256393A (zh) * 2017-06-05 2017-10-17 四川大学 基于深度学习的一维生理信号的特征提取与状态识别

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923004A (en) * 1997-12-30 1999-07-13 Otis Elevator Company Method for continuous learning by a neural network used in an elevator dispatching system
AU2002233052B2 (en) * 2001-02-28 2004-06-10 University Of Technology, Sydney A non-invasive method and apparatus for determining onset of physiological conditions
US7467119B2 (en) * 2003-07-21 2008-12-16 Aureon Laboratories, Inc. Systems and methods for treating, diagnosing and predicting the occurrence of a medical condition
US7840511B2 (en) * 2006-09-06 2010-11-23 Siemens Medical Solutions Usa, Inc. Learning or inferring medical concepts from medical transcripts using probabilistic models with words or phrases identification
AU2014239852A1 (en) * 2013-03-15 2015-11-05 The Cleveland Clinic Foundation Self-evolving predictive model
US10496927B2 (en) * 2014-05-23 2019-12-03 DataRobot, Inc. Systems for time-series predictive data analytics, and related methods and apparatus
US10963810B2 (en) * 2014-06-30 2021-03-30 Amazon Technologies, Inc. Efficient duplicate detection for machine learning data sets
WO2018017467A1 (en) * 2016-07-18 2018-01-25 NantOmics, Inc. Distributed machine learning systems, apparatus, and methods
US10691998B2 (en) * 2016-12-20 2020-06-23 Google Llc Generating templated documents using machine learning techniques
US10751548B2 (en) * 2017-07-28 2020-08-25 Elekta, Inc. Automated image segmentation using DCNN such as for radiation therapy
US11036642B2 (en) * 2019-04-26 2021-06-15 Intel Corporation Architectural enhancements for computing systems having artificial intelligence logic disposed locally to memory

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866727A (zh) * 2015-06-02 2015-08-26 陈宽 基于深度学习对医疗数据进行分析的方法及其智能分析仪
CN107256393A (zh) * 2017-06-05 2017-10-17 四川大学 基于深度学习的一维生理信号的特征提取与状态识别

Also Published As

Publication number Publication date
EP3788627A1 (en) 2021-03-10
US20210042667A1 (en) 2021-02-11
CN112055878A (zh) 2020-12-08
WO2019211089A1 (en) 2019-11-07

Similar Documents

Publication Publication Date Title
CN112055878B (zh) 基于第二组训练数据调整机器学习模型
Food and Drug Administration Proposed regulatory framework for modifications to artificial intelligence/machine learning (AI/ML)-based software as a medical device (SaMD)
US10585739B2 (en) Input data correction
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
US20120271612A1 (en) Predictive modeling
US11848103B2 (en) Method and system of deploying a machine learning neural network in generating medical states
US20160125159A1 (en) System for management of health resources
US20230351204A1 (en) Selecting a training dataset with which to train a model
CN110046707B (zh) 一种神经网络模型的评估优化方法和系统
US20210357689A1 (en) Computer-implemented method and system for training an evaluation algorithm, computer program and electronically readable data carrier
Alharbi et al. Prediction of dental implants using machine learning algorithms
US7716145B2 (en) System for supporting user's behavior
US11651289B2 (en) System to identify and explore relevant predictive analytics tasks of clinical value and calibrate predictive model outputs to a prescribed minimum level of predictive accuracy
US20220331092A1 (en) Methods and systems for determining intraocular lens (iol) parameters for cataract surgery
CN116090618A (zh) 一种电力通信网的运行态势感知方法和装置
CN113425248B (zh) 医疗影像评估方法、装置、设备及计算机存储介质
WO2023073092A1 (en) Managing a model trained using a machine learning process
US20240049960A1 (en) Predicting clinical parameters relating to glaucoma from central visual field patterns
EP3477652A1 (en) Matching a subject to resources
US20220101187A1 (en) Identifying and quantifying confounding bias based on expert knowledge
CN114203306A (zh) 医疗事件预测模型训练方法、医疗事件预测方法及装置
WO2024029261A1 (ja) 情報処理装置、予測装置、機械学習方法、および学習プログラム
EP4220323A1 (en) Performing a maintenance operation on a medical imaging system
US20230317219A1 (en) Customized exceptions for intelligent protocoling
US20230359927A1 (en) Dynamic user-interface comparison between machine learning output and training data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant