CN103843030B - 用于从多个来源产生保健相关经验证预测模型的方法 - Google Patents

用于从多个来源产生保健相关经验证预测模型的方法 Download PDF

Info

Publication number
CN103843030B
CN103843030B CN201280048322.2A CN201280048322A CN103843030B CN 103843030 B CN103843030 B CN 103843030B CN 201280048322 A CN201280048322 A CN 201280048322A CN 103843030 B CN103843030 B CN 103843030B
Authority
CN
China
Prior art keywords
model
patient
prediction model
data
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280048322.2A
Other languages
English (en)
Other versions
CN103843030A (zh
Inventor
梅林·姚
W·H·王
B·崔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
UNIVFY Inc
Original Assignee
UNIVFY Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by UNIVFY Inc filed Critical UNIVFY Inc
Publication of CN103843030A publication Critical patent/CN103843030A/zh
Application granted granted Critical
Publication of CN103843030B publication Critical patent/CN103843030B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F04POSITIVE - DISPLACEMENT MACHINES FOR LIQUIDS; PUMPS FOR LIQUIDS OR ELASTIC FLUIDS
    • F04CROTARY-PISTON, OR OSCILLATING-PISTON, POSITIVE-DISPLACEMENT MACHINES FOR LIQUIDS; ROTARY-PISTON, OR OSCILLATING-PISTON, POSITIVE-DISPLACEMENT PUMPS
    • F04C2270/00Control; Monitoring or safety arrangements
    • F04C2270/04Force
    • F04C2270/041Controlled or regulated
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种用于从多个保健中心产生预测模型的方法。所述方法允许第三方使用来自多个来源的数据集合来建立预测模型。通过将所述数据集合输入模型解构和传送(MDT)平台中,保健中心可将数据提供给第三方,而无需去识别数据或物理上从所述保健中心传送任何识别或经去识别数据。所述MDT平台包含变量库,其允许所述保健中心选择将用以产生和验证所述预测模型的变量。本发明还提供一种用于基于用以产生预测模型的临床数据的百分比来补偿贡献数据集合的来源的方法。

Description

用于从多个来源产生保健相关经验证预测模型的方法
相关申请案的交叉参考
本申请案主张2011年9月30申请的第61/541,468号美国临时申请案的优先权,所述临时申请案全文并入本文中。
技术领域
本发明大体上涉及保健预测模型。更具体地说,本发明涉及从多个来源产生的保健相关预测模型。
背景技术
近年来,保健行业已投入了大量精力来通过提供基于证据的个人化决策支持系统且建立处理个别患者和患者群两者的特性的临床协议来改进患者的临床结果。保健行业还已打算通过在推荐治疗方案时使用基于证据的个人化决策支持系统来考虑健康益处和成本效应,来向患者及其付款人(即,其承保人和雇主)提供更大价值。
保健行业的上文所提到的努力已通过健康相关信息技术(IT)的实施和采用而得以促进,所述技术引起患者和医师对电子医疗记录的存取,以及电子数据在保健提供者、实验室、药房、保健管理者和保健行政人员之间的交换。保健相关IT平台也已在进行生物发现、遗传和分子数据到临床应用的转化以及用于识别保健相关问题和/或疾病疗效的预测模型的开发中起作用。
理论上,保健相关预测模型的实施应对保健质量和递送具有重大影响;然而,实际上,迄今为止EMR产生的预测模型的类型及其效用一直是有限的。通常需要从多个数据来源(例如,保健设施)积累的大数据集合来建立具有临床效用的有意义预测模型。因为此些大数据集合的收集、处理和分析需要花费大量的人力和金钱资源,因此此些预测模型的益处仍是大小和/或资源不太大的实体无法实现的。
除物理上积累大量数据所固有的挑战之外,预测模型的实施还面临与数据集合中存在的个人识别符的保护有关的挑战。目前,处理来自多个保健设施的保健信息以建立预测模型需要越过每一保健设施的物理和网络边界传送健康数据。数据中个人识别符的存在对保健设施以及数据处理或分析中所涉及的任何第三方实体造成较大的管理、后勤和合约障碍。个人识别符的存在还引起赔偿责任问题,且增加了所述设施防范赔偿责任的成本。尽管可去除个人识别符,但还存在因产生去识别的数据集合同时保留所述数据的完整性而招致的相当大的后勤、技术和金融成本。因为此些过程耗时且成本高,所以它们抑制了保健预测模型的发展。
发明内容
本发明通过提供用以基于从多个来源获得的保健数据来产生和验证保健预测模型而无需去识别或传送临床数据超过保健设施的物理和网络边界的方法来对此项技术中已知的方法进行改进。本发明的经验证预测模型是基于能够应用于不同患者群体的多个变量。
在本发明的一个实施例中,提供一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)向一个以上保健中心提供具有由变量库(variable library)(VL)组成的模型解构传送(Model Deconstruction Transfer)(MDT)平台,其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述MDT平台中,且从所述VL选择与所述感兴趣的健康结果相关的变量;以及(b)从所述MDT平台产生每一保健中心的至少一个预测模型(prediction model)(PM0),其中每一PM0是基于所述选定变量。
在另一实施例中,所述方法进一步包括以下步骤:(c)从每一PM0产生模型组件库(Model Component Library)(MCL),其中所述MCL包括因每一PM0的解构而产生的组件,以及(d)从所述MCL产生至少一个第二预测模型(PM1),其中所述至少一个PM1经设计以预测共同代表每一保健中心的患者群体中的所述感兴趣的健康结果的概率。通过使用个别MCL组件作为具有差分加权的所述至少一个PM1中的变量来从所述MCL产生所述至少一个PM1。单个MCL组件可在单个PM1中使用一次以上。另外,单个MCL组件的每次使用均可经受不同统计函数。
在本发明的另一实施例中,提供一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合;(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;(c)基于所述至少一个数据集合变量的差分加权来产生每一保健中心的至少一个第一预测模型(PM0),其中使用计算装置来产生所述至少一个PM0;(d)从每一PM0产生模型组件库(MCL),其中所述MCL包括因每一PM0的解构而产生的组件;以及(e)基于与所述感兴趣的健康结果相关的所述MCL组件的差分加权从所述MCL产生至少一个第二预测模型(PM1)。在一个实施例中,所述一个以上保健中心可将所述至少一个数据集合输入到包括变量库(VL)的模型解构传送(MDT)平台中。
在另一实施例中,前述方法进一步包括以下步骤:从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述MCL中未表示的保健中心的患者群组有关且对用以产生所述MCL的数据非冗余并与用以产生所述MCL的数据无关的保健数据。
在另一实施例中,前述方法进一步包括以下步骤:从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自MCL中所表示的保健中心的患者群组有关的保健数据,其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余,且包括所述至少一个第二数据集合的所述保健数据与用以产生所述MCL的所述保健数据无关。
在进一步实施例中,所述至少一个第二数据集合包括训练集合(training set)、测试集合(test set)或测试集合与训练集合的组合。在一个实施例中,可根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。
在另一实施例中,所述至少一个PM1包括基于所述至少一个PM1的所述性能来选择的MCL组件,以预测所述训练集合或所述测试集合中的所述保健结果的概率。
在进一步实施例中,通过使用个别MCL组件作为具有差分加权的所述至少一个PM1中的变量来从所述MCL产生所述至少一个PM1。单个MCL组件可在单个PM1中使用一次以上。另外,单个MCL组件的每次使用均经受不同统计函数。
在另一实施例中,所述VL包括选自由以下各项组成的群组的变量:患者人口统计、患者保单状态(patient insurance policy status)、患者记账数据(patient billingdata)、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验(patient metabolic panels)、患者代谢功能简档(patient metabolic profiles)、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性(临床标志和症状)、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及CPT(当前程序技术)诊断代码。
在另一实施例中,所述MCL组件是选自由以下各项组成的群组:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性(临床标志和症状)、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及CPT(当前程序技术)诊断代码。
在另一实施例中,所述健康结果是选自由以下各项组成的群组:较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再入院、合并症的发展以及前述任何项的组合。
在另一实施例中,在电子存储媒体中提供所述MDT平台,所述电子存储媒体可选自由以下各项组成的群组:外部硬盘驱动器、CD ROM、USB存储器装置、电子移动装置、桌上型计算机、服务器、VPN、安全因特网网站以及可通过安全特征从因特网下载的软件产品。所述服务器可选自所述保健中心处的现场本地服务器以及由所述保健中心控制的场外共站或云服务器。
在另一实施例中,所述计算装置可经编程以运行选自由以下各项组成的群组的统计技术:机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。
在另一实施例中,使用选自由以下各项组成的群组的统计技术来产生所述至少一个PM0:机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。所述机器学习技术可选自由以下各项组成的群组:分类树方法、LASSO(最小绝对收缩和选择算子)、贝叶斯网络建模以及前述任何项的组合。分类树方法的实例为升高树方法。
在另一实施例中,根据选自由以下各项组成的群组的模型性能参数来产生、排列和选择至少两个PM1:后验对数似然(posterior log likelihoods)、基于事件的后验概率的预测能力(predictive power based upon posterior probability of an event)、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。
在另一实施例中,可通过源自所述一个以上保健中心中的至少一者的验证测试来验证所述至少一个PM0和/或所述至少一个PM1。在一个实施例中,通过源自所述保健中心中的一者或一者以上的测试数据集合来验证所述至少一个PM0和/或所述至少一个PM1。在另一实施例中,可对照源自所述至少一个PM1将应用于的保健中心的测试数据集合来验证所述至少一个PM1
在另一实施例中,可通过对照控制模型的性能进行比较来测量所述经验证的至少一个PM0和/或所述经验证的至少一个PM1的性能。在一个实施例中,可通过应用选自由以下各项组成的群组的统计准则来进行所述经验证的至少一个PM0和/或所述经验证的至少一个PM1的所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。所述机器学习技术可选自由以下各项组成的群组:分类树方法、LASSO(最小绝对收缩和选择算子)、贝叶斯网络建模以及前述任何项的组合。所述分类树方法可为升高树方法。
在另一实施例中,提供一种基于由保健中心提供以供用于产生健康结果的预测模型的数据来补偿所述保健中心的方法,其包括以下步骤:(a)向所述保健中心提供包括变量库(VL)的至少一个数据集合,其中所述保健中心从所述VL选择与感兴趣的健康结果相关的变量;(b)基于所述VL变量产生所述保健中心的第一预测模型(PM0);(c)从所述至少一个PM0产生模型组件库(MCL),其中所述MCL包括因所述至少一个PM0的解构而产生的组件;(d)基于所述MCL组件产生所述感兴趣的健康结果的至少一个第二预测模型(PM1);(e)根据为所述至少一个PM1的所述产生作贡献的所述MCL组件来补偿所述保健中心。在一个实施例中,可在模型解构传送(MDT)平台中提供VL。
在另一实施例中,提供一种基于由保健中心提供以供用于产生健康结果的预测模型的数据来补偿所述保健中心的方法,其包括以下步骤:(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合;(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;(c)基于所述变量的差分加权来产生保健中心的至少一个第一预测模型(PM0);(d)从所述至少一个PM0产生模型组件库(MCL),其中所述MCL包括因所述PM0的解构而产生的组件;以及(e)基于所述MCL组件产生所述感兴趣的健康结果的至少一个第二预测模型(PM1);以及(f)根据为所述至少一个PM1的所述产生作贡献的所述MCL组件来补偿所述保健中心。在一个实施例中,可在包括变量库(VL)的模型解构传送(MDT)平台中提供所述至少一个数据集合。
在另一实施例中,确定所述保健中心的补偿的因素是选自由以下各项组成的群组:所述保健中心的数据的大小或存在、所述保健中心所选择变量的量或种类、从所述保健中心所提供的所述数据丢失的数据的量和/或质量,以及从所述至少一个PM0得出的MCL组件的贡献。
在进一步实施例中,可根据基于从所述至少一个PM0得出的对所述至少一个PM1的性能有帮助的MCL组件的贡献的收入份额百分比来补偿所述保健中心。举例来说,可根据按照所述至少一个PM1中所使用的MCL组件的每个量度的固定支付来补偿所述保健中心。
在下文所陈述的本发明的详细描述中无限制地提供本发明的额外方面和实施例。
附图说明
图1是本发明的一实施例的示意性表示,其中单个PHC具有对单个现场MDT/TL平台的接入权,且产生单个预测模型(PM0)。
图2是本发明的一实施例的示意性表示,其中五个PHC具有对产生五个第一预测模型(PM0)和MCL的MDT/VL平台的个别现场接入权,MCL用来解构PM0以产生单个第二预测模型(PM1),第二预测模型是针对共同代表五个PHC的一般群体中感兴趣的健康结果。
图3是本发明的一实施例的示意性表示,其中使用来自单个PHC的数据来产生第一预测模型(PM0)、MCL以及第二预测模型(PM1)。
图4是本发明的一实施例的示意性表示,所述实施例不涉及MDT/VL平台的应用,其中使用来自五个PHC的数据来产生五个第一预测模型(PM0)和MCL,MCL用来解构PM0以得到单个第二预测模型(PM1),第二预测模型是针对共同代表五个PHC的一般群体中感兴趣的健康结果。
具体实施方式
下文陈述目前相信是所主张的本发明的优选实施例的描述。本申请案的权利要求书意在涵盖功能、目的或结构方面的任何替代或修改。如本说明书和所附权利要求书中所使用,单数形式“一”和“所述”包含复数指代物,除非上下文清楚地另有指示。术语“包括”在用于本说明书和所附权利要求书中时指定所陈述的特征、整体、步骤、操作、元件及/或组件的存在,但并不排除一个或一个以上其它特征、整体、步骤、操作、元件、组件及/或其群组的存在或添加。
在本文可互换使用的术语“保健中心”和“保健设施”意在指代且包含所有类型的保健相关机构,包含但不限于提供住院护理、门诊护理、急诊护理、非急诊护理、长期护理、康复护理、姑息护理、紧急护理、急救护理、创伤中心、三级护理、社区护理和乡村护理的机构。
术语“参与保健中心”或“PHC”意在包含用来根据本发明的方法准备预测模型的保健中心。
如本文所使用,术语“客户”指代可与保健中心交互的任何第三方。此些客户包含但不限于以下各项中的任一者:保险公司;健康管理组织(HMO);保健提供者网络;医疗保险和/或医疗补助;联邦、州或地方政府;地方法庭;军事部门;制药、生物技术和/或医疗装置公司;第三方付款人(例如,自投保的大型雇主);保健中心中的一者或群组,例如医院、门诊诊所以及社区诊所;专科实习,例如肿瘤科、血液透析科、生育科以及眼科实习;移植和器官捐献代理;专业性组织(例如,美国医学会);慈善基金会;以及全球健康计划,包含私人、非营利或政府资助的计划。
如本文所使用,术语“来源”、“若干来源”和“多个来源”用来指代一个或一个以上保健中心。
术语“保健提供者”意在包含医师、护士、执业护士、护士助理、医技人员、牙医、心理学家、顺势医疗者、按摩师,或服从专业发证机构的行为规则的其它保健专业人员,以及上述各项中的任一者的实习人员。
术语“患者”意在包含由保健提供者照看的任何人类个体。在本发明的上下文内,患者可能(但不一定)在经历医疗程序且/或生病。
术语“治疗”意在包含由保健专业人员通过咨询或借助于医疗装置提供的任何医疗、行为、外科和/或程序性动作或干预。治疗可由保健专业人员和/或保健设施中的装置提供,或者根据保健专业人员或保健设施的适当指令,可执行将由患者自己执行的治疗。
术语“健康结果”意在指代因为特定疾病状态和/或病症正接受治疗的患者的不利健康状况。在本发明的上下文内,健康结果的实例包含但不限于:较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再次入院、合并症的发展以及前述任何的组合。
术语“保健数据”意在指代在向患者提供的住院或门诊临床服务的过程中所产生的医疗数据,例如患者病历、物理检查、实验室测试和结果、医疗程序和结果、药物治疗以及患者对药物治疗的反应。如本文所使用,“保健数据”意在包含因为患者接收他/她的保健提供者的临床服务且导览他/她的保健需要(例如药物处方、实验检测预订、记账记录和转诊)所需的记账和其它管理任务而产生的数据。
术语“数据集合”意在指代保健中心所提供的关于患者和/或医疗情况的保健数据。数据集合将通常由保健中心以电子方式(例如通过电子查询)或手动或通过电子与手动方式的组合来提取。数据集合中的保健数据可包含或可不包含个人识别符(此项技术中称为“去识别的数据集合”的无个人信息的数据集合)。在本发明的上下文内,来自特定保健中心(即,“数据来源”)的数据集合将通常与为之建立预测模型的保健结果相关。
术语“测试集合”意在指代根据用来验证预测模型的PHC或非PHC(见,实例2到6)所提供的数据而准备的数据集合。换句话说,将预测模型应用于测试数据集合,来检查预测模型执行得多好。在本发明的上下文内,测试集合通常是针对来自接近预测模型的年份或为预测模型的当前年份的年份的数据集合。
术语“训练集合”意在指代根据用来针对特定病症或疾病状态产生或训练一个或一个以上预测模型的PHC或非PHC(见,实例2到6)所提供的数据而准备的数据集合。在本发明的上下文内,训练集合通常是针对从进一步移除(在过去)的年份到预测模型的年份的数据集合。
术语“电子健康记录”或“EHR”意在包含保健设施托管的电子医疗记录(EMR);基于因特网的EHR;保健提供者(包含指定人员)、患者和/或消费者所输入的数据。
术语“存储媒体”和“电子存储媒体”包含但不限于外部硬盘驱动器、CD ROM、USB存储器装置(也称为“存储棒”和“拇指驱动器”)、电子移动装置(例如,智能电话、平板计算机、笔记本型计算机或膝上型计算机)、桌上型计算机、服务器(包含公众不可接入的封闭式服务器网络)、VPN、安全因特网网站以及可通过安全特征从因特网下载的软件产品。安全特征包含但不限于数字证书、用户访问代码、自动期满日期以及抗解密机制。
术语“服务器”意在指代专用于进行受试者操作的独立计算机和/或连网服务器。可结合本发明使用的独立和连网服务器的实例包含但不限于桌上型计算机、膝上型计算机、移动装置、协同定位服务器、本地现场服务器和场外云服务器。云服务器包含公用云服务器和私用/专用云或混合云服务器。
如本文所使用,术语“控制模型”指代预测模型,或实践指南,或资格准则(例如,执行医疗服务、提供对医疗服务的覆盖或偿还保健专业人员或保健设施所需的准则),其在保健行业中用于标准用途,或更具体地说,用于通过特定PHC产生预测模型。
如本文所使用,术语“基线”指代总体平均概率,而不考虑任何概要分析或建模。参考控制模型,如果未进行预测性建模,那么基线为平均概率。如果不存在先前模型,那么可通过使用保健提供者在特定情形中通常使用的一个或一个以上变量来产生控制模型。
术语“模型解构与传送”以及“MDT”意在指代一个平台,这个平台允许PHC提供对第三方的接入、使用PHC的保健数据来产生没有任何现场个人识别符的预测模型,且将所述预测模型传送到第三方设施用于解构,而不传送个人识别符或任何原始数据。可结合本发明使用的MDT平台的一个实例为电子存储媒体,其含有MDT平台,且允许PHC接入MDT平台。
术语“变量库”和“VL”意在指代本发明的MDT平台中所提供的变量;所述术语意在包含可填入MDT平台的所有变量和变量子集。可在本发明的上下文中使用的VL的实例包含但不限于患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性(临床标志和症状)、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及CPT(当前程序技术)诊断代码。
术语“MCL”、“模型组件库”和“MCL组件”意在指代从预测模型(PM0)的统计特征得出的经解构组件。每一MCL组件表示与数据集合、VL或两者的组合中提供的一个或一个以上变量有关的统计特征。所述术语包含所有包括MCL的组件,以及包含于其中的组件的所有子集。在本发明的上下文内,MCL组件可借助于MDT平台(见,例如图2)从PHC得出的预测模型(PM0)得出,或MCL组件可直接从尚未通过MDT平台(见,例如图4)分析的PHC得出的预测模型(PM0)得出。可在本发明的上下文中使用的MCL的实例包含但不限于患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果(组织活检)、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性(临床标志和症状)、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及CPT(当前程序技术)诊断代码。
为了实现感兴趣的健康结果的有用预测模型,有必要具有由具不同临床特性(优选来自多个来源)的患者组成的数据集合。保健数据的多样性对于应用对一般群体内的个人来说有意义的预报是至关重要的,所述一般群体包含非典型以及典型患者。在最广意义上,保健的多样性与各种健康和/或疾病结果预测指标有关。在更具体的意义上,不同保健数据包含但不限于临床特性,例如年龄、种族、性别、体质指数;基因预测指标,例如某些突变、缺失、单核苷酸多态性、序列的存在;代谢或生理学预测指标,例如血清中的某些代谢物或分泌因子的水平,或生理学量度,例如心率和心电图数据。
尽管统计和数学建模已取得进步,但从多个数据源提取最有利的健康结果预测工具的挑战依然存在。阻碍物中的一些与以下各项有关:EHR数据库结构的非标准化;归因于保健中心之间的不同临床协议和工作流程的可变数据条目;IT和网络互操作性标准的缓慢采用;与链接到个人识别符的保健数据的法定和机构强加保护相关联的数据共享低效性、责任且因此引起的成本。
本发明提供用于利用存在于多个来源之间的大量保健数据且将所述数据转变为预测模型的方法,所述预测模型含有许多多样性和预报值,且能够应用于可具有或可不具有积累多年的保健数据的患者群。另外,本发明的方法促进了基于来自多个来源的不同数据集合的预测模型的建立,而无需去识别保健数据,或物理上从保健中心传送任何识别或经去识别的数据。在实践中,参与保健中心(PHC)将其数据集合输入到模型解构和传送(MDT)平台中,所述平台安装在PHC的虚拟或物理资产中。所述MDT平台包含变量库(VL),其允许PHC选择将用以产生和验证所述预测模型的变量。一旦建立预测模型,PHC就可进一步利用MDT平台来从预测模型提取统计特征和/或组件,并将那些特征和/或组件发送到第三方,第三方又可将所述统计特征和/或组件连同来自其它设施(即,多个来源)的统计特征和/或组件重组成模型组件库(MCL)。可将多个来源得出的MCL应用于其它数据集合,以训练和/或验证表示起源于多个来源的不同患者简档的预测模型。
本文所述的方法的优点在于与保健有关的数据集合永远无需离开PHC的物理或虚拟站点。重要的是,发送到第三方的任何MCL产生的统计特征和/或组件没有任何个人识别符。
实例1到6描述根据本发明的预测模型的产生。实例1描述用于为五个诊所(即PHC-A到PHC-E)中的每一者产生与子宫内受精(IUI)的成功率有关的第一预测模型(PM0)的示范性方法。实例2描述与从两个三级中心(PHC-A和PHC-B)和三个社区医院(PHC-C到PHC-E)得出的一般化群体中的哮喘患者的ER再入院率有关的第二预测模型(PM1)的产生。实例2还描述如何为这五个PHC对PM1的产生的贡献而补偿五个PHC中的每一者。实例3和4提供本发明的MCL可如何扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围的实例。在实例3中,非PHC地区保健网络想要IUI治疗成功率的预测模型,但属于他们自己的日期非常少。在实例4中,PHC-E想要定制的预测模型,其将PHC-E的PM0扩展超过其核心患者群体。在这两个实例中,A公司从实例1的五个PM0准备MCL,且解构MCL中的数据以产生定制的PM1,PM1预测群体中的IUI治疗成功率,其超过非PHC地区保健网络(实例3)和实例4的PHC-E所特定的成功率。实例5描述用于为三个诊所产生三个糖尿病病症(视网膜病变、肾功能障碍以及高血清LDL胆固醇)的第一预测模型(PM0)(即,产生9个PM0)的方法。将每一病症特定的每一PM0解构成其基础组件,以准备特定病症特定的MCL(即,准备3个MCL)。接着使用每一MCL来产生由诊所中的每一者表示的集体患者群中每一病症所特定的第二预测模型(PM1)。实例6描述与实例5中所示的程序类似的程序,但疾病状态为癌症,且病程进展为缓解期的患者在接下来的五年时间内的肿瘤复发和/或转移。在此实例中,产生三个诊所的PM0数据以得出6个PM0值,其经解构以准备两个病症中的每一者所特定的MCL。接着使用MCL来产生由三个诊所中的每一者表示的患者群中每一病症所特定的PM1。在实例1到6中,将理解,MDT平台、VL和MCL(包含MDT、VL和MCL中的所有变量和组件)由A公司拥有。最后,应理解,PHC可以因为将PHC的数据呈交给MDT平台的数据使用而向A公司收费或可以不向A公司收费,但在任何情况下,PHC将负责在解构数据集合之前准备其自己的数据备份副本。
在本发明的一个方面中,可解构每一PM0以形成MCL,MCL可将包括PM0的变量中的每一者剖析成个别组件。图2到4展示本发明的解构过程的示意图。解构过程从每一PM0提取每一和全部统计特征,以形成MCL。如图2到4中所示,解构过程由服务器最有效地进行。使用本发明的MCL来产生第二预测模型PM1,第二预测模型PM1能够提供较广群体中的个人的感兴趣的健康结果的准确预测,所述群体由特定项目中所涉及的PHC中的每一者的集体群体表示。
将PM0解构成组成MCL的统计特征。这些统计特征或MCL组件包含但不限于:PM0或PM0的部分的个别预测性变量,以及具有预测性值的PM0或PM0的部分的值范围或阈值;预测性变量的相对贡献以及相关联的值范围;预测性变量的子集以及具有预测值的相关联值范围或阈值;预测性变量和阈值的子集的使用以最佳界定充满某一特质、预后或结果的患者群体;预测能力;辨别力;以及重新分类。在从MCL产生一个以上PM1的情况下,可使用相同统计特征(本文中也称为“模型性能参数”)来产生、排列一个以上PM1,以及在一个以上PM1之间选择。
通过以一组参数为条件的后验概率来测量预测能力;其可依据对数似然、机率比的后验概率(对数级或线性级)和/或对数似然的改进百分比来表达。辨别力指代模型可多好地区分具有较高对较低结果概率的患者,或具有显著不同预后的患者。辨别能力可通过受试者工作特性分析来测量,其中曲线下面积(AUC)指示辨别程度,且AUC=0.5指示模型不具有辨别能力。重新分类是效用量度,且指代预测模型为其提供显著不同于控制模型所预测的概率的所预测概率的患者的百分比(95%置信区间)。
所属领域的技术人员将理解,预测性模型的描述通常包含:所估计的误差范围,其可因所预测概率的不同百分位范围(四分位数或五分位数)而不同;指代可预测的概率范围的动态范围。除上述内容之外,所属领域的技术人员将通常计算从预测模型获得的所预测概率的频率。或者,百分等级可与所预测概率的阈值相关(例如,最前面百分之10的患者具有≥50%的具有某一结果的所预测概率)。在本发明的上下文内,在其已从MCL组件(或统计特征)产生所预测概率的频率之后,所预测概率的频率将指向正为其验证预测模型的特定患者群体。
在本发明的另一实施例中,可将PHC的整个数据集合用作训练集合来形成具有解决特定临床结果的每一预测模型的一个或一个以上预测模型。在此情况下,将理解,根据此实施例而作出的预测模型本身将不经验证,但在从客户的此PHC的预测模型得出的MCL的帮助下建立的预测模型将使用客户的测试集合经受验证。
在另一实施例中,PHC可提供测试集合,还有训练集合。在此情况下,MDT平台主要用作将MDT平台内所含有的一个或一个以上预存在预测模型(MDT平台内所含有的预测模型由术语PM0、PM1、PM2等参考)应用于测试集合且测量预测模型对测试集合执行得多好的机制。
在另一实施例中,可将数据集合分成非重叠的训练和测试集合。训练集合可由MDT平台用来建立一个或一个以上预测模型。接着可对照测试集合验证这些预测模型。在验证过程期间,每一模型的性能由统计测试评定。将数据分成训练和测试集合可通过若干方法来实现,包含但不限于按时间顺序或随机。从横跨六年(例如,2005到2010)的数据集合产生的按时间顺序测试或训练集合可包括由来自从分析日期开始计算的最近年份(即,可用的最近1到3年或2008到2010)的数据组成的测试集合,以及由来自从分析日期开始计算的较晚年份(即,可用的最早三年或2005到2007)的数据组成的训练集合。可在具有或不具有交叉验证的情况下产生随机准备的测试或训练集合,其中进行许多随机化迭代,且测量随机化研究的中等性能。应理解,本文所描述的测试和训练集合还可通过一种以上方法来准备;就是说,例如,可通过按时间顺序与随机方法的组合来产生测试和训练集合。
在本发明的另一实施例中,从一个以上保健中心的至少一者获得第二数据集合,其中第二数据集合包括与来自MCL中未表示的保健中心的患者群组有关的保健数据,且为非冗余并与用以产生MCL的数据无关。
在本发明的另一实施例中,来自一个以上保健中心的至少一者的第二数据集合,其中第二数据集合包括与来自MCL中所表示的保健中心的患者群组有关的保健数据,其中第二数据集合对第一数据集合非冗余,且包括第二数据集合的保健数据与用以产生MCL的保健数据无关。
在本发明的另一实施例中,提供一种用于通过有效的补偿方法激励PHC以规则的时间间隔(例如,每年)提供经更新的数据的方法。参考实例4,其描述其中客户(即,地区健康网络)不同于PHC的情形,客户向A公司付款,使A公司生产经由MDT平台和MCL的使用从多个来源产生经验证模型。向A公司的付款可呈基于项目的费用(其可为预付款)的形式,或测试即服务(test-as-a-service)模型的形式,其中预付款相对较少,且一旦MCL经开发、验证且可供使用,就在每测试基础上向所述公司付款。可经由独立或EHR支持的DSS来使MCL可供使用。根据此付款方法,不是为了许可其数据的使用,而是为了参与MDT平台和MCL的产生且为了为最终DSS工具的预测能力做贡献而补偿PHC。在本发明的一个实施例中,A公司组织PHC的参与,且为PHC的参与和对预测模型的相对贡献而补偿PHC。所述补偿可呈固定费率、反映PHC对预测模型的性能的相对贡献的费用或两者的组合的形式。在本发明的另一实施例中,客户组织或请求指定PHC的参与,且A公司设计并执行统计和计算工作。在后者实施例中,客户直接补偿PHC,且还为所得预测模型或所述预测模型的执行向A公司付款。
在本发明的另一实施例中,可将所述补偿应用于PHC的参与。影响补偿量的因素包含但不限于:数据集合的大小或存在、变量的量或种类,以及数据质量(例如,缺失数据的量)。在本发明的另一实施例中,补偿由对正为在最终预测模型(即,DSS工具)中使用而选择的MCL组件的贡献决定。在这方面,PHC没法先验地知晓哪些模型组件将对使用独立数据集合的预测模型验证贡献最多。推测起来,操作的一致性、较大的数据集合大小、多年的数据全部给予预测能力,但患者及其临床属性的多样性也是重要因素。举例来说,如果独立数据集合包括也共享此罕见特质的个人,那么具有罕见特质的富集的非常小的数据集合可唯一地对预测模型贡献。
本文所描述的补偿方法不仅激励不同大小的保健中心参与,而且产生对改进数据集合的欺诈性企图的抑制因素,因为不可能知晓何种数据将贡献最多预测能力,也不可能知晓哪些模型组件将在为另一群体产生预测模型时最有用。变量的相对重要性还取决于正为其建立新模型的群体。举例来说,两个不同客户可能会需要不同的MCL模型组件(例如,患者群体具有不同特性的两个不同地区保健网络)。对PHC的补偿可呈收入份额的百分比(见,实例2)、按所使用的MCL模型组件的量度的固定支付、会员注册或某些其它互相认可的条款的形式。
在本发明的另一实施例中,一个或一个以上第三方可许可使用已经经由所描述的MDT/VL/MCL方法从多个来源建立的预测模型的权利。
在本发明的另一实施例中,在不使用MDT工具的情况下产生MCL。根据此方法,获得来自一个或一个以上PHC的数据,且从数据集合选择感兴趣的健康结果特定的变量。使用前面所论述的计算方法和统计准则,产生每一PHC所特定的PM0。接着可解构PM0以形成MCL,其可用来产生横跨一个以上PHC的群体中感兴趣的健康结果所特定的PM1
将理解,本文所提供的模型意在用来预测任何疾病状态,且不是本文中或以下实例和/或所附权利要求书中所描述的疾病状态所特定且/或独有。在这方面,前面的描述和下面的实例意在说明且不限制本发明的范围。另外,将理解,本文所陈述的实施例和实例不是排它性的,且在不脱离本发明的范围和精神的情况下,所属领域的技术人员将明白本发明的修改和变化。
实验
陈述以下实例以向所属领域的技术人员提供如何制作和使用如本文所陈述的本发明的方面和实施例的完整揭示内容。
实例1
用于咨询患者关于IUI治疗成功率的预测模型(PM0)的产生
此实例描述用以在对尚未能够自然怀孕的个人和夫妇的子宫内受精(IUI)治疗之后提供具有宫内妊娠结果的所预测概率的决策支持(DS)工具的开发。
A公司希望响应生育市场中对开发用以在对尚未能够自然怀孕的个人和夫妇的IUI治疗之后提供具有宫内妊娠结果的所预测概率的DS工具的需要。为了开发将服务本国内的不同群体(例如,农村、城市、东海岸、中西部、南部、西海岸以及各个种族)的此DS工具,A公司建立具有共同服务不同群体的5个生育诊所的产品开发布置。
A公司将外部存储媒体上的模型解构与传送(MDT)平台连同指令提供给五个PHC中的每一者:PHC-A、PHC-B、PHC-C、PHC-D和PHC-E。每一MDT经设计以为特定临床结果或临床结果集合建立预测模型。指示PHC准备呈电子表格格式或可导出到若干输入格式中的一者的数据集合,其含有关于MDT的VL中所列的变量的数据。每一PHC可具有VL中的不同变量子集的数据,其中一些变量比其它变量在更多诊所中可用。另外,如果诊所具有关于不在VL中的变量的数据,那么其可创建新的变量来添加到VL。PHC无需使用同一组变量,且所述变量的数据输入无需正规化或标准化;换句话说,数据集合的结构无需遵循相同规则。
如果PHC的策略以及任何适用的HIPPA规定许可,那么数据集合可包含PHI和个人识别符。或者,此数据集合可为经去识别或受限的数据集合,其含有日期,但不含有其它个人识别符。将理解,来自任何特定PHC的数据集合不与A公司、其它PHC中的任一者或任何终极用户共享。
每一PHC现场运行MDT平台(见,例如图1);因此,输入到MDT平台中的数据集合不离开PHC物理位置,且不暴露于A公司。在完成MDT执行后,自动销毁所述数据集合,且展示确认销毁的消息,并可由MDT将其打印(到纸上或打印到便携式数据文件(pdf))。因为存储媒体和MDT产品为A公司所有,但被视为借给每一PHC来进行特定执行,因此数据集合的销毁确认A公司将不具有对所述数据集合的存取权。在销毁数据集合后,将现在含有预测模型PM0但不含有所述数据集合的MDT返回给A公司以用于解构PM0,以产生MCL的统计特征或组件。PHC具有通过使用测试集合来验证MDT中的数据的选项,所述测试集合是从PHC数据集合产生,或作为输入到MDT中的单独数据集合由PHC提供。将测试数据集合连同训练数据集合一起销毁。
MDT和外部硬盘驱动器现在含有与每一PHC特定的IUI治疗的成功率有关的预测模型(PM0)(其可或可不依据PHC是否运行了验证测试或训练集合来验证)。这些预测模型(PM0)不含有任何原始数据或识别符;相反,它们是表示具有其可从中得出的特定PHC的预测值的变量之间的统计关系的经编码预测模型。
在A公司接收到来自五个PHC中的每一者的五个MDT平台和外部存储媒体之后,将来自每一MDT平台的PM0下载到A公司的安全服务器。A公司将根据先验地确定的统计测试来回顾每一PM0的性能。用于性能测试的可接受准则可为预定的或在回顾时确定。基于PM0的性能,A公司能够建议每一PHC如何使用PM0来向其患者提供关于其诊所中的IUI治疗的成功率的信息。
实例2
用于识别具有高ER再入院率的患者的预测模型(PM1)以及PHC补偿模型的产生
具有ER设施的小社区医院链要求A公司使用从两个三级中心(PHC-A和PHC-B)以及三个社区医院(PHC-C、PHC-D和PHC-E)得出的MCL模型组件来开发DS工具以预测患者在因哮喘发作而从ER出院之后返回到ER的概率。DS工具将允许医院链具有建立或测试具有返回到ER的较高风险的哮喘患者在某一时间周期内在门诊环境中接受随访程序以便最小化返回到ER的需要的选择。
A公司使用如实例1中所提供的MDT平台为五个PHC中的每一者产生五个第一预测模型(PM0),以预测每一PHC的哮喘患者在第一次入院之后返回到ER的可能性。A公司接着从五个PM0中的每一者产生MCL,且使用MCL中的组件来产生单个第二预测模型(PM1),其预测横跨五个PHC的患者群体中的哮喘患者在第一次入院之后返回到ER的可能性。使用客户自己的数据来训练和验证PM1
用对预测能力具有以下贡献的五个PHC的MCL组件来产生PM1:PHC-A 25%、PHC-B40%、PHC-C 30%、PHC-D 4%以及PHC-E 1%。医院链因A公司提供PM1而向其付款。A公司又分配收入的5%来以根据五个PHC对PM1的预测能力的贡献的比率(例如25:40:30:4:1)与五个PHC分享。因此,PHC-A接收支付给A公司的收入的1.25%;PHC-B接收支付给A公司的收入的2.0%;PHC-C接收支付给A公司的收入的1.5%;PHC-D接收支付给A公司的收入的0.2%;且PHC-E接收支付给A公司的总收入的0.05%。
实例3
用于非PHC的预测模型(PM1)的产生
客户地区保健网络要求A公司建立经定制的DS工具来将IUI治疗的结果的所预测概率提供给其保健提供者和患者。地区保健网络已仅开始在过去两年提供IUI治疗,因此其不具有充足的数据来产生和验证其自己的预测模型。
A公司使用实例1的五个预测模型(PM0)来准备用来产生展示由实例1的五个PHC表示的患者群体中的IUI治疗的成功率的单个第二预测模型(PM1)的MCL。将地区保健网络自己的数据用作测试集合来验证PM1在客户的患者群体中的使用。在验证期间,根据本文所述的统计测试来评定PM1的性能。
实例4
用于PHC的经定制预测模型(PM1)的产生
PHC-E向A公司作出对经定制预测模型(PM1)的请求,所述经定制预测模型比根据实例1所产生的基于PHC-E自己的数据建立和验证的PM0更具预测性。因为PHC-E与其它四个PHC(见,实例2的补偿模型)相比具有非常小的数据集合,所以PHC-E对利用可从使用实例3的MCL获得的总预测能力感兴趣。
为了准备经定制预测模型,PHC-E向A公司提供经去识别的数据集合,其为非冗余的且独立于用用以为PHC-E建立PM1的实例1的MDT平台产生的数据集合。A公司对地区保健网络执行与实例3中所描述的程序相同的程序,以到达PHC-E的PM1。用从PHC-E自己的数据得出的测试和训练集合来验证PM1
实例5
用于识别在指定时间周期内有病程进展的较高风险的糖尿病患者的预测模型(PM1)的
产生
客户医院诊所希望开发DS工具来识别6个月内特定地区中具有较高的病程进展(例如视网膜病变、肾功能障碍和高血清LDL胆固醇水平)概率的糖尿病患者。A公司从三个PHC(PHC-1到PHC-3)获得数据集合,以产生九个个别第一预测模型(PM0):用于PHC-1的三个PM0,每一PM0为糖尿病患者在六个月的周期内的三种疾病状态(即,视网膜病变、肾功能障碍和高血清LDL胆固醇)的进展所特定;用于PHC-2的三个PM0,每一PM0为三种疾病状态中的每一者所特定;以及用于PHC-3的三个PM0,每一PM0为三种疾病状态中的每一者所特定。包含于用以准备PM0值的数据集合中的变量包含但不限于指定时间周期内的全血和尿液分析全套试验;来自指定时间周期内的眼部检查和视网膜图的数据;与肾脏感染的频率、发生和/或再次发生、性别、年龄、BMI以及患者营养和生活习惯有关的患者病历。使用九个PM0来准备三个MCL,其中每一MCL为每一疾病状态所特定。使用三个MCL中的每一者来产生三个第二预测模型(PM1)中的每一者,所述第二预测模型分别能够横跨被视为由PHC-1到PHC-3的集体群体表示的患者群体,预测糖尿病患者在六个月周期内的视网膜病变、肾功能障碍和高血清LDL胆固醇的进展。包括三个PM1值的DS工具将允许客户识别处于危险中的患者,以登记加入新的管理计划,其提供较频繁的访问、监视和教育,目标是降低病程进展的速率。
实例6
用于识别在指定时间周期内有病程进展的较高风险的癌症患者的预测模型(PM1)的产
客户癌症诊所希望开发DS工具来识别具有肿瘤复发和/或转移的形式的病程进展的较高概率的处于缓解期的癌症患者。A公司从三个PHC(PHC-1到PHC-3)获得数据集合,以产生六个个别第一预测模型(PM0):用于PHC-1、PHC-2和PHC-3中的每一者各两个PM0,其中每一PM0为癌症患者在五年周期内的两种疾病状态(即,肿瘤复发和肿瘤转移)的进展所特定。包含于用以准备PM0值的数据集合中的变量包含但不限于已知癌症生物标记、性别、年龄、BMI、分子诊断、病理亚型分类、健康史以及患者对先前治疗的反应。使用六个PM0来准备两个MCL,每一疾病状态各一个。使用两个MCL来产生两个第二预测模型(PM1),其能够分别跨被视为由PHC-1到PHC-3的集体群体表示的患者群体预测当前针对接下来五年处于缓解期的癌症患者的肿瘤复发和肿瘤转移的进展。包括两个PM1值的DS工具将允许客户识别处于危险中的患者,以登记加入新的管理计划,其提供较频繁的访问、监视和教育,目标是较早检测到肿瘤复发和/或转移,使得可较早考虑并起始治疗来停止病程进展。

Claims (76)

1.一种产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:
(a)为一个以上保健中心提供具有由变量库组成的模型解构与传送平台,其中每一保健中心将与所述感兴趣的健康结果相关的至少一个数据集合输入到所述模型解构与传送平台 中,且从所述变量库选择与所述感兴趣的健康结果相关的变量;
(b)从所述模型解构与传送平台产生每一保健中心的至少一个第一预测模型,其中所述至少一个第一预测模型是基于所述选定变量并且通过使用计算装置来产生,以及进一步其中所述至少一个第一预测模型提供较广群体中的个人的感兴趣的健康结果的预测,所述较广群体由所述至少一个数据集合表示,所述方法扩展不具有充足数据来形成其自己对感兴趣的健康结果的预测的保健中心的预测范围。
2.根据权利要求1所述的方法,其进一步包括以下步骤:
(c)从所述至少一个第一预测模型中的每者产生模型组件库,其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件,其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的,以及
(d)从所述模型组件库产生至少一个第二预测模型,其中所述至少一个第二预测模型经设计以预测共同代表每一保健中心的患者群体中的所述感兴趣的健康结果的概率。
3.根据权利要求1所述的方法,其中所述感兴趣的健康结果选自由以下各项组成的群组:较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再入院、合并症的发展以及前述任何项的组合。
4.根据权利要求1所述的方法,其中所述变量库包括选自由以下各项组成的群组的变量:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及当前程序技术诊断代码。
5.根据权利要求2所述的方法,其中所述模型组件库组件选自由以下各项组成的群组:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及当前程序技术诊断代码。
6.根据权利要求1所述的方法,其中在电子存储媒体中提供所述模型解构与传送平台。
7.根据权利要求6所述的方法,其中所述电子存储媒体选自由以下各项组成的群组:外部硬盘驱动器、CD ROM、USB存储器装置、电子移动装置、桌上型计算机、服务器、VPN、安全因特网网站以及可通过安全特征从因特网下载的软件产品。
8.根据权利要求7所述的方法,其中所述服务器选自所述保健中心处的现场本地服务器以及由所述保健中心控制的场外共站或云服务器。
9.根据权利要求1所述的方法,其中使用选自由以下各项组成的群组的统计技术来产生所述至少一个第一预测模型:机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。
10.根据权利要求9所述的方法,其中所述机器学习技术选自由以下各项组成的群组:分类树方法、最小绝对收缩和选择算子、贝叶斯网络建模以及前述任何项的组合。
11.根据权利要求10所述的方法,其中所述分类树方法为升高树方法。
12.根据权利要求1所述的方法,其中通过源自所述至少一个保健中心中的至少一者的验证测试来验证至少一个第一预测模型。
13.根据权利要求12所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第一预测模型的性能。
14.根据权利要求2所述的方法,其中对照源自所述至少一个第二预测模型将应用于的保健中心的测试数据集合来验证所述至少一个第二预测模型。
15.根据权利要求14所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第二预测模型的性能。
16.根据权利要求13所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。
17.根据权利要求15所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。
18.根据权利要求2所述的方法,其中通过使用个别模型组件库组件作为具有差分加权的所述至少一个第二预测模型中的变量来从所述模型组件库产生所述至少一个第二预测模型。
19.根据权利要求18所述的方法,其中单个模型组件库组件可在来自所述至少一个第二预测模型的单个预测模型中使用一次以上。
20.根据权利要求19所述的方法,其中单个模型组件库组件的每次使用均经受不同统计函数。
21.根据权利要求2所述的方法,其进一步包括以下步骤:
(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述模型组件库中未表示的保健中心的患者群组有关且对用以产生所述模型组件库的数据非冗余并与用以产生所述模型组件库的数据无关的保健数据。
22.根据权利要求2所述的方法,其进一步包括以下步骤:
(e)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述模型组件库中所表示的保健中心的患者群组有关的保健数据,其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余,且包括所述至少一个第二数据集合的所述保健数据与用以产生所述模型组件库的所述保健数据无关。
23.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括训练集合。
24.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括训练集合。
25.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括测试集合。
26.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括测试集合。
27.根据权利要求21所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。
28.根据权利要求22所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。
29.根据权利要求27所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。
30.根据权利要求28所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。
31.根据权利要求23所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。
32.根据权利要求24所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。
33.根据权利要求25所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。
34.根据权利要求26所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。
35.根据权利要求2所述的方法,其中根据选自由以下各项组成的群组的模型性能参数来产生、排列和选择所述至少一个第二预测模型中的至少两者:后验对数似然、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。
36.一种用于产生感兴趣的健康结果的预测模型的方法,其包括以下步骤:
(a)从一个以上保健中心获得与所述感兴趣的健康结果相关的至少一个数据集合,其中所述一个以上保健中心各自提供单个数据集合,所述单个数据集合当合并时包括所述至少一个数据集合;
(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;
(c)基于所述至少一个数据集合变量的差分加权来产生每一保健中心的至少一个第一预测模型,其中使用计算装置来产生所述至少一个第一预测模型;
(d)从所述至少一个第一预测模型中的每者产生模型组件库,其中所述模型组件库包括因所述至少一个第一预测模型中的每者的解构而产生的组件,其中所述至少一个第一预测模型解构成所述模型组件库是通过服务器进行的;
(e)基于与所述感兴趣的健康结果相关的所述模型组件库组件的差分加权从所述模型组件库产生至少一个第二预测模型,以及
(f)基于所述至少一个第二预测模型识别有所述感兴趣的健康结果危险的患者以及产生用于治疗处于危险中的患者的管理计划。
37.根据权利要求36所述的方法,其中在步骤(a)中,每一保健中心将所述至少一个数据集合输入到包括变量库的模型解构与传送平台中。
38.根据权利要求36所述的方法,其中所述感兴趣的健康结果选自由以下各项组成的群组:较差的治疗反应、病症的恶化、病程进展的速度、干预程序之后的成功概率、干预程序之后的失败概率、干预程序之后的并发症概率、因为特定病症而重新回到急救服务、因为特定病症而再入院、合并症的发展以及前述任何项的组合。
39.根据权利要求36所述的方法,其中所述模型组件库组件选自由以下各项组成的群组:患者人口统计、患者保单状态、患者记账数据、患者家族史、患者实验结果、患者成像结果、患者病理学结果、患者免疫病理学结果、患者细胞学结果、患者细胞遗传学结果、患者基因表达、患者代谢功能全套试验、患者代谢功能简档、患者基因组数据、患者对程序的反应、患者药物治疗、患者治疗方案、患者紧急护理参数、患者流动监视;门诊访问的频率、急诊访问的频率、入院频率、再入院频率;生活质量评定;临床特性、临床诊断、临床住院程序、临床门诊程序;监视癌症复发、精神病评定;以及当前程序技术诊断代码。
40.根据权利要求36所述的方法,其中步骤(c)的所述计算装置经编程以运行选自由以下各项组成的群组的统计技术:机器学习、逻辑回归、线性回归、非线性回归以及前述任何项的组合。
41.根据权利要求40所述的方法,其中所述机器学习技术选自由以下各项组成的群组:分类树方法、最小绝对收缩和选择算子、贝叶斯网络建模以及前述任何项的组合。
42.根据权利要求41所述的方法,其中所述分类树方法为升高树方法。
43.根据权利要求36所述的方法,其中通过源自所述保健中心中的一者或一者以上的测试数据集合来验证至少一个第一预测模型。
44.根据权利要求43所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第一预测模型的性能。
45.根据权利要求36所述的方法,其中通过源自所述保健中心中的一者或一者以上的测试数据集合来验证至少一个第二预测模型。
46.根据权利要求45所述的方法,其中通过对照控制模型的性能进行比较来测量所述经验证的至少一个第一预测模型的性能。
47.根据权利要求44所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目、实施的容易性、计算时间、辨别力、校准以及重新分类。
48.根据权利要求46所述的方法,其中通过应用选自由以下各项组成的群组的统计准则来进行所述比较:基于后验对数似然的预测能力、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目、实施的容易性、计算时间、辨别力、校准以及重新分类。
49.根据权利要求36所述的方法,其中通过使用个别模型组件库组件作为具有差分加权的所述至少一个第二预测模型中的变量来从所述模型组件库产生所述至少一个第二预测模型。
50.根据权利要求49所述的方法,其中单个模型组件库组件可在所述至少一个第二预测模型中的单个预测模型中使用一次以上。
51.根据权利要求50所述的方法,其中单个模型组件库组件的每次使用均经受不同统计函数。
52.根据权利要求36所述的方法,其进一步包括:
(f)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自所述模型组件库中未表示的保健中心的患者群组有关且对用以产生所述模型组件库的数据非冗余并与用以产生所述模型组件库的数据无关的保健数据。
53.根据权利要求36所述的方法,其进一步包括:
(f)从所述一个以上保健中心的至少一者获得至少一个第二数据集合,其中所述至少一个第二数据集合包括与来自模型组件库中所表示的保健中心的患者群组有关的保健数据,其中所述至少一个第二数据集合对步骤(a)的所述至少一个数据集合非冗余,且包括所述至少一个第二数据集合的所述保健数据与用以产生所述模型组件库的所述保健数据无关。
54.根据权利要求52所述的方法,其中所述至少一个第二数据集合包括训练集合。
55.根据权利要求53所述的方法,其中所述至少一个第二数据集合包括训练集合。
56.根据权利要求52所述的方法,其中所述至少一个第二数据集合包括测试集合。
57.根据权利要求53所述的方法,其中所述至少一个第二数据集合包括测试集合。
58.根据权利要求52所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。
59.根据权利要求53所述的方法,其中所述至少一个第二数据集合包括测试集合与训练集合的组合。
60.根据权利要求58所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。
61.根据权利要求59所述的方法,其中根据所述保健数据的起源年份按时间顺序将所述至少一个第二数据集合分成训练集合和测试集合。
62.根据权利要求54所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。
63.根据权利要求55所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述训练集合中的所述保健结果的概率。
64.根据权利要求56所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。
65.根据权利要求57所述的方法,其中所述至少一个第二预测模型包括基于所述至少一个第二预测模型的所述性能来选择的模型组件库组件,以预测所述测试集合中的所述保健结果的概率。
66.根据权利要求36所述的方法,其中根据选自由以下各项组成的群组的模型性能参数来产生、排列和选择所述至少一个第二预测模型中的至少两者:后验对数似然、基于事件的后验概率的预测能力、基于所估计预测误差的预测能力、所预测概率的动态范围、重新分类、所预测概率的频率、交叉验证误差、所需的模型组件的数目以及辨别力。
67.一种基于由保健中心提供以供用于产生健康结果的预测模型的数据来补偿所述保健中心的方法,其包括以下步骤:
(a)为一个以上保健中心提供变量库,其中每一保健中心输入与感兴趣的健康结果相关的至少一个数据集合,且从所述变量库选择与感兴趣的健康结果相关的变量;
(b)为每一保健中心产生至少一个第一预测模型,其中所述至少一个第一预测模型中的每者是基于所述选定变量并且通过使用计算装置来产生;
(c)从每个第一预测模型产生模型组件库,其中所述模型组件库包括因每个第一预测模型的解构而产生的组件,其中所述第一预测模型解构成所述模型组件库是通过服务器进行的;
(d)基于所述模型组件库组件产生所述感兴趣的健康结果的至少一个第二预测模型;
(e)基于第二预测模型识别有所述感兴趣的健康结果的危险的患者以及产生用于治疗处于危险中的患者的管理计划;以及
(f)根据为所述至少一个第二预测模型的所述产生作贡献的所述模型组件库组件来补偿所述保健中心。
68.根据权利要求67所述的方法,其中在模型解构与传送平台中提供所述变量库。
69.根据权利要求67所述的方法,其中确定所述保健中心的补偿的因素是选自由以下各项组成的群组:所述保健中心的数据的大小或存在、所述保健中心所选择变量的量或种类、从所述保健中心所提供的所述数据丢失的数据的量和/或质量,以及从所述至少一个第一预测模型得出的模型组件库组件的贡献。
70.根据权利要求67所述的方法,其中根据基于从所述至少一个第一预测模型得出的对所述至少一个第二预测模型的性能有帮助的模型组件库组件的贡献的收入份额百分比来补偿步骤(f)的所述保健中心。
71.根据权利要求67所述的方法,其中根据按照所述第二预测模型中所使用的模型组件库组件的每个量度的固定支付来补偿步骤(f)的所述保健中心。
72.一种基于由保健中心提供以供用于产生健康结果的预测模型的数据来补偿所述保健中心的方法,其包括以下步骤:
(a)从一个以上保健中心获得与感兴趣的健康结果相关的至少一个数据集合;
(b)从所述至少一个数据集合选择与所述感兴趣的健康结果相关的变量;
(c)基于与所述感兴趣的健康结果相关的所述变量的差分加权来产生所述一个以上保健中心中的每者的至少一个第一预测模型,其中使用计算装置来产生所述至少一个第一预测模型;
(d)从每个个别至少一个第一预测模型产生模型组件库,其中所述模型组件库包括因每个个别第一预测模型的解构而产生的组件;以及
(e)基于与所述感兴趣的健康结果相关的所述模型组件库组件的差分加权产生所述感兴趣的健康结果的至少一个第二预测模型;
(f)基于所述至少一个第二预测模型识别有所述感兴趣的健康结果的危险的患者以及产生用于治疗处于危险中的患者的管理计划;以及
(g)根据为所述至少一个第二预测模型的所述产生作贡献的所述模型组件库组件来补偿所述保健中心。
73.根据权利要求72所述的方法,其中在步骤(a)中,在包括变量库的模型解构与传送平台中提供所述至少一个数据集合。
74.根据权利要求72所述的方法,其中确定所述保健中心的补偿的因素是选自由以下各项组成的群组:所述保健中心的数据的大小或存在、所述保健中心所选择变量的量或种类、从所述保健中心所提供的所述数据丢失的数据的量和/或质量,以及从所述至少一个第一预测模型得出的模型组件库组件的贡献。
75.根据权利要求74所述的方法,其中根据基于从所述至少一个第一预测模型得出的对所述至少一个第二预测模型的性能有帮助的模型组件库组件的贡献的收入份额百分比来补偿步骤(g)的所述保健中心。
76.根据权利要求74所述的方法,其中根据按照所述至少一个第二预测模型中所使用的模型组件库组件的每个量度的固定支付来补偿步骤(g)的所述保健中心。
CN201280048322.2A 2011-09-30 2012-09-30 用于从多个来源产生保健相关经验证预测模型的方法 Active CN103843030B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161541468P 2011-09-30 2011-09-30
US61/541,468 2011-09-30
PCT/US2012/058189 WO2013049771A1 (en) 2011-09-30 2012-09-30 Method for generating healthcare-related validated prediction models from multiple sources

Publications (2)

Publication Number Publication Date
CN103843030A CN103843030A (zh) 2014-06-04
CN103843030B true CN103843030B (zh) 2019-02-05

Family

ID=47993423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280048322.2A Active CN103843030B (zh) 2011-09-30 2012-09-30 用于从多个来源产生保健相关经验证预测模型的方法

Country Status (9)

Country Link
US (1) US9934361B2 (zh)
EP (1) EP2761577B1 (zh)
CN (1) CN103843030B (zh)
CA (1) CA2849313C (zh)
EA (1) EA201400398A1 (zh)
IL (1) IL231627A0 (zh)
IN (1) IN2014CN03209A (zh)
SG (1) SG11201400884UA (zh)
WO (1) WO2013049771A1 (zh)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11839430B2 (en) 2008-03-27 2023-12-12 Doheny Eye Institute Optical coherence tomography-based ophthalmic testing methods, devices and systems
US20130339100A1 (en) * 2012-06-15 2013-12-19 Exxonmobil Research And Engineering Company Decision support tool for operation of a facility
US10068670B2 (en) 2012-08-16 2018-09-04 Ginger.io, Inc. Method for modeling behavior and depression state
US10276260B2 (en) 2012-08-16 2019-04-30 Ginger.io, Inc. Method for providing therapy to an individual
CN109785972B (zh) 2012-08-16 2023-09-26 橙点公司 用于对行为和健康变化进行建模的方法
US10740438B2 (en) 2012-08-16 2020-08-11 Ginger.io, Inc. Method and system for characterizing and/or treating poor sleep behavior
US10650920B2 (en) 2012-08-16 2020-05-12 Ginger.io, Inc. Method and system for improving care determination
US10741285B2 (en) 2012-08-16 2020-08-11 Ginger.io, Inc. Method and system for providing automated conversations
WO2014179712A1 (en) * 2013-05-03 2014-11-06 Georgia State University Research Foundation, Inc. Systems and methods for supporting hospital discharge decision making
JP6066826B2 (ja) * 2013-05-17 2017-01-25 株式会社日立製作所 分析システム及び保健事業支援方法
WO2015022649A2 (en) * 2013-08-14 2015-02-19 Koninklijke Philips N.V. Modeling of patient risk factors at discharge
JP6410289B2 (ja) * 2014-03-20 2018-10-24 日本電気株式会社 医薬品有害事象抽出方法及び装置
US9836693B2 (en) 2014-09-17 2017-12-05 International Business Machines Corporation Using cohorts in a question answering system
SG11201705768QA (en) * 2015-01-16 2017-08-30 Pricewaterhousecoopers Llp Healthcare data interchange system and method
WO2016118527A1 (en) 2015-01-20 2016-07-28 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer
US9818062B2 (en) 2015-02-19 2017-11-14 International Business Machines Corporation Using cohorts to infer attributes for an input case in a question answering system
KR20190047108A (ko) * 2015-03-03 2019-05-07 난토믹스, 엘엘씨 앙상블-기반 연구 추천 시스템 및 방법
EP3834705B1 (en) 2015-09-17 2023-12-20 Envision Diagnostics, Inc. Medical interfaces and other medical devices, systems, and methods for performing eye exams
MX2019000713A (es) * 2016-07-18 2019-11-28 Nant Holdings Ip Llc Sistemas, aparatos y metodos para maquina de aprendizaje distribuido.
US11087235B2 (en) 2016-08-02 2021-08-10 International Business Machines Corporation Cohort consensus approach to manufacturing watson Q and A pipeline training cases from historical data
CN110753971B (zh) * 2017-06-12 2023-12-12 皇家飞利浦有限公司 用于动态监测患者状况和预测不良事件的系统和方法
US11062792B2 (en) 2017-07-18 2021-07-13 Analytics For Life Inc. Discovering genomes to use in machine learning techniques
US11139048B2 (en) 2017-07-18 2021-10-05 Analytics For Life Inc. Discovering novel features to use in machine learning techniques, such as machine learning techniques for diagnosing medical conditions
CN111684539A (zh) * 2017-12-06 2020-09-18 心脏起搏器股份公司 改善临床工作流程的系统
US10692605B2 (en) * 2018-01-08 2020-06-23 International Business Machines Corporation Library screening for cancer probability
EP3514756A1 (en) * 2018-01-18 2019-07-24 Koninklijke Philips N.V. Medical analysis method for predicting metastases in a test tissue sample
US11694801B2 (en) 2018-05-15 2023-07-04 International Business Machines Corporation Identifying and extracting stimulus-response variables from electronic health records
CN109346184B (zh) * 2018-09-18 2022-04-01 合肥工业大学 医学药物领域高维数据变量选择与预测方法及装置
US11568179B2 (en) * 2018-10-19 2023-01-31 Oracle International Corporation Selecting an algorithm for analyzing a data set based on the distribution of the data set
US11573962B2 (en) 2018-10-19 2023-02-07 Oracle International Corporation Dynamic performance tuning based on implied data characteristics
CN109346179B (zh) * 2018-12-10 2022-08-26 山东管理学院 一种冠心病介入术后复发预测模型及其建模方法、装置
US11354753B1 (en) * 2019-01-03 2022-06-07 INMAR Rx SOLUTIONS, INC. System for reconciling pharmacy payments based upon predicted claims and related methods
CN110210626A (zh) * 2019-05-31 2019-09-06 京东城市(北京)数字科技有限公司 数据处理方法、装置和计算机可读存储介质
US11227062B2 (en) * 2019-07-03 2022-01-18 Hitachi, Ltd. Data management method, apparatus and system for machine learning system
CN111883258B (zh) * 2020-04-30 2024-03-15 浙江大学山东工业技术研究院 一种构建ohss分度分型预测模型的方法
US11830627B2 (en) * 2021-04-13 2023-11-28 Electronics And Telecommunications Research Institute System and method for predicting disease based on biosignal data and medical knowledge base convergence
US11710576B2 (en) 2021-05-24 2023-07-25 OrangeDot, Inc. Method and system for computer-aided escalation in a digital health platform
CN114141374B (zh) * 2021-12-07 2022-11-15 中南大学湘雅二医院 孤独症发病预测模型构建方法、预测方法及装置
US20230207131A1 (en) * 2021-12-27 2023-06-29 Matrixcare, Inc. Wound management system for predicting and avoiding wounds in a healthcare facility

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816257A (en) 1985-09-20 1989-03-28 Research & Education Institute, Harbor-Ucla Medical Center Inc. Method for producing an in vivo environment suitable for human embryo transfer
WO1995000914A1 (en) 1993-06-28 1995-01-05 Scott & White Memorial Hospital And Scott, Sherwood And Brindley Foundation Electronic medical record using text database
US5612869A (en) 1994-01-21 1997-03-18 Innovative Enterprises International Corporation Electronic health care compliance assistance
US5816246A (en) 1994-09-15 1998-10-06 Mirza; M. Zubair Electronic pocket spirometer
US5619991A (en) 1995-04-26 1997-04-15 Lucent Technologies Inc. Delivery of medical services using electronic data communications
US5809997A (en) 1995-05-18 1998-09-22 Medtrac Technologies, Inc. Electronic medication chronolog device
US6600696B1 (en) 1995-11-29 2003-07-29 Lynn Lynn Woman's electronic monitoring device
US5812984A (en) 1996-05-13 1998-09-22 Goltra; Peter S. Method for entering information into an electronic patient chart, and protocol auto-negative capabilities
US5924074A (en) 1996-09-27 1999-07-13 Azron Incorporated Electronic medical records system
US6597946B2 (en) 1998-11-09 2003-07-22 Transpharma Ltd. Electronic card for transdermal drug delivery and analyte extraction
US6529876B1 (en) 1999-03-26 2003-03-04 Stephen H. Dart Electronic template medical records coding system
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
US7188073B1 (en) 1999-08-18 2007-03-06 Tam Tommy H On-line appointment system with electronic notifications
US7076437B1 (en) 1999-10-29 2006-07-11 Victor Levy Process for consumer-directed diagnostic and health care information
US6523009B1 (en) 1999-11-06 2003-02-18 Bobbi L. Wilkins Individualized patient electronic medical records system
US7295988B1 (en) 2000-05-25 2007-11-13 William Reeves Computer system for optical scanning, storage, organization, authentication and electronic transmitting and receiving of medical records and patient information, and other sensitive legal documents
US8260635B2 (en) * 2000-10-11 2012-09-04 Healthtrio Llc System for communication of health care data
US7275220B2 (en) 2000-12-22 2007-09-25 Epic Systems Corporation System and method for a seamless user interface for an integrated electronic health care information system
US6684276B2 (en) 2001-03-28 2004-01-27 Thomas M. Walker Patient encounter electronic medical record system, method, and computer product
US7392199B2 (en) 2001-05-01 2008-06-24 Quest Diagnostics Investments Incorporated Diagnosing inapparent diseases from common clinical tests using Bayesian analysis
US7188082B2 (en) 2001-07-06 2007-03-06 Digital Vision, Inc. Electronic ordering system, such as for use by eye care professionals
DE02786364T1 (de) 2001-10-01 2005-01-13 Diversa Inc., San Diego Konstruktion ganzer zellen unter verwendung einer echtzeitanalyse des metabolischen flusses
US7263493B1 (en) 2002-01-11 2007-08-28 P5, Inc. Delivering electronic versions of supporting documents associated with an insurance claim
JP4467263B2 (ja) 2002-09-20 2010-05-26 日本精密測器株式会社 健康指標測定のための電子機器及びその制御方法
US7853456B2 (en) 2004-03-05 2010-12-14 Health Outcomes Sciences, Llc Systems and methods for risk stratification of patient populations
US7858308B2 (en) 2004-03-29 2010-12-28 Michigan State University Identification of genes or polypeptides the expression of which correlates to fertility, ovarian function and/or fetal/newborn viability
US7223234B2 (en) * 2004-07-10 2007-05-29 Monitrix, Inc. Apparatus for determining association variables
US8024128B2 (en) 2004-09-07 2011-09-20 Gene Security Network, Inc. System and method for improving clinical decisions by aggregating, validating and analysing genetic and phenotypic data
RU2007124523A (ru) 2004-12-30 2009-02-10 ПРОВЕНТИС, Инк., (US) Способы, системы и компьютерные программные продукты для разработки и использования прогнозных моделей для прогнозирования большинства медицинских случаев, оценки стратегий вмешательства и для одновременной оценки нерегулярности биологических маркеров
US20080040151A1 (en) * 2005-02-01 2008-02-14 Moore James F Uses of managed health care data
US7643969B2 (en) 2005-03-04 2010-01-05 Health Outcomes Sciences, Llc Methods and apparatus for providing decision support
US20070053563A1 (en) 2005-03-09 2007-03-08 Zhuowen Tu Probabilistic boosting tree framework for learning discriminative models
US7990155B2 (en) 2005-04-28 2011-08-02 Auto Meter Products, Inc. Heavy duty battery system tester and method
US7438228B2 (en) 2005-05-05 2008-10-21 Scott Robertson Systems and methods for managing electronic prescriptions
US20070055552A1 (en) 2005-07-27 2007-03-08 St Clair David System and method for health care data integration and management
US20070027636A1 (en) 2005-07-29 2007-02-01 Matthew Rabinowitz System and method for using genetic, phentoypic and clinical data to make predictions for clinical or lifestyle decisions
US20070178501A1 (en) 2005-12-06 2007-08-02 Matthew Rabinowitz System and method for integrating and validating genotypic, phenotypic and medical information into a database according to a standardized ontology
US20070130206A1 (en) 2005-08-05 2007-06-07 Siemens Corporate Research Inc System and Method For Integrating Heterogeneous Biomedical Information
US7685000B1 (en) 2005-08-10 2010-03-23 Matria Healthcare, Inc. Predictive modeling system and method for disease management
WO2007038471A2 (en) 2005-09-27 2007-04-05 Regenetech, Inc. Rotatable time varying electromagnetic force bioreactor and method of using the same
WO2007070684A2 (en) 2005-12-15 2007-06-21 University Of Vermont And State Agricultural College Clinical decision support system
US7981399B2 (en) 2006-01-09 2011-07-19 Mcgill University Method to determine state of a cell exchanging metabolites with a fluid medium by analyzing the metabolites in the fluid medium
US7730024B2 (en) 2006-03-20 2010-06-01 Microsoft Corporation Distributed data mining using analysis services servers
US20080163824A1 (en) 2006-09-01 2008-07-10 Innovative Dairy Products Pty Ltd, An Australian Company, Acn 098 382 784 Whole genome based genetic evaluation and selection process
US20080133275A1 (en) 2006-11-28 2008-06-05 Ihc Intellectual Asset Management, Llc Systems and methods for exploiting missing clinical data
WO2008065180A1 (en) 2006-11-30 2008-06-05 Tibotec Pharmaceuticals Ltd. Phenotype prediction method
US8160977B2 (en) 2006-12-11 2012-04-17 Poulin Christian D Collaborative predictive model building
US20080162992A1 (en) 2006-12-27 2008-07-03 Lonowski Wayne J Method and apparatus for intelligently re-sequencing tests based on production test results
EP1944611A1 (en) 2007-01-11 2008-07-16 Université de la Méditerranée Biomarker for the medicine and the biology of the reproduction
CA2693783A1 (en) 2007-07-11 2009-01-15 Intergenetics, Inc. Genetic models for stratification of cancer risk
WO2009103156A1 (en) * 2008-02-20 2009-08-27 Mcmaster University Expert system for determining patient treatment response
US8126740B2 (en) 2008-03-28 2012-02-28 Busch Rebecca S Electronic health record case management system
CN105224827B (zh) 2008-07-01 2019-12-24 小利兰·斯坦福大学托管委员会 用于发展ivf治疗协议的分析数据的计算机系统和存储介质
US8467079B2 (en) * 2008-07-25 2013-06-18 General Electric Company System and method for location based printing for healthcare data
WO2010045463A2 (en) 2008-10-15 2010-04-22 Government Of The United States As Represented By The Secretary Of The Army Clinical decision model
US20110173018A1 (en) 2010-01-11 2011-07-14 Hoffner Ron M System and method for use of prediction market data to generate real-time predictive healthcare models
US20130246097A1 (en) * 2010-03-17 2013-09-19 Howard M. Kenney Medical Information Systems and Medical Data Processing Methods
WO2011163017A2 (en) 2010-06-20 2011-12-29 Univfy, Inc. Method of delivering decision support systems (dss) and electronic health records (ehr) for reproductive care, pre-conceptive care, fertility treatments, and other health conditions
MX342210B (es) 2010-07-13 2016-09-20 Univfy Inc * Metodo para evaluar el riesgo de nacimientos multiples en tratamientos de infertilidad.

Also Published As

Publication number Publication date
CN103843030A (zh) 2014-06-04
EP2761577A4 (en) 2015-09-16
EP2761577B1 (en) 2018-09-05
EP2761577A1 (en) 2014-08-06
IL231627A0 (en) 2014-05-28
IN2014CN03209A (zh) 2015-07-03
EA201400398A1 (ru) 2014-11-28
CA2849313C (en) 2019-06-04
US9934361B2 (en) 2018-04-03
US20130085773A1 (en) 2013-04-04
CA2849313A1 (en) 2013-04-04
SG11201400884UA (en) 2014-04-28
WO2013049771A1 (en) 2013-04-04

Similar Documents

Publication Publication Date Title
CN103843030B (zh) 用于从多个来源产生保健相关经验证预测模型的方法
Nøhr et al. Nationwide citizen access to their health data: analysing and comparing experiences in Denmark, Estonia and Australia
Tresp et al. Going digital: a survey on digitalization and large-scale data analytics in healthcare
Carlin et al. Changes in quality of health care delivery after vertical integration
Wood et al. The general practice research database: role in pharmacovigilance
Boonen et al. Direct costs of ankylosing spondylitis and its determinants: an analysis among three European countries
Khajouei et al. Errors and causes of communication failures from hospital information systems to electronic health record: A record-review study
Idri et al. A framework for evaluating the software product quality of pregnancy monitoring mobile personal health records
Jha et al. Protocol for the mWellcare trial: a multicentre, cluster randomised, 12-month, controlled trial to compare the effectiveness of mWellcare, an mHealth system for an integrated management of patients with hypertension and diabetes, versus enhanced usual care in India
Sherwood et al. Treatment disparities following the diagnosis of an astrocytoma
Nass et al. The value, importance, and oversight of health research
Tinmouth et al. Using physician-linked mailed invitations in an organised colorectal cancer screening programme: effectiveness and factors associated with response
Julià-Sapé et al. Strategies for annotation and curation of translational databases: the eTUMOUR project
Rosendahl et al. Measuring performance in skin cancer practice: the SCARD initiative
Ye Design and development of an informatics-driven implementation research framework for primary care studies
Baser et al. Use of open claims vs closed claims in health outcomes research
Skrocki Standardization needs for effective Interoperability
Kim et al. The effects of an emergency department length-of-stay management system on severely ill patients’ treatment outcomes
Limotai et al. Efficacy and economic evaluation of delivery of care with tele-continuous EEG in critically ill patients: a multicentre, randomised controlled trial (Tele-cRCT) study protocol
Cooper et al. Evaluating key performance indicators of the process of care in juvenile idiopathic arthritis
Coben et al. Hospital and demographic influences on the disposition of transient ischemic attack
Doupi et al. eHealth in Finland: present status and future trends
Tanihara et al. Estimating medical expenditures spent on rule‐out diagnoses in Japan
Kron et al. Cancer care: new value chains challenge german hospital structures—a comprehensive cancer center perspective
Zorko Kodelja et al. Slovenian civil registration and unique identification number system for universal health coverage: a case study

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant