CN114203296A - 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型 - Google Patents

基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型 Download PDF

Info

Publication number
CN114203296A
CN114203296A CN202111477970.7A CN202111477970A CN114203296A CN 114203296 A CN114203296 A CN 114203296A CN 202111477970 A CN202111477970 A CN 202111477970A CN 114203296 A CN114203296 A CN 114203296A
Authority
CN
China
Prior art keywords
variables
data
network model
causal relationship
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111477970.7A
Other languages
English (en)
Inventor
N·R·纳莱恩
V·R·阿科梅夫
V·维穆拉帕利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Berg Pharma LLC
Original Assignee
Berg Pharma LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Berg Pharma LLC filed Critical Berg Pharma LLC
Publication of CN114203296A publication Critical patent/CN114203296A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了用于健康护理分析的系统、方法和计算机可读介质。接收对应于多位患者的数据。解析所述数据来产生针对多个变量的标准化数据,所述标准化数据是针对每位患者的超过一个变量而产生。使用贝叶斯网络算法基于所产生的标准化数据产生涉及所述多个变量的因果关系网络模型。所述因果关系网络模型包括与多种医学状况或医疗药物相关的变量。在另一个方面中,接收医学状况或药物的选择。从因果关系网络模型确定子网络。所述子网络包括与选定的医学状况或药物相关的一个或多个变量。鉴定针对选定的医学状况或药物的一个或多个预测因子。

Description

基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系 网络模型
本申请是申请日为2015年9月11日和发明名称为“基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型”的201580058049.5号中国发明专利申请的分案申请。
相关申请
本申请与2014年9月11日提交的美国临时专利申请No.62/049,148相关并要求其优先权,将其完整公开内容按引用全部并入本文中。
技术领域
本公开内容总体地涉及用于数据分析的系统和方法,特别是用于使用健康护理数据来产生因果关系网络模型。
背景技术
许多系统分析数据来获得关于健康护理的各个方面的深入了解。可以通过确定数据之中的关系来获得深入了解。常规方法预先确定几个相关变量以从健康护理数据中提取用于加工和分析。基于少量预选的变量,在各种因素之间建立关系,所述因素如医疗药物、疾病、症状等。预先选择重点关注的变量限制了发现新的或未知的关系的能力。预先选择变量还限制了发现其他相关变量的能力。例如,如果在考虑糖尿病的分析时预选择了变量,人们将局限于这些变量而不会认识到数据分析支持之前健康护理团体不知道的与糖尿病相关的另一个变量。
发明内容
在一个方面中,本发明涉及用于基于患者数据产生因果关系网络模型的计算机执行的方法。该方法包括接收对应于多位患者的数据,其中所述数据包括针对每位患者的诊断信息和/或治疗信息,解析数据以产生针对多个变量的标准化数据,其中对于每位患者,标准化数据针对超过一个变量产生,使用贝叶斯网络算法基于所产生的标准化数据产生涉及多个变量的因果关系网络模型,所述因果关系网络模型包括与多个医学状况相关的变量,并且使用程序化计算系统产生因果关系网络,所述程序化计算系统包括容纳网络模型构建代码的存储器和一个或多个配置成执行网络模型构建代码的处理器。
在某些实施方案中,所述因果关系网络模型包括指示针对多种医学状况中的每一种的一个或多个预测因子的关系。在某些实施方案中,接收的数据未预先选择为与多种医学状况中的一种或多种相关而的。在一些实施方案中,所述方法进一步包括接收对应于一位或多位其他患者的另外的数据,并且基于所述另外的数据更新因果关系网络模型。在某些实施方案中,因果关系网络模型只基于产生的标准化数据来产生。
在一些实施方案中,所述方法进一步包括从因果关系网络模型确定子网络、子网络中与选定的医学状况相关的一个或多个变量和探测子网络中的关系以确定针对选定的医学状况的一个或多个预测因子。在某些实施方案中,所述针对选定的医学状况的一个或多个预测因子指示与选定的医学状况共同发生的医学状况。在某些实施方案中,基于与选定的医学状况相关的一个或多个变量以及该一个或多个变量和因果关系网络模型中的其他变量之间的关系的强度来确定子网络的范围。在某些实施方案中,所述子网络包括与选定的医学状况相关的一个或多个变量、各自具有与该一个或多个变量的第一程度关系的第一组其他变量和各自具有与该一个或多个变量的第二程度关系的第二组其他变量。在一些实施方案中,一个或多个预测因子中的至少一个是之前未知的。在一些实施方案中,一个或多个预测因子中的至少一个新鉴定为针对所述医学状况的预测因子。在某些实施方案中,预测因子的数量小于变量的数量。
在一些实施方案中,所述方法进一步包括在用户界面中显示一个或多个预测因子,所述显示包括一个或多个变量、一个或多个预测因子以及一个或多个变量和一个或多个预测因子之中的关系的图形表示。在一些实施方案中,所述方法进一步包括在用户界面中显示子网络的图形表示。在一些实施方案中,所述方法还包括基于一个或多个变量和一个或多个预测因子之间的关系强度将一个或多个预测因子分级。
在某些实施方案中,所述方法进一步包括从因果关系网络模型确定子网络,子网络中的一个或多个变量与选定药物相关,并探测子网络来确定与选定药物相关的一个或多个预测因子。在一些实施方案中,与选定药物相关的一个或多个预测因子指示结合选定药物给药的药物。在一些实施方案中,一个或多个预测因子指示选定药物和一种或多种其他药物之间的不利药物相互作用。在一些实施方案中,基于与选定药物相关的一个或多个变量以及一个或多个变量和因果关系网络模型中的其他变量之间的关系的强度来确定子网络的范围。在一些实施方案中,子网络包括一个或多个与选定药物相关的一个或多个变量,各自具有与该一个或多个变量的第一程度关系的第一组其他变量和各自具有与该一个或多个变量的第二程度关系的第二组其他变量。在其他实施方案中,一个或多个预测因子中的至少一个是之前未知的。在一些实施方案中,一个或多个预测因子中的至少一个新鉴定为医学状况的预测因子。在某些实施方案中,预测因子的数量小于变量的数量。
在某些实施方案中,基于至少50个变量产生所述因果关系网络模型。
在某些实施方案中,基于至少100个变量产生所述因果关系网络模型。
在某些实施方案中,基于至少1000个变量产生所述因果关系网络模型。
在某些实施方案中,基于至少100,000个变量产生所述因果关系网络模型。
在某些实施方案中,基于至少50个变量至1,000,000变量产生所述因果关系网络模型。
在其他实施方案中,基于来自50位患者至1,000,000位患者的数据产生所述因果关系网络。
在其他实施方案中,所述数据包括来自患者电子健康记录的信息。
在某些实施方案中,接收的数据进一步包括针对多位患者中的至少一些的至少一种以下信息:患者人口统计学数据、病史、患者家族病史、活性的药物治疗信息、非活性的过去药物治疗信息、过敏信息、免疫状态信息、实验室测试结果、放射图像、生命体征信息、患者体重、账单信息、生活方式信息、习惯信息、保险索赔信息和药房信息。在一些实施方案中,患者人口统计学数据包括患者年龄、患者种族和患者民族中的至少一种。
在某些实施方案中,接收的数据包括来自患者病历表的信息。在一些实施方案中,来自患者病历表的信息包括健康护理专业人员的备注、健康护理专业人员的观察、药物和治疗的施用、药物和治疗施用的顺序、测试结果和x-射线中的至少一种。
在某些实施方案中,接收的数据包括患者出院信息。在一些实施方案中,患者出院信息包括诊断代码、治疗代码、保险费代码、诊断相关组代码和疾病国际分类代码中的至少一种。
在某些实施方案中,接收的数据涉及来自选定医院的多位患者。在某些实施方案中,接收的数据涉及来自选定的地理区域的多位患者。
在一些实施方案中,使用贝叶斯网络算法基于产生的标准化数据产生针对多位患者的涉及变量的因果关系网络模型包括通过贝叶斯片段计数过程(fragment enumerationprocess)基于变量形成网络片段文库,从而形成整套试验网络,每个试验网络从文库中的不同网络片段子集构建,并且通过经由模拟退火的局部转化使每个试验网络进化来总体地优化整套试验网络,以产生一致因果关系网络模型。在一些实施方案中,使用贝叶斯网络算法基于所产生的标准化数据产生针对多位患者的涉及变量的因果关系网络模型进一步包括基于输入数据计算机(in silico)模拟一致因果关系网络模型,以提供针对所得到的因果关系网络模型内的一个或多个因果关系的预测置信水平。
在另一个方面中,本发明涉及使用因果关系网络模型的计算机执行的方法。该方法包括从多种医学状况接收医学状况的选择,从计算机产生的因果关系网络模型确定子网络,因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与多种医学状况相关的变量,所述因果关系网络模型基于选定的医学状况,所述子网络包括与选定的医学状况相关的一个或多个变量,全面研究(traversing)子网络以鉴定针对选定的医学状况的一个或多个预测因子,并且储存针对选定的医学状况的一个或多个预测因子。
在某些实施方案中,通过用户界面从用户接收医学状况的选择。在一些实施方案中,一个或多个预测因子中的至少一个是之前未知的。在一些实施方案中,一个或多个预测因子中的至少一个新鉴定为医学状况的预测因子。在一些实施方案中,预测因子的数量少于变量的数量。
在一些实施方案中,所述方法进一步包括将回归算法应用于预测因子来确定每个预测因子与选定的医学状况或药物的关系。在一些实施方案中,所述方法进一步包括在用户界面上显示预测因子,所述显示包括一个或多个选定的变量、一个或多个预测因子以及一个或多个选定变量和预测因子之中的关系的图形表示。在一些实施方案中,所述方法进一步包括在用户界面显示子网络的图形表示。在一些实施方案中,所述方法进一步包括基于一个或多个选定变量和一个或多个预测因子之间关系的强度将一个或多个预测因子分级。
在某些实施方案中,一个或多个预测因子与一种或多种医疗药物相关。在某些实施方案中,预测因子与一种或多种医学状况相关。
在另一个方面中,本发明涉及使用因果关系网络模型的计算机执行的方法。该方法包括从多种医学状况接收与医学状况相关的探询,从计算机产生的因果关系网络模型确定子网络,该因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与多种医学状况相关的变量,因果关系网络模型基于探询的医学状况,子网络包括与探询的医学状况相关的一个或多个变量,全面研究子网络以鉴定针对探询的医学状况的一个或多个预测因子,并且储存针对探询的医学状况的一个或多个预测因子。在某些实施方案中,从用户接收的探询包括与医学状况和/或医疗药物相关的信息。
在另一个方面中,本发明涉及使用因果关系网络模型的计算机执行的方法。所述方法包括接收与医疗药物相关的信息,从计算机产生因果关系网络模型确定子网络,该因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与多种医疗药物相关的变量,因果关系网络模型基于医疗药物,子网络包括一个或多个与医疗药物相关的变量,全面研究子网络以鉴定针对医疗药物的一个或多个预测因子,并且储存针对医疗药物的一个或多个预测因子。
在再另一个方面中,本发明涉及用于基于患者数据产生因果关系网络模型的系统。所述系统包括配置用于接收与多位患者相关的数据的数据接收模块,所述数据包括针对每位患者的诊断信息和/或治疗信息,配置用于解析数据以产生针对多个变量的标准化数据的解析模块,其中,针对每位患者,标准化数据针对超过一个变量产生,以及配置用于使用贝叶斯网络算法基于所产生的标准化数据产生涉及多个变量的因果关系网络模型的处理器实施的关系网络模块,所述因果关系网络模型包括与多种医学状况相关的变量。在某些实施方案中,因果关系网络模型包括指示针对多种医学状况中的每一种的一个或多个预测因子的关系。
在再另一个方面中,本发明提供使用基于患者数据的因果关系网络模型的系统。所述系统包括配置用于接收与医学状况相关信息的数据接收模块,配置用于从计算机产生的因果关系网络模型确定子网络的子网络模块,该因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与多种医学状况相关的变量,所述因果关系网络模型基于医学状况,所述子网络包括与医学状况相关的一个或多个变量,以及配置用于全面研究子网络并鉴定医学状况的一个或多个预测因子的变量鉴定模块。在某些实施方案中,使用某些实施方案公开的方法产生计算机产生的因果关系网络模型。
在再另一个方面中,本发明提供了存储至少一个程序的非暂时性机器可读存储介质,该程序在通过至少一个处理器执行时,引起至少一个处理器进行作为某些实施方案的部分公开的任何方法。
在另一个方面中,本发明提供了用于产生医学状况的预测因子的系统。所述系统包括因果关系网络模型产生器,其配置用于接收对应于多位患者的数据的,所述数据包括针对每位患者的诊断信息和/或治疗信息,解析数据以产生针对多个变量的标准化数据,其中,针对每位患者,标准化数据针对超过一个变量产生,和使用贝叶斯网络算法基于产生的标准化数据产生将每个变量与多个变量中的一个或多个关联的因果关系网络模型,所述因果关系网络模型包括与多种医学状况相关的变量。在某些实施方案中,因果关系网络模型包括指示针对多种医学状况中的每一种的一个或多个预测因子的关系。在一些实施方案中,所述系统进一步包括子网络选择模块,其配置用于经由用户界面从用户接收与医学状况相关的信息,从因果关系网络模型确定子网络,所述子网络包括与医学状况相关的一个或多个变量,全面研究子网络以鉴定针对医学状况的一个或多个预测因子,并且储存针对医学状况的一个或多个预测因子。
在另一个方面中,本发明提供了用于基于患者数据产生因果关系网络模型的系统。所述系统包括由第一处理器执行的数据接收模块,其配置用于接收对应于多位患者的数据,所述数据包括每位患者的诊断信息和/或治疗信息,和解析数据以产生针对多个变量的标准化数据,其中,针对每位患者,标准化数据针对超过一个变量产生,以及通过一个或多个其他处理器执行的因果关系网络模块,其配置用于使用贝叶斯网络算法基于所产生的标准化数据产生涉及多个变量的因果关系网络模型,所述因果关系网络模型包括与多种医学状况相关的变量。
在整个本申请中,列表中呈现的所有数值,例如,如以上那些,也可以是打算作为本发明一部分的范围的上限或下限。
附图说明
在附图的图中以举例的方式而非限制地说明本公开,附图中相似的参考编号表示相似的元件,除非另外指出。
图1是描绘了根据实施方案的健康护理分析系统的示意性网络图。
图2是示意性地就模块方面描绘了根据实施方案的健康护理分析系统的框图。
图3是根据实施方案通过产生关系网络模型的健康护理分析方法的流程图。
图4是根据实施方案使用关系网络模型方法的流程图。
图5是实施例1中的健康护理分析方法的流程图。
图6是来自实施例1中使用的健康护理实体的实例数据集。
图7示意性地描绘了实施例1中产生的关系网络模型。
图8示意性地描绘了聚焦于心力衰竭&休克和肾衰竭的图7关系网络模型的子网络。
图9A示意性地描绘了聚焦于心力衰竭&休克并且强调心力衰竭&休克与单纯性肺炎&胸膜炎之间的关联以及心力衰竭&休克与呼吸道感染之间的关联的图7关系网络模型的子网络。
图9B示意性地描绘了心力衰竭&休克可以如何导致单纯性肺炎&胸膜炎和呼吸道感染&炎症。
图10A示意性地描绘了强调心力衰竭&休克与COPD之间的关联的图9A心力衰竭&休克子网络。
图10B示意性地描绘了COPD可以如何导致心力衰竭。
图11示意性地描绘了强调心力衰竭&休克与心律不齐&传导障碍之间的关联的心力衰竭&休克子网络。
图12A示意性地描绘了强调G.I.出血与心力衰竭&休克之间的关联的心力衰竭&休克子网络。
图12B示意性地描绘了G.I.出血可以如何导致心力衰竭。
图13示意性地描绘了强调肾衰竭和心力衰竭&休克之间的关联的心力衰竭&休克子网络。
图14A是从实施例1中的关系网络模型产生的心力衰竭&休克与肾衰竭的关联图。
图14B是从实施例1中的关系网络模型产生的心力衰竭&休克与肾衰竭的四格(fourfold)图。
图15A是从实施例1中的关系网络模型产生的心力衰竭&休克与G.I.出血的关联图。
图15B是从实施例1中的关系网络模型产生的心力衰竭&休克与G.I.出血的四格图。
图16示意性地描绘了聚焦于肾衰竭的图8子网络的第二部分。
图17A示意性地描绘了聚焦于肾衰竭并且强调支气管炎&哮喘与肾衰竭之间的关联的图7关系网络模型的子网络。
图17B示意性地描绘了肾衰竭子网络中支气管炎&哮喘与肾衰竭之间的关联以及用于支气管炎&哮喘和肾衰竭之间的关系的回归模型。
图18A是从实施例1中的关系网络模型产生的肾衰竭与支气管炎和哮喘的关联图。
图18B是从实施例1中的关系网络模型产生的肾衰竭与支气管炎和哮喘的四格图。
图19A是基于临床研究示意性描绘途径的图解,解释了从实施例1的肾衰竭子网络确定的支气管炎&哮喘与肾衰竭之间的新关联。
图19B是示意性描绘引起从实施例1的肾衰竭子网络确定的支气管炎&哮喘与肾衰竭之间的新关联的潜在分子机理的图解。
图20示意性地描绘了实施例1的关系网络模型和实施例2的所选定的红细胞障碍子网络。
图21是可以用于实施本文中所述的健康护理分析系统和方法的一些实施方案的计算设备的框图。
具体实施方式
近些年来,由于采用电子健康记录的驱动,健康护理数据中存在量的爆发。可以利用这种健康护理数据来开辟通过改善患者护理和在提供护理中形成新的效率而推进健康护理的新途径。例如,了解由于患者特定的分子和临床因素引起的治疗结果的变化使得可以形成医学中的精确模型。
健康护理中对大数据工作的主要焦点在于更好的健康护理数据的管理和审编(curation),以及数据挖掘以检验假设。健康数据的常规分析受到对长期持有的生物学或临床表型假设的依赖,或构成所述分析的基础的其他假设的限制。
本文中所述的实施方案包括用于健康护理分析的系统、方法和计算机可读介质。一些实施方案使用贝叶斯网络算法,基于与健康护理(如患者护理)的各个领域相关的数据产生因果关系网络模型。用于产生关系网络模型的数据是没有针对相关性预先选择或预先过滤的大的数据集合。此外,因果关系网络模型的产生不依赖于有关哪些变量是相关或无关的假设,或关于变量之间的关系的在先知识。这种无偏的方法用使得方法和系统的实施方案能够构建网络模型,所述网络模型描绘数据集合支持的关联性并且通过已知临床研究是无偏的。因此,与其中数据针对相关性预先选择并且涉及有关变量之间的关系的在先知识的常规方法相反,一些实施方案所得到的网络更有可能包括健康护理团体之前未知的,或健康团体之前没有研究或探索过的变量之间新的相互作用。一些实施方案涉及用于患者数据建模的方法和系统,其是完全数据驱动的和按照当前知识是无偏的。这样的数据驱动和无偏的模型可以用于发现疾病结果中新的且常常是令人惊讶的趋势。一些实施方案可以用于鉴定不明显的共病,并且开发改进的治疗策略和实验方案。
在一些实施方案中,获得或接收包括健康护理相关信息的数据。将接收的数据加工并解析以产生针对多个变量的标准化数据。使用贝叶斯网络算法基于该变量产生因果关系网络模型。在一些情况中,关系网络模型包括多种医学状况和多种医疗药物,并且指示医学状况和药物之间的关系。
一些实施方案包括使用所产生的因果关系网络模型的方法。例如,一些实施方案包括从用户接收与医学状况或医疗药物相关的信息。基于接收的信息,从所产生的因果关系网络模型确定子网络。全面研究或探索子网络以确定针对感兴趣的医学状况或药物的预测因子。预测因子可以是对医学状况或药物具有影响的显著因子。
定义
打算具体限定但在说明书其他部分中尚未限定的本文中使用的某些术语在此定义。
术语“诊断/治疗信息”是指编码进行的诊断的任何信息或描述提供哪种治疗的信息。
术语“医学状况”是指可能存在症状或体征的影响人的任何病理状况、疾病(disease)和/或病态(illness)。
术语“医疗药物”或“药物”是指可以用于治愈、治疗和/或预防医学状况和/或用于诊断医学状况的任何药品、药剂、治疗剂和/或化学物质。
术语“预测因子”是指可以用于预测结果的数学公式、算法或决策支持工具中的变量。数学公式、算法或决策支持工具可以使用多个预测因子来预测结果。
呈现以下描述,使得本领域的任何技术人员能够形成和使用用于健康护理分析的系统和方法。对实施方案的各种改变将是本领域技术人员显而易见的,并且本文中限定的一般原则可适用于其他实施方案和应用而没有脱离本发明的精神和范围。此外,在以下描述中,列出了许多详细内容用于解释的目的。然而,本领域普通技术人员将认识到可以不使用这些特定的详细内容来实施本发明。在其他情况中,以框图的形式显示了公知的结构和过程,使得本发明的描述不会被不必要的细节模糊。因此,本发明公开内容不意图限于所示的实施方案,而是符合与本文中公开的原则和特征相一致的最宽范围。
图1说明了网络图解,其描绘了根据本发明实施方案可以部分或全部包括在健康护理分析提供中的实例系统100。系统100可以包括网络105、客户端设备110、客户端装置115、客户端装置120、客户端装置125、服务器130、服务器135、数据库140和数据库服务器145。客户端装置110、115、120、125、服务器130、服务器135、数据库140和数据库服务器145各自与网络105连通。
在一个实施方案中,网络105的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网(WAN)、无线广域网(WWAN)、城域网(MAN)、互联网的一部分、公用电话交换网络(PSTN)的一部分、蜂窝电话网络、无线网络、WiFi网络、WiMax网络、任何其他类型的网络或两种或更多种这样的网络的组合。
客户端装置的实例包括,但不限于,工作站、个人计算机、通用计算机、互联网设备、笔记本、台式机、多处理器系统、机顶盒、网络PC、无线设备、便携式设备、可穿戴计算机、蜂窝或移动电话、便携式数字助理(PDA)、智能电话、平板电脑、超极本、上网本、多处理器系统、基于微处理器的或可编程消费电子产品、小型计算机等。客户端装置110、115、120、125各自可以通过有线或无线连接与网络105连接。
在示例性实施方案中,客户端装置110、115、120、125上包括的健康护理分析系统可以配置成局部进行本文中所述的一些功能,而服务器130、135进行本文中所述的其他功能。例如,客户端装置110、115、120、125可以接收患者数据并解析患者数据,而服务器135可以产生因果关系网络。在另一个实例中,客户端装置110、115、120、125可以接收标准的选择,而服务器135可以从因果关系网络确定子网络,全面研究子网络以鉴定针对选定标准的预测因子,并且储存所鉴定的预测因子。在再另一个实例中,客户端装置110、115、120、125可以接收标准的选择,服务器135可以从因果关系网络确定子网络并全面研究子网络以鉴定针对选定标准的预测因子,并且客户端装置110、115、120、125可以储存所鉴定的预测因子。
在可替代的实施方案中,客户端装置110、115、120、125可以进行本文中所述的全部功能。例如,客户端装置110、115、120、125可以接收患者数据、解析患者数据并基于患者数据产生因果关系网络。在另一个实例中,客户端装置110、115、120、125可以接收标准的选择,例如,医学状况或医疗药物,基于选定的标准从因果关系网络确定子网络,全面研究子网络以鉴定针对选定标准的预测因子,并且储存所鉴定的预测因子。
在另一个可替代的实施方案中,健康护理分析系统可以包括在客户端装置110、115、120、125上,并且服务器135执行本文中所述的功能。例如,服务器135可以接收患者数据、解析患者数据并且基于患者数据产生因果关系网络。在另一个实例中,服务器35可以接收标准的选择,例如,医学状况或医疗药物,基于选定的标准从因果关系网络确定子网络,全面研究子网络以鉴定针对选定标准的预测因子,并且储存所鉴定的预测因子。
在一些实施方案中,服务器130和服务器135可以是分布式计算环境的部分,其中一些任务/功能在服务器130和135之间分布。在一些实施方案中,服务器130和服务器135是并行计算环境的部分,其中服务器130和服务器135平行地执行任务/功能以提供产生本文中所述的因果关系网络模型需要的计算与处理资源。
在一些实施方案中,服务器130、135,数据库140和数据库服务器145各自通过有线连接与网络105连接。或者,服务器130、135,数据库140或数据库服务器145中的一个或多个可以通过无线连接与网络105连接。尽管没有显示,数据库服务器145可以直接连接数据库140,或服务器130、135可以直接连接数据库服务器145和/或数据库140。服务器130、135包括一个或多个配置成通过网络与客户端装置110、115、120、125通讯的计算机或处理器。服务器130、135装载(host)一个或多个通过客户端装置110、115、120和125访问的应用或网站和/或促进对数据库140内容的访问。数据库服务器145包括一个或多个配置成促进对数据库140内容的访问的计算机或处理器。数据库140包括一个或多个用于储存数据和/或服务器130、135,数据库服务器145和/或供客户端装置110、115、120、125使用的指令的存储设备。数据库140,服务器130、135和/或数据库服务器145可以位于一个或多个彼此或与客户端装置110、115、120、125在地理上分布的位置。或者,数据库140可以包括在服务器130或135,或数据库服务器145内。
图2是显示了在根据实例实施方案的以模块实施的健康护理分析系统的框图200。在一些实施方案中,模块包括数据模块210、解析模块220、关系-网络模块230、子网络模块240和预测因子模块250。在实例实施方案中,模块210、220、230、240和250中的一个或多个包括在服务器130和/或服务器135中,而模块210、220、230、240和250中的其他模块可以提供在客户端装置110、115、120、125中。例如,数据模块210可以包括在客户端装置110、115、120、125中,而解析模块220、关系-网络模块230、子网络模块240和预测因子模块250在服务器130或服务器135中提供。在另一个实例中,数据模块210可以包括在客户端装置110、115、120、125中,而解析模块220和关系-网络模块230在服务器130中提供,且子网络模块240和预测因子模块250在服务器135中提供。在再另一个实例中,可以通过服务器130执行关系-网络模块230的部分功能,并且可以通过服务器135执行关系-网络模块230的其他部分的功能。
在可替代的实施方案中,可以在客户端装置110、115、120、125的任一个中实施模块。模块可以包括一个或多个配置成通过一个或多个包括在客户端装置110、115、120、125中的处理器来执行的软件组成部分、程序、应用、app或其他代码库(code base)或指令的单元。在一些实施方案中,模块210、220、230、240和250可以从网站下载。在其他实施方案中,模块210、220、230、240和250可以从外部硬件部件安装,如外部存储部件(例如,USB驱动器、指状(thumb)驱动器、CD、DVD等)。
尽管模块210、220、230、240和250在图2中显示为不同的模块,但应当理解模块210、220、230、240和250可以作为比所示的更少或更多的模块来执行。应当理解模块210、220、230、240和250中的任一个可以与一个或多个外部部件通讯,所述外部部件如数据库、服务器、数据库服务器或其他客户端装置。
数据模块210可以是配置成接收和管理数据的硬件实施模块。解析模块220可以是配置成针对多个变量处理、解析和分析接收的数据的硬件实施模块。关系-网络模块230可以是配置成使用贝叶斯网络算法从接收的数据产生涉及多个变量的因果关系网络模型的硬件实施模块。产生因果关系网络模型可能需要相当大的处理器能力;因此,在一些实施方案中,可以通过服务器130和服务器135实施关系-网络模块的功能。子网络模块240可以是配置成管理因果关系网络模块并从因果关系网络模型确定与从使用者接收的信息相关的子网络的硬件实施模块。预测因子模块250可以是配置成全面研究子网络以鉴定一个或多个对应于从使用者接收的信息的预测因子的硬件实施模块。
图3说明了根据实施方案用于产生因果关系网络模型的方法的实例流程图300。在框302中,接收对应于多位患者的数据。在一些实施方案中,通过数据模块210接收数据(参见图2)。在一些实施方案中,数据包括针对每位患者的诊断信息和/或治疗信息。数据可以包括如患者人口统计学数据、病史、患者家族病史、活性的药物治疗信息、非活性的过去药物治疗信息、过敏信息、免疫状态信息、实验室测试结果、放射图像、生命体征信息、患者体重、账单信息、生活方式信息、习惯信息、保险索赔信息、药房信息等中任一种的信息。患者人口统计学数据可以包括患者年龄、患者种族和患者民族。数据还可以包括或替代地包括来自患者病历表的信息,如健康护理专业人员的备注、健康护理专业人员的观察、药物和治疗的施用、药物和治疗施用的顺序、测试结果、x-射线等。数据还可以包括或替代地包括患者出院信息,如诊断代码、治疗代码、保险收费代码、诊断相关组代码、疾病国际分类代码等。数据模块210(参见图2)可以从管理和利用各种健康护理数据、信息和/或统计资料的实体提取或获得数据。数据可以获自多种来源,如公众可利用的资源、收集数据的商业实体、健康护理提供者等。在一些实施方案中,数据可以没有预先选择或预先确定为与多个医学状况或药物相关。对于输入数据的说明性实例,参见以下参照图6讨论的实施例1
在框304中,解析在框302中接收的数据以产生针对多个变量的标准化数据。在一些实施方案中,通过解析模块220来解析数据(参见图2)。针对每位患者的超过一个变量产生标准化数据。数据的标准化可以包括将数据缩减成其规范形式,和/或将数据组织成有利于进一步使用的形式。在一些实施方案中,解析数据进一步包括过滤数据和数据的插补(imputation)。过滤数据可以包括基于标准(如数据点的完整性和准确性)除去数据点。数据的插补可以包括用合适的替代值替换缺失的数据点。
在框306中,针对多个变量基于产生的标准化数据产生因果关系网络模型。在一些实施方案中,使用因果关系网络模块230产生因果关系网络模块(参见图2)。在一些实施方案中,使用贝叶斯网络算法来产生涉及多个变量的因果关系网络模型。在一些实施方案中,产生的因果关系网络模型包括涉及多种医学状况和/或药物的变量。在一些情况中,使用程序化计算系统产生因果关系网络模型,所述程序化计算系统包括用于网络模型构建代码的存储器和一个或多个用于执行网络模型构建代码的处理器。因果关系网络模型可以包括指示针对多种医学状况或药物中的每一种的一个或多个预测因子的关系。因果关系网络模型可以仅仅基于标准化数据来产生。在一些实施方案中,关系网络模型是基于人工智能的网络模型。
可以按照需要或适合于有意义的数据分析,基于尽可能多的变量来产生因果关系网路络模型。例如,在一些实施方案中,可以基于至少50个变量来产生模型。在其他实施方案中,可以基于至少100个变量、至少1000个变量、至少10,000个变量、至少100,000变量或至少1,000,000变量来产生模型。如以上讨论的,变量对应于从未加工的/原始输入数据集确定/提取的数据。在一些实施方案中,变量变成因果关系网络模型中的节点。
可以按照需要或适合于有意义的数据分析,基于来自尽可能多的患者的数据来产生因果关系网络模型。例如,在一些实施方案中,可以基于来自至少50位患者的数据来产生模型。在其他实施方案中,可以基于来自至少100位患者、来自至少1000位患者、来自至少10,000位患者、来自至少100,000位患者或来自至少1,000,000位患者的数据来产生模型。
所述方法可以包括更多步骤。例如,可以接收对应于一位或多位其他患者的另外的数据,在此时,可以基于另外的数据更新或重新产生因果关系网络模型。
在一些实施方案中,可以将所产生的因果关系网络模型的部分或全部的图形表示展示给使用者。在一些实施方案中,储存所产生的关系网络模型用于之后的使用。
应当注意到许多不同的基于人工智能的平台或系统可以用于使用贝叶斯网络算法来产生因果关系网络模型。一些实例实施方案使用从GNS(Cambridge,MA)可商业购得的称为REFSTM(逆向工程/正向模拟(Reverse Engineering/Forward Simulation))的系统。适用于执行一些实施方案的基于AI的系统或平台使用数据算法来仅仅基于输入数据集建立变量之中的因果关系网络,而没有考虑现有的关于任何潜在的、确立的和/或验证的关系的知识。
例如,基于REFSTM AI的信息学平台可以采用标准化的输入数据,并且快速进行数万亿次的计算以确定在系统中数据点怎样相互作用。基于REFSTM AI的信息学平台进行逆向工程处理,以试图基于输入数据形成计算机实施的关系网络模型,所述关系网络模型定量地表示各种健康状况和预测因子之间的关系。此外,可以产生假设并且基于计算机实施的关系网络模型快速地模拟以获得关于该假设的预测,伴随相关的置信水平。以下提供关于使用REFS平台产生因果关系模型的实例的更多详细内容。
图4说明了根据实施方案使用因果关系网络模型的方法的实例流程图400。方法400可以在示例性系统中实施并且可以描述为使用健康护理分析系统的方法。所述使用因果关系网络模型的方法也可以称为解释来自因果关系网络模型的结果的方法。
在框402中,从使用者接收信息。在一些实施方案中,通过数据模块210接收信息(参见图2)。在一些实施方案中,用于接收用于产生关系网络模型的数据集合的数据模块与从使用者接收用于使用所产生的关系网络模型的信息的数据模块不同或是分离的。
从使用者接收的信息可以包括一种或多种医学状况或一种或多种医疗药物的选择。在一些实施方案中,可以给使用者呈现医学状况和/或医疗药物的列表,在其中进行选择。
从使用者接收的信息可以是关于一种或多种医学状况或一种或多种医疗药物的探询的形式。在一些实施方案中,使用者可以在搜索/询问区域中输入文本。
在一些实施方案中,可以显示因果关系网络模型的部分或全部的图形表示。在一些实施方案中,从使用者接收的信息可以是因果关系网络模型的部分或全部的图形表示中显示的一个或多个节点的选择。
在框404中,基于框402中从使用者接收的信息从因果关系网络模型确定子网络。在一些实施方案中,通过子网络模块240来确定子网络。从其确定子网络的因果关系网络模型已经如上所述使用贝叶斯网络算法从患者数据产生,并且可以包含多个变量,包括与多种医学状况相关的变量。确定的子网络中包括的一个或多个变量对应于从使用者接收的信息。例如,如果接收的信息涉及一种或多种医学状况,则子网络中的一个或多个变量涉及该一种或多种医学状况。作为另一个实例,如果接收的信息涉及一种或多种药物,则子网络中的一个或多个变量涉及该一种或多种药物。
可以基于与选定的一种或多种医学状况或一种或多种药物相关的一个或多个变量以及该一个或多个变量和因果关系网络模型中的其他变量之间的关系的强度确定子网络的范围。子网络可以包括与感兴趣的医学状况或药物相关的一个或多个变量,以及各自与一个或多个变量具有第一程度关系的第一组其他变量。在一些实施方案中,子网络可以进一步包括各自与一个或多个变量具有第二程度关系的第二组其他变量。
在框406中,全面研究子网络来鉴定预测因子。在一些实施方案中,通过预测因子模块250来全面研究子网络(参见图2)。将预测因子鉴定为与从使用者接收的信息相关。预测因子是与感兴趣的医学状况或医疗药物具有因果关系的因子、数据点或节点。例如,肾衰竭可以是心力衰竭的预测因子。从因果关系网络模型鉴定出一个或多个预测因子后,可以将所鉴定的预测因子用于传统统计学或回归分析中以确定预测因子相对于感兴趣的医学状况或药物的显著性。针对感兴趣的医学状况的一个或多个预测因子可以指示与感兴趣的医学状况共同发生的医学状况。一个或多个预测因子可以指示结合感兴趣的药物施用的药物,或指示不利的药物相互作用。所鉴定的预测因子可以是针对医学状况或药物之前未知的或新的预测因子。所鉴定的预测因子可以新鉴定为医学状况或药物的预测因子。预测因子的数量可以少于子网络中的变量或节点的数量。在框408中,储存所鉴定的预测因子。
以上方法可以包括更多步骤。例如,可以通过变量、预测因子以及变量和预测因子之中的关系的图形表示在用户界面中显示所鉴定的预测因子。确定的子网络可以显示在用户界面中。
因果关系网络模型的产生
以下针对基于REFS AI的信息学系统(仅仅是为了说明的目的)更详细地解释了使用贝叶斯网络算法基于产生的标准化数据产生涉及多个变量的因果关系网络模型的步骤(图3中的框306)。然而,本领域普通技术人员将认识到可以使用采用贝叶斯分析的其他系统。
将对于多个变量的标准化数据作为输入数据集输入REFS系统中。REFS系统形成“网络片段”的文库,其包括驱动健康护理系统中的关联和关系的变量(例如,医学状况、医疗药物、出院代码)。REFS系统选择文库中的网络片段子集,并且从选定的子集构建初始试验网络。基于AI的系统还选择文库中不同的网络片段子集以构建另一初始试验网络。最终,从文库中不同的网络片段子集形成整套的初始试验网络(例如,1000个网络)。这一过程被称为平行整套采样。通过从文库添加、减去和/或替换另外的网络片段使整套试验网络中的每个试验网络进化或优化。以下提供了关于网络片段文库的形成、试验网络的形成和网络进化的更多详细内容。如果获得另外的数据,可以将另外的数据并入文库中的网络片段中,并且可以通过每个试验网络的进化并入整套试验网络中。在完成优化/进化过程后,可以将整套试验网络描述为产生的关系网络模型。
整套的所产生关系网络模型可以用于模拟各种医学状况和/或药物之间的关联行为。模拟可以用于预测医学状况和/或医疗药物之间的相互作用,这可以使用临床研究和实验来证实。此外,可以通过将模拟的扰动单独地应用于每个节点而同时观察对所产生的关系网络模型中的其他节点的作用,使用模拟功能提取所产生的关系网络模型中的关系的定量参数。
REFS的构建块结合了来自无限数量的数据形式的多个数据类型,例如,连续、离散、Boolean。产生整套模型需要相当大的处理能力。在一些实施方案中,使用30,000+处理器的并行IBM Blue Gene机器来产生整套模型。所得到的网络能够进行假设的高通量计算机模拟检验。网络还包括提供可验证假设的等级次序和预测置信度量。
如上所述,将预加工的数据用于构建网络片段文库。网络片段限定所测量变量的所有可能的小集合(例如,2-3个成员的集合或2-4个成员的集合)(输入数据)之中的定量的连续关系。片段中变量之间的关系可以是线性、逻辑、多项、显性或隐性纯合等。给每个片段中的关系分配贝叶斯概率评分,所述概率评分反映输入数据有多大可能给出候选关系,并且还针对其数学复杂性惩罚所述关系。通过将从输入数据推断的所有可能的配对以及三方关系(并且在一些实施方案中,还有四方关系)评分,可以鉴定文库中最有可能的片段(可能片段)。还基于输入数据计算关系的定量参数并针对每个片段储存。各种模型类型可以用于片段计数中,包括但不限于线性回归、逻辑回归、(方差分析)ANOVA模型、(协方差分析)ANCOVA模型、非线性/多项式回归模型和甚至非参数回归。之前关于模型参数的假设可以假定与模型中所用参数的数量相关的Gull分布或贝叶斯信息标准(BIC)罚分。在网络推断过程中,从片段文库中的片段子集构建整套初始试验网络中的每个网络。用来自片段文库的不同片段子集构建整套初始试验网络中的每个初始试验网络。
通过基于给定的输入数据确定最有可能的因子分解和最有可能的参数来进化或优化模型。可以将这描述为“学习贝叶斯网络”,或换句话说,在给出输入数据的训练集的情况下,发现与输入数据最佳匹配的网络。这可以通过使用关于输入数据评价每个网络的评分函数来完成。
给定输入数据的情况下,使用贝叶斯框架来确定因子分解的可能性。贝叶斯法则阐明了给定数据D的模型M的后验概率P(D|M)与给定模型假设的数据的后验概率P(D|M)乘以模型的先验概率P(M)的乘积的乘积成比例,假定数据的概率P(D)在整个模型中是恒定的。这表述于以下等式中:
Figure BDA0003394246140000221
假定模型的数据的后验概率是之前参数分布上数据可能性的积分:
P(D|M)=∫P(D|M(Θ))P(Θ|M)dΘ。
假定所有模型可能性相等(即,P(M)是恒定的),给定数据D的模型M的后验概率可以因子分解成针对每个局部网络片段Mi的参数上的积分的乘积,如下:
Figure BDA0003394246140000222
注意到在以上等式中,已经省略了前导常数项。在一些实施方案中,贝叶斯信息标准(BIC)(其采用模型后验概率P(D|M)的负对数)可以用于对每个模型“评分”,如下:
Figure BDA0003394246140000223
其中对于模型M的总评分Stot是针对每个局部网络片段的局部评分Si的总和。BIC进一步给出用于确定每个单独网络片段评分的表示:
Figure BDA0003394246140000224
其中κ(Mi)是模型Mi中的拟合参数的数量,并且N是样品(数据点)的数量。SMLE(Mi)是网络片段的可能性函数的负对数,其可以从用于每个网络片段的函数关系计算。对于BIC评分,分数越低,模型拟合输入数据的可能性越大。
将整套试验网络全面优化,这可以描述为优化或进化网络。例如,可以根据米特罗波利斯-蒙特卡罗抽样算法来进化和优化试验网络。模拟的退火可以通过局部转化而用于优化或进化整套中的每个试验网络。在实例模拟退火方法中,通过从文库增加网络片段、通过从试验网络删除网络片段、通过减去网络片段或通过另外改变网络拓扑结构来改变每个试验网络,并随后计算该网络的新评分。一般而言,如果评分提高,保持所述改变,而如果评分恶化,则放弃所述改变。“温度”参数允许一些恶化评分的局部变化被保留,这有助于优化过程避免一些局部极小值。“温度”参数随着时间降低以允许优化/进化过程来汇聚。
所有或部分网络推断过程可以针对不同试验网络平行地进行。每个网络可以在分开的处理器和/或分开的计算设备上平行优化。在一些实施方案中,优化过程可以在集成了数百至数千个并行运行的处理器的超级计算机上进行。信息可以在并行处理器上进行的优化过程中共享。在一些实施方案中,优化过程可以在一个或多个量子计算机上进行,其具有明显快于基于硅的计算机来进行某些计算的潜能。
优化过程可以包括从整套网络中去掉不能满足针对整体评分的阈值标准的任何网络的网络过滤器。去掉的网络可以被新的初始网络来替代。此外,任何不是“无标度(scale free)”网络可以从整套网络中去掉。在整套网络优化或进化后,结果可以称为整套所产生的关系网络模型,其可以总称为所产生的一致性网络。
模拟可以用于提取关于所产生的关系网络模型中的每个关系的定量参数信息。例如,用于定量信息提取的模拟可以涉及将网络中的每个节点扰动(提高或降低)十倍并针对模型中的其他节点计算后续分布。终点通过t-检验比较,采用100个样品/组的假定和0.01的显著性截止。t-检验统计是100个t-检验的中值。通过使用这种模拟技术,针对整套网络中的每个关系产生表示预测强度的曲线下面积(AUC)和表示驱动终点的计算机模拟节点幅度的倍数变化。
局部计算机系统的关系量化模块可以用于指引基于AI的系统来进行扰动并且提取AUC信息和倍数信息。提取的量化信息可以包括针对将亲节点连接到子节点的各边缘的倍数变化和AUC。在一些实施方案中,定制的R程序可以用于提取量化信息。
在一些实施方案中,整套所产生的关系网络模型可以通过模拟使用以用于预测对条件变化的响应,这可以随后通过临床研究和实验来验证。
基于AI系统的输出可以是量化关系参数和/或其他模拟预测。
一些示例性实施方案结合了可以使用Berg Interrogative BiologyTMInformatics Suite进行的方法,其是用于了解广泛的生物学过程(如疾病病理生理学)以及构成这些学生物过程的基础的关键分子驱动者(包括使疾病过程成为可能的因子)的工具。一些示例性实施方案使用Berg Interrogative BiologyTM Informatics Suite来获得关于疾病与其他疾病、医疗药物、生物学过程等的相互作用的新的见解。一些示例性实施方案包括可以结合至少一部分或全部Berg Interrogative BiologyTM Informatics Suite的系统。
实施例
实施例1-从CMS数据产生的关系网络模型:心力衰竭&休克与肾衰竭的子网络
在人工智能(AI)中开发的数学和统计学习工具充分适用于解读大数据中复杂的相互作用模式。Berg Interrogative BiologyTM Informatics Suite是使用贝叶斯网络(BN)以纯数据驱动的方式用于各种数据形式的整合和因果效应的推断的计算流程。本实施例涉及在健康护理大数据分析中使用BN,所述健康护理大数据分析对增强患者护理以及提高健康护理和医院效率具有显著影响。
使用低解析度的、公众可得的数据形成使用所产生的因果关系网络模型直接告知护理的新发现和得到新的假设。基于来自医疗保险和医疗补助服务中心(Centers forMedicare&Medicaid Services)(CMS)的公众可得的账单数据产生诊断代码的数据关系网络。
如图5的方法500中图示的,从CMS发布提取数据。通过过滤、标准化和插补将数据预加工。将基于A.I.的模型构建用于从预加工的数据产生模型,形成诊断代码网络形式的关系网络。
从CMS数据发布获得数据集合。CMS发布(即,使得在其网站上公众可得)涉及患者护理、保险信息、诊断代码、出院代码和针对健康护理提供者的各种程序的费用代码的数据。图6显示了针对单个医疗机构的一部分CMS数据的样本。在这个实例中,所获得的数据包括多个健康护理提供者和2011年的头100个诊断代码。
将Berg Interrogative BiologyTM Informatics Suite用于数据预加工和模型构建。将收集的数据加工以使得从数据集提取含有关于诊断相关组(DRG)代码和出院总数的信息的栏。将出院计数信息组织成DRG代码相对于医院的矩阵。从进一步的分析中除去在超过70%的医院中缺失的DRG代码。从数据集中过滤掉缺失超过25个DRG代码的信息的医院。过滤后,数据集含有100个DRG代码和1618个医院。对这个数据矩阵进行中位平滑(medianpolish)标准化,并且缺失数据用“零程序(zero procedure)”插补。使用REFS技术构建了因果关系网络模型。用0.65的曲线下面积(AUC)截止来过滤所得到的关系网络中的关联。使用合适的图形环境/界面软件来可视化所得到的网络,尤其是Cytoscape,这是来自CytoscapeConsortium的用于生物分子相互作用网络的集成模型的软件环境。在Cytoscape环境内,网络可视化为通过“边缘”连接的“节点”,各边缘图示描绘了通过边缘连接的两个节点之间的关系。
基于DRG代码的所产生关系网络的示意性图形描绘显示于图7中。这个特定的关系网络含有60个诊断和88个连接它们的关联/关系。网络中的每个节点表示针对特定诊断的出院数,并且边缘(例如,节点之间的连接)表示与各种诊断相关的出院数之间的相互作用。在图7中,节点的大小对应于针对特定诊断的出院代码的数量。网络中边缘和关联的解释取决于所涉及的特定诊断。例如,当源节点是糖尿病并且目标节点是高血压时,关联表示共病。当源节点是糖尿病并且目标节点是神经病时,关联表示所述疾病的并发症。以这种方式,关系网络表示多种DRG代码之间的相互作用。
选择子网络以从所产生的关系网络获得相关信息。从图7中所示的因果关系网络模型确定了以“心力衰竭&休克”和“肾衰竭”为中心的子网络(显示于图8中)。在这个实例中,由于其在疾病控制预防中心(CDC)编制的死亡指数中的显著性,选择了“心力衰竭&休克”和“肾衰竭”。根据CDC报告,心脏病是2011年的最主要死亡原因。一些肾相关的病症位列9、12和13;然而,结合所有肾相关病症在死亡原因中占有重要地位。
在图8的子网络的图形表示中,箭头形式的关联表示第一种状况中的诊断数和第二种状况中的诊断数为正相关的。在临床上,可以根据涉及的状况以不同方式来解释关联(例如,从心力衰竭&休克指向单纯性肺炎&胸膜炎的箭头表示心力衰竭&休克在统计学上显著比例的患者中导致或继发单纯性肺炎&胸膜炎)。显示为线的标注之间的每个关联也可以描述为节点之间的边缘。形成节点之间的关联的线的宽度(也描述为线的“权重”)提供了节点之间的关系强度的图形指示。例如,从心力衰竭&休克指向单纯性肺炎&胸膜炎的箭头比连接心力衰竭&休克与呼吸道感染&炎症的箭头宽。这表示所述模型预测心力衰竭&休克与单纯性肺炎&胸膜炎之间的关系比心力衰竭&休克与呼吸道感染&炎症之间的关系强。
如以下讨论的,用作关系网络模型中出现的关联的验证的心力衰竭子网络中和肾衰竭子网络中的关联是可靠的。
心力衰竭由降低心脏有效泵送血液的能力的状况引起。这些状况包括先天性心脏缺陷、心律不齐、随着时间使动脉狭窄的冠心病和可能使得心脏太弱或太僵硬以致不能有效泵送血液的高血压。以下讨论了心力衰竭和其他状况之间的关系,其反映在子网络中的心力衰竭和其他节点之间的关联中。
呼吸道感染和炎症/单纯性肺炎和胸膜炎:公知的是心力衰竭引起血液以较缓慢的速度通过身体并且引起肾脏流体潴留。流体潴留开始于身体的较低部分,但发展至肺而引起肺炎。肺中的流体积累导致提高的呼吸道感染率和呼吸道感染。关系网络模型预测心力衰竭&休克的诊断在统计学上显著比例的患者中导致或跟随单纯性肺炎和胸膜炎的诊断,如通过图9A中从心力衰竭&休克指向单纯性肺炎和胸膜炎的箭头所指示的。关系网络模型预测心力衰竭&休克的诊断在统计学上显著比例的患者中导致或跟随呼吸道感染&炎症的诊断,如通过图9A中从心力衰竭&休克指向呼吸道感染&炎症的箭头所指示的。图9B图示描绘了心力衰竭和休克可以通过其导致单纯性肺炎和胸膜炎以及呼吸道感染和炎症的途径。
慢性阻塞性肺病(COPD):当肺尝试通过提高肺内部的血压来补偿血液中的低氧浓度时,COPD引起肺动脉高血压。肺内部的血压提高导致肺动脉高血压,其使右心室应变并且引起心力衰竭。因此,心力衰竭的诊断可以导致之前未诊断的COPD的诊断。因此,心力衰竭诊断数量的增加将增加COPD诊断的数量。关系网络模型预测心力衰竭&休克的诊断数增加导致COPD诊断数的增加,如通过图10A中从心力衰竭&休克指向COPD的箭头所指示的。这可以直接解释为心力衰竭&休克在统计学上显著数量的患者中引起COPD。然而,图10B图示描绘了COPD通过其导致心力衰竭&休克的途径,而不是心力衰竭&休克导致COPD。这种模型预测与已知的心力衰竭和COPD之间关系之间的明显时序逆转很可能是由于在心力衰竭后诊断的之前未诊断的COPD引起。临床医生可能发现仅心力衰竭后的COPD导致原因的探索。因此,尽管在心力衰竭前存在COPD,COPD未得到诊断,直至在心力衰竭诊断后。
心律失常和传导障碍:心律失常和传导障碍可以直接引起心力衰竭。心力衰竭的诊断可以导致这些因果条件的诊断。因此,心力衰竭诊断数量的增加将增加心律失常和传导障碍的诊断数量。关系网络没模型预测心力衰竭和休克诊断数量的增加在统计学上显著比例的患者中导致或跟随心律失常&传导障碍的诊断数量的增加,如通过图11中从心力衰竭和休克指向心律失常&传导障碍的箭头所指示的。
胃肠道(G.I.)出血:心力衰竭可以是低血容量性休克的结果。低血容量性休克由于循环血量的快速损失而发生。出血性休克(低血容量性休克的前身)的最常见原因是外伤、G.I.出血和器官损伤。关系网络模型预测G.I.出血的诊断在统计学上显著比例的患者中导致或跟随心力衰竭&休克的诊断,如通过图12A中从G.I.出血指向心力衰竭和休克的箭头所指示的。图12B图示描绘了G.I.出血通过其导致心力衰竭的途径。
肾衰竭:贫血、心脏问题和肾疾病之间的关联是公知的,并且已经证明了治疗心-肾功能不全患者的挑战。约四分之一肾病患者具有充血性心脏问题。随着肾病恶化,具有心脏疾病的患者的分数提高至约65-70%。大的研究已经表明在之前诊断为心力衰竭的患者中,肾病恶化与较高死亡率和住院率相关。因此,这种关联已经是公知的。关系网络模型预测肾衰竭的诊断在统计学上显著比例的患者中导致或跟随心力衰竭和休克的诊断,如通过图13中从肾衰竭指向心力衰竭&休克的箭头所指示的。
图14A和14B提供了关于关系网络模型用于心力衰竭&休克和肾衰竭之间的关系强度的预测的更多详细内容。图14A是源自用于构建关系网络模型的数据的心力衰竭和肾衰竭的关联图。可以表示为2×2表的关联图显示了针对数据集中的变量,所观察到的频率与预期的频率的偏离。皮尔森残差表示预期的频率和观察的频率之间的距离,并且因此允许鉴别造成与预期值的偏离的类别。在图14A的关联图中,每个矩形的宽度表示数据点的数量并且高度和颜色代表皮尔森残差。在这种情况中,基于心力衰竭和肾衰竭独立分布的零假设来计算预期的值。如果这是真的,图将主要是浅灰色的,表示皮尔森残差接近零(即,小于2且大于-2)。相反,观察到表示皮尔森残差小于-2的中灰色部分和表示皮尔森残差大于2的深灰色部分,表明心力衰竭和肾衰竭不是独立的,因此偏离零假设。如通过皮尔森残差指示的,造成变化的最大组成部分对于肾衰竭和心力衰竭是在高类别中。总的来说,在这种情况中,图14A的关联图指示心力衰竭和肾衰竭之间的相互作用。这种相互作用主要是通过同时患有肾衰竭和心力衰竭的患者造成的。
图14B是心力衰竭和肾衰竭的四格(fourfold)图,其源自用于构建关系网络模块的数据。四格图是偏离目标类别之间的独立性的另一种表示。在四格图中,每个方块中的数字表示该类别中数据点的数量。图14B显示了肾衰竭对心力衰竭的影响。基于比较四分之一圆的大小,图的左半部分表明与低肾衰竭率相比,高肾衰竭率对高心力衰竭率具有更强的影响。图的右半部分表明高或低肾衰竭对低心脏衰竭第的影响中具有较小差异。总的来说,这一图表强化了目标状况心力衰竭和肾衰竭之间的相互作用。基于关系网络模型,心力衰竭伴随肾衰竭的相对风险计算为2.57。
图15A和15B提供了关于关系网络模型用于心力衰竭&休克与G.I.出血之间的关系强度的预测的更多详细内容。图15A是心力衰竭和G.I.出血的关联图。在这一图表中,表示皮尔森残差大于4.0的深灰色矩形和表示皮尔森残差小于-2的中灰色矩形表明G.I.出血和心力衰竭不是独立的。特别地,深灰色矩形表明两种状况的高比率具有最强的相互作用。图15B是心力衰竭和G.I.出血的四格图。这一图表表明高比率的心力衰竭与高比率的G.I.出血强烈相关。如所示的,心力衰竭伴随G.I.出血的相对风险计算为3.22。
仅基于DRG和出院代码产生了关系网络模型,而没有关于心脏病&休克与各种状况(即,单纯性肺炎和胸膜炎、呼吸道感染和炎症、COPD、心律失常&传导障碍、G.I.出血及肾衰竭)之间的关系的任何假设和其他信息。无论如何,所产生的关系网络模型的以心力衰竭和休克为中心的子网络反映出医学领域中关于心力衰竭&休克与其他状况之间的关系的现有知识,这支持关系网络模型的有效性。
这个分析中对应于肾衰竭的诊断代码包括慢性/急性肾衰竭和其他肾障碍。肾衰竭/功能不全是指肾脏从血液除去废物的能力降低。超过10%的20岁或更大年龄的成年人患有CKD,并且由于与共病和生活质量因素有关的花费,治疗CKD的费用非常高。一个研究表明用于治疗终末期肾病(ESRD)的费用持续增加并且用于这种状况的医疗成本在2009年达到3百亿美元。图16中示意性地描绘了以肾衰竭为中心的子网络。子网络中与肾衰竭的关联研究如下:
肾和尿道感染:关系网络模型预测了肾衰竭与肾和尿道感染之间的统计学上显著的关系,如通过图16中从肾衰竭指向肾&尿道感染的箭头所示的。已知未治疗的尿道和肾感染可以导致肾衰竭。尽管方向性的逆转仍然是未得到解释的,但在关系网络模型中表示了状况之间的关联。因此,鉴定之间的这种关联并不令人惊讶。
营养、代谢和流体/电解质的失调:肾脏在维持液体和电解质平衡中起着重要作用。因此,肾衰竭的诊断导致营养、代谢、液体和电解质平衡问题的追踪测试和诊断是可能的。关系网络模型预测了肾衰竭的诊断在统计学上显著比例的患者中导致营养、代谢和流体/电解质失调的诊断,如通过图16中从肾衰竭指向营养、代谢和流体/电解质失调的箭头所示的。
单纯性肺炎和胸膜炎:确定了慢性肾病提高了对感染的易感性,并且肺炎已经被证明为肾病的感染性并发症。关系网络模型预测了肾衰竭和单纯性肺炎&胸膜炎之间的统计学上显著的关系,如通过图16中肾衰竭和单纯性肺炎&胸膜炎之间的关联所示的。在图8的子网络的图形表示中,T-型形式的关联表示第一状况中的诊断数量和第二状况中的诊断数量是负相关的。具体地,单纯性肺炎&胸膜炎的诊断数量和肾衰竭的诊断数量是负相关的。
关于以肾衰竭为中心的子网络,选定的子网络中除了一个以外的其他全部关联(具体地,除了支气管炎&哮喘和肾衰竭之间的关联的其他全部关联)得到了医疗领域中现有知识的支持。这作为来自所产生的关系网络模型是可靠的并且相互作用的新预测值得进一步研究的进一步验证。
来自所产生的网络关系模型的结果还导致新的相互作用的鉴定。例如,基于肾衰竭子网络,鉴定了肾衰竭和支气管炎&哮喘之间新的相互作用。如图17A中所示,关系网络模型预测了支气管炎&哮喘的诊断在统计学上显著比例的患者中导致或跟随肾衰竭的诊断。箭头的厚度指示这是肾衰竭与心力衰竭&休克、肾&尿道感染、单纯性肺炎&胸膜炎以及营养、代谢和流体/电解质的各种失调中的任一个之间较强的关系或关联。因为关于肾衰竭和支气管炎&哮喘之间的关系的文献不是广为所知的或可得的,因此就药物治疗、疾病因果性和/或诊断顺序而言,这种相互作用具有用于新发现的潜能。构建了回归模型来鉴定相互作用的强度,如图17B中所描绘的。回归模型表明支气管炎和哮喘占据肾衰竭数据的~2.5%(p-值1.8×10-10)。p-值是获得检验统计结果的概率,其至少和假定零假设实际观察到的一样极端。在这种情况中,如果支气管炎和哮喘完全独立,则获得这个数据的概率将是1.8×10-10
图18A是肾衰竭与支气管炎和哮喘的关联图。图18A中表示的数据具有低于2.22×10-16的p-值。这一图表表明支气管炎&哮喘和肾衰竭不是独立的并且高比率的支气管炎&哮喘升高肾衰竭的比率。图18B是肾衰竭与支气管炎&哮喘的四格图。这一图表也显示出高比率的支气管炎&哮喘升高肾衰竭的比率。对于患者哮喘&支气管炎导致肾衰竭的相对风险计算为5.13。
产生了新的假设来关联这些状况。具体地,假设是肾衰竭和/或功能不全是作为治疗哮喘和支气管炎的副作用引起的。因此,当支气管炎和哮喘病例的数量增加时,肾衰竭病例的数量增加。以下进一步讨论这种假设。
支气管炎和哮喘是呼吸道疾病,其中由炎症引起了气道狭窄。为了控制症状和降低气道的肿胀,许多药物的选择是可用的,如以下表1中所示。这些药物中的许多的主要成分是长效β2-肾上腺素激动剂,并且禁忌症包括低钾血症。实际上,舒喘灵(β2-激动剂)广泛用于治疗肾衰竭/功能不全患者的高钾血症。因此,长期使用含有有效β2-激动剂的药物可降低钾水平,从而导致低钾血症。在用β2-激动剂治疗哮喘的患者中,已经注意到电解质失衡。
表1:在2011-12年选择头10种哮喘药物的临床药理学。药物信息获自处方药的药物索引。处方计数信息获自IMS健康的调查。
Figure BDA0003394246140000311
Figure BDA0003394246140000321
研究已经表明低钾血症在大鼠中诱导肾损伤并且观察到低钾血症在人中引起肾衰竭。在55位患者的研究中,慢性低钾血症伴随肾囊肿形成,这导致瘢痕形成和肾损伤而导致肾功能不全。其他研究也已经表明肾病患者中的低钾血症提高了发展至终末期肾病的比率且提高了死亡率。β2-激动剂可以提高醛固酮水平,这转而与肾功能障碍相关。阻断醛固酮的功能导致肾功能的改善。
图19A和19B描绘了支气管炎和哮喘的治疗可能通过其引起肾衰竭和/或功能不全的途径,这支持支气管炎和哮喘与肾衰竭之间的新关联的假设并解释了这一新关联。通过将公开的临床研究关联在一起构建了图19A中的途径。图19B显示了构成所述途径的基础的潜在分子机制,其被确定为支持公开的临床研究中的临床发现。图19B中使用的蛋白质缩写是Gs(鸟嘌呤核苷酸-结合调控蛋白)、cAMP(环腺苷酸单磷酸)、PKA(蛋白激酶A)、ACE(血管紧张素转化酶抑制剂)。图19A示意性地描绘了关联支气管炎&哮喘与肾衰竭的假设。用于支气管炎&哮喘的治疗最经常涉及使用含有长效β2-肾上腺素激动剂的药物。已知长效β2-肾上腺素激动剂提高醛固酮水平,已经表明这引起肾衰竭。按照联邦药物管理局(FDA)标签,低钾血症是长效β2-肾上腺素激动剂的禁忌症,并且低钾血症是提高的肾衰竭比率的已知标志物。图19B示意性地描绘了提出的将哮喘&支气管炎治疗与肾衰竭关联的分子机制。长效β2-肾上腺素激动剂提高Gs的活性,Gs涉及cAMP的产生,这转而提高PKA。这导致近球细胞的肾素分泌增加。肾素催化血管紧张素I的形成,其随后通过肺中的ACE活性转化成血管紧张素II。升高血管紧张素II水平引起醛固酮增加。在肾脏的肾上腺皮质中,增加的醛固酮导致增加的钾去除、水重吸收和钠重吸收,最终引起低钾血症和肾衰竭。表2包括支持图19A和19B中显示的途径和分子机制的公开临床研究的列表。
表2:支持关于支气管炎和哮喘与肾衰竭之间关联性的假设的途径和分子机制的公开临床研究。
Figure BDA0003394246140000331
Figure BDA0003394246140000341
Figure BDA0003394246140000351
在这个CMS数据集(其包括住院前瞻性支付系统(IPPS)中登记的3000家医院)中,治疗患者肾病的总费用为$23亿。这个CMS数据集代表总医疗保险支出的60%。因此,对于2011年仅这个诊断代码的总医疗保险费用将是$38.3亿。在这个引用中,2.5%将归因于用于治疗支气管炎和哮喘的药物的副作用。基于使用实施例1的关系网络模型确定的肾衰竭与支气管炎和哮喘之间的关系进一步研究和改进针对哮喘/支气管炎的治疗指南不仅导致更好的患者护理,而且节省了相当大的费用。例如,使用患者水平的数据,有可能基于病史和遗传因素鉴定对肾副作用具有高风险的患者。对于高风险患者,替代的治疗策略或肾功能监控可以导致患者更好的结果和付款人(如医疗保险)更低的成本。通过整合患者电子健康记录与知识库,可以将这样的护理改进通过临床决策支持系统结合至临床中,以提供个性化患者护理指导。
实施例2-从CMS数据产生的关系网络模型:红细胞(RBC)障碍的子网络
还从实施例1中描述的所产生的关系网络模型中选择了以红细胞(RBC)障碍为中心的子网络。图20示意性地描绘了关系网络模型和选择的RBC障碍子网络。从RBC障碍子网络确定了另一种新的相互作用。
RBC障碍的DRG代码涵盖贫血(由营养、遗传和共病引起)、输血反应(ABO,Rh不相容性)和血细胞减少。在将RBC障碍与其他诊断关联的分析中考虑所有相关的诊断。
RBC障碍子网络表明蜂窝组织炎的诊断在统计学上显著比例的患者中导致或跟随RBC障碍的诊断。当蜂窝组织炎未治疗时,来自感染的细菌进入血流并引起败血症。之前的研究已经表明脓毒症改变RBC形态和流变。因此蜂窝组织炎诊断的增加引起RBC障碍诊断的增加似乎是合理的。
RBC障碍子网络表明RBC障碍的诊断在统计学上显著比例的患者中导致或跟随败血症或重度脓毒症的诊断。脓毒症很可能在手术患者(其随之可能进行静脉输注)中。多次或延长的静脉输注可以引起全血细胞减少症,由此将RBC障碍的诊断与败血症关联起来。
RBC障碍子网络还表明“其他循环系统诊断”在统计学上显著比例的患者中导致或跟随RBC障碍的诊断。循环系统代码(即,其他循环系统诊断)包括心脏组织的感染和异常,以及心脏外科手术的并发症(搭桥,分流器、植入物和瓣膜的放置)。循环障碍和RBC障碍之间可能的关联涉及来自人工瓣膜的溶血性贫血。具体地,缺铁性贫血(一种RBC障碍)可以导致快速或无规律的心跳,这可以引起心脏扩大或心力衰竭。
如实施例1和2中鉴定的新的相互作用的发现对患者和提供者都具有重要影响。有效健康护理递送的一个重要方面是预测资源需求、确定最大化资源利用的策略和提供者选项的可用性。目前,只有医疗保险账单数据的一些部分,如病例组合指数,用于制定计划。利用对账单数据的高级统计学分析来补强这类数据可以显著提高健康护理管理的效率并形成健康护理系统的明显节约。结果表明了对使用大数据的高级分析的新观点,并且更重要地,证明了本文中所述的方法可以有效地用于从大数据提取可操作的信息。也可以分析推断的BN(其是根据一些实施方案的关系网络模型)以通过鉴定不利的药物相互作用、共病和疾病因果关系来提高患者护理。本文中呈现的实施例说明了实施方案可以怎样用于理解和弄清大量的、错综复杂的数据集的意义,以针对健康护理分析和实质的健康护理经济确定新的相互作用和产生可操作的输出。
在实施例1和2中,根据实施方案,基于出院数量构建了表示诊断之间的相互作用的有意义的关系网络模型。使用完全数据驱动的方法产生了关系网络模型,完全没有受到现有知识或假设的偏差。使用文献支持验证了来自关系网络模型的结果。实施例说明了即使对低解析度数据的相对小规模的分析也导致鉴定具有临床影响的新的相互作用。
实施例结果说明了根据本文中所述实施方案的大数据分析中纯粹数据驱动的方法可以怎样用于健康护理中来加速医学研究以及通过提供独特的见解来提高患者护理。实施例结果表明了对大数据高级分析的应用的新观点,并且更重要地,证明了使用贝叶斯网络算法形成的关系网络模型可以有效地用于提取可操作的信息。
以这种方式,本文中公开的健康护理分析系统和方法可以用于分析大的数据集并且收集作为数据集中数据点的关系的新见解。这样的分析可以针对含有详细的DRG代码信息、患者水平的索赔信息、患者临床信息(如诊断、用药、纵向数据、临床测试结果)等的数据集进行。这样的分析就处方推荐、副作用和毒性分析、药物相互作用、药物重新定位、药物试验的患者组等等而言,对于制药工业是有益的。这样的分析就临床决策支持系统、针对基于结果的支付的结果改善、护理标准的提高等等而言,对于医院行业是有益的。
某些实施方案在本文中描述为包括逻辑或许多组成部分、模块或机制。模块可以构成软件模块(例如,机器可读介质上或传输信号中具体化的代码)或硬件模块。硬件模块是能够执行某些操作的有形单元并且可以以某些方式来配置或排列。在实例实施方案中,可以通过软件(例如,应用或应用部分)来配置一个或多个计算机系统(例如,独立、客户端或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如,处理器或一组处理器)作为运行来执行本文中所述的某些操作的硬件模块。
在各种实施方案中,硬件模块可以机械地或电子地实施。例如,硬件模块可以包括永久配置来执行某些操作的专用电路或逻辑(例如,作为专用处理器,如现场可编程门阵列(FPGA)、应用-专用集成电路(ASIC)或图形处理器(GPU))。硬件模块还可以包括通过软件临时配置来执行某些操作的可编程逻辑或电路(例如,包括在通用处理器或其他可编程处理器中)。将认识到可以通过成本和时间考虑来驱动机械地实施硬件模块的决定,在专用的和永久配置的电路中,或在临时配置的电路(例如,通过软件配置)中实施。
因此,术语“硬件模块”应当理解为包括有形实体,所述实体是物理构造的、永久配置的(例如,硬连线的)或临时配置的(例如,编程的)以特定方式来运行和/或执行本文中所述的某些操作的实体。考虑其中硬件模块临时配置的(例如,编程的)实施方案,每一个硬件模块不需要在任何一个时间进程中配置或实例化。例如,在硬件模块包括使用软件配置的通用处理器的情况中,通用处理器可以在不同时间配置成相应的不同硬件模块。软件因此可以配置处理器,例如,以在一个时间进程构成特定的硬件模块并且在不同时间进程构成不同的硬件模块。
硬件模块可以给其他硬件模块提供信息或从其他硬件模块接收信息。因此,所描述的硬件模块可以认为是通讯耦合的。在同时存在多个这样的硬件模块的情况中,可以通过连接硬件模块的信号传输(例如,通过合适的电路和总线)来实现通讯。在其中在不同时间配置或实例化多个硬件模块的实施方案中,这些硬件模块之间的通讯可以,例如,通过已经接入多个硬件模块的存储结构中信息的存储和取回来实现。例如,一个硬件模块可以执行操作并在与其通讯耦合的存储装置中储存操作的输出。然后再一个硬件模块在稍后的时间访问存储装置来取回和加工存储的输出。硬件模块还可以启动与输入或输出设备的通讯并且可以基于资源(例如,信息集合)运行。
可以至少部分地通过临时配置(例如,通过软件)或永久配置来执行相关操作的一个或多个处理器来执行本文中所述的实例方法的各种操作。不管是临时或永久配置的,这样的处理器可以构成处理器实施模块,其运行来执行一个或多个操作或功能。在一些实例实施方案中,本文中所称的模块包括处理器实施模块。
相似地,本文中所述的方法可以至少部分地是处理器实施的。例如,可以通过一个或多个处理器或处理器实施模块来执行方法的至少一些操作。某些操作的执行可以分布在一个或多个处理器中,不仅停留在单个机器内,而是跨多个机器来部署。在一些实例实施方案中,一个或多个处理器以位于单一位置中(例如,在家庭环境、办公室环境内或作为服务器群组),而在其他实施方案中,处理器可以分布在多个位置中。
一个或多个处理器还可以运行来支持“云计算”环境中或作为“软件即服务”(SaaS)的相关操作的执行。例如,可以通过一组计算机(例如,包括处理器的机器)来执行至少一些操作,这些操作经由网络(例如,互联网)和经由一个或多个合适的界面(例如,API)是可访问的。
实例实施方案可以在数字电子电路中实施,或在计算机硬件、固件、软件或其组合中实施。实例实施方案可以使用计算机程序产品来实施,例如,信息载体中有形地具体化的计算机程序,例如,在用于通过数据处理装置执行的或控制数据处理装置操作的计算机可读介质中,所述数据处理装置例如为可编程处理器、计算机或多个计算机。
计算机程序可以以任何形式的编程语言来编写,包括汇编语言或解释语言,并且可以以任何形式来部署,包括作为独立程序或作为模块、子程序或适用于计算环境中的其他单元。计算机程序可以部署成在一个计算机或多个计算机(在一个位点或分布在多个位点中并通过通讯网络来互相连接)上执行。
在实例实施方案中,可以通过一个或多个可编程处理器来执行操作,所述处理器通过基于输入数据运行并产生输出来执行计算机程序而执行功能。也可以通过专用逻辑电路(例如,FPGA或ASIC)来执行方法操作,并且实例实施方案的装置可以作为专用逻辑电路(例如,FPGA或ASIC)来实施。
计算系统可以包括客户端和服务器。客户端和服务器一般彼此远离并且通常通过通讯网络进行交互。凭借在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。在部署可编程计算系统的实施方案中,将认识到硬件和软件结构需要考虑。具体地,将认识到是否在永久配置的硬件(例如,ASIC)中、在临时配置的硬件(例如,软件和可编程处理器的组合)中或永久和临时配置的硬件的组合中实施某些功能的选择可能是设计选择。以下是在各个实例实施方案中给出可以部署的硬件(例如,机器)和软件结构。
图21是实例形式的计算机系统900中的机器的框图,在所述系统内可以执行用于引起机器(例如,客户端装置110、115、120、125;服务器135;数据库服务器140;数据库130)来执行本文中讨论的任一个或多个方法的指令。在可替代的实施方案中,机器作为单独的设备来运行或可以连接(例如,网络连接)其他机器。在网络连接的部署中,机器可以在服务器-客户端网络环境中在服务器或客户端机器的能力中运行,或在对等(或分布式)网络环境中作为对等机器(peer machine)来运行。机器可以是个人计算机(PC)、平板PC、机顶盒(STB)、PDA、手机、环球网设备、网络路由器、交换机或网桥,或任何能够执行指令(按序或其他方式)的机器,所述指令指定由所述机器采取的动作。此外,尽管只显示了单个机器,术语“机器”还应当用于包括单独或结合执行一组(或多组)指令来执行本文中讨论的任一种或多种方法的任何机器集合。
实例计算机系统900包括处理器902(例如,中央处理器单元(CPU)、多核处理器和/或图形处理单元(GPU))、主存储器904和静态存储器906,其经由总线908彼此连通。计算机系统900可以进一步包括视频显示单元910(例如,液晶显示器(LCD)、触摸屏或电子射线管(CRT)。计算机系统900还包括字母输入装置912(例如,物理或虚拟键盘)、用户界面(UI)导航装置914(例如,鼠标)、磁盘驱动单元916、信号发生装置918(例如,扬声器)和网络接口装置920。
磁盘驱动单元916包括在其上储存一组或多组指令和具体化本文中所述的任何一种或多种方法或功能或通过本文中所述的任何一种或多种方法或功能使用的数据结构(例如,软件)924的机器可读介质922。指令924在其通过计算机系统900、主存储器904和处理器902执行的过程中,还可以完全或至少部分在驻留在也构成机器可读介质的主存储器904、静态存储器906和/或处理器902内。
尽管在实例实施方案中,机器可读介质922显示为单一介质,术语“机器可读介质”可以包括储存一个或多个指令或数据结构的单一介质或多个介质(例如,集中式或分布式数据库,和/或相关缓存和服务器)。术语“机器可读介质”还应当考虑包括能够储存、编码或携带由机器执行的指令并且引起机器来执行本发明的任一种或多种方法的,或能够储存、编码或携带通过这样的指令来使用或与这样的指令相关的数据结构的任何有形介质。术语“机器可读介质”因此应当考虑包括,但不限于,固态存储器以及光和磁介质。机器可读介质的特定实例包括非易失性存储器,包括,例如,半导体存储设备(例如,可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM))和闪存设备;磁盘,如内置式硬盘和可移动硬盘;磁光碟;以及CD-ROM和DVD-ROM盘。
指令924可以进一步使用传输介质在通信网络926上传输或接收。可以使用网络接口装置920和多个公知的传输协定(例如,HTTP)中的任何一个来传输指令。通信网络的实例包括LAN、WAN、互联网、移动电话网络、普通老式电话(POTS)网络和无线数据网络(例如,WiFi和WiMax网络)。术语“传输介质”应当考虑包括能够储存、编码或携带通过机器执行的指令的任何有形介质,并且包括数字或类似通信信号或促进这种软件的通信的其他无形介质。
尽管已经参照特定的实例实施方案描述了本发明,但显然可以对这些实施方案进行各种变化和改变而不脱离本发明更宽的精神和范围。因此,说明书和附图被认为是说明性的,而不是限制意义的。
将认识到,为了清楚的目的,以上描述参照不同的功能单元或处理器描述了一些实施方案。然而,将清楚的是可以使用在不同功能单元、处理器或结构域之间任何合适的功能分布而不脱离本发明。例如,可以通过同一处理器或控制器来执行阐述为由分开的处理器或控制器执行的功能。因此,对于特定功能单元的陈述只能看作是对用于提供所述功能的合适方式的陈述,而不是表示严格的逻辑或物理结构或组织。
尽管已经参照特定实例实施方案描述了实施方案,但显然可以对这些实施方案进行各种变化和改变而不脱离本发明更宽的精神和范围。因此,说明书和附图被认为是说明性的,而不是限制意义的。形成其一部分的附图通过说明而非限制的方式显示了其中可以实施所述主题的特定实施方案。足够详细地描述了所示的实施方案以使得本领域技术人员能够实施本文中公开的教导。可以使用和从其衍生其他实施方案以使得可以形成结构和逻辑替换和变化而不脱离本发明公开内容的范围。因此,这个详述是不是以限制意义来考虑,并且各个实施方案的范围仅由所附权利要求来限定,连同这些权利要求涵盖的等同的全部范围。
本发明主题的这些实施方案在本文中可以单独地和/或总体地通过术语“本发明”来提及,这仅仅是为了方便并且没有打算自愿地将本申请的范围限于任何单个发明或发明概念,如果实际上公开了超过一个发明或发明概念。因此,尽管本文中已经说明和描述了特定实施方案,但应当认识到所示的特定实施方案可以替换为经计算以实现相同目的的任何配置列。本发明公开内容打算涵盖各个实施方案的任何和所有的适应或改变。本文中没有特意描述的以上实施方案和其他实施方案的组合将是本领域技术人员在阅读以上描述时显而易见的。
在本文中,使用了术语“一(a)”或“一个(an)”,其与常见专利文件中相同,用于包括一个或超过一个,独立于“至少一个”或“一个或多个”的任何其他情况或用法。在本文中,术语“或”用于表示非排他性的或,使得“A或B”包括“A但不是B”、“B但不是A”及“A和B”,除非另外指出。在所附权利要求中,术语“包括(including)”和“其中(in which)”用作相应术语“包含(comprising)”和“其中(wherein)”的简单英语等同来使用。此外,在以下权利要求中,术语“包括”和“包含”是开放式的;即,包括除了权利要求中该术语后所列那些以外的其他要素的系统、设备、物品或方法仍然认为落入该权利要求的范围内。此外,在以下权利要求中,术语“第一”、“第二”和“第三”等等仅仅是用作标记,并不是打算对其对象施加数位要求。
提供了公开内容的摘要使得阅读者可以快速确定技术公开内容的性质。所述摘要理解为不会用于解释或限制权利要求的范围或含义。此外,在之前的详述中,可以看到为了使公开内容顺畅的目的,在单个实施方案中将各种不同特征组合在一起。本公开的这种方法不应解释为反映出所要求的实施方案需要比每个权利要求专门描述的更多特征的意图。相反,如以下权利要求反映的,本发明的主题在于单个公开实施方案中并非全部的特征。因此,将以下权利要求由此结合至详述中,每个权利要求作为单独的实施方案自身成立。

Claims (64)

1.一种用于基于患者数据产生因果关系网络模型的计算机实施方法,该方法包括:
接收对应于多位患者的数据,所述数据包括针对每位患者的诊断信息和/或治疗信息;
解析数据,产生针对多个变量的标准化数据,其中对于每位患者,所述标准化数据针对超过一个变量产生;
使用贝叶斯网络算法基于所产生的标准化数据产生涉及所述多个变量的因果关系网络模型,所述因果关系网络模型包括与多种医学状况相关的变量,和
使用程序化计算系统产生因果关系网络,所述程序化计算系统包括容纳网络模型构建代码的存储器和一个或多个配置成执行网络模型构建代码的处理器。
2.权利要求1的方法,其中所述因果关系网络模型包括指示针对所述多种医学状况中的每一种的一个或多个预测因子的关系。
3.权利要求1的方法,其中所述接收的数据没有预选择为与所述多种医学状况的一种或多种相关。
4.权利要求1的方法,其中所述多位患者包括各自具有指示患者医学状况诊断的数据的患者的第一子集和各自具有不指示患者医学状况诊断的数据的患者的第二子集。
5.权利要求1的方法,进一步包括:
接收对应于一位或多位其他患者的另外的数据;和
基于所述另外的数据更新所述因果关系网络模型。
6.权利要求1的方法,进一步包括:
接收对应于所述多位患者中的一位或多位的更新的或另外的数据;和
基于所述更新的或另外的数据更新所述因果关系网络模型。
7.权利要求1的方法,其中仅仅基于所产生的标准化数据来产生所述因果关系网络模型。
8.权利要求1的方法,进一步包括:
从所述因果关系网络模型确定子网络,所述子网络中的一个或多个变量与选定的医学状况相关;和
探测所述子网络中的关系,以确定针对所述选定的医学状况的一个或多个预测因子。
9.权利要求8的方法,其中针对选定的医学状况的所述一个或多个预测因子指示与选定的医学状况共同发生的医学状况。
10.权利要求8的方法,其中基于与选定的医学状况相关的所述一个或多个变量以及所述一个或多个变量和所述因果关系网络模型中的其他变量之间的关系的强度来确定所述子网络的范围。
11.权利要求8的方法,其中所述子网络包括与选定的医学状况相关的所述一个或多个变量、各自具有与所述一个或多个变量的第一程度关系的第一组其他变量和各自具有与所述一个或多个变量的第二程度关系的第二组其他变量。
12.权利要求8的方法,其中所述一个或多个预测因子中的至少一个之前未知为针对选定的医学状况的预测因子的。
13.权利要求8的方法,其中所述一个或多个预测因子中的至少一个新鉴定为针对所述医学状况的预测因子。
14.权利要求8的方法,其中预测因子的数量小于变量的数量。
15.权利要求8的方法,进一步包括:
在用户界面中显示所述一个或多个预测因子,所述显示包括所述一个或多个变量、所述一个或多个预测因子以及所述一个或多个变量和所述一个或多个预测因子之中的关系的图形表示。
16.权利要求8的方法,进一步包括在用户界面中显示所述子网络的图形表示。
17.权利要求8的方法,进一步包括基于所述一个或多个变量和所述一个或多个预测因子之间的关系的强度将所述一个或多个预测因子分级。
18.权利要求1的方法,进一步包括:
从所述因果关系网络模型确定子网络,所述子网络中的一个或多个变量与选定的药物相关;和
探测所述子网络来确定与选定的药物相关的一个或多个预测因子。
19.权利要求18的方法,其中与选定的药物相关的所述一个或多个预测因子指示与选定的药物结合给药的药物。
20.权利要求18的方法,其中所述一个或多个预测因子指示所述选定的药物与一种或多种其他药物之间的不利药物相互作用。
21.权利要求20的方法,其中所述一个或多个预测因子中的至少一个新鉴定为针对所述选定的药物与所述一种或多种其他药物之间的不利药物相互作用的预测因子。
22.权利要求18的方法,其中基于与所述选定的药物相关的所述一个或多个变量以及所述一个或多个变量与所述因果关系网络模型中的其他变量之间的关系的强度来确定所述子网络的范围。
23.权利要求18的方法,其中所述子网络包括与所述选定的药物相关的所述一个或多个变量,各自具有与所述一个或多个变量的第一程度关系的第一组其他变量和各自具有与所述一个或多个变量的第二程度关系的第二组其他变量。
24.权利要求18的方法,其中所述一个或多个预测因子中的至少一个之前未知为针对所述选定的药物的预测因子的。
25.权利要求18的方法,其中预测因子的数量小于变量的数量。
26.权利要求1至25任一项的方法,其中基于至少50个变量产生所述因果关系网络模型。
27.权利要求1至25任一项的方法,其中基于至少100个变量产生所述因果关系网络模型。
28.权利要求1至25任一项的方法,其中基于至少1000个变量产生所述因果关系网络模型。
29.权利要求1至25任一项的方法,其中基于至少100,000个变量产生所述因果关系网络模型。
30.权利要求1至25任一项的方法,其中基于50个变量至1,000,000个变量产生所述因果关系网络模型。
31.权利要求1至25任一项的方法,其中基于50位患者至1,000,000位患者的数据产生所述因果关系网络。
32.权利要求1至25任一项的方法,其中所述数据包括来自患者电子健康记录的信息。
33.权利要求1至25任一项的方法,其中所述接收的数据进一步包括所述多位患者中至少一些的至少一种以下信息:患者人口统计学数据、病史、患者家族病史、现在进行着的药物治疗信息、非现在进行的过去药物治疗信息、过敏信息、免疫状态信息、实验室测试结果、放射图像、生命体征信息、患者体重、账单信息、生活方式信息、习惯信息、保险索赔信息和药房信息。
34.权利要求33的方法,其中所述患者人口统计学数据包括患者年龄、患者种族和患者民族中的至少一种。
35.权利要求1至25任一项的方法,其中所述接收的数据包括来自病历表的信息。
36.权利要求35的方法,来自患者病历表的信息包括健康护理专业人员的备注、健康护理专业人员的观察、药物和治疗的施用、药物和治疗施用的顺序、测试结果和x-射线中的至少一种。
37.权利要求1至25任一项的方法,其中所述接收的数据包括患者出院信息。
38.权利要求37的方法,其中所述患者出院信息包括诊断代码、治疗代码、保险费代码、诊断相关组代码和疾病国际分类代码中的至少一种。
39.权利要求1至25任一项的方法,其中所述接收的数据涉及来自选定医院的多位患者。
40.权利要求1至25任一项的方法,其中所述接收的数据涉及来自选定地理区域的多位患者。
41.权利要求1至25任一项的方法,其中使用贝叶斯网络算法基于所产生的标准化数据产生针对所述多位患者的涉及所述变量的因果关系网络模型包括:
通过贝叶斯片段计数过程基于所述变量形成网络片段文库;
形成整套试验网络,每个试验网络从所述文库中的不同网络片段子集构建;和
通过经由模拟退火的局部转化使每个试验网络进化而总体地优化所述整套试验网络,以产生一致因果关系网络模型。
42.权利要求41的方法,其中使用贝叶斯网络算法基于所产生的标准化数据产生针对所述多位患者的涉及所述变量的因果关系网络模型进一步包括:
基于输入数据计算机模拟所述一致因果关系网络模型,以提供针对所得到的因果关系网络模型内的一个或多个因果关系的预测置信水平。
43.一种使用因果关系网络模型的计算机执行的方法,所述方法包括:
接收从多种医学状况的医学状况的选择;
从计算机产生的因果关系网络模型确定子网络,所述因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与所述多种医学状况相关的变量,所述因果关系网络模型基于选定的医学状况,所述子网络包括与所述选定的医学状况相关的一个或多个变量;
全面研究所述子网络以鉴定针对所述选定的医学状况的一个或多个预测因子;和
储存针对所述选定的医学状况的所述一个或多个预测因子。
44.权利要求43的方法,其中通过用户界面从用户接收所述医学状况的选择。
45.权利要求43的方法,其中所述一个或多个预测因子中的至少一个之前未知为针对所述选定的医学状况的预测因子。
46.权利要求43的方法,其中所述一个或多个预测因子中的至少一个新鉴定为针对所述选定的医学状况的预测因子。
47.权利要求43的方法,其中预测因子的数量少于变量的数量。
48.权利要求43的方法,进一步包括:
在用户界面中显示所述预测因子,所述显示包括所述一个或多个选定的变量、所述一个或多个预测因子以及所述一个或多个选定变量和所述预测因子之中的关系的图形表示。
49.权利要求43的方法,进一步包括在用户界面中显示所述子网络的图形表示。
50.权利要求43的方法,进一步包括基于所述一个或多个选定变量和所述一个或多个预测因子之间的关系强度将所述一个或多个预测因子分级。
51.权利要求43的方法,其中所述一个或多个预测因子与一种或多种医疗药物相关。
52.权利要求43的方法,其中所述预测因子与一种或多种医学状况相关。
53.一种使用因果关系网络模型的计算机执行的方法,该方法包括:
从多种医学状况接收与医学状况相关的探询;
从计算机产生的因果关系网络模型确定子网络,所述因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与所述多种医学状况相关的变量,所述因果关系网络模型基于探询的医学状况,所述子网络包括与所述探询的医学状况相关的一个或多个变量;
全面研究所述子网络以鉴定针对所述探询的医学状况的一个或多个预测因子;和
储存针对所述探询的医学状况的所述一个或多个预测因子。
54.权利要求53的方法,其中从用户接收的所述探询包括与医学状况和/或医疗药物相关的信息。
55.一种使用因果关系网络模型的计算机执行的方法,该方法包括:
接收与医疗药物相关的信息;
从计算机产生的因果关系网络模型确定子网络,所述因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与所述多种医疗药物相关的变量,所述因果关系网络模型基于所述医疗药物,所述子网络包括与所述医疗药物相关的一个或多个变量;
全面研究所述子网络以鉴定针对所述医疗药物的一个或多个预测因子;和
储存针对所述医疗药物的所述一个或多个预测因子。
56.一种用于基于患者数据产生因果关系网络模型的系统,所述系统包括:
配置用于接收与多位患者相关的数据的数据接收模块,所述数据包括针对每位患者的诊断信息和/或治疗信息;
配置用于解析所述数据以产生针对多个变量的标准化数据的解析模块,其中,针对每位患者,所述标准化数据针对超过一个变量而产生;和
配置用于使用贝叶斯网络算法基于产生的标准化数据产生涉及所述多个变量的因果关系网络模型的处理器实施的关系网络模块,所述因果关系网络模型包括与多种医学状况相关的变量。
57.权利要求56的系统,其中所述因果关系网络模型包括指示针对所述多种医学状况中每一种的一个或多个预测因子的关系。
58.一种使用基于患者数据的因果关系网络模型的系统,所述系统包括:
配置用于接收与医学状况相关信息的数据接收模块;
配置用于从计算机产生的因果关系网络模型确定子网络的子网络模块,所述因果关系网络模型使用贝叶斯网络算法从患者数据产生并且包括多个变量,所述变量包括与多种医学状况相关的变量,所述因果关系网络模型基于所述医学状况,所述子网络包括与所述医学状况相关的一个或多个变量;和
配置用于全面研究所述子网络并鉴定针对所述医学状况的一个或多个预测因子的变量鉴定模块。
59.权利要求58的方法,其中所述计算机产生的因果关系网络模型使用权利要求1-25任一项的方法来产生。
60.一种储存至少一个程序的非临时机器可读存储介质,所述程序在通过至少一个处理器执行时,引起所述至少一个处理器来进行权利要求1至25任一项的方法。
61.一种用于产生针对医学状况的预测因子的系统,所述系统包括:
因果关系网络模型产生器,其配置用于:
接收对应于多位患者的数据,所述数据包括针对每位患者的诊断信息和/或治疗信息;
解析所述数据以产生针对多个变量的标准化数据,其中,针对每位患者,所述标准化数据针对超过一个变量产生;和
使用贝叶斯网络算法基于产生的标准化数据产生将每个变量与所述多个变量中的一个或多个关联的因果关系网络模型,所述因果关系网络模型包括与多种医学状况相关的变量。
62.权利要求61的系统,其中所述因果关系网络模型包括指示针对所述多种医学状况中的每一种的一个或多个预测因子的关系。
63.权利要求61的系统,进一步包括:
子网络选择模块,其配置用于:
经由用户界面从用户接收与医学状况相关的信息;
从所述因果关系网络模型确定子网络,所述子网络包括与所述医学状况相关的一个或多个变量;
全面研究所述子网络以鉴定针对所述医学状况的一个或多个预测因子;和
储存针对所述医学状况的所述一个或多个预测因子。
64.一种用于基于患者数据产生因果关系网络模型的系统,所述系统包括:
由第一处理器执行的数据接收模块,其配置用于:
接收对应于多位患者的数据,所述数据包括每位患者的诊断信息和/或治疗信息;和
解析所述数据以产生针对多个变量的标准化数据,其中,针对每位患者,所述标准化数据针对超过一个变量产生;和
通过一个或多个另外的处理器执行的因果关系网络模块,其配置用于:
使用贝叶斯网络算法基于所产生的标准化数据产生涉及所述多个变量的因果关系网络模型,所述因果关系网络模型包括与多个医学状况相关的变量。
CN202111477970.7A 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型 Pending CN114203296A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201462049148P 2014-09-11 2014-09-11
US62/049,148 2014-09-11
PCT/US2015/049552 WO2016040725A1 (en) 2014-09-11 2015-09-11 Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data
CN201580058049.5A CN107111603A (zh) 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201580058049.5A Division CN107111603A (zh) 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Publications (1)

Publication Number Publication Date
CN114203296A true CN114203296A (zh) 2022-03-18

Family

ID=55459589

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580058049.5A Pending CN107111603A (zh) 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型
CN202111477970.7A Pending CN114203296A (zh) 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201580058049.5A Pending CN107111603A (zh) 2014-09-11 2015-09-11 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Country Status (13)

Country Link
US (3) US10482385B2 (zh)
EP (1) EP3191975A4 (zh)
JP (1) JP6916107B2 (zh)
KR (1) KR102662004B1 (zh)
CN (2) CN107111603A (zh)
AU (2) AU2015314956A1 (zh)
CA (1) CA2960837A1 (zh)
HK (1) HK1243509A1 (zh)
IL (1) IL250966B (zh)
NZ (1) NZ730197A (zh)
SG (2) SG10201902151UA (zh)
WO (1) WO2016040725A1 (zh)
ZA (1) ZA201701611B (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111603A (zh) 2014-09-11 2017-08-29 博格有限责任公司 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型
US20210280317A1 (en) * 2014-10-07 2021-09-09 AlignCare Services, LLC. System and Method for Improving Health Care Management and Compliance
US11443206B2 (en) 2015-03-23 2022-09-13 Tibco Software Inc. Adaptive filtering and modeling via adaptive experimental designs to identify emerging data patterns from large volume, high dimensional, high velocity streaming data
US10839024B2 (en) * 2016-06-20 2020-11-17 Tibco Software Inc. Detecting important variables and their interactions in big data
EP3465200A4 (en) * 2016-06-05 2020-07-08 Berg LLC PATIENT STRATIFICATION SYSTEMS AND METHODS AND IDENTIFICATION OF POTENTIAL BIOMARKERS
US11182229B2 (en) * 2016-12-16 2021-11-23 Sap Se Data processing for predictive analytics
US11315685B2 (en) * 2017-01-25 2022-04-26 UCB Biopharma SRL Method and system for predicting optimal epilepsy treatment regimes
KR101830314B1 (ko) 2017-07-26 2018-02-20 재단법인 구미전자정보기술원 인공지능 기반 베이지안 네트워크를 이용한 췌장암 진단에 필요한 정보제공 방법, 컴퓨터 프로그램 및 컴퓨터 판독 가능한 기록 매체
US10699450B2 (en) 2017-09-28 2020-06-30 International Business Machines Corporation Interactive tool for causal graph construction
US11164678B2 (en) * 2018-03-06 2021-11-02 International Business Machines Corporation Finding precise causal multi-drug-drug interactions for adverse drug reaction analysis
CN110555047B (zh) * 2018-03-29 2024-03-15 日本电气株式会社 数据处理方法和电子设备
CN110322019A (zh) * 2018-03-29 2019-10-11 日本电气株式会社 用于处理数据集的方法、系统和存储介质
US11694800B2 (en) * 2018-05-09 2023-07-04 International Business Machines Corporation Medical diagnosis system with continuous learning and reasoning
US11276494B2 (en) 2018-05-11 2022-03-15 International Business Machines Corporation Predicting interactions between drugs and diseases
CN110827988B (zh) * 2018-08-14 2022-10-21 上海明品医学数据科技有限公司 一种基于移动终端进行医学数据研究的控制方法
WO2020097122A1 (en) * 2018-11-05 2020-05-14 Children's Hospital Medical Center Computation model of learning networks
CN110147878B (zh) * 2018-11-28 2023-01-31 腾讯科技(深圳)有限公司 数据处理方法、装置及设备
CN112233736B (zh) * 2019-01-15 2022-09-16 合肥工业大学 一种知识库的构建方法和系统
WO2020154573A1 (en) 2019-01-25 2020-07-30 Children's Hospital Medical Center Bayesian causal inference models for healthcare treatment using real world patient data
KR102238762B1 (ko) 2019-01-31 2021-04-16 주식회사 이노제닉스 패혈증 진단을 위한 reba 결과 판독 영상인식 시스템 및 이를 이용한 패혈증 진단 방법
WO2020243965A1 (en) * 2019-06-06 2020-12-10 Nec Corporation Causal analysis
US11468994B2 (en) * 2019-06-28 2022-10-11 Cerner Innovation, Inc. Pneumonia readmission prevention
US12100515B2 (en) * 2019-07-11 2024-09-24 International Business Machines Corporation Altering a targeted brain therapeutic based on a brain circuit model
US20220270757A1 (en) * 2019-08-02 2022-08-25 Intellijoint Surgical Inc. Systems and methods to collaborate, to train an expert system and to provide an expert system
US11107555B2 (en) 2019-10-02 2021-08-31 Kpn Innovations, Llc Methods and systems for identifying a causal link
US11645565B2 (en) 2019-11-12 2023-05-09 Optum Services (Ireland) Limited Predictive data analysis with cross-temporal probabilistic updates
KR102272296B1 (ko) * 2019-11-25 2021-07-02 (주)오렌지아이 2차 전지의 성능 평가 지원 장치, 성능 평가 데이터 저장 및 분석 시스템 및 그의 이용 방법
US12106842B2 (en) 2020-01-31 2024-10-01 Direct Supply, Inc. Systems, methods, and media for automated dietary management in healthcare facilities
US11552785B2 (en) * 2020-04-02 2023-01-10 Epidaurus Health, Inc. Methods and systems for a synchronized distributed data structure for federated machine learning
US20230154628A1 (en) * 2020-04-07 2023-05-18 Nippon Telegraph And Telephone Corporation Analysis apparatus, analysis method and program
CN113554449A (zh) * 2020-04-23 2021-10-26 阿里巴巴集团控股有限公司 商品变量预测方法、设备以及计算机可读介质
US11797776B2 (en) * 2020-09-07 2023-10-24 Accenture Global Solutions Limited Utilizing machine learning models and in-domain and out-of-domain data distribution to predict a causality relationship between events expressed in natural language text
US11335443B1 (en) 2020-09-07 2022-05-17 OpenNano Pte. Ltd. Phenotypic patient data derivation from economic data
CN112185583B (zh) * 2020-10-14 2022-05-31 天津之以科技有限公司 一种基于贝叶斯网络的数据挖掘检疫方法
US11763325B2 (en) * 2020-11-13 2023-09-19 Adobe Inc. Automated discovery of causal relationships in mixed datasets
CN112614595A (zh) * 2020-12-25 2021-04-06 联仁健康医疗大数据科技股份有限公司 生存分析模型的构建方法、装置、电子终端及存储介质
US20220246297A1 (en) * 2021-02-01 2022-08-04 Anthem, Inc. Causal Recommender Engine for Chronic Disease Management
CN113436725B (zh) * 2021-06-24 2023-06-23 深圳平安智慧医健科技有限公司 数据处理方法、系统、计算机设备及计算机可读存储介质
CN113221391B (zh) * 2021-07-08 2021-09-07 中国电子科技集团公司第九研究所 用bic准则分析环行器性能指导物料尺寸参数筛选的方法
KR20230027810A (ko) * 2021-08-20 2023-02-28 가톨릭대학교 산학협력단 예후 예측 장치, 방법 및 기록매체
CN114176600B (zh) * 2021-12-28 2023-10-20 上海交通大学 基于因果分析的心电图st段异常判别系统
CN115424741B (zh) * 2022-11-02 2023-03-24 之江实验室 基于因果发现的药物不良反应信号发现方法及系统
KR20240084699A (ko) 2022-12-07 2024-06-14 주식회사 디케이닥터 헬스 디바이스 측정 데이터의 실효성 향상을 위한 사용자 인증 시스템
CN117637184B (zh) * 2023-12-22 2024-06-04 湖北省疾病预防控制中心(湖北省预防医学科学院) 一种纵向数据的贝叶斯敏感性分析方法及系统

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5918200A (en) 1992-08-31 1999-06-29 Yamatake-Honeywell Co., Ltd. State estimating apparatus
WO1997029447A2 (en) 1996-02-09 1997-08-14 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6678669B2 (en) * 1996-02-09 2004-01-13 Adeza Biomedical Corporation Method for selecting medical and biochemical diagnostic tests using neural network-related applications
US6763307B2 (en) 2000-03-06 2004-07-13 Bioseek, Inc. Patient classification
WO2002072871A2 (en) 2001-03-13 2002-09-19 Ashni Naturaceuticals, Inc. Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes
US8000949B2 (en) 2001-06-18 2011-08-16 Genego, Inc. Methods for identification of novel protein drug targets and biomarkers utilizing functional networks
US7393656B2 (en) 2001-07-10 2008-07-01 The Board Of Trustees Of The Leland Stanford Junior University Methods and compositions for risk stratification
US7415359B2 (en) 2001-11-02 2008-08-19 Gene Network Sciences, Inc. Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents
AU2002304965A1 (en) 2002-05-24 2003-12-12 Zensun (Shanghai) Sci-Tech.Ltd Neuregulin based methods and compositions for treating viral myocarditis and dilated cardiomyopathy
AU2003270041A1 (en) 2002-08-29 2004-03-19 Gene Network Sciences, Inc. Systems and methods for inferring biological networks
CA2499513A1 (en) * 2002-09-20 2004-04-01 Board Of Regents, University Of Texas System Computer program products, systems and methods for information discovery and relational analysis
CN1714371A (zh) 2002-11-19 2005-12-28 Gni美国公司 根据时间序列基因表达数据的基因网络的非线性模拟
JP4288345B2 (ja) 2003-06-19 2009-07-01 独立行政法人産業技術総合研究所 新規てんかんモデル動物
EP1512970A1 (en) 2003-09-05 2005-03-09 Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO Method for determining the impact of a multicomponent mixture on the biological profile of a disease
JPWO2005035780A1 (ja) 2003-10-14 2006-12-21 株式会社セルフリーサイエンス 指標物質の新規スクリーニング方法
CA2578670C (en) 2004-04-15 2017-03-07 University Of Florida Research Foundation, Inc. Neural proteins as biomarkers for nervous system injury and other neural disorders
WO2005107412A2 (en) 2004-04-30 2005-11-17 Rosetta Inpharmatics Llc Systems and methods for reconstruction gene networks in segregating populations
EP1607898A3 (en) 2004-05-18 2006-03-29 Neal E. Solomon A bioinformatics system for functional proteomics modelling
GB0419124D0 (en) 2004-08-27 2004-09-29 Proteome Sciences Plc Methods and compositions relating to Alzheimer's disease
US20100316629A1 (en) 2004-09-01 2010-12-16 Shaughnessy Jr John D Use of gene expression profiling to predict survival in cancer patient
CA2587765A1 (en) 2004-11-17 2006-05-26 Immunivest Corporation Magnetic enrichment of circulating cells, fragments and debris for enabling hts proteomics and genomics in disease detection
WO2006079092A2 (en) 2005-01-24 2006-07-27 The Board Of Trustees Of The Leland Stanford Junior University Method for modeling cell signaling systems by means of bayesian networks
EP1866818A1 (en) 2005-03-31 2007-12-19 Koninklijke Philips Electronics N.V. System and method for collecting evidence pertaining to relationships between biomolecules and diseases
US20090132171A1 (en) 2005-05-31 2009-05-21 Jcl Bioassay Corporation Screening Method for Specific Protein in Proteome Comprehensive Analysis
US7906116B2 (en) 2005-09-01 2011-03-15 Parkash Gill Methods for using and identifying modulators of Delta-like 4
WO2007039255A1 (en) 2005-09-30 2007-04-12 Universiteit Maastricht Tumor angiogenesis associated genes and a method for their identification
US20080281170A1 (en) * 2005-11-08 2008-11-13 Koninklijke Philips Electronics N.V. Method for Detecting Critical Trends in Multi-Parameter Patient Monitoring and Clinical Data Using Clustering
EP1840574A1 (en) 2006-03-30 2007-10-03 Institut Pasteur Use of the alpha chain of brain spectrin and fragments thereof, for diagnosing cerebral diseases
US20080046290A1 (en) * 2006-08-21 2008-02-21 Cerner Innovation, Inc. System and method for compiling and displaying discharge instructions for a patient
WO2008060620A2 (en) 2006-11-15 2008-05-22 Gene Network Sciences, Inc. Systems and methods for modeling and analyzing networks
KR20150113216A (ko) * 2006-12-05 2015-10-07 디코드 제네틱스 이에이치에프 심장성 부정맥의 위험 관리를 위한 유전적 마커
CN101105841B (zh) 2007-02-12 2011-06-15 浙江大学 由大规模基因芯片表达谱数据构建基因调控亚网络的方法
US8140270B2 (en) 2007-03-22 2012-03-20 National Center For Genome Resources Methods and systems for medical sequencing analysis
US20090117562A1 (en) 2007-04-09 2009-05-07 Valerie Wailin Hu Method and kit for diagnosing Autism using gene expression profiling
WO2009020684A1 (en) 2007-05-16 2009-02-12 Edsa Micro Corporation Real-time predictive systems for intelligent energy monitoring and management of electrical power networks
JP2009050171A (ja) 2007-08-23 2009-03-12 Toyobo Co Ltd 表面プラズモン共鳴による基板上におけるリン酸化の検出方法
DE102007044380A1 (de) 2007-09-17 2009-03-19 Siemens Ag Verfahren zum rechnergestützten Lernen eines probabilistischen Netzes
US8478544B2 (en) * 2007-11-21 2013-07-02 Cosmosid Inc. Direct identification and measurement of relative populations of microorganisms with direct DNA sequencing and probabilistic methods
US7895146B2 (en) 2007-12-03 2011-02-22 Microsoft Corporation Time modulated generative probabilistic models for automated causal discovery that monitors times of packets
WO2009105718A1 (en) 2008-02-20 2009-08-27 The Children's Hospital Of Philadelphia Genetic alterations associated with autism and the autistic phenotype and methods of use thereof for the diagnosis and treatmemt of autism
US8173369B2 (en) 2008-05-15 2012-05-08 The Regents Of The University Of California Peripheral gene expression biomarkers for autism
US8005770B2 (en) * 2008-06-09 2011-08-23 Microsoft Corporation Parallel generation of a bayesian network
EP2318548B1 (en) 2008-08-15 2013-10-16 Merrimack Pharmaceuticals, Inc. Methods and systems for predicting response of cells to a therapeutic agent
JP5667567B2 (ja) * 2008-08-15 2015-02-12 コーニンクレッカ フィリップス エヌ ヴェ モデルにより強調される画像化
WO2010045463A2 (en) * 2008-10-15 2010-04-22 Government Of The United States As Represented By The Secretary Of The Army Clinical decision model
GB2477705B (en) 2008-11-17 2014-04-23 Veracyte Inc Methods and compositions of molecular profiling for disease diagnostics
WO2010056982A2 (en) 2008-11-17 2010-05-20 The George Washington University Compositions and methods for identifying autism spectrum disorders
WO2010132479A2 (en) 2009-05-11 2010-11-18 Cytotech Labs, Llc Methods for the diagnosis of metabolic disorders using epimetabolic shifters, multidimensional intracellular molecules, or environmental influencers
US20110202486A1 (en) * 2009-07-21 2011-08-18 Glenn Fung Healthcare Information Technology System for Predicting Development of Cardiovascular Conditions
US20110059861A1 (en) 2009-09-08 2011-03-10 Nodality, Inc. Analysis of cell networks
WO2011060314A1 (en) 2009-11-12 2011-05-19 eTenum, LLC Method and system for optimal estimation in medical diagnosis
US20130123124A1 (en) 2010-03-12 2013-05-16 Children's Medical Center Corporation Methods and compositions for characterizing autism spectrum disorder based on gene expression patterns
US20130023574A1 (en) 2010-03-31 2013-01-24 National University Corporation Kumamoto University Method for generating data set for integrated proteomics, integrated proteomics method using data set for integrated proteomics that is generated by the generation method, and method for identifying causative substance using same
US11195213B2 (en) * 2010-09-01 2021-12-07 Apixio, Inc. Method of optimizing patient-related outcomes
MY181093A (en) 2011-03-02 2020-12-17 Berg Llc Interrogatory cell-based assays and uses thereof
SG188320A1 (en) * 2011-08-31 2013-04-30 Apixio Inc Medical information navigation engine (mine) system
CN103107315B (zh) 2011-11-10 2016-03-30 北京有色金属研究总院 一种纳米硅碳复合材料及其制备方法
CN104364393A (zh) 2012-03-05 2015-02-18 博格有限责任公司 用于诊断和治疗广泛性发育障碍的组合物和方法
MX357392B (es) 2012-04-02 2018-07-06 Berg Llc Ensayos basados en interrogatorios celulares y uso de los mismos.
BR112014028801A2 (pt) 2012-05-22 2017-07-25 Berg Llc ensaios com base em célula interrogatória para identificar marcadores de toxicidade induzida por fármaco
CN107111603A (zh) 2014-09-11 2017-08-29 博格有限责任公司 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型

Also Published As

Publication number Publication date
US20200143278A1 (en) 2020-05-07
WO2016040725A1 (en) 2016-03-17
US20240169223A1 (en) 2024-05-23
KR102662004B1 (ko) 2024-04-29
SG10201902151UA (en) 2019-04-29
HK1243509A1 (zh) 2018-07-13
SG11201701963UA (en) 2017-04-27
ZA201701611B (en) 2019-09-25
CA2960837A1 (en) 2016-03-17
AU2020244596B2 (en) 2023-02-23
US10482385B2 (en) 2019-11-19
AU2015314956A1 (en) 2017-04-06
NZ730197A (en) 2022-07-01
EP3191975A4 (en) 2018-04-18
AU2020244596A1 (en) 2020-11-05
US20160171383A1 (en) 2016-06-16
EP3191975A1 (en) 2017-07-19
KR20170058391A (ko) 2017-05-26
JP2017537365A (ja) 2017-12-14
IL250966A0 (en) 2017-04-30
JP6916107B2 (ja) 2021-08-11
IL250966B (en) 2021-07-29
US11734593B2 (en) 2023-08-22
CN107111603A (zh) 2017-08-29

Similar Documents

Publication Publication Date Title
AU2020244596B2 (en) Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data
Shameer et al. Machine learning in cardiovascular medicine: are we there yet?
Galetsi et al. Big data analytics in health sector: Theoretical framework, techniques and prospects
Liao et al. Cluster analysis and its application to healthcare claims data: a study of end-stage renal disease patients who initiated hemodialysis
Barbiero et al. Graph representation forecasting of patient's medical conditions: Toward a digital twin
CN102822834B (zh) 用于预测治疗结果的基于计算机的系统
US11515040B2 (en) Systems and methods for machine learning approaches to management of healthcare populations
US20160098519A1 (en) Systems and methods for scalable unsupervised multisource analysis
Parmar et al. 5G-enabled deep learning-based framework for healthcare mining: State of the art and challenges
Xiang et al. HyMM: hybrid method for disease-gene prediction by integrating multiscale module structure
Martinez et al. Understanding and Predicting Cognitive Improvement of Young Adults in Ischemic Stroke Rehabilitation Therapy
WO2023062600A1 (en) Predicting performance of clinical trial facilitators using patient claims and historical data
CN114078576B (zh) 临床辅助决策方法、装置、设备及介质
Sharma et al. Big data analytics in healthcare
Saravanan et al. Foundation of big data and internet of things: Applications and case study
CN114783587A (zh) 严重急性肾损伤智能预测系统
Landi et al. The evolution of mining electronic health records in the era of deep learning
Chushig-Muzo et al. Interpretable data-driven approach based on feature selection methods and GAN-based models for cardiovascular risk prediction in diabetic patients
US20230386612A1 (en) Determining comparable patients on the basis of ontologies
WO2023239960A1 (en) A clinical decision support tool and method for patients with pulmonary arterial hypertension
US20240120043A1 (en) Optimized classification models based on large patient datasets to improve medical care
Di Camillo et al. The Long Path to Usable AI
Dykstra Integrating Multi-Domain Electronic Health Data, Machine Learning, and Automated Cardiac Phenomics for Personalized Cardiovascular Care
Baumgartner A clinical metabolomics strategy to discover new biomarkers in complex disease: An overview
Bukhari 30-DAYS All-CAUSE PREDICTION MODEL FOR READMISSIONS FOR HEART FAILURE PATIENTS

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination