CN110444289A - 用于诊断检测的识别的途径分析 - Google Patents

用于诊断检测的识别的途径分析 Download PDF

Info

Publication number
CN110444289A
CN110444289A CN201910676787.6A CN201910676787A CN110444289A CN 110444289 A CN110444289 A CN 110444289A CN 201910676787 A CN201910676787 A CN 201910676787A CN 110444289 A CN110444289 A CN 110444289A
Authority
CN
China
Prior art keywords
data
expression
sick cell
multiple different
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910676787.6A
Other languages
English (en)
Inventor
S·C·本茨
S·拉比扎德
C·塞托
P·温加特
陶春林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantomics LLC
Original Assignee
Nantomics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantomics LLC filed Critical Nantomics LLC
Publication of CN110444289A publication Critical patent/CN110444289A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/33Heterocyclic compounds
    • A61K31/395Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins
    • A61K31/495Heterocyclic compounds having nitrogen as a ring hetero atom, e.g. guanethidine or rifamycins having six-membered rings with two or more nitrogen atoms as the only ring heteroatoms, e.g. piperazine or tetrazines
    • A61K31/505Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim
    • A61K31/506Pyrimidines; Hydrogenated pyrimidines, e.g. trimethoprim not condensed and containing further heterocyclic rings
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D401/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom
    • C07D401/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, at least one ring being a six-membered ring with only one nitrogen atom containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D403/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00
    • C07D403/02Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings
    • C07D403/12Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing two hetero rings linked by a chain containing hetero atoms as chain links
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D403/00Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00
    • C07D403/14Heterocyclic compounds containing two or more hetero rings, having nitrogen atoms as the only ring hetero atoms, not provided for by group C07D401/00 containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D413/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms
    • C07D413/14Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and oxygen atoms as the only ring hetero atoms containing three or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D417/00Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00
    • C07D417/14Heterocyclic compounds containing two or more hetero rings, at least one ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for by group C07D415/00 containing three or more hetero rings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients

Abstract

本发明的主题提供了用于诊断检测的识别的途径分析,其中识别了一种诊断检测的设备、系统和方法,该诊断检测用于根据病人的细胞的一个或多个特征确定特定疗法对特定病人是否有效。在利用治疗一个或多个疾病的潜力来开发药物或其它疗法时,该药物对与疾病相关的不同细胞系可能有不同效果。一种机器学习系统被编程为从许多不同可测量细胞特征推断出与不同细胞系对药物或其它形式的疗法的敏感度数据具有期望关联的可测量细胞特征。该机器学习系统被编程为根据关联随后确定为了推荐实施该药物或其它形式的疗法,病人应该呈现的细胞特征阈值水平。

Description

用于诊断检测的识别的途径分析
本申请是申请日为2014年6月30日、申请号为201480037201.7、发明名称为“用于诊断检测的识别的途径分析”的发明专利申请的分案申请。
相关申请的交叉引用
本申请请求2013年6月28日提交的美国专利申请61/840669的优先权。本文讨论的该个及其它外部材料在此通过引用以其整体明确地并入本文。当并入的文献的术语的定义或使用与本文提供的术语的定义不一致或相反时,采用本文提供的该术语的定义,而不采用文献中该术语的定义。
技术领域
本发明的领域是途径分析,更具体地是使用PARADIGM来识别用于利用药物对细胞或病人进行治疗的推定诊断和/或预后指标的途径分析。
背景技术
下述说明包括对于理解本发明的主题可能有用的信息。并不是承认此处提供的任意信息是现有技术或者与请求保护的本发明的主题相关、或者具体或者隐含地参考的任意公开文本是现有技术。
在此指出的所有公开文本通过引用并入,就好像每个单独的公开文本或专利申请被具体并单独地指出通过引用并入。当并入的文献的术语的定义或使用与本文提供的术语的定义不一致或相反时,采用本文提供的该术语的定义,而不采用文献中该术语的定义。
药物开发一般由先导化合物的机械假设或筛查和改良按照基础理论的方式推动。虽然这种假设和/或筛查程序通常对于特定对象和特定药物是有效的,但是药物对于对象相关的组分的性能和/或控制的影响往往未被考虑。例如,激酶抑制剂可能对于一个或多个特定激酶的制剂是明确的,但是抑制剂对与激酶有关的信号转导途径的其它元素或功能的影响通常是未知的。因此,虽然针对作用机理的有效性可能经由激酶特效试验获取,但是这种测试通常不适合作为诊断或预后工具,因为细胞通常呈现出对药物效果的补偿机制。
近年来,各种改进的系统和方法已经被描述用来获取活有机体内途径的生物信息学途径模型,WO 2011/139345和WO 2013/062505中描述了示例的系统和方法。WO 2014/059036(在此统称为“PARADIGM”)中提供了这种模型的进一步改良,其公开了用于协助识别不同途径元素和途径之间的互相关的方法。虽然这种模型提供了例如对各种信号转导途径与经由各种途径的信号流的互联互通的有价值的观点,采用这种建模的大量方面还未被理解或者甚至认识到。
因此,仍需要提供改进的系统和方法来识别和/或开发诊断和预后测试,尤其是针对药物功效。
发明内容
本发明的主题提供了设备、系统和方法,其中识别了一种诊断检测,用于根据病人的细胞的一个或多个特征确定特定疗法对特定病人是否有效。在利用治疗一个或多个疾病的潜力来开发药物或其它疗法时,该药物对与疾病相关的不同细胞系可能有不同效果。例如,一个病变细胞系可能对该药物极其敏感(例如,该药物对于抑制该细胞系的疾病非常有效),而另一病变细胞系可能对该药物非常抵抗(例如,该药物对于抑制该细胞系的疾病非常没有效果。这种敏感度数据和其它形式的测试结果的收集可能对于健康问题、疾患和疾病的诊断和/或治疗非常有用。虽然可以相当容易地收集到与每个细胞系对药物的反应如何(细胞系对药物的敏感度水平)有关的信息(例如,通过将药物引入不同细胞系并测量它们的反应),利用从病人取得的样本细胞来表明其相应的细胞系,因此预期的药物有效性仍然是一种挑战。
因此,在本发明主题的一个方面中,一种机器学习系统被编程为从许多不同可测量细胞特征推断出与不同细胞系对药物或其它形式的疗法的敏感度数据具有期望关联的可测量细胞特征。该机器学习系统被编程为根据关联随后确定为了推荐实施该药物或其它形式的疗法,病人应该呈现的细胞特征阈值水平。
在一些实施例中,机器学习系统信息化地耦接至途径模型数据库。途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个数据集。每个不同数据集包括与不同病变细胞系对应的途径元素数据。机器学习系统被编程为使用途径模型数据库,针对许多可测量细胞特征中的每个细胞特征,根据途径模型数据库中存储的途径元素数据产生基于多个相异的病变细胞系的特征的量级推断表达的数据。
此后,机器学习系统被编程为针对每个细胞表达,参考多个相异的病变细胞系,导出推断的细胞表达的量级与敏感度数据之间的关联。通过比较这些导出的关联,机器学习系统能够识别相对于多个病变细胞系具有与敏感度数据的最期望的(例如,最适配)的关联的单个表达。在本发明主题中考虑,机器学习系统对导出的关联的比较可识别具有与敏感度数据的最期望的关联的表达,其可包括单个特征、特征组合、或特征排布。
在本发明主题的一个观点中,敏感度数据或其它测试结果可基于产生特定结果所需的治疗的量。疗法包括但不限于施用抗肿瘤药物、治疗性和/或预防性药剂、保健药剂和其它化合物,以及放射、训练、禁食、精神疗法和其它用药程式或养生法。测试结果的性质可能显著变化,而且可包括对药物治疗的反应(例如,GI50值,IC50值),全身效应、细胞凋亡的包含、局部效应和细胞效应。
本发明主题设计可测量细胞特征包括酶活性、调节活性、代谢活性、表达活性(包括转译、转录和/或转录后修饰)、信号传导途径和其它各种细胞途径、以及受体、致活酶、调节因子和其它细胞复合物或元素。总体上优选地,细胞特征至少具有假设的或已知的分子靶标。
机器学习系统被编程而推断出的可测量细胞表达可以是单个特征、特征组合、或特征排布。机器学习系统被编程为接收不同细胞系的敏感度数据,允许它将细胞特征的推断量级与每个细胞系关联。可以通过在实验室或其它适当环境中由技术人员或机器执行各种测试或程序来收集敏感度数据。
在另一方面中,发明人设计了一种确定标示物的方法,用于根据相异的病变细胞系的组学数据利用药物治疗疾病。该方法包括步骤:将途径模型数据库信息化地耦接至机器学习系统,其中途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,而且其中每个数据集包括多个途径元素数据。机器学习系统接收与所述多个相异的病变细胞系关联的敏感度数据。敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平,而且可以通过利用药物来测试所述多个相异的病变细胞系的范例病变细胞来产生。
在进一步的步骤中,机器学习系统推断通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的细胞特征(例如,一个复合物或多个复合物)。机器学习系统随后根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
应该注意的是,可以按照各种方式来定义表达。例如,表达至少可由复合物的浓度、多个复合物的组合或两个或更多复合物之间的浓度比定义。
更典型地,从所述多个相异的病变细胞系中存在的可能表达中推断出该表达。在针对所述多个病变细胞系中存在的可能表达中的每个推断该表达时,设计使得数据点可被根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点。机器学习系统随后可参考所述多个相异的病变细胞系来导出针对所述可能表达中的每个表达的量级与敏感度数据之间的关联。因此,应该理解的是,机器学习可被从来从与所述可能表达对应的导出的关联中推断出具有最佳关联的表达。
在不限制本发明主题的情况下,总体上优选地,输出数据被产生为包括针对病人的疗法推荐。可从病人获取样本病变细胞,而且可测量所述样本病变细胞中存在的表达的量级,由此根据测量的表达量级来产生疗法推荐。
就不同观点而言,应该理解的是,所述多个相异的病变细胞系可在对所述药物的敏感度方面彼此不同。例如,所述多个相异的病变细胞系的第一集合对所述药物的治疗敏感,而且其中所述多个相异的病变细胞系的第二集合对所述药物的治疗抵抗。
对于组学数据,所有已知的组学数据被认为合适的,而且优选的组学数据包括基因拷贝数数据、基因突变数据、基因甲基化数据、基因表达数据、RNA剪接信息数据、短片断干扰RNA数据、RNA转录数据和蛋白活性数据。类似地,大量数据格式被认为适合使用,然而,特别优选的数据格式是PARADIGM数据集合。途径元素数据可能显著变化,然而,途径元素数据包括基因的表达状态、蛋白的蛋白水平和/或蛋白的蛋白活性。
从另一个观点来看,发明人设计了一种确定标示物的系统,用于根据相异的病变细胞系的组学数据利用药物治疗疾病。该系统包括:途径模型数据库,用于存储分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,而且每个数据集包括多个途径元素数据。该系统还包括信息化地耦接至途径模型数据库的机器学习系统。机器学习系统并被编程为:(i)接收与所述多个相异的病变细胞系关联的敏感度数据,其中敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平,(ii)通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的表达,以及(iii)根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
如上所述,设计成使得表达是从所述多个相异的病变细胞系中存在的可能表达推断出来的。机器学习系统被编程为针对所述多个病变细胞系中存在的可能表达中的每一个通过下述方式推断表达:(i)根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点,以及(ii)参考所述多个相异的病变细胞系来导出所述一个表达的量级与敏感度数据之间的关联。此外,机器学习系统可被进一步编程为使用机器学习来推断具有与所述可能表达对应的导出的关联中的最佳关联的表达。
从另一个观点来看,发明人设计了一种包含程序指令的非瞬态计算机可读介质,程序指令用于使得包含机器学习系统的计算机系统执行一种方法。机器学习系统息化地耦接至途径模型数据库,途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,而且其中每个数据集包括多个途径元素数据。该方法包括下述步骤:(i)利用机器学习系统接收与所述多个相异的病变细胞系关联的敏感度数据,其中敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平,(ii)利用机器学习系统,通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的表达,以及(iii)利用机器学习系统,根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
最典型地,所述表达是从所述多个相异的病变细胞系中存在的可能表达推断出来的。此外,推断所述表达的步骤包括下述步骤:(i)根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点,以及(ii)利用机器学习系统,参考所述多个相异的病变细胞系来导出所述一个表达的量级与敏感度数据之间的关联。应该理解的是,可针对所述多个病变细胞系中存在的可能表达中的每个执行推断的步骤。机器学习随后可用来推断具有与所述可能表达对应的导出的关联中的最佳关联的表达。
附图说明
图1描绘了一些实施例的示例机器学习系统。
图2描绘了图示出细胞系对特定治疗作出反应的不同敏感度水平的示图。
图3描绘了图示出细胞系的敏感度水平与细胞系中存在的测得的表达的量级之间的关系的示图。
图4描绘了图示出细胞系的敏感度水平与细胞系中存在的另一个测得的表达的量级之间的关系的示图。
图5描绘了图示出细胞系的敏感度水平与细胞系中存在的又一个测得的表达的量级之间的关系的示图。
图6描绘了图示出细胞系的敏感度水平与细胞系中存在的又一个测得的表达的量级之间的关系的示图。
具体实施方式
应该注意的是,涉及计算机的任何语言应该被读成包含计算装置(包括服务器、接口、系统、数据库、代理、对等端、引擎、模块、控制器或其它类型的单独或共同操作的计算装置)的任意适当组合。应该理解的是,计算装置包括配置成执行存储在有形的非暂时性计算机可读存储介质(例如,硬盘驱动器、固态驱动器、RAM,闪存、ROM等)上的软件指令的处理器。软件指令优选地将计算装置配置成提供下文参考所公开的设备讨论的作用、责任或其它功能。在特别优选的实施例中,各种服务器、系统、数据库或接口很可能基于HTTP、HTTPS、AES、公私密钥交换、网络服务API、已知金融交易协议或其它电子信息交换方法,利用标准化协议或算法交换数据。数据交换优选地经由分组交换网络(因特网、LAN、WAN、VPN或其它类型的分组交换网络)进行。
下面的讨论提供了本发明主题的许多示例实施例。虽然每个实施例表示了本发明元素的单个组合,但是本发明主题被认为包括所公开元素的所有可能组合。因此,如果一个实施例包括元素A、B和C,而且第二个实施例包括元素B和D,则本发明主题还被认为包括A、B、C或D的剩余的其它组合,即使未明确公开。
对于此处的使用,除非上下文另有规定,术语"耦接"旨在包括直接耦接(其中两个元素彼此接触地相互耦接)和间接耦接(其中至少一个其它元素处于这两个元素之间)。因此,术语"耦接"和"耦接至"是同义的。
在一些实施例中,表示用于描述并声明本发明主题的具体实施例的组成部分、特性(例如浓度、反应条件等)的数量的数将被理解为在一些情况下以术语“大约”做出修改。由此,在一些实施例中,说明书和所附权利要求中阐述的数值参数是可根据具体实施例想要获取的期望特性而变化的近似值。在一些实施例中,数值参数应该根据报告的有效数的数量通过应用常用的四舍五入技术进行解释。尽管阐述本发明主题的一些实施例的广义范围的数值范围和参数是近似值,具体示例中阐述的数值被报告为尽量精确。本发明主题的一些实施例中表示的数值可包含在它们各自的测试测量中发现的必然会由于标准偏差而导致的具体误差。
对于在说明书和后续权利要求通篇中的使用,“一个”、“一种”和“该”的含义包括复数引用,除非上下文另有规定。而且,对于在说明书中的使用,“在……中”的含义包括“在……中”和“在……上”,除非上下文另有规定。
除非上下文另有规定,此处阐述的所有范围应该被解释为包含它们的端点,而且开端范围应该被解释为仅仅包括商业上可实现的值。此处对值范围的引述仅仅作为针对每个单独值分别推导的速记方法落入该范围内。除非本文另有规定,该范围内的每个单独值被并入说明书,就像其被单独地在本文中引述一样。类似地,值的所有列表应该被看作是包括中间值,除非上下文明确地另有规定。
本文描述的所有方法可以按照任意适当的顺序执行,除非本文另有规定或者上下文明确地另有规定。所有示例的使用或者本文针对特定实施例提供的示范语言(例如“诸如”)旨在仅仅用于更好地说明本发明主题,而不是对请求保护的本发明主题的范围的限制。说明书中所有语言都不应该被理解为表示任意非请求保护的元素对本发明主题的实施很关键。
本文公开的本发明主题的替换元素或实施例的组合不被理解为限制。每个组成员可单独地、或者按照与组的其它成员或本文发现的其它元素任意组合的方式进行参考和请求保护。出于方便性和/或可专利性的原因,组的一个或多个成员可包含在组中或者从组中删除。在发生这种包含或删除时,本文的说明书被认为成包含修改后的组,以满足所附权利要求中使用的所有马库西群组的撰写说明。
本发明的主题提供了其中识别了一种诊断检测的设备、系统和方法,该诊断检测用于根据病人的细胞的一个或多个特征确定特定疗法(例如,药物、药物化合物、治疗方案等)对特定病人是否有效。在利用治疗一个或多个疾病的潜力来开发药物或其它疗法时,该药物对与疾病相关的不同细胞系可能有不同效果。例如,一个病变细胞系可能对该药物极其敏感(例如,该药物对于抑制该细胞系的疾病非常有效),而另一病变细胞系可能对该药物非常抵抗(例如,该药物对于抑制该细胞系的疾病非常没有效果。这种敏感度数据和其它形式的测试结果的收集可能对于健康问题、疾患和疾病的诊断和/或治疗非常有用。虽然可以相当容易地收集到与每个细胞系对药物的反应如何(细胞系对药物的敏感度水平)有关的信息(例如,通过将药物引入不同细胞系并测量它们的反应),利用从病人取得的样本细胞来表明其相应的细胞系,因此预期的药物有效性仍然是一种挑战。
因此,在本发明主题的一个方面中,一种机器学习系统被编程为从细胞系中出现的许多不同可测量细胞特征推断出与不同细胞系对药物或其它形式的疗法的敏感度数据具有期望关联的可测量细胞特征。该机器学习系统被编程为根据关联随后确定为了推荐实施该药物或其它形式的疗法,病人应该呈现的细胞特征阈值水平。
在一些实施例中,机器学习系统息化地耦接至途径模型数据库。在一些实施例中,途径模型数据库包括采用对基因组模型进行数据整合的途径识别算法(PARADIGM)数据库,其在2011年4月29日提交的Charles J.Vaske等人的国际公开文本WO2011/139345以及2011年10月26日提交的Charles J.Vaske等人的国际公开文本WO 2013/062505中有进一步的描述。
途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个数据集。每个不同数据集包括对应于不同病变细胞系的途径元素数据。机器学习系统被编程为根据存储在途径模型数据库中的途径元素数据使用途径模型数据库来针对许多可测量细胞特征的每个细胞表达,产生用于推断多个相异的病变细胞系中的表达的量级的数据。
此后,机器学习系统被编程为针对每个细胞表达,参考多个相异的病变细胞系,导出推断的细胞表达的量级与敏感度数据之间的关联。通过比较这些导出的关联,机器学习系统能够识别相对于多个病变细胞系具有与敏感度数据的最期望的(例如,最适配)的关联的单个表达。在一些实施例中,机器学习系统使用机器学习算法(例如,支持向量机(SVM)等)来识别具有与敏感度数据的最期望的关联的单个表达。Ben-Hur等人的题为“A User’sGuide to Support Vector Machines”的公开文本中描述了SVM机器学习算法的更多细节,其在此通过引用以其整体并入本文。设想单个表达可包括具有与敏感度数据的最期望的关联的单个可测量细胞特征、可测量细胞特征组合、或可测量细胞特征排布。
在本发明主题的一个观点中,敏感度数据或其它测试结果可基于产生特定结果所需的治疗的量。疗法包括但不限于施用抗肿瘤药物、治疗性和/或预防性药剂、保健药剂和其它化合物,以及放射、训练、禁食、精神疗法和其它用药程式或养生法。测试结果的性质可能显著变化,而且可包括对药物治疗的反应(例如,GI50值,IC50值),全身效应、细胞凋亡的包含、局部效应和细胞效应。
本发明主题设计可测量细胞特征包括酶活性、调节活性、代谢活性、表达活性(包括转译、转录和/或转录后修饰)、信号传导途径和其它各种细胞途径、以及受体、致活酶、调节因子和其它细胞复合物或元素。总体上优选地,细胞特征至少具有假设的或已知的分子靶标。在一些实施例中,细胞特征的浓度或其它量化说明被用来证明特征的达标。
机器学习系统被编程而推断出的单个量细胞表达可以是单个特征、特征组合、或特征排布。为了推断单个可测量特征,机器学习系统被编程为首先接收不同细胞系的敏感度数据。可以通过在实验室或其它适当环境中由技术人员或机器执行各种测试或程序来收集敏感度数据。
应该理解的是,公开的技术提供了许多有利的技术效果,包括允许医务人员根据病人的病变细胞系为病人提供定制的疗法。
图1图示了本发明主题的一些实施例的示例机器学习系统100。机器学习系统100包括数据库接口模块110、机器学习管理器120、用户接口模块130、关联模块140和标示物确定模块150。机器学习管理器120被编程为发送命令以及从用户接口模块130、数据库接口模块110、关联模块140和标示物确定模块150接收信息和/或其它数据元素。机器学习管理器120还用作用于在模块110、130、140和150之间传递数据元素的渠道。机器学习管理器120将数据元素数据流从接口模块110和130引导至分析模块140和150,在关联模块140和标示物确定模块150引导,以及最终引导至用户接口模块130以输出给用户终端138。
用户接口模块130息化地耦接至输入装置(例如,计算机终端等)以便从实验室132接收对应于每个被调查细胞系的数据集。在用户接口模块130接收的数据集包括治疗有效性数据136和组学数据134。由实验室132对每个被调查细胞系执行适合于组学数据和治疗有效性数据的各种程序、测试和分析。由此,针对每个被调查细胞系导出治疗有效性数据136和组学数据134。
组学数据包括但不限于与基因组学、脂类组学、蛋白质组学、转录组、代谢体、代谢组学、营养基因组学以及细胞的其它特征和生物功能有关的信息。被调查细胞系可包括来自单个或多个不同组织或解剖区域的细胞、来自单个或多个不同寄主的细胞、以及组合的任意置换。此外,被调查细胞系可以是健康的细胞、不健康的细胞或任意组合。在优选实施例中,被调查细胞系包括肿瘤细胞。
在本发明主题的一些实施例中,评估治疗可能对于治疗多种疾病是有效的。由此,被调查细胞系优选地包括来自多个不同组织和解剖区域的细胞,具有相异的疾病、健康问题或疾患的多个细胞,或者两者的一些组合。
本发明主题设想出,实验室132产生的组学数据134包括足够的信息来评估每个被调查细胞系的各种特征。细胞特征包括酶活性、调节活性、代谢活性、表达活性(包括转译、转录和/或转录后修饰)、信号传导途径和其它各种细胞途径、以及受体、致活酶、调节因子和其它细胞复合物或元素。
在图1所示的实施例中,与评估治疗相关的测试结果包括治疗有效性数据136。治疗有效性数据136表示了治疗对不同相异的细胞系多有效。换言之,治疗有效性数据136(也称为“敏感度数据”)包括表示每个细胞系对特定治疗有多敏感(例如,从极度敏感到极度抵抗的范围)的数据。疗法包括药物治疗,例如施用抗肿瘤药物、治疗性和/或预防性药剂、保健药剂和其它化合物,以及放射、训练、禁食、精神疗法和其它用药程式或养生法。此外,评估治疗可包括施用化合物和/或用药程式的任意合理组合。测试结果的性质可能显著变化,而且可包括对药物治疗的反应(例如,GI50值,IC50值),全身效应、细胞凋亡的包含、局部效应和细胞效应。
存在许多方式来导出和测量针对特定治疗的治疗有效性数据136。例如,有效性数据可通过对每个病变细胞系施用评估治疗来导出,而且可测量评估治疗对每个病变细胞系的效果。测量可基于获取细胞系中的疾病的阈值抑制作用所需的药物量(例如,使得疾病的活性降低一半所需的药物量)。
图2图示了示图200,示出了表示出NANT3456对一系列细胞系有多有效的治疗有效性数据136示例集合的图形表示。2014年5月8日公开的WO/2014/071378(在此通过引用并入本文)中更详细地描述了NANT3456。在一些实施例中,图2上的数据点表示了来自不同组织的相异的细胞系、来自相同组织的相异的细胞系、或者它们的任意组合。而且,细胞系可从单个寄主、多个相异的寄主或者它们的任意组合导出。在该示例中,已知NANT3456能够治疗与一系列细胞系(例如,细胞系MV411,TT,AN3CA,K562,PC3,HCT116,ASPC1,MDAMB231,TF1,NCIH23,MIAPACA2,HS766T,CAPAN2,A549,HT29,U937,BXPC3,CAPAN1和SU8686)有关的疾病。示图200中的各种实线圈数据点260和265表示了上述各种细胞系。例如,数据点225可表示细胞系MV411,数据点230可表示细胞系TT,数据点235可表示细胞系PC3,数据点240可表示NCIH23,数据点245可表示细胞系HT29,数据点250可表示细胞系CAPAN1,诸如此类。
示图200的仅有轴线(轴线205)表示了可能的治疗有效性值(例如,从-4至6)的范围。在该示例中,治疗有效性值被表达为针对药物/治疗的以底数位10的对数值(log10)为单位的GI50值的摩尔药物浓度(例如,药物实现阈值有效性的浓度量)。因此,治疗有效性值-4(示图200的很左边)表明该药物对治疗及其敏感,治疗有效性值6(示图200的很右边)表明该药物对治疗及其抵抗。因此,如示图200所示,细胞系225、230和235比细胞系240、245和250对NANT3456更敏感。
一旦接收治疗有效性数据136和组学数据134,用户接口模块130被编程为将这些数据集传递给机器学习管理器120。机器学习管理器随后发送治疗有效性数据136和组学数据134至关联模块140以产生关联。在一些实施例中,一旦接收治疗有效性数据136,关联模块140首先根据治疗有效性数据136将细胞系划分(分类)成两个组(敏感细胞系和抵抗细胞系)。
在这些实施例中的一些中,关联模块140可通过识别阈值有效性值来划分该系列细胞系,由此处于阈值有效性值下方的细胞系(比阈值有效性值更敏感或有效)被认为是敏感细胞系,处于阈值有效性值上方的细胞系(比阈值有效性值更不敏感或有效)被认为是抵抗细胞系。阈值有效性值可被产生为取该治疗有效性数据集合136中的所有治疗有效性值的中值。例如,关联模块140可产生阈值有效性值1.7(如示图200的虚线220所示)。因此,数据点组260代表的细胞系(如黑色圆圈数据点所示,包括细胞系225、230和235)被认为是敏感细胞系,数据点组265代表的细胞系(如白色圆圈数据点所示,包括细胞系240、245和250)被认为是抵抗细胞系。在一些实施例中,将细胞系划分为敏感和抵抗组,使得各种机器学习算法能够推断组学数据134和治疗有效性数据136之间的关联。与推断关联有关的细节将在下文予以进一步解释。
回到图1,机器学习系统100的数据库接口模块110信息化地耦接至途径模型数据库160以便将数据集从途径模型数据库160传递至机器学习系统100。在一些实施例中,途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个数据集。每个不同数据集包括对应于不同病变细胞系的途径元素数据。在一些实施例中,举例来说,途径模型数据库包括采用对基因组模型进行数据整合的途径识别算法(PARADIGM)数据库,其在2011年4月29日提交的Charles J.Vaske等人的国际公开文本WO2011/139345以及2011年10月26日提交的Charles J.Vaske等人的国际公开文本WO 2013/062505中有进一步的描述。
在一些实施例中,数据集在途径模型数据库160和接口模块110之间被发送和接收,由此允许新数据被接口模块110添加至途径模型数据库160。
机器学习系统100的关联模块140被编程为分析并评估来自药物有效性数据136和组学数据134的数据集与来自途径模块数据库160的数据集之间的关联。这种数据集在数据集142被描绘为示例。在一些实施例中,关联模块140被编程为评估一些或所有被调查细胞系的药物有效性和细胞系中存在的所有可能表达之间的关联。为了这么做,关联模块140首先识别病变细胞系中能够找到的所有可能表达。所述可能表达可包括病变细胞系中存在的每个单个特征以及特征的组合的所有可能排列。例如,如果在病变细胞系中找到特征A、B和C,所述可能表达可包括特征A、特征B、特征C、特征A和B的组合、特征A和C的组合、特征B和C的组合、以及特征AB和C的组合。
对于每个病变细胞系,关联模块140遍历途径模型数据库160中的途径元素数据以便推断不同可能表达的量级。为了执行这个推断步骤,一些实施例的关联模块140针对每个细胞系获取组学数据134(经由用户接口模块130接收的),根据组学数据134遍历途径模型数据库160内的途径元素数据,而且记录来自途径元素数据中存在的表达的活性。在一些实施例中,利用诸如签名提到的PARADIGM之类的计算机系统来执行量级的推断。随后,针对识别的所有所述可能表达中的每个表达,关联模块140导出细胞系的表达量级与细胞系治疗有效性数据之间的关联。图3–6图示了不同示图(示图300、400、500和600),它们表示了不同表达与关联模块140采用来自途径模型数据库160的表达数据产生的治疗有效性数据之间的关联。
例如,图3描绘了示图300,其示出了表达(复合物A的浓度)与治疗有效性数据136之间的关联。轴线305类似于示图200的轴线205,其代表了治疗有效性值(被表达为针对药物NANT3456的以底数位10的对数值为单位的GI50值的摩尔药物浓度)。轴线310代表了表达的量级,而且在该示例中,表达的量级:复合物A的浓度,从低量级(在轴线310的底部)到高量级(在轴线310的顶部)。以表达的标准浓度的分数来表达沿轴线310的值。类似于示图200,示图300中的每个数据点代表了不同细胞系。例如,数据点225可表示细胞系MV411,数据点230可表示细胞系TT,数据点235可表示细胞系PC3,数据点240可表示NCIH23,数据点245可表示细胞系HT29,数据点250可表示细胞系CAPAN1,诸如此类。
类似地,图4描绘了示图400,其示出了不同表达(复合物B的浓度)与治疗有效性数据136之间的关联;图5描绘了示图500,其示出了不同表达(复合物A和B的浓度)与治疗有效性数据136之间的关联;图6描绘了示图500,其示出了另一表达(复合物C的浓度)与治疗有效性数据136之间的关联。如图3至6所示,不同表达与药物NANT 3456的治疗有效性之间的关联可能不同。在一些实施例中,关联模块140发送所有这些关联数据给标示物确定模块150用于进一步分析。虽然此处示出了针对仅仅四个不同表达的关联,但是设想的是关联模块140可产生针对所有可能表达的更多的关联示图(不同复合物,复合物等的浓度的所有排列)。
如上所述,标示物确定模块150被编程为根据从关联模块140接收到的关联数据从所有所述可能表达中选择具有最期望的(例如,最适配)关联的表达,而且确定为了推荐施用药物/疗法而病人应该呈现的阈值表达量级值。在一些实施例中,确定模块150首先针对关联模块140产生的所有关联找到对敏感细胞系(来自图2的组260)和抵抗细胞系(来自图2的组265)进行最佳划分的阈值表达量级值,而且根据阈值表达量级值有多好地划分细胞系的两个组将置信度分配给该关联。例如,如果存在一个量级值,该值可以在该值任意一侧适当地划分细胞系的两个组(例如,所有敏感细胞系具有该值以上的表达量级,所有抵抗细胞系具有该值以下的表达量级,或者反过来),则标示物确定模块150选择该值作为阈值表达值。如果存在可以在该值任意一侧适当地划分细胞系的两个组的一个量级值范围(例如,所有敏感细胞系具有该值以上的表达量级,所有抵抗细胞系具有该值以下的表达量级,或者反过来),则标示物确定模块150选择这些值中的任意一个(例如,中值)。由于该阈值表达量级值在上述场景中可以完全划分细胞系的两个组,标示物确定模块150可针对每个上述关联分配100%的置信度。
另一方面,如果不存在这种量级,标示物确定模块150选择尽量划分最大数量的细胞系的量级值(例如,其相对于阈值量级值使得很少细胞系出现在示图的错误的一侧)。在这些场景中,标示物确定模块150使得置信度降低出现在示图的错误的一侧的细胞系的百分比。
通过将上述步骤施加至关联示图300,标示物确定模块150将选择量级值-0.18(如阈值315所示)作为阈值值,因为其使得最少数量的细胞系出现在示图的“错误”的一侧。如图3所示,总共二十四(24)数据点中的三个黑色数据点(来自组260)和八个白色数据点(来自组265)在阈值值的错误的一侧。由此,通过使用具有该阈值值的复合物,存在假阳性的风险(例如,在病人是敏感性的时,基于复合物的阈值值可能表示病人是抵抗性的)。因此,标示物确定模块150分配置信度13/24(54%)。注意,即使一些表达具有与治疗有效性数据的正比关系。然而,一些其它表达,例如图3所示的表达(复合物A的浓度),可具有与治疗有效性数据的相反关系。即,细胞中发现的复合物A的更小浓度意味着来自NANT3456的治疗的更有效的结果。在该实施例中,标示物确定模块150还识别由于测量病人的样本细胞中的表达的浓度的误差速率而导致的针对表达(例如,复合物A)的浓度的最小的诊断上的相关值。
类似地,对于示图400,标示物确定模块150选择阈值量级值-0.25,如图4的阈值415所示,而且分配置信度20/24(83%)。示图400所示的关联示出了表达和治疗有效性值之间的比例关系。对于示图500,标示物确定模块150选择阈值量级值-0.16,如图5的阈值515所示,而且分配置信度20/24(83%)。示图500所示的关联示出了表达和治疗有效性值之间的相反关系。对于示图600,标示物确定模块150选择阈值量级值-0.29,如图6的阈值615所示,而且分配置信度24/24(100%)。示图600所示的关联示出了表达和治疗有效性值之间的比例关系。
根据不同关联示图的置信度,标示物确定模块150确定针对示图600的表达(复合物C的浓度)具有与治疗有效性数据的最期望的关联,因为它具有最高(100%)置信度。针对示图600的阈值量级值(复合物C的浓度-0.29)也被用作诊断检测的一部分,由于确定药物NANT3456是否适合于病人。在一些实施例中,机器学习系统100还呈现(显示)诊断检测(包括最期望的关联示图,例如该示例中的示图600以及阈值表达量级)给用户(经由诸如用户终端138之类的输出显示装置)。
对于具有药物NANT3456设计治疗的多种疾病中的一种疾病的任意病人,可以从病人获取样本病变细胞而且获取复合物C的量级值(例如,测量样本病变细胞中的复合物C的浓度)。根据诊断检测,样本细胞的复合物C浓度高于-0.29(作为标准浓度的分数)的病人被推荐使用该疗法(例如,服用药物NANT3456)而且样本细胞的复合物C浓度低于标准浓度-0.29的病人被推荐不使用该疗法(例如,服用药物NANT3456)。
对于本领域技术人员来说显然的是,在不脱离本文的本发明构思的范围的情况下,可以做出除已经描述的修改之外的许多其它修改。因此,除了所附权利要求的精神之外,本发明主题未受限制。而且,在解释说明书和权利要求时,应该按照与上下文一致的最广的可能方式来解释所有术语。具体地,术语“包括”和“包含”应该被解释为以非排他性的方式引述元素、组件或步骤,表明引述的元素、组件或步骤可存在或被采用,或者与未明确引述的其它元素、组件或步骤组合。在说明书声明指的是选自由A、B、C…和N组成的组的至少一个某物,文本应该被解释为仅仅要求该组中的一个元素,而不是A加N、或者B加N等。

Claims (23)

1.一种确定标示物的方法,用于根据相异的病变细胞系的组学数据利用药物治疗疾病,包括:
将途径模型数据库信息化地耦接至机器学习系统,其中途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,而且其中每个数据集包括多个途径元素数据;
利用机器学习系统接收与所述多个相异的病变细胞系关联的敏感度数据,其中敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平;
利用机器学习系统,通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的表达;以及
利用机器学习系统,根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
2.根据权利要求1所述的方法,其中所述表达是从所述多个相异的病变细胞系中存在的可能表达推断出来的。
3.根据权利要求1或2所述的方法,其中推断所述表达包括针对所述多个病变细胞系中存在的可能表达中的每一个:
根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点;以及
利用机器学习系统,参考所述多个相异的病变细胞系来导出所述一个表达的量级与敏感度数据之间的关联。
4.根据权利要求3所述的方法,进一步包括使用机器学习来推断具有与所述可能表达对应的导出的关联中的最佳关联的表达。
5.根据权利要求1或2所述的方法,进一步包括通过利用所述药物测试所述多个相异的病变细胞系的范例病变细胞来产生敏感度数据。
6.根据权利要求1或2所述的方法,其中表达至少由复合物的浓度定义。
7.根据权利要求1或2所述的方法,其中表达至少由多个复合物的组合的浓度定义。
8.根据权利要求1或2所述的方法,其中表达至少由两个或更多复合物之间的浓度比定义。
9.根据权利要求1或2所述的方法,进一步包括产生输出数据,该输出数据包括针对病人的疗法推荐。
10.根据权利要求9所述的方法,进一步包括:
从病人获取样本病变细胞;以及
测量所述样本病变细胞中存在的表达的量级,其中根据测得的表达量级产生疗法推荐。
11.根据权利要求1或2所述的方法,其中所述多个相异的病变细胞系在对所述药物的敏感度方面彼此不同。
12.根据权利要求1或2所述的方法,其中所述多个相异的病变细胞系的第一集合对所述药物的治疗敏感,而且其中所述多个相异的病变细胞系的第二集合对所述药物的治疗抵抗。
13.根据权利要求1或2所述的方法,其中组学数据选自由基因拷贝数数据、基因突变数据、基因甲基化数据、基因表达数据、RNA剪接信息数据、短片断干扰RNA数据、RNA转录数据和蛋白活性数据组成的组。
14.根据权利要求1或2所述的方法,其中相异的数据集是PARADIGM数据集合。
15.根据权利要求1或2所述的方法,其中途径元素数据是基因的表达状态、蛋白的蛋白水平和/或蛋白的蛋白活性。
16.一种用于确定标示物的系统,用于根据相异的病变细胞系的组学数据利用药物治疗疾病,包括:
途径模型数据库,其存储了分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,其中每个数据集包括多个途径元素数据;以及
机器学习系统,其信息化地耦接至途径模型数据库并被编程为:
接收与所述多个相异的病变细胞系关联的敏感度数据,其中敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平,
通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的表达,以及
根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
17.根据权利要求16所述的系统,其中表达是从所述多个相异的病变细胞系中存在的可能表达推断出来的。
18.根据权利要求16或17所述的系统,其中机器学习系统被编程为针对所述多个病变细胞系中存在的可能表达中的每一个通过下述方式推断表达:
根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点;以及
参考所述多个相异的病变细胞系来导出所述一个表达的量级与敏感度数据之间的关联。
19.根据权利要求18所述的系统,其中机器学习系统被进一步编程为使用机器学习来推断具有与所述可能表达对应的导出的关联中的最佳关联的表达。
20.一种包含程序指令的非瞬态计算机可读介质,程序指令用于使得包含机器学习系统的计算机系统执行以下方法,其中机器学习系统息化地耦接至途径模型数据库,途径模型数据库存储了分别从多个相异的病变细胞系的组学数据导出的多个相异的数据集,而且其中每个数据集包括多个途径元素数据,其中所述方法包括下述步骤:
利用机器学习系统接收与所述多个相异的病变细胞系关联的敏感度数据,其中敏感度数据表示了所述多个相异的病变细胞系中的每一个对所述药物作出反应的敏感度水平;
利用机器学习系统,通过遍历途径模型数据库中的与所述多个相异的病变细胞系对应的多个途径元素数据,参考所述多个相异的病变细胞系来推断与敏感度数据具有关联的表达;以及
利用机器学习系统,根据所述关联来确定病人表现出的阈值表达水平,用于推荐所述药物来治疗所述疾病。
21.根据权利要求20所述的非瞬态计算机可读介质,其中所述表达是从所述多个相异的病变细胞系中存在的可能表达推断出来的。
22.根据权利要求20或21所述的非瞬态计算机可读介质,其中推断所述表达的步骤包括针对所述多个病变细胞系中存在的可能表达中的每一个执行下述步骤:
根据所述多个途径元素数据,产生表示所述多个相异的病变细胞系中存在的一个表达的量级的数据点;以及
利用机器学习系统,参考所述多个相异的病变细胞系来导出所述一个表达的量级与敏感度数据之间的关联。
23.根据权利要求22所述的非瞬态计算机可读介质,进一步包括使用机器学习来推断具有与所述可能表达对应的导出的关联中的最佳关联的表达的步骤。
CN201910676787.6A 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析 Withdrawn CN110444289A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361840669P 2013-06-28 2013-06-28
US61/840,669 2013-06-28
CN201480037201.7A CN105706097A (zh) 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201480037201.7A Division CN105706097A (zh) 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析

Publications (1)

Publication Number Publication Date
CN110444289A true CN110444289A (zh) 2019-11-12

Family

ID=52116630

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480037201.7A Pending CN105706097A (zh) 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析
CN201910676787.6A Withdrawn CN110444289A (zh) 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480037201.7A Pending CN105706097A (zh) 2013-06-28 2014-06-30 用于诊断检测的识别的途径分析

Country Status (8)

Country Link
US (1) US11011273B2 (zh)
EP (1) EP3014505A4 (zh)
JP (3) JP6054555B2 (zh)
KR (1) KR20160084363A (zh)
CN (2) CN105706097A (zh)
AU (3) AU2014302070B2 (zh)
CA (1) CA2919768C (zh)
WO (1) WO2014210611A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11011273B2 (en) 2013-06-28 2021-05-18 Nantomics, Llc Pathway analysis for identification of diagnostic tests

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9458137B2 (en) * 2012-11-05 2016-10-04 Nantbioscience, Inc. Substituted indol-5-ol derivatives and their therapeutical applications
EP2968332A4 (en) 2013-03-15 2016-08-03 Nantbioscience Inc SUBSTITUTED INDOL-5-OL DERIVATIVES AND THEIR THERAPEUTIC APPLICATIONS
TW201803598A (zh) 2016-06-30 2018-02-01 南特細胞公司 Nant癌症疫苗
US11823773B2 (en) 2018-04-13 2023-11-21 Nant Holdings Ip, Llc Nant cancer vaccine strategies
US11564980B2 (en) 2018-04-23 2023-01-31 Nantcell, Inc. Tumor treatment method with an individualized peptide vaccine
TWI787500B (zh) 2018-04-23 2022-12-21 美商南特細胞公司 新抗原表位疫苗及免疫刺激組合物及方法
US11915832B2 (en) 2018-12-24 2024-02-27 Medirita Apparatus and method for processing multi-omics data for discovering new drug candidate substance
US11721441B2 (en) * 2019-01-15 2023-08-08 Merative Us L.P. Determining drug effectiveness ranking for a patient using machine learning
KR20210096402A (ko) * 2020-01-28 2021-08-05 (주)인테그로메디랩 증례 데이터 기반 천연물 추천 장치 및 방법
JP6810294B1 (ja) * 2020-06-30 2021-01-06 凸版印刷株式会社 評価システム、学習装置、予測装置、評価方法、及びプログラム
WO2022196971A1 (ko) * 2021-03-18 2022-09-22 주식회사 온코크로스 세포 레벨의 정보로부터 조직 레벨의 정보를 추정하는 방법 및 그 장치

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6054555B2 (ja) 1979-04-19 1985-11-30 株式会社 テイエルブイ バケットフロ−ト形スチ−ムトラップ
US6983227B1 (en) * 1995-01-17 2006-01-03 Intertech Ventures, Ltd. Virtual models of complex systems
US6925389B2 (en) * 2000-07-18 2005-08-02 Correlogic Systems, Inc., Process for discriminating between biological states based on hidden patterns from biological data
WO2002019602A2 (en) 2000-09-01 2002-03-07 Fred Hutchinson Cancer Research Center Statistical modeling to analyze large data arrays
US20030130798A1 (en) * 2000-11-14 2003-07-10 The Institute For Systems Biology Multiparameter integration methods for the analysis of biological networks
US6602670B2 (en) 2000-12-01 2003-08-05 Response Genetics, Inc. Method of determining a chemotherapeutic regimen based on ERCC1 expression
AR031457A1 (es) 2000-12-01 2003-09-24 Response Genetics Inc Metodo para determinar un regimen terapeutico mediante el analisis de la expresion genica en tumores primarios
CA2430142A1 (en) 2000-12-07 2002-06-13 Phase It Intelligent Solutions Ag Expert system for classification and prediction of genetic diseases
WO2002072871A2 (en) * 2001-03-13 2002-09-19 Ashni Naturaceuticals, Inc. Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes
US7514209B2 (en) 2001-06-18 2009-04-07 Rosetta Inpharmatics Llc Diagnosis and prognosis of breast cancer patients
US7308363B2 (en) 2002-01-23 2007-12-11 Sri International Modeling and evaluation metabolic reaction pathways and culturing cells
US20040088116A1 (en) * 2002-11-04 2004-05-06 Gene Network Sciences, Inc. Methods and systems for creating and using comprehensive and data-driven simulations of biological systems for pharmacological and industrial applications
CA2527285A1 (en) * 2003-05-28 2004-12-23 Genomic Health, Inc. Gene expression markers for predicting response to chemotherapy
AU2004296023A1 (en) * 2003-11-26 2005-06-16 Genstruct, Inc. System, method and apparatus for causal implication analysis in biological networks
WO2006110264A2 (en) * 2005-03-16 2006-10-19 Sidney Kimmel Cancer Center Methods and compositions for predicting death from cancer and prostate cancer survival using gene expression signatures
US20080275652A1 (en) * 2005-05-13 2008-11-06 Universite Libre De Bruxelles Gene-based algorithmic cancer prognosis
US20070172844A1 (en) * 2005-09-28 2007-07-26 University Of South Florida Individualized cancer treatments
US8768629B2 (en) * 2009-02-11 2014-07-01 Caris Mpi, Inc. Molecular profiling of tumors
WO2009029712A1 (en) * 2007-08-29 2009-03-05 Genstruct, Inc. Computer-aided discovery of biomarker profiles in complex biological systems
CA2700978A1 (en) * 2007-09-28 2009-04-02 Duke University Individualized cancer treatments
WO2009102957A2 (en) 2008-02-14 2009-08-20 The Johns Hopkins University Methods to connect gene set expression profiles to drug sensitivity
WO2010040233A1 (en) * 2008-10-10 2010-04-15 Mount Sinai Hospital Methods for classifying samples based on network modularity
JP2010165230A (ja) * 2009-01-16 2010-07-29 Pharma Design Inc 薬剤標的となるタンパク質−タンパク質相互作用を予測する方法及び予測システム
CA3007713C (en) * 2010-04-29 2020-05-26 The Regents Of The University Of California Pathway recognition algorithm using data integration on genomic models (paradigm)
US10192641B2 (en) * 2010-04-29 2019-01-29 The Regents Of The University Of California Method of generating a dynamic pathway map
US8756182B2 (en) * 2010-06-01 2014-06-17 Selventa, Inc. Method for quantifying amplitude of a response of a biological network
US9234210B2 (en) * 2010-08-25 2016-01-12 Intrexon Ceu, Inc. Selectable markers and related methods
EP2549399A1 (en) * 2011-07-19 2013-01-23 Koninklijke Philips Electronics N.V. Assessment of Wnt pathway activity using probabilistic modeling of target gene expression
US20130144584A1 (en) 2011-12-03 2013-06-06 Medeolinx, LLC Network modeling for drug toxicity prediction
CN114530203A (zh) 2012-04-02 2022-05-24 皇家飞利浦有限公司 用于临床决策支持的途径可视化
CA2888125A1 (en) 2012-10-09 2014-04-17 Five3 Genomics, Llc Systems and methods for learning and identification of regulatory interactions in biological pathways
US9458137B2 (en) * 2012-11-05 2016-10-04 Nantbioscience, Inc. Substituted indol-5-ol derivatives and their therapeutical applications
CA2920608C (en) 2013-05-28 2018-07-24 Five3 Genomics, Llc Paradigm drug response networks
EP3014505A4 (en) 2013-06-28 2017-03-08 Nantomics, LLC Pathway analysis for identification of diagnostic tests

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11011273B2 (en) 2013-06-28 2021-05-18 Nantomics, Llc Pathway analysis for identification of diagnostic tests

Also Published As

Publication number Publication date
US20150006445A1 (en) 2015-01-01
JP6677773B2 (ja) 2020-04-08
AU2018282245A1 (en) 2019-01-17
AU2016273897B2 (en) 2019-01-17
CN105706097A (zh) 2016-06-22
JP2016528565A (ja) 2016-09-15
JP2017097884A (ja) 2017-06-01
WO2014210611A1 (en) 2014-12-31
AU2014302070A1 (en) 2016-02-18
AU2014302070B2 (en) 2016-09-15
CA2919768C (en) 2019-12-03
JP6054555B2 (ja) 2016-12-27
CA2919768A1 (en) 2014-12-31
JP6388901B2 (ja) 2018-09-12
AU2016273897A1 (en) 2017-01-12
JP2019023871A (ja) 2019-02-14
US11011273B2 (en) 2021-05-18
EP3014505A1 (en) 2016-05-04
EP3014505A4 (en) 2017-03-08
KR20160084363A (ko) 2016-07-13

Similar Documents

Publication Publication Date Title
CN110444289A (zh) 用于诊断检测的识别的途径分析
Galeano et al. Predicting the frequencies of drug side effects
US10282588B2 (en) Image-based tumor phenotyping with machine learning from synthetic data
US20150142465A1 (en) Pathway recognition algorithm using data integration on genomic models (paradigm)
Doyle et al. Predicting progression of Alzheimer’s disease using ordinal regression
Afshar et al. DRTOP: deep learning-based radiomics for the time-to-event outcome prediction in lung cancer
Morris et al. Systematic analysis of quantitative logic model ensembles predicts drug combination effects on cell signaling networks
KR102316989B1 (ko) 신약 후보 물질의 발굴 시스템 및 그 방법
Lin et al. Functional survival forests for multivariate longitudinal outcomes: Dynamic prediction of Alzheimer’s disease progression
Hua et al. Equivalence of kernel machine regression and kernel distance covariance for multidimensional phenotype association studies
Okonechnikov et al. InTAD: chromosome conformation guided analysis of enhancer target genes
Duffy et al. Confounders mediate AI prediction of demographics in medical imaging
Dominietto et al. Integrative analysis of cancer imaging readouts by networks
Kumar et al. Feature Selection for high Dimensional DNA Microarray data using hybrid approaches
Sukhadia et al. ImaGene: A web-based software platform for tumor radiogenomic evaluation and reporting
Feng et al. Deep multiview learning to identify imaging-driven subtypes in mild cognitive impairment
Pham et al. Artificial intelligence fusion for predicting survival of rectal cancer patients using immunohistochemical expression of Ras homolog family member B in biopsy
Ghosh On assessing surrogacy in a single trial setting using a semicompeting risks paradigm
Kim et al. Semiparametric transformation models for multiple continuous biomarkers in ROC analysis
Tang et al. Nonparametric ROC summary statistics for correlated diagnostic marker data
CN103718181A (zh) 指示表型的组合标签的跨模态应用
Singleton et al. Comparing predictive models of glioblastoma multiforme built using multi-institutional and local data sources
Hua et al. Equivalence of kernel machine regression and kernel distance covariance for multidimensional trait association studies
Wang et al. Missing-value imputation and in-silico region detection for spatially resolved transcriptomics
Mao et al. Knowledge-Informed Machine Learning for Cancer Diagnosis and Prognosis: A review

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20191112