CN113692624A - 用于确定受试者的妊娠相关状态的方法和系统 - Google Patents

用于确定受试者的妊娠相关状态的方法和系统 Download PDF

Info

Publication number
CN113692624A
CN113692624A CN202080028640.7A CN202080028640A CN113692624A CN 113692624 A CN113692624 A CN 113692624A CN 202080028640 A CN202080028640 A CN 202080028640A CN 113692624 A CN113692624 A CN 113692624A
Authority
CN
China
Prior art keywords
subject
pregnancy
weeks
cell
sensitivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080028640.7A
Other languages
English (en)
Inventor
马尼什·简恩
欧金尼·纳姆萨拉伊夫
莫滕·拉斯穆森
琼·卡穆纳斯·索莱尔
法鲁克·西迪基
米特苏·雷迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Milvey Co
Original Assignee
Milvey Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Milvey Co filed Critical Milvey Co
Publication of CN113692624A publication Critical patent/CN113692624A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Primary Health Care (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Bioethics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Medicinal Chemistry (AREA)

Abstract

本申请提供了针对妊娠相关状态的无细胞鉴定和/或监测的方法和系统。用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的方法可以包括测定源自所述受试者的无细胞生物样品以检测生物标志物组,并且使用经训练的算法分析生物标志物组以确定妊娠相关状态的存在或敏感性。

Description

用于确定受试者的妊娠相关状态的方法和系统
交叉引用
本申请要求于2019年2月14日提交的美国专利申请号62/805,515、于2019年8月22日提交的美国专利申请号62/890,248和于2019年10月28日提交的美国专利申请号62/926,786的权益,其各自通过引用以其全文并入本文。
背景技术
每年,全球报告有约1500万例早产。早产可影响多达约10%的妊娠,其中大多数是自然早产。目前,可能尚无有意义的、临床上可操作的可用于许多妊娠相关的并发症,例如早产的诊断筛查或检验。然而,妊娠相关的并发症(例如早产)是新生儿死亡和晚年并发症的主要原因。此外,此类妊娠相关的并发症可对母体健康造成负面影响。因此,为了使妊娠尽可能安全,需要快速、准确的方法以鉴定和监测妊娠相关状态,这些方法是非侵入性且具有成本效益的,以改善母体和胎儿的健康。
发明内容
本申请提供了通过处理获自或源自受试者的无细胞生物样品以鉴定或监测妊娠相关状态的方法、系统和试剂盒。可以对获自受试者的无细胞生物样品(例如,血浆样品)进行分析以鉴定妊娠相关状态(可以包括,例如,测量妊娠相关状态的存在、不存在或相对评估)。此类受试者可以包括具有一种或多种妊娠相关状态的受试者和没有妊娠相关状态的受试者。妊娠相关状态可以包括,例如,早产、足月产、胎龄、预产期(例如,受试者的未出生婴儿或胎儿的预产期)、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,胎儿器官功能或发育正常,和胎儿器官功能或发育异常)。
一方面,本申请提供了一种用于鉴定受试者的妊娠相关状态的存在(presence)或敏感性(susceptibility)的方法,包括测定源自受试者的无细胞生物样品中的转录物和/或代谢物以检测生物标志物组,并且使用经训练的算法分析生物标志物组以确定妊娠相关状态的存在或敏感性。在一些实施方案中,所述方法包括测定源自受试者的无细胞生物样品中的转录物以检测生物标志物组。在一些实施方案中,转录物使用核酸测序进行测定。在一些实施方案中,所述方法包括测定源自受试者的无细胞生物样品中的代谢物以检测生物标志物组。在一些实施方案中,代谢物使用代谢组学测定进行测定。
另一方面,本申请提供了一种用于鉴定受试者妊娠相关状态的存在或敏感性的方法,包括测定源自受试者的无细胞生物样品以检测生物标志物组,并且使用经训练的算法分析生物标志物组以至少约80%的准确度确定在至少三个不同妊娠相关状态的组中的该妊娠相关状态的存在或敏感性。在一些实施方案中,妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,胎儿器官功能或发育正常,和胎儿器官功能或发育异常)。在一些实施方案中,妊娠相关状态是早产的亚型,并且至少三种不同妊娠相关状态包括早产的至少两种不同的亚型。在一些实施方案中,早产的亚型是早产的分子亚型,并且早产的至少两种不同的亚型包括早产的至少两种不同的分子亚型。在一些实施方案中,早产的不同分子亚型包括选自由既往早产史、自然早产、种族特异性早产风险(例如,在非裔美国人人群中)和早产胎膜早破(PPROM)组成的组。在一些实施方案中,所述方法进一步包括至少部分基于妊娠相关状态的存在或敏感性以鉴定对受试者的临床干预。在一些实施方案中,临床干预选自多种临床干预。在一些实施方案中,生物标志物组包括与预产期相关的基因位点,其中该基因位点选自由表1和表7中列出的基因组成的组。在一些实施方案中,生物标志物组包括与胎龄相关的基因位点,其中该基因位点选自由表2中列出的基因组成的组。在一些实施方案中,生物标志物组包括与早产相关的基因位点,其中该基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。在一些实施方案中,生物标志物组包括至少5个不同的基因位点。在一些实施方案中,生物标志物组包括至少10个不同的基因位点。在一些实施方案中,生物标志物组包括至少25个不同的基因位点。在一些实施方案中,生物标志物组包括至少50个不同的基因位点。在一些实施方案中,生物标志物组包括至少100个不同的基因位点。在一些实施方案中,生物标志物组包括至少150个不同的基因位点。
另一方面,本申请提供了一种用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的方法,包括:(a)使用第一测定处理源自所述受试者的无细胞生物样品以生成第一数据集;(b)使用第二测定处理源自所述受试者的阴道或宫颈生物样品以生成包括所述阴道或宫颈生物样品的微生物组谱的第二数据集;(c)使用算法(例如,经训练的算法)处理至少所述第一数据集和所述第二数据集以确定所述妊娠相关状态的所述存在或敏感性,该经训练的算法具有在至少50个独立样品上至少约80%的准确度;和(d)以电子方式输出指示所述受试者的妊娠相关状态的所述存在或敏感性的报告。
在一些实施方案中,所述第一测定包括使用源自所述无细胞生物样品的无细胞核糖核酸(cfRNA)分子生成转录组学数据,使用源自所述无细胞生物样品的无细胞脱氧核糖核酸(cfDNA)分子生成基因组学数据,使用源自所述无细胞生物样品的蛋白质生成蛋白质组学数据,或使用源自所述无细胞生物样品的代谢物生成代谢组学数据。在一些实施方案中,所述无细胞生物样品来自所述受试者的血液。在一些实施方案中,所述无细胞生物样品来自所述受试者的尿液。
在一些实施方案中,所述第一数据集包括与所述妊娠相关状态相关的第一组生物标志物。在一些实施方案中,所述第二数据集包括与所述妊娠相关状态相关的第二组生物标志物。在一些实施方案中,所述第二组生物标志物与所述第一组生物标志物不同。
在一些实施方案中,所述妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况、以及胎儿发育阶段或状态。
在一些实施方案中,所述妊娠相关状态包括早产。在一些实施方案中,所述妊娠相关状态包括胎龄。
在一些实施方案中,所述无细胞生物样品选自由无细胞核糖核酸(cfRNA)、无细胞脱氧核糖核酸(cfDNA)、无细胞胎儿DNA(cffDNA)、血浆、血清、尿液、唾液、羊水及其衍生物组成的组。在一些实施方案中,所述无细胞生物样品使用乙二胺四乙酸(EDTA)收集管、无细胞RNA收集管或无细胞DNA收集管从所述受试者获得或得到。在一些实施方案中,所述方法进一步包括分级分离所述受试者的全血液样品以获得所述无细胞生物样品。
在一些实施方案中,所述第一测定包括cfRNA测定或代谢组学测定。在一些实施方案中,所述代谢组学测定包括靶向质谱(MS)或免疫测定。在一些实施方案中,所述无细胞生物样品包括cfRNA或尿液。在一些实施方案中,所述第一测定或所述第二测定包括定量聚合酶链反应(qPCR)。在一些实施方案中,所述第一测定或所述第二测定包括被配置为在家庭环境中进行的家用检验。
在一些实施方案中,所述经训练的算法以至少约80%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约90%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约95%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
在一些实施方案中,所述经训练的算法以至少约70%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约80%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约90%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
在一些实施方案中,所述经训练的算法以至少约0.90的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约0.95的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。在一些实施方案中,所述经训练的算法以至少约0.99的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
在一些实施方案中,所述受试者对于以下中的一种或多种是无症状的:早产、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况、以及异常的胎儿发育阶段或状态。
在一些实施方案中,使用与所述妊娠相关状态的所述存在或敏感性相关的至少约10个独立训练样品训练所述经训练的算法。在一些实施方案中,使用与所述妊娠相关状态的所述存在或敏感性相关的不超过约100个独立训练样品训练所述经训练的算法。在一些实施方案中,使用与所述妊娠相关状态的存在或敏感性相关的第一组独立训练样品和与所述妊娠相关状态的不存在或无敏感性相关的第二组独立训练样品训练所述经训练的算法。在一些实施方案中,所述方法进一步包括使用所述经训练的算法处理所述受试者的一组临床健康数据以确定所述妊娠相关状态的所述存在或敏感性。
在一些实施方案中,(a)包括(i)使所述无细胞生物样品经受足以分离、富集或提取核糖核酸(RNA)分子、脱氧核糖核酸(DNA)分子、蛋白质或代谢物的组的条件,和(ii)使用所述第一测定分析所述RNA分子、DNA分子、蛋白质或代谢物的组以生成所述第一数据集。在一些实施方案中,所述方法进一步包括从所述无细胞生物样品中提取核酸分子组,并且对所述核酸分子组进行测序以生成测序读数组,其中所述第一数据集包括所述测序读数组。在一些实施方案中,(b)包括(i)使所述阴道或宫颈生物样品经受足以分离、富集或提取微生物群的条件,和(ii)使用所述第二测定分析所述微生物群以生成所述第二数据集。
在一些实施方案中,所述测序是大规模并行测序。在一些实施方案中,所述测序包括核酸扩增。在一些实施方案中,所述核酸扩增包括聚合酶链反应(PCR)。在一些实施方案中,所述测序包括使用同步逆转录(RT)和聚合酶链反应(PCR)。在一些实施方案中,所述方法进一步包括使用被配置为选择性富集对应于一个或多个基因位点的组的所述核酸分子组的探针。在一些实施方案中,所述探针是核酸引物。在一些实施方案中,所述探针与所述一个或多个基因位点的所述组的核酸序列具有序列互补性。
在一些实施方案中,所述一个或多个基因位点的所述组包括选自由以下组成的组的至少一个基因位点:ACTB、ADAM12、ALPP、ANXA3、APLF、ARG1、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH1、CSH2、CSHL1、CYP3A7、DAPP1、DCX、DEFA4、DGCR14、ELANE、ENAH、EPB42、FABP1、FAM212B-AS1、FGA、FGB、FRMD4B、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、Immune、ITIH2、KLF9、KNG1、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MEF2C、MMD、MMP8、MOB1B、NFATC2、OTC、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、PTGER3、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。
在一些实施方案中,所述一个或多个基因位点的所述组包括至少5个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少10个不同的基因位点。
在一些实施方案中,所述一个或多个基因位点的所述组包括与早产相关的基因位点,其中所述基因位点选自由以下组成的组:ADAM12、ANXA3、APLF、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH2、CSHL1、CYP3A7、DAPP1、DGCR14、ELANE、ENAH、FAM212B-AS1、FRMD4B、GH2、HSPB8、Immune、KLF9、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MMD、MOB1B、NFATC2、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。
在一些实施方案中,所述一个或多个基因位点的所述组包括与胎龄相关的基因位点,其中所述基因位点选自由以下组成的组:ACTB、ADAM12、ALPP、ANXA3、ARG1、CAMP、CAPN6、CGA、CGB、CSH1、CSH2、CSHL1、CYP3A7、DCX、DEFA4、EPB42、FABP1、FGA、FGB、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、ITIH2、KNG1、LGALS14、LTF、MEF2C、MMP8、OTC、PAPPA、PGLYRP1、PLAC1、PLAC4、PSG1、PSG4、PSG7、PTGER3、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、VGLL1、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2。
在一些实施方案中,所述一个或多个基因位点的所述组包括与与预产期相关的基因位点,其中所述基因位点选自由表1和表7中列出的基因组成的组。在一些实施方案中,所述一个或多个基因位点的所述组包括与胎龄相关的基因位点,其中所述基因位点选自由表2中列出的基因组成的组。在一些实施方案中,所述一个或多个基因位点的所述组包括与早产相关的基因位点,其中所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。
在一些实施方案中,所述一个或多个基因位点的所述组包括至少5个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少10个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少25个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少50个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少100个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的所述组包括至少150个不同的基因位点。
在一些实施方案中,在不经过核酸分离、富集或提取的情况下处理所述无细胞生物样品。
在一些实施方案中,所述报告被呈现在用户的电子设备的图形用户界面上。在一些实施方案中,所述用户是所述受试者。
在一些实施方案中,所述方法进一步包括确定所述受试者的所述妊娠相关状态的所述存在或敏感性的所述确定的可能性。
在一些实施方案中,所述经训练的算法包括有监督的机器学习算法。在一些实施方案中,所述有监督的机器学习算法包括深度学习算法、支持向量机(SVM)、神经网络或随机森林。
在一些实施方案中,所述方法进一步包括为所述受试者提供针对所述妊娠相关状态的所述存在或敏感性的治疗干预。在一些实施方案中,所述治疗干预包括己酸羟孕酮、阴道孕酮、天然孕酮IVR产品、前列腺素F2α受体拮抗剂或β2-肾上腺素能受体激动剂。
在一些实施方案中,所述方法进一步包括监测所述妊娠相关状态的所述存在或敏感性,其中所述监测包括在多个时间点评估所述受试者的所述妊娠相关状态的所述存在或敏感性,其中所述评估至少基于在所述多个时间点中的每个时间点的(d)中确定的所述妊娠相关状态的所述存在或敏感性。
在一些实施方案中,在所述多个时间点之间的所述受试者的所述妊娠相关状态的所述存在或敏感性的所述评估的差异指示选自由以下组成的组的一种或多种临床指征:(i)所述受试者的所述妊娠相关状态的所述存在或敏感性的诊断、(ii)所述受试者的所述妊娠相关状态的所述存在或敏感性的预后、和(iii)用于治疗所述受试者的所述妊娠相关状态的所述存在或敏感性的疗程有疗效或无疗效。
在一些实施方案中,所述方法进一步包括通过使用所述经训练的算法从早产的多种不同分子亚型中确定所述早产的分子亚型来对所述早产进行分层。在一些实施方案中,所述早产的多种不同分子亚型包括选自由既往早产史、自然早产、种族特异性早产风险(例如,在非裔美国人人群中)和早产胎膜早破(PPROM)组成的组。
另一方面,本申请提供了一种用于预测受试者的早产风险的计算机实现方法,包括:(a)接收所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;(b)使用算法(例如,经训练的算法)处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;以及(c)以电子方式输出指示所述风险评分的报告,所述风险评分指示所述受试者的所述早产风险。
在一些实施方案中,所述临床健康数据包括选自由年龄、体重、身高、体重指数(BMI)、血压、心率、血糖水平、既往妊娠次数和既往胎数组成的组。在一些实施方案中,所述临床健康数据包括选自由人种、种族、用药史或其他临床治疗史、吸烟史、饮酒史、日常活动或健康水平、基因检验结果、血液检验结果、影像学结果和胎儿筛查结果组成的组的一个或多个分类测量。
在一些实施方案中,所述经训练的算法以至少约80%的灵敏度确定所述受试者的早产风险。在一些实施方案中,所述经训练的算法以至少约80%的特异性确定所述受试者的所述早产风险。在一些实施方案中,所述经训练的算法以至少约80%的阳性预测值(PPV)确定所述受试者的所述早产风险。在一些实施方案中,所述经训练的算法以至少约80%的阴性预测值(NPV)确定所述受试者的所述早产风险。在一些实施方案中,所述经训练的算法使用至少约0.9的曲线下面积(AUC)确定所述受试者的所述早产风险。
在一些实施方案中,所述受试者对于以下中的一种或多种是无症状的:早产、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况、以及异常的胎儿发育阶段或状态。
在一些实施方案中,使用至少约10个与早产相关的独立训练样品训练所述经训练的算法。在一些实施方案中,使用不超过约100个与早产相关的独立训练样品训练所述经训练的算法。在一些实施方案中,使用与早产存在相关的第一组独立训练样品和与早产不存在相关的第二组独立训练样品训练所述经训练的算法。
在一些实施方案中,所述报告被呈现在用户的电子设备的图形用户界面上。在一些实施方案中,所述用户是所述受试者。
在一些实施方案中,所述经训练的算法包括有监督的机器学习算法。在一些实施方案中,所述有监督的机器学习算法包括深度学习算法、支持向量机(SVM)、神经网络或随机森林。
在一些实施方案中,所述方法进一步包括至少部分基于指示所述早产风险的所述风险评分为所述受试者提供治疗干预。在一些实施方案中,所述治疗干预包括己酸羟孕酮、阴道孕酮、天然孕酮IVR产品、前列腺素F2α受体拮抗剂或β2-肾上腺素能受体激动剂。
在一些实施方案中,所述方法进一步包括监测所述早产风险,其中所述监测包括在多个时间点评估所述受试者的所述早产风险,其中所述评估至少基于在所述多个时间点中的每个时间点的(b)中确定的指示所述早产风险的所述风险评分。
在一些实施方案中,所述方法进一步包括通过对所述受试者进行一项或多项后续临床检验来改善指示所述受试者的所述早产风险的所述风险评分,并使用经训练的算法处理来自所述一项或多项后续临床检验的结果以确定指示所述受试者的所述早产风险的更新风险评分。在一些实施方案中,所述一项或多项后续临床检验包括超声成像或血液检验。在一些实施方案中,所述风险评分包括所述受试者在预定持续时间内早产的可能性。
在一些实施方案中,所述预定持续时间是约1小时、约2小时、约4小时、约6小时、约8小时、约10小时、约12小时、约14小时、约16小时、约18小时、约20小时、约22小时、约24小时、约1.5天、约2天、约2.5天、约3天、约3.5天、约4天、约4.5天、约5天、约5.5天、约6天、约6.5天、约7天、约8天、约9天、约10天、约12天、约14天、约3周、约4周、约5周、约6周、约7周、约8周、约9周、约10周、约11周、约12周、约13周、或超过约13周。
另一方面,本申请提供了一种用于预测受试者的早产风险的计算机系统,包括:数据库,其被配置为存储所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;和一个或多个计算机处理器,其与所述数据库可操作地耦合,其中所述一个或多个计算机处理器被单独地共同编程以:(i)使用算法(例如,经训练的算法)处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;和(ii)以电子方式输出指示所述受试者的所述早产风险的所述风险评分的报告。
在一些实施方案中,所述计算机系统进一步包括电子显示器,其与所述一个或多个计算机处理器可操作地耦合,其中所述电子显示器包括被配置为显示所述报告的图形用户界面。
另一方面,本申请提供了一种非暂时性计算机可读介质,包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实施用于预测受试者的早产风险的方法,所述方法包括::(a)接收所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;(b)使用算法(例如,经训练的算法)处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;和(c)以电子方式输出指示所述受试者的所述早产风险的所述风险评分的报告。
另一方面,本申请提供了一种用于确定妊娠受试者的胎儿的预产期、预产期范围或胎龄的方法,包括测定源自所述妊娠受试者的无细胞生物样品以检测生物标志物组,并且使用经训练的算法分析所述生物标志物组以确定所述胎儿的所述预产期、预产期范围或胎龄。
在一些实施方案中,所述方法进一步包括使用所述经训练的算法分析所述妊娠受试者的所述胎儿的估计预产期或预产期范围,其中所述估计预产期或预产期范围从所述胎儿的超声测量值中生成。在一些实施方案中,所述生物标志物组包括与与预产期相关的基因位点,其中所述基因位点选自表1和表7中列出的基因的组。
在一些实施方案中,所述生物标志物组包括至少5个不同的基因位点。在一些实施方案中,所述生物标志物组包括至少10个不同的基因位点。在一些实施方案中,所述生物标志物组包括至少25个不同的基因位点。在一些实施方案中,所述生物标志物组包括至少50个不同的基因位点。在一些实施方案中,所述生物标志物组包括至少100个不同的基因位点。在一些实施方案中,所述生物标志物组包括至少150个不同的基因位点。
在一些实施方案中,进一步包括至少部分基于所述确定的预产期鉴定对所述妊娠受试者的临床干预。在一些实施方案中,所述临床干预选自多种临床干预。
在一些实施方案中,所述分娩时间(time-to-delivery)少于7.5周。在一些实施方案中,所述基因位点选自ACKR2、AKAP3、ANO5、C1orf21、C2orf42、CARNS1、CASC15、CCDC102B、CDC45、CDIPT、CMTM1、COPS8、CTD-2267D19.3、CTD-2349P21.9、CXorf65、DDX11L1、DGUOK、DPAGT1、EIF4A1P2、FANK1、FERMT1、FKRP、GAMT、GOLGA6L4、KLLN、LINC01347、LTA、MAPK12、METRN、MKRN4P、MPC2、MYL12BP1、NME4、NPM1P30、PCLO、PIF1、PTP4A3、RIMKLB、RP13-88F20.1、S100B、SIGLEC14、SLAIN1、SPATA33、TFAP2C、TMSB4XP8、TRGV10和ZNF124。
在一些实施方案中,所述分娩时间少于5周。在一些实施方案中,所述基因位点选自C2orf68、CACNB3、CD40、CDKL5、CTBS、CTD-2272G21.2、CXCL8、DHRS7B、EIF5A2、IFITM3、MIR24-2、MTSS1、MYSM1、NCK1-AS1、NR1H4、PDE1C、PEMT、PEX7、PIF1、PPP2R3A、RABIF、SIGLEC14、SLC25A53、SPANXN4、SUPT3H、ZC2HC1C、ZMYM1和ZNF124。
在一些实施方案中,所述分娩时间少于7.5周。在一些实施方案中,所述基因位点选自ACKR2、AKAP3、ANO5、C1orf21、C2orf42、CARNS1、CASC15、CCDC102B、CDC45、CDIPT、CMTM1、collectionga、COPS8、CTD-2267D19.3、CTD-2349P21.9、DDX11L1、DGUOK、DPAGT1、EIF4A1P2、FANK1、FERMT1、FKRP、GAMT、GOLGA6L4、KLLN、LINC01347、LTA、MAPK12、METRN、MPC2、MYL12BP1、NME4、NPM1P30、PCLO、PIF1、PTP4A3、RIMKLB、RP13-88F20.1、S100B、SIGLEC14、SLAIN1、SPATA33、STAT1、TFAP2C、TMEM94、TMSB4XP8、TRGV10、ZNF124和ZNF713。
在一些实施方案中,所述分娩时间少于5周。在一些实施方案中,所述基因位点选自ATP6V1E1P1、ATP8A2、C2orf68、CACNB3、CD40、CDKL4、CDKL5、CEP152、CLEC4D、COL18A1、collectionga、COX16、CTBS、CTD-2272G21.2、CXCL2、CXCL8、DHRS7B、DPPA4、EIF5A2、FERMT1、GNB1L、IFITM3、KATNAL1、LRCH4、MBD6、MIR24-2、MTSS1、MYSM1、NCK1-AS1、NPIPB4、NR1H4、PDE1C、PEMT、PEX7、PIF1、PPP2R3A、PXDN、RABIF、SERTAD3、SIGLEC14、SLC25A53、SPANXN4、SSH3、SUPT3H、TMEM150C、TNFAIP6、UPP1、XKR8、ZC2HC1C、ZMYM1和ZNF124。
在一些实施方案中,所述经训练的算法包括线性回归模型或ANOVA模型。在一些实施方案中,所述ANOVA模型从多个时间窗之中确定对应于所述预产期的最大似然时间窗。在一些实施方案中,所述最大似然时间窗对应于1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周或20周的分娩时间。在一些实施方案中,所述ANOVA模型从多个时间窗之中确定对应于所述预产期的时间窗的概率或可能性。在一些实施方案中,所述ANOVA模型计算跨所述多个时间窗的概率加权平均值以确定平均或预期时间窗间隔。
另一方面,本申请提供了一种用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的方法,包括:(a)使用第一测定处理源自受试者的第一无细胞生物样品以生成第一数据集;(b)至少部分基于(a)中生成的第一数据集,使用与第一测定不同的第二测定处理源自受试者的第二无细胞生物样品以高于第一数据集的特异性生成指示妊娠相关状态的存在或敏感性的第二数据集;(c)使用经训练的算法处理至少第二数据集以确定妊娠相关状态的存在或敏感性,所述经训练的算法具有在至少50个独立样品上的至少约80%的准确度;和(d)以电子方式输出指示受试者的妊娠相关状态的存在或敏感性的报告。
在一些实施方案中,第一测定包括使用源自第一无细胞生物样品的无细胞核糖核酸(cfRNA)分子生成转录组学数据,使用源自第一无细胞生物样品的无细胞脱氧核糖核酸(cfDNA)分子生成基因组学数据,使用源自第一无细胞生物样品的蛋白质生成蛋白质组学数据,或使用源自第一无细胞生物样品的代谢物生成代谢组学数据。在一些实施方案中,第一无细胞生物样品来自受试者的血液。在一些实施方案中,第一无细胞生物样品来自受试者的尿液。在一些实施方案中,第一数据集包括与妊娠相关状态相关的第一组生物标志物。在一些实施方案中,第二数据集包括与妊娠相关状态相关的第二组生物标志物。在一些实施方案中,第二组生物标志物与第一组生物标志物不同。
在一些实施方案中,妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,正常的胎儿器官功能或发育和异常的胎儿器官功能或发育)。在一些实施方案中,妊娠相关状态包括早产。在一些实施方案中,妊娠相关状态包括胎龄。在一些实施方案中,无细胞生物样品选自由无细胞核糖核酸(cfRNA)、无细胞脱氧核糖核酸(cfDNA)、无细胞胎儿DNA(cffDNA)、血浆、血清、尿液、唾液、羊水及其衍生物组成的组。在一些实施方案中,第一无细胞生物样品或第二无细胞生物样品使用乙二胺四乙酸(EDTA)收集管、无细胞RNA收集管或无细胞DNA收集管从所述受试者获得或得到。在一些实施方案中,所述方法进一步包括分级分离受试者的全血液样品以获得第一无细胞生物样品或第二无细胞生物样品。在一些实施方案中,(i)第一测定包括cfRNA测定并且第二测定包括代谢组学测定,或(ii)第一测定包括代谢组学测定并且第二测定包括cfRNA测定。在一些实施方案中,(i)第一无细胞生物样品包括cfRNA并且第二无细胞生物样品包括尿液,或(ii)第一无细胞生物样品包括尿液并且第二无细胞生物样品包括cfRNA。在一些实施方案中,第一测定或第二测定包括定量聚合酶链反应(qPCR)。在一些实施方案中,第一测定或第二测定包括被配置为在家庭环境中进行的家用检验。在一些实施方案中,第一测定或第二测定包括代谢组学测定。在一些实施方案中,代谢组学测定包括靶向质谱(MS)或免疫测定。
在一些实施方案中,第一数据集以至少约80%的灵敏度指示妊娠相关状态的存在或敏感性。在一些实施方案中,第一数据集以至少约90%的灵敏度指示妊娠相关状态的存在或敏感性。在一些实施方案中,第一数据集以至少约95%的灵敏度指示妊娠相关状态的存在或敏感性。在一些实施方案中,第一数据集以至少约70%的阳性预测值(PPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,第一数据集以至少约80%的阳性预测值(PPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,第一数据集以至少约90%的阳性预测值(PPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约90%的特异性指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约95%的特异性指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约99%的特异性指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约90%的阴性预测值(NPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约95%的阴性预测值(NPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,第二数据集以至少约99%的阴性预测值(NPV)指示妊娠相关状态的存在或敏感性。在一些实施方案中,经训练的算法以至少约0.90的曲线下面积(AUC)确定受试者的妊娠相关状态的存在或敏感性。在一些实施方案中,经训练的算法以至少约0.95的曲线下面积(AUC)确定受试者的妊娠相关状态的存在或敏感性。在一些实施方案中,经训练的算法以至少约0.99的曲线下面积(AUC)确定受试者的妊娠相关状态的存在或敏感性。
在一些实施方案中,受试者对于以下中的一种或多种是无症状的:早产、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及异常的胎儿发育阶段或状态(例如,异常的胎儿器官功能或发育)。在一些实施方案中,使用至少约10个与妊娠相关状态相关的独立训练样品以训练该经训练的算法。在一些实施方案中,使用不超过约100个与妊娠相关状态相关的独立训练样品以训练经训练的算法。在一些实施方案中,使用与妊娠相关状态的存在相关的第一组独立训练样品和与妊娠相关状态的不存在相关的第二组独立训练样品训练经训练的算法。在一些实施方案中,所述方法进一步包括使用经训练的算法处理第一数据集以确定妊娠相关状态的存在或敏感性。在一些实施方案中,所述方法进一步包括使用经训练的算法处理受试者的一组临床健康数据以确定妊娠相关状态的存在或敏感性。
在一些实施方案中,(a)包括(i)使第一无细胞生物样品经受足以分离、富集或提取第一组核糖核酸(RNA)分子、脱氧核糖核酸(DNA)分子、蛋白质或代谢物的条件,和(ii)使用第一测定分析第一组RNA分子、DNA分子、蛋白质或代谢物以生成第一数据集。在一些实施方案中,所述方法进一步包括从第一无细胞生物样品中提取第一组核酸分子,并且对第一组核酸分子进行测序以生成第测序读数组,其中第一数据集包括第测序读数组。在一些实施方案中,所述方法进一步包括从第一无细胞生物样品中提取第一组代谢物,并且对第一组代谢物进行测定以生成第一数据集。在一些实施方案中,(b)包括(i)使第二无细胞生物样品经受足以分离、富集或提取第二组核糖核酸(RNA)分子、脱氧核糖核酸(DNA)分子、蛋白质或代谢物的条件,和(ii)使用第二测定分析第二组RNA分子、DNA分子、蛋白质或代谢物以生成第二数据集。在一些实施方案中,所述方法进一步包括从第二无细胞生物样品中提取第二组核酸分子,并且对第二组核酸分子进行测序以生成第二组测序读数,其中第二数据集包括第二组测序读数。在一些实施方案中,所述方法进一步包括从第二无细胞生物样品中提取第二组代谢物,并且对第二组代谢物进行测定以生成第二数据集。在一些实施方案中,测序是大规模并行测序。在一些实施方案中,测序包括核酸扩增。在一些实施方案中,核酸扩增包括聚合酶链反应(PCR)。在一些实施方案中,测序包括使用同步逆转录(RT)和聚合酶链反应(PCR)。
在一些实施方案中,所述方法进一步包括使用被配置为选择性富集对应于一个或多个基因位点的组的第一组核酸分子或第二组核酸分子的探针。在一些实施方案中,探针是核酸引物。在一些实施方案中,探针与一个或多个基因位点的组的核酸序列具有序列互补性。在一些实施方案中,一个或多个基因位点的组包括选自由以下组成的组的至少一个基因位点:ACTB、ADAM12、ALPP、ANXA3、APLF、ARG1、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH1、CSH2、CSHL1、CYP3A7、DAPP1、DCX、DEFA4、DGCR14、ELANE、ENAH、EPB42、FABP1、FAM212B-AS1、FGA、FGB、FRMD4B、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、Immune、ITIH2、KLF9、KNG1、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MEF2C、MMD、MMP8、MOB1B、NFATC2、OTC、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、PTGER3、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。在一些实施方案中,所述一个或多个基因位点的组包括至少5个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括至少10个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括与早产相关的基因位点,其中所述基因位点选自由以下组成的组:ADAM12、ANXA3、APLF、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH2、CSHL1、CYP3A7、DAPP1、DGCR14、ELANE、ENAH、FAM212B-AS1、FRMD4B、GH2、HSPB8、Immune、KLF9、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MMD、MOB1B、NFATC2、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。在一些实施方案中,所述一个或多个基因位点的组包括与胎龄相关的基因位点,其中所述基因位点选自由以下组成的组:ACTB、ADAM12、ALPP、ANXA3、ARG1、CAMP、CAPN6、CGA、CGB、CSH1、CSH2、CSHL1、CYP3A7、DCX、DEFA4、EPB42、FABP1、FGA、FGB、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、ITIH2、KNG1、LGALS14、LTF、MEF2C、MMP8、OTC、PAPPA、PGLYRP1、PLAC1、PLAC4、PSG1、PSG4、PSG7、PTGER3、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。在一些实施方案中,所述一个或多个基因位点的组包括与与预产期相关的基因位点,其中该基因位点选自由表1和表7中列出的基因组成的组。在一些实施方案中,所述一个或多个基因位点的组包括与胎龄相关的基因位点,其中该基因位点选自由表2中列出的基因组成的组。在一些实施方案中,所述一个或多个基因位点的组包括与早产相关的基因位点,其中该基因位点选自选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。在一些实施方案中,所述一个或多个基因位点的组包括至少5个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括至少10个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组的组包括至少25个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括至少50个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括至少100个不同的基因位点。在一些实施方案中,所述一个或多个基因位点的组包括至少150个不同的基因位点。在一些实施方案中,在未经过核酸分离、富集或提取的情况下处理第一无细胞生物样品或第二无细胞生物样品。在一些实施方案中,报告被呈现在用户的电子设备的图形用户界面上。在一些实施方案中,用户是受试者。
在一些实施方案中,所述方法进一步包括确定受试者的妊娠相关状态的存在或敏感性的确定的可能性。在一些实施方案中,经训练的算法包括有监督的机器学习算法。在一些实施方案中,有监督的机器学习算法包括深度学习算法、支持向量机(SVM)、神经网络或随机森林。在一些实施方案中,所述方法进一步包括为受试者提供针对妊娠相关状态的存在或敏感性的治疗干预。在一些实施方案中,治疗干预包括孕酮治疗,例如己酸羟孕酮(例如,17-α己酸羟孕酮(17-P)、来自Lipocin的LPCN 1107、来自AMAG Pharma的Makena)、阴道孕酮或天然孕酮IVR产品(例如,来自Juniper Pharma的DARE-FRT1(JNP-0301));前列腺素F2α受体拮抗剂(例如来自ObsEva的OBE022);或β2-肾上腺素能受体激动剂(例如,来自MediciNova的硫酸贝多拉君(MN-221))。治疗干预可以,例如,如“WHO关于改善早产结局的干预的建议”,世界卫生组织,2015年所述,其通过引用以其全文并入本文。在一些实施方案中,所述方法进一步包括监测妊娠相关状态的存在或敏感性,其中监测包括在多个时间点评估受试者的妊娠相关状态的存在或敏感性,其中所述评估至少基于(d)中在多个时间点中的每个时间点确定的妊娠相关状态的存在或敏感性。在一些实施方案中,在多个时间点之间的受试者的妊娠相关状态的存在或敏感性的评估的差异指示选自由以下组成的组的一种或多种临床指征:(i)受试者的妊娠相关状态的存在或敏感性的诊断、(ii)受试者的妊娠相关状态的存在或敏感性的预后、和(iii)用于治疗受试者的妊娠相关状态的存在或敏感性的疗程有疗效或无疗效。在一些实施方案中,所述方法进一步包括通过使用经训练的算法从早产的多种不同分子亚型中确定早产的分子亚型来对早产进行分层。在一些实施方案中,早产的多种不同分子亚型包括选自由既往早产史、自然早产、种族特异性早产风险(例如,在非裔美国人人群中)和早产胎膜早破(PPROM)组成的组的早产的分子亚型。
另一方面,本申请提供了一种用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的计算机系统,包括:数据库,其被配置为存储第一数据集和第二数据集,其中第二数据集以大于第一数据集的特异性指示妊娠相关状态的存在或敏感性;和一个或多个计算机处理器,其与数据库可操作地耦合,其中一个或多个计算机处理器被单独地共同编程以:(i)使用经训练的算法处理至少第二数据集以确定妊娠相关状态的存在或敏感性,该经训练的算法具有在至少50个独立样品上的至少约80%的准确度;(ii)以电子方式输出指示受试者的妊娠相关状态的存在或敏感性的报告。
在一些实施方案中,计算机系统进一步包括电子显示器,其与一个或多个计算机处理器可操作地耦合,其中电子显示器包括被配置为显示报告的图形用户界面。
另一方面,本申请提供了一种非暂时性计算机可读介质,包括机器可执行代码,该机器可执行代码在由一个或多个计算机处理器执行时实施用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的方法,所述方法包括:(a)获得第一数据集和第二数据集,其中第二数据集以大于第一数据集的特异性指示妊娠相关状态的存在或敏感性;(b)使用经训练的算法处理至少第二数据集以确定与妊娠相关状态,该经训练的算法具有在至少50个独立样品上的至少约80%的准确度;(c)以电子方式输出指示受试者妊娠相关状态的存在或敏感性的报告。
另一方面,本申请提供了一种用于鉴定受试者妊娠相关状态的存在或敏感性的方法,包括(i)使用第一测定测定源自受试者的第一无细胞生物样品以生成第一数据集,(ii)使用第二测定测定来自受试者的第二无细胞生物样品以生成第二数据集,该第二数据集以高于第一数据集的特异性指示妊娠相关状态的存在或敏感性,和(iii)使用经训练的算法处理至少第二数据集,以至少约80%的准确度确定妊娠相关状态的存在或敏感性。在一些实施方案中,准确度为至少约90%。在一些实施方案中,妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产,死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,正常的胎儿器官功能或发育和异常的胎儿器官功能或发育)。
另一方面,本申请提供了一种用于确定受试者处于早产风险中的方法,包括测定源自受试者的无细胞生物样品以生成以至少80%的特异性指示早产风险的数据集,以及使用在独立于无细胞生物样品的样品上进行训练的经训练的算法以至少约80%的准确度确定受试者处于早产风险中。在一些实施方案中,准确度为至少约90%。
另一方面,本申请提供了一种用于检测妊娠受试者的胎儿存在产前代谢遗传病或有产前代谢遗传病风险的方法,包括:测定源自所述妊娠受试者的无细胞生物样品中的核糖核酸(RNA)以检测生物标志物组;并且使用算法(例如,经训练的算法)分析所述生物标志物组以检测所述产前代谢遗传病的所述存在或风险。
另一方面,本申请提供了一种用于检测妊娠受试者的胎儿或所述妊娠受试者的至少两种健康或生理状况的方法,包括:测定在第一时间点获自或源自所述妊娠受试者的第一无细胞生物样品和在第二时间点获自或源自所述妊娠受试者的第二无细胞生物样品,以检测在所述第一时间点的第一组生物标志物和在所述第二时间点的第二组生物标志物,以及使用经训练的算法分析所述第一组生物标志物或所述第二组生物标志物以检测所述至少两种健康或生理状况。
在一些实施方案中,所述至少两种健康或生理状况选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。在一些实施方案中,所述生物标志物组包括与与预产期相关的基因位点,其中所述基因位点选自由表1和表7中列出的基因组成的组。在一些实施方案中,所述生物标志物组包括与胎龄相关的基因位点,其中所述基因位点选自由表2中列出的基因组成的组。在一些实施方案中,所述生物标志物组包括与早产相关的基因位点,其中所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。在一些实施方案中,所述生物标志物组包括至少5个不同的基因位点。
另一方面,本申请提供了一种方法,包括:测定获自或源自妊娠受试者的一个或多个无细胞生物样品以检测生物标志物组;和分析所述生物标志物组以鉴定(1)所述妊娠受试者的胎儿的预产期或其范围和(2)所述妊娠受试者的所述胎儿或所述妊娠受试者的健康或生理状况。
在一些实施方案中,所述方法进一步包括使用经训练的算法分析所述生物标志物组。在一些实施方案中,所述健康或生理状况选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。在一些实施方案中,所述生物标志物组包括与与预产期相关的基因位点,其中所述基因位点选自由表1和表7中列出的基因组成的组。在一些实施方案中,所述生物标志物组包括与胎龄相关的基因位点,其中所述基因位点选自由表2中列出的基因组成的组。在一些实施方案中,所述生物标志物组包括与早产相关的基因位点,其中所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。在一些实施方案中,所述生物标志物组包括至少5个不同的基因位点。
另一方面,本申请提供了一种方法,包括:测定获自或源自妊娠受试者的一个或多个无细胞生物样品以检测一组非人来源的核酸;和分析所述一组非人来源的核酸以检测所述妊娠受试者的胎儿或所述妊娠受试者的健康或生理状况。在一些实施方案中,非人来源的核酸包括非人生物体的DNA或RNA。在一些实施方案中,非人生物体是细菌、病毒或寄生虫。在一些实施方案中,所述方法进一步包括使用经训练的算法分析所述一组非人来源的核酸。
本申请的另一方面提供了一种非暂时性计算机可读介质,其包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实施上述或本文其他地方的任何方法。
本申请的另一方面提供了一种系统,该系统包括一个或多个计算机处理器和与其耦合的计算机存储器。计算机存储器包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实施上述或本文其他地方的任何方法。
根据以下详细描述,本申请的其他方面和优点对本领域技术人员来说将变得显而易见,其中仅示出和描述了本申请的说明性实施方案。如将意识到的,本申请能够有其他不同的实施方案,并且其若干详情能够进行各种明显方面修改,所有这些均未背离本申请。因此,附图和描述在本质上被认为是说明性的,而不是限制性的。
通过引用并入
本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用并入。如果通过引用并入的出版物和专利或专利申请与包含在说明书中的公开内容相矛盾,则本说明书旨在取代和/或优先于任何此类矛盾材料。
附图说明
本发明的新特征在所附权利要求中具体阐述。通过参考以下阐述说明性实施方案的详细描述以及附图(本文也称为“图”),将获得对本发明的特征和优点的更好理解,其中说明性实施方案中利用了本发明的原理,其中:
图1示出了根据公开的实施方案的用于鉴定或监测受试者的妊娠相关状态的方法的示例工作流。
图2示出了被编程或以其他方式配置为实施本文提供的方法的计算机系统。
图3A显示了根据公开的实施方案的建立的第一队列受试者(例如,孕妇)(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从第一队列受试者中收集一个或多个生物样品(例如,各2或3个)并进行测定。
图3B显示了根据公开的实施方案的基于在提取病历时每名参与者的年龄的第一队列中的参与者的分布。
图3C显示了根据公开的实施方案的基于每名参与者的人种的第一队列中100名参与者的分布。
图3D显示了根据公开的实施方案的基于在每个样品收集时每名参与者的估计胎龄和妊娠期(trimester)的胎龄队列中的所收集的样品的分布。
图3E显示了根据公开的实施方案的基于所收集的样品的研究样品类型,第一队列中225个所收集的样品的分布。
图4A显示了根据公开的实施方案的建立的第二队列受试者(例如,孕妇)(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从第二队列受试者中收集一个或多个生物样品(例如,各1、2或3个)并进行测定。
图4B显示了根据公开的实施方案的基于在病历提取时每名参与者的年龄的第二队列中的参与者的分布。
图4C显示了根据公开的实施方案的基于每名参与者的人种的第二队列中128名参与者的分布。
图4D显示了根据公开的实施方案的基于在每个样品收集时每名参与者的估计胎龄和妊娠期的第二队列中所收集的样品的分布。
图4E显示了根据公开的实施方案的基于所收集的样品的研究样品类型的第二队列中160个所收集的样品的分布。
图5A显示了根据公开的实施方案的建立的受试者(例如,孕妇)的预产期队列(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从受试者中收集一个或多个生物样品(例如,各1或2个)并进行测定。
图5B显示了根据公开的实施方案的基于样品收集日期和分娩日期之间的时间(分娩时间)的预产期队列中所收集的样品的分布。
图5C显示了根据公开的实施方案的在预产期的第一预测模型和第二预测模型中使用的基因重叠的维恩图。第一预测模型共有51个最具预测性的基因,第二预测模型共有49个最具预测性的基因;此外,两个预测模型之间仅有5个基因重叠。
图5D显示了根据公开的实施方案的预产期队列中的受试者的预测分娩时间(以周计)与观察到的(实际)分娩时间(以周计)之间的一致性的图。
图5E显示了用于预测预产期的预测模型的总结,包括使用分娩时间少于5周的样品的预测模型和使用分娩时间少于7.5周的样品的预测模型;不同的预测模型使用估计预产期信息(例如,使用从超声测量估计胎龄确定)和不使用估计预产期信息生成。
图6A显示了根据公开的实施方案的建立的受试者(例如,孕妇)的胎龄队列(在x轴显示患者识别号),在对应于每名受试者的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从受试者中收集一个或多个生物样品(例如,各1或2个)并进行测定。
图6B显示了根据公开的实施方案的整个转录组的相交互信息的视觉模型,其中多个胎龄相关基因的表达在整个妊娠过程中随胎龄而变化。
图6C显示根据公开的实施方案的胎龄队列中的受试者的预测胎龄(以周计)与测量胎龄(以周计)之间的一致性的图。在图中受试者按主要人种(例如,白人、非黑人西班牙裔、亚洲人、非裔美国人、美洲原住民、混血(例如,两个或多个人种)或未知)分层。
图7A-图7B显示了根据公开的实施方案的受试者(例如,孕妇)的早产(PTB)队列的结果,其包括一组早产病例样品(例如,来自早产的女性)和一组早产对照样品(例如,来自足月产的女性)。在早产病例样品和早产对照样品中,收集时的胎龄的分布相似(图7A),而分娩时胎龄的分布在统计学上明显可区分(图7B)。
图7C-图7E分别显示了根据公开的实施方案的早产病例样品(左)和早产对照样品(右)之间的B3GNT2、BPI和ELANE基因的差异基因表达。
图7F显示了根据公开的实施方案的来自图7C-图7E中所示的早产病例样品和早产对照样品的结果的图例。
图7G显示了根据公开的实施方案的显示跨10倍交叉验证的用于早产的预测模型的性能的受试者工作特征(ROC)曲线。
图8显示了在美国由产科医生估计胎龄的阴道单胎分娩分布实例。
图9A-图9E显示了预测妊娠受试者胎儿的预产期的不同方法,包括预测实际日期(含误差)(图9A)、预测分娩周(或其他时间窗)(图9B)、预测分娩预期是在某个时间边界之前还是之后发生(图9C)、预测分娩预期发生在多个时间段(bin)(例如,6个时间段)中的哪个时间段中(图9D)、以及预测提前分娩或延迟分娩的相对风险或相对可能性(图9E)。
图10显示了为开发预产期预测模型(例如分类器)而执行的数据工作流。
图11A-图11B分别显示了在270和310名患者上进行训练的预产期预测模型的预测误差。
图12显示了早产预测模型的受试者工作特征(ROC)曲线,使用从高加索人受试者队列获得的一组79个样品的一组22个基因。ROC曲线的平均曲线下面积(AUC)为0.91±0.10。
图13A显示了早产预测模型的受试者工作特征(ROC)曲线,使用从具有非洲人或非裔美国人血统的一队列受试者(AA队列)获得的一组45个样品的一组基因。ROC曲线的平均曲线下面积(AUC)为0.82±0.08。
图13B显示了三个不同AA队列(队列1、队列2和队列3)的早产预测模型的基因集合,包括RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2。
图14A显示了使用从妊娠受试者获得的单个身体样品(例如,单次抽血)进行用于评估多个妊娠相关状况的多个测定的工作流。
图14B显示了可以从沿妊娠受试者的妊娠进展的单次抽血检验的状况组合。
具体实施方式
虽然本文已经显示和描述了本发明的各种实施方式,但是对于本领域技术人员而言,这些实施方案仅作为实例提供是显而易见的。在不背离本发明的情况下,本领域技术人员可以进行多种改变、变化和替换。应当理解,可以采用对本文描述的本发明的实施方案的各种替代。
如说明书和权利要求中所用,单数形式“一个”、“一种”和“该”包括复数形式,除非上下文另有明确规定。例如,术语“核酸”包括多种核酸,包括其混合物。
如本文所用,术语“受试者”通常是指具有可测试或可检测遗传信息的实体或介质。受试者可以是人、个体或患者。受试者可以是脊椎动物,例如哺乳动物。哺乳动物的非限制性实例包括人、猿猴、农场动物、运动动物、啮齿动物和宠物。受试者可以是妊娠女性受试者。受试者可以是怀有胎儿(或多个胎儿)或疑似怀有胎儿(或多个胎儿)的女性。受试者可以是妊娠或疑似妊娠的人。受试者可以表现出指示受试者的健康或生理状态或状况的症状,例如受试者的妊娠相关健康或生理状态或状况。作为替代方案,受试者在这种健康或生理状态或状况方面可以是无症状的。
本文中使用的术语“妊娠相关状态”通常是指妊娠或疑似妊娠的受试者或受试者的胎儿(或多个胎儿)的任何健康、生理和/或生化状态或状况。妊娠相关状态的实例包括,但不限于早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,正常的胎儿器官功能或发育和异常的胎儿器官功能或发育)。在一些情况下,妊娠相关状态与受试者的胎儿(或多个胎儿)的健康或生理状态或状况无关。
如本文所用,术语“样品”通常是指获自或源自一名或多名受试者的生物样品。生物样品可以是无细胞生物样品或基本上无细胞的生物样品,或者可以经处理或分级分离以产生无细胞生物样品。例如,无细胞生物样品可以包括无细胞核糖核酸(cfRNA)、无细胞脱氧核糖核酸(cfDNA)、无细胞胎儿DNA(cffDNA)、血浆、血清、尿液、唾液、羊水及其衍生物。无细胞生物样品可以使用乙二胺四乙酸(EDTA)收集管、无细胞RNA收集管(例如,Streck)或无细胞DNA收集管(例如,Streck)从受试者获得或得到。无细胞生物样品可以通过分级分离从全血液样品中获得。生物样品或其衍生物可以含有细胞。例如,生物样品可以是血液样品或其衍生物(例如,通过收集管或血滴收集的血液)、阴道样品(例如,阴道拭子)或宫颈样品(例如,宫颈拭子)。
如本文所用,术语“核酸”通常指任何长度的核苷酸(脱氧核糖核苷酸(dNTP)或核糖核苷酸(rNTP))的聚合形式,或其类似物。核酸可以具有任何三维结构,并且可以执行任何已知或未知功能。核酸的非限制性实例包括脱氧核糖核酸(DNA)、核糖核酸(RNA)、基因或基因片段的编码或非编码区、由连锁分析定义的基因座、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组核酸、分支核酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。核酸可以包括一种或多种修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,可以在核酸组装之前或核酸组装之后对核苷酸结构进行修饰。核酸的核苷酸序列可以被非核苷酸成分中断。核酸可以在聚合后进一步修饰,例如通过与报道剂缀合或结合。
如本文所用,术语“靶核酸”通常是指核酸分子的起始群体中的具有这样的核酸序列的核酸分子:其核苷酸序列的存在、数量和/或序列的变化或存在、数量和/或序列中一项或多项的变化想要被确定。靶核酸可以是任何类型的核酸,包括DNA、RNA及其类似物。如本文所用,“靶核糖核酸(RNA)”通常是指即为RNA的靶核酸。如本文所用,“靶脱氧核糖核酸(DNA)”通常是指即为DNA的靶核酸。
如本文所用,术语“扩增”通常是指增加核酸分子的大小或数量。核酸分子可以是单链或双链的。扩增可以包括产生核酸分子的一个或多个拷贝或“扩增产物”。例如,可以通过延伸(例如,引物延伸)或连接来进行扩增。扩增可以包括进行引物延伸反应以产生与单链核酸分子互补的链,并且在一些情况下产生链和/或单链核酸分子的一个或多个拷贝。术语“DNA扩增”通常是指产生一个或多个拷贝的DNA分子或“扩增的DNA产物”。术语“逆转录扩增”通常是指通过逆转录酶的作用从核糖核酸(RNA)模板产生脱氧核糖核酸(DNA)。
每年,全球报告有约1500万例早产。早产可影响多达约10%的妊娠,其中大多数是自然早产。目前,可能尚无有意义的、临床上可操作的可用于许多妊娠相关的并发症,例如早产的诊断筛查或检验。然而,妊娠相关的并发症(例如早产)是新生儿死亡和晚年并发症的主要原因。此外,此类妊娠相关的并发症可对母体健康造成负面影响。因此,为了使妊娠尽可能安全,需要快速、准确的方法以鉴定和监测妊娠相关状态,这些方法是非侵入性且具有成本效益的,以改善母体和胎儿的健康。
目前的产前护理检查可能无法实现且不完整。对于妊娠进展而没有妊娠相关并发症的情况,妊娠受试者可使用有限的妊娠监测方法,例如分子检验、超声成像以及使用末次月经期估计胎龄和/或预产期。然而,这种监测方法可能复杂、昂贵且不可靠。例如,分子检验不能预测胎龄,超声成像价格昂贵并且最好在妊娠的前三个月进行,使用末次月经估计胎龄和/或预产期可能不可靠。此外,对于妊娠进展与妊娠相关并发症(例如自然早产风险)的情况,分子检验、超声成像和人口统计学因素的临床效用可能有限。例如,分子检验可能具有有限的BMI(体重指数)范围、有限的胎龄和/或预产期范围(约2周)以及低阳性预测值(PPV);超声成像可能很昂贵并且具有较低的PPV和特异性;使用人口统计学因素预测妊娠相关并发症的风险可能不可靠。因此,临床上迫切需要准确且可负担的非侵入性诊断方法来检测和监测妊娠相关状态(例如,估计胎龄、预产期和/或分娩发作,以及预测妊娠相关并发症,例如早产)以达到临床可操作的结果。
本申请提供了通过处理获自或源自受试者(例如,妊娠女性受试者)的无细胞生物样品以鉴定或监测妊娠相关状态的方法、系统和试剂盒。可以对获自受试者的无细胞生物样品(例如,血浆样品)进行分析以鉴定妊娠相关状态(其可以包括,例如,测量妊娠相关状态的存在、不存在或定量评估(例如,风险))。此类受试者可以包括具有一种或多种妊娠相关状态的受试者和未具有妊娠相关状态的受试者。妊娠相关状态可以包括,例如,早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限和巨大胎儿(对于胎龄来说的大胎儿)。在一些实施方案中,妊娠相关状态与胎儿的健康无关。在一些实施方案中,妊娠相关状态包括新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及胎儿发育阶段或状态(例如,正常的胎儿器官功能或发育以及异常的胎儿器官功能或发育)。
图1示出了根据公开的实施方案的用于鉴定或监测受试者的妊娠相关状态的方法的示例工作流。一方面,本申请提供了一种用于鉴定或监测受试者的妊娠相关状态的方法100。方法100可以包括使用第一测定处理源自所述受试者的第一无细胞生物样品以生成第一数据集(如在操作102中)。接下来,至少部分基于生成的第一数据集,方法100可以任选地包括使用第二测定(例如,与第一测定不同)处理源自受试者的第二无细胞生物样品以生成以大于第一数据集的特异性指示妊娠相关状态的第二数据集。例如,可以对从第二无细胞血浆样品中提取的核糖核酸(RNA)分子进行测序以生成指示受试者妊娠相关状态的一组序列读数(如在操作104中)。在一些实施方案中,可在第一时间点从受试者获得第一无细胞生物样品以用于第一测定处理。然后,任选地可以在第二时间点从同一受试者获得第二无细胞生物样品以用于第二测定处理。在一些实施方案中,可以从受试者获得无细胞生物样品,然后等分以产生第一无细胞生物样品和第二无细胞生物样品,然后分别用第一测定和第二测定进行处理。接下来,可以使用经训练的算法处理第一数据集和/或第二数据集以确定受试者的妊娠相关状态(如在操作106中)。经训练的算法可以被配置为在超过50个独立样品上以至少约80%的准确度鉴定妊娠相关状态。然后可以以电子方式输出指示(例如,鉴定或提供指示)受试者的妊娠相关状态的存在或敏感性的报告(如在操作108中)。
测定无细胞生物样品
无细胞生物样品可以获自或源自人受试者(例如,妊娠的女性受试者)。无细胞生物样品在处理前可以储存在多种储存条件,例如不同的温度(例如,在室温、冷藏或冷冻条件下、25℃、4℃、-18℃、-20℃或-80℃)或不同的悬浮液(例如,EDTA收集管、无细胞RNA收集管或无细胞DNA收集管)下。
无细胞生物样品可以获自具有妊娠相关状态(例如,妊娠相关并发症)的受试者,获自疑似具有妊娠相关状态(例如,妊娠相关并发症)的受试者,或获自不具有或没有被怀疑具有妊娠相关状态(例如,妊娠相关并发症)的受试者。妊娠相关状态可以包括妊娠相关并发症,例如早产、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及异常的胎儿发育阶段或状态(例如,胎儿器官功能或发育异常)。妊娠相关状态可以包括足月产、正常的胎儿发育阶段或状态(例如,正常的胎儿器官功能或发育)、或不存在妊娠相关并发症(例如,早产、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及异常的胎儿发育阶段或状态(例如,胎儿器官功能或发育异常))。妊娠相关状态可以包括妊娠的定量评估,例如胎龄(例如,以天、周或月计)或预产期(例如,表示为预测或估计的日历日期或日历日期范围)。妊娠相关状态可以包括妊娠相关并发症的定量评估,例如妊娠相关并发症(例如,早产、分娩发作、妊娠相关高血压症(例如,子痫前期)、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产,产后并发症(例如,产后抑郁症、出血或失血过多、肺栓塞、心肌病、糖尿病、贫血和高血压症)、妊娠剧吐(晨吐)、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘(胎盘覆盖子宫颈)、宫内/胎儿生长受限、巨大胎儿(对于胎龄来说的大胎儿)、新生儿状况(例如,贫血、呼吸暂停、心动过缓和其他心脏缺陷、支气管肺发育不良或慢性肺病、糖尿病、腹裂、脑积水、高胆红素血症、低钙血症、低血糖、脑室内出血、黄疸、坏死性小肠结肠炎、动脉导管未闭、脑室周围白质软化、持续性肺动脉高压、红细胞增多症、呼吸窘迫综合征、早产儿视网膜病变和短暂性呼吸急促)、以及异常的胎儿发育阶段或状态(例如,胎儿器官功能或发育异常))的可能性、敏感性或风险(例如,表示为概率、相对概率、比值比、或风险评分或风险指数)。例如,妊娠相关状态可以包括未来(例如,在约1小时、约2小时、约4小时、约6小时、约8小时、约10小时、约12小时,约14小时、约16小时、约18小时、约20小时、约22小时、约24小时、约1.5天、约2天、约2.5天、约3天、约3.5天、约4天、约4.5天、约5天、约5.5天、约6天、约6.5天、约7天、约8天、约9天、约10天、约12天、约14天、约3周、约4周、约5周、约6周、约7周、约8周、约9周、约10周、约11周、约12周、约13周或超过约13周内)分娩发作的可能性或敏感性。
可以在治疗患有妊娠相关并发症的受试者之前和/或治疗之后采集无细胞生物样品。无细胞生物样品可以在治疗或治疗方案期间从受试者获得。可以从受试者获得多个无细胞生物样品以监测随时间的治疗效果。无细胞生物样品可以取自已知或疑似患有妊娠相关状态(例如,妊娠相关并发症)的受试者,通过临床检验无法对其进行明确的阳性或阴性诊断。样品可以取自疑似患有妊娠相关并发症的受试者。无细胞生物样品可以取自经历无法解释的症状的受试者,例如疲乏、恶心、体重减轻、酸痛、虚弱或出血。无细胞生物样品可以取自具有解释症状的受试者。无细胞生物样品可以取自处于因家族史、年龄、高血压或高血压前期、糖尿病或糖尿病前期、超重或肥胖、环境暴露、生活方式风险因素(例如,吸烟、饮酒或吸毒)或存在其他风险因素而发展妊娠相关并发症的风险中的受试者。
无细胞生物样品可以包含一种或多种能够被测定的分析物,例如适用于测定以生成转录组学数据的无细胞核糖核酸(cfRNA)分子、适用于测定以生成基因组学数据的无细胞脱氧核糖核酸(cfDNA)分子、适用于测定以生成蛋白质组学数据的蛋白质、适用于测定以生成代谢组学数据的代谢物、或其混合物或组合。一种或多种此类分析物(例如,cfRNA分子、cfDNA分子、蛋白质或代谢物)可以从受试者的一种或多种无细胞生物样品中分离或提取,用于使用一种或多种合适的测定进行下游测定。
从受试者获得无细胞生物样品后,可以处理无细胞生物样品以生成指示受试者妊娠相关状态的数据集。例如,无细胞生物样品的核酸分子的在一组与妊娠相关状态相关的基因位点方面的存在、不存在或定量评估(例如,在与妊娠相关状态相关的基因位点的RNA转录物或DNA的定量测量)、包括一组与妊娠相关状态相关的蛋白质中数据集蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据可以指示妊娠相关状态。处理从受试者获得的无细胞生物样品可以包括(i)使无细胞生物样品处于足以分离、富集或提取多种核酸分子、蛋白质和/或代谢物的条件,以及(ii)测定多种核酸分子、蛋白质和/或代谢物以生成数据集。
在一些实施方案中,从无细胞生物样品中提取多种核酸分子并进行测序以生成多个测序读数。核酸分子可以包括核糖核酸(RNA)或脱氧核糖核酸(DNA)。可以通过多种方法从无细胞生物样品中提取核酸分子(例如,RNA或DNA),例如MP Biomedicals的FastDNA试剂盒方案、Qiagen的QIAamp DNA无细胞生物迷你试剂盒、或Norgen Biotek的无细胞生物DNA分离试剂盒方案。提取方法可以从样品中提取所有RNA或DNA分子。可选地,提取方法可以从样品中选择性地提取部分RNA或DNA分子。从样品中提取的RNA分子可以通过逆转录(RT)转化为DNA分子。
测序可以通过任何合适的测序方法进行,例如大规模并行测序(MPS)、双端测序、高通量测序、二代测序(NGS)、鸟枪测序、单分子测序、纳米孔测序、半导体测序、焦磷酸测序、合成测序(SBS)、连接测序、杂交测序和RNA-Seq(Illumina)。
测序可以包括核酸扩增(例如,RNA或DNA分子)。在一些实施方案中,核酸扩增是聚合酶链反应(PCR)。可以进行适当轮数的PCR(例如,PCR、qPCR、逆转录酶PCR、数字PCR等)以将初始量的核酸(例如,RNA或DNA)充分扩增至用于后续测序的期望输入量。在一些情况下,PCR可用于靶核酸的全局扩增。这可以包括使用可以首先连接到不同的分子,然后使用通用引物进行PCR扩增的接头序列。可以使用多种市售试剂盒中的任何一种进行PCR,例如,由Life Technologies、Affymetrix、Promega、Qiagen等提供。在其他情况下,仅可扩增核酸群体中的某些靶核酸。可能与接头连接相结合的特异性引物,可用于选择性扩增用于下游测序的某些靶标。PCR可以包括一个或多个基因位点例如与妊娠相关状态相关的基因位点的靶向扩增。测序可以包括使用同步逆转录(RT)和聚合酶链反应(PCR),例如由Qiagen、NEB、Thermo Fisher Scientific或Bio-Rad提供的OneStep RT-PCR试剂盒方案。
可以对从无细胞生物样品中分离或提取的RNA或DNA分子加标签,例如,加有可识别的标签,以实现多个样品多路复用。任何数量的RNA或DNA样品可以被多路复用。例如,多路复用反应可以包含来自至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或超过100个初始无细胞生物样品的RNA或DNA。例如,多个无细胞生物样品可以标记有样品条形码,使得每个DNA分子可以追溯回所述DNA分子起源的样品(和受试者)。此类标签可以通过连接或通过使用引物的PCR扩增而连接至RNA或DNA分子。
在对核酸分子进行测序之后,可以对序列读数进行合适的生物信息学处理以生成指示妊娠相关状态的存在、不存在或相对评估的数据。例如,序列读数可以与一个或多个参考基因组(例如,一个或多个物种的基因组,例如人基因组)进行比对。比对的序列读数可以在一个或多个基因位点被定量以生成指示妊娠相关状态的数据集。例如,对应于与妊娠相关状态相关的多个基因位点的序列的定量可以生成指示妊娠相关状态的数据集。
可以在不经过任何核酸提取的情况下处理无细胞生物样品。例如,可以通过使用配置为选择性富集对应于多个与妊娠相关状态相关的基因位点的核酸(例如,RNA或DNA)分子的探针,鉴定或监测受试者的妊娠相关状态。探针可以是核酸引物。探针可以与来自多个与妊娠相关状态相关的基因位点或基因组区域中的一个或多个的核酸序列具有序列互补性。多个与妊娠相关状态相关的基因位点或基因组区域可以包括至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、至少约25种、至少约30种、至少约35种、至少约40种、至少约45种、至少约50种、至少约55种、至少约60种、至少约65种、至少约70种、至少约75种、至少约80种、至少约85种、至少约90种、至少约95种、至少约100种、或更多种不同的与妊娠相关状态相关的基因位点或基因组区域。多个与妊娠相关状态相关的基因位点或基因组区域可以包括选自由以下组成的组的一个或多个成员(例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、约25个、约30个、约35个、约40个、约45个、约50个、约55个、约60个、约65个、约70个、约75个、约80个、或更多个):ACTB、ADAM12、ALPP、ANXA3、APLF、ARG1、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH1、CSH2、CSHL1、CYP3A7、DAPP1、DCX、DEFA4、DGCR14、ELANE、ENAH、EPB42、FABP1、FAM212B-AS1、FGA、FGB、FRMD4B、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、Immune、ITIH2、KLF9、KNG1、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MEF2C、MMD、MMP8、MOB1B、NFATC2、OTC、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、PTGER3、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。与妊娠相关状态相关的基因位点或基因组区域可以与以下有关:胎龄、早产、预产期、分娩发作或其他妊娠相关状态或并发症,例如,如Ngo等人(“Noninvasive blood tests for fetal development predictgestational age and preterm delivery,”Science,360(6393),pp.1133-1136,08Jun2018)所述的基因位点,其通过引用以其全文并入本文。
探针可以是与一个或多个基因位点(例如,与妊娠相关状态相关的基因位点)的核酸序列(例如,RNA或DNA)具有序列互补性的核酸分子(例如,RNA或DNA)。这些核酸分子可以是引物或富集序列。使用对一个或多个基因位点(例如,与妊娠相关状态相关的基因位点)有选择性的探针进行的无细胞生物样品测定可以包括使用阵列杂交(例如,基于微阵列)、聚合酶链反应(PCR)或核酸测序(例如,RNA测序或DNA测序)。在一些实施方案中,DNA或RNA可以通过以下一种或多种测定:等温DNA/RNA扩增方法(例如,环介导等温扩增(LAMP)、解旋酶依赖性扩增(HDA)、滚环扩增(RCA)、重组酶聚合酶扩增(RPA))、免疫测定、电化学测定、表面增强拉曼光谱(SERS)、基于量子点(QD)的测定、分子倒置探针、液滴数字PCR(ddPCR)、基于CRISPR/Cas的检测(例如,CRISPR分型PCR(ctPCR)、特异性高灵敏度酶促报告基因解锁(SHERLOCK)、DNA核酸内切酶靶向CRISPR反式报告基因(DETECTR)和CRISPR介导的类似物多事件记录装置(CAMERA)、以及激光透射光谱(LTS)。
测定读数可以在一个或多个基因位点(例如,与妊娠相关状态相关的基因位点)定量以生成指示妊娠相关状态的数据。例如,对应于多个基因位点(例如,与妊娠相关状态相关的基因位点)的阵列杂交或聚合酶链反应(PCR)的定量可以生成指示妊娠相关状态的数据。测定读数可以包括定量PCR(qPCR)值、数字PCR(dPCR)值、数字液滴PCR(ddPCR)值、荧光值等,或其归一化值。测定可以是被配置为在家庭环境中进行的家用检验。
在一些实施方案中,使用多种测定处理受试者的无细胞生物样品。例如,第一测定可用于处理获自或源自受试者的第一无细胞生物样品以生成第一数据集;并且至少部分基于第一数据集,与所述第一测定不同的第二测定可用于处理获自或源自受试者的第二无细胞生物样品以生成指示所述妊娠相关状态的第二数据集。第一测定可用于筛选或处理一组受试者的无细胞生物样品,而第二或后续测定可用于筛选或处理一组受试者的较小亚组的无细胞生物样品。第一测定可以具有检测一种或多种妊娠相关状态(例如,妊娠相关并发症)的低成本和/或高灵敏度,顺从于筛选或处理相对大量组的受试者的无细胞生物样品。第二检测可以具有检测一种或多种妊娠相关状态(例如,妊娠相关并发症)的较高成本和/或较高特异性,顺从于筛选或处理相对较小组的受试者(例如,使用第一测定筛选的受试者的亚组)的无细胞生物样品。第二测定可以生成具有比使用第一测定生成的第一数据集更大的特异性(例如,对于一种或多种妊娠相关状态,例如妊娠相关并发症)的第二数据集。例如,可以使用cfRNA测定对大组受试者的一个或多个无细胞生物样品进行处理,然后对较小亚组的受试者进行代谢组学测定,反之亦然。可以至少部分基于第一测定的结果来选择较小亚组的受试者。
可选地,可以使用多种测定同时处理受试者的无细胞生物样品。例如,第一测定可用于处理获自或源自受试者的第一无细胞生物样品以生成指示妊娠相关状态的第一数据集;并且与第一测定不同的第二测定可用于处理获自或源自受试者的第二无细胞生物样品以生成指示妊娠相关状态的第二数据集。然后可以分析第一数据集和第二数据集中的任何一个或全部以评估受试者的妊娠相关状态。例如,可以基于第一数据集和第二数据集的组合生成单一诊断索引或诊断评分。作为另一实例,可以基于第一数据集和第二数据集生成单独的诊断索引或诊断评分。
可以使用代谢组学测定处理无细胞生物样品。例如,代谢组学测定可用于鉴定受试者的无细胞生物样品中多种与妊娠相关状态相关的代谢物中的每一种的定量测量(例如,指示存在、不存在或相对量)。代谢组学测定可以被配置为处理无细胞生物样品,例如受试者的血液样品或尿液样品(或其衍生物)。无细胞生物样品中与妊娠相关状态相关的代谢物的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。作为对应于与妊娠相关状态相关的基因的一种或多种代谢途径的结果,可以产生无细胞生物样品中的代谢物(例如,作为终产物或副产物)。测定无细胞生物样品的一种或多种代谢物可以包括从无细胞生物样品中分离或提取代谢物。代谢组学测定可用于生成指示受试者的无细胞生物样品中多种与妊娠相关状态相关的代谢物中的每一种的定量测量(例如,指示存在、不存在或相对数量)的数据集。
代谢组学测定可以分析无细胞生物样品中的多种代谢物,例如小分子、脂质、氨基酸、肽、核苷酸、激素和其他信号传导分子、细胞因子、矿物质和元素、多酚、脂肪酸、二羧酸、醇和多元醇、烷烃和烯烃、酮酸、糖脂、碳水化合物、羟基酸、嘌呤、前列腺素、儿茶酚胺、酰基磷酸酯、磷脂、环胺、氨基酮、核苷、甘油脂、芳香酸、维甲酸、氨基醇、蝶呤、类固醇、肉碱、白三烯、吲哚、卟啉、磷酸糖、辅酶A衍生物、葡萄糖醛酸、酮、磷酸糖、无机离子和气体、鞘脂、胆汁酸、醇磷酸盐、氨基酸磷酸盐、醛、醌、嘧啶、吡哆醛、三羧酸、酰基甘氨酸、钴胺素衍生物、硫辛酰胺、生物素和多胺。
代谢组学测定可以包括,例如,以下中的一种或多种:质谱(MS)、靶向MS、气相色谱(GC)、高效液相色谱(HPLC)、毛细管电泳(CE)、核磁共振(NMR)光谱、离子迁移谱、拉曼光谱、电化学测定或免疫测定。
可以使用甲基化特异性测定处理无细胞生物样品。例如,甲基化特异性测定可用于鉴定受试者的无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的甲基化的定量测量(例如,指示存在、不存在或相对数量)。甲基化特异性测定可以被配置为处理无细胞生物样品,例如受试者的血液样品或尿液样品(或其衍生物)。无细胞生物样品中与妊娠相关状态相关的基因位点的甲基化的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。甲基化特异性测定可用于生成指示受试者的无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的甲基化的定量测量(例如,指示存在、不存在或相对量)的数据集。
甲基化特异性测定可以包括,例如,以下中的一种或多种:甲基化感知测序(例如,使用亚硫酸氢盐处理)、焦磷酸测序、甲基化敏感单链构象分析(MS-SSCA)、高分辨率熔解分析(HRM)、甲基化敏感单核苷酸引物延伸(MS-SnuPE)、碱基特异性裂解/MALDI-TOF、基于微阵列的甲基化测定、甲基化特异性PCR、靶向亚硫酸氢盐测序、氧化亚硫酸氢盐测序、基于质谱的亚硫酸氢盐测序、或简化代表性亚硫酸氢盐序列(RRBS)。
可以使用蛋白质组学测定处理无细胞生物样品。例如,蛋白质组学测定可用于鉴定受试者的无细胞生物样品中多种与妊娠相关状态相关的蛋白质或多肽中的每一种的定量测量(例如,指示存在、不存在或相对量)。蛋白质组学测定可以被配置为处理无细胞生物样品,例如受试者的血液样品或尿液样品(或其衍生物)。无细胞生物样品中与妊娠相关状态相关的蛋白质或多肽的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。无细胞生物样品中的蛋白质或多肽可以作为对应于与妊娠相关状态相关的基因的一种或多种生化途径的结果而产生(例如,作为终产物或副产物)。测定无细胞生物样品的一种或多种蛋白质或多肽可以包括从无细胞生物样品中分离或提取蛋白质或多肽。蛋白质组学测定可用于生成指示受试者的无细胞生物样品中多种与妊娠相关状态相关的蛋白质或多肽中的每一种的定量测量的数据集(例如,指示存在、不存在或相对量)。
蛋白质组学测定可以分析无细胞生物样品中的多种蛋白质或多肽,例如在不同细胞条件下(例如,发育、细胞分化或细胞周期)产生的蛋白质。蛋白质组学测定可以包括,例如,以下中的一种或多种:基于抗体的免疫测定,Edman降解测定、基于质谱的测定(例如,基质辅助激光解吸/电离(MALDI)和电喷雾电离(ESI))、自上而下(top-down)蛋白质组学测定、自下而上(bottom-up)蛋白质组学测定、质谱免疫测定(MSIA)、稳定同位素标准捕获与抗肽抗体(SISCAPA)测定、荧光二维差示凝胶电泳(2-D DIGE)测定、定量蛋白质组学测定、蛋白质微阵列测定、或反相蛋白质微阵列测定。蛋白质组学测定可以检测蛋白质或多肽的翻译后修饰(例如,磷酸化、泛素化、甲基化、乙酰化、糖基化、氧化和亚硝基化)。蛋白质组学测定可以从数据库(例如,人蛋白质图谱、PeptideAtlas和UniProt)中鉴定或定量一种或多种蛋白质或多肽。
试剂盒
本申请提供了用于鉴定或监测受试者的妊娠相关状态的试剂盒。试剂盒可以包括用于鉴定受试者的无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)的探针。无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。探针可以对无细胞生物样品中多种与妊娠相关状态相关的基因位点的序列具有选择性。试剂盒可以包括使用探针处理无细胞生物样品以生成指示无细胞生物样品中的多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)的数据集的说明书。
试剂盒中的探针可以对无细胞生物样品中多种与妊娠相关状态相关的基因位点的序列具有选择性。试剂盒中的探针可以被配置为选择性地富集对应于多种与妊娠相关状态相关的基因位点的核酸(例如,RNA或DNA)分子。试剂盒中的探针可以是核酸引物。试剂盒中的探针可以与来自多种与妊娠相关状态相关的基因位点或基因组区域中的一个或多个的核酸序列具有序列互补性。多种与妊娠相关状态相关的基因位点或基因组区域可以包括至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种、至少16种、至少17种、至少18种、至少19种、至少20种、或更多种不同的与妊娠相关状态相关的基因位点或基因组区域。多种与妊娠相关状态相关的基因位点或基因组区域可以包括选自由以下组成的组的一个或多个成员:ACTB、ADAM12、ALPP、ANXA3、APLF、ARG1、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH1、CSH2、CSHL1、CYP3A7、DAPP1、DCX、DEFA4、DGCR14、ELANE、ENAH、EPB42、FABP1、FAM212B-AS1、FGA、FGB、FRMD4B、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、Immune、ITIH2、KLF9、KNG1、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MEF2C、MMD、MMP8、MOB1B、NFATC2、OTC、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、PTGER3、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。
试剂盒中的说明书可以包括使用对无细胞生物样品中的多种与妊娠相关状态相关的基因位点的序列具有选择性的探针来测定无细胞生物样品的说明书。这些探针可以是与来自多种与妊娠相关状态相关的基因位点中的一种或多种的核酸序列(例如,RNA或DNA)具有序列互补性的核酸分子(例如,RNA或DNA)。这些核酸分子可以是引物或富集序列。测定无细胞生物样品的说明书可以包括进行阵列杂交、聚合酶链反应(PCR)或核酸测序(例如,DNA测序或RNA测序)以处理无细胞生物样品的说明书,以生成指示无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)的数据集。无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。
试剂盒中的说明书可以包括测量和解释测定读数的说明书,测定读数可以在多种与妊娠相关状态相关的基因位点中的一种或多种被定量以生成指示无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)的数据集。例如,对应于多种与妊娠相关状态相关的基因位点的阵列杂交或聚合酶链反应(PCR)的定量可以生成指示无细胞生物样品中的多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量(例如,指示存在、不存在或相对量)的数据集。测定读数可以包括定量PCR(qPCR)值、数字PCR(dPCR)值、数字液滴PCR(ddPCR)值、荧光值等,或其归一化值。
试剂盒可以包括用于鉴定受试者的无细胞生物样品中多种与妊娠相关状态相关的代谢物中的每一种的定量测量(例如,指示存在、不存在或相对量)的代谢组学测定。无细胞生物样品中与妊娠相关状态相关的代谢物的定量测量(例如,指示存在、不存在或相对量)可以指示一种或多种妊娠相关状态。可以产生无细胞生物样品中的代谢物(例如,作为终产物或副产物),作为对应于与妊娠相关状态相关的基因的一种或多种代谢途径的结果。试剂盒可以包括有关从无细胞生物样品中分离或提取代谢物和/或用于使用代谢组学测定生成指示受试者的无细胞生物样品中多种与妊娠相关状态相关的代谢物中的每一种的定量测量(例如,指示存在、不存在或相对量)的数据集的说明书。
经训练的算法
在使用一种或多种测定处理源自受试者的一个或多个无细胞生物样品以生成一种或多种指示妊娠相关状态或妊娠相关并发症的数据集后,经训练的算法可用于处理一个或多个数据集(例如,在多种与妊娠相关状态相关的基因位点中的每一种)以确定妊娠相关状态。例如,经训练的算法可用于确定无细胞生物样品中多种与妊娠相关状态相关的基因位点中的每一种的序列的定量测量。经训练的算法可以被配置为以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或超过99%的准确度鉴定至少约25个、至少约50个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、至少约500个、或超过约500个独立样品的妊娠相关状态。
经训练的算法可以包括有监督的机器学习算法。经训练的算法可以包括分类和回归树(CART)算法。有监督的机器学习算法可以包括,例如,随机森林、支持向量机(SVM)、神经网络或深度学习算法。经训练的算法可以包括无有监督的机器学习算法。
经训练的算法可以被配置为接受多个输入变量并且基于多个输入变量产生一个或多个输出值。多个输入变量可以包括一个或多个指示妊娠相关状态的数据集。例如,输入变量可以包括对应于或对准于多种与妊娠相关状态相关的基因位点中的每一种的多种序列。多个输入变量还可以包括受试者的临床健康数据。
经训练的算法可以包括分类器,使得一个或多个输出值中的每一个包括指示分类器对无细胞生物样品的分类的固定数量的可能值(例如,线性分类器、逻辑回归分类器等)中的一个。经训练的算法可以包括二元分类器,使得一个或多个输出值中的每一个包括指示分类器对无细胞生物样品的分类的两个值中的一个(例如,{0,1}、{阳性,阴性}或{高风险,低风险})。经训练的算法可以是另一种类型的分类器,使得一个或多个输出值中的每一个包括指示分类器对无细胞生物样品的分类的超过两个值中的一个(例如,{0,1,2}、{阳性,阴性或不确定},或{高风险,中风险或低风险})。输出值可以包括描述性标签、数值或其组合。一些输出值可以包括描述性标签。此类描述性标签可提供受试者的疾病或病症状态的鉴定或指示,并且可以包括例如阳性、阴性、高风险、中风险、低风险或不确定。这种描述性标签可以提供对受试者妊娠相关状态治疗的鉴定,并且可以包括,例如,治疗干预、治疗干预的持续时间和/或适合治疗妊娠相关状况的治疗干预的剂量。这种描述性标签可以提供可能适合对受试者进行的二级临床检验的标识,并且可以包括,例如,成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检验(NIPT)或其任何组合。例如,此类描述性标签可提供受试者的妊娠相关状态的预后。作为另一实例,此类描述性标签可以提供受试者的妊娠相关状态(例如,以天数、周数或月数表示的估计胎龄)的相对评估。一些描述性标签可以映射至数值,例如,通过将“阳性”映射至1,将“阴性”映射至0。
一些输出值可以包括数值,例如二进制、整数或连续值。此类二进制输出值可以包括例如{0,1}、{阳性,阴性}或{高风险,低风险}。此类整数输出值可以包括例如{0,1,2}。此类连续输出值可以包括,例如,至少为0且不超过1的概率值。此类连续输出值可以包括,例如,至少为0的未归一化概率值。此类连续输出值可以指示受试者的妊娠相关状态的预后。一些数值可以映射至描述性标签,例如,将1映射至“阳性”,将0映射至“阴性”。
一些输出值可以基于一个或多个截止值来分配。例如,如果样品指示受试者有至少50%的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的二元分类可以分配“阳性”或1的输出值。例如,如果样品指示受试者有低于50%的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的二元分类可以分配“阴性”或0的输出值。在这种情况下,使用50%的单一截止值将样品分类为两个可能的二进制输出值中的一个值。单一截止值的实例可以包括约1%、约2%、约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%和约99%。
在另一实例中,如果样品指示受试者有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%,或更高的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的分类可以分配“阳性”或1的输出值。如果样品指示受试者有超过约50%、超过约55%、超过约60%、超过约65%、超过约70%、超过约75%、超过约80%、超过约85%、超过约90%、超过约91%超过、超过约92%、超过约93%、超过约94%、超过约95%、超过约96%、超过约97%、超过约98%、或超过约99%的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的分类可以分配“阳性”或1的输出值。
如果样品指示受试者有小于约50%、小于约45%、小于约40%、小于约35%、小于约30%、小于约25%、小于约20%、小于约15%、小于约10%、小于约9%、小于约8%、小于约7%、小于约6%、小于约5%、小于约4%、小于约3%、小于约2%、或小于约1%的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的分类可以分配“阴性”或0的输出值。如果样品指示受试者有不超过约50%、不超过约50%、不超过约45%、不超过约40%、不超过约35%、不超过约30%、不超过约25%、不超过约20%、不超过约15%、不超过约10%、不超过约9%、不超过约8%、不超过约7%、不超过约6%、不超过约5%、不超过约4%、不超过约3%,不超过约2%、或不超过约1%的概率患有妊娠相关状态(例如,妊娠相关并发症),则样品的分类可以分配“阴性”或0的输出值。
如果样品未被分类为“阳性”、“阴性”、1或0,则样品的分类可以分配“不确定”或2的输出值。在这种情况下,使用一组两个截止值将样品分类为三个可能的输出值中的一个值。一组截止值的实例可以包括{1%,99%}、{2%,98%}、{5%,95%}、{10%,90%}、{15%,85%}、{20%,80%}、{25%,75%}、{30%,70%}、{35%,65%}、{40%,60%}、和{45%,55%}。类似地,可以使用一组n个截止值将样品分类为n+1个可能的输出值中的一个值,其中n是任何正整数。
可以用多个独立训练样品训练经训练的算法。每个独立训练样品可以包括来自受试者的无细胞生物样品,通过分析无细胞生物样品获得的相关数据集(如本文别处所述),以及对应于无细胞生物样品的一个或多个已知输出值(例如,受试者的妊娠相关状态的临床诊断、预后、不存在、或治疗疗效)。独立训练样品可以包括获自或源自多名不同受试者的无细胞生物样品和相关数据集以及输出。独立训练样品可以包括在多个不同时间点(例如,定期,例如每周、每两周或每月)处从同一受试者获得的无细胞生物样品和相关数据集以及输出。独立训练样品可以与妊娠相关状态的存在相关联(例如,训练获自或源自已知有妊娠相关状态的多名受试者的包括无细胞生物样品的样品、相关数据集和输出)。独立训练样品可能与不存在妊娠相关状态相关(例如,训练获自或源自已知没有既往妊娠相关状态诊断或已收到妊娠相关状态阴性检验结果的多名受试者的包括无细胞生物样品的样品、相关数据集和输出)。
可以用至少约5个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、或至少约500个独立训练样品训练经训练的算法。独立训练样品可以包括与妊娠相关状态的存在相关的无细胞生物样品和/或与妊娠相关状态的不存在相关的无细胞生物样品。可以用不超过约500个、不超过约450个、不超过约400个、不超过约350个、不超过约300个、不超过约250个、不超过约200个、不超过约150个、不超过约100个、或不超过约50个与妊娠相关状态的存在相关的独立训练样品训练经训练的算法。在一些实施方案中,无细胞生物样品独立于用于训练经训练的算法的样品。
可以用与妊娠相关状态的存在相关的第一数量的独立训练样品和与妊娠相关状态的不存在相关的第二数量的独立训练样品训练经训练的算法。第一数量的与妊娠相关状态的存在相关的独立训练样品可以不超过第二数量的与妊娠相关状态的不存在相关的独立训练样品。第一数量的与妊娠相关状态的存在相关的独立训练样品可以等于第二数量的与妊娠相关状态的不存在相关的独立训练样品。第一数量的与妊娠相关状态的存在相关的独立训练样品可以大于第二数量的与妊娠相关状态的不存在相关的独立训练样品。
经训练的算法可以被配置为以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的准确度鉴定至少约5个、至少约10个、至少约15个、至少约20个、至少约25个、至少约30个、至少约35个、至少约40个、至少约45个、至少约50个、至少约100个、至少约150个、至少约200个、至少约250个、至少约300个、至少约350个、至少约400个、至少约450个、或至少约500个独立训练样品的妊娠相关状态。通过经训练的算法鉴定妊娠相关状态的准确度可以计算为被正确鉴定或分类为有或没有妊娠相关的状态的独立检验样品(例如,已知有妊娠相关状态的受试者或具有针对妊娠相关状态的阴性临床检验结果的受试者)的百分比。
经训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约20%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、在至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大的阳性预测值(PPV)鉴定妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的PPV可以计算为被鉴定或分类为具有妊娠相关状态的无细胞生物样品对应于真正具有妊娠相关状态的受试者的百分比。
经训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约20%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、在至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更大的阴性预测值(NPV)鉴定妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的NPV可以计算为被鉴定或分类为不具有妊娠相关状态的无细胞生物样品对应于真正不具有妊娠相关状态的受试者的百分比。
经训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更高的临床灵敏度鉴定妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的临床灵敏度可以计算为被正确鉴定或分类为有妊娠相关状态的与妊娠相关状态的存在相关的独立检验样品(例如,已知有妊娠相关状态的受试者)的百分比。
经训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%,至少约99.99%,至少约99.999%、或更高的临床特异性鉴定妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的临床特异性可以计算为被正确鉴定或分类为不具有妊娠相关状态的与不存在妊娠相关状态相关的独立检验样品(例如,具有妊娠相关状态阴性临床检验结果的受试者)的百分比。
经训练的算法可以被配置为使用至少约0.50、至少约0.55、至少约0.60、至少约0.65、至少约0.70、至少约0.75、至少约0.80、至少约0.81、至少约0.82、至少约0.83、至少约0.84、至少约0.85、至少约0.86、至少约0.87、至少约0.88、至少约0.89、至少约0.90、至少约0.91、至少约0.92、至少约0.93、至少约0.94、至少约0.95、至少约0.96、至少约0.97、至少约0.98、至少约0.99、或更多曲线下面积(AUC)鉴定妊娠相关状态。AUC可以计算为在将无细胞生物样品分类为有或没有妊娠相关状态中与经训练的算法相关的受试者工作特征(ROC)曲线(例如,ROC曲线下面积)的积分。
可以校正或调整经训练的算法以改善鉴定妊娠相关状态的性能、准确度、PPV、NPV、临床灵敏度、临床特异性或AUC中的一种或多种。可以通过校正经训练的算法的参数(例如,用于分类如本文别处所述的无细胞生物样品的一组截止值、或神经网络的权重)来校正或调整经训练的算法。可以在训练过程中或在训练过程完成后不断校正或调整经训练的算法。
在对经训练的算法进行初步训练之后,输入的亚组可以被鉴定为被纳入的最具影响力或最重要的,以便进行高质量分类。例如,多种与妊娠相关状态相关的基因位点的亚组可以被鉴定为被纳入的最有影响力或最重要的,以便进行妊娠相关状态(或妊娠相关状态的子类型)的高质量分类或鉴定。多种与妊娠相关状态相关的基因位点或其亚组可基于指示每种基因位点对进行妊娠相关状态的高质量分类或鉴定的影响或重要性的分类度量进行排序(或妊娠相关状态的亚型)。此类度量可用于降低,在一些情况下显著降低可用于将经训练的算法训练至期望性能水平的输入变量(预测变量)的数量(例如,基于期望最小准确度、PPV、NPV、临床灵敏度、临床特异性、AUC或其组合)。例如,如果在经训练的算法中用包括数十或数百个输入变量的多个训练经训练的算法导致超过99%的分类准确度,然后替代仅用多个之中的不超过约5个、不超过约10个、不超过约15个、不超过约20个、不超过约25个、不超过约30个、不超过约35个、不超过约40个、不超过约45个、不超过约50个、或不超过约100个此类最有影响或最重要的输入变量的选择亚组可能产生降低但仍可接受的分类准确度(例如,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%)。可以通过对整个多个输入变量进行排序并选择预定数量(例如,不超过约5个、不超过约10个、不超过约15个、不超过约20个、不超过约25个、不超过约30个、不超过约35个、不超过约40个、不超过约45个、不超过约50个、或不超过约100个)的具有最佳分类度量的输入变量来选择亚组。
鉴定或监测妊娠相关状态
在使用经训练的算法处理数据集之后,可以鉴定或监测受试者中妊娠相关状态或妊娠相关并发症。该鉴定可以至少部分基于在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据。
可以以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的准确度鉴定受试者中的妊娠相关状态。通过经训练的算法鉴定妊娠相关状态的准确度可以计算为被正确鉴定或分类为有或没有妊娠相关状态的独立检验样品(例如,已知有妊娠相关状态的受试者或有妊娠相关状态的阴性临床检验结果的受试者)的百分比。
可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更大的阳性预测值(PPV)鉴定受试者中的妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的PPV可以计算为被鉴定或分类为有妊娠相关状态的无细胞生物样品对应于真正有妊娠相关状态的受试者的百分比。
可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更大的阴性预测值(NPV)鉴定受试者中的妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的NPV可以计算为被鉴定或分类为没有妊娠相关状态的无细胞生物样品对应于真正没有妊娠相关状态的受试者的百分比。
可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%、或更高的临床灵敏度鉴定受试者中的妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的临床灵敏度可以计算为被正确鉴定或分类为妊娠相关状态的与妊娠相关状态的存在相关的独立检验样品(例如,已知有妊娠相关状态的受试者)的百分比。
可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%、或更高的临床特异性鉴定受试者中的妊娠相关状态。使用经训练的算法鉴定妊娠相关状态的临床特异性可以计算为被正确鉴定或分类为没有妊娠相关状态的与不存在妊娠相关状态相关的独立检验样品(例如,有妊娠相关状态的阴性临床检验结果的受试者)的百分比。
一方面,本申请提供了一种用于确定受试者处于早产风险中的方法,包括测定源自受试者的无细胞生物样品以生成以至少80%的特异性指示所述早产风险的数据集,并使用在独立于无细胞生物样品的样品上被训练的经训练的算法,以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的准确度确定受试者处于早产风险中。
在鉴定受试者中的妊娠相关状态之后,可以进一步鉴定妊娠相关状态的亚型(例如,从妊娠相关状态的多个亚型中选择)。可以至少部分基于在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,与妊娠相关状态相关的基因位点的RNA转录物或DNA的定量测量)、包括在一组妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据来确定妊娠相关状态的亚型。例如,受试者可以被鉴定为处于早产亚型的风险中(例如,选自早产的多个亚型)。在受试者被鉴定为处于早产亚型的风险中之后,可以至少部分基于受试者被鉴定为处于其风险中的早产亚型来选择对受试者的临床干预。在一些实施方案中,临床干预选自多种临床干预(例如,针对早产的不同亚型的临床指征)。
在一些实施方案中,经训练的算法可以确定受试者处于至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或更高的早产风险中。
经训练的算法可以以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%、或更高的准确度确定受试者处于早产风险中。
在鉴定受试者有妊娠相关状态后,可以任选地向受试者提供治疗干预(例如,开出适当的疗程以治疗受试者的妊娠相关状态)。治疗干预可以包括有效剂量的药物的处方、妊娠相关状态的进一步检验或评估、妊娠相关状态的进一步监测、分娩的诱导或抑制、或其组合。如果受试者目前正在接受针对妊娠相关状态疗程的治疗,则治疗干预可以包括后续不同的疗程(例如,以提高疗效,由于当前疗程无效)。
治疗干预可以包括建议受试者进行二次临床检验以确认妊娠相关状态的诊断。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检测(NIPT)、或其任何组合。
可以在一段时间内进行评估在一组与妊娠相关状态相关的基因位点方面的数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点的RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括与妊娠相关状态相关的代谢物的定量测量的代谢组数据以监测患者(例如,有妊娠相关状态或正在接受针对妊娠相关状态治疗的受试者)。在这种情况下,患者的数据集的定量测量可能会在疗程中发生变化。例如,由于有效治疗而具有降低的妊娠相关状态风险的患者的数据集的定量测量可能转向健康受试者(例如,没有妊娠相关并发症的受试者)的概况或分布。相反,例如,由于无效治疗具有增加的妊娠相关状态风险的患者的数据集的定量测量可能转向具有较高妊娠相关状态风险或更晚期妊娠相关状态的受试者的概况或分布。
可以通过监测用于治疗受试者的妊娠相关状态的疗程监测受试者的妊娠相关状态。监测可以包括在两个或更多个时间点评估受试者的妊娠相关状态。评估可以至少基于在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括两个或更多个时间点的每一次测定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异,可以指示一种或多种临床指征,例如(i)受试者的妊娠相关状态的诊断、(ii)受试者的妊娠相关状态的预后、(iii)增加的受试者妊娠相关状态的风险、(iv)降低的受试者妊娠相关状态的风险、(v)治疗受试者妊娠相关状态的疗程有疗效、以及(vi)治疗受试者妊娠相关状态的疗程的无疗效。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括一组与妊娠相关状态相关的蛋白质的数据集蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或更多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示受试者的妊娠相关状态的诊断。例如,如果在较早的时间点未在受试者中检测到妊娠相关状态,但在较晚的时间点在受试者中检测到妊娠相关状态,那么该差异指示受试者的妊娠相关状态的诊断。可以基于受试者的妊娠相关状态的诊断指示为该受试者制定临床活动或决定,例如为受试者开具新治疗干预。临床活动或决定可以包括建议受试者进行二次临床检验以确认妊娠相关状态的诊断。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检验(NIPT)、或其任何组合。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或更多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示受试者的妊娠相关状态的预后。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或更多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示受试者具有升高的妊娠相关状态的风险。例如,如果在较早的时间点和较晚的时间点均在受试者中检测到与妊娠相关状态,并且如果差异是阴性差异(例如,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据从较早的时间点到较晚的时间点增加),那么该差异可能表明该受试者的妊娠相关状态风险增加。可以根据这种妊娠相关状态风险增加的指示为该受试者制定临床活动或决定,例如,为受试者开具新治疗干预或转用治疗干预(例如,结束当前治疗并开具新治疗)。临床活动或决定可以包括建议受试者进行二次临床检验以确认妊娠相关状态风险增加。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学检测、羊膜穿刺术、非侵入性产前检测(NIPT)、或其任何组合。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点的RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量蛋白质组学数据、和/或包括在两个或更多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示受试者具有降低的妊娠相关状态风险。例如,如果在较早时间点和较晚时间点均在受试者中检测到妊娠相关状态,如果差异是阳性差异(例如,在一组与妊娠相关状态相关的基因位点方面数据集序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据从较早的时间点到较晚的时间点减少),那么该差异可能指示受试者具有降低的妊娠相关状态风险。可以基于受试者具有降低的妊娠相关状态风险的指示为该受试者制定临床活动或决定(例如,继续或结束当前治疗干预)。临床活动或决定可以包括建议受试者进行二次临床检验以确认妊娠相关状态风险降低。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检测(NIPT)、或其任何组合。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或更多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示用于治疗受试者的妊娠相关状态的疗程有疗效。例如,如果在较早的时间点在受试者中检测到妊娠相关状态,但在较晚的时间点未在受试者中检测到妊娠相关状态,那么该差异可以指示用于治疗受试者的妊娠相关状态的疗程有疗效。可以基于治疗受试者的妊娠相关状态的疗程有疗效的指示为受试者制定临床活动或决定,例如,继续或结束对受试者的当前治疗干预。临床活动或决定可以包括建议受试者进行二次临床检验以确认治疗妊娠相关状态的疗程有疗效。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检测(NIPT)、或其任何组合。
在一些实施方案中,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括在两个或多个时间点之间确定的一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据的差异可以指示用于治疗受试者的妊娠相关状态的疗程的无疗效。例如,如果在较早时间点和较晚时间点均在受试者中检测到妊娠相关状态,如果差异是阴性或零差异(例如,在一组与妊娠相关状态相关的基因位点方面数据集的序列读数的定量测量(例如,在与妊娠相关状态相关的基因位点方面RNA转录物或DNA的定量测量)、包括在一组与妊娠相关状态相关的蛋白质方面数据集的蛋白质的定量测量的蛋白质组学数据、和/或包括一组与妊娠相关状态相关的代谢物的定量测量的代谢组数据从较早的时间点到较晚的时间点增加或保持在恒定水平),并且如果在更早的时间点指示有效的治疗,那么该差异可以指示治疗受试者的妊娠相关状态的疗程的无疗效。可以基于治疗受试者的妊娠相关状态的疗程的无疗效的这种指示为该受试者制定临床活动或决定,例如,结束对受试者的当前治疗干预和/或转用(例如,开处方)不同的新治疗干预。临床活动或决定可以包括建议受试者进行二次临床检验以确认治疗妊娠相关状态的疗程无疗效。该二次临床检验可以包括成像检测、血液检验、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声波扫描、胸部X射线、正电子发射断层(PET)扫描、PET-CT扫描、无细胞生物细胞学、羊膜穿刺术、无创产前检测(NIPT)、或其任何组合。
另一方面,本申请提供了一种用于预测受试者的早产风险的计算机实现方法,包括:(a)接收受试者的临床健康数据,其中临床健康数据包括所述受试者的多个定量或分类测量;(b)使用经训练的算法处理受试者的临床健康数据,以确定指示受试者的早产风险的风险评分;以及(c)以电子方式输出指示受试者的早产风险的风险评分的报告。
在一些实施方案中,例如,临床健康数据包括受试者的一种或多种定量测量,例如年龄、体重、身高、体重指数(BMI)、血压、心率、血糖水平、既往妊娠次数和既往胎数。作为另一实例,临床健康数据可以包括一个或多个分类测量值,例如人种、种族、用药史或其他临床治疗史、吸烟史、饮酒史、日常活动或健康水平、基因检验结果、血液检验结果、影像学结果和胎儿筛查结果。
在一些实施方案中,用于预测受试者的早产风险的计算机实现方法使用计算机或移动设备应用程序执行。例如,受试者可以使用计算机或移动设备应用程序输入她自己的临床健康数据,包括定量和/或分类测量。然后计算机或移动设备应用程序可以使用经训练的算法处理临床健康数据以确定指示受试者的早产风险的风险评分。然后计算机或移动设备应用程序可以显示指示风险评分的报告,该风险评分指示受试者的早产风险。
在一些实施方案中,可以通过对受试者进行一项或多项后续临床检验来完善指示受试者的早产风险的风险评分。例如,医生可以根据初始风险评分建议受试者进行一项或多项后续临床检验(例如,超声成像或血液检验)。接下来,计算机或移动设备应用程序可以使用经训练的算法处理来自一项或多项后续临床检验的结果,以确定指示受试者的早产风险的更新风险评分。
在一些实施方案中,风险评分包括受试者在预定持续时间内早产的可能性。例如,预定持续时间可以是约1小时、约2小时、约4小时、约6小时、约8小时、约10小时、约12小时、约14小时、约16小时、约18小时、约20小时、约22小时、约24小时、约1.5天、约2天、约2.5天、约3天、约3.5天、约4天、约4.5天、约5天、约5.5天、约6天、约6.5天、约7天、约8天、约9天、约10天、约12天、约14天、约3周、约4周、约5周、约6周、约7周、约8周、约9周、约10周、约11周、约12周、约13周、或超过约13周。
输出妊娠相关状态报告
在受试者中鉴定妊娠相关状态或监测到升高的妊娠相关状态的风险后,可以以电子方式输出指示(例如,鉴定或提供指示)受试者的妊娠相关状态的报告。受试者可以未表现出妊娠相关状态(例如,没有妊娠相关状态的症状,例如妊娠相关并发症)。该报告可以呈现在用户的电子设备的图形用户界面(GUI)上。用户可以是受试者、看护人、医生、护士或其他卫生保健工作者。
报告可以包括一种或多种临床指征,例如(i)受试者的妊娠相关状态的诊断、(ii)受试者的妊娠相关状态的预后、(iii)升高的受试者的妊娠相关状态的风险、(iv)降低的受试者妊娠相关状态的风险、(v)治疗受试者的妊娠相关状态的疗程有疗效、(vi)治疗受试者的妊娠相关状态的疗程的无疗效。该报告可以包括基于这些一种或多种临床指征制定的一项或多项临床活动或决定。此类临床活动或决定可以针对治疗干预、诱导或抑制分娩、或进一步临床评估或检验受试者的妊娠相关状态。
例如,受试者的妊娠相关状态的诊断的临床指征可以伴随有为受试者开具新治疗干预的临床活动。作为另一实例,升高的受试者妊娠相关状态风险的临床指征可以伴随为受试者开具新治疗干预或转用治疗干预(例如,结束当前治疗并开具新治疗)的临床活动。作为另一实例,降低的受试者的妊娠相关状态风险的临床指征可以伴随继续或结束对受试者的当前治疗干预的临床活动。作为另一实例,用于治疗受试者的妊娠相关状态的疗程有疗效的临床指征可以伴随继续或结束对受试者的当前治疗干预的临床活动。作为另一实例,用于治疗受试者的妊娠相关状态的疗程无疗效的临床指征可以伴随结束对受试者的当前治疗干预和/或转用(例如,开处方)不同的新治疗干预的临床活动。
计算机系统
本申请提供了被编程以实现本申请的方法的计算机系统。图2示出了计算机系统201,其被编程或以其他方式配置为,例如,(i)训练和测试经训练的算法,(ii)使用经训练的算法处理数据以确定受试者的妊娠相关状态,(iii)确定指示受试者的妊娠相关状态的定量测量,(iv)鉴定或监测受试者的妊娠相关状态,以及(v)以电子方式输出指示受试者的妊娠相关状态的报告。
计算机系统201可以调节本申请的分析、计算和生成的各个方面,例如,(i)训练和测试经训练的算法、(ii)使用经训练的算法处理数据以确定受试者的妊娠相关状态、(iii)确定指示受试者的妊娠相关状态的定量测量、(iv)鉴定或监测受试者的妊娠相关状态和(v)以电子方式输出指示受试者的妊娠相关状态的报告。计算机系统201可以是用户的电子设备或相对于电子设备位于远程的计算机系统。电子设备可以是移动电子设备。
计算机系统201包括中央处理单元(CPU,本也称为“处理器”和“计算机处理器”)205,其可以是单核或多核处理器,也可以是多个处理器并行处理。计算机系统201还包括存储器或存储单元210(例如,随机存取存储器、只读存储器、闪存)、电子存储单元215(例如,硬盘)、用于与一个或多个其他系统通信的通信接口220(例如,网络适配器)和外围设备225,例如缓存、其他内存、数据存储器和/或电子显示适配器。存储器210、存储单元215、接口220和外围设备225通过通信总线(实线,诸如母板)与CPU 205通信。存储单元215可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统201可以在通信接口220的帮助下可操作地耦合至计算机网络(“网络”)230。网络230可以是因特网(Internet)、互联网(internet)和/或外联网、或与因特网通信的内联网和/或外联网。
在一些情况下,网络230是电信和/或数据网络。网络230可以包括一个或多个计算机服务器,其可以实现分布式计算,例如云计算。例如,一个或多个计算机服务器可以通过网络230(“云”)启用云计算以执行本申请的分析、计算和生成的各个方面,例如,(i)训练和测试经训练的算法,(ii)使用经训练的算法处理数据以确定受试者的妊娠相关状态,(iii)确定指示受试者的妊娠相关状态的定量测量,(iv)鉴定或监测受试者的妊娠相关状态,以及(v)以电子方式输出指示受试者的妊娠相关状态的报告。这种云计算可以由云计算平台提供,例如Amazon Web Services(AWS)、Microsoft Azure、Google云平台和IBM云。网络230,在一些情况下,在计算机系统201的帮助下,可以实现可以使耦合至计算机系统201的设备能够充当客户端或服务器的对等网络。
CPU 205可以包括一个或多个计算机处理器和/或一个或多个图形处理单元(GPU)。CPU 205可以执行一系列机器可读指令,这些指令可以体现在程序或软件中。指令可以存储在存储单元,例如存储器210。指令可以指向CPU 205,其可以随后编程或以其他方式配置CPU 205以实现本申请的方法。CPU 205执行的操作的实例可以包括获取、解码、执行和写回。
CPU 205可以是电路的一部分,例如集成电路。系统201的一个或多个其他组件可以被包括在电路中。在一些情况下,该电路是专用集成电路(ASIC)。
存储单元215可以存储文件,例如驱动程序、库和保存的程序。存储单元215可以存储用户数据,例如用户偏好和用户程序。在一些情况下,计算机系统201可以包括一个或多个在计算机系统201外部的附加数据存储单元,例如位于通过内联网或互联网与计算机系统201通信的远程服务器上。
计算机系统201可以通过网络230与一个或多个远程计算机系统通信。例如,计算机系统201可以与用户的远程计算机系统进行通信。远程计算机系统的实例包括个人计算机(例如便携式PC)、平板(slate或tablet)PC(例如
Figure BDA0003302183910000671
iPad、
Figure BDA0003302183910000672
GalaxyTab)、电话、智能手机(例如
Figure BDA0003302183910000673
iPhone、支持Android的设备、
Figure BDA0003302183910000674
)或个人数字助理。用户可以通过网络230访问计算机系统201。
如本文所述的方法可以通过存储在计算机系统201的电子存储单元上(例如,在存储器210或电子存储单元215上)的机器(例如,计算机处理器)可执行代码的方式实施。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可由处理器205执行。在一些情况下,可以从存储单元215检索代码并将其存储在存储器210上以供处理器205迅速存取。在一些情况下,可以排除电子存储单元215,并且机器可执行指令被存储在存储器210上。
代码可以被预编译和配置以与具有适于执行代码的处理器的机器一起使用,或者可以在运行时编译。代码可以以编程语言提供,可以选择该语言以使代码能够以预编译或编译后的方式执行。
本文提供的系统和方法的方面,例如计算机系统201,可以体现在编程中。该技术的各个方面可以被认为是“产品”或“制品”,通常以机器(或处理器)可执行代码和/或相关数据的形式承载于或包含在一种机器可读介质中。机器可执行代码可以存储在电子存储单元上,例如存储器(例如,只读存储器、随机存取存储器、闪存)或硬盘上。“存储”类型介质可以包括计算机的任何或所有有形内存,处理器等,或其相关模块,例如各种半导体存储器、磁带驱动器、光盘驱动器等,其可以随时为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。此类通信,例如,可以将软件从一台计算机或处理器加载到另一台计算机或处理器中,例如,从管理服务器或主机到应用服务器的计算机平台。因此,另一种可能承载软件元素的介质包括光波、电波和电磁波,例如跨本地设备之间的物理接口、有线和光纤陆线网络以及各种空中链路使用。承载这种波的物理元素,例如有线或无线链路、光链路等,也可被视为承载软件的介质。如本文所用,除非限制为非暂时性、有形“存储”介质,否则术语例如计算机或机器“可读介质”是指参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质,例如计算机可执行代码,可以采用多种形式,包括,但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,例如任何计算机等中的任何存储设备,例如可用于实现图中所示的数据库等。易失性存储介质包括动态存储器,例如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内总线的电线。载波传输介质可以采用电信号或电磁信号,或者声波或光波的形式,例如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,常见形式的计算机可读介质包括例如:软盘(floppy disk)、软磁盘(flexible disk)、硬盘、磁带、任何其他磁性介质、CD-ROM、DVD或DVD-ROM,任何其他光学介质、穿孔卡片纸带、任何其他带有孔图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒式磁带、传输数据或指令的载波、传输这种载波的电缆或链路,或计算机可以从中读取程序代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可能涉及将一个或多个指令的一个或多个序列传输至处理器以供执行。
计算机系统201可以包括电子显示器235或与其通信,该电子显示器235包括用于提供以下的用户界面(UI)240,例如,(i)指示训练和测试经训练的算法的视觉显示、(ii)指示受试者的妊娠相关状态的数据的视觉显示、(iii)受试者的妊娠相关状态的定量测量、(iv)鉴定受试者具有妊娠相关状态、或(v)指示受试者的妊娠相关状态的电子报告。UI的实例包括,但不限于图形用户界面(GUI)和基于网络的用户界面。
本申请的方法和系统可以通过一种或多种算法的方式实施。算法可以在由中央处理单元205执行时通过软件的方式实施。该算法可以,例如,(i)训练和测试经训练的算法,(ii)使用经训练的算法处理数据以确定受试者的妊娠相关状态,(iii)确定指示受试者的妊娠相关状态的定量测量,(iv)鉴定或监测受试者的妊娠相关状态,和(v)以电子方式输出指示受试者的妊娠相关状态的报告。
实施例
实施例1:受试者队列
如图3A所示,使用本申请的方法和系统,建立第一队列受试者(例如,孕妇)(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从第一队列受试者收集一个或多个生物样品(例如,各2或3个)并进行测定。例如,估计胎龄(在y轴显示)可以使用方法例如超声成像、末次月经(LMP)日期、或其组合确定,并且可以在0至约42周的范围内。第一队列包括从其收集不同样品类型用于不同研究(包括用于预测分娩、预测预产期、以及预测每名受试者胎儿的实际胎龄的研究)的受试者。图3B显示了基于在提取病历时每名参与者的年龄的第一队列中的参与者的分布。图3C显示了基于每名参与者的人种的第一队列中100名参与者的分布。图3D显示了基于在每个样品收集时每名参与者的估计胎龄和妊娠期的胎龄队列中所收集的样品的分布。图3E显示了基于所收集的样品的研究样品类型的第一队列中225个所收集的样品的分布。
如图4A所示,使用本申请的方法和系统,建立第二队列受试者(例如,孕妇)(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从第二队列受试者收集一个或多个生物样品(例如,各1、2或3个)并进行测定。例如,估计胎龄(在y轴显示)可以使用方法例如超声成像、末次月经(LMP)日期、或其组合确定,并且可以在0至约42周的范围内。第二队列包括从其收集不同样品类型用于不同研究(包括用于预测早产、预测分娩、预测预产期、以及预测每名受试者胎儿的实际胎龄的研究)的受试者。图4B显示了基于在病历提取时每名参与者的年龄的第二队列中的参与者的分布。图4C显示了基于每名参与者的人种的第二队列中128名参与者的分布。图4D显示了基于在每个样品收集时每名参与者的估计胎龄和妊娠期的第二队列中所收集的样品的分布。图4E显示了基于所收集的样品的研究样品类型的第二队列中160个所收集的样品的分布。
实施例2:预测预产期
如图5A所示,使用本申请的方法和系统,建立受试者(例如,孕妇)的预产期队列(在x轴显示患者识别号),在对应于每名受试者的胎儿的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从受试者收集一个或多个生物样品(例如,各1或2个)并进行测定。预产期队列包括如实施例1所述的来自第一队列和第二队列的受试者。预产期队列包括从其收集不同样品类型以用于不同研究(包括用于预测早产(例如,作为对照)、预测分娩、预测预产期、以及预测每名受试者胎儿的实际胎龄的研究)的受试者。
图5B基于样品收集日期和分娩日期之间的时间(分娩时间)的预产期队列中所收集的样品的分布。所有样品均在分娩日期前小于12周的妊娠后三个月收集,其中59个样品的分娩时间小于7.5周,43个样品的分娩时间小于5周。使用本申请的系统和方法,从分娩时间少于7.5周的59个样品中生成第一组预测模型,并且从分娩时间少于5周的43个样品中生成第二组预测模型。预测模型组包括使用估计预产期信息(例如,使用来自超声测量的估计胎龄确定)和没有使用估计预产期信息生成的预测模型。每个预测模型均包括具有弹性网络正则化的线性回归模型。预测模型的生成包括鉴定与相应队列中的预产期(例如,通过分娩时间测量)具有最高相关性(例如,最具预测性)的四组基因,包括(1)分娩时间少于7.5周,具有估计预产期信息,(2)分娩时间少于7.5周,不具有估计预产期信息,(3)分娩时间少于5周,具有估计预产期信息,以及(4)分娩时间少于5周,不具有估计预产期信息。这四组可预测预产期的基因列于表1中。
表1:按队列列出的预测预产期的基因集
Figure BDA0003302183910000711
Figure BDA0003302183910000721
Figure BDA0003302183910000731
Figure BDA0003302183910000741
图5C是显示在预产期的第一预测模型和第二预测模型中使用的基因重叠的维恩图。第一预测模型共有51个最具预测性的基因,第二预测模型共有49个最具预测性的基因;此外,两个预测模型之间仅有5个基因重叠。
图5D是预产期队列中的受试者的预测分娩时间(以周计)与观察到的(实际)分娩时间(以周计)之间的一致性的图。使用基于表1中列出的预测基因的相应预测模型生成预测的分娩结果时间。
图5E显示了用于预测预产期的预测模型的总结,包括使用分娩时间少于5周的样品的预测模型和使用分娩时间少于7.5周的样品的预测模型;不同的预测模型使用估计预产期信息(例如,使用从超声测量估计胎龄确定)和不使用估计预产期信息生成。评价了约总共15,000个基因用于预测模型(例如,作为基因发掘过程的一部分)。此外,在“<5周”和“<7.5周”样品组中,分别鉴定可以预测预产期的总共130个基因和62个基因。在“<5周”和“<7.5周”样品组中,分别鉴定被包含于不使用估计预产期信息(例如,来自超声)的用于预测预产期的预测模型中的总共28和47个基因。在“<5周”和“<7.5周”样品组中,分别鉴定被包含于使用估计预产期信息(例如,来自超声)的用于预测预产期的预测模型中的总共50和48个基因。
实施例3:预测胎龄(GA)
如图6A所示,使用本申请的方法和系统,建立受试者(例如,孕妇)的胎龄队列(在x轴显示患者识别号),在对应于每名受试者的估计胎龄(在y轴显示,按分娩时估计胎龄的递增顺序)的不同时间点从受试者收集一个或多个生物样品(例如,各1或2个)并进行测定。胎龄队列包括如实施例1所述的来自第一队列的受试者。胎龄队列包括从其收集不同样品类型用于不同研究(包括用于预测分娩、预测预产期、以及预测每名受试者的胎儿的实际胎龄的研究)的受试者。
图6B是显示整个转录组的相交互信息的视觉模型,其中多个胎龄相关基因的表达在整个妊娠过程中随胎龄而变化。如图所示,在整个妊娠过程中,不同的基因簇在不同时间(例如,不同的估计胎龄)表现出波动(例如,增加和减少)。例如,与妊娠早期相比,与先天免疫相关的基因(例如,RSAD2、HES1、HIST1H3G、CSHL1、CSH1、EXOSC4和AXL)以及与细胞粘附相关的基因(例如,PATL2、CCT6P1、ACSL4和TUBA4A)在妊娠后期表现出升高的表达。作为另一实例,与妊娠后期相比,与细胞周期相关的基因(例如UTRN、DOCK11、VPS50、ZMYM1、ZFAND1、FAM179B、C2CD5和ZNF236)在妊娠早期表现出升高的表达。作为另一实例,与妊娠后期相比,与RNA加工相关的基因(例如,ZBTB4、ADK、HBS1L、EIF2D、CDK13、CCDC61、POLDIP3和C8orf88)在妊娠早期和中期表现出升高的表达。因此,可以分析不同的基因集合或基因簇以用作“分子钟(molecular clock)”来追踪和预测妊娠过程中胎儿的不同胎龄。这些用于预测胎龄的基因集合列于表2中。此外,表3中按簇列出了用于预测胎龄的通路。
表2:按簇列出的预测胎龄的基因集合
Figure BDA0003302183910000761
表3:按簇列出的预测胎龄的通路
Figure BDA0003302183910000771
Figure BDA0003302183910000781
Figure BDA0003302183910000791
Figure BDA0003302183910000801
Figure BDA0003302183910000811
图6C是显示胎龄队列中的受试者的预测胎龄(以周计)与测量胎龄(以周计)之间的一致性的图。在图中受试者按主要人种(例如,白人、非黑人西班牙裔、亚洲人、非裔美国人、美洲原住民、混血(例如,两个或多个人种)或未知)进行分层。值得注意的是,数据显示,与许多生物表型不同,妊娠生物标志物模型(例如,基于一组与胎龄相关的生物标志物基因预测胎龄)不依赖于人种或种族。这一观察结果表明,妊娠的潜在分子钟在人种/种族之间是高度保守的,这具有使胎龄的通用测定可行的实际意义。基于表2中列出的预测基因和/或表3中列出的预测通路,使用胎龄预测模型(通过10倍交叉验证生成的Lasso模型)生成预测的胎龄。此外,表4列出了用于预测胎龄的基因的预测模型权重。
表4:用于预测胎龄的基因的预测模型权重
Figure BDA0003302183910000812
Figure BDA0003302183910000821
Figure BDA0003302183910000831
Figure BDA0003302183910000841
实施例4:预测早产(PTB)
如图7A-7B所示,使用本申请的方法和系统,建立受试者(例如,孕妇)的早产(PTB)队列,在对应于每名受试者的胎儿的估计胎龄的不同时间点从受试者收集一个或多个生物样品(例如,各1、2、3个或超过3个)并对其进行测定。早产队列包括如实施例1中所述的来自第二队列的受试者。早产队列包括从其收集不同样品类型用于不同研究(包括用于预测早产、预测分娩、预测预产期、以及预测每名受试者的胎儿的实际胎龄的研究)的受试者。如图所示,从早产队列的128名孕妇收集共160个样品并对其进行测定,其中118个样品从100名足月生产的妊娠受试者收集,42个样品从28名早产(例如,定义为在估计胎龄37周之前发生)的妊娠受试者收集。早产(PTB)队列包括一组早产病例样品(例如,来自早产女性)和一组早产对照样品(例如,来自足月产女性)。在早产病例样品和早产对照样品之间,收集时的胎龄分布相似(图7A),而分娩时胎龄的分布达到了统计学上显著程度地明显可区分(图7B)。
对早产病例样品和早产对照样品之间差异表达的基因进行分析,揭示151个基因上调,37个基因下调。例如,图7C-7E分别显示了早产病例样品(左)和早产对照样品(右)之间的B3GNT2、BPI和ELANE基因的差异基因表达。图7F显示了来自图7C-7E中所示的早产病例样品和早产对照样品的结果的图例。表5中列出了一组预测早产(PTB)的基因。此外,表6中列出了可用于预测早产(PTB)的基因的预测模型权重。
表5:早产预测基因集合(PTB)
Figure BDA0003302183910000851
Figure BDA0003302183910000861
Figure BDA0003302183910000871
Figure BDA0003302183910000881
Figure BDA0003302183910000891
Figure BDA0003302183910000901
表6:预测早产(PTB)基因的预测模型权重
Figure BDA0003302183910000902
Figure BDA0003302183910000911
图7G显示了显示早产预测模型在10倍交叉验证之间的性能的受试者工作特征(ROC)曲线。如图所示,用于预测早产的预测模型实现了0.90±0.08的平均曲线下面积(AUC),从而证明了用于预测早产的预测模型具有优异性能。
实施例5:预测预产期(DD)
使用本申请的系统和方法,开发预测模型以预测妊娠受试者的胎儿的预产期。例如,预测的预产期可以是天(例如,1天、2天、3天、4天、5天、6天、或7天)或周(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周、或45周)直至妊娠受试者的胎儿的预期分娩。作为另一实例,预测的预产期可以是预期妊娠受试者的胎儿的分娩发生的未来日期。
预测模型可以基于测定给定时间点(例如,在1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周周、39周、40周、41周、42周、43周、44周或45周的估计胎龄)的妊娠受试者的样品(例如,抽血)。
图8显示了在美国由产科医生估计的胎龄的阴道单胎分娩分布实例。该图显示,仅23.7%的阴道单胎分娩发生在估计胎龄40周时,而约67%的阴道单胎分娩发生在估计胎龄39-41周时。因此,分娩时间的这种变化说明需要使用本申请的系统和方法、使用分子钟更好地预测分娩日期。
图9A-9E显示了预测妊娠受试者胎儿的预产期的不同方法,包括预测实际日期(含误差)(图9A)、预测分娩周(或其他时间窗)(图9B)、预测是否分娩被预期在某个时间边界之前还是之后发生(图9C)、预测分娩预期发生在多个时间段(例如,6个时间段)中的哪个时间段中(图9D)、以及预测提前分娩或延迟分娩的相对风险或相对可能性(图9E)。
例如,预产期预测模型可用于预测实际日期(含错误)(图9A)。例如,预测的预产期可以是天(例如,1天、2天、3天、4天、5天、6天、或7天)或周(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周、或45周)直至妊娠受试者胎儿的预期分娩。作为另一实例,预测的预产期可以是妊娠受试者的胎儿的分娩被预期发生的未来日期。作为另一实例,预测的预产期可以是妊娠受试者的胎儿的分娩被预期发生的估计胎龄(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周、或45周)。预测的预产期可以与针对预测的预产期的误差或置信区间(例如,1天、2天、3天、4天、5天、6天、7天、2周、3周或4周)一起提供。预测的预产期可以与针对预测的预产期的估计可能性或置信度(例如,约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)一起提供。
作为另一实例,预产期预测模型可用于预测分娩周(或其他时间窗)(图9B)。例如,预测的预产期可以是数周(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周或45周周)直至妊娠受试者胎儿的预期分娩。作为另一实例,预测的预产期可以是妊娠受试者的胎儿预期将在该周分娩e未来一周(例如,日历周)。作为另一实例,预测的预产期可以是妊娠受试者的胎儿的分娩被预期发生的估计胎龄(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周、或45周)。预测的预产期可以与针对预测的预产期的估计可能性或置信度(例如,约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)一起提供。
作为另一实例,预产期预测模型可用于预测是否分娩被预期在某个时间边界之前或之后发生(图9C)。例如,时间边界可以是数周(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周)、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周、24周、25周、26周、27周、28周、29周、30周、31周、32周、33周、34周、35周、36周、37周、38周、39周、40周、41周、42周、43周、44周或45周)的估计胎龄。例如,时间边界可以是40周的估计胎龄。
作为另一实例,预产期预测模型可用于预测分娩被预期发生在多个时间段(例如,6个时间段)中的哪个时间段中(图9D)。例如,时间段(例如,时间窗)可以是相等的时间范围(例如,1周、2周、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、13周、14周、15周、16周、17周、18周、19周、20周、21周、22周、23周;或1个月、2个月、3个月、4个月、或5个月;或妊娠早期、中期或晚期中的一期)。预测的预产期可以与针对预测的预产期时间段或时间窗的估计可能性或置信度(例如,约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)一起提供。
作为另一实例,预产期预测模型可用于预测提前分娩或延迟分娩的相对风险或相对可能性(图9E)。例如,预测可以包括约10%、20%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的提前分娩或延迟分娩的相对风险或相对可能性。早产可定义为估计胎龄少于40周的预产期,而延迟分娩可以定义为估计胎龄超过40周的预产期。
使用从妊娠受试者的胎龄(GA)队列收集的样品训练预产期预测模型,所有这些妊娠受试者具有34周至36周的估计胎龄均。使用270个和312个匹兹堡样品(其中约半数是高加索人,半数是AA)的队列获得训练数据集,其中41个样品被指定为实验室离群值而未使用,1个样品具有低于CPM的离群值。此外,使用19个GAPPS样品(其中大多数是高加索人)的队列(003_GA)和47个验证GAPPS样品的队列(009_VG)(其中所有的具有34周至36周的估计胎儿胎龄,并且其中大部分是高加索人)。
进行基因发掘以开发如下的预产期预测模型。使用一组241个输入基因,包括候选标记基因。使用训练数据集,这些候选标记基因的一个亚组被鉴定为具有大于0.5的高中值(log2_CPM)值。使用一组248个基因(如表7所示)对训练样品的实际分娩时间(例如,对于前100个基因-7周vs.-2周,以及对于前100个基因-6周vs.-3周)进行方差分析(ANOVA)。进行Pearson线性相关以鉴定候选标记基因中与预产期具有最强统计相关性的前100个基因。测试许多不同的预测模型以预测分娩时间段。第一,使用护理标准,其中基于40周胎龄的预测的预产期预测分娩时间。第二,仅使用超声数据估计胎龄,使用collectionga队列作为弹性网络预测模型的输入。第三,仅使用cfDNA估计胎龄,使用基因的log2_CPM输入和混杂因素(例如,胎次、BMI、吸烟状况等)作为弹性网络预测模型的输入。第四,使用基因的log2_CPMs输入、混杂因素和输入到弹性网络预测模型的collectionga,使用cfDNA加超声估计胎龄。
表7:ANOVA模型中使用的248个基因集
Figure BDA0003302183910000951
Figure BDA0003302183910000961
图10显示了为开发预产期预测模型(例如分类器)而执行的数据工作流。首先,将训练数据(n=271个样品)随机分成4组,每组67个样品。接下来,使用4个拆分组中的3个的不同组合训练模型,这些组合通过一次不考虑1个拆分组而创建(例如,拆分1、2、3的第一组合;拆分2、3、4的第二组合;拆分1、3、4的第三组合;以及拆分1、2、4的第四组合;各n=203个样品)。接下来,使用n=271个样品执行交叉验证,其中4个模型中的每个均在保留的拆分组(n=67个样品)上进行测试。接下来,对每个模型进行独立验证,从而在独立数据(例如,测试数据集)上测试模型。
图11A-11B分别显示了在270和310名患者上进行训练的预产期预测模型的预测误差。该图显示了具有给定预测误差(例如,分娩时间段,时间段宽为1周,其中正值表示分娩发生在预测预产期之后,负值表示分娩发生在预测预产期之前)的样品百分比。这些数字显示,与标准护理(40周)模型和仅超声模型相比,使用仅cfRNA模型或cfRNA加超声模型在预产期预测中的准确度更高且误差更低。
实施例6:预测早产(PTB)
使用本申请的系统和方法,开发了一种预测模型以预测妊娠受试者的早产(PTB)风险。从高加索人受试者的队列(如实施例4中所述)获得的数据集使用修饰基因列表进行重新分析,如表8所示。图12显示了早产预测模型的受试者工作特征(ROC)曲线,使用针对从高加索人受试者的队列获得的一组79个样品的一组22个基因。在总共79个样品中,23个具有早期PTB(定义为在估计胎龄34周之前分娩)。ROC曲线的平均曲线下面积(AUC)为0.91±0.10。
表8:预测早产(PTB)的基因(高加索人)
基因
SLC2A5
ESPN
LOX
IRX3
SPDYC
BEX1
ANK3
MTRNR2L12
MAPK10
B3GNT2
COL6A3
DDX11L10
NBPF3
U2AF1
MT1X
PHGDH
HBG2
RPL23AP7
CTD-3092A11.1
HLA-G
COL4A2
GSTM5
此外,图13A示出了早产预测模型的受试者工作特征(ROC)曲线,使用针对从具有非洲人血统或非裔美国人血统的受试者队列(AA队列)获得的一组45个样品的一组基因。在总共45个样品中,18个具有早期PTB(定义为在估计胎龄34周之前分娩)。ROC曲线的平均曲线下面积(AUC)为0.82±0.08。
图13B显示了针对三个不同AA队列(队列1、队列2和队列3)的早产预测模型的基因集合,包括RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2。
图14A显示了使用从妊娠受试者获得的单个身体样品(例如,单次抽血)用于进行用于评估多个妊娠相关状况的多个测定的工作流。在妊娠期间可以进行数次抽血,以研究和检验妊娠进展。检验在特定时间点(例如,T1、T2和T3)获得的抽血,以确定数周后可能发生的特定妊娠相关并发症的风险。对于胎儿发育,在每次抽血(T1、T2和T3)时进行纵向检验,以提供胎儿发育进展的结果。例如,可以在时间T1(例如,在妊娠的前三个月期间)从妊娠受试者获得第一血液样品,可以在时间T2(例如,在妊娠的第二个三个月期间)从妊娠受试者获得第二血液样品,并且可以在时间T3(例如,在妊娠的后三个月期间)从妊娠的受试者获得第三血液样品。在时间T1获得的血液样品可用于测定在妊娠早期或妊娠的前三个月可检测或可预测的妊娠相关状况,例如早产、自然流产、PE、GDM、胎儿发育。在时间T2获得的血液样品可用于测定在妊娠中期或妊娠的第二个三个月可检测或可预测的妊娠相关状况,例如早产、PE、GDM、胎儿发育和IUGR。在时间T3获得的血液样品可用于测定在妊娠晚期或妊娠的后三个月可检测或可预测的妊娠相关状况,例如预产期、胎儿发育、胎盘增生、IUGR、产前代谢疾病和来自RNA的新生儿代谢遗传病。
图14B可以从沿妊娠受试者的妊娠进展的单次抽血检验的状况组合。在时间T1获得的血液样品可用于测定在妊娠早期或妊娠的前三个月可检测或可预测的妊娠相关状况,例如早产、子痫前期(妊娠相关高血压症)、妊娠糖尿病、自然流产和胎儿发育(正常和异常)。在时间T2获得的血液样品可用于测定在妊娠中期或妊娠的第二个三个月可检测或可预测的妊娠相关状况,例如胎龄、子痫前期(妊娠相关高血压症)、妊娠糖尿病、自然流产、前置胎盘、胎盘增生(出血或失血过多)、胎膜早破(PROM)、胎儿发育(正常和异常)、以及宫内/胎儿生长受限(IUGR)。在时间T3获得的血液样品可用于测定在妊娠晚期或妊娠的后三个月可检测或可预测的妊娠相关状况,例如预产期、先天性疾病、前置胎盘、植入性胎盘(出血或失血过多)、胎膜早破(PROM)、胎儿发育(正常和异常)和宫内/胎儿生长受限(IUGR)、产后抑郁症、产前代谢遗传病、产后心肌病、以及来自RNA的新生儿代谢遗传病。
虽然已经在本文中示出和描述本发明的优选实施例方案,但是对于本领域技术人员来说显而易见的是,这些实施方案仅通过示例的方式提供。本发明不旨在受限于说明书中提供的具体实施例。虽然已经参考上述说明书对本发明进行描述,但是本文对实施方案的描述和示例并不表示被解释为限制性的。在不背离本发明的情况下,本领域技术人员目前可进行诸多修改、变化和替换。此外,应当理解,本发明的所有方面不限于本文阐述的具体描述、配置或相对比例,这些具体描述、配置或相对比例取决于各种条件和变量。应当理解,在实践本发明时可以采用对本文描述的本发明的实施方案的各种替代。因此预期本发明还应涵盖任何此类替代、修改、变化或等同方式。以下权利要求旨在限定本发明的范围,并且由此涵盖在这些权利要求及其等同物范围内的方法和结构。

Claims (153)

1.一种用于鉴定受试者的妊娠相关状态的存在或敏感性的方法,包括测定源自所述受试者的无细胞生物样品中的转录物或代谢物以检测生物标志物组,并使用经训练的算法分析所述生物标志物组以确定所述妊娠相关状态的所述存在或敏感性。
2.根据权利要求1所述的方法,进一步包括测定源自所述受试者的所述无细胞生物样品中的所述转录物以检测所述生物标志物组。
3.根据权利要求2所述的方法,其中使用核酸测序测定所述转录物。
4.根据权利要求1所述的方法,进一步包括测定源自所述受试者的所述无细胞生物样品中的所述代谢物以检测所述生物标志物组。
5.根据权利要求4所述的方法,其中使用代谢组学测定来测定所述代谢物。
6.一种用于鉴定受试者的妊娠相关状态的存在或敏感性的方法,进一步包括测定源自所述受试者的无细胞生物样品以检测生物标志物组,并使用经训练的算法分析所述生物标志物组以至少约80%的准确度确定至少三种不同的妊娠相关状态的组中的所述妊娠相关状态的所述存在或敏感性。
7.根据权利要求1-6中任一项所述的方法,其中,所述妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。
8.根据权利要求6所述的方法,其中,所述妊娠相关状态是早产的亚型,并且所述至少三种不同的妊娠相关状态包括早产的至少两种不同的亚型。
9.根据权利要求8所述的方法,其中,所述早产的亚型是早产的分子亚型,并且所述早产的至少两种不同的亚型包括早产的至少两种不同的分子亚型。
10.根据权利要求9所述的方法,其中,所述早产的分子亚型选自由既往早产史、自然早产、种族特异性早产风险和早产胎膜早破(PPROM)组成的组。
11.根据权利要求6所述的方法,进一步包括至少部分基于所述妊娠相关状态的所述存在或敏感性鉴定对所述受试者的临床干预。
12.根据权利要求9所述的方法,其中所述临床干预选自多种临床干预。
13.根据权利要求6所述的方法,其中,所述生物标志物组包括与预产期相关的基因位点,所述基因位点选自由表1和表7中列出的基因组成的组。
14.根据权利要求6所述的方法,其中,所述生物标志物组包括与胎龄相关的基因位点,所述基因位点选自由表2中列出的基因组成的组。
15.根据权利要求6所述的方法,其中,所述生物标志物组包括与早产相关的基因位点,所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。
16.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少5个不同的基因位点。
17.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少10个不同的基因位点。
18.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少25个不同的基因位点。
19.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少50个不同的基因位点。
20.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少100个不同的基因位点。
21.根据权利要求13-15中任一项所述的方法,其中,所述生物标志物组包括至少150个不同的基因位点。
22.一种用于鉴定或监测受试者的妊娠相关状态的存在或敏感性的方法,包括:
(a)使用第一测定处理源自所述受试者的无细胞生物样品以生成第一数据集;
(b)使用第二测定处理源自所述受试者的阴道或宫颈生物样品以生成包括所述阴道或宫颈生物样品的微生物组谱的第二数据集;
(c)使用经训练的算法处理至少所述第一数据集和所述第二数据集以确定所述妊娠相关状态的所述存在或敏感性,所述经训练的算法具有在至少50个独立样品上至少约80%的准确度;和
(d)以电子方式输出指示所述受试者的所述妊娠相关状态的所述存在或敏感性的报告。
23.根据权利要求22所述的方法,其中,所述第一测定包括使用源自所述无细胞生物样品的无细胞核糖核酸(cfRNA)分子生成转录组学数据,使用源自所述无细胞生物样品的无细胞脱氧核糖核酸(cfDNA)分子生成基因组学数据,使用源自所述第一无细胞生物样品的蛋白质生成蛋白质组学数据,或使用源自所述第一无细胞生物样品的代谢物生成代谢组学数据。
24.根据权利要求22所述的方法,其中,所述无细胞生物样品来自所述受试者的血液。
25.根据权利要求22所述的方法,其中,所述无细胞生物样品来自所述受试者的尿液。
26.根据权利要求22所述的方法,其中,所述第一数据集包括与所述妊娠相关状态相关的第一组生物标志物。
27.根据权利要求26所述的方法,其中,所述第二数据集包括与所述妊娠相关状态相关的第二组生物标志物。
28.根据权利要求27所述的方法,其中,所述第二组生物标志物与所述第一组生物标志物不同。
29.根据权利要求22所述的方法,其中,所述妊娠相关状态选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。
30.根据权利要求29所述的方法,其中,所述妊娠相关状态包括早产。
31.根据权利要求29所述的方法,其中,所述妊娠相关状态包括胎龄。
32.根据权利要求22所述的方法,其中,所述无细胞生物样品选自由无细胞核糖核酸(cfRNA)、无细胞脱氧核糖核酸(cfDNA)、无细胞胎儿DNA(cffDNA)、血浆、血清、尿液、唾液、羊水及其衍生物组成的组。
33.根据权利要求22所述的方法,其中,所述无细胞生物样品使用乙二胺四乙酸(EDTA)收集管、无细胞RNA收集管或无细胞脱氧核糖核酸(DNA)收集管从所述受试者获得或得到。
34.根据权利要求22所述的方法,进一步包括分级分离所述受试者的全血液样品以获得所述无细胞生物样品。
35.根据权利要求22所述的方法,其中,所述第一测定包括无细胞核糖核酸(cfRNA)测定或代谢组学测定。
36.根据权利要求35所述的方法,其中,所述代谢组学测定包括靶向质谱(MS)或免疫测定。
37.根据权利要求22所述的方法,其中,所述无细胞生物样品包括无细胞核糖核酸(cfRNA)或尿液。
38.根据权利要求22所述的方法,其中,所述第一测定或所述第二测定包括定量聚合酶链反应(qPCR)。
39.根据权利要求22所述的方法,其中,所述第一测定或所述第二测定包括被配置为在家庭环境中进行的家用检验。
40.根据权利要求22所述的方法,其中,所述经训练的算法以至少约80%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
41.根据权利要求22所述的方法,其中,所述经训练的算法以至少约90%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
42.根据权利要求22所述的方法,其中,所述经训练的算法以至少约95%的灵敏度确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
43.根据权利要求22所述的方法,其中,所述经训练的算法以至少约70%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
44.根据权利要求22所述的方法,其中,所述经训练的算法以至少约80%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
45.根据权利要求22所述的方法,其中,所述经训练的算法以至少约90%的阳性预测值(PPV)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
46.根据权利要求22所述的方法,其中,所述经训练的算法以至少约0.90的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
47.根据权利要求22所述的方法,其中,所述经训练的算法以至少约0.95的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
48.根据权利要求22所述的方法,其中,所述经训练的算法以至少约0.99的曲线下面积(AUC)确定所述受试者的所述妊娠相关状态的所述存在或敏感性。
49.根据权利要求22所述的方法,其中,所述受试者对于以下中的一种或多种是无症状的:早产、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、受试者胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及异常的胎儿发育阶段或状态。
50.根据权利要求22所述的方法,其中,使用与所述妊娠相关状态的所述存在或敏感性相关的至少约10个独立训练样品训练所述经训练的算法。
51.根据权利要求22所述的方法,其中,使用与所述妊娠相关状态的所述存在或敏感性相关的不超过约100个独立训练样品训练所述经训练的算法。
52.根据权利要求22所述的方法,其中,使用与所述妊娠相关状态的存在或敏感性相关的第一组独立训练样品和与所述妊娠相关状态的不存在或无敏感性相关的第二组独立训练样品训练所述经训练的算法。
53.根据权利要求22所述的方法,其中,(c)包括使用所述经训练的算法或另一经训练的算法处理所述受试者的临床健康数据组以确定所述妊娠相关状态的所述存在或敏感性。
54.根据权利要求22所述的方法,其中,(a)包括(i)使所述无细胞生物样品经受足以分离、富集或提取核糖核酸(RNA)分子、脱氧核糖核酸(DNA)分子、蛋白质或代谢物的组的条件,以及(ii)使用所述第一测定分析所述RNA分子、DNA分子、蛋白质或代谢物的组以生成所述第一数据集。
55.根据权利要求54所述的方法,进一步包括从所述无细胞生物样品中提取核酸分子组,并且对所述核酸分子组进行测序以生成测序读数组,其中所述第一数据集包括所述测序读数组。
56.根据权利要求22所述的方法,其中,(b)包括(i)使所述阴道或宫颈生物样品经受足以分离、富集或提取微生物群的条件,和(ii)使用所述第二测定分析所述微生物群以生成所述第二数据集。
57.根据权利要求55所述的方法,其中,所述测序是大规模并行测序。
58.根据权利要求55所述的方法,其中,所述测序包括核酸扩增。
59.根据权利要求58所述的方法,其中,所述核酸扩增包括聚合酶链反应(PCR)。
60.根据权利要求59所述的方法,其中所述测序包括使用基本同步逆转录(RT)和聚合酶链反应(PCR)。
61.根据权利要求55所述的方法,进一步包括使用被配置为选择性富集对应于一个或多个基因位点的组的所述核酸分子组的探针。
62.根据利要求61所述的方法,其中,所述探针是核酸引物。
63.根据权利要求61所述的方法,其中,所述探针与所述一个或多个基因位点的所述组的核酸序列具有序列互补性。
64.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括选自由以下组成的组的至少一个基因位点:ACTB、ADAM12、ALPP、ANXA3、APLF、ARG1、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH1、CSH2、CSHL1、CYP3A7、DAPP1、DCX、DEFA4、DGCR14、ELANE、ENAH、EPB42、FABP1、FAM212B-AS1、FGA、FGB、FRMD4B、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、Immune、ITIH2、KLF9、KNG1、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MEF2C、MMD、MMP8、MOB1B、NFATC2、OTC、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、PTGER3、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。
65.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括至少5个不同的基因位点。
66.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括至少10个不同的基因位点。
67.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括与早产相关的基因位点,其中所述基因位点选自由以下组成的组:ADAM12、ANXA3、APLF、AVPR1A、CAMP、CAPN6、CD180、CGA、CGB、CLCN3,CPVL、CSH2、CSHL1、CYP3A7、DAPP1、DGCR14、ELANE、ENAH、FAM212B-AS1、FRMD4B、GH2、HSPB8、Immune、KLF9、KRT8、LGALS14、LTF、LYPLAL1、MAP3K7CL、MMD、MOB1B、NFATC2、P2RY12、PAPPA、PGLYRP1、PKHD1L1、PKHD1L1、PLAC1、PLAC4、POLE2、PPBP、PSG1、PSG4、PSG7、RAB11A、RAB27B、RAP1GAP、RGS18、RPL23AP7、TBC1D15、VCAN、VGLL1、B3GNT2、COL24A1、CXCL8和PTGS2。
68.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括与胎龄相关的基因位点,所述基因位点选自由以下组成的组:ACTB、ADAM12、ALPP、ANXA3、ARG1、CAMP、CAPN6、CGA、CGB、CSH1、CSH2、CSHL1、CYP3A7、DCX、DEFA4、EPB42、FABP1、FGA、FGB、FRZB、FSTL3、GH2、GNAZ、HAL、HSD17B1、HSD3B1、HSPB8、ITIH2、KNG1、LGALS14、LTF、MEF2C、MMP8、OTC、PAPPA、PGLYRP1、PLAC1、PLAC4、PSG1、PSG4、PSG7、PTGER3、S100A8、S100A9、S100P、SERPINA7、SLC2A2、SLC38A4、SLC4A1、VGLL1、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2。
69.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括与与预产期相关的基因位点,所述基因位点选自由表1和表7中列出的基因组成的组。
70.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括与胎龄相关的基因位点,所述基因位点选自由表2中列出的基因组成的组。
71.根据权利要求61所述的方法,其中,所述一个或多个基因位点的所述组包括与早产相关的基因位点,所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。
72.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少5个不同的基因位点。
73.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少10个不同的基因位点。
74.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少25个不同的基因位点。
75.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少50个不同的基因位点。
76.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少100个不同的基因位点。
77.根据权利要求69-71中任一项所述的方法,其中,所述一个或多个基因位点的所述组包括至少150个不同的基因位点。
78.根据权利要求22所述的方法,其中,在不经过核酸分离、富集或提取的情况下处理所述无细胞生物样品。
79.根据权利要求22所述的方法,其中,所述报告被呈现在用户的电子设备的图形用户界面上。
80.根据权利要求79所述的方法,其中,所述用户是所述受试者。
81.根据权利要求22所述的方法,进一步包括确定所述受试者的所述妊娠相关状态的所述存在或敏感性的所述确定的可能性。
82.根据权利要求22所述的方法,其中,所述经训练的算法包括有监督的机器学习算法。
83.根据权利要求82所述的方法,其中,所述有监督的机器学习算法包括深度学习算法、支持向量机(SVM)、神经网络或随机森林。
84.根据权利要求22所述的方法,进一步包括为所述受试者提供针对所述妊娠相关状态的所述存在或敏感性的治疗干预。
85.根据权利要求84所述的方法,其中,所述治疗干预包括己酸羟孕酮、阴道孕酮、天然孕酮IVR产品、前列腺素F2α受体拮抗剂或β2-肾上腺素能受体激动剂。
86.根据权利要求22所述的方法,进一步包括监测所述妊娠相关状态的所述存在或敏感性,其中所述监测包括在多个时间点评估所述受试者的所述妊娠相关状态的所述存在或敏感性,所述评估至少基于在所述多个时间点中的每个时间点(d)中确定的所述妊娠相关状态的所述存在或敏感性。
87.根据权利要求86所述的方法,其中,在所述多个时间点之间的所述受试者的所述妊娠相关状态的所述存在或敏感性的所述评估的差异指示选自由以下组成的组的一种或多种临床指征:(i)所述受试者的所述妊娠相关状态的所述存在或敏感性的诊断、(ii)所述受试者的所述妊娠相关状态的所述存在或敏感性的预后、和(iii)用于治疗所述受试者的所述妊娠相关状态的所述存在或敏感性的疗程有疗效或无疗效。
88.根据权利要求30所述的方法,进一步包括通过使用所述经训练的算法从早产的多种不同的分子亚型中确定所述早产的分子亚型对所述早产进行分层。
89.根据权利要求88所述的方法,其中,所述早产的多种不同分子亚型包括选自由既往早产史、自然早产、种族特异性早产风险和早产胎膜早破(PPROM)组成的组的早产的分子亚型。
90.一种用于预测受试者的早产风险的计算机实现方法,包括:
(a)接收所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;
(b)使用经训练的算法处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;以及
(c)以电子方式输出指示所述风险评分的报告,所述风险评分指示所述受试者的所述早产风险。
91.根据权利要求90所述的方法,其中,所述临床健康数据包括选自由年龄、体重、身高、体重指数(BMI)、血压、心率、血糖水平、既往妊娠次数和既往胎数组成的组的一个或多个定量测量。
92.根据权利要求90所述的方法,其中,所述临床健康数据包括选自由人种、种族、用药史或其他临床治疗史、吸烟史、饮酒史、日常活动或健康水平、基因检验结果、血液检验结果、影像学结果和胎儿筛查结果组成的组的一个或多个分类测量。
93.根据权利要求90所述的方法,其中,所述经训练的算法以至少约80%的灵敏度确定所述受试者的早产风险。
94.根据权利要求90所述的方法,其中,所述经训练的算法以至少约80%的特异性确定所述受试者的所述早产风险。
95.根据权利要求90所述的方法,其中,所述经训练的算法以至少约80%的阳性预测值(PPV)确定所述受试者的所述早产风险。
96.根据权利要求90所述的方法,其中,所述经训练的算法以至少约80%的阴性预测值(NPV)确定所述受试者的所述早产风险。
97.根据权利要求90所述的方法,其中,所述经训练的算法使用至少约0.9的曲线下面积(AUC)确定所述受试者的所述早产风险。
98.根据权利要求90所述的方法,其中,所述受试者对于以下中的一种或多种是无症状的:早产、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及异常的胎儿发育阶段或状态。
99.根据权利要求90所述的方法,其中,使用至少约10个与早产相关的独立训练样品训练所述经训练的算法。
100.根据权利要求90所述的方法,其中,使用不超过约100个与早产相关的独立训练样品训练所述经训练的算法。
101.根据权利要求90所述的方法,其中,使用与早产存在相关的第一组独立训练样品和与早产不存在相关的第二组独立训练样品训练所述经训练的算法。
102.根据权利要求90所述的方法,其中,所述报告被呈现在用户的电子设备的图形用户界面上。
103.根据权利要求102所述的方法,其中,所述用户是所述受试者。
104.根据权利要求90所述的方法,其中,所述经训练的算法包括有监督的机器学习算法。
105.根据权利要求104所述的方法,其中,所述有监督的机器学习算法包括深度学习算法、支持向量机(SVM)、神经网络或随机森林。
106.根据权利要求90所述的方法,进一步包括至少部分基于指示所述早产风险的所述风险评分为所述受试者提供治疗干预。
107.根据权利要求106所述的方法,其中,所述治疗干预包括己酸羟孕酮、阴道孕酮、天然孕酮IVR产品、前列腺素F2α受体拮抗剂或β2-肾上腺素能受体激动剂。
108.根据权利要求90所述的方法,进一步包括监测所述早产风险,其中所述监测包括在多个时间点评估所述受试者的所述早产风险,所述评估至少基于在所述多个时间点中的每个时间点的(b)中确定的指示所述早产风险的所述风险评分。
109.根据权利要求90所述的方法,进一步包括通过对所述受试者进行一项或多项后续临床检验来改善指示所述受试者的所述早产风险的所述风险评分,并使用经训练的算法处理来自所述一项或多项后续临床检验的结果以确定指示所述受试者的所述早产风险的更新风险评分。
110.根据权利要求109所述的方法,其中,所述一项或多项后续临床检验包括超声成像或血液检验。
111.根据权利要求90所述的方法,其中,所述风险评分包括所述受试者在预定持续时间内早产的可能性。
112.根据权利要求111所述的方法,其中,所述预定持续时间为至少约1小时。
113.一种用于预测受试者的早产风险的计算机系统,包括:
数据库,被配置为存储所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;和
与所述数据库可操作地耦合的一个或多个计算机处理器,其中所述一个或多个计算机处理器被单独地共同编程以:
(i)使用经训练的算法处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;以及
(ii)以电子方式输出指示所述受试者的所述早产风险的所述风险评分的报告。
114.根据权利要求113所述的计算机系统,进一步包括与所述一个或多个计算机处理器可操作地耦合的电子显示器,其中所述电子显示器包括被配置为显示所述报告的图形用户界面。
115.一种非暂时性计算机可读介质,包括机器可执行代码,所述机器可执行代码在由一个或多个计算机处理器执行时实施用于预测受试者的早产风险的方法,所述方法包括:
(a)接收所述受试者的临床健康数据,其中所述临床健康数据包括所述受试者的多个定量或分类测量;
(b)使用经训练的算法处理所述受试者的所述临床健康数据以确定指示所述受试者的所述早产风险的风险评分;以及
(c)以电子方式输出指示所述受试者的所述早产风险的所述风险评分的报告。
116.一种用于确定妊娠受试者的胎儿的预产期、预产期范围或胎龄的方法,包括测定源自所述妊娠受试者的无细胞生物样品以检测生物标志物组,并且使用经训练的算法分析所述生物标志物组以确定所述胎儿的所述预产期、预产期范围或胎龄。
117.根据权利要求116所述的方法,进一步包括使用所述经训练的算法分析所述妊娠受试者的所述胎儿的估计预产期或预产期范围,其中所述估计预产期或预产期范围从所述胎儿的超声测量值中生成。
118.根据权利要求116或117所述的方法,其中,所述生物标志物组包括与与预产期相关的基因位点,其中所述基因位点选自表1和表7中列出的基因的组。
119.根据权利要求118所述的方法,其中,所述生物标志物组包括至少5个不同的基因位点。
120.根据权利要求118所述的方法,其中,所述生物标志物组包括至少10个不同的基因位点。
121.根据权利要求118所述的方法,其中,所述生物标志物组包括至少25个不同的基因位点。
122.根据权利要求118所述的方法,其中,所述生物标志物组包括至少50个不同的基因位点。
123.根据权利要求118所述的方法,其中,所述生物标志物组包括至少100个不同的基因位点。
124.根据权利要求118所述的方法,其中,所述生物标志物组包括至少150个不同的基因位点。
125.根据权利要求116-124中任一项所述的方法,进一步包括至少部分基于所述确定的预产期以鉴定对所述妊娠受试者的临床干预。
126.根据权利要求125所述的方法,其中,所述临床干预选自多种临床干预。
127.根据权利要求116所述的方法,其中,所述分娩时间小于7.5周。
128.根据权利要求127所述的方法,其中,所述基因位点选自ACKR2、AKAP3、ANO5、C1orf21、C2orf42、CARNS1、CASC15、CCDC102B、CDC45、CDIPT、CMTM1、COPS8、CTD-2267D19.3、CTD-2349P21.9、CXorf65、DDX11L1、DGUOK、DPAGT1、EIF4A1P2、FANK1、FERMT1、FKRP、GAMT、GOLGA6L4、KLLN、LINC01347、LTA、MAPK12、METRN、MKRN4P、MPC2、MYL12BP1、NME4、NPM1P30、PCLO、PIF1、PTP4A3、RIMKLB、RP13-88F20.1、S100B、SIGLEC14、SLAIN1、SPATA33、TFAP2C、TMSB4XP8、TRGV10和ZNF124。
129.根据权利要求116所述的方法,其中,所述分娩时间小于5周。
130.根据权利要求129所述的方法,其中,所述基因位点选自C2orf68、CACNB3、CD40、CDKL5、CTBS、CTD-2272G21.2、CXCL8、DHRS7B、EIF5A2、IFITM3、MIR24-2、MTSS1、MYSM1、NCK1-AS1、NR1H4、PDE1C、PEMT、PEX7、PIF1、PPP2R3A、RABIF、SIGLEC14、SLC25A53、SPANXN4、SUPT3H、ZC2HC1C、ZMYM1和ZNF124。
131.根据权利要求117所述的方法,其中,所述分娩时间小于7.5周。
132.根据权利要求131所述的方法,其中,所述基因位点选自ACKR2、AKAP3、ANO5、C1orf21、C2orf42、CARNS1、CASC15、CCDC102B、CDC45、CDIPT、CMTM1、collectionga、COPS8、CTD-2267D19.3、CTD-2349P21.9、DDX11L1、DGUOK、DPAGT1、EIF4A1P2、FANK1、FERMT1、FKRP、GAMT、GOLGA6L4、KLLN、LINC01347、LTA、MAPK12、METRN、MPC2、MYL12BP1、NME4、NPM1P30、PCLO、PIF1、PTP4A3、RIMKLB、RP13-88F20.1、S100B、SIGLEC14、SLAIN1、SPATA33、STAT1、TFAP2C、TMEM94、TMSB4XP8、TRGV10、ZNF124和ZNF713。
133.根据权利要求116所述的方法,其中,所述分娩时间小于5周。
134.根据权利要求133所述的方法,其中,所述基因位点选自ATP6V1E1P1、ATP8A2、C2orf68、CACNB3、CD40、CDKL4、CDKL5、CEP152、CLEC4D、COL18A1、collectionga、COX16、CTBS、CTD-2272G21.2、CXCL2、CXCL8、DHRS7B、DPPA4、EIF5A2、FERMT1、GNB1L、IFITM3、KATNAL1、LRCH4、MBD6、MIR24-2、MTSS1、MYSM1、NCK1-AS1、NPIPB4、NR1H4、PDE1C、PEMT、PEX7、PIF1、PPP2R3A、PXDN、RABIF、SERTAD3、SIGLEC14、SLC25A53、SPANXN4、SSH3、SUPT3H、TMEM150C、TNFAIP6、UPP1、XKR8、ZC2HC1C、ZMYM1和ZNF124。
135.根据权利要求116所述的方法,其中,所述经训练的算法包括线性回归模型或ANOVA模型。
136.根据权利要求135所述的方法,其中,所述ANOVA模型从多个时间窗之中确定对应于所述预产期的最大似然时间窗。
137.根据权利要求136所述的方法,其中,所述最大似然时间窗对应于至少1周的分娩时间。
138.根据权利要求135所述的方法,其中,所述ANOVA模型从多个时间窗之中确定对应于所述预产期的时间窗的概率或可能性。
139.根据权利要求137所述的方法,其中,所述ANOVA模型计算跨所述多个时间窗的概率加权平均值以确定平均或预期时间窗间隔。
140.一种用于检测妊娠受试者的胎儿存在产前代谢遗传病或有产前代谢遗传病风险的方法,包括:
测定源自所述妊娠受试者的无细胞生物样品中的核糖核酸(RNA)以检测生物标志物组,和
使用经训练的算法分析所述生物标志物组以检测所述产前代谢遗传病的所述存在或风险。
141.一种检测妊娠受试者的胎儿或所述妊娠受试者的至少两种健康或生理状况的方法,包括:
测定在第一时间点获自或源自所述妊娠受试者的第一无细胞生物样品和在第二时间点获自或源自所述妊娠受试者的第二无细胞生物样品,以检测在所述第一时间点的第一组生物标志物和在所述第二时间点的第二组生物标志物,以及
使用经训练的算法分析所述第一组生物标志物或所述第二组生物标志物以检测所述至少两种健康或生理状况。
142.根据权利要求141所述的方法,其中,所述至少两种健康或生理状况选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。
143.根据权利要求141所述的方法,其中,所述生物标志物组包括与预产期相关的基因位点,其中所述基因位点选自由表1和表7中列出的基因组成的组。
144.根据权利要求141所述的方法,其中,所述生物标志物组包括与胎龄相关的基因位点,其中所述基因位点选自由表2中列出的基因组成的组。
145.根据权利要求141所述的方法,其中,所述生物标志物组包括与早产相关的基因位点,其中所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。
146.根据权利要求141所述的方法,其中,所述生物标志物组包括至少5个不同的基因位点。
147.一种方法,包括:
测定获自或源自妊娠受试者的一个或多个无细胞生物样品以检测生物标志物组;以及
分析所述生物标志物组以鉴定(1)所述妊娠受试者的胎儿的预产期或其范围和(2)所述妊娠受试者的所述胎儿或所述妊娠受试者的健康或生理状况。
148.根据权利要求147所述的方法,进一步包括使用经训练的算法分析所述生物标志物组。
149.根据权利要求147所述的方法,其中,所述健康或生理状况选自由以下组成的组:早产、足月产、胎龄、预产期、分娩开始、妊娠相关高血压症、子痫、妊娠糖尿病、所述受试者的胎儿的先天性疾病、异位妊娠、自然流产、死产、产后并发症、妊娠剧吐、分娩时出血或失血过多、胎膜早破、早产胎膜早破、前置胎盘、宫内/胎儿生长受限、巨大胎儿、新生儿状况、以及胎儿发育阶段或状态。
150.根据权利要求147所述的方法,其中,所述生物标志物组包括与预产期相关的基因位点,其中所述基因位点选自由表1和表7中列出的基因组成的组。
151.根据权利要求147所述的方法,其中,所述生物标志物组包括与胎龄相关的基因位点,其中所述基因位点选自由表2中列出的基因组成的组。
152.根据权利要求147所述的方法,其中,所述生物标志物组包括与早产相关的基因位点,其中所述基因位点选自由表5列出的基因、表6列出的基因、表8列出的基因、RAB27B、RGS18、CLCN3、B3GNT2、COL24A1、CXCL8和PTGS2组成的组。
153.根据权利要求147所述的方法,其中,所述生物标志物组包括至少5个不同的基因位点。
CN202080028640.7A 2019-02-14 2020-02-13 用于确定受试者的妊娠相关状态的方法和系统 Pending CN113692624A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962805515P 2019-02-14 2019-02-14
US62/805,515 2019-02-14
US201962890248P 2019-08-22 2019-08-22
US62/890,248 2019-08-22
US201962926786P 2019-10-28 2019-10-28
US62/926,786 2019-10-28
PCT/US2020/018172 WO2020168118A1 (en) 2019-02-14 2020-02-13 Methods and systems for determining a pregnancy-related state of a subject

Publications (1)

Publication Number Publication Date
CN113692624A true CN113692624A (zh) 2021-11-23

Family

ID=72044275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080028640.7A Pending CN113692624A (zh) 2019-02-14 2020-02-13 用于确定受试者的妊娠相关状态的方法和系统

Country Status (10)

Country Link
US (6) US11208693B2 (zh)
EP (1) EP3924972A4 (zh)
JP (1) JP2022519897A (zh)
CN (1) CN113692624A (zh)
AU (1) AU2020221278A1 (zh)
CA (1) CA3126990A1 (zh)
GB (3) GB2612911B (zh)
MX (1) MX2021009726A (zh)
SG (1) SG11202108405VA (zh)
WO (1) WO2020168118A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114822841A (zh) * 2022-03-24 2022-07-29 川北医学院附属医院 基层适用的严重产后出血风险预测模型及其构建方法
US11441183B2 (en) 2019-02-14 2022-09-13 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject
WO2023102786A1 (zh) * 2021-12-08 2023-06-15 深圳华大基因股份有限公司 基因标志物在预测孕妇早产风险中的应用
CN116705215A (zh) * 2023-08-04 2023-09-05 南京诺源医疗器械有限公司 一种用于脑室检测的荧光标记系统
CN116904587A (zh) * 2023-09-13 2023-10-20 天津云检医学检验所有限公司 一种用于预测早产的生物标志物组、预测模型及试剂盒
CN117079823A (zh) * 2023-10-17 2023-11-17 北京大学第三医院(北京大学第三临床医学院) 早期预测选择性胎儿生长受限发病风险筛查的系统和方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020247411A1 (en) * 2019-06-03 2020-12-10 Illumina, Inc. Limit of detection based quality control metric
CN115397452A (zh) 2020-01-30 2022-11-25 普罗科技有限公司 肺生物标志物及其使用方法
WO2022155469A1 (en) * 2021-01-15 2022-07-21 The Trustees Of Columbia University In The City Of New York Using the vaginal metabolome for early prediction of spontaneous preterm birth
CN112662754B (zh) * 2021-01-27 2024-05-14 北京航空航天大学 用于预测小耳畸形发生概率的组合物的应用方法
GB2620035A (en) * 2021-02-10 2023-12-27 Mirvie Inc Methods and systems for conducting pregnancy-related clinical trials
US20220328129A1 (en) * 2021-03-31 2022-10-13 PrognomIQ, Inc. Multi-omic assessment
EP4341438A2 (en) * 2021-05-18 2024-03-27 Mirvie, Inc. Methods and systems for methylation profiling of pregnancy-related states
EP4099335A1 (en) * 2021-06-03 2022-12-07 Tata Consultancy Services Limited System and method for estimation of delivery date of pregnant subject using microbiome data
WO2022256850A1 (en) * 2021-06-04 2022-12-08 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods to assess neonatal health risk and uses thereof
US11664100B2 (en) * 2021-08-17 2023-05-30 Birth Model, Inc. Predicting time to vaginal delivery
CA3231038A1 (en) 2021-09-13 2023-03-16 Bruce Wilcox Enhanced detection and quantitation of biomolecules
WO2023081768A1 (en) * 2021-11-04 2023-05-11 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject
WO2023150726A2 (en) * 2022-02-03 2023-08-10 Nx Prenatal Inc. Three-tiered risk stratification for spontaneous preterm birth
CN114636826B (zh) * 2022-03-02 2022-11-22 广州市妇女儿童医疗中心 Cd177+中性粒细胞在制备新生儿坏死性小肠结肠炎检测产品中的应用
KR20230145829A (ko) * 2022-04-11 2023-10-18 의료법인 성광의료재단 기계학습을 이용한 고위험 임신 질환 예측을 위한 질량 스펙트럼 분석 방법
CN114592074A (zh) * 2022-04-12 2022-06-07 苏州市立医院 一种与胎龄相关的靶标基因组合及其应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014193999A2 (en) * 2013-05-28 2014-12-04 Caris Science, Inc. Biomarker methods and compositions
WO2017141169A1 (en) * 2016-02-16 2017-08-24 Tata Consultancy Services Limited Method and system for early risk assessment of preterm delivery outcome
CN108700591A (zh) * 2015-09-11 2018-10-23 洛斯安第斯大学 用于鉴定妊娠相关疾病的体外方法

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5629147A (en) 1992-07-17 1997-05-13 Aprogenex, Inc. Enriching and identifying fetal cells in maternal blood for in situ hybridization
US5432054A (en) 1994-01-31 1995-07-11 Applied Imaging Method for separating rare cells from a population of cells
CA2359816C (en) 1999-01-06 2010-08-03 Genenews Inc. Method for the detection of gene transcripts in blood and uses thereof
US20080009467A1 (en) 2000-05-01 2008-01-10 Accera, Inc. Combinations of medium chain triglycerides and therapeutic agents for the treatment and prevention of alzheimers disease and other diseases resulting from reduced neuronal metabolism
US6727066B2 (en) 2000-07-28 2004-04-27 Incyte Corporation Genes expressed in treated human C3A liver cell cultures
US6664056B2 (en) 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
CA2484549A1 (en) 2002-05-10 2003-11-20 Phase-1 Molecular Toxicology, Inc. Liver inflammation predictive genes
US20040086511A1 (en) 2002-07-12 2004-05-06 The Johns Hopkins University Neuronal gene expression patterns
AU2003272204A1 (en) 2002-07-12 2004-02-02 The Johns Hopkins University Neuronal and retinal gene expression patterns
US7435419B2 (en) * 2002-07-19 2008-10-14 Beth Israel Deaconess Medical Center Methods of diagnosing and treating pre-eclampsia or eclampsia
CA2513292C (en) 2003-01-17 2016-04-05 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
US20060003342A1 (en) 2004-01-15 2006-01-05 Bianchi Diana W Fetal RNA in amniotic fluid to determine gene expression in the developing fetus
KR20070065869A (ko) 2004-07-21 2007-06-25 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 타액 트랜스크립톰 진단법
US7713693B1 (en) 2004-09-01 2010-05-11 University Of Louisiana At Monroe Human cancer cell specific gene transcript
CA2528531A1 (en) 2005-01-06 2006-07-06 Mount Sinai Hospital Markers of pre-term labor
WO2006097051A1 (en) 2005-03-18 2006-09-21 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
WO2007146229A2 (en) 2006-06-07 2007-12-21 Tethys Bioscience, Inc. Markers associated with arteriovascular events and methods of use thereof
WO2008132752A2 (en) 2007-05-01 2008-11-06 Tel Hashomer Medical Research Infrastructure And Services Ltd. Methods and kits for predicting cancer metastasis
WO2009009457A1 (en) 2007-07-06 2009-01-15 University Of Louisville Research Foundation, Inc. Alzheimer's disease-specific micro-rna microarray and related methods
PL2195450T3 (pl) 2007-08-22 2013-09-30 Trovagene Inc Sposób zastosowania miRNA do wykrywania in vivo śmierci komórki
US8298768B2 (en) 2007-11-29 2012-10-30 Complete Genomics, Inc. Efficient shotgun sequencing methods
EP2234483A4 (en) 2008-01-27 2011-04-27 Rosetta Genomics Ltd METHOD AND COMPOSITIONS FOR DIAGNOSIS OF PREGNANCY COMPLICATIONS
WO2009134452A2 (en) 2008-05-01 2009-11-05 Swedish Health Services Preterm delivery diagnostic assay
WO2009143576A1 (en) 2008-05-27 2009-12-03 Adelaide Research & Innovation Pty Ltd Polymorphisms associated with pregnancy complications
WO2009149026A2 (en) 2008-06-01 2009-12-10 Tufts Medical Center, Inc. Genomic approaches to fetal treatment and diagnosis
US7888030B2 (en) 2008-08-21 2011-02-15 King's College London Biomarkers
WO2010045470A2 (en) 2008-10-15 2010-04-22 Dana-Farber Cancer Institute, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of hepatic disorders
WO2011029899A1 (en) 2009-09-11 2011-03-17 The Chinese University Of Hong Kong Methods for assessing liver pathologies
CA2807050C (en) 2009-12-08 2019-06-18 Ozlem Equils Diagnostic biomarker to identify women at risk for preterm delivery
EP2854058A3 (en) 2010-05-18 2015-10-28 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
WO2011156734A2 (en) 2010-06-11 2011-12-15 Hitachi Chemical Co., Ltd. Method of characterizing vascular diseases
JP2013531799A (ja) 2010-07-08 2013-08-08 プロノタ エヌ.ヴェ. 妊娠の高血圧障害についてのバイオマーカー
EP4303584A3 (en) 2010-07-23 2024-04-03 President and Fellows of Harvard College Methods for detecting signatures of disease or conditions in bodily fluids
WO2012088348A2 (en) * 2010-12-23 2012-06-28 Sequenom, Inc. Fetal genetic variation detection
US10441577B2 (en) 2011-07-08 2019-10-15 Helmholtz Zentrum Fuer Infektionsforschung Medicament for treatment of liver cancer
US20130040303A1 (en) 2011-08-08 2013-02-14 Eugenia Wang Biomarker for Alzheimer's Disease and/or Mild Cognitive Impairment, and Use Thereof
CN114518458A (zh) 2011-09-30 2022-05-20 私募蛋白质体运营有限公司 心血管危险事件预测及其用途
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP6320302B2 (ja) 2012-01-27 2018-05-09 ザ ボード オブ トラスティーズ オブ ザ リーランド スタンフォード ジュニア ユニバーシティ 無細胞rnaをプロファイリングおよび定量するための方法
US20160289762A1 (en) 2012-01-27 2016-10-06 The Board Of Trustees Of The Leland Stanford Junior University Methods for profiliing and quantitating cell-free rna
US9938580B2 (en) 2012-03-14 2018-04-10 Ruprecht-Karls-Universität Heidelberg Epigenetic signatures as marker for cardiomyopathies and myocardial insufficiencies
US10054599B2 (en) 2013-03-12 2018-08-21 Agency For Science, Technology And Research (A*Star) Pre-eclampsia biomarkers
BR122019026188B1 (pt) 2013-03-15 2024-01-02 Somalogic Operating Co., Inc Métodos para determinar se um indivíduo com esteatose não alcoólica tem esteato-hepatite não alcoólica e para monitorar um indivíduo com esteatose não alcoólica para o desenvolvimento de nash
CN104673925A (zh) 2015-03-19 2015-06-03 绍兴锐创生物科技有限公司 能检测多种新生儿遗传病的rna探针及基因筛查试剂盒
WO2016196945A1 (en) 2015-06-05 2016-12-08 Regulus Therapeutics Inc. Non-alcoholic fatty liver disease biomarkers
CN108138232B (zh) 2015-09-14 2023-07-18 基恩菲特公司 用于诊断和评估非酒精性脂肪性肝炎的方法
CN109790643A (zh) 2016-03-09 2019-05-21 分子听诊器公司 用于检测组织状况的方法和系统
AU2020221278A1 (en) 2019-02-14 2021-08-05 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014193999A2 (en) * 2013-05-28 2014-12-04 Caris Science, Inc. Biomarker methods and compositions
CN108700591A (zh) * 2015-09-11 2018-10-23 洛斯安第斯大学 用于鉴定妊娠相关疾病的体外方法
WO2017141169A1 (en) * 2016-02-16 2017-08-24 Tata Consultancy Services Limited Method and system for early risk assessment of preterm delivery outcome

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
THUY T. M. NGO 等: ""Noninvasive blood tests for fetal development predict gestational age and preterm delivery"", 《SCIENCE》, vol. 360, 8 June 2018 (2018-06-08), pages 1133 - 1136, XP055693729, DOI: 10.1126/science.aar3819 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11441183B2 (en) 2019-02-14 2022-09-13 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject
US11845988B2 (en) 2019-02-14 2023-12-19 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject
US11851706B2 (en) 2019-02-14 2023-12-26 Mirvie, Inc. Methods and systems for determining a pregnancy-related state of a subject
WO2023102786A1 (zh) * 2021-12-08 2023-06-15 深圳华大基因股份有限公司 基因标志物在预测孕妇早产风险中的应用
CN114822841A (zh) * 2022-03-24 2022-07-29 川北医学院附属医院 基层适用的严重产后出血风险预测模型及其构建方法
CN116705215A (zh) * 2023-08-04 2023-09-05 南京诺源医疗器械有限公司 一种用于脑室检测的荧光标记系统
CN116705215B (zh) * 2023-08-04 2023-09-29 南京诺源医疗器械有限公司 一种用于脑室检测的荧光标记系统
CN116904587A (zh) * 2023-09-13 2023-10-20 天津云检医学检验所有限公司 一种用于预测早产的生物标志物组、预测模型及试剂盒
CN116904587B (zh) * 2023-09-13 2023-12-05 天津云检医学检验所有限公司 一种用于预测早产的生物标志物组、预测模型及试剂盒
CN117079823A (zh) * 2023-10-17 2023-11-17 北京大学第三医院(北京大学第三临床医学院) 早期预测选择性胎儿生长受限发病风险筛查的系统和方法
CN117079823B (zh) * 2023-10-17 2024-01-02 北京大学第三医院(北京大学第三临床医学院) 早期预测选择性胎儿生长受限发病风险筛查的系统和方法

Also Published As

Publication number Publication date
AU2020221278A1 (en) 2021-08-05
US11208693B2 (en) 2021-12-28
EP3924972A4 (en) 2023-03-29
WO2020168118A1 (en) 2020-08-20
US20220380846A1 (en) 2022-12-01
GB2597379B (en) 2022-12-28
GB202308486D0 (en) 2023-07-19
GB2612911A (en) 2023-05-17
US20240117429A1 (en) 2024-04-11
US20220073982A1 (en) 2022-03-10
US11845988B2 (en) 2023-12-19
US20210017598A1 (en) 2021-01-21
EP3924972A1 (en) 2021-12-22
GB202216607D0 (en) 2022-12-21
GB2615975A (en) 2023-08-23
SG11202108405VA (en) 2021-08-30
GB2597379A (en) 2022-01-26
CA3126990A1 (en) 2020-08-20
GB2612911B (en) 2023-11-22
GB2615975B (en) 2023-11-29
GB202111725D0 (en) 2021-09-29
JP2022519897A (ja) 2022-03-25
US20230250477A1 (en) 2023-08-10
US11441183B2 (en) 2022-09-13
MX2021009726A (es) 2021-09-14
US20220380847A1 (en) 2022-12-01
US11851706B2 (en) 2023-12-26

Similar Documents

Publication Publication Date Title
CN113692624A (zh) 用于确定受试者的妊娠相关状态的方法和系统
US20240038396A1 (en) Methods and systems for determining risk of a pregnancy complication occurring
US20230332229A1 (en) Methods and systems for determining a pregnancy-related state of a subject
US20170351806A1 (en) Method for assessing fertility based on male and female genetic and phenotypic data
EP3701043B1 (en) A noninvasive molecular clock for fetal development predicts gestational age and preterm delivery
CN115667554A (zh) 通过核酸甲基化分析检测结直肠癌的方法和系统
US20210381054A1 (en) Methods, systems and kits for predicting premature birth condition
JPWO2020168118A5 (zh)
Camunas-Soler et al. Predictive RNA profiles for early and very early spontaneous preterm birth
Zhou et al. Maternal blood EBF1-based microRNA transcripts as biomarkers for detecting risk of spontaneous preterm birth: A nested case-control study
Huang et al. Transcriptomic profiles in peripheral blood between women with unexplained recurrent implantation failure and recurrent miscarriage and the correlation with endometrium: A pilot study
US20230410957A1 (en) Methods and systems for conducting pregnancy-related clinical trials
US20240150837A1 (en) Methods and systems for methylation profiling of pregnancy-related states
WO2023081768A1 (en) Methods and systems for determining a pregnancy-related state of a subject
Luo et al. Association between the first and second trimester cell free DNA fetal fraction and spontaneous preterm birth
JP7141039B2 (ja) Dna変異絞込装置、dna変異絞込システム、dna変異絞込方法、及びプログラム
Ake et al. Quantification of transcript isoforms at the single-cell level using SCALPEL
JP2023109481A (ja) 妊娠関連有害事象の発生を予測する方法、予測装置及びコンピュータプログラム
CA3177168A1 (en) Methods and systems for assessing fibrotic disease with deep learning
CN118056016A (zh) 基因标志物在预测孕妇早产风险中的应用
GB2564846A (en) Prenatal screening and diagnostic system and method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40064776

Country of ref document: HK