CN116096920A - 用于诊断呼吸道病原体和预测covid-19相关结果的方法 - Google Patents

用于诊断呼吸道病原体和预测covid-19相关结果的方法 Download PDF

Info

Publication number
CN116096920A
CN116096920A CN202180044432.0A CN202180044432A CN116096920A CN 116096920 A CN116096920 A CN 116096920A CN 202180044432 A CN202180044432 A CN 202180044432A CN 116096920 A CN116096920 A CN 116096920A
Authority
CN
China
Prior art keywords
methylation
subject
infection
classifier
hla
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180044432.0A
Other languages
English (en)
Inventor
K·巴尼斯
I·杨
C·吉诺
R·马蒂亚斯
P·诺曼
A·塔耶
R·珀雷查
B·巴尼斯
B·彼得森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
University of Colorado
Original Assignee
Illumina Inc
University of Colorado
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc, University of Colorado filed Critical Illumina Inc
Publication of CN116096920A publication Critical patent/CN116096920A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

发明构思提供了基于DNA甲基化的平台,和机器学习算法,用于诊断包括SARS‑CoV‑2在内的呼吸道病原体并且预测COVID‑19相关结果,以及使用这些平台和算法的方法,诸如用于识别存在病毒感染(诸如SARS‑CoV‑2感染)、确定受试者是否患有COVID‑19,并且/或者患有COVID‑19的受试者是否可能发展为急性呼吸窘迫综合征或儿童多系统炎症综合征。

Description

用于诊断呼吸道病原体和预测COVID-19相关结果的方法
相关申请的交叉引用
本申请要求2020年6月23日提交的美国临时申请序列号63/042,669的权益,该美国临时申请的公开内容全文以引用方式并入本文。
关于以电子方式提交序列表的声明
本申请包括以电子方式按ASCII文本格式递交的序列表。ASCII副本代替纸件副本提供,其名称为IP-2201-PCT_SL.txt,大小为1,791,460字节,创建日期为2021年6月22日。该序列表的公开内容全部以引用方式并入本文的说明书中。
技术领域
本发明的构思涉及基于DNA甲基化的平台、使用该平台的方法、诊断和治疗包括SARS-CoV-2在内的呼吸道病原体的方法,以及预测COVID-19相关的并发症和结果的方法。
发明内容
根据发明构思的一个方面,提供了一种测定受试者体内存在病毒感染的方法,包括:从来源于该受试者的样品获得一组DNA甲基化位点的甲基化模式;以及用感染阳性甲基化分类器和/或感染阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于感染阳性分类器的评分超过指示病毒感染存在的截止值和/或阈值时,指示该受试者体内存在病毒感染。
根据发明构思的另一个方面,提供了一种用于确定受试者体内的病毒感染产生急性呼吸窘迫综合征的可能性的方法,包括:从来源于该受试者的样品获得一组DNA甲基化位点的甲基化模式;以及用急性呼吸窘迫综合征阳性甲基化分类器和/或急性呼吸窘迫综合征阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于急性呼吸窘迫综合征阳性分类器的评分超过指示病毒感染产生急性呼吸窘迫综合征的可能性的截止值和/或阈值时,指示该受试者将表现出急性呼吸窘迫综合征的可能性。
根据本发明的另一个方面,提供了一种确定受试者体内病毒感染的性质的方法,包括:从来源于该受试者的样品获得一组DNA甲基化位点的甲基化模式;以及用SARS-CoV-2阳性甲基化分类器和/或SARS-CoV-2阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于SARS-CoV-2阳性甲基化分类器的评分超过指示SARS-CoV-2感染存在的截止值和/或阈值时,指示该受试者体内存在SARS-CoV-2感染。
根据发明构思的另一个方面,提供了一种治疗受试者体内的COVID-19的方法,包括:从来源于怀疑患有COVID-19的受试者的样品获得一组DNA甲基化位点的甲基化模式;用SARS-CoV-2阳性甲基化分类器和/或SARS-CoV-2阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于SARS-CoV-2阳性甲基化分类器的评分超过指示SARS-CoV-2感染存在的截止值和/或阈值时,指示该受试者体内存在SARS-CoV-2感染;如果指示该受试者体内存在SARS-CoV-2感染,则治疗该受试者的COVID-19。
根据发明构思的另一个方面,提供了一种治疗怀疑患有COVID-19的受试者的急性呼吸窘迫综合征(ARDS)的方法,包括:在来源于该受试者的样品中获得一组DNA甲基化位点的甲基化模式;用ARDS阳性甲基化分类器和/或ARDS阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于ARDS阳性分类器的评分超过指示COVID-19感染产生ARDS的可能性的截止值和/或阈值时,指示该受试者将表现出急性呼吸窘迫综合征的可能性;以及治疗该受试者的ARDS。
根据发明构思的另一个方面,提供了一种治疗怀疑患有COVID-19的受试者的成人多系统炎症综合征(MIS-A)或儿童多系统炎症综合征(MIS-C)的方法,包括:在来源于该受试者的样品中获得一组DNA甲基化位点的甲基化模式;用MIS-A或MIS-C阳性甲基化分类器和/或MIS-A或MIS-C阴性甲基化分类器分析这组DNA甲基化位点的甲基化模式,其中当来源于MIS-C阳性分类器的评分超过指示COVID-19感染产生MIS-A或MIS-C的可能性的截止值和/或阈值时,指示该受试者将表现出MIS-A或MIS-C的可能性;以及治疗该受试者的MIS-A或MIS-C。
发明构思的其他方面包括DNA甲基化位点的阵列(诸如甲基化珠粒阵列)、用于执行上文所提出的任何方法的计算机实现的方法,以及用于执行上文所提出的方法的机器学习算法。
附图说明
图1.基于由设置在EPIC上的阴性探针校准的检测结果得出的COVID-(浅灰色)和COVID+(深灰色)的总检出率。
图2.为火山图,描绘了在针对偏倚和膨胀进行调整后,与经FD调整的p值<0.05时的COVID-19状态显著相关的CpG位点(所识别的深灰色点)。其他位点(浅灰色点)是在针对偏倚和膨胀进行调整前显著的点。黑色点是不显著的点。
图3.针对COVID-19或MIS-C的应用,用于确定COVID-19或MIS-C的基于甲基化的表观遗传标记。
图4.使用来自患有COVID-19或MIS-C的儿童的样品来表征表观遗传标记的方法。
图5.对COVID-19+病例和COVID-19-对照进行训练和测试,以开发用于EPIC+芯片的分类器。
图6.可以根据发明构思的方法来表征的SARS-CoV-2疾病症状连续体。
图7是可以与根据发明构思的实施方案的平台一起使用的分类系统、计算机程序产品和/或计算机实现的方法的框图。
图8描绘了根据发明构思的方法的分类器生成过程的概要。
图9.用于根据发明构思的分类器生成过程的机器学习方法。
具体实施方式
已经开发了发明构思的两个阶段。第一阶段包括Illumina的InfiniumMethylation EPIC BeadChip试剂盒(EPIC)的定制版本,其用于选择在产生COVID-19诊断标记方面表现最佳的约50,000个CpG位点/甲基化探针。为了定制EPIC芯片,CCPM团队利用了从COVID-19+和COVID-19-患者的25个鼻咽拭子(NPS)产生的数据,并且将其添加到公共领域先前报道的并且与同近期冠状病毒爆发相关的呼吸道病毒感染和心肺并发症相关联的那些CpG位点中,加上所有26,000个已知HLA等位基因,加上跨MHC基因组区域、天然杀伤细胞免疫受体(KIR)和其他免疫遗传基因座的替代性单倍型和未公布的参考序列,以增强免疫应答检测的灵敏度。在制造EPIC+芯片后,对来自624名使用标准临床实践(rtPCR检验)被检测为COVID-19阳性或阴性的患者的DNA样品进行了定量甲基化。第二阶段包括使用选择的约50K个最佳CpG位点来创建Infinium HTS Custom Methylation COVID-19组套,该组套通过将来自甲基化芯片的数据与我们已经开发的机器学习疾病分类器组合而可靠地预测全血中的SARS-CoV-2感染。除了准确预测宿主中的SARS-CoV-2感染,Infinium HTSCustom Methylation COVID-19组套与机器学习分类器结合还将具有以下用途:(i)将SARS-CoV-2与其他冠状病毒和呼吸道病毒区分开;(ii)预测哪些患者在初次感染后继续出现临床并发症(即,急性呼吸窘迫综合征);以及(iii)表征与短期恢复和长期恢复两者相关联的标记。对用于检测引起COVID-19的新型冠状病毒的高通量且廉价的大规模检验存在尚未满足的需求,本发明满足了这一需求。尽管正在以非凡的速度开发用于检测引起COVID-19的新型冠状病毒的高通量快速检验,但是rtPCR和血清学检验是病毒株依赖性的,这些测定的典型周转时间在8小时至48小时范围内;虽然已经开发了一些检验来实现更快速的周转(30分钟),但是这些检验的假阴性率高(26%至100%),仅限用于COVID-19,还一直存在突出的供应链问题。此外,检验通常仅限于有症状的患者,这是一种不能满足筛查和全社区监测的迫切需求的策略。因此,仍然需要更准确、更快速的SARS-CoV-2感染和COVID-19诊断检验方法。
诊断SARS-CoV-2的现行护理标准是通过感染后进行rtPCR或通过血清学检查(感染后)来实施的。这些方法的局限在于它们将是病毒株依赖性的,而且需要设计rtPCR引物来扩增和检测SARS-CoV-2病毒。这是仅针对SARS-CoV-2的二元检测方法(阳性或阴性),不能评估受感染个体出现多种症状的风险。rtPCR检验还受限于需要使用患者的鼻咽拭子来进行验证。本发明构思的平台在以下方面对护理标准作出了改进:1)通过使用定制靶向Illumina表观遗传微阵列芯片测量宿主内的遗传变化来检测SARS-CoV-2病毒感染,从而使该检测不依赖于病毒株;2)能够预测患者无症状、轻微症状表现、直至严重症状(例如,急性呼吸窘迫综合征(ADRS)和/或儿童多系统炎症综合征(MIS-C))的风险因素;3)识别附加标记以区别诊断其他呼吸道病毒,包括但不限于:(i)呼吸道合胞病毒(RSV);(ii)副流感病毒(1、2、3、4);(iii)人偏肺病毒(hMPV);(iv)人鼻病毒;(v)腺病毒(Ad);和(vi)现存冠状病毒(例如:229E(α冠状病毒)、NL63(α冠状病毒)、OC43(β冠状病毒)、HKU1(β冠状病毒),等等);4)宿主基因组样品能够使用上呼吸道(例如,NPS)样品或外周血样品来收集。本发明的主要方面是检测病毒感染的检验策略,该策略使用宿主的表观遗传变化作为标志物,具有全面识别其他呼吸道感染的潜在能力,以及预测患者对SARS-CoV-2的症状性反应的能力。
为了促进对本公开原理的理解,现在将参考优选实施方案并且将使用特定语言来描述这些优选实施方案。然而,应当理解,并不因此意图限制本公开的范围,如本文所展示的本公开的此类改变和进一步修改被认为是本公开所涉及领域的技术人员通常会想到的。
冠词“一个”、“一种”和“该”在本文中用于指一个/种或多于一个/种(即,至少一个/种)该冠词的语法对象。举例来说,“一个要素”意指至少一个要素,并且可以包括多于一个要素。术语“和/或”包括一个或多个相关所列项目的任何和全部组合,可以缩写为“/”。
如本文所用,术语“包括”除了其常规含义外,还可以包括并且在一些实施方案中可以具体地指代以下表述:“基本上由……组成”和/或“由……组成”。因此,表述“包括”还可以指代其中要求权利的“包括”具体列出的要素不包括另外的要素的实施方案,以及其中要求权利的“包括”具体列出的要素可以并且/或者确实涵盖另外的要素,或者涵盖不会实质上影响要求权利的对象的基础特性和新颖特性的另外的要素的实施方案。例如,诸如方法、试剂盒、系统等涉及的要求权利的“包括”具体列出的要素还涵盖例如方法、试剂盒、系统等“由……组成”,即,其中要求权利的对象不包括另外的要素,以及例如方法、试剂盒、系统等“基本上由……组成”,即,其中要求权利的对象可以包括不会实质上影响要求权利的对象的基础特性和新颖特性的另外的要素。
除非另有定义,否则本文所用的所有技术术语的含义与本公开所属领域的普通技术人员通常理解的含义相同。
检验、诊断、表征和/或预测结果的方法
本公开指出,可以使用全基因组甲基化模式响应于接触呼吸道病毒(诸如SARS-CoV-2)的改变,以高准确度识别和表征例如病毒感染的存在、病毒感染的性质,以及/或者受试者体内的病毒感染表现出更严重的症状的概率。
术语“DNA甲基化”和/或“基因甲基化”是指将甲基基团添加到DNA/核酸分子中的生物学过程。DNA/基因/CpG岛甲基化可以发生在腺嘌呤(A)或胞嘧啶(C)上,对于A甲基化,产生N6-甲基腺苷(6mA),而对于C甲基化,产生5-甲基胞嘧啶(5mC)和N4-甲基胞嘧啶(4mC)。在发明构思的实施方案中,测量/测定导致5mC的胞嘧啶甲基化水平。在一些实施方案中,测量/测定DNA基因座/基因中CpG二核苷酸的甲基化程度。甲基化CpG二核苷酸可以位于CpG岛即DNA中具有高频率CpG位点的区域中,如本领域技术人员所理解的。在发明构思的实施方案中,测量受试者体内的DNA/一组基因座和/或位于DNA/基因/CpG岛基因座中的CpG岛的甲基化,将其与针对具有替代性的生物学状态的群体(例如,患有疾病/感染的群体对比健康/无感染的群体)所观察到的DNA、基因和/或CpG岛的甲基化进行比较。在替代性的生物学状态中,例如,疾病/感染对比健康/无感染,在一些实施方案中,特定的DNA基因座/基因可以是低甲基化的,即,处于疾病/感染状态的DNA基因座/基因的甲基化程度低于健康/无感染状态的甲基化程度,并且在一些实施方案中,特定的DNA基因座/基因可以是高甲基化的,即,处于疾病/感染状态的DNA基因座/基因的甲基化程度高于健康/无感染状态的甲基化程度。
根据发明构思的实施方案,术语“标记”可以指代一组数量可测量的生物标志物,例如,全基因组甲基化模式、CpG岛的全基因组甲基化,和/或一组(例如,特定的一组和/或预先定义的一组)基因/CpG岛的甲基化模式,其中这些生物标志物的特定模式/组合表示存在或不存在指定的生物学状态,诸如存在或不存在一种或多种感染,所述感染诸如但不限于:SARS-CoV-2感染、呼吸道合胞病毒(RSV)感染、副流感病毒(1、2、3、4)感染、人偏肺病毒(hMPV)感染、人鼻病毒感染、腺病毒(Ad)感染,和/或现存冠状病毒(例如:229E,α冠状病毒;NL63,α冠状病毒;OC43,β冠状病毒;HKU1,β冠状病毒)感染,或它们的任何组合。在一些实施方案中,该特定模式/组合表示受试者体内存在或不存在SARS-CoV-2感染,以及/或者受试者是否患有/罹患COVID-19,以及/或者受试者可能易患和/或罹患COVID-19更严重的表现/症状和/或与该生物学状态相关的更严重的病症的概率/可能性,其中更严重的病症诸如:急性呼吸窘迫综合征(ARDS)和/或与免疫病理学细胞因子释放和血管渗漏相关联的多器官衰竭,例如与COVID-19相关联的成人多系统炎症综合征(MIS-A)和/或儿童多系统炎症综合征(MIS-C)。这些标记在具有已知状态(例如,COVID-19阳性、COVID-19阴性、证实患有与COVID-19相关联的ARDS和/或与COVID-19相关联的MIS-C)的多个受试者中被发现,并且有别于(单独地或共同地)一种或多种感兴趣的类别或结果,例如,存在或不存在SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS、受试者是否患有与COVID-19相关联的MIS-A以及/或者是否更可能患上与COVID-19相关联的MIS-A,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。
在一些实施方案中,标记涉及一群/组基因的DNA/基因/CpG岛甲基化,和/或这群/组基因中的CpG岛的甲基化,例如,一组基因包括但不必限于:ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集,这些基因的甲基化水平在结合到如本文所述的分类器中后,可以辨别存在指定的生物学状态,诸如,在一些实施方案中,存在或不存在SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。在一些实施方案中,标记涉及一群/组基因的DNA/基因/CpG岛甲基化,和/或这群/组基因中的CpG岛的甲基化,例如,一组基因包括但不必限于:ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CHSY1、DDX60、EPSTI1、FGFRL1、GPX1、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PPL、RAB40C、REPD、TNFRSF8、TSEN15和ZDHHC6,或它们的任何子集。在一些实施方案中,当比较例如COVID-19+个体与COVID-19-个体时,该标记可以包括特定基因的低甲基化和/或高甲基化。在一些实施方案中,该标记可以包括以下基因的低甲基化:IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和/或GPX1,或者它们的任何子集。在一些实施方案中,该标记可以包括以下基因的高甲基化:LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和/或FGFRL1,或者它们的任何子集。在一些实施方案中,标记涉及一群/组基因的DNA/基因/CpG岛甲基化,和/或这群/组基因中的CpG岛的甲基化,例如,一组基因包括但不必限于:A_24_P561165、AA455656、AID、AIM2、ANLN、APE1、APOBEC3G、APOL2、APOL3、APOL6、ARID3B、ARID5B、ASK1、ATF2、B2M、BATF、BATF2、BCL2L14、C10orf81、C1R、C1S、C3、C4A、C4B、C5、C6、C7、C8、C9、CALHM2、CALR、CASP1、半胱天冬酶-3、半胱天冬酶-8、CBX3B2、CCRL1、CD19、CD4、CD74、CD8、CFH、CFHR1、CFHR3、CIITA、CIITA、CHSY1、BX117479、c-Jun、CLIC5、CTSS ZBP1、CX3CL1 A_24_P912985、CXCL10、CXCL11、CXCL2、DDX60、eIF-2、eIF2B、EPSTI1、ERP27、ETV7、FADD、FAM26F、FGFRL1、FZD5、GPX1、HCP5 NNMT、HLA-A、HLA-DMB、HLA-DOA、HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DRA、HLA-DRB3、HLA-DRB4、HLA-DRB5、HLA-E、ICAM1、IFI16、IFI35、IFI44、IFI44L、IFIH1、IFIT2、IFIT3、IFIT5、IFITM1、IFNL1、IFNL2、IFNL3、IFNL4、IFN-α、IFN-β、IFNγ、IFN-γ、IFN-ε、IFN-κ、IFN-ω、IGH、IGK、IGL、IKK-α、IKK-β、IKK-γ、IKKε、IL-10、IL-11、IL-12、IL12A、IL-13、IL-15、IL-17、IL-18、IL18BP、IL-1ra、IL-1α、IL-1β、IL-2、IL-3、IL-33、IL-36ra、IL-36α、IL-36β、IL-36γ、IL-37、IL-38、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IRF1、IRF3、IRF7、JAK2、JNK、LAP3、LGP2、LINC00428、LINC01429、LT-α、M27126、MAVS、MDA5、MEKK1、MICA、MICAB、MKK7、MMP25、MX1、NAIP、NFKB1、NFKB2、NFKBIA、NLRC3、NLRC4、NLRC5、NLRP1、NLRP10、NLRP11、NLRP12、NLRP13、NLRP14、NLRP2、NLRP3、NLRP4、NLRP5、NLRP6、NLRP7、NLRP8、NLRP9、NLRX1、NMI、NOD1、NOD2、OAS1、OAS2、PARP9、PDIA3、PKR、PMAIP1、PML、POMC、PPL、PSMB8、PSMB9、RAB40C、REC8、REL、RELA、RELB、REPD、RIG-1、RIP、RNAse L、RTP4、SAMD9L、SECTM1、SEPX1、SERPING1、SOCS1、SP110、SPTLC3、SSTR2、STAT1、TAP1、TAP2、TAPBP、TBK1、TGFβ、TLR1、TLR10、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TMEM140、TNF、TNFR1、TNFR2、TNFRSF8、TNFRSF14、TNFSF10、TNFSF13B、TP53、TRA、TRADD、TRAF2、TRAF3、TRB、TRD、TRG、TRIM25、TSEN15、UNG、VAMP5、WARS、XAF1、ZC3HAV1和ZDHHC6,或它们的任何子集。例如,在一些实施方案中,这些基因组/集合的子集可以包括例如:A_24_P561165、AA455656、AID、AIM2、APE1、APOBEC3G、APOL2、APOL3、APOL6、ASK1、ATF2、B2M、BATF、BATF2、BCL2L14、C10orf81、C1R、C1S、C3、C4A、C4B、C5、C6、C7、C8、C9、CALR、CASP1、半胱天冬酶-3、半胱天冬酶-8、CCRL1、CD19、CD4、CD74、CD8、CFH、CFHR1、CFHR3、CIITA、CIITA、BX117479、c-Jun、CLIC5、CTSS ZBP1、CX3CL1 A_24_P912985、CXCL10、CXCL11、CXCL2、eIF-2、eIF2B、EPSTI1、ERP27、ETV7、FADD、FAM26F、FZD5、HCP5 NNMT、HLA-A、HLA-DMB、HLA-DOA、HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DRA、HLA-DRB3、HLA-DRB4、HLA-DRB5、HLA-E、ICAM1、IFI16、IFI35、IFI44、IFI44L、IFIH1、IFIT2、IFIT3、IFIT5、IFITM1、IFNL1、IFNL2、IFNL3、IFNL4、IFN-α、IFN-β、IFNγ、IFN-γ、IFN-ε、IFN-κ、IFN-ω、IGH、IGK、IGL、IKK-α、IKK-β、IKK-γ、IKKε、IL-10、IL-11、IL-12、IL12A、IL-13、IL-15、IL-17、IL-18、IL18BP、IL-1ra、IL-1α、IL-1β、IL-2、IL-3、IL-33、IL-36ra、IL-36α、IL-36β、IL-36γ、IL-37、IL-38、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IRF1、IRF3、IRF7、JAK2、JNK、LAP3、LGP2、LT-α、M27126、MAVS、MDA5、MEKK1、MICA、MICAB、MKK7、MMP25、MX1、NAIP、NFKB1、NFKB2、NFKBIA、NLRC3、NLRC4、NLRC5、NLRP1、NLRP10、NLRP11、NLRP12、NLRP13、NLRP14、NLRP2、NLRP3、NLRP4、NLRP5、NLRP6、NLRP7、NLRP8、NLRP9、NLRX1、NMI、NOD1、NOD2、OAS2、PDIA3、PKR、PMAIP1、PML、POMC、PSMB8、PSMB9、REC8、REL、RELA、RELB、RIG-1、RIP、RNAse L、RTP4、SAMD9L、SECTM1、SEPX1、SERPING1、SOCS1、SP110、SPTLC3、SSTR2、STAT1、TAP1、TAP2、TAPBP、TBK1、TGFβ、TLR1、TLR10、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TMEM140、TNF、TNFR1、TNFR2、TNFRSF14、TNFSF10、TNFSF13B、TP53、TRA、TRADD、TRAF2、TRAF3、TRB、TRD、TRG、TRIM25、UNG、VAMP5、WARS、XAF1和ZC3HAV1,或它们的任何子集。
如本文所用,“阵列”可以指代具有不同微特征的群体,诸如包含以下多核苷酸的微特征:这些多核苷酸与表面缔合或附接,使得不同的微特征可以根据相对位置彼此区分。阵列的单个特征可包括微特征的单个拷贝,或者该微特征的多个拷贝可作为阵列的单个特征处的微特征的群体而存在。每个特征处的微特征的群体通常是同质的,具有单个种类的微特征。因此,单个核酸序列的多个拷贝可存在于一个特征处,例如,存在于具有相同序列的多个核酸分子上。
在一些实施方案中,微特征的异质群体可存在于一个特征处。因此,一个特征可以但不必仅包括单个微特征种类,而是可包括多个不同的微特征种类,诸如具有不同序列的核酸的混合物。阵列的相邻特征可为彼此离散的,因为它们不重叠。因此,特征可彼此邻近或由缺口隔开。在其中特征间隔开的实施方案中,相邻位点可以隔开例如以下距离:小于100pm、50pm、10pm、5pm、1pm、0.5pm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm,或前述距离中任意两者所组成的范围内的任何距离。阵列上特征的布局也可根据相邻特征之间的中心至中心距离来理解。可用于本发明的阵列可以具有中心至中心间距为以下距离的相邻特征:小于约100pm、50pm、10pm、5pm、1pm、0.5pm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm,或前述距离中任意两者所组成的范围内的任何距离。
在一些实施方案中,上文和本文其他地方所述的距离值可表示阵列的相邻特征之间的平均距离。因此,除非有相反的明确说明,例如通过距离构成阵列的所有相邻特征之间的阈值距离的明确说明,否则并非所有相邻特征都需要落入指定范围内。实施方案可与具有各种密度中的任一种密度的特征的阵列一起使用。某些实施方案的示例密度范围包括约10,000,000个特征/cm2至约2,000,000,000个特征/cm2、约100,000,000个特征/cm2至约1,000,000,000个特征/cm2、约100,000个特征/cm2至约10,000,000个特征/cm2、约1,000,000个特征/cm2至约5,000,000个特征/cm2、约10,000个特征/cm2至约100,000个特征/cm2、约20,000个特征/cm2至约50,000个特征/cm2、约1,000个特征/cm2至约5,000个特征/cm2,或前述密度中任意两者所组成的范围内的任何密度。
如本文所用,“表面”可以指代基底或支撑结构的能够与试剂、珠粒或分析物接触的一部分。表面可为基本上平坦的或平面的。另选地,表面可为圆形的或轮廓状的。可包括在表面上的示例性轮廓为孔、凹陷、柱、脊、通道等。可用作基底或支撑结构的示例性材料包括:玻璃,诸如改性的或官能化的玻璃;塑料,诸如丙烯酸、聚苯乙烯或苯乙烯与另一种材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯或特氟隆;多糖或交联多糖,诸如琼脂糖或琼脂糖凝胶;尼龙;硝化纤维;树脂;二氧化硅或基于二氧化硅的材料,包括硅和改性硅;碳纤维;金属;无机玻璃;光纤束,或多种其他聚合物。单一材料或几种不同材料的混合物可形成可用于本发明的表面。在一些实施方案中,表面包括孔。在一些实施方案中,支撑结构可包括一个或多个层。示例性支撑结构可包括芯片、膜、多孔板和流通池。
如本文所用,“珠粒”可以指代由刚性或半刚性材料制成的小主体。主体可具有例如以球形、椭圆形、微球形或其他公认的颗粒形状为特征的形状,无论是具有规则的尺寸还是不规则的尺寸。可用于小珠的示例性材料包括:玻璃,诸如改性的或官能化的玻璃;塑料,诸如丙烯酸、聚苯乙烯或苯乙烯与另一种材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯或特氟隆;多糖或交联多糖,诸如琼脂糖或琼脂糖凝胶;尼龙;硝化纤维;树脂;二氧化硅或基于二氧化硅的材料,包括硅和改性硅;碳纤维;金属;无机玻璃;或多种其他聚合物。示例性小珠包括可控孔玻璃小珠、顺磁性小珠、氧化钍溶胶、琼脂糖小珠、纳米晶体和本领域已知的其他小珠。小珠可由生物或非生物材料制成。由于在本文所述方法的各个步骤中使用磁体容易操纵磁珠,所以磁珠是特别有用的。用于某些实施方案中的珠粒可以具有约0.1pm至约100pm、约0.1nm至约500nm的直径、宽度或长度。在一些实施方案中,用于某些实施方案中的珠粒可以具有小于约100pm、50pm、10pm、5pm、1pm、0.5pm、100nm、50nm、10nm、5nm、1nm、0.5nm、100pm、50pm、1pm的直径、宽度或长度,或者在前述直径、宽度或长度中任意两个数值所组成的范围内的任何直径、宽度或长度。小珠尺寸可被选择为具有减小的尺寸,从而获得每单位面积更多的特征,同时保持足够的信号(每个特征的模板拷贝)以便分析特征。
在一些实施方案中,多核苷酸可附接于小珠。在一些实施方案中,小珠可分布到基板表面上的孔内。可以用于某些实施方案中的示例珠粒阵列包括随机排序的BEAD ARRAY技术(Illumina Inc.,San Diego CA)。此类珠粒阵列公开于以下文献中:Michael等人,AnalChem 70,1242-8(1998);Walt,Science 287,451-2(2000);Fan等人,Cold Spring HarbSymp Quant Biol 68:69-78(2003);Gunderson等人,Nat Genet 37:549-54(2005);Bibikova等人,Am J Pathol 165:1799-807(2004);Fan等人,Genome Res,第14卷,第878-885页(2004年);Kuhn等人,Genome Res,第14卷,第2347-2356页(2004年);Yeakley等人,第20卷,第353-358页(2002年);以及Bibikova等人,Genome Res,第16卷,第383-393页(2006年),这些文献中的每一篇均全文以引用方式并入。
如本文所用,“靶标核酸”或其语法等同形式可以指代需要测序、分析和/或进一步操作的核酸分子或序列。在一些实施方案中,靶核酸可附接于阵列。在一些实施方案中,可将捕获探针附接于阵列,并且该阵列随后用于检测与探针相互作用的样本中的靶核酸。就这一点而言,应当理解,在一些实施方案中,术语“靶”和“探针”可在核酸检测方法方面互换使用。
在一些实施方案中,阵列上不同探针的数目在500至100,000的范围内。在其他实施方案中,阵列上不同靶标的数目为至少500、1,000、5,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、55,000、60,000、65,000、70,000、75,000、80,000、85,000、90,000、95,000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、550,000、600,000、650,000、700,000、750,000、800,000、850,000、900,000、950,000或1,000,000。
如本文所用,“捕获探针”可以指代具有足够大的互补性以便特异性地与靶标核酸杂交的多核苷酸。捕获探针可用作用于将靶核酸与混合物中的其他核酸和/或组分分离的亲和结合分子。在一些实施方案中,靶核酸可通过介入分子由捕获探针特异性结合。介入分子的示例包括接头、衔接子和其他具有足够互补性以特异性杂交至靶序列和捕获探针两者的桥接核酸。
对于发明构思的COVID-19甲基化分析,包括被设计成靶向以下基因的探针:ABCF1、ACBD5、AGL、AGPAT1、AIF1、ANKRD28、APOBEC3G、APOL6、APPBP2、ASPM、ATAT1、ATP2C1、B2M、BCL2L14、BRD2、C1orf68、C2、C4A、C4B、C6orf136、C6orf15、C7、CALR、CATSPER2、CATSPER2P1、CATSPERG、CCDC66、CCHCR1、CD27-AS1、CD4、CD40、CDKN1A、CELF4、CEP162、CFB、CFH、CFHR1、CFHR2、CFHR3、CFHR4、CHTOP、CIITA、CSNK2B、CTNND1、CUTA、CYP21A2、DAG1、DDR1、DENND2B、DEXI、DTNB、DYSF、E2F5、EGFL8、EHMT2、ELAVL2、FAM49B、FKBP5、FLG、FLG-AS1、FRMD3、GAPVD1、GPANK1、GPX5、GTF2H4、HCG17、HCG18、HCG20、HCG22、HCG24、HCG25、HCG27、HCG4、HCG4B、HCP5、HLA-A、HLA-B、HLA-C、HLA-DPA1、HLA-DPB1、HLA-DPB2、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB1-AS1、HLA-DRA、HLA-E、HLA-F、HLA-F-AS1、HLA-G、HLA-H、HLA-V、HRNR、HSD17B8、HSPA1B、ICAM1、IFI16、IFI35、IFI44、IFI44L、IFITM1、IVL、JAK2、KCTD16、KDM4C、KIFC1、KPRP、LAP3、LCE1D、LCE1E、LCE2B、LCE2C、LCE2D、LCE3C、LCE4A、LELP1、LINC00302、LINC01185、LOC100129636、LOC100294145、LOC100507547、LOC101929006、LOC105375690、LRBA、LST1、LTA、LTBR、LY6G6F-LY6G6D、LYRM4-AS1、MCCD1、MDC1、MEF2C、MICA、MICA-AS1、MICB、MICB-DT、MIR219A1、MIR4479、MMP25、MOG、MPIG6B、MSH5、MUCL3、MX1、NA、NBPF18P、NELFE、NFKB1、NFKB2、NLRC5、NLRP11、NLRP2、NLRP3、NLRP4、NLRP5、NLRX1、NRCAM、OR10C1、OR12D2、OR14J1、OR2H1、OR2H2、OR2J1、OR2J2、OSMR、PCDH15、PDCD6IPP2、PDIA3、PGLYRP4、PHF1、PML、PPP1R11、PPP2R5A、PPP6R3、PPT2、PRR3、PRR9、PRRC2A、PRRT1、PSMB8-AS1、PSMB9、PSORS1C1、PSORS1C2、RALYL、REC8、REL、RELB、RING1、RNF43、RNF5、RNF5P1、RPL13A、RPS18、RPS6KC1、RTP4、RXRB、S100A13、S100A7、S100A8、SCNN1A、SERPINB7、SERPING1、SHMT1、SKIV2L、SLC44A4、SLCO5A1、SMURF2P1-LRRC37BP1、SNAPC3、SNHG32、SNORD32B、SNX14、SPRR1A、SPRR1B、SPRR3、SPRR4、SPTLC3、STAT4、STOML1、SUN1、SYNGAP1、TAP1、TBC1D5、TBK1、TCF19、THRB、TK2、TLR2、TLR3、TLR4、TMEM185A、TMEM62、TNF、TNFRSF14、TNFRSF14-AS1、TNFSF13B、TPTE2P5、TRAF2、TRAF3、TRIM10、TRIM15、TRIM27、TRIM33、TRIM37、TRIM39、TRIM40、TRIT1、TRPM4、TSBP1、TSBP1-AS1、TUBB、UBE2K、USP8、VARS2、VEZT、VPS52、XAF1、XPOT、YY1AP1、ZMYND11、ZNF248、ZNF512、ZNF610和ZNRD1ASP。用于这些基因的探针的序列包括以所附序列表(名称为IP-2201-PCT_SL.txt)的SEQ ID NO:1–7,831或它们的任何子集示出的那些。
在一些实施方案中,这些探针包含选自由随附序列表中的以下序列组成的组的至少一种序列:SEQ ID NO:42、48、49、56、60、152、153、154、155、156、160、161、170、174、175、176、192、195、196、205、206、207、208、209、210、211、217、219、220、221、222、235、255、294、295、298、299、300、310、315、322、329、330、331、337、602、607、608、668、669、677、678、738、750、751、756、757、761、762、769、770、773、776、777、779、829、830、842、843、846、847、855、856、857、858、860、864、869、870、877、882、904、905、916、922、923、924、925、933、942、943、959、964、965、966、969、981、982、999、1000、1002、1003、1004、1005、1035、1036、1046、1047、1048、1049、1062、1063、1090、1095、1096、1097、1122、1123、1138、1145、1146、1155、1156、1158、1165、1173、1174、1180、1181、1185、1210、1211、1216、1217、1219、1220、1225、1237、1238、1247、1248、1249、1250、1254、1255、1256、1259、1260、1263、1270、1271、1296、1297、1308、1309、1312、1314、1318、1319、1326、1328、1329、1342、1348、1405、1406、1413、1414、1415、1416、1433、1434、1443、1444、1465、1470、1476、1485、1486、1487、1508、1509、1510、1514、1612、1613、1620、1627、1638、1639、1664、1665、1666、1669、1670、1676、1677、1684、1685、1701、1712、1719、1720、1721、1722、1726、1727、1731、1738、1740、1747、1748、1852、1853、1854、1939、2072、2073、2075、2088、2090、2171、2193、2194、2434、2435、2604、2676、2678、2680、2681、2756、2914、2915、2919、2920、3180、3243、3774、3775、3994、3995、3996、3998、3999、4000、4020、4021、4030、4031、4046、4103、4171、4179、4184、4187、4188、4225、4236、4251、4253、4257、4258、4259、4262、4263、4272、4276、4277、4278、4292、4293、4313、4314、4316、4317、4318、4328、4329、4330、4343、4344、4345、4357、4358、4376、4377、4384、4389、4390、4402、4408、4409、4410、4411、4414、4415、4416、4418、4419、4421、4422、4426、4427、4430、4439、4453、4454、4456、4457、4458、4479、4487、4488、4491、4492、4493、4494、4500、4501、4518、4519、4525、4526、4539、4540、4555、4562、4563、4564、4584、4585、4586、4589、4594、4595、4596、4597、4615、4617、4618、4619、4620、4621、4622、4627、4628、4629、4630、4631、4632、4657、4658、4661、4662、4671、4673、4689、4690、4691、4697、4698、4716、4717、4726、4727、4728、4729、4731、4747、4768、4773、4774、4778、4779、4780、4781、4782、4783、4784、4785、4968、4969、4976、4977、4987、4993、4994、4995、4999、5005、5006、5020、5025、5026、5027、5035、5049、5050、5055、5056、5158、5164、5171、5172、5173、5188、5189、5190、5191、5192、5193、5204、5206、5208、5209、5210、5211、5212、5213、5214、5217、5219、5220、5225、5232、5233、5234、5235、5238、5239、5240、5241、5294、5295、5296、5313、5316、5327、5370、5375、5376、5377、5378、5379、5385、5507、5508、5509、5510、5511、5512、5513、5514、5515、5516、5517、5561、5572、5573、5574、5577、5578、5579、5585、5586、5592、5645、5646、5649、5650、5656、5657、5667、5672、5681、5684、5695、5696、5697、5698、5699、5700、5701、5702、5710、5711、5720、5725、5728、5729、5730、5743、5744、5745、5748、5749、5759、5760、5761、5765、5766、5768、5769、5772、5780、5781、5782、5802、5803、5804、5807、5808、5809、5813、5814、5816、5817、5828、5829、5833、5910、5914、5917、5937、5941、5942、5944、5945、5948、5949、5963、6018、6019、6023、6031、6032、6033、6039、6040、6043、6045、6109、6110、6111、6112、6113、6116、6127、6128、6133、6134、6137、6225、6236、6242、6449、6450、6451、6452、6453、6454、6455、6457、6458、6461、6462、6463、6466、6469、6470、6471、6480、6481、6545、6546、6547、6613、6684、6685、6692、6693、6694、6695、6710、6711、6731、6732、6741、6787、6788、6805、6806、6807、6828、6829、6830、6831、6832、6835、6836、6846、6847、6848、6849、6850、6862、6868、6869、6870、6871、6878、6879、6897、6898、6899、6900、6908、6909、6914、6938、6939、6949、6950、6951、6952、6959、6960、6971、6972、6973、6974、6976、6979、7110、7111、7112、7113、7117、7118、7120、7122、7124、7135、7184、7185、7401、7402、7404、7408、7441、7442、7482、7490、7491、7497、7500、7503、7504、7513、7514、7515、7525、7526、7621、7622、7623、7624、7625、7626、7627、7638、7649、7650、7651、7652、7665、7694、7704、7705、7708、7716、7717、7718、7726、7727、7728、7729、7738、7739、7740、7741、7742、7743、7744、7746、7747、7749、7757、7770、7771、7774、7775、7777、7783、7788、7789、7790、7791、7798、7799、7803、7804、7815、7816、7823、7824和7825,或它们的任何子集。
在一些实施方案中,该甲基化标记包括检测选自由以下项组成的组的至少一种基因的甲基化状态:ABCF1、ABCF1、AIF1、APOBEC3G、APOL6、B2M、BCL2L14、BRD2、C2、C6orf136、C6orf15、C7、CALR、CD27-AS1、CD4、CD40、CFB、CFH、CHTOP、CIITA、CSNK2B、CUTA、CYP21A2、DDR1、DEXI、EGFL8、EHMT2、GPANK1、GPX5、GTF2H4、HCG17、HCG18、HCG20、HCG25、HCG27、HCG4、HCG4B、HLA-A、HLA-DPA1、HLA-DPB2、HLA-DQA2、HLA-E、HLA-F、HLA-F-AS1、HLA-G、HLA-V、ICAM1、IFI16、IFI35、IFI44、IFI44L、IFITM1、IVL、KIFC1、KPRP、LCE1D、LCE1E、LCE2C、LELP1、LINC00302、LOC100507547、LOC101929006、LY6G6F-LY6G6D、MICA-AS1、MICB、MICB-DT、MSH5、MX1、NA、NBPF18P、NFKB1、NFKB2、NLRC5、NLRP11、NLRP3、NLRP5、NLRX1、OR2H1、OSMR、PDIA3、PHF1、PML、PPP1R11、PPT2、PRR9、PRRC2A、PSMB8-AS1、PSMB9、PSORS1C1、REC8、REL、RELB、RING1、RNF5、RPS18、RTP4、RXRB、S100A13、SCNN1A、SERPING1、SKIV2L、SLC44A4、SNORD32B、SPRR4、SPTLC3、SYNGAP1、TAP1、TBK1、TCF19、TLR3、TNF、TNFRSF14、TNFSF13B、TRAF2、TRAF3、TRIM15、TRIM27、TRIM39、TSBP1-AS1、TUBB、VARS2、VPS52、XAF1和ZNRD1ASP,或它们的任何子集。
术语“分类器”和“预测器”可以互换使用,是指用于确定样品可以被分配到其中的类别的过程,该过程使用标记的值(例如,一组基因的甲基化水平)和用于每个标记组分的预先确定的系数(或权重)来生成给定观察结果或个体患者的评分,以用于分配到类别的目的。分类器可以是线性的和/或概率性的。如果评分是由一组系数加权的求和标记值的函数,则分类器是线性的。此外,如果标记值的函数生成的概率,即介于0与1.0(或0和100%)之间的值分别量化受试者或观察结果属于特定类别或将具有特定结果的可能性,则分类器是概率性的。概率单位回归和逻辑回归是分别使用概率单位链接函数和逻辑链接函数来生成概率的概率线性分类器的示例。在一些实施方案中,分类器可以是根据指定的测量特性(例如,观察到的DNA/基因/CpG岛甲基化水平)将样品归入类别中的过程。
分类器方程可以采取例如以下一般形式:
P(有条件)=Φ(β1X12X2+…+βdXd)
其中条件是:例如,存在SARS-CoV-2感染,和/或易患ARDS/MIS-A/MIS-C。Φ(.)是概率单位(或逻辑等)链接函数;{β12,…,βd}是在宿主反应生物标志物被翻译至平台时,通过训练分类器而获得的系数(这些系数在本文中也可以作为“权重”表示为{w1,w2,…,wd});{X1,X2,…,Xd}是标记/生物标志物的DNA/基因/CpG岛甲基化水平;并且d是标记/生物标志物的大小(即,甲基化位点/基因座的数目)。
应当指出的是,可以调整阈值或截止值以适应诊断决策。例如,可以降低用于诊断细菌感染的阈值以利于检验灵敏度,因此降低潜在危及生命的假阴性结果的可能性。
分类器可以通过称为“训练”的过程来开发,该过程利用一组数据,这组数据包含具有已知类别成员关系的观察结果,例如,DNA/基因/CpG岛甲基化水平。具体地讲,训练设法找到给定标记的每个组分(例如,组分的DNA/基因/CpG岛甲基化水平和DNA/基因/CpG岛甲基化水平差值)的最佳系数(即权重),以及最佳标记,诸如一组基因/生物标志物,其中最佳结果由可实现的最高分类准确度确定。在阳性病例与阴性对照之间具有较高甲基化程度差异的DNA/CpG岛通常是被选择作为用于该标记的特征/组分的探针。发明构思的分类器可以例如通过迭代地进行以下操作来生成:为每个DNA基因座/基因的甲基化程度分配权重,将每个DNA基因座/基因的甲基化程度的权重和值输入分类器方程中,以及确定多个受试者各自的结果评分;确定在多个受试者中每个结果的分类准确度,然后调整权重,直到分类准确度被优化,以提供分类器。发明构思的分类器包括例如:受试患者是否感染SARS-CoV-2的分类器、受试者是否患有COVID-19的分类器、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS的分类器,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C的分类器。在训练期间使用样本训练集开发的分类器用于预测目的,以诊断新个体(“分类”)。
在一些实施方案中,可以使用一个或多个支持向量机(SVM)来开发/生成发明构思的分类器。如本领域技术人员所理解的,任何可用的SVM都可以用于生成分类器。软件(例如svmlib/libsvm)可以用于训练和/或优化分类器。改善分类器的性能可以通过选择更好的特征(标记的DNA/基因/CpG岛甲基化位点/组分),诸如选择在阳性病例与阴性对照之间具有较高甲基化程度差异的DNA/CpG岛,或者通过采集进一步的数据/观察结果来实现。
“分类”可以指代将患有症状或有出现症状的风险的受试者分配到一个或多个类别或结果的方法(其中这些类别或结果例如:受试者/患者是否感染SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS、受试者是否患有与COVID-19相关联的MIS-A以及/或者是否更可能患上与COVID-19相关联的MIS-A,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C)。在一些情况下,例如,在患有COVID-19并且更可能患上与COVID-19相关联的MIS-C的情况下,可以将受试者分类为多于一种类别。结果或类别由分类器提供的/从分类器导出的评分的值确定,该评分值可以与截止值或阈值、置信水平或限值进行比较。在其他场景中,可以给出属于特定类别的概率(例如,如果该分类器报告概率的话)。在一些实施方案中,由分类器报告的高概率或可能性可以为约0.7或更高,可以为约0.75或更高、约0.8或更高、约0.85或更高、约0.9或更高、约0.95或更高、约0.98或更高,或者约0.99或更高。在一些实施方案中,由分类器报告的高百分比可能性可以为约70%或更高、约75%或更高、约80%或更高、约85%或更高、约90%或更高、约95%或更高、约98%或更高,或者约99%或更高。
术语“指示”在与DNA/基因/CpG岛甲基化水平一起使用时,可以意味着该DNA/基因/CpG岛甲基化水平与替代性的生物学状态(例如,患者/受试者是否感染SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C)或对照中的水平相比上调或下调、改变或变化。术语“指示”在与DNA/基因/CpG岛甲基化水平一起使用时,意味着该DNA/基因/CpG岛甲基化水平与标准蛋白质水平或替代性的生物学状态中的水平相比更高或更低、增加或减少、改变或变化。测量的DNA/基因/CpG岛甲基化水平,当在如本文所述的分类器的语境中(例如用于指示以下项的分类器:存在SARS-CoV-2、受试者是否患有COVID-19(即,与SARS-CoV-2相关联的疾病)、受试者是否患有与COVID-19相关联的更严重症状以及/或者是否更可能患上与COVID-19相关联的更严重症状、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C)用预先确定的权重分析时,可以提供“指示”以下项的评分/效果/结果:存在SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。
应当理解,SARS-CoV-2疾病(COVID-19)的症状遍及一系列状态/状态连续体,包括无症状的疾病。症状可以包括但不限于(例如):发热和/或畏寒、咳嗽、呼吸短促和/或呼吸困难、疲劳、肌肉疼痛和/或身体疼痛、头痛、新出现的味觉和/或嗅觉丧失、喉咙痛、鼻塞和/或流涕、恶心和/或呕吐,以及腹泻。更严重的症状可以包括但不限于可能需要立即紧急医疗护理的症状,例如:呼吸困难、持续的胸部疼痛或压迫感、新出现的意识模糊、无法醒来或无法保持清醒、以及取决于肤色,皮肤、嘴唇或甲床苍白、灰暗或发青。严重的SARS-CoV-2疾病还可以包括与COVID-19相关联的ARDS、MIS-A和/或MIS-C。
术语“受试者”和“患者”可以互换使用,是指被检查、研究或治疗的任何动物。本公开并不旨在限于任何特定类型的受试者。在本发明的一些实施方案中,人是优选的受试者,而在其他实施方案中,非人动物是优选的受试者,包括但不限于:小鼠、猴、雪貂、牛、绵羊、山羊、猪、鸡、火鸡、狗、猫、马和爬行动物,以及例如实验室动物(诸如大鼠、小鼠、豚鼠、兔、灵长类等)、农场或商业动物(例如奶牛、猪、马、山羊、驴、绵羊等)或家畜(例如猫、狗、雪貂、马等)。人类受试者可以是任何性别(例如,男性、女性或跨性别者),也可以处于任何发育阶段(即,新生儿、婴幼儿、少年、青少年、成人、老年人)。在一些实施方案中,受试者可以是可能患有与COVID-19相关联的更严重症状以及/或者更可能患上与COVID-19相关联的更严重症状的人类受试者。在一些实施方案中,受试者可以是可能患有与COVID-19相关联的ARDS以及/或者更可能患上与COVID-19相关联的ARDS的人类受试者。在一些实施方案中,受试者可以是可能患有与COVID-19相关联的MIS-A以及/或者更可能患上与COVID-19相关联的MIS-A的成人或老年人受试者。在一些实施方案中,受试者可以是可能患有与COVID-19相关联的MIS-C以及/或者更可能患上与COVID-19相关联的MIS-C的非成人或非老年人受试者(即,新生儿、婴幼儿、少年或青少年人类受试者)。
在一些实施方案中,受试者存在感染冠状病毒(诸如SARS-CoV-2)的高风险,以及/或者存在患有与SARS-CoV-2疾病相关联的更严重症状的高风险。在一些实施方案中,受试者为65岁或更大的年龄,患有高血压、哮喘、肺病、癌症、糖尿病、唐氏综合征、心脏疾病/病症、HIV、肾病、肝病、肺病、镰状细胞病或地中海贫血、神经系统病症(诸如痴呆)、物质使用障碍,进行过实质器官或血液干细胞移植,并且/或者患有卒中/脑血管疾病、怀孕、超重/肥胖、吸烟,并且/或者免疫受损。在一些实施方案中,免疫受损受试者可能患有免疫缺陷疾病并且/或者可能具有I型IFN防御缺陷。
“平台”或“技术”是指可以用于根据发明构思测量标记(例如,DNA/基因/CpG岛甲基化水平)的装置(例如,仪器和相关零件、计算机、包括一个或多个本文所教导的数据库的计算机可读介质、试剂、阵列等)。用于分析/测量DNA/基因/CpG岛甲基化水平的平台的示例可以包括甲基化珠粒芯片。示例性的甲基化珠粒芯片包括例如:商业平台,诸如IlluminaInfinium Methylation EPIC BeadChip试剂盒;和定制平台,诸如定制的IlluminaInfinium Methylation EPIC BeadChip试剂盒(EPIC+),和如本文所述的IlluminaInfinium HTS Custom Methylation COVID-19组套。
在一些实施方案中,该平台可以被配置为半定量地测量DNA/基因/CpG岛甲基化水平,即,不是测量离散的或绝对的DNA/基因/CpG岛甲基化水平,而是测量DNA/基因/CpG岛甲基化水平作为估计值,以及/或者相对于彼此或指定的一种或多种标志物(例如,另一种“标准”或“参考”基因/标志物的DNA/基因/CpG岛甲基化)测量DNA/基因/CpG岛甲基化水平。
根据发明构思的实施方案,对DNA/基因/CpG岛甲基化的分析可以包括在核酸扩增/甲基化分析之前用亚硫酸氢盐(例如亚硫酸氢钠)处理DNA。根据发明构思的实施方案,对DNA/基因/CpG岛甲基化的分析可以包括对亚硫酸氢盐处理过的DNA进行核酸扩增。根据发明构思的实施方案,核酸扩增可以通过本领域技术人员将会理解的任何方法来实现。在一些实施方案中,核酸扩增可以包括对亚硫酸氢盐处理过的DNA进行全基因组扩增(WGA),方式例如为:随机六聚体引物引发和Phi29聚合酶,以及在DNA/基因/CpG岛甲基化分析之前对扩增产物进行酶促片段化。然后可以用如本文所述的平台或技术对亚硫酸氢盐处理过的DNA的核酸扩增产物进行分析。
核酸扩增可以包括加热扩增,诸如聚合酶链式反应(PCR),或者可以包括等温扩增,诸如环介导等温扩增(LAMP)、多重置换扩增(MDA)、链置换扩增(SDA)、解旋酶依赖性扩增(HDA)、重组酶聚合酶扩增(RPA)、基于核酸序列的扩增(NASBA)、滚环扩增(RCA)。
术语“生物样品”包括可以取自受试者/生物来源的包含可以用于本文所提供的方法中的遗传物质的任何样品。例如,生物样品可以包括血液样品,诸如外周血样品。术语“外周血样品”是指取自身体系统的在循环系统或身体中循环的血液样品。其他样品可以包括取自上呼吸道的那些,包括但不限于痰、鼻咽拭子(NPS)和鼻咽洗液,或滑液,或脑脊液。生物样品还可以包括取自下呼吸道的那些,包括但不限于痰、支气管肺泡灌洗液和气管内抽吸物。生物样品还可以包括这些物质的任意组合。“生物来源”包括例如从其可以获得样品/生物样品或者样品/生物样品可以来源于其的人类受试者或非人类受试者(“体内”)、培养的细胞(“体外”)和原代人组织(“离体”)。例如,测量/测定/分析一种或多种生物来源中的DNA/基因/基因CpG岛甲基化水平包括测量/测定/分析来源于该生物来源的样品/生物样品中的DNA/基因/基因CpG岛甲基化水平,并且在一些实施方案中,可以由测量/测定/分析来源于该生物来源的样品/生物样品中的DNA/基因/基因CpG岛甲基化水平来提供。
当提及基因甲基化水平和/或DNA甲基化水平时,术语“获得”、“采集”和/或“收集”可以包括在例如来源于例如生物来源的样品/生物样品中以实验方式测量DNA甲基化水平/基因/CpG岛甲基化水平,以及从例如本领域技术人员可获得或将可获得的DNA/基因/CpG岛甲基化数据的公共数据库和/或可商购获得的数据库中提取测量/测定的DNA/基因/CpG岛甲基化水平。当提及样品(诸如生物样品)时,术语“获得”、“采集”和/或“收集”可以包括从来源(诸如生物来源)以实验方式获得、采集和/或收集的样品,以及从例如公众可获得的储存库和/或商业储存库提取的样品,其中这些储存库是本领域技术人员将会知道的。
术语“治疗”是指由施用一种或多种疗法引起疾病或异常、或者疾病或异常的一种或多种症状的严重性、持续时间和/或进展降低或改善。该术语可以指代病原体(诸如本文所述的呼吸道病毒)的复制减少,或者病原体向受试者体内的其他器官或组织或者向其他受试者的传播减少。
“适当的治疗方案”是指治疗特定疾病或异常所需的护理标准。通常,此类方案需要向受试者施用能够在疾病状态下产生疗效的治疗剂的行为。例如,合适的治疗方案可以包括以本领域技术人员将理解的适当量施用任何治疗剂来治疗病原体,例如,如本文所述的呼吸道病毒,诸如但不限于:SARS-CoV-2(与2019冠状病毒病(即COVID-19)相关联的冠状病毒)、呼吸道合胞病毒(RSV)、副流感病毒(1、2、3、4)、人偏肺病毒(hMPV)、人鼻病毒、腺病毒(Ad);和现存冠状病毒,例如:229E(α冠状病毒)、NL63(α冠状病毒)、OC43(β冠状病毒)、HKU1(β冠状病毒)、MERS-CoV(与中东呼吸综合征(即MERS)相关联的β冠状病毒),和/或SARS-CoV(与严重急性呼吸综合征(即SARS)相关联的β冠状病毒)。发明构思还考虑使用根据发明构思的方法来确定使用尚未公开的治疗剂治疗此类病原体的方案。在一些实施方案中,发明构思设想治疗和/或预防现在已知或有待发现的属于冠状病毒科(Coronaviridae)的任何病毒/病毒感染。
系统和计算机实现的方法
根据本文所述的各种实施方案,分类系统、计算机程序产品和/或计算机实现的方法可以用于平台中或由平台使用。分类系统、计算机程序产品和/或计算机实现的方法可以体现为一个或多个企业计算机系统、应用计算机系统、个人计算机系统、普适计算机系统和/或嵌入式计算机系统,这些计算机系统可操作以使用软件、固件和/或硬件的任何合适的组合来接收、传输、处理和存储数据,并且可以是独立的以及/或者通过任何常规的、公共的和/或私有的、真实的和/或虚拟的、有线的和/或无线的网络(包括被称为互联网的全球通信网络的全部或一部分)互连,并且可以包括各种类型的有形的非暂态计算机可读介质。可以使用发明构思的分类系统、计算机程序产品和/或计算机实现的方法的硬件不受特别限制,并且可以包括但不限于个人计算机、手持式和/或移动设备、电话等。在一些实施方案中,发明构思的系统、计算机程序和/或计算机实现的方法可以是基于云的。
分类系统可以包括处理器子系统,该处理器子系统包括一个或多个中央处理单元(CPU),一个或多个操作系统和/或一个或多个应用程序在该CPU上运行。应当理解,可以存在多个处理器,它们可以是电互连的或分离的。处理器被配置为执行来自存储器设备(诸如存储器)的计算机程序代码,以执行本文所述的操作和方法中的至少一些,并且可以是任何常规或专用处理器,包括但不限于数字信号处理器(DSP)、现场可编程门阵列(FPGA)、专用集成电路(ASIC)与多核处理器。
存储器子系统可以包括存储器设备的分级结构,诸如随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)或闪存存储器,以及/或者任何其他固态存储器设备。
还可以提供存储电路,其可以包括例如便携式计算机软磁盘、硬盘、便携式光盘只读存储器(CDROM)、光存储设备、磁存储设备和/或任何其他种类的基于磁盘或磁带的存储子系统。存储电路可以设置在硬件上,该硬件包括但不限于计算机(诸如个人计算机(PC))、移动/手持式设备(诸如平板电脑和/或移动电话)等;或者可以设置在云上。存储电路可以为分类系统提供对数据/参数/分类器的非易失性存储。存储电路可以包括磁盘驱动器和/或网络存储部件。存储电路可以用于存储将由处理器执行的代码和/或将由处理器访问的数据。在一些实施方案中,存储电路可以存储允许访问用于分类系统的数据/参数/分类器的数据库,其中这些数据/参数/分类器诸如标记、权重、阈值等。存储电路可以利用一种或多种计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是(例如但又不限于)电、磁、光、电磁、红外或半导体系统、装置或设备,或者前述项的任何合适的组合。计算机可读存储介质的更具体的示例(非穷举列表)将包括以下项:便携式计算机软磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存存储器)、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备,或前述项的任何合适的组合。如本文所用,计算机可读存储介质可以是能够容纳或存储供指令执行系统、装置或设备使用或者与指令执行系统、装置或设备结合的程序的任何有形介质。
输入/输出电路可以包括显示器和/或用户输入设备,诸如键盘、触摸屏和/或指向设备。附接到输入/输出电路的设备可以用于由分类系统的用户向处理器提供信息。附接到输入/输出电路的设备可以包括联网或通信控制器、输入设备(键盘、鼠标、触摸屏等)和输出设备(打印机或显示器)。输入/输出电路还可以提供到设备(诸如显示器和/或打印机)的接口,分类系统操作的结果可以传送到该接口,以便提供给分类系统的用户。
可以包括可选的更新电路,作为用于向分类系统提供更新的接口。更新可以包括存储在存储器和/或存储电路中的对由处理器执行的代码的更新。经由更新电路提供的更新还可以包括对与数据库和/或其他数据存储格式相关的存储电路部分的更新,其中数据库和/或其他数据存储格式维护用于分类系统的信息,诸如标记、权重、阈值等。
分类系统的样品输入电路可以为上文所述平台提供接口以接收待分析的生物样品。样品输入电路可以包括机械元件以及电气元件,这些元件接收由用户提供给分类系统的生物样品,随后在分类系统和/或平台内传送该生物样品以进行处理。样品输入电路可以包括条形码读取器,该条形码读取器识别标有条形码的容器,以用于识别样品和/或送检项目表。样品处理电路可以进一步处理分类系统和/或平台内的生物样品,以便制备用于自动分析的生物样品。样品分析电路可以自动地分析处理过的生物样品。样品分析电路可以用于测量例如提供给分类系统的生物样品内的一群/组基因的DNA/基因/CpG岛甲基化水平。在一些实施方案中,测量一群/组基因的DNA/甲基化水平是在商业平台上完成的,该商业平台诸如Illumina Infinium Methylation EPIC BeadChip试剂盒。在一些实施方案中,测量一群/组基因的DNA/甲基化水平是在定制平台上完成的,该定制平台诸如定制的IlluminaInfinium Methylation EPIC BeadChip试剂盒(EPIC+),以及如本文所述的IlluminaInfinium HTS Custom Methylation COVID-19组套。样品分析电路还可以从存储电路检索用于指示以下项的分类器:受试者是否感染SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C,该分类器包括针对这群/组基因中的每个基因/DNA甲基化位点预先定义的加权值(即,系数)。样品分析电路可以将DNA/基因/CpG岛甲基化值输入一个或多个分类器中,这些分类器选自用于指示以下项的分类器:受试患者是否感染SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。样品分析电路可以经由输入/输出电路,基于所述分类器和控制输出确定SARS-CoV-2感染是否存在、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C,或者这些项的一些组合,来计算以下一项或多项的概率:受试者是否具有SARS-CoV-2感染、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。在一些实施方案中,样品分析电路可以计算存在感染或不存在感染(诸如SARS-CoV-2感染)的概率或评分,并且/或者其中存在感染指示存在受试者可能患有ARDS和/或MIS-C的可能性和/或风险。
样品输入电路、样品处理电路、样品分析电路、输入/输出电路、存储电路和/或更新电路可以至少部分地在分类系统的一个或多个处理器的控制下运行。如本文所用,在处理器的“控制下”运行意味着由样品输入电路、样品处理电路、样品分析电路、输入/输出电路、存储电路和/或更新电路执行的操作可以至少部分地由处理器执行和/或引导,但不排除那些部件的至少一部分操作单独地以电学方式或机械方式自动化。如本文所述,处理器可以经由执行计算机程序代码来控制分类系统的操作。
用于实施本公开各方面的操作的计算机程序代码可以用一种或多种编程语言的任何组合来编写,这些编程语言包括面向对象的编程语言,诸如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等;常规的过程编程语言,诸如“C”编程语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP;动态编程语言,诸如Python、Ruby和Groovy;或其他编程语言。程序代码可以作为独立软件包完全在分类系统上执行或部分在分类系统上执行,可以部分在分类系统上并且部分在远程计算机上执行,或者完全在远程计算机或服务器上执行。在后一种场景中,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到分类系统,或者可以连接到外部计算机(例如,使用互联网服务提供商通过互联网)或在云计算机环境中建立连接,或者作为服务(诸如软件即服务(SaaS))来提供连接。
在一些实施方案中,该系统包括计算机可读代码,该计算机可读代码可以将DNA/基因/CpG岛甲基化的定量或半定量检测结果转化为感染致病源的累积评分或概率。在一些实施方案中,该系统包括计算机可读代码,该计算机可读代码可以将DNA/基因/CpG岛甲基化的定量或半定量检测结果转化为存在或不存在感染的累积评分或概率,其中存在感染可以指示:存在SARS-CoV-2、受试者是否患有COVID-19、受试者是否患有与COVID-19相关联的ARDS以及/或者是否更可能患上与COVID-19相关联的ARDS、受试者是否患有与COVID-19相关联的MIS-A以及/或者是否更可能患上与COVID-19相关联的MIS-A,或者受试者是否患有与COVID-19相关联的MIS-C以及/或者是否更可能患上与COVID-19相关联的MIS-C。
在发明构思的方法中使用的算法可以包括本领域技术人员将会理解的任何机器学习方法,包括例如线性回归、ElasticNet回归、Ridge回归、LASSO回归、支持向量机(SVM)回归、Random 
Figure BDA0004010556300000271
和/或XGBoost决策树算法。在一些实施方案中,第一机器学习方法可以用于优化第二机器学习方法的特征。例如,在生成分类器时,对初始样本集进行SVM训练之后可以是对更多样本的XGBoost决策树训练。
在一些实施方案中,该系统是从样品到结果系统,其具有集成的部件,使得用户仅需要插入待检验的生物样品,在一段时间后(优选地为较短的时间,例如10分钟、30分钟或45分钟,或者1小时、2小时或3小时,最长8小时、12小时、24小时或48小时)就可以从该系统接收结果输出。
可以与平台一起使用的分类系统、计算机程序产品和/或计算机实现的方法的框图描绘在图7中。分类系统700、计算机程序产品和/或计算机实现的方法可以包括处理器子系统740,该处理器子系统包括一个或多个中央处理单元(CPU),一个或多个操作系统和/或一个或多个应用程序在该CPU上运行。尽管只示出了一个处理器740,但是应当理解,可以存在多个处理器740,它们可以是电互连的或分离的。处理器740被配置为执行来自存储器设备(诸如存储器750)的计算机程序代码,以执行本文所述的至少一些操作和方法。存储电路770可以存储允许访问由分类系统700使用的数据/参数/分类器的数据库,其中这些数据/参数/分类器诸如标记、权重、阈值等。输入/输出电路760可以包括显示器和/或用户输入设备,诸如键盘、触摸屏和/或指向设备。附接到输入/输出电路760的设备可以用于由分类系统700的用户向处理器740提供信息。附接到输入/输出电路760的设备可以包括联网或通信控制器、输入设备(键盘、鼠标、触摸屏等)和输出设备(打印机或显示器)。可以包括可选的更新电路780作为用于向分类系统700提供更新的接口,其中更新诸如存储在存储器750和/或存储电路770中的对由处理器740执行的代码的更新。经由更新电路780提供的更新还可以包括对与数据库和/或其他数据存储格式相关的存储电路770部分的更新,其中数据库和/或其他数据存储格式维护用于分类系统700的信息,诸如标记、权重、阈值等。样品输入电路710为分类系统700提供接口,以接收待分析的生物样品。样品处理电路720可以进一步处理分类系统700内的生物样品,以便准备由样品分析电路730自动分析的生物样品。样品处理电路720和/或样品分析电路730可以结合如本文所述的平台或技术来操作,该平台或技术诸如本文所述的Illumina Infinium Methylation EPIC BeadChip试剂盒、IlluminaInfinium Methylation EPIC BeadChip试剂盒(EPIC+),以及Illumina Infinium HTSCustom Methylation COVID-19组套。
应当理解,本发明在其应用中不限于在以下描述中阐述的或在以下附图中展示的部件的构造和布置的细节。本发明能够具有其他实施方案,并且能够以各种方式实践或实施。
尽管已描述了发明构思的各个方面,但在以下实施例中将更详细地解释这些方面,这些实施例包括在本文中用于说明目的,并且并不旨在限制本发明。
实施例1:COVID-19相关结果的表观遗传低甲基化和预测
1.COVID-19标记来自Infinium Methylation EPIC BeadChip试剂盒。Illumina的Infinium甲基化珠粒阵列已成为提供本申请中所利用的大多数可操作数据的主力设备,并且Infinium甲基化技术(即EPIC BeadChip)的最新扩展提供了对近全表观基因组的覆盖(1)。为本申请集结的团队在科罗拉多大学安舒茨遗传学研究组织(CARGO)中提供机构服务,通过各个研究项目在利用EPIC平台识别与呼吸道疾病和变应性疾病相关联的甲基化变化(2-22)以及与病毒传播相关联的表型(23)方面具有相当多的专业知识。另一个关键考虑是,新兴的表观遗传学领域已证明,可执行的分类与传统GWAS相比,需要的样品量少得多(24),并且本申请中提出的样品量(N>3,000)超过了检测真实关联所必需的能力。
为了利用EPIC的覆盖范围对COVID-19+样品和COVID-19-样品的差异甲基化标记进行分类,完成了初步研究以证明能够准确地区分COVID-19+DNA样品和COVID-19-DNA样品,以及告知开发定制的Infinium Methylation EPIC BeadChip试剂盒(称为EPIC+)来检验更多的患者样品(第1阶段)。开发EPIC+芯片的最终目标是选择~50K探针来创建Infinium HTS Custom Methylation COVID-19组套(用于本申请中的研究的计划平台)(第2阶段)。分析来自在CCPM Biobank中进行基于rtPCR的COVID-19检验的25名患者的鼻咽拭子(NPS)的洗脱缓冲液样品中的残留核酸的浓度和纯度,然后使用EZ DNA MethylationGold试剂盒(Zymo,Irvine,CA)进行亚硫酸氢盐转化。取亚硫酸氢盐处理过的DNA经由随机六聚体引发和Phi29 DNA聚合酶进行全基因组扩增(WGA),将扩增产物酶法片段化25,从dNTP、引物和酶中纯化,然后在Infinium 850K(EPIC)甲基化芯片上加工。总的来说,经由rtPCR,15个样品被检测为COVID-19阴性,10个样品被检测为COVID-19阳性。将该分析与现有的EPIC NPS甲基化数据整合(n=164);由于这些预先存在的样品是在COVID-19之前收集的,因此在本构思验证研究中,它们代表了适当的未暴露对照。在使用这15个样品的情况下,(i)样品处理的可行性得到证实,原因是:使用阴性对照探针指标和seSAMe的基于p值的PooBAH检测阈值两者的质量控制过滤器(在seSAMe(26)中实现)显示超过98%的检出率,这表明数据的质量高(图1)。(ii)使用seSAMe中的DML函数,在COVID-19+个体与COVID-19-个体之间识别了具有Δβ(平均甲基化状态的变化)的776个位点。(iii)通过增加样品量并且利用164个COVID-19前对照,可以在这2个组之间可靠地检测的Δβ>0.2个探针的位点的数量增加至25,000个。然后将libsvm包用于支持向量机(SVM)(27)训练和测试。进行了双重交叉验证测试,以证明病例与对照之间的信号清晰:测试了3种不同的SVM分类方法以及3种不同的p值和阈值检测方法(表1)。基于776个CpG位点和15个样品的分类准确度在84.6至100范围内。在L2正则化L2损失SVM(双重)分类器中使用25,000个位点和164个样品并且使用负p值选择方法得到93.7至95.7的准确度。这些结果非常清楚地证实,COVID+样品和COVID-样品可以使用表观遗传标志物以及所提供的用于随着EPIC定制而向前移动的关键数据来区分。
2.开发和实施定制的Infinium Methylation EPIC BeadChip试剂盒。在利用从COVID-19+患者和COVID-19-患者的NPS样品生成的数据(上述第1部分)的情况下,除了与同近期冠状病毒爆发相关联的呼吸道病毒感染和心肺并发症的已知表观遗传关联性之外,还以所有26,000个已知的HLA等位基因,以及跨MHC基因组区域、天然杀伤细胞免疫受体(KIR)和其他免疫遗传基因座的多个替代性单倍型和未公布的参考序列为目标,以增强免疫应答检测的灵敏度,并且开发了定制的Infinium Methylation EPIC BeadChip试剂盒。定制的“EPIC+”芯片包括~10k个位点,这些位点的目标在于增加免疫应答基因检测组套的覆盖范围(表2)。表3汇总了定制芯片如何补充标准EPIC芯片上已经存在的位点。用于检验最多624个DNA样品的芯片由Illumina制造和提供。
目前,正在对来自312个COVID-19+血液样品和312个COVID-19-血液样品的基因组DNA进行处理,这些血液样品收集自通过科罗拉多大学的现有方案招募的患者,以便:(i)确认能够使用来自全血的基因组DNA识别SARS-CoV-2感染的表观遗传标记并且对COVID-19做出早期诊断;以及(ii)表征准确预测SARS-CoV-2感染(通过常规临床rtPCR检验和血清学数据证实)的表观遗传标记,并且选择50K个最佳CpG位点来产生Infinium HTS CustomMethylation COVID-19组套。
3.使用来自检测了COVID19的患者的血液生物样本从EPIC+芯片中识别COVID-19标记(第1阶段)。考虑到来自血液的基因组DNA在规模上是比来自疑似COVID-19病例可行得多的组织来源(主要是因为其消除了与用于收集NPS的拭子相关联的供应链问题有关的担忧),并且因为血液已证明是用于生成表观遗传标记和预测疾病的疾病分类器的可靠来源(28-34),所以在试点研究中将焦点从来自NPS样品的DNA转移到了用于第1阶段的血液。迄今为止,已从EPIC+芯片生成了有关624个样品中的前90个样品的结果。与试点研究相同,分析了DNA样品的浓度和纯度,然后如上所述使用EZ DNA Methylation Gold试剂盒(Zymo,Irvine,CA)进行亚硫酸氢盐转化,并在新开发的EPIC+甲基化芯片上处理扩增的DNA。86个样品超过了使用SeSAMe软件包的PooBAH算法的检测p值截止值,从而产生多于初始10个COVID-19+和15个COVID-19-对照的经处理的43个COVID+和43个COVID的增加数据集用于训练。将这些样品随机分成三组,使用XGBoost的R实现(极端梯度增强)进行三重交叉验证训练和测试。表1汇总了第1阶段中的初始批次样品的结果。类似于试点研究,首先从SeSAMe软件包中应用差异甲基化基因座(DML)函数对每个随机分区中的所有基因座进行排序。为每个分区挑选排序前N位的基因座,其中N在100、1000、10k、50k、100k和1M的范围内(仅显示1k和10k的数据)。对于每个“桶(bucket)”,使用XGBoost采用默认参数进行训练和测试(表4)。
除了改进机器学习技术以及将样品量增加到超过试点研究之外,在第1阶段中,还已将EPIC阵列的内容扩展了~10k基因座,以扩展宿主免疫应答基因。此外,还包括新的探针设计,其使得能够检测和测量人类基因组中的多个特定位点处的DNA甲基化。这种设计类型使得能够在高度同源的区域(诸如HLA)中进行表观遗传检测分类。这些新的探针设计显示出大于DML算法的选择机会。利用改进的机器学习算法、增加的数据集、改进的靶向和新型的Infinium探针设计,COVID+样品与COVID-样品之间的强表观遗传标记在全血液中再现。这表明这种检测的准确度仅受可用于训练的样品数量的限制。
4.在SARS-CoV-2感染状态下进行全表观基因组关联研究(EWAS)。为了评价SARS-CoV-2感染状态下的全表观基因组DNA甲基化模式,在Illumina EPIC+阵列上根据上文第3部分所述,由来自43个COVID+个体和43个COVID-个体的数据对外周血进行了分析。使用seSAMe处理Illumina IDAT信号强度文件(26)。去除了含有SNP位点(一般群体中次要等位基因频率>1%)的探针,以及存在非唯一映射和脱靶杂交的探针。此外,在分析前去除了样品间的平均检测p值≥0.05的探针。这导致748,416个探针通过了质量控制,并且在全表观基因组关联分析(EWAS)中测试了与COVID-19状态的关联性。使用主成分回归分析(PCRA)来识别具有强批次效应的阵列位置,然后使用ComBat来回归(35)。使用Limma线性模型识别差异甲基化CpG(36),针对年龄、性别和种族/民族进行调节。使用Bacon调整p值的膨胀和偏倚(37),并且使用Benjamini-Hochberg错误发现率(FDR)调整p值的多重比较(38)。该分析识别出了在经FDR调整的p值<0.05时显著的145个CpG(图2)。干扰素应答因子7(IRF7)基因内的CpG具有最低的甲基化程度,与COVID-19阴性组相比,COVID19阳性组中甲基化的平均变化为-23%。此外,富集分析将多种干扰素相关类别识别为在差异甲基化基因内以最高程度富集(对I型干扰素的GO生物过程细胞反应,BioPlanet通路干扰素α/β信号传导,Jensen隔室干扰素调节因子复合物,等等)。这些数据提示干扰素应答的低甲基化,因此提示干扰素应答活化,如先前针对SARS感染所观察到的(39、40)。如使用Houseman方法(41)所估计的,在COVID-19阳性组和COVID-19阴性组中没有观察到细胞比例的显著差异,表明我们识别的甲基化变化不受细胞比例的影响。
参考文献
1 Pidsley,R.et al.Critical evaluation of the IlluminaMethylationEPICBeadChip microarray for whole-genome DNA methylationprofiling.Genome Biol 17,208,doi:10.1186/s13059-016-1066-1(2016)。
2 Breton,C.V.et al.Prenatal tobacco smoke exposure is associated withchildhood DNA CpG methylation.PloS one 9,e99716,doi:10.1371/journal.pone.0099716(2014)。
3 Kothari,P.H.et al.Role of local CpG DNA methylation in mediatingthe 17q21 asthma susceptibility gasdermin B(GSDMB)/ORMDL sphingolipidbiosynthesis regulator 3(ORMDL3)expression quantitative trait locus.TheJournal of allergy and clinical immunology 141,2282-2286 e2286,doi:10.1016/j.jaci.2017.11.057(2018)。
4 Yang,I.V.et al.Relationship of DNA methylation and gene expressionin idiopathic pulmonary fibrosis.American journal of respiratory and criticalcare medicine 190,1263-1272,doi:10.1164/rccm.201408-1452OC(2014)。
5 Eyring,K.R.,Pedersen,B.S.,Yang,I.V.&Schwartz,D.A.In Utero CigaretteSmoke Affects Allergic Airway Disease But Does Not Alter the LungMethylome.PloS one 10,e0144087,doi:10.1371/journal.pone.0144087(2015)。
6 Helling,B.A.&Yang,I.V.Epigenetics in lung fibrosis:frompathobiology to treatment perspective.Current opinion in pulmonary medicine21,454-462,doi:10.1097/MCP.0000000000000191(2015)。
7 Liang,L.et al.An epigenome-wide association study of total serumimmunoglobulin E concentration.Nature 520,670-674,doi:10.1038/nature14125(2015)。
8 Yang,I.V.et al.DNA methylation and childhood asthma in the innercity.The Journal of allergy and clinical immunology 136,69-80,doi:10.1016/j.jaci.2015.01.025(2015)。
9 Breton,C.V.et al.Small-Magnitude Effect Sizes in Epigenetic EndPoints are Important in Children's Environmental Health Studies:The Children's Environmental Health and Disease Prevention Research Center's EpigeneticsWorking Group.Environmental health perspectives 125,511-526,doi:10.1289/EHP595(2017)。
10 Helling,B.A.et al.Regulation of MUC5B Expression in IdiopathicPulmonary Fibrosis.American journal of respiratory cell and molecular biology57,91-99,doi:10.1165/rcmb.2017-0046OC(2017)。
11 Yang,I.V.,Lozupone,C.A.&Schwartz,D.A.The environment,epigenome,andasthma.The Journal of allergy and clinical immunology 140,14-23,doi:10.1016/j.jaci.2017.05.011(2017)。
12 Yang,I.V.et al.The nasal methylome and childhood atopicasthma.Journal of Allergy and Clinical Immunology 139,1478-1488,doi:10.1016/j.jaci.2016.07.036(2017)。
13 Yang,I.V.et al.The Nasal Methylome:A Key to Understanding AllergicAsthma.American journal of respiratory and critical care medicine 195,829-831,doi:10.1164/rccm.201608-1558LE(2017)。
14 Davidson,E.J.&Yang,I.V.Role of epigenetics in the development ofchildhood asthma.Current opinion in allergy and clinical immunology 18,132-138,doi:10.1097/ACI.0000000000000429(2018)。
15 Eyring,K.R.et al.Methylene-tetrahydrofolate reductase contributesto allergic airway disease.PloS one 13,e0190916,doi:10.1371/journal.pone.0190916(2018)。
16 Yang,I.V.DNA methylation signatures of atopy and asthma.LancetRespir Med,doi:10.1016/S2213 2600(18)30504-6(2018)。
17 Reese,S.E.et al.Epigenome-wide meta-analysis of DNA methylationand childhood asthma.The Journal of allergy and clinical immunology 143,2062-2074,doi:10.1016/j.jaci.2018.11.043(2019)。
18 Yang,I.V.et al.DNA Methylation Changes in Lung Immune Cells AreAssociated with Granulomatous Lung Disease.American journal of respiratorycell and molecular biology 60,96-105,doi:10.1165/rcmb.2018-0177OC(2019)。
19 Qi,C.et al.Nasal DNA methylation profiling of asthma andrhinitis.The Journal of allergy and clinical immunology,doi:10.1016/j.jaci.2019.12.911(2020)。
20 Yang IV et al.DNA Methylation Changes and Childhood Asthma in theInner City J Allergy Clin Immunol.accepted(2015)。
21 Forno,E.et al.DNA methylation in nasal epithelium,atopy,and atopicasthma in children:a genomewide study.Lancet Respir Med,doi:10.1016/S2213-2600(18)30466-1(2018)。
22 Cardenas,A.et al.The nasal methylome as a biomarker of asthma andairway inflammation in children.Nature communications 10,3095,doi:10.1038/s41467-019-11058-3(2019)。
23 Boorgula,M.P.et al.Replicated methylation changes associated witheczema herpeticum and allergic response.Clinical epigenetics 11,122,doi:10.1186/s13148-019-0714-1(2019)。
24 Tsai,P.C.&Bell,J.T.Power and sample size estimation for epigenome-wide association scans to detect differential DNA methylation.Int J Epidemiol44,1429-1441,doi:10.1093/ije/dyv041(2015)。
25 Weisenberger DJ,V.D.B.D.,Pan F,Berman BP,and LairdPW.Comprehensive DNA Methylation Analysis on the Illumina Infinium AssayPlatform.Illumina application note(2008)。
26 Zhou,W.,Triche,T.J.,Jr.,Laird,P.W.&Shen,H.SeSAMe:reducingartifactual detection of DNA methylation by Infinium BeadChips in genomicdeletions.Nucleic Acids Res 46,e123,doi:10.1093/nar/gky691(2018)。
27 Chang,C.-C.&Lin,C.-J.LIBSVM:a library for support vectormachines.ACM Transactions on Intelligent Systems and Technology 2:27,1-27(2011)。
28 Jiang,H.et al.DNA methylation markers in the diagnosis andprognosis of common leukemias.Signal Transduct Target Ther 5,3,doi:10.1038/s41392-019-0090-5(2020)。
29 Ciolfi,A.et al.Frameshift mutations at the C-terminus of HIST1H1Eresult in a specific DNA hypomethylation signature.Clin Epigenetics 12,7,doi:10.1186/s13148-019-0804-0(2020)。
30 Wang,L.,Ni,S.,Du,Z.&Li,X.A six-CpG-based methylation markers forthe diagnosis of ovarian cancer in blood.J Cell Biochem 121,1409-1419,doi:10.1002/jcb.29376(2020)。
31 Imgenberg-Kreuz,J.et al.Shared and Unique Patterns of DNAMethylation in Systemic Lupus Erythematosus and Primary Sjogren'sSyndrome.Front Immunol 10,1686,doi:10.3389/fimmu.2019.01686(2019)。
32 Bend,E.G.et al.Gene domain-specific DNA methylation episignatureshighlight distinct molecular entities of ADNP syndrome.Clin Epigenetics 11,64,doi:10.1186/s13148-019-0658-5(2019)。
33 Wang,C.,Chen,L.,Yang,Y.,Zhang,M.&Wong,G.Identification ofpotential blood biomarkers for Parkinson's disease by gene expression and DNAmethylation data integration analysis.Clin Epigenetics 11,24,doi:10.1186/s13148-019-0621-5(2019)。
34 Panagopoulou,M.et al.Circulating cell-free DNA in breast cancer:size profiling,levels,and methylation patterns lead to prognostic andpredictive classifiers.Oncogene 38,3387-3401,doi:10.1038/s41388-018-0660-y(2019)。
35 Leek,J.T.,Johnson,W.E.,Parker,H.S.,Jaffe,A.E.&Storey,J.D.The svapackage for removing batch effects and other unwanted variation in high-throughput experiments.Bioinformatics 28,882-883,doi:10.1093/bioinformatics/bts034(2012)。
36 Ritchie,M.E.et al.limma powers differential expression analysesfor RNA-sequencing and microarray studies.Nucleic acids research 43,e47,doi:10.1093/nar/gkv007(2015)。
37 van Iterson,M.,van Zwet,E.W.,Consortium,B.&Heijmans,B.T.Controlling bias and inflation in epigenome-and transcriptome-wideassociation studies using the empirical null distribution.Genome biology 18,19,doi:10.1186/s13059-016-1131-9(2017)。
38 Benjamini,Y.&Hochberg,Y.Controlling the False Discovery Rate:APractical and Powerful Approach to Multiple Testing.Journal of the RoyalStatistical Society.Series B(Methodological)57,289-300(1995)。
39Totura,A.L.&Baric,R.S.SARS coronavirus pathogenesis:host innateimmune responses and viral antagonism of interferon.Curr Opin Virol 2,264-275,doi:10.1016/j.coviro.2012.04.004(2012)。
40Menachery,V.D.et al.Pathogenic influenza viruses and coronavirusesutilize similar and contrasting approaches to control interferon-stimulatedgene responses.mBio 5,e01174-01114,doi:10.1128/mBio.01174-14(2014)。
41Houseman,E.A.et al.DNA methylation arrays as surrogate measures ofcell mixture distribution.BMC bioinformatics 13,86,doi:10.1186/1471-2105-13-86(2012)。
实施例2:表观遗传标记在与COVID-19相关联的儿童多系统炎症综合征(MIS-C)的 临床表现中的潜在作用
包膜RNA病毒(例如冠状病毒)通过拮抗和调节宿主先天免疫抗病毒防御过程,特别是经由DNA甲基化来操纵宿主的表观基因组。已在其他病毒感染(流行性感冒、呼吸道合胞病毒、鼻病毒、腺病毒)、COVID-19的呼吸道并发症(即哮喘、COPD)和CVD并发症中报道过表观遗传修饰。表观遗传变化可以预测与COVID-19感染相关联的心肺并发症(即ARDS)和与COVID-19相关联的儿童多系统炎症综合征(MIS-C)的恶化。
德国癌症研究中心(DKFZ)将基于DNA甲基化的诊断方法应用于CNS肿瘤诊断。对超过90种CNS肿瘤类型的DNA甲基化阵列数据的无监督聚类显示,不同的肿瘤基于它们的表观遗传标记被很好地分类。使用Illumina EPIC甲基化阵列,DKFZ建立了网页分散式随机森林分类器来准确地诊断CNS肿瘤类型。该分类器将肿瘤误分类减少了约15%(参见,Sawahla等人DNA methylation-based classification of central nervous systemtumors.Nature 555,469,doi:10.1038/nature26000)。
为了将基于甲基化的分类应用于COVID-19和与COVID-19相关联的并发症,在从来自COVID-19+患者和COVID-19-患者的血液样品中提取的DNA中分析了DNA甲基化模式(图3)。分析分离的DNA样品的浓度和纯度,使用EZ DNA Methylation Lightning MagPrep试剂盒(ZYMO,Irvine,CA)的自动化Hamilton方案进行亚硫酸氢盐转化。对亚硫酸氢盐转化过的DNA进行扩增,然后在新开发的Infinium EPIC+甲基化芯片上处理扩增的DNA(第1阶段),以及在Infinium HTS Custom Methylation COVID-19组套上处理扩增的DNA(第2阶段)。通过杂交、荧光染色、芯片扫描和数据分析对甲基化进行定量,并且为COVID-19、呼吸道病毒感染和疾病恶化所提供的诊断标记(例如,诊断标记)可以通过使用来自患有COVID-19和/或MIS-C的儿童的样品进行分析来提供诊(图4)。对COVID-19+病例和COVID-19-对照的示例性SVM训练和测试描绘在图5中,并且汇总在实施例1的表1中。
Infinium HTS Custom Methylation COVID-19组套可以用于评估图6所示的SARS-CoV-2疾病症状连续体内的疾病状态,从无症状到轻度、到重度,再到MIS-C。该定制组套以低成本(小于约$100/样品)提供高覆盖率和高准确度,且在约48小时内报告结果。该定制组套可以广泛地应用,因为其在例如研究和临床实验室中的Illumina Infinium平台上以及存在于较小的临床实验室中并常规地可在较小的临床实验室中使用的设备(诸如NextSeq550)上运行。最大可能通量在表5中示出。每个测试要求获得约500ng基因组DNA,其可以收集在例如专用的4mL EDTA等分试样中(平均收率=约50ng/μL,相当于约7.5μL)。
实施例3:分析流水线和机器学习方法
用于评估疾病状态的分类器是通过从COVID-19状态已知(COVID-19+和COVID-19-)的样品中收集DNA甲基化的数据来实现的。使用BSC指标、对照、pOOBAH和nOOB背景校正对原始数据进行QC/归一化。基于基因座检测百分比、检测p值(灵敏度)和探针数目(+样品和-样品)进行预先QC。对标记进行监督式机器学习,并且通过用更多的样品进行迭代并调整特征的加权来生成分类器,直到分类准确度被优化为止。分类器生成过程的概要描绘在图8中。机器学习方法描绘在图9中。用于机器学习的算法可以包括线性回归、ElasticNet回归、Ridge回归、LASSO回归、支持向量机(SVM)回归、Random
Figure BDA0004010556300000381
和XGBoost决策树算法。使用SVM作为第一次分析的交叉验证结果在表6中示出。对COVID-19+NPS样品和COVID-19-对照进行SVM训练和测试,之后对COVID-19+和COVID-19-血液样品进行XGBoost训练和测试。从该分析可以得出结论,在COVID-19+样品与COVID-19-样品之间存在DNA甲基化标记的差异。
本领域的技术人员将容易理解,本发明非常适于实现所提及的目的并且获得所提及的结果和优点,以及其中固有的那些结果和优点。本文所述的本公开内容目前代表特定的实施方案,是示例性的,并且不旨在作为对本发明范围的限制。本领域的技术人员将想到其中的变化和其他用途,这些变化和用途涵盖在由权利要求的范围所限定的本发明实质中。
Figure BDA0004010556300000401
Figure BDA0004010556300000411
Figure BDA0004010556300000421
Figure BDA0004010556300000431

Claims (61)

1.一种测定受试者体内存在病毒感染的方法,包括:
从来源于所述受试者的样品获得一组DNA甲基化位点的甲基化模式;以及
用感染阳性甲基化分类器和/或感染阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,
其中当来源于所述感染阳性分类器的评分超过指示病毒感染存在的截止值和/或阈值时,指示所述受试者体内存在病毒感染。
2.根据权利要求1所述的方法,其中所述病毒感染是SARS-CoV-2感染。
3.根据权利要求2所述的方法,其中所述SARS-CoV-2感染引起COVID-19。
4.根据权利要求1至3中任一项所述的方法,其中所述样品是来自所述受试者的血液样品。
5.根据权利要求1至4中任一项所述的方法,其中所述受试者是人类受试者。
6.根据权利要求1至5中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
7.根据权利要求6所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
8.根据权利要求1至7中任一项所述的方法,其中用感染阳性甲基化分类器和/或感染阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
9.根据权利要求8所述的方法,其中感染阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
10.根据权利要求9所述的方法,其中所述感染阳性甲基化标记包括IFR7的低甲基化。
11.一种用于确定受试者体内的病毒感染产生急性呼吸窘迫综合征的可能性的方法,包括:
从来源于所述受试者的样品获得一组DNA甲基化位点的甲基化模式;以及
用急性呼吸窘迫综合征阳性甲基化分类器和/或急性呼吸窘迫综合征阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,
其中当来源于所述急性呼吸窘迫综合征阳性分类器的评分超过指示病毒感染产生急性呼吸窘迫综合征的可能性的截止值和/或阈值时,指示所述受试者将表现出急性呼吸窘迫综合征的可能性。
12.根据权利要求11所述的方法,其中所述病毒感染是SARS-CoV-2感染。
13.根据权利要求12所述的方法,其中所述SARS-CoV-2感染引起COVID-19。
14.根据权利要求11至13中任一项所述的方法,其中所述样品是来自所述受试者的血液样品。
15.根据权利要求11至14中任一项所述的方法,其中所述受试者是人类受试者。
16.根据权利要求11至15中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
17.根据权利要求16所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
18.根据权利要求11至17中任一项所述的方法,其中用感染阳性甲基化分类器和/或感染阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
19.根据权利要求18所述的方法,其中急性呼吸窘迫综合征阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
20.根据权利要求19所述的方法,其中所述感染阳性甲基化标记包括IFR7的低甲基化。
21.一种确定受试者体内病毒感染的性质的方法,包括:
从来源于所述受试者的样品获得一组DNA甲基化位点的甲基化模式;以及
用SARS-CoV-2阳性甲基化分类器和/或SARS-CoV-2阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,
其中当来源于所述SARS-CoV-2阳性甲基化分类器的评分超过指示SARS-CoV-2感染存在的截止值和/或阈值时,指示所述受试者体内存在SARS-CoV-2感染。
22.根据权利要求21所述的方法,其中所述样品是来自所述受试者的血液样品。
23.根据权利要求1或2所述的方法,其中所述受试者是人类受试者。
24.根据权利要求21至23中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
25.根据权利要求24所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
26.根据权利要求21至25中任一项所述的方法,其中用感染阳性甲基化分类器和/或感染阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
27.根据权利要求26所述的方法,其中急性呼吸窘迫综合征阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
28.根据权利要求27所述的方法,其中所述感染阳性甲基化标记包括IFR7的低甲基化。
29.一种计算机实现的方法,所述计算机实现的方法用于执行根据权利要求1至28中任一项所述的方法。
30.一种DNA甲基化位点的甲基化珠粒阵列,所述DNA甲基化位点包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
31.一种治疗受试者体内的COVID-19的方法,包括:
从来源于怀疑患有COVID-19的受试者的样品获得一组DNA甲基化位点的甲基化模式;
用SARS-CoV-2阳性甲基化分类器和/或SARS-CoV-2阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,其中当来源于所述SARS-CoV-2阳性甲基化分类器的评分超过指示SARS-CoV-2感染存在的截止值和/或阈值时,指示所述受试者体内存在SARS-CoV-2感染;以及
如果指示所述受试者体内存在SARS-CoV-2感染,则治疗所述受试者的COVID-19。
32.根据权利要求31所述的方法,其中所述样品是来自所述受试者的血液样品。
33.根据权利要求31或32所述的方法,其中所述受试者是人类受试者。
34.根据权利要求31至33中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
35.根据权利要求34所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
36.根据权利要求1至7中任一项所述的方法,其中用SARS-CoV-2阳性甲基化分类器和/或SARS-CoV-2阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
37.根据权利要求36所述的方法,其中SARS-CoV-2阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
38.根据权利要求37所述的方法,其中所述SARS-CoV-2阳性甲基化标记包括IFR7的低甲基化。
39.一种治疗怀疑患有COVID-19的受试者的急性呼吸窘迫综合征(ARDS)的方法,包括:
在来源于所述受试者的样品中获得一组DNA甲基化位点的甲基化模式;
用ARDS阳性甲基化分类器和/或ARDS阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,其中当来源于所述ARDS阳性分类器的评分超过指示COVID-19感染产生ARDS的可能性的截止值和/或阈值时,指示所述受试者将表现出急性呼吸窘迫综合征的可能性;以及
治疗所述受试者的ARDS。
40.根据权利要求39所述的方法,其中所述样品是来自所述受试者的血液样品。
41.根据权利要求39或40所述的方法,其中所述受试者是人类受试者。
42.根据权利要求39至41中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
43.根据权利要求42所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
44.根据权利要求31至43中任一项所述的方法,其中用ARDS阳性甲基化分类器和/或ARDS阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
45.根据权利要求44所述的方法,其中ARDS阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
46.根据权利要求45所述的方法,其中所述ARDS阳性甲基化标记包括IFR7的低甲基化。
47.一种治疗怀疑患有COVID-19的受试者的儿童多系统炎症综合征(MIS-C)的方法,包括:
在来源于所述受试者的样品中获得一组DNA甲基化位点的甲基化模式;
用MIS-C阳性甲基化分类器和/或MIS-C阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式,其中当来源于所述MIS-C阳性分类器的评分超过指示COVID-19感染产生MIS-C的可能性的截止值和/或阈值时,指示所述受试者将表现出MIS-C的可能性;以及
治疗所述受试者的MIS-C。
48.根据权利要求47所述的方法,其中所述样品是来自所述受试者的血液样品。
49.根据权利要求47或48所述的方法,其中所述受试者是人类受试者。
50.根据权利要求49所述的方法,其中所述人类受试者是青少年人类受试者。
51.根据权利要求47至50中任一项所述的方法,其中获得所述组DNA甲基化位点的所述甲基化模式是在甲基化珠粒阵列上进行的。
52.根据权利要求51所述的方法,其中所述甲基化珠粒阵列包含一组基因,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
53.根据权利要求31至43中任一项所述的方法,其中用MIS-C阳性甲基化分类器和/或MIS-C阴性甲基化分类器分析所述组DNA甲基化位点的所述甲基化模式包括分析一组基因的甲基化,所述组基因包括ANLN、ARID3B、ARID5B、CALHM2、CBX3B2、CD38、CHSY1 CMPK2、DDX60、DTX3L、EPSTI1、FAM38A、FGFRL1、GPX1、GTPBP2、IFI27、IFIT3、IRF7、LINC00428、LINC01429、MX1、OAS1、OAS2、PARP9、PHOSPHO1、PPL、RAB40C、REPD、TNFRSF8、TRIM22、TSEN15和ZDHHC6,或它们的任何子集。
54.根据权利要求53所述的方法,其中MIS-C阳性甲基化标记包括:选自由IFR7、ARID5B、ANLN、PARP9、MX1、CBX3P2、EPSTI1、CHSY1、MX1和GPX1或它们的任何子集组成的组的一种或多种基因的低甲基化,以及/或者选自由LINC01429、CALHM2、LINC00428、OAS1、RAB40C、TSEN15、PEPD、PPL、ARID3B、ZDHHC6、TNFRSF8、DDX60、OAS2和FGFRL1或它们的任何子集组成的组的一种或多种基因的高甲基化。
55.根据权利要求54所述的方法,其中所述感染阳性甲基化标记包括IFR7的低甲基化。
56.一种用于检测样品中存在呼吸道病毒的阵列,所述阵列包括附接到固体载体的多个寡核苷酸探针;其中所述多个寡核苷酸探针检测所述样品的甲基化标记。
57.一种用于确定患者体内的呼吸道病毒感染的临床结果的阵列,所述阵列包括附接到固体载体的多个寡核苷酸探针;其中所述多个寡核苷酸探针检测来自所述患者的样品的甲基化标记。
58.根据权利要求56或57所述的阵列,其中所述甲基化标记包括检测选自由以下项组成的组的至少一种基因的甲基化状态:A_24_P561165、AA455656、ABCF1、ACBD5、AGL、AGPAT1、AID、AIF1、AIM2、ANLN、ANKRD28、APE1、APOBEC3G、APOL2、APOL3、APOL6、APPBP2、ARID3B、ARID5B、ASK1、ASPM、ATAT1、ATF2、ATP2C1、B2M、BATF、BATF2、BCL2L14、BRD2、C10orf81、C1orf68、C1R、C1S、C2、C3、C4A、C4B、C5、C6、C6orf136、C6orf15、C7、C8、C9、CALHM2、CALR、CASP1、半胱天冬酶-3、半胱天冬酶-8、CATSPER2、CATSPER2P1、CATSPERG、CBX3B2、CCDC66、CCHCR1、CCRL1、CD19、CD27-AS1、CD4、CD38、CD40、CD74、CD8、CDKN1A、CELF4、CEP162、CFB、CFH、CFHR1、CFHR2、CFHR3、CFHR4、CHSY1、CHTOP、CIITA、CIITA BX117479、c-Jun、CLIC5、CMPK2、CSNK2B、CTNND1、CTSS ZBP1、CUTA、CX3CL1 A_24_P912985、CXCL10、CXCL11、CXCL2、CYP21A2、DAG1、DDR1、DDX60、DENND2B、DEXI、DTNB、DTX3L、DYSF、E2F5、EGFL8、EHMT2、eIF-2、eIF2B、ELAVL2、EPSTI1、ERP27、ETV7、FADD、FAM26F、FAM38A、FAM49B、FGFRL1GPX1、FKBP5、FLG、FLG-AS1、FRMD3、FZD5、GAPVD1、GPANK1、GPX5、GTPBP2、GTF2H4、HCG17、HCG18、HCG20、HCG22、HCG24、HCG25、HCG27、HCG4、HCG4B、HCP5、HCP5 NNMT、HLA-A、HLA-B、HLA-C、HLA-DMB、HLA-DOA、HLA-DPA1、HLA-DPB1、HLA-DPB2、HLA-DQA1、HLA-DQA2、HLA-DQB1、HLA-DQB1-AS1、HLA-DRA、HLA-DRB3、HLA-DRB4、HLA-DRB5、HLA-E、HLA-F、HLA-F-AS1、HLA-G、HLA-H、HLA-V、HRNR、HSD17B8、HSPA1B、ICAM1、IFI16、IFI27、IFI35、IFI44、IFI44L、IFIH1、IFIT2、IFIT3、IFIT5、IFITM1、IFNL1、IFNL2、IFNL3、IFNL4、IFN-α、IFN-β、IFNγ、IFN-γ、IFN-ε、IFN-κ、IFN-ω、IGH、IGK、IGL、IKK-α、IKK-β、IKK-γ、IKKε、IL-10、IL-11、IL-12、IL12A、IL-13、IL-15、IL-17、IL-18、IL18BP、IL-1ra、IL-1α、IL-1β、IL-2、IL-3、IL-33、IL-36ra、IL-36α、IL-36β、IL-36γ、IL-37、IL-38、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IRF1、IRF3、IRF7、IVL、JAK2、JNK、KCTD16、KDM4C、KIFC1、KPRP、LAP3、LCE1D、LCE1E、LCE2B、LCE2C、LCE2D、LCE3C、LCE4A、LELP1、LGP2、LINC00302、LINC00428、LINC01429、LINC01185、LOC100129636、LOC100294145、LOC100507547、LOC101929006、LOC105375690、LRBA、LST1、LTA、LTBR、LT-α、LY6G6F-LY6G6D、LYRM4-AS1、M27126、MAVS、MCCD1、MDA5、MDC1、MEF2C、MEKK1、MICA、MICA-AS1、MICAB、MICB、MICB-DT、MIR219A1、MIR4479、MKK7、MMP25、MOG、MPIG6B、MSH5、MUCL3、MX1、NA、NAIP、NBPF18P、NELFE、NFKB1、NFKB2、NFKBIA、NLRC3、NLRC4、NLRC5、NLRP1、NLRP10、NLRP11、NLRP12、NLRP13、NLRP14、NLRP2、NLRP3、NLRP4、NLRP5、NLRP6、NLRP7、NLRP8、NLRP9、NLRX1、NMI、NOD1、NOD2、NRCAM、OAS1、OAS2、OR10C1、OR12D2、OR14J1、OR2H1、OR2H2、OR2J1、OR2J2、OSMR、PARP9、PCDH15、PDCD6IPP2、PDIA3、PGLYRP4、PHF1、PHOSPHO1;PKR、PMAIP1、PML、POMC、PPL、PPP1R11、PPP2R5A、PPP6R3、PPT2、PRR3、PRR9、PRRC2A、PRRT1、PSMB8、PSMB8-AS1、PSMB9、PSORS1C1、PSORS1C2、RAB40C、RALYL、REC8、REL、RELA、RELB、REPD TNFRSF8、RIG-1、RING1、RIP、RNAse L、RNF43、RNF5、RNF5P1、RPL13A、RPS18、RPS6KC1、RTP4、RXRB、S100A13、S100A7、S100A8、SAMD9L、SCNN1A、SECTM1、SEPX1、SERPINB7、SERPING1、SHMT1、SKIV2L、SLC44A4、SLCO5A1、SMURF2P1-LRRC37BP1、SNAPC3、SNHG32、SNORD32B、SNX14、SOCS1、SP110、SPRR1A、SPRR1B、SPRR3、SPRR4、SPTLC3、SSTR2、STAT1、STAT4、STOML1、SUN1、SYNGAP1、TAP1、TAP2、TAPBP、TBC1D5、TBK1、TCF19、TGFβ、THRB、TK2、TLR1、TLR10、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TMEM140、TMEM185A、TMEM62、TNF、TNFR1、TNFR2、TNFRSF14、TNFRSF14-AS1、TNFSF10、TNFSF13B、TP53、TPTE2P5、TRA、TRADD、TRAF2、TRAF3、TRB、TRD、TRG、TRIM10、TRIM15、TRIM22、TRIM25、TRIM27、TRIM33、TRIM37、TRIM39、TRIM40、TRIT1、TRPM4、TSBP1、TSBP1-AS1、T TSEN15、UBB、UBE2K、UNG、USP8、VAMP5、VARS2、VEZT、VPS52、WARS、XAF1、XPOT、YY1AP1、ZC3HAV1、ZDHHC6、ZMYND11、ZNF248、ZNF512、ZNF610和ZNRD1ASP。
59.根据权利要求56或57所述的阵列,其中所述多个寡核苷酸探针包含选自由SEQ IDNO:1–7,831组成的组的至少一种序列。
60.根据权利要求56或57中任一项所述的阵列,其中所述多个寡核苷酸探针包含选自由以下项组成的组的至少一种序列:SEQ ID NO:42、48、49、56、60、152、153、154、155、156、160、161、170、174、175、176、192、195、196、205、206、207、208、209、210、211、217、219、220、221、222、235、255、294、295、298、299、300、310、315、322、329、330、331、337、602、607、608、668、669、677、678、738、750、751、756、757、761、762、769、770、773、776、777、779、829、830、842、843、846、847、855、856、857、858、860、864、869、870、877、882、904、905、916、922、923、924、925、933、942、943、959、964、965、966、969、981、982、999、1000、1002、1003、1004、1005、1035、1036、1046、1047、1048、1049、1062、1063、1090、1095、1096、1097、1122、1123、1138、1145、1146、1155、1156、1158、1165、1173、1174、1180、1181、1185、1210、1211、1216、1217、1219、1220、1225、1237、1238、1247、1248、1249、1250、1254、1255、1256、1259、1260、1263、1270、1271、1296、1297、1308、1309、1312、1314、1318、1319、1326、1328、1329、1342、1348、1405、1406、1413、1414、1415、1416、1433、1434、1443、1444、1465、1470、1476、1485、1486、1487、1508、1509、1510、1514、1612、1613、1620、1627、1638、1639、1664、1665、1666、1669、1670、1676、1677、1684、1685、1701、1712、1719、1720、1721、1722、1726、1727、1731、1738、1740、1747、1748、1852、1853、1854、1939、2072、2073、2075、2088、2090、2171、2193、2194、2434、2435、2604、2676、2678、2680、2681、2756、2914、2915、2919、2920、3180、3243、3774、3775、3994、3995、3996、3998、3999、4000、4020、4021、4030、4031、4046、4103、4171、4179、4184、4187、4188、4225、4236、4251、4253、4257、4258、4259、4262、4263、4272、4276、4277、4278、4292、4293、4313、4314、4316、4317、4318、4328、4329、4330、4343、4344、4345、4357、4358、4376、4377、4384、4389、4390、4402、4408、4409、4410、4411、4414、4415、4416、4418、4419、4421、4422、4426、4427、4430、4439、4453、4454、4456、4457、4458、4479、4487、4488、4491、4492、4493、4494、4500、4501、4518、4519、4525、4526、4539、4540、4555、4562、4563、4564、4584、4585、4586、4589、4594、4595、4596、4597、4615、4617、4618、4619、4620、4621、4622、4627、4628、4629、4630、4631、4632、4657、4658、4661、4662、4671、4673、4689、4690、4691、4697、4698、4716、4717、4726、4727、4728、4729、4731、4747、4768、4773、4774、4778、4779、4780、4781、4782、4783、4784、4785、4968、4969、4976、4977、4987、4993、4994、4995、4999、5005、5006、5020、5025、5026、5027、5035、5049、5050、5055、5056、5158、5164、5171、5172、5173、5188、5189、5190、5191、5192、5193、5204、5206、5208、5209、5210、5211、5212、5213、5214、5217、5219、5220、5225、5232、5233、5234、5235、5238、5239、5240、5241、5294、5295、5296、5313、5316、5327、5370、5375、5376、5377、5378、5379、5385、5507、5508、5509、5510、5511、5512、5513、5514、5515、5516、5517、5561、5572、5573、5574、5577、5578、5579、5585、5586、5592、5645、5646、5649、5650、5656、5657、5667、5672、5681、5684、5695、5696、5697、5698、5699、5700、5701、5702、5710、5711、5720、5725、5728、5729、5730、5743、5744、5745、5748、5749、5759、5760、5761、5765、5766、5768、5769、5772、5780、5781、5782、5802、5803、5804、5807、5808、5809、5813、5814、5816、5817、5828、5829、5833、5910、5914、5917、5937、5941、5942、5944、5945、5948、5949、5963、6018、6019、6023、6031、6032、6033、6039、6040、6043、6045、6109、6110、6111、6112、6113、6116、6127、6128、6133、6134、6137、6225、6236、6242、6449、6450、6451、6452、6453、6454、6455、6457、6458、6461、6462、6463、6466、6469、6470、6471、6480、6481、6545、6546、6547、6613、6684、6685、6692、6693、6694、6695、6710、6711、6731、6732、6741、6787、6788、6805、6806、6807、6828、6829、6830、6831、6832、6835、6836、6846、6847、6848、6849、6850、6862、6868、6869、6870、6871、6878、6879、6897、6898、6899、6900、6908、6909、6914、6938、6939、6949、6950、6951、6952、6959、6960、6971、6972、6973、6974、6976、6979、7110、7111、7112、7113、7117、7118、7120、7122、7124、7135、7184、7185、7401、7402、7404、7408、7441、7442、7482、7490、7491、7497、7500、7503、7504、7513、7514、7515、7525、7526、7621、7622、7623、7624、7625、7626、7627、7638、7649、7650、7651、7652、7665、7694、7704、7705、7708、7716、7717、7718、7726、7727、7728、7729、7738、7739、7740、7741、7742、7743、7744、7746、7747、7749、7757、7770、7771、7774、7775、7777、7783、7788、7789、7790、7791、7798、7799、7803、7804、7815、7816、7823、7824和7825。
61.根据权利要求56或57所述的阵列,其中所述甲基化标记包括检测选自由以下项组成的组的至少一种基因的甲基化状态:ABCF1、ABCF1、AIF1、APOBEC3G、APOL6、B2M、BCL2L14、BRD2、C2、C6orf136、C6orf15、C7、CALR、CD27-AS1、CD4、CD40、CFB、CFH、CHTOP、CIITA、CSNK2B、CUTA、CYP21A2、DDR1、DEXI、EGFL8、EHMT2、GPANK1、GPX5、GTF2H4、HCG17、HCG18、HCG20、HCG25、HCG27、HCG4、HCG4B、HLA-A、HLA-DPA1、HLA-DPB2、HLA-DQA2、HLA-E、HLA-F、HLA-F-AS1、HLA-G、HLA-V、ICAM1、IFI16、IFI35、IFI44、IFI44L、IFITM1、IVL、KIFC1、KPRP、LCE1D、LCE1E、LCE2C、LELP1、LINC00302、LOC100507547、LOC101929006、LY6G6F-LY6G6D、MICA-AS1、MICB、MICB-DT、MSH5、MX1、NA、NBPF18P、NFKB1、NFKB2、NLRC5、NLRP11、NLRP3、NLRP5、NLRX1、OR2H1、OSMR、PDIA3、PHF1、PML、PPP1R11、PPT2、PRR9、PRRC2A、PSMB8-AS1、PSMB9、PSORS1C1、REC8、REL、RELB、RING1、RNF5、RPS18、RTP4、RXRB、S100A13、SCNN1A、SERPING1、SKIV2L、SLC44A4、SNORD32B、SPRR4、SPTLC3、SYNGAP1、TAP1、TBK1、TCF19、TLR3、TNF、TNFRSF14、TNFSF13B、TRAF2、TRAF3、TRIM15、TRIM27、TRIM39、TSBP1-AS1、TUBB、VARS2、VPS52、XAF1和ZNRD1ASP。
CN202180044432.0A 2020-06-23 2021-06-23 用于诊断呼吸道病原体和预测covid-19相关结果的方法 Pending CN116096920A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063042669P 2020-06-23 2020-06-23
US63/042,669 2020-06-23
PCT/US2021/038763 WO2021262894A1 (en) 2020-06-23 2021-06-23 Methods for diagnosing respiratory pathogens and predicting covid-19 related outcomes

Publications (1)

Publication Number Publication Date
CN116096920A true CN116096920A (zh) 2023-05-09

Family

ID=79281779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180044432.0A Pending CN116096920A (zh) 2020-06-23 2021-06-23 用于诊断呼吸道病原体和预测covid-19相关结果的方法

Country Status (10)

Country Link
US (1) US20240093318A1 (zh)
EP (1) EP4168593A1 (zh)
JP (1) JP2023532444A (zh)
KR (1) KR20230038486A (zh)
CN (1) CN116096920A (zh)
AU (1) AU2021297245A1 (zh)
BR (1) BR112022026509A2 (zh)
CA (1) CA3184128A1 (zh)
MX (1) MX2023000105A (zh)
WO (1) WO2021262894A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4303326A1 (fr) * 2022-07-06 2024-01-10 Biomérieux Determination du risque de deces d'un sujet infecte par un virus respiratoire par mesure du niveau d'expression du gene oas2
WO2024008955A1 (en) * 2022-07-08 2024-01-11 Age Labs As Method of screening for severe covid-19 susceptibility

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1297185A2 (en) * 2000-06-30 2003-04-02 Epigenomics AG Diagnosis of diseases associated with signal transduction
BR112019018272A2 (pt) * 2017-03-02 2020-07-28 Youhealth Oncotech, Limited marcadores metilação para diagnosticar hepatocelular carcinoma e câncer

Also Published As

Publication number Publication date
EP4168593A1 (en) 2023-04-26
BR112022026509A2 (pt) 2023-03-07
CA3184128A1 (en) 2021-12-30
US20240093318A1 (en) 2024-03-21
KR20230038486A (ko) 2023-03-20
AU2021297245A1 (en) 2023-02-02
MX2023000105A (es) 2023-04-25
WO2021262894A1 (en) 2021-12-30
JP2023532444A (ja) 2023-07-28

Similar Documents

Publication Publication Date Title
JP2022058359A (ja) 敗血症の診断法
US20150315643A1 (en) Blood transcriptional signatures of active pulmonary tuberculosis and sarcoidosis
US20160208331A1 (en) Diagnostic methods for infectious disease using endogenous gene expression
EP3044333A1 (en) Methods and systems for analysis of organ transplantation
WO2010060051A2 (en) Systems biology approach predicts the immunogenicity of vaccines
EP3316875A1 (en) Methods to diagnose and treat acute respiratory infections
US20240093318A1 (en) Method for diagnosing respiratory pathogens and predicting covid-19 related outcomes
US20220246242A1 (en) Methods of assessing risk of developing a severe response to coronavirus infection
EP4058606A1 (en) Identification of host rna biomarkers of infection
EP3394291B1 (en) Triage biomarkers and uses therefor
Nilson et al. Upregulation of the type I interferon pathway in feedlot cattle persistently infected with bovine viral diarrhea virus
Souquette et al. Integrated drivers of basal and acute immunity in diverse human populations
AU2016349950B2 (en) Viral biomarkers and uses therefor
US20220205042A1 (en) Molecular Signatures for Distinguishing Liver Transplant Rejections or Injuries
CN106119406B (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
EP3825418A2 (en) Molecular signatures for distinguishing liver transplant rejections or injuries
US11739369B2 (en) Immune profiling using small volume blood samples
Zhang cg05883128 (DDX60) and NR3C2 (CD4 T-cells and B-cells) to Be the Genetic Roots of Systemic Lupus Erythematosus
US11104951B2 (en) Molecular signatures for distinguishing liver transplant rejections or injuries
Cathomas et al. Two distinct immunopathological profiles in autopsy lungs of COVID-19
Deng et al. A novel Bayesian framework for harmonizing information across tissues and studies to increase cell type deconvolution accuracy
Hall The genetics of age-related macular degeneration: exploring pathway and epistatic effects
WO2023057467A1 (en) Screening method for rheumatoid arthritis
Cathomas et al. Two distinct immunopathological profiles in lungs of lethal COVID-19
de la Calle-Fabregat et al. The DNA Methylomes of Synovial and Peripheral Blood Monocytes Associate and Evolve With Prognosis and Treatment in Undifferentiated Arthritis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination