CN115176320A - 检测先天性心脏缺陷 - Google Patents

检测先天性心脏缺陷 Download PDF

Info

Publication number
CN115176320A
CN115176320A CN202080094653.4A CN202080094653A CN115176320A CN 115176320 A CN115176320 A CN 115176320A CN 202080094653 A CN202080094653 A CN 202080094653A CN 115176320 A CN115176320 A CN 115176320A
Authority
CN
China
Prior art keywords
chd
methylation
dna
sites
cytosine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080094653.4A
Other languages
English (en)
Inventor
雷·巴哈多-辛格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bioscreening and Diagnostics LLC
Original Assignee
Bioscreening and Diagnostics LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bioscreening and Diagnostics LLC filed Critical Bioscreening and Diagnostics LLC
Publication of CN115176320A publication Critical patent/CN115176320A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开描述了一种检测、诊断或预测先天性心脏缺陷(CHD)的方法。该方法主要是微创方法,因为其使用来自受试者的生物样本来检测受试者的核酸中的甲基化变化。该方法还涉及人工智能(AI)的应用。

Description

检测先天性心脏缺陷
相关申请的交叉引用
本申请要求于2019年11月27日提交的美国临时专利申请62/941,357的权益,其全部内容通过引用并入本文。
技术领域
本公开涉及使用分子标记来预测和检测患者的先天性心脏缺陷(congenitalheart defects)的方法和系统。
背景技术
已知表观遗传变化(包括DNA甲基化)与心脏胚胎发生(O′Meara&Lee2015)和先天性心脏缺陷的发展(Bahado-Singh et al.2005;Bahado-Singh et al.2016;Radhakrishnaet al.2016;Radhakrishna et al.2019)有关。除了极少的例外,心脏组织不可用于活体受试者的研究分析。对于发育中的胎儿尤其如此,并且这种现实阻碍了与先天性心脏缺陷(CHD)的发展的原因或关联的表观遗传变化的评估。因此,对开发组织(如血液白细胞)中的分子标记具有显著的兴趣,分子标记也反映表观遗传变化并且与隔离器官如发育中的心脏中的那些生物联系或相关。许多研究(Bahado-Singh et al.2005;Bahado-Singh etal.2016;Radhakrishna et al.2016;Radhakrishna et al.2019)已经表明上述目标可能是可实现的。在这些研究中已经使用通过跟部针刺(heel stick)获得的新生儿白细胞DNA的甲基化来阐明多种不同类型的常见非综合征性CHD的机制。此外,使用常规统计分析以及人工智能(AI)方法,白细胞DNA甲基化准确地预测了不同类型的非综合征性先天性心脏缺陷(CHD)(Bahado-Singh et al.2019b)。
广泛的临床和实验室出版物(Burton&Jauniaux 2018;Maslen 2018)表明胎盘及其血管分布在心脏胚胎发生和CHD发展中起关键作用。事实上,可以影响胎盘形态和血管分布的病症(例如母体高血压)已经在荟萃分析中显示出显著增加这种妊娠的后代中CHD的风险(Ramakrishnan et al.2015;van Gelder et al.2015)。胎盘是可大量用于产后分析的器官。
在DNA甲基化中,单个碳原子或所谓的“甲基”被转移至并共价结合至胞嘧啶-鸟嘌呤(‘C-G’或‘CpG’)二核苷酸的胞嘧啶核苷酸环的位置#5。该过程将胞嘧啶碱基转化为5-甲基胞嘧啶(5mC)。典型地,DNA甲基化,特别是当其发生在具有大量CpG重复的基因的启动子区域中时,导致基因转录的抑制或基因沉默。5mC可以进一步化学修饰为5-羟甲基胞嘧啶(5hmC)。已发现这种羟甲基化通过一组称为10-11易位(TET)蛋白的酶的作用而发生。这些是一组三种双加氧酶,其催化5mC转化为5hmC(Tahiliani et al.2009)。
由于5hmC由5mC的转化产生,因此5mC被认为是消除前者的机制。5hmC的积累与基因转录的调节有关。与5mC不同,5hmC与基因阻遏蛋白(例如,甲基-CpG-结合蛋白,如MBD1、MBD2和MBD4)的结合亲和力低得多(Jin SG,Kadam S,Pfeifer GP.Examination of thespecificity of DNA methylation profiling techniques towards 5-methylcytosineand 5-hydroxymethylcytosine.Nucleic Acid Res 2010;38:e125)。因此,除了测量5mC浓度之外,关于5hmC的同时信息将提供更详细的表观遗传信息和更精确的基因转录信息。发现5hmC水平在具有转录活性的基因的基因体中增强(Nester et al.2012),因此与5mC相比对基因表达具有相反的作用。
其次,5hmC的浓度似乎是组织分化的重要机制和组织类型的标记(Nester etal.2012)。胎儿游离(cfF)DNA研究的主要限制是“胎儿”(更确切地说是作为胎儿器官的胎盘DNA)被从溶血白细胞溢出的母体DNA严重污染。因此,母体循环中的cfF DNA占妊娠中游离(cf)DNA的约10-20%(Rafi et al.2017)。母体白细胞中的5hmC水平较低,测量胎儿cfDNA 5hmC水平应改善在母体循环中识别胎儿和/或胎盘cf DNA的特异性。
附图说明
图1A和1B示出了使用病例和对照之间显著差异的甲基化标记的个体β值产生的热图。层次聚类分析显示基于差异CpG甲基化的病例和对照的清晰的分离。CpG标记ID在右列中提供。
图2示出了差异甲基化的基因网络在心脏胚胎发育和先天性心脏缺陷形成中起重要作用。
发明内容
提供本发明内容是为了以简化的形式介绍一些概念,这些概念将在下面的具体说明书中进一步描述。发明内容不旨在标识所要求保护的主题的所有关键特征或必要特征,也不旨在单独使用以帮助确定所要求保护的主题的范围。
精准医学的基础是人工智能(AI)、大数据、组学技术和血液测试的发展的集成,以阐明复杂病症的发病机制并准确检测复杂病症(Mesko B,2017)。将胎儿游离DNA(cfF DNA)的表观基因组分析与AI技术组合用于询问胎儿非综合征性CHD的发病机制和检测胎儿非综合征性CHD。在这项前瞻性研究中,从母体血液中提取cfF DNA,并使用Illumina InfiniumMethylationEPIC BeadChip阵列进行全基因组DNA甲基化分析。包括深度学习(DL)(最新的AI方法)的六种不同的AI平台被用于CHD检测。基于显著差异甲基化的位点的通路分析(Ingenuity Pathway Analysis)用于研究CHD的分子基础。
总共有12例孤立的CHD和26例对照。AI准确地检测到CHD。使用RF,五种CpG标记的组合具有AUC(95%CI)=0.98(0.83-1),具有97%的灵敏度和93%的特异性;随后是SVM模型,具有AUC(95%CI)=0.97(0.87-1),具有98%的灵敏度和94%的特异性,用于CHD检测。使用CpG标记和CHD胎儿的既往病史进行交叉验证的逻辑回归的AUC(95%CI)=0.98(0.98-0.97),对CHD具有100%的灵敏度和85%的特异性。在非综合征性CHD中发现了参与心脏发育和心脏异常发展的基因和基因途径的表观遗传失调。这提供了发现不是随机发生的生物学确认或合理性。
本文所述的方法使用母体血液中cfF DNA的AI分析准确地检测胎儿CHD。申请人的数据进一步证明了表观遗传功能障碍在CHD非综合征发展中的作用。申请人的发现代表了胎儿心血管精准医学发展的进一步进展。
具体实施方式
在美国,出生缺陷(即,在胎儿生命中发展并在出生时存在的异常)是婴儿死亡的主要原因,其被定义为出生后一年内死亡。每1000个活产儿中发生CHD的频率为8-9例。CHD是最常见的严重出生缺陷组,并且在住院治疗方面是最昂贵的。高达25%的新生儿重症CHD病例在出院前未能被诊断出。
胚胎和胎儿生命中的心脏发育需要大量不同基因的协调和编排。已知相对小百分比的CHD病例与基因突变有关,基因突变是指基本结构单元(“核苷酸”)排列在基因的DNA中的正常序列的变化。此类突变导致对正常心脏发育很重要的基因的功能障碍或无功能(即,异常类型蛋白质的量改变或产生)。
在过去的六十年中,已经发现并广泛研究了被称为“表观遗传学”的控制基因功能的重要机制。术语“表观遗传学”可用于描述基因与环境之间的相互作用。这些相互作用不会导致基因组序列本身的变化(没有核苷酸序列变化),但会改变基因表达,这仍然是表型表达变化的原因。表观遗传学被定义为细胞基因表达的可遗传(即,传递给后代)变化,这些变化主要不是由于基因中核苷酸(腺嘌呤、硫胺素、鸟嘌呤和胞嘧啶)序列的突变或变化。表观遗传学是通过几种潜在机制对基因表达的可逆调节。研究最广泛的一种机制是DNA甲基化。其他机制包括DNA三维结构的变化、组蛋白修饰和微RNA抑制活性。已知表观遗传机制是广泛相互关联的。
胞嘧啶是指构建DNA的一组四个结构单元“核苷酸”中的一个。胞嘧啶的化学结构是嘧啶环的形式。除了胞嘧啶之外,DNA中发现的其他核苷酸或结构单元是硫胺素、腺嘌呤和鸟苷。
术语甲基化是指将“甲基”或单个碳原子酶促加成到胞嘧啶的嘧啶环的#5位,其导致胞嘧啶转化为5-甲基-胞嘧啶。如上所述的胞嘧啶甲基化是通过被称为DNA甲基转移酶(DNMT)的酶家族的作用而完成的。5-甲基-胞嘧啶在形成后易于突变或原始胞嘧啶化学转化以形成胸腺嘧啶。5-甲基-胞嘧啶占正常基因组中全部核苷酸碱基的约1%。
术语高甲基化是指当将来自目标个体或组的样本与正常或对照组进行比较时,特定胞嘧啶位点处的甲基化频率或百分比增加。
胞嘧啶通常与鸟苷(沿着单个DNA链的线性序列中的另一种核苷酸)配对以形成CpG对。“CpG”是指胞嘧啶-磷酸-鸟苷化学键,其中磷酸将两个核苷酸结合在一起。在哺乳动物中,在这些CpG对中大约70%至80%的胞嘧啶被甲基化(ChatterjeeR,VinsonC.Biochemica et Biophisica Acta2012;1819:763-70)。术语“CpG岛”是指基因组中具有高浓度的CG二核苷酸对或CpG位点的区域。靠近哺乳动物DNA中的基因经常发现“CpG岛”。CpG岛占据的DNA长度通常为300-3000个碱基对。CG簇位于同一条DNA单链上。CpG岛由各种标准定义,包括:i)占据至少200bp DNA的重复CG二核苷酸对的长度;和ii)片段的CG含量为至少50%,以及观察到的/预期的CpG比率应大于60%。在人类中,约70%的基因启动子区域具有高CG含量。CG二核苷酸对可能存在于基因中的其他地方或基因外,并且不知道与特定基因相关。
哺乳动物基因的大约40%的启动子区域(控制其转录或激活的基因区域)具有相关的CpG岛,并且这些启动子区域的四分之三具有高CpG浓度。总体而言,在分散在整个DNA中的大多数CpG位点中,胞嘧啶核苷酸被甲基化。相反,在位于基因启动子区域的CpG岛中的CpG位点中,胞嘧啶是未甲基化的,表明CpG岛中胞嘧啶的甲基化状态在基因转录活性中的作用。
与基因相关或位于基因中的胞嘧啶的甲基化通常与基因转录的抑制相关。然而,在某些基因中,增加的甲基化具有相反的作用并导致基因的激活或转录增加。解释后一种现象的一种潜在机制是胞嘧啶的甲基化可能潜在地抑制基因抑制元件的结合,从而从抑制中释放基因。表观遗传修饰(包括DNA甲基化)是含有相同DNA和基因的细胞经历不同基因的活化并导致分化成独特组织(例如心脏或肠)的机制。
本公开描述了使用表观基因组学和人工智能分析技术基于检测受试者核酸的胞嘧啶甲基化来准确诊断或预测CHD(包括产前和/或儿科受试者的CHD)的用途。根据制造商的说明书,使用具有超过850k甲基化标记的Illumina Infinium阵列进行甲基化分析。在12个CHD病例中检查整个基因组中CpG位点的甲基化水平,并与26个未受影响的健康匹配对照进行比较。使用Ingenuity通路分析进行通路分析以阐明病症的机制。此外,确定了用于检测CHD的表观基因组标记的诊断准确性。计算受试者作业特征(receiver operatingcharacteristics)曲线下面积(AUC)以及95%CL和FDRp值,以检测CHD。
几种不同的人工智能(AI)技术(包括最新形式AI的深度学习(DL))用于使用i)表观遗传(即,DNA甲基化标记)以及ii)临床和人口统计标记来预测CHD。
在实施方案中,本公开描述了一种用于基于对核酸样本中各种已识别的位点中胞嘧啶核苷酸的甲基化频率或甲基化百分比来诊断CHD的方法。在实施方案中,核酸样本可以从有需要的患者的生物样本获得。该方法包括:从患者获得生物样本;从所述样本中提取核酸;测定所述样本以确定整个基因组的位点处胞嘧啶的甲基化百分比;将所述患者的胞嘧啶甲基化水平与对照进行比较;以及基于整个基因组中不同位点处的胞嘧啶甲基化水平计算个体被诊断患有CHD的风险。对照可以是一个或多个表征或已知的病例和/或一个或多个表征或已知的组。
本文所述的方法包括从受试者的生物样本获得核酸。受试者是需要(或有需要)诊断或正在经历CHD症状的个体或患者。受试者也可以进行常规筛查。受试者的实例包括例如来自成人、儿科患者、胚胎或胎儿。“胚胎”是指从受精到妊娠第八周结束的患者。“胎儿”是指妊娠第八周后的患者。
在实施方案中,患者可以是成人,并且对照可以是充分表征的正常(健康)人群组和/或充分表征的CHD患者群体。
在实施方案中,患者可以是儿科患者。儿科患者可以小于约19岁、约15至19岁、小于约15岁、约10至15岁、小于10岁(儿童期)、约5至10岁、小于约4岁、约1至4岁、小于一岁(婴儿)或出生后28天或更短时间(新生儿或新生儿期)。患者可以是子宫内的患者,例如胚胎或胎儿。当患者是胚胎或胎儿时,DNA可以从携带胚胎或胎儿的母亲、孕妇的生物样本中获得。生物样本可以从妊娠早期、妊娠中期或妊娠晚期的孕妇获得。
儿科患者的对照可以是充分表征的小于约19岁的正常(健康)儿童组和/或充分表征的CHD儿科患者群体。同样,子宫内的患者的对照可以是充分表征的正常(健康)子宫内患者组和/或充分表征的CHD子宫内患者群体。
正常人群(包括成人、儿童和子宫内患者)或CHD患者的充分表征的组可以包括一个或多个正常人群或CHD患者,或者可以包括正常人群或CHD患者的群体。
生物样本可以是体液,例如血液、血浆、血清、尿液、唾液、痰液、汗液、呼吸冷凝物、泪液、包括宫颈分泌物的生殖器分泌物、羊水和出生时获得的脐带血。生物样本可以是用于游离核酸或脱落的滋养层细胞的宫颈拭子、皮肤、毛发、毛囊/根、和粘膜(脸颊(又名颊)刮屑或舌头刮屑)。生物样本还可以包括患者的任何体内组织,例如从患者获得的任何组织样本,包括来自新生儿期或胎儿生命期间的胎盘组织。来自胚胎或胎儿的胎盘组织可以通过胎盘活检或绒毛膜绒毛取样(CVS)获得。在实施方案中,生物样本还可包括来自CVS的样本。在实施方案中,来自母亲的生物样本可包括母体血液、胎盘、羊水、妊娠期间的其他体液或其他母体体液。
来自含有DNA的任何生物样本的细胞和核酸可用于本文所述的用于诊断和预测CHD的方法中。用于测试的样本可以从活的或死的组织以及含有细胞或组织的考古样本获得。
本文所述方法中使用的核酸可以从细胞获得。在实施方案中,核酸包括直接从胎儿或胚胎获得的胎儿核酸(例如通过羊膜穿刺术从胎盘或羊水获得),或从母体体液或胎盘组织、从母体循环收获的循环胎儿细胞、脱落胎盘细胞获得的胎儿核酸,或母体循环中的cfF DNA。在实施方案中,核酸是从胎儿生命期间或出生时获得的羊水、胎儿血或脐带血中获得的。在实施方案中,核酸是DNA或RNA。
由于所有细胞(除了少数例外,即,成熟红细胞和成熟血小板)含有细胞核并因此含有DNA,因此本文所述的方法可用于使用来自除上述两种细胞之外的任何细胞的DNA来筛选CHD。因此,包括含有核酸(例如DNA)的细胞的任何生物或组织样本可用于本文所述的方法中。此外,从已经被破坏并可从体液中回收的细胞中释放的游离DNA可以用于这种筛选。
游离DNA(cf DNA):核酸可以是以cf DNA形式存在的DNA。游离DNA是指由于自然细胞死亡/更新或由于疾病过程而从细胞释放的DNA。cf DNA被释放到循环中并快速分解成DNA片段,并且最终可以最终进入其他体液,例如尿液。用于从血液和其他体液中收获cfDNA的技术是本领域熟知的(Li Y et al.Size separation of circulatory DNA inmaternal plasma permits ready detection of fetal DNA polymorphisms.ClinChem2004;50∶1002-1011;Zimmerman B et al.Noninvasive prenatal aneuploidytesting of chromosomes 13,18,21,X,and Y,using targeted sequencing ofpolymorphic loci.Prenat Diagn 2012;32:1233-41)。
使用的游离DNA分离技术包被并稳定母体白细胞,防止从另外的母体来源的白细胞DNA分解、释放和污染。为了进一步增强和靶向胎盘/胎儿cf DNA而不是源自其他母体组织的cf DNA的分析,可以进行能够识别cf DNA的组织来源的靶向技术。一个实例包括Lehmann-Werman R et al.的研究(Lehmann-Werman et al.2016)。使用现有的甲基化组数据库识别cf DNA的组织特异性甲基化模式。从血液供体获得游离DNA,并基于甲基化将其与甲基化组数据库进行比较,因此其能够确定cf DNA片段的循环来源组织,例如来自脑的胰腺β细胞和少突胶质细胞。
5hmC水平是组织特异性的,并且超出了其报道的与基因表达水平的相关性。除了由cf DNA中的5hmC水平提供的基因表达信息之外,cf DNA的组织来源的其他信息开辟了基于血液测试从不同器官获得DNA和表观遗传数据的能力。研究(Nester et al.2012)表明5hmC的水平在组织之间显著变化。5hmC的水平在血细胞的DNA中非常低,而在胎盘组织中相对高,并且在脑中甚至更高。因此,测量CF胎儿DNA(胎盘来源)中的5hmC将极大地解决母体白细胞cfF DNA污染的问题,当在cfF DNA中仅测量5mC水平时,这可能是一个问题。这是因为白细胞中5hmC的水平与源自胎盘的cfF DNA(该CHD提议中的目标对象)相比如此低。因此,总体而言,可以进行胎盘组织的cf DNA靶向表观基因组分析的5mC和5hmC测量的使用,以用于检测并提供关于CHD和其中胎盘受影响的其他妊娠病症的进一步增强的机制信息。
甲基化测定:几种定量甲基化测定是可用的。这些方法包括使用甲基化敏感的限制性内切核酸酶的COBRATM、凝胶电泳和基于标记的杂交探针的检测。另一种可用的技术是用于扩增目标DNA区段的甲基化特异性PCR(MSP)。这在胞嘧啶的‘重亚硫酸钠’转化之后使用甲基化敏感探针进行。MethyLightTM(基于定量甲基化测定)使用基于荧光的PCR。使用的另一种方法是定量甲基化(QMTM)测定,其将PCR扩增与设计用于结合推定甲基化位点的荧光探针组合。Ms-SNuPETM是一种用于确定CpG位点中甲基化水平差异的定量技术。与其他技术一样,首先进行重亚硫酸盐处理,导致未甲基化的胞嘧啶转化为尿嘧啶,而甲基胞嘧啶不受影响。对重亚硫酸盐转化的DNA具有特异性的PCR引物用于扩增目标靶序列。扩增的PCR产物被分离并用于定量目标CpG位点的甲基化状态。测量胞嘧啶甲基化的优选方法是Illumina方法。
Illumina方法:对于DNA甲基化测定,Illumina
Figure BDA0003764278260000081
Human Methylation450Beadchip或Illumina Infinium MethylationEPIC BeadChip测定可用于定量甲基化谱分析。简言之,获得核酸,例如基因组DNA。使用行业中广泛已知的技术,使用商业试剂盒分离核酸。使用蛋白酶K从核酸中除去蛋白质和其他污染物。使用可用的方法(例如,有机提取、盐析或将DNA结合到固相支持物上)从溶液中除去核酸。
甲基化分析-Illumina的Infinium Human Methylation 450 Bead Chip系统或Illumina Infinium MethylationEpic BeadChip阵列可用于全基因组甲基化分析。使用Infinium测定的标准方案,用EZDNA Methylation Gold试剂盒或EZ-96Methylation试剂盒(Zymo Research)对核酸(例如DNA)(500ng)进行重亚硫酸盐转化,以将未甲基化的胞嘧啶脱氨基为尿嘧啶。DNA被酶促片段化并与Illumina BeadChip杂交。BeadChip含有位点特异性寡聚体并且是成对的,其中一个特异于甲基化胞嘧啶位点,另一个特异于未甲基化的位点。进行单碱基延伸,以掺入生物素标记的ddNTP。在荧光染色和洗涤后,扫描BeadChip,并使用BeadStudio软件(Illumina)确定每个位点的甲基化状态。使用具有样本依赖性和样本非依赖性对照靶去除、染色、杂交、延伸、重亚硫酸盐转化、特异性、阴性对照和非多态性对照的对照仪表板评估实验质量。甲基化状态是甲基化探针信号相对于甲基化和未甲基化探针的总和的比率。所得比率指示位点是未甲基化的(0)还是完全甲基化的。使用IlluminaCustom Model确定差异甲基化位点,并使用0.05作为截止值根据p值过滤。
重亚硫酸盐转化:如在
Figure BDA0003764278260000082
测定甲基化方案指南中所述,用重亚硫酸钠处理核酸,所述重亚硫酸钠将未甲基化的胞嘧啶转化为尿嘧啶,而甲基化的胞嘧啶保持不变。然后使重亚硫酸盐转化的核酸变性并中和。然后扩增变性的核酸。基于重亚硫酸盐的分析(目前用于区分甲基化与未甲基化胞嘧啶的技术)不能区分5mC与5hmC。新技术包括,但不限于:薄层色谱测定(Kriaucionis et al.2009)、5hmC的化学标记(Song et al.2011)、免疫沉淀(Nester et al.,2012)以及最近市售的5hmC全外显子组和甚至全基因组测序技术可用于提供关于cfF DNA中表观遗传变化的详细信息。
在实施方案中,使用用Illumina Infinium测定进行全基因组(使用基因组DNA)甲基化研究,当与正常组相比时,在CHD组证实了与特定基因相关的特定胞嘧啶核苷酸的甲基化频率(水平或百分比)的显著差异。胞嘧啶甲基化水平的差异是高度显著的,并且足以准确地区分CHD和正常组。因此,本文所述的方法可用作在患有CHD和正常病例的混合群体中筛选CHD病例的测试。
全基因组应用过程使DNA的量增加高达数千倍。下一步使用酶促手段将DNA片段化。然后使用异丙醇沉淀片段化的DNA并通过离心分离。然后将分离的DNA悬浮在杂交缓冲液中。然后将片段化的DNA与磁珠杂交,所述磁珠已共价限于对基因组中目标胞嘧啶核苷酸特异性的位点处的50聚体核苷酸区段。总共有超过500000种磁珠类型专门设计用于退火至特定胞嘧啶所在的位点。磁珠与硅基阵列结合。为每个位点设计两种磁珠类型,一种磁珠类型代表被设计为与胞嘧啶核苷酸将保持不变的甲基化位点匹配的探针。另一种磁珠类型对应于最初未甲基化的胞嘧啶,其在重亚硫酸盐处理后转化为硫胺素核苷酸。洗去未杂交(未退火至磁珠)的DNA,仅留下与适当磁珠结合并含有目标胞嘧啶的DNA区段。在与相应的患者DNA序列退火后,磁珠结合的寡聚体然后使用患者DNA序列中目标胞嘧啶之外的“突出端”作为延伸模板,用荧光标记的核苷酸进行单碱基延伸。
如果目标胞嘧啶是未甲基化的,则其将与未甲基化或“U”磁珠探针完全匹配。这使得能够用荧光标记的核苷酸探针进行单碱基延伸,并产生可以以自动方式读取的该磁珠探针的荧光信号。如果胞嘧啶被甲基化,则将与“U”磁珠探针寡聚体发生单碱基错配。然而,珠寡聚体上没有发生进一步的核苷酸延伸,从而防止荧光标记的核苷酸掺入珠上。这将导致来自“U”磁珠的低荧光信号。相反的情况将发生在“M”或甲基化磁珠探针上。
激光用于刺激与用于序列延伸的单个碱基结合的荧光团。通过与未甲基化磁珠相比来自甲基化磁珠的荧光强度来确定每个胞嘧啶位点的甲基化水平。胞嘧啶甲基化水平表示为“β”,其是甲基化磁珠探针信号与该胞嘧啶位点处的总信号强度的比率。用于确定胞嘧啶甲基化的这些技术先前已有描述,并且可广泛用于商业用途。
本公开描述了使用可商购的甲基化技术在整个基因组中覆盖高达99%的参考序列基因,涉及约16000个基因和450000个胞嘧啶核苷酸,低至单核苷酸水平(InfiniumHuman Methylation 450 Beach Chip试剂盒或Infinium MethylationEpic BeadChip)。与对照相比,一组CHD病例中单个核苷酸处胞嘧啶甲基化的频率用于估计被诊断患有CHD的风险或概率。使用该技术分析的胞嘧啶核苷酸包括CpG岛内的胞嘧啶和CpG岛外更远距离处的胞嘧啶,即,位于“CpG岛岸”和“CpG架”中,甚至更远离岛的所谓的“CpG海”。
如本文所述评估的胞嘧啶包括,但不限于:位于基因的启动子区域中的CpG岛中的胞嘧啶。靶向和测量的其他区域包括所谓的CpG岛“岸(shore)”,其位于距离CpG岛最多2000个碱基对的位置,和“架(shelve)”,其是岛岸两侧的DNA区域的名称。对离CpG岛更远的区域(所谓的“海(sea)”)的胞嘧啶甲基化差异进行分析。位于已知基因之外的基因外胞嘧啶位点(然而,其可能潜在地维持未指定基因的远程控制)也以所示的中等、良好和优异的准确度检测CHD。
特异性胞嘧啶核苷酸的识别:分布在整个基因组中的特定胞嘧啶位点的可靠识别已经在以下文献中详细描述(Illumnia):“CpG Loci Identification.A guide toIllumina′s method for unambiguous CpG loci identification and tracking forthe
Figure BDA0003764278260000101
and lnfiniumTM assays for Methylation”。简要概述如下。Illumina已经开发了一种独特的CpG位点标识符,其基于胞嘧啶所在的核苷酸的实际情况或前后序列来指定胞嘧啶位点。其使用与NCBI的Re SNP IPS(rs#)所使用的类似的策略,并且基于目标胞嘧啶两侧的序列。因此,将唯一的CpG位点簇ID号分配给每个接受评估的胞嘧啶。据报道,该系统是一致的,并且不会受到公共数据库和基因组组装的变化的影响。CG位点两侧60个碱基5′和3′的侧翼序列(即,总共122个碱基序列)用于识别位点。因此,将唯一的“CpG簇编号”或CG#分配给含有目标CpG的122bp的序列。cg#基于人类基因组的Build 37(NCBI37)。因此,只有当CpG簇中的122bp相同时,才存在位点被分配相同编号并位于基因组中多于一个位置的风险。基于这个唯一ID系统,利用三个单独的标准来追踪单个CpG位点。染色体数目、基因组坐标和基因组构建。CpG中两个坐标“C”或“G”中的较小者用于唯一的CG位点识别。CG位点也相对于含有‘A’(腺嘌呤)至‘T’(硫胺素)的第一个‘明确的’核苷酸对来指定。如果这些核苷酸之一是CG的5’,则该排列被指定为TOP,如果这样的核苷酸是3’,则其被指定为BOT。
此外,正向或反向DNA链被指示为被评估的胞嘧啶的位置。假设特定染色体区域内胞嘧啶碱基的甲基化状态是同步的。
胞嘧啶甲基化用于使用ROC曲线诊断CHD:为了确定用于CHD预测的特定胞嘧啶位点的甲基化水平的准确性,使用该位点处的甲基化的不同阈值水平(例如10%、≥20%、≥30%、≥40%等)来计算CHD诊断的灵敏度和特异性。因此,例如在特定cg位点处使用≥10%的甲基化,甲基化水平高于该阈值的病例将被认为具有阳性测试,并且低于该阈值的病例被解释为阴性甲基化测试。在该实施例中具有阳性测试(即,在该特定胞嘧啶位点处10%的甲基化)的CHD病例的百分比将等于测试的灵敏度。在该位点处胞嘧啶甲基化水平<10%的正常(非CHD)病例的百分比将被认为是测试的特异性。假阳性率在此被定义为具有(错误)异常测试结果的正常病例数,并且灵敏度被定义为具有(正确)异常测试结果的CHD病例数,例如在该特定cg位置处的甲基化水平为10%。评估一系列阈值甲基化值,例如≥1/10、≥1/20、≥1/30等,并用于为每个位点产生一系列配对的灵敏度和假阳性值。受试者操作特性(ROC)曲线,该曲线是数据点的制图,其中,Y轴为灵敏度值,X轴为假阳性率。该方法可用于为每个单独胞嘧啶位点生成ROC曲线,显示病例和CHD组之间的显著甲基化差异。在这种情况下,使用计算机程序ROCR package-版本3.4(https://CRAN.R-project.crg/package=ROCR)来产生ROC曲线下而积。
ROC曲线是绘制灵敏度(在该设置中定义为在Y轴上的特定胞嘧啶位点处具有阳性测试或异常胞嘧啶甲基化水平的CHD病例的百分比)和假阳性率(1-特异性,或者当后者表示为百分比时为100%-特异性)(即,在X轴上在相同位点处具有异常胞嘧啶甲基化的正常(非CHD)病例数)的图。特异性定义为在目标位点处具有正常甲基化水平或阴性测试的正常(非CHD)病例的百分比。假阳性率是指被错误地发现具有阳性测试(即,异常甲基化水平)的正常个体的百分比;其可以计算为100-特异性(%),或表示为十进制格式[1-特异性(表示为小数点)]。
ROC曲线下面积(AUC)表示测试在从异常病例中识别正常的准确性。AUC是从X轴和Y轴的交点到对角线(倾斜角为45°)的ROC图下的面积。ROC曲线下面积越大,预测目标状况的测试准确度越高。ROC=1.0下的面积表示完美测试,其在具有病症的所有情况下为阳性(异常),并且在所有正常情况下(没有病症)为阴性。甲基化测定是指用于确定基因组中特定胞嘧啶处的甲基化水平的测定,其中大量是可商购的。在该特定情况下,该方法可用于区分与未受影响的对照相比受影响的病例(CHD)中的甲基化水平。
逻辑回归分析可用于计算基于胞嘧啶位点的甲基化预测CHD的灵敏度和特异性。
可以进行标准统计测试,其使用p值来表示在CHD和对照DNA样本之间的给定位点处胞嘧啶甲基化之间可以观察到差异的概率。还进行了使用用于多重比较的错误发现率(FDR)的统计学显著性的更严格测试。当使用多重比较进行多重假设检验时,FDR给出了阳性结果是偶然的概率。
统计分析:本公开描述了用于预测、诊断、检测受试者的CHD和/或计算受试者被诊断患有CHD或甚至特定类型的CHD的风险的方法。该计算可以基于逻辑回归分析,导致在已知与CHD或被诊断患有CHD的增加的风险相关的许多可能的预测因子(例如甲基化位点)中识别显著的独立预测因子。不同位点处的胞嘧啶甲基化水平可以单独使用或与其他已知的CHD风险预测因子组合使用,例如产前暴露于毒素-“是”或“否”(例如酒精或母体吸烟、母体糖尿病、家族史与单个或多个位点中的甲基化水平组合),其已知与如本申请中所述的CHD风险增加相关。例如,个体受影响的概率可以从基于逻辑回归的概率方程导出:
PCHD=1/1+e-(B1x1+B2x2+B3x3...Bnxn)
其中,‘x’是指特定预测因子的量级或数量(例如,特定位点处的甲基化水平),并且“β”或β-系数是指对于特定预测因子(x)的水平的每个单位变化的结果(例如,CHD)概率变化的幅度,β值源自逻辑回归分析的结果。这些β值将从大量受影响和未受影响个体中的多变量逻辑回归分析得出。在这种情况下表示不同胞嘧啶位点处的甲基化百分比的x1、x2、x3等的值将源自被测试的个体,而β值将源自上述受影响(CHD)和未受影响病例的大参考群体的逻辑回归分析。基于这些值,可以定量估计个体患有某种类型CHD的概率。概率阈值用于定义处于高风险的个体(例如,≥1/100CHD的概率可用于定义触发进一步评估的高风险个体,诸如以下中的一项或多项:超声心动图、出生时的脉搏血氧测量等),而风险<1/100的个体将不需要进一步的随访。除了其他因素之外,所使用的阈值将基于诊断灵敏度(正确识别的CHD病例的数量)、特异性(被正确地识别为正常的非CHD病例的数量)、超声心动图的风险和成本以及根据将个体指定为CHD的“高风险”和此类因素的相关干预。逻辑回归分析作为疾病筛查中用于估计个体患有病症的风险的方法是众所周知的。(Royston P,Thompson SG.Model-based screening by risk with application in Down′ssyndrome.Stat Med 1992;11:257-68.)
CHD的个体风险也可以通过使用单独区分胞嘧啶位点的个体处的甲基化百分比(报告为β系数)或基于重叠高斯分布或多变量高斯分布的方法使用位点的不同组合来计算(Wald NJ,Cuckle HS,Deusem JW et al(1988)Maternal serum screening for downsyndrome in early pregnancy.BMJ297,883-887.),其中,变量将是所谓的特定(或多个)位点处的甲基化水平/甲基化百分比。替代地,如果甲基化百分比或β系数不是正态分布的(即,非高斯分布),如果需要,将通过这些百分比的对数变换来实现正态高斯分布。
作为实例,针对CHD组和正常群体中的特定位点处的甲基化导出两条高斯分布曲线。然后计算两条曲线之间的平均值、标准偏差和重叠程度。在给定甲基化水平下的分布曲线的高度的比率将给出在给定位点处的特定甲基化水平下增加(或降低)患有CHD的风险的似然比或因子。似然比(LR)值可以乘以普通人群中CHD的背景风险,从而基于所选择的CG位点处的甲基化水平给出个体的CHD风险。关于新生儿群体中CHD的背景群体风险的信息可从若干来源获得(一个这样的实例是Hoffman JL et al Am Heart J 2004;147:425-439)。类似的信息可用于产前和后期产后生活。
人工智能(AI):一种或多种AI算法可以与本文所述的方法组合使用,以提高预测和/或诊断CHD的准确性。AI算法的代表性实例包括随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、微阵列分析预测(PAM)、广义线性模型(GLM)和深度学习(DL)。
随机森林(RF)是一种用于回归、分类和其他任务的监督分类算法。在训练阶段随机生成多个决策树预测模型,并且生成类别的模式和各个树的平均预测作为输出。森林中的树的数量与其可以获得的结果之间存在直接关系:树的数量越大,结果越准确。随机森林算法和决策树算法之间的区别在于,在随机森林中,找到根节点和分割特征节点的过程是随机运行的。决策树是一种决策支持工具,其使用树状图来显示可能的后果。如果将具有目标和特征的训练数据集输入到决策树中,则其将制定一组规则。过度拟合是可能使决策树中的结果变差的一个关键问题,但是对于随机森林算法,如果森林中存在足够多的树,则分类器不会过度拟合模型。另一个优点是随机森林的分类器可以处理缺失值,并且最后一个优点是随机森林分类器可以针对类别值进行建模。
支持向量机(SVM)主要是一种分类器方法,其通过在分离不同类别标签的情况的多维空间中构建超平面来执行分类任务。SVM支持回归和分类任务,并且可以处理多个连续和分类变量。假设一些给定数据点各自属于两个类别之一,并且目标是决定一个新数据点将属于哪个类别。在支持向量机的情况下,数据点被视为p维向量(p个数字的列表),并且我们想知道我们是否可以用(p-1)维超平面分隔这些点。这被称为线性分类器。存在许多可能对数据进行分类的超平面。作为最佳超平面的一个合理选择是表示两个类之间的最大间隔或余量的超平面。我们选择超平面,使得从其到每一侧上的最近数据点的距离最大化。如果存在这样的超平面,则将其称为最大裕度超平面,并且将其定义的线性分类器称为最大裕度分类器;或等效地,最优稳定性的感知器。
线性判别分析(LDA)是最初由R.A.Fisher在1936年开发的分类方法。它是简单的、数学上稳健的,并且通常产生精度与更复杂的方法一样好的模型。LDA基于搜索最佳地分离两个类别(目标)的变量(预测因子)的线性组合的概念。其与方差分析(ANOVA)和回归分析密切相关,其也试图将一个因变量表示为其他特征或测量的线性组合。
微阵列预测分析(PAM)是一种使用最近的收缩质心从基因表达数据进行类别预测的统计技术。该方法识别了最佳表征每个类别的基因子集。
广义线性模型(GLM)是一大类模型,包括例如线性回归、ANOVA、泊松回归、对数线性模型,但是GLM存在一些限制,例如线性函数,例如在系统组件中只能具有线性预测器,并且响应必须是独立的。
通常,经典机器学习技术直接根据用户预先指定的一组特征进行预测。然而,表示学习技术在将特征映射到最终预测之前将特征变换为一些中间表示。深度学习(DL)是一种表示学习形式,其使用多个转换步骤来创建非常复杂的特征。DL广泛应用于模式识别、图像处理、计算机视觉以及最近还被应用于生物信息学。DL被分类为前馈人工神经网络(ANN),其使用经由权重(W)矩阵连接输入层(X)和输出层(Z)的多于一个隐藏层(Y)。预期最小化输入层(x)和输出层(z)之间的差异的权重矩阵W被认为是最佳的,并且由系统选择以获得最佳结果。
CHD的类型和CHD的预防和治疗:本文所述的方法可用于诊断、检测或预测受试者中的一种或多种心脏缺陷。存在多种类型的心脏缺陷,其通常按照受影响的心脏部分进行分组。缺陷可以是心脏瓣膜、隔膜、心脏的内部瓣膜或心室的缺陷。瓣膜缺陷包括例如主动脉瓣和肺动脉瓣的缺陷。隔膜中的缺陷包括分隔心脏的右手腔室和左手腔室的壁的问题。当隔膜在心脏发育期间不能完全闭合时,小孔导致壁将右侧腔室和左侧腔室分开。一些缺陷是由于分离心脏的顶部腔室和底部腔室的瓣膜未能正确形成。一些类型的心脏缺陷包括不同缺陷的组合,或者在心脏发育时必须与心脏循环的方式有关。
一些CHD的实例包括主动脉瓣狭窄(AVS)、左心发育不良综合征(HLHS)、室间隔缺损(VSD)(包括VSD伴房间隔缺损)、法洛四联症(TOF)、主动脉缩窄(Coarct)、房间隔缺损(ASD)、肺动脉狭窄(PS)(包括肺动脉瓣狭窄和肺动脉瓣狭窄)、肺动脉狭窄包括具有肺动脉瓣狭窄的那些)、动脉干、双主动脉弓和双尖A-V瓣膜(包括具有扩张的主肺动脉的那些)。诊断患有这些类型的CHD中的一种或多种的患者需要手术以防止严重并发症或死亡。
本文描述的方法提供了一个或多个心脏缺陷的准确和早期检测和预测。CHD的早期产前诊断允许在出生时进行早期评估和最佳治疗,并且与出生后较晚进行诊断的病例相比,降低了死亡率(Holland BJ et al.Ultrasound Ostet.Genecology 2015:45:631-638)和发病率。此外,与危重CHD病例中的晚期诊断相比,CHD的早期出生后诊断与改善的存活率相关(Eckersley L,Sadler L etl.Arch Dis Child 2015:0:1-5)。因此,本文所述的方法促进准确的产前诊断,这有助于早期评估,例如在新生儿期间,治疗和改善CHD病例的存活率。
本文所述的胞嘧啶甲基化是指将甲基或单个碳原子化学添加至胞嘧啶核苷酸。用于胞嘧啶甲基化的碳原子的重要膳食来源是叶酸。鉴于申请人的发现证明胞嘧啶甲基化在CHD发病机制中的重要性,可以合理地预期膳食叶酸补充将降低CHD的风险。目前,谷物和面包中的叶酸强化以及包括孕妇在内的整个人群的直接补充消费一直是预防神经管缺陷的标准护理。这提供了一个“自然”实验,通过该实验来判断叶酸补充对预防CHD的价值。在中国(Mao B.et al.2017)、美国(Botto et al.2003)、欧洲(Czeizel et al.1998)和加拿大(Ionescu-Ittu et al.2009)的研究表明叶酸补充在减少CHD中的有益效果。应当注意,相当大比例的孕妇可能对叶酸补充没有充分反应。这是因为一些群体中相当大比例的女性在亚甲基四氢叶酸还原酶(MTHFR)基因中发生突变,该基因编码负责叶酸代谢的类似命名的酶,其最终结果是产生参与胞嘧啶甲基化的甲基碳。因此,MTHFR的结果是削弱胞嘧啶甲基化。在一些群体中,该突变的频率可以高达20%。此外,当存在突变时,酶活性降低多达30%(Botto et al.,2000年)。因此,预期MTHFR突变将减弱叶酸补充在此类群体中的有效性。
幸运的是,存在不受MTHFR基因突变影响的甲基的替代来源。这些包括胆碱和甜菜碱,并且存在于膳食来源如花椰菜、菠菜、甜菜、肝脏和其他食物中。基于申请人对DNA甲基化在CHD中的重要性的发现,可以评估胆碱和甜菜碱的群体强化和个体补充方案。此外,目前的证据表明,包括孕妇在内的美国人口中不到十分之一具有足够的胆碱消耗(Zeisel etal.,2009)。妊娠缺乏的风险由于这是胆碱需求增加的时期的事实而放大。
实验室证据表明甜菜碱(胞嘧啶甲基化的单碳的替代来源)对于预防CHD的重要性(Karunamuni et al.2017)。产前酒精暴露是CHD的重要风险因素。据估计,美国10%的孕妇饮酒,3%的孕妇具有高水平的酒精消耗(Tan et al.,2015),出生前酒精摄入已显示干扰小鼠中的单碳代谢和DNA甲基化(Liu et al.,2009)。在Karunamuni et al.的研究中(Karunamuni et al.,2017),在暴露于酒精的妊娠小鼠中补充甜菜碱降低了CHD的频率,对由酒精暴露引起的心脏和大血管的结构变化具有有益作用。重要的是,酒精导致患有CHD的幼崽的心脏神经嵴细胞中5mC核苷酸水平降低。心脏神经嵴细胞是一组专门的细胞,其对于重要心脏结构如室间隔、主动脉、肺动脉和其他血管的发育是胚胎学上关键的。这些心脏神经嵴细胞的5mC水平通过向暴露于产前酒精的妊娠小鼠补充甜菜碱恢复正常。前述信息证实了甲基化变化在心脏发育中的重要性。然而,其没有提供关于cf DNA中甲基化水平用于CHD检测的任何信息。本文所述的方法是评估CHD机制的微创血液测试。该测试可以在接近妊娠早期心脏的早期发育时进行。已知胎儿游离DNA从妊娠早期排出到母体循环中。了解发育中胎儿的甲基化状态可以潜在地用作在个体患者中补充叶酸、胆碱或甜菜碱的基础,以帮助预防或减轻CHD的发展或严重程度。
从群体角度来看,由申请人的发现(即,使用来自发育中的胎儿的cfF DNA显示CHD病例中重要心脏基因中胞嘧啶甲基化的深刻变化的证据)产生的认知可以形成群体补充胆碱和甜菜碱的政策的基础。这对于具有高MTHFR突变率的群体尤其重要,所述高MTHFR突变率使得叶酸补充不太有效。因此,申请人的发现可以用作重要的预防性甚至治疗性干预的基础。
一旦患者被诊断患有CHD,就可以使用药物来保持心跳规律。CHD患者的立即治疗包括向患者提供足够的氧气水平,直到可以进行心脏修复。可以对患者进行手术,例如心内直视手术,以修复心脏的任何缺陷。取决于CHD的其他治疗方法包括抗生素、心导管插入术、心内直视手术和心脏移植。CHD的药物可包括血管紧张素转化酶(ACE)抑制剂、血管紧张素II受体阻断剂(ARB)、β阻断剂、利尿剂、抗高血压剂等。
在实施方案中,本文所述的方法能够预防未来妊娠中CHD的发展。作为实例,孕妇可以补充叶酸或叶酸盐。
基因和基因组位点(CHD标记)的表格:本公开报道了使用严格的假发现率()FDR分析在整个基因组中大量胞嘧啶位点处的胞嘧啶甲基化状态之间的强相关性,其中,q值<0.05并且许多q值低至<1×10-30,这取决于所考虑的特定胞嘧啶位点。对12例CHD和26例正常对照者进行表观基因组分析。与正常对照相比,在测试的所有CHD病例中发现的整个DNA中多个位点处的胞嘧啶甲基化模式的显著差异。本文所述的基因组位点位于已知基因中或与已知基因相关。与对照相比,这些发现与CHD病例中多种基因的表达改变一致。
表1至表6提供了可单独用于预测、检测或诊断患者的CHD的基因组位点。基因组位点在表2至表6的每个表下方提供。可以选择表1至表6中的基因组位点中的一个或多个用于预测或诊断患者的CHD。在实施例中,这些位点中的两个或更多个可以选自表1、表2、表3、表4、表5和/或表6中的位点。
共识别了5918个CpG基因组位点,涵盖4976个基因(FDRp值≤0.01)。表1提供了通过使用cfF DNA进行的全基因组甲基化谱分析获得的前1000个基因组位点。可选择表1中的基因组位点中的一个或多个、两个或更多个、至多并包括全部1000个,用于预测、检测或诊断患者中的CHD。在实施方案中,可选择表1中公开的一个或多个、两个或更多个、至多且包括5、10、15、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个基因组位点,用于预测CHD。在实施方案中,所述基因组位点具有≥0.70、0.75、0.80、0.85、0.86、0.87、0.88、0.89、0.90、0.91、0.92、0.93或0.94的AUC(具有95%CI)。在1000个基因组位点中,130个CpG是低甲基化的,并且870个标记是与CHD相关的高甲基化的。发现53个低甲基化和486个高甲基化标记差异甲基化≥10%的甲基化差异。甲基化差异高于20%的三个基因组位点是:cg06301252(PTPRN2),具有33.62%的甲基化差异;cg02807450(MTMR2),具有-21.15%的甲基化差异;以及cg12900404(DOCK10),具有-20.13%的甲基化差异。126个CpG位点单独显示AUC≥0.80,表明疾病预测的非常好至优异的预测准确性。在实施方案中,用于检测、预测和/或诊断CHD的基因组位点包括cg06301252、cg02807450和cg12900404。
AUC综合了灵敏度和特异性值并且给出了测试准确性的更精确指示。AUC(具有95%CI)表示具有统计学上显著的95%置信区间的AUC。AUC≥0.70表示临床上有用的测试。
表2至表6提供了使用6种不同平台(包括SVM、GLM、PAM、RF、LDA和DL)通过AI分析获得的基因组位点。尽管在每个表下提供了位点,但其属于汇总每种算法的AUC、灵敏度和特异性的编号表。在实施方案中,用于预测、检测和诊断的基因组位点包括表2至表6中列出的6种算法中的每一种的一至五个位点。在每个表中以降序(在每个表下)提供每个模型的前5个预测标记。
在实施方案中,基因组位点选自具有≥0.8800、0.8900、0.9000、0.9100、0.9200、0.9300、0.9400、0.9500、0.9600或0.9700的AUC(具有95%CI)的算法。在实施方案中,基因组位点选自灵敏度和/或特异性≥0.8700、0.8800、0.8900、0.9000或0.9100的算法。在实施方案中,基因组位点选自表2的RF、SVM或DL的一至五个位点。
表3示出了当将人口统计学标记与CpG位点一起考虑时,实现了可比较的预测性能。表4示出了当仅考虑满足严格GWAS阈值的标记时,实现了高性能。表5示出了当考虑满足严格GWAS阈值的人口统计标记和CpG位点时,实现了高性能。表6示出了当仅使用显示高水平甲基化变化(例如1.5倍或更大)的标记时,观察到高预测准确度。表6示出了当仅使用显示高水平甲基化变化(例如1.5倍或更大)的标记时,观察到高预测准确度。
在整个申请中描述的范围包括指定范围、指定范围内的子范围、范围内的各个数字和范围的端点。例如,诸如从一个或更多个至高达1000的范围中的说明书包括诸如从一个或更多个至500个或更多个、从10个或更多个至20个或更多个、从一个或更多个至5个或更多个的子范围,以及该范围内的单个数字,例如1、2、3、4、5、10、20、100和500。此外,作为另一个实例,≥0.70的范围的说明书将包括0.70至1.00并且包括0.70和1.0的所有单个数字。
本文提供的结果证实,基于整个人类基因组中CHD与正常病例之间胞嘧啶位点的甲基化水平的差异,可以确定患有CHD的倾向或风险。
报道的基因组位点使得能够基于整个基因组中的胞嘧啶甲基化进行预测和检测CHD的靶向筛选研究。其还允许改善对CHD发展机制的理解,例如通过使用基因本体分析评估胞嘧啶甲基化数据。在实施方案中,基因组位点以许多不同的组合用于预测、检测或诊断受试者中的CHD。在实施方案中,基因组位点用于确定或计算受试者在出生前的任何时间或出生后的任何时间段期间患有CHD的风险或倾向。
表1
Figure BDA0003764278260000191
Figure BDA0003764278260000201
Figure BDA0003764278260000211
Figure BDA0003764278260000221
Figure BDA0003764278260000231
Figure BDA0003764278260000241
Figure BDA0003764278260000251
Figure BDA0003764278260000261
Figure BDA0003764278260000271
Figure BDA0003764278260000281
Figure BDA0003764278260000291
Figure BDA0003764278260000301
Figure BDA0003764278260000311
Figure BDA0003764278260000321
Figure BDA0003764278260000331
Figure BDA0003764278260000341
Figure BDA0003764278260000351
Figure BDA0003764278260000361
Figure BDA0003764278260000371
Figure BDA0003764278260000381
Figure BDA0003764278260000391
Figure BDA0003764278260000401
Figure BDA0003764278260000411
Figure BDA0003764278260000421
Figure BDA0003764278260000431
Figure BDA0003764278260000441
Figure BDA0003764278260000451
Figure BDA0003764278260000461
Figure BDA0003764278260000471
Figure BDA0003764278260000481
Figure BDA0003764278260000491
Figure BDA0003764278260000501
Figure BDA0003764278260000511
Figure BDA0003764278260000521
Figure BDA0003764278260000531
Figure BDA0003764278260000541
Figure BDA0003764278260000551
Figure BDA0003764278260000561
Figure BDA0003764278260000571
Figure BDA0003764278260000581
Figure BDA0003764278260000591
Figure BDA0003764278260000601
Figure BDA0003764278260000611
Figure BDA0003764278260000621
Figure BDA0003764278260000631
Figure BDA0003764278260000641
Figure BDA0003764278260000651
Figure BDA0003764278260000661
Figure BDA0003764278260000671
Figure BDA0003764278260000681
Figure BDA0003764278260000691
Figure BDA0003764278260000701
Figure BDA0003764278260000711
Figure BDA0003764278260000721
Figure BDA0003764278260000731
Figure BDA0003764278260000741
Figure BDA0003764278260000751
Figure BDA0003764278260000761
Figure BDA0003764278260000771
Figure BDA0003764278260000781
Figure BDA0003764278260000791
Figure BDA0003764278260000801
Figure BDA0003764278260000811
Figure BDA0003764278260000821
表2:CHD的人工智能和循环cfF DNA预测*
Figure BDA0003764278260000822
Figure BDA0003764278260000831
*基于甲基化差异≥5%和CHD检测的个体AUC≥0.70选择的个体CpG标记
按贡献递减顺序的个体预测因子:
SVM:cg04761177、cg21431091、cg01263077、cg09853933、cg27142059
GLM:cg24479965、cg01094213、cg22467129、cg24748945、cg01949461
PAM:cg27142059、cg09386284、cg16551159、cg04761177、cg01263077
RF:cg04761177、cg16551159、cg14957943、cg06978680、cg12592721
LDA:cg04761177、cg27142059、cg18073832、cg25731807、cg03790075
DL:cg04761177、cg21431091、cg01263077、cg09853933、cg27142059
表3:CHD的人工智能和循环cfF DNA、临床和人口统计学预测*
Figure BDA0003764278260000841
*基于甲基化差异≥5%和CHD检测的个体AUC≥0.70选择的个体CpG标记
按贡献递减顺序的个体预测因子:
SVM:cg04761177、cg21431091、cg01263077、cg09853933、cg27142059
GLM:cg24479965、cg01094213、cg22467129、cg24748945、cg01949461
PAM:cg27142059、cg09386284、cg16551159、cg04761177、cg01263077
RF:cg04761177、cg16551159、cg14957943、cg06978680、cg12592721
LDA:cg04761177、cg27142059、cg18073832、cg25731807、cg03790075
DL:cg04761177、cg21431091、cg01263077、cg09853933、cg27142059
表4:CHD的人工智能、满足严格标准的循环cfF DNA*预测*
Figure BDA0003764278260000842
*限于那些满足GWAS研究的严格阈值的个体CpG标记(p值<5x10-8)
按贡献递减顺序的个体预测因子:
SVM:cg04761177,cg15277677,cg03790075,cg04626875,cg11782260
GLM:cg13598434,cg05349624,cg10259004,cg04761177,cg11196182
PAM:cg18198743,cg08316054,cg02394812,cg00280345,cg08052226
RF:cg04761177,cg244128480.62684,cg01637563,cg17720707,cg05349624
LDA:cg03790075,cg04761177,cg05349624,cg14809932,cg01637563
DL:cg13598434,cg05349624,cg10259004,cg04761177,cg11196182
表5:CHD的人工智能、满足严格标准的循环cfF DNA*、临床和人口统计学预测
Figure BDA0003764278260000851
*限于那些满足GWAS研究的严格阈值的单个CpG标记(p值<5x10-8)
按贡献递减顺序的个体预测因子:
SVM:cg04761177、cg15277677、cg03790075、cg04626875、cg11782260
GLM:cg13598434、cg05349624、cg10259004、cg04761177、cg11196182
PAM:cg18198743、cg08316054、cg02394812、cg00280345、cg08052226
RF:cg04761177、cg244128480.62684、cg01637563、cg17720707、cg05349624
LDA:cg03790075、cg04761177、cg05349624、cg14809932、cg01637563
DL:cg13598434、cg05349624、cg10259004、cg04761177、cg11196182
表6:CHD的人工智能和循环cfF DNA*预测
Figure BDA0003764278260000852
*限于CHD相对于对照具有≥1.5倍甲基化变化的单独CpG标记
按贡献递减顺序的个体预测因子:
SVM:cg09493833、cg27563174、cg22752533、cg05279901、cg03741571
GLM:cg19803352、cg24479965、cg07287606、cg22467129、cg24509810
PAM:cg27142059、cg13598434、cg14200609、cg09493833、cg20360734
RF:cg27142059、cg26078733、cg14200609、cg23273875、cg24509810
LDA:cg27142059、cg09493833、cg19803352、cg17485454、cg07287606
DL:cg27142059、cg26078733、cg14200609、cg23273875、cg24509810
微阵列:可以使用微阵列系统分析差异甲基化。核酸可以连接到芯片,例如微芯片。参见例如美国专利号5,143,854;6,087,112;5,215,882;5,707,807;5,807,522;5,958,342;5,994,076;6,004,755;6,048,695;6,060,240;6,090,556;和6,040,138。与微阵列上的核酸的结合可以通过用各种基于激光或电荷耦合器件(CCD)的扫描仪扫描微阵列,并用软件包提取特征来检测,所述软件包例如IMAGENE(Biodiscovery,Hawthorne,CA)、FeatureExtraction Software(Agilent)、SCANALYZE(Eisen,M.1999.SCANALYZE User Manual,Stanford Univ.,Stanford,Calif.Ver2.3.2.)或Genepix(Axon Instruments)。全组位点将包括表1至表6中列出的一个或多个基因组位点,其已单独显示为潜在临床有用的测试AUC≥0.70。
试剂盒:描述了基于核酸上CpG位点的甲基化预测和诊断CHD的试剂盒。试剂盒可以包括用于从生物样本中提取核酸(包括DNA和RNA)的组分、微阵列系统的组分和/或用于分析差异甲基化的基因组位点的组分。
如本文所述的CHD的生物标记检测可促使早期和准确的诊断,从而促进CDC规划管理目标。鉴于显著百分比甚至大多数的主要CHD病例仍未被诊断的证据,准确的生物标记是任何有效治疗策略的关键必要补充。
本文公开的方法包括预测、检测或诊断CHD和/或计算发生CHD的风险或倾向。本文所述的方法可用于早期预防和/或治疗(包括减轻或缓解症状)患者以预防死亡或与CHD相关的严重症状的发展。需要(有需要)预测、诊断和/或治疗的受试者或患者是可能患有CHD并且需要诊断和治疗的受试者。
如本领域普通技术人员将理解的,本文公开的每个实施方案可包含其具体陈述的要素、步骤、成分或组分,基本上由其组成或由其组成。因此,术语“包括”或“包含”应当被解释为叙述:“包括、由...组成或基本上由...组成”。过渡术语“包括”或“包含”意指包括但不限于,并且即使是主要的量仍允许包括未指出的要素、步骤、成分或组分。过渡短语“由......组成”排除未指出的任何元素、步骤、成分或组分。过渡短语“基本上由......组成”将实施方案的范围限制于指定的要素、步骤、成分或组分以及不实质上影响实施方案的那些。例如,不影响CHD的检测、预测、诊断或不影响患者CHD的预防或治疗的步骤。
此外,除非另有说明,否则说明书和权利要求书中使用的表示成分、组分、反应条件等的量的数字应理解为由术语“约”修饰。因此,除非有相反的指示,否则说明书和所附权利要求书中阐述的数值参数是近似值,其可以根据本文提出的主题寻求获得的期望性质而变化。至少并且不试图将等同原则的应用限制在权利要求的范围内,每个数值参数应至少根据所报告的有效数字的数量并通过应用普通的四舍五入技术来解释。尽管阐述本文提出的主题的宽范围的数值范围和参数是近似值,但是在具体实施例中阐述的数值是尽可能精确地报告的。然而,任何数值固有地包含由其各自的测试测量中发现的标准偏差必然导致的某些误差。
当需要进一步清楚时,术语“约”具有本领域技术人员在与所述数值或范围结合使用时合理归于其的含义,即,表示稍微大于或稍微小于所述值或范围,在所述值的±20%的范围内;所述值±15%的范围内;所述值的±10%的范围内;所述值±5%的范围内;所述值±4%的范围内;所述值的±3%的范围内;所述值的±2%的范围内;所述值的±1%范围内;或±所述值的1%和20%之间的任何百分比。
除非本文另有说明或与上下文明显矛盾,否则在描述所要求保护的主题的上下文中(特别是在以下权利要求的上下文中)使用的术语“一”、“一个”、“该”和类似指示物应被解释为涵盖单数和复数。
以下示例性实施方案和实施例说明了本文提供的示例性方法。这些示例性实施例和示例不旨在也不应被解释为限制本公开的范围。将清楚的是,所述方法可以以不同于本文具体描述的方式实施。鉴于本文的教导,许多修改和变化是可能的,并且因此在本公开的范围内。
示例性实施方案
示例性实施例包括但不限于:
1、本文所述的方法包括使用从受试者的生物样本获得的核酸来诊断、检测和/或预测CHD。受试者可以是胎儿、胚胎、新生儿、婴儿、儿童、青少年或成人。受试者可以是孕妇。生物样本包括组织样本,包括胎盘组织或体液,例如血液、血浆、血清、尿液、唾液、痰液、汗液、泪液、生殖器分泌物(包括宫颈分泌物)、羊水和出生时获得的脐带血。在实施方案中,核酸是DNA。DNA可以是细胞DNA或游离(cf)DNA。cf DNA可以是cf胎儿(cfF)DNA。
2、本文所述的方法包括使用DNA和cfF DNA来确定CHD的表观遗传机制。
3、本文所述的表观遗传机制包括基于DNA和cfF DNA的使用的所有形式的表观遗传测试,例如DNA甲基化变化和组蛋白修饰,包括但不限于:甲基化、乙酰化、类泛素化和磷酸化。组蛋白是DNA链包裹在其周围的蛋白质。组蛋白修饰有助于DNA胞嘧啶甲基化的直接改变,并在基因中起关键作用。
4、本文所述的核酸甲基化变化(包括DNA甲基化变化)包括各种形式的甲基化变化,包括:胞嘧啶甲基化、胞嘧啶羟甲基化和其他形式的胞嘧啶表观遗传修饰。腺嘌呤核苷酸也可以经历DNA甲基化变化。因此,本文所述的方法包括使用cfF DNA来测量所有形式的胞嘧啶修饰,所述形式将落入用于使用cff DNA预测或监测CHD的目的的腺嘌呤甲基化的定义内。
6、基于cff DNA的如本文所述的DNA表观遗传变化(包括胞嘧啶或腺嘌呤中所有形式的甲基化变化,并且包括所有形式的组蛋白表观遗传修饰),用于检测DNA甲基化或组蛋白修饰在其发育中起作用的其他胎儿先天性异常,例如神经管缺陷、唇裂和腭裂。
7、本文所述的方法包括针对本文所述的相关心脏异常(例如酒精或药物、化学品或其他已知的风险暴露)或正在进行的妊娠中的病症(例如母体糖尿病或高血压)的发展风险,使用cfF DNA用于表观遗传监测暴露对妊娠的影响。
8、一种预测或诊断有需要的受试者中的先天性心脏缺陷(CHD)的方法,其中,所述方法包括:测定从所述受试者获得的包含cf核酸的生物样本以确定整个基因组中一个或多个位点处的胞嘧啶甲基化的频率或百分比;以及将样本的胞嘧啶甲基化水平与对照样本的胞嘧啶甲基化进行比较。
9、根据实施方案1-8中任一个的方法,其中,所述方法还包括使用人工智能(AI)技术。
10、根据实施方案1-9中任一个的方法,其中,所述方法还包括使用包括以下机器学习算法中的一种或多种的人工智能(AI)技术:随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、微阵列分析预测(PAM)、广义线性模型(GLM)或深度学习(DL)。
11、根据实施方案1-10中任一个的方法,其中,所述方法还包括:计算所述受试者发展CHD的风险。
12、根据实施方案1-11中任一个的方法,其中,对照样本包括来自一个或多个正常(健康)患者或来自一个或多个被诊断患有CHD的患者的一个或多个生物样本。
13、根据实施方案1-12中任一个的方法,其中,所述生物样本包括体液。
14、根据实施方案1-13中任一个的方法,其中,所述生物样本包括血液、血浆、血清、尿液、唾液、痰液、汗液、呼吸冷凝物、泪液、生殖器分泌物包括宫颈分泌物、羊水、胎盘组织、CVS样本和在出生时获得的脐带血。
15、根据实施方案1-14中任一个的方法,其中,cf核酸包括cfF核酸。
16、根据实施方案1-15中任一个的方法,其中,所述生物样本包含来自妊娠早期、妊娠中期和/或妊娠晚期的cfF核酸。
17、根据实施方案1-16中任一个的方法,其中,cf核酸包括DNA。
18、根据实施方案1-17中任一个的方法,其中,所述一个或多个位点包括来自表1至表6的一个或多个位点。
19、根据实施方案1-18中任一个的方法,其中,所述一个或多个位点包括来自表1至表6的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少10个位点。
20、根据实施方案1-19中任一个的方法,其中该一个或多个位点包括大于0.70、0.75、0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96、或0.97的AUC(具有95%CI)。
21、根据实施方案8-20中任一个的方法,其中,所述测定是基于重亚硫酸盐的甲基化测定或全基因组甲基化测定。
22、根据实施方案1-21中任一个的方法,其中,所述一个或多个位点包括cg06301252、cg02807450或cg12900404。
23、根据实施方案1-22中任一个的方法,其中,所述一个或多个位点包括cg04761177、cg21431091、cg01263077、cg09853933、cg27142059、cg16551159、cg14957943、cg06978680或cg12592721。
24、根据实施方案1-23中任一个的方法,其中,所述方法还包括治疗CHD。
25、根据实施方案1-24中任一个的方法,其中,所述方法还包括通过对所述受试者施用药物和/或进行手术来治疗所述受试者。
26、根据实施方案1-23中任一个的方法,其中,所述方法在未来妊娠中预防CHD。
27、根据实施例26所述的方法,其中,所述方法包括向怀孕母亲补充叶酸或叶酸盐。
实施例
在该研究中,总共分析了12例CHD。这12个病例包括:1例肺动脉闭锁伴肺动脉瓣狭窄;4例室间隔缺损(又名VSD);1例动脉干病例;2例法洛四联症(Tetralogyof Fallot)病例;1例肺动脉瓣狭窄;1例室间隔缺损个合并房间隔缺损;1例双主动脉弓;以及1例具有扩张的主肺动脉的二尖瓣A-V瓣膜。总共有12例CHD。人口统计数据在补充表S1中提供。表1提供了表观基因组数据。表2至表6提供了与人工智能技术组合获得的表观基因组数据。
介绍:在一系列研究(Radhakrishna et al.2018;Bahado-Singh et al.2019a;Radhakrishna et al.2019)中,甲基化变化在胎盘DNA识别的基因和基因网络中得到了证实,所述基因和基因网络在孤立的VSD和非综合征性法洛四联症(两种最重要的CHD类别)中表观遗传失调。这些研究有助于为这些CHD的致病机制提供重要的启示。此外,使用来自胎盘的DNA甲基化标记准确筛选CHD。虽然胎盘鉴于其丰度和有限的临床价值对于此类研究是理想的,但将结果应用于CHD的产前预测代表了重大挑战。获得可用于DNA分析的胎盘滋养层组织通常需要侵入性程序,例如绒毛膜绒毛取样或胎盘活检(Alfirevic et al.,2003)。该手术是痛苦的,需要专业知识,并且可能与妊娠并发症的风险增加相关。然而,这些先前的研究没有解决从胎盘释放到循环中的cf DNA是否可用于检测发育中的胎儿或胚胎中的CHD的问题。
在过去二十年中,对存在于妊娠母体循环中的efF DNA进行基因组分析现在已经发展到广泛的临床应用,用于检测胎儿非整倍性(Goldwaser&Klugman 2018)和其他染色体(Keet al.2015;Grace et al.2016)和分子病理学(Stewart et al.2018)。然而,“胎儿游离DNA”是不精确的术语,因为DNA实际上来自胎盘本身,即,胚胎胎儿组织。胎盘滋养层持续增殖、分化和凋亡(Taglauer et al.,2014)。胎盘凋亡物质连续脱落到母体循环中。这种滋养层细胞凋亡材料构成在母体血液(Gupta et al.2004;Tjoa et al.2006)和临床研究(Wataganara et al.2005;Alberry et al.2007)中发现的游离“胎儿”DNA。游离“胎儿”DNA构成母体循环中cf DNA的显著百分比。胎儿生理物理评分(fetal fraction)对总体母体cfDNA血液水平的贡献随着孕龄的提高而加速(Rafaeli-Yehudai et al.,2018)。在以下研究中,从孕妇的血浆中提取cf DNA(Zolotukhina et al.,2005)。对cf DNA进行DNA甲基化分析。基于cf DNA的DNA甲基化分析用于帮助阐明CHD发展的表观遗传发病机制,并且还用于基于在中期妊娠的母体循环中的循环cfF DNA中观察到的DNA甲基化变化来预测非综合征性CHD。
方法:研究样本和cf DNA提取。人类伦理委员会已经批准了本研究并且向被研究的每个受试者都提供了知情的书面同意书。共分析了12例病例和26例对照。受试者是生产CHD病例的母亲和正常婴儿。病例的平均年龄为29.7岁,对照组为31.3岁。从母体血液中提取cfF DNA。在妊娠期间从受试者获得血液样本。将血液样本直接抽取到Streck游离DNA
Figure BDA0003764278260000911
管中,以确保来自血浆的cf-DNA的良好质量(Bartak et al.,2019)。此后,通过在抽血24小时内以3000×g离心取样管15分钟来进一步处理取样管。将血浆等分到2.0mL微量离心收集管中,而不干扰样本的血沉棕黄层。将等分的血浆样本储存在-80℃下直至进一步处理(Sheinerman et al.2017)。使用QIAamp循环核酸试剂盒(QiagenCat#55114),使用5mL血浆提取cf-DNA。使用的方法是遵循制造商的方案使用QIAvac 24 Plus真空歧管的手动真空方法。可以结合片段化DNA的二氧化硅膜技术使得DNA的有效回收成为可能。该方法允许我们通过维持DNA的甲基化状态来使用DNA进行进一步的重亚硫酸盐转化和甲基化谱分析。
重亚硫酸盐转化和甲基化阵列处理:使用EZ DNA甲基化金试剂盒(Zymo,USA),根据该制造商的操作手册,使用10ul洗脱缓冲液(Hardy et al.,2017),进行DNA的重亚硫酸盐转化。根据制造商的说明书,使用具有超过850K甲基化标记的Illumina InfiniumMethylationEpic BeadChip阵列进行甲基化谱分析。样本在芯片上随机化。两种情况和对照样本处理一起进行以避免任何样本处理偏差。使用真空干燥器干燥阵列,并根据公司的说明使用Illumina iScan系统对经处理的磁珠芯片进行成像。
统计和生物信息学分析:扫描后,从iScan软件下载原始iDat文件,并使用GenomeStudio软件分析数据。针对个体CpG位点比较病例与对照受试者的β值以进行差异甲基化分析。先前的出版物描述了进一步的下游统计分析(Bahado-Singh et al.2019a;Bahado-Singh et al.2019b)。对于进一步的下游分析,排除了构成X和Y染色体的CpG探针,随后是CpG位点的10bp内的dbSNP条目,以避免性别偏倚和分别对甲基化位点的遗传效应(Wilhelm-Benartzi et al.2013)。具有BH调整的FDR p值<0.01的β值被认为是显著性的截止值。使用R工具的dplyr、reshape2和ROCR包计算每个显著CpG位点的具有95%CI的接受者操作特征曲线下面积(AUC-ROC)。
人工智能(AI)分析:用于AI分析的方法描述于Bahado-Singh et al.,2019b。以下是先前公布的描述的概述。将表观基因组数据分成两组,训练组由80%的研究受试者组成,测试组构成剩余的20%。这是一种在分析较小的小数据集时经常使用的方法。我们对来自训练组的数据进行了10倍交叉验证,以生成预测模型。然后在独立验证或测试组中评价该模型。使用六种适当的AI方法或算法来确定CHD检测的筛选性能。这些是随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、微阵列预测分析(PAM)、广义线性模型(GLM)和深度学习(DL),深度学习是AI的最新形式,并且越来越多地用于分析复杂和大量的生物数据,例如表观基因组学。
RF是用于分类、回归和其他功能的监督分类算法。随机创建决策树的森林,并且确定各个树的平均预测。森林中的树的数量与所生成的结果的准确性之间存在直接相关性。增加树的数量将增加所获得的结果的准确性。RF具有能够处理数据集中的缺失值并且可以利用分类值的益处(Huang et al.,2013)。首先向SVM馈送标识不同组的标记数据(监督学习),并由此构建用于区分组的模型。随后,当提供未标记的新鲜数据时,能够开发模型或超平面以将一个组与另一个组聚类。SVM能够执行回归和分类任务,并且可以处理多个连续和分类变量(Mahadevan et al.,2008)。LDA用于减少准确分类和区分组所需的特征或预测因子的数量。这对于表观基因组分析特别有用,因为研究开始时接近900000个潜在特征用于CHD检测。LDA是一种简单的方法,但其仍然可以实现优异的精度。准确度与更复杂的方法一样好。LDA基于最佳地分离两个类别(靶标)的变量(预测因子)的线性组合的识别(Liland2011)。其与方差分析(ANOVA)和回归分析密切相关,回归分析试图基于解释变量的组合来定义结果变量。PAM是一种使用最近的收缩质心从基因表达数据进行类别预测的统计技术(Alakwaa et al.2018;Candel et al.2018)。该方法识别了最佳表征每个类别的基因子集。GLM是模型的一个大类,包括线性回归、ANOVA、泊松回归、对数线性模型等(Alakwaaet al.,2018;Candel et al.,2018)。DL是使用多个变换步骤来创建非常复杂的特征的表示学习的一种形式。DL被分类为前馈人工神经网络(ANN),其使用经由权重(W)矩阵连接输入层(x)和输出层(z)的多于一个隐藏层(y)。预期权重矩阵使输入和输出层之间的差异最小化,并且被认为是最佳AI方法(Alakwaa et al.,2018;Candel et al.,2018)。
多元回归分析提供模型:在进行多元回归分析之前,对表观基因组学数据进行分位数归一化和自动缩放。作为质量控制步骤,为了研究任何系统变异的存在并检测潜在的异常值,使用MetaboAnalyst(v4.0)对所有类别进行主成分分析(PCA)(Chong et al.,2018)。随后,这些预处理的数据用于执行偏最小二乘判别分析(PLSDA)。使用MetaboAnalyst中可用的留一交叉验证方法,基于预测准确性和交叉验证仔细选择CpG β值变量的理想数量。已经报告了每个PLSDA模型的拟合优度(R2)和可预测性(Q2)值。在交叉验证时,进行2000次迭代排列检验,其可以最小化在PLSDA上观察到的分离的可能性,这是由于考虑p值<0.05的可能性。
cfF DNA CHD中差异甲基化靶标的聚类分析:使用病例和对照之间显著差异甲基化标记的个体β值产生热图(图1)。如果存在少于20%的缺失值,则用特定甲基化位点的中值估算缺失值。省略显示超过20%缺失值的任何甲基化标记。此外,使用分位数间范围(IQR)过滤数据,并对分位数进行归一化以避免稀释效应。在层次聚类分析中,使用欧几里德距离测度和Ward聚类算法,并用PLADA-VIP图得分查看。对照组和病例组分别给予代码0和1。
基因本体分析和功能富集:使用发现以FDR p值<0.01显著差异甲基化的基因,使用通路分析(Ingenuity Pathway Analysis(IPA))(Qiagen IPA)系统进行疾病和功能富集分析。IPA平台使得能够系统分析与生物学功能相关的阵列数据(Haddad et al.,2016)。基于其在心脏发育和疾病中的相互关系和作用来考虑基因网络。
结果:使用从生产12个CHD病例和26个对照的母亲提取的cfF DNA进行全基因组甲基化谱分析。取样时的胎龄也没有显示任何统计学差异(p值=0.15)。抽血时的平均(SD)胎龄为23周5天(病例组)和24周6天(对照组)(p-0.15)。生育CHD婴儿的母亲和生育正常婴儿的母亲的年龄范围和取样时的胎龄分别没有显示出0.32和0.15的p值的显著差异。人口统计的细节在表S1中提供。
表S1:研究受试者的临床和人口统计学特征*
Figure BDA0003764278260000931
Figure BDA0003764278260000941
W:Wilcoxon秩和统计检验
*两组的种族组成没有差异。
cfF DNA的差异甲基化分析共识别了5918个CpG标记,涵盖4976个基因(FDR p值≤0.01)。表1中提供了前1000个重要CpG位点和具有加州大学圣克鲁兹分校(University ofCalifomia Santa Cruz(UCSC))基因符号的相关基因,以及统计数据。在这些标记中,130个CpG是低甲基化的,而870个标记是与CHD相关的高甲基化的。发现53个低甲基化和486个高甲基化标记差异甲基化≥10%的甲基化差异。甲基化差异高于20%的3种标记是具有33.62%甲基化变化的cg06301252(PTPRN2)、具有-21.15%甲基化变化的cg02807450(MTMR2)和具有-20.13%甲基化变化的cg12900404(DOCK10)。126个CpG位点分别显示AUC≥0.80,表明对疾病预测具有优异的预测准确性。
cfF DNA CHD的甲基化标记的AI预测。具有5%差异和AUC>0.70的显著差异甲基化CpG已用于使用6种预测算法进行AI分析。其中,发现RF和SVM模型显示出最高性能,AUC(95%CI)=0.98(0.831-1),具有93.8%的灵敏度和93.2%的特异性,AUC(95%CI)=0.97(0.877-1),具有98%的灵敏度和94%的特异性,随后是DL模型,具有AUC(95%CI)=0.94(0.840-1.0),具有93%的灵敏度和94%的特异性(表2)。对于其他四个平台中的每一个也实现了高性能。当将人口统计标记与CpG位点一起考虑时,实现了相当的预测性能(表3),并且当仅考虑满足严格GWAS阈值的标记时,也实现了高性能(表4)。当考虑满足严格GWAS阈值的人口统计学标记和CpG位点时,实现了高性能(表5)。表6显示,当仅使用显示高水平甲基化变化(例如1.5倍或更大)的标记时,观察到高预测准确度。在每个表中以降序(在每个表下)提供每个模型的前5个预测标记。
Logistic回归分析:进行具有10倍交叉验证的常规逻辑回归分析,并将标记与具有5%差异和AUC>0.70的CpG的AI预测进行比较。在训练集上,获得具有100%的灵敏度和85%的特异性的0.98(0.98-0.97)的AUC(95%CI),随后具有10倍交叉验证的训练逻辑回归模型提供在测试集上提供的具有83%的灵敏度和80%的特异性的0.79(0.61-0.98)的AUC值(95%CI)。逻辑回归方程如下:
logit(P)=log(P/(1-P))=-5.469-2.698cg08230215-3.924cg04761177-2.478cg10259004-2.477cg06009031。
对于具有严格p值5×10-8的CpG标记,发现AUC(95%CI)=0.99(0.92-0.99),在训练/发现测试中具有90%的灵敏度和95%的特异性。10倍交叉验证显示AUC(95%CI)=0.71(0.50-0.92),具有75%的灵敏度和87%的特异性,具有以下等式:
logit(P)=log(P/(1-P))=-2.583-5.115cg04761177-6.351cg23306063+1.126cg10259004-0.369cg23136742-2.917cg11196182。
cfF DNA CHD中差异甲基化靶标的聚类分析:在使用病例和对照之间显著差异甲基化标记的个体β值的分层聚类分析中,观察到病例和对照之间低甲基化和高甲基化的良好分离的聚类(图1A和图1B)。CpG标记ID在右列中提供。
疾病和功能富集分析:为了确定统计发现是否具有生物学合理性,进行通路分析。通路分析系统显示出显著的疾病和与CHD相关的基因的功能富集。前3名心脏发育和疾病功能显示在先天性心脏病(P-6.69E-03)、心脏肥大(P-4.34E-03)和心脏发育(P-3.73E-05)中富集。图2描绘了这些疾病功能中涉及的基因网络。因此,差异甲基化的重要基因似乎在心脏胚胎学和CHD发展中起作用。
讨论:使用来自母亲血液的游离循环cfF DNA进行与AI预测组合的综合甲基化谱分析。该研究表明,在病例和对照之间,包含4976个基因的5918个CpG标记物的显著差异甲基化。Cf DNA是一种用于产前诊断的有前景的生物标记来源,其是微创的并且缓慢地替代其他侵入性测试,例如羊膜穿刺术或基于绒毛膜绒毛样本的测试(Nagy2019)。表观遗传因子调节基因表达并影响胚胎发生期间的心脏发育(Vallaster et al.2012)。1278个低甲基化基因倾向于在细胞中过表达(Klasic et al.2016),而剩余的4640个高甲基化基因可能在细胞中显示下调的表达(Razin&Kantor2005)。539个CpG显示甲基化差异≥10%,表明基因表达的生物学相关性。发现基于PLS-DA分析分离研究样本,并且高甲基化和低甲基化标记之间的差异显示在热图中(图1)。
使用6种不同的算法进行AI分析,包括SVM、GLM、PAM、RF、LDA和DL。SVM模型提供了最佳预测,AUC=0.97(98%的灵敏度和94%的特异性)。前5种预测标记包括cg04761177(ATP2A1)、cg21431091(TMEM9)、cg01263077(MYO9B)、cg09853933(ATG2B;GSKIP)和cg27142059(TRIM15)。为了与AI预测进行比较,使用具有10倍交叉验证的常规逻辑回归分析测试标记,并发现cg08230215(MAST3),cg04761177(ATP2A1),cg10259004(MY19)和cg06009031(C7orf50)。发现预测算法SVM、PAM、RF、LDA、DL和逻辑回归中的共同标记是cg04761177(ATP2A1)。cg04761177已被去甲基化,具有9%的甲基化差异,AUC=0.94(CI0.86-1.00)用于CHD预测,并且基因ATP2A1也称为SERCA1。该基因调节心脏的电和收缩特性,从而失调与包括充血性心力衰竭在内的多种心脏病有关(Peters et al.1997;Enniset al.2002)。
从具有严格p值-5×10-8和常规逻辑回归的两种AI算法预测为优异标记的第二种常见CpG标记是cg10259004(MY19)。MYL9基因编码肌球蛋白轻链,并且在心脏平滑肌中表达并参与心脏的形态发生(England&Loughna 2013)。
疾病和与CHD相关的cf DNA中具有CpG的基因的功能富集:基于疾病的途径富集分析已经识别了目前已知或预测与心脏肥大、心脏发育和先天性心脏病相关的显著差异甲基化基因。这表明所识别的与CHD相关的基因的生物学合理性。所有识别的CpG甲基化位点均在启动子内或基因区域中识别,并且与心脏肥大、心脏发育和先天性心脏病的机制相关,具有显著的p值<0.001。例如,一些低甲基化基因包括HSPB11、POFUT1、NFATC4、DTNBP1、CFLAR、KCNH2、B3GAT3、BMP4,并且高甲基化基因包括BMP7、NOG、MAP2K2、FGF9、ADAM17和MAPK3。
HSPB11被发现与心脏发育相关,并且在斑马鱼(zebrafish)的心室组织发育的后期高度表达(Singh et al.2016)。POFUT1是Notch信号传导的必要组分,其在心脏瓣膜的发育、心脏流出道和心室隔膜形成中起重要作用(Penton et al.2012)。缺乏蛋白质POFUT1的小鼠在妊娠中期死亡,具有血管发生和心脏发育的严重缺陷(Shi&Stanley2003)。NFATC4和DTNBP1涉及诱导人心脏肥大(Poirier et al.2003;Rangrez et al.2013)。CFLAR基因的表达降低已显示在心脏小梁形成、心肌变薄、心脏致死性和心室结构方面表现出严重缺陷(Imanishi et al.2000;Yeh et al.2000;Lakhani et al.2006;Ye et al.2013)。KCNH2编码已知作为将钾离子传导出心肌细胞的Kv11.1(钾离子通道)(Newton-Cheh et al.2007;Park et al.2013)的蛋白质。在大群组中的一项回顾性研究调查了KCNH2中的突变导致房室传导阻滞、法洛四联症、缩窄(Coarctation)、房间隔缺损、房室管、二叶主动脉瓣、动脉导管未闭、三尖瓣闭锁和室间隔缺损(Ebrahim et al.,2017)。另一个基因B3GAT3在蛋白聚糖生物合成中起重要作用(von Oettingen et al.2014),并且这些蛋白聚糖链中的突变导致严重的先天性心脏异常,包括二叶主动脉瓣、室间隔缺损和二尖瓣脱垂(Baasanjav etal.2011;Bloor et al.2017)。BMP4是心内膜垫发育和流出道正常分隔的重要来源。在小鼠中,BMP4功能丧失会导致室间隔缺损、半月瓣形成异常、垫重塑异常、永存动脉干和发育中的心外膜垫中的心脏分化不足(McCulley et al.,2008)。
高甲基化基因如BMP7编码TGF-β的分泌配体,其在冠状脉管系统、心室心肌发育和致密化中起关键调节作用(Azhar et al.2003)。在小鼠胚胎中,低BMP7与心血管疾病发病率和死亡率增加有关(Silverman et al.,2004)(Freedman et al.,2009)。另一种高甲基化基因NOG(头蛋白(Noggin))与BMP2和BMP4具有强相互作用,然而其也与BMP7相互作用(Choi et al.2007)。值得注意的是,BMP4和BMP7两者与NOG一起在本研究中被差异甲基化。头蛋白敲除小鼠显示出心血管发育的几种异常,这些是BMP信号传导的结果,并且预测在人类中发挥类似的机制(Choi et al.2007)。MAP2K2(促分裂原活化蛋白激酶激酶2)是另一种高甲基化基因,早期报道通过激活ERK途径与心脏肥大的患病率增加有关((Gillespie-Brown et al.1995;Gallo et al.2019)。另一种MAP激酶家族基因MAPK3参与减数分裂、有丝分裂和有丝分裂后功能的调节,并且该基因的失调促进心脏肥大(Bueno et al.2000;Mutlak&Kehat 2015)。FGF9基因主要在心外膜中表达,其在妊娠中期心脏发育期间维持心肌增殖。FGF9的表达改变与显著降低的成心肌细胞增殖和心室发育不全相关。(Lavine etal.,2005)。FGF9还在胚胎心脏发育中作为旁分泌信号起作用,并且功能丧失与心肌细胞增殖减少相关(Itoh et al.2016)。含有去整合蛋白和金属蛋白酶结构域的蛋白17基因(ADAM17)通过改变细胞表面基质受体在结构心脏重塑中起重要作用,并且ADAM17的功能丧失导致心脏肥大(Wang et al.2009;Takayanagi et al.2016)。ADAM17的表达改变也是心室重塑的标志,表明其在心脏重塑的晚期阶段中的重要作用(Zheng et al.2016)。
该概念验证研究证实了DNA甲基化对引起CHD的影响,并且使用cfF DNA识别这是一种可能的方法。使用各种统计方法和AI平台预测的诊断准确性有助于对CHD预测新的基因进行优先级排序。
总之识别了cfF DNA中与CHD相关的显著差异甲基化标记。AI算法预测与CHD相关的显著标记,并且疾病富集分析显示与心脏发育和功能相关的重要基因。开发微创方法进行产前诊断具有临床重要性。在本研究中使用cfF DNA理解识别的基因的作用和调节将进一步形成理解妊娠早期正常和异常心脏的胚胎学发育的分子机制的基础。
上述主题仅以示意说明的方式提供并且不应被解释为限制。在不遵循所示出和描述的示例实施例和应用并且不脱离在所附权利要求中阐述的本公开的真实精神和范围的条件下,可以对本文描述的主题进行各种修改和改变。
本说明书中引用的所有出版物、专利和专利申请通过引用整体并入本文,如同每个单独的出版物、专利或专利申请被具体和单独地指出通过引用并入。虽然已经根据各种实施方案描述了前述内容,但是本领域技术人员将理解,在不脱离其精神的情况下,可以进行各种修改、替换、省略和改变。
参考文献
Alakwaa F.M.,Chaudhary K.&Garmire L.X.(2018)Deep Learning AccuratelyPredicts Estrogen Receptor Status in Breast Cancer MetabolomicsData.JProteome Res 17,337-47.
Alberry M.,Maddocks D.,Jones M.,Abdel Hadi M.,Abdel-Fattah S.,AventN.&Soothill P.W.(2007)Free fetal DNA in maternal plasma in anembryonicpregnancies:confirmation that the origin is the trophoblast.Prenat Diagn 27,415-8.
Alfirevic Z.,Sundberg K.&Brigham S.(2003)Amniocentesis and chorionicvillus sampling for prenatal diagnosis.Cochrane Database Syst Rev,CD003252.
Azhar M.,Schultz Jel J.,Grupp I.,Dorn G.W.,2nd,Meneton P.,Molin D.G.,Gittenberger-de Groot A.C.&Doetschman T.(2003)Transforming growth factor betain cardiovascular development and function.Cytokine Growth Factor Rev 14,391-407.
Baasanjav S.,A1-Gazali L.,Hashiguchi T.,Mizumoto S.,Fischer B.,HornD.,Seelow D.,Ali B.R.,Aziz S.A.,Langer R.,Saleh A.A.,Becker C.,Nurnberg G.,Cantagrel V.,Gleeson J.G.,Gomez D.,Michel J.B.,Stricker S.,Lindner T.H.,Nurnberg P.,Sugahara K.,Mundlos S.&Hoffmann K.(2011)Faulty initiation ofproteoglycan synthesis causes cardiac and joint defects.Am JHum Genet 89,15-27.
Bahado-Singh R.,Vishweswaraiah S.,Mishra N.K.,Guda C.&Radhakrishna U.(2019a)Placental DNA methylation changes for the detection of tetralogy ofFallot.Ultrasound Obstet Gynecol.
Bahado-Singh R.O.,Vishweswaraiah S.,Aydas B.,Mishra N.K.,Guda C.&Radhakrishna U.(2019b)Deep Learning/Artificial Intelligence and Blood-BasedDNA Epigenomic Prediction of Cerebral Palsy.Int JMol Sci 20.
Bahado-Singh R.O.,Wapner R.,Thom E.,Zachary J.,Platt L.,Mahoney M.J.,Johnson A.,Silver R.K.,Pergament E.,Filkins K.,Hogge W.A.,Wilson R.D.,JacksonL.G.,First Trimester Maternal Serum B.&Fetal Nuchal Translucency ScreeningStudy G.(2005)Elevated first-trimester nuchal translucency increases the riskof congenital heart defects.Am JObstet Gynecol 192,1357-61.
Bahado-Singh R.O.,Zaffra R.,Albayarak S.,Chelliah A.,Bolinjkar R.,Turkoglu O.&Radhakrishna U.(2016)Epigenetic markers for newborn congenitalheart defect(CHD).J Matern Fetal Neonatal Med 29,1881-7.
Bartak B.K.,Kalmar A.,Galamb O.,Wichmann B.,Nagy Z.B.,Tulassay Z.,Dank M.,Igaz P.&Molnar B.(2019)Blood Collection and Cell-Free DNA IsolationMethods Influence the Sensitivity of Liquid Biopsy Analysis for ColorectalCancer Detection.Pathol Oncol Res 25,915-23.
Bloor S.,Giri D.,Didi M.&Senniappan S.(2017)Novel Splicing Mutationin B3GAT3 Associated with Short Stature,GH Deficiency,Hypoglycaemia,Developmental Delay,and Multiple Congenital Anomalies.Case Rep Genet 2017,3941483.
Botto LD,Mulinare J,Erickson JD.Do multivitamin or folic acidsupplements reduce the risk for congenital heart defects?Evidence and gaps.AmJ Med GenetA 2003;121A:95-101)
Botto LD,Yang Q.5,10-Methylenetetrahydrofolate reductase genevariants and congenital anomalies:a HuGE review.Am JEpidemiol2000;151:862-77
Bueno O.F.,De Windt L.J.,Tymitz K.M.,Witt S.A.,Kimball T.R.,KlevitskyR.,Hewett T.E.,Jones S.P.,Lefer D.J.,Peng C.F.,Kitsis R.N.&Molkentin J.D.(2000)The MEK1-ERK1/2 signaling pathway promotes compensated cardiachypertrophy in transgenic mice.EMBO J 19,6341-50.
Burton G.J.&Jauniaux E.(2018)Development of the Human Placenta andFetal Heart:Synergic or Independent?Front Physiol 9,373.
Candel A.,Parmar V.,LeDell E.&Arora A.(2018)Deep Learning with H2O.
Choi M.,Stottmann R.W.,Yang Y.P.,Meyers E.N.&Klingensmith J.(2007)Thebone morphogenetic protein antagonist noggin regulates mammalian cardiacmorphogenesis.Circ Res 100,220-8.
Chong J.,Soufan O.,Li C.,Caraus I.,Li S.,Bourque G.,Wishart D.S.&XiaJ.(2018)MetaboAnalyst 4.0:towards more transparent and integrativemetabolomics analysis.Nucleic Acids Res46,W486-W94.
Czeizel AE,Merhala Z.Bread fortification with folic acid,vitamin B12,and vitamin B6 in Hungary.Lancet 1998;352:1225
Ebrahim M.A.,Williams M.R.,Shepard S.&Perry J.C.(2017)GenotypePositive Long QT Syndrome in Patients With Coexisting Congenital HeartDisease.Am J Cardiol 120,256-61.
England J.&Loughna S.(2013)Heavy and light roles:myosin in themorphogenesis of the heart.Cell Mol Life Sci 70,1221-39.
Ennis I.L.,LiR.A.,Murphy A.M.,Marban E.&Nuss H.B.(2002)Dual genetherapy with SERCA1and Kir2.1 abbreviates excitation without suppressingcontractility.J Clin Invest 109,393-400.
Freedman B.I.,Bowden D.W.,Ziegler J.T.,Langefeld C.D.,Lehtinen A.B.,Rudock M.E.,Lenchik L.,Hruska K.A.,Register T.C.&Carr J.J.(2009)Bonemorphogenetic protein7(BMP7)gene polymorphisms are associated with inverserelationships between vascular calcification and BMD:the Diabetes HeartStudy.JBone Miner Res 24,1719-27.
Gallo S.,Vitacolonna A.,Bonzano A.,Comoglio P.&Crepaldi T.(2019)ERK:AKey Player in the Pathophysiology of Cardiac Hypertrophy.Int J Mol Sci 20.
Gillespie-Brown J.,Fuller S.J.,Bogoyevitch M.A.,Cowley S.&Sugden P.H.(1995)The mitogen-activated protein kinase kinase MEK1 stimulates a patternof gene expression typical of the hypertrophic phenotype in rat ventricularcardiomyocytes.JBiol Chem270,28092-6.
Goldwaser T.&Klugman S.(2018)Cell-free DNA for the detection of fetalaneuploidy.Fertil Steril 109,195-200.
Grace M.R.,Hardisty E.,Dotters-Katz S.K.,Vora N.L.&Kuller J.A.(2016)Cell-Free DNA Screening:Complexities and Challenges of ClinicalImplementation.Obstet Gynecol Surv 71,477-87.
Gupta A.K.,Holzgreve W.,Huppertz B.,Malek A.,Schneider H.&Hahn S.(2004)Detection of fetal DNA and RNA in placenta-derived syncytiotrophoblastmicroparticles generated in vitro.Clin Chem 50,2187-90.
Haddad D.,Socci N.,Chen C.H.,Chen N.G.,Zhang Q.,Carpenter S.G.,MittraA.,Szalay A.A.&Fong Y.(2016)Molecular network,pathway,and functional analysisof time-dependent gene changes associated with pancreatic cancersusceptibility to oncolytic vaccinia virotherapy.Mol Ther Oncolytics3,16008.
Huang J.H.,Xie H.L.,Yan J.,Lu H.M.,Xu Q.S.&Liang Y.Z.(2013)Usingrandom forest to classify T-cell epitopes based on amino acid properties andmolecular features.Anal Chim Acta 804,70-5.
Imanishi T.,Murry C.E.,Reinecke H.,Hano T.,Nishio I.,Liles W.C.,Hofsta L.,Kim K.,O′Brien K.D.,Schwartz S.M.&Han D.K.(2000)Cellular FLIP isexpressed in cardiomyocytes and down-regulated in TUNEL-positive graftedcardiac tissues.Cardiovasc Res 48,101-10.
Ionescu-Ittu R,Marelli AJ,Mackie AS et al.Prevalence of severecongenital heart disease after folic acid fortification of grain products:time trend analysis in Quebec,Canada.BMJ 2009;338:b1673doi:10.1136/bmj.b1673
Itoh N.,Ohta H.,Nakayama Y.&Konishi M.(2016)Roles of FGF Signals inHeart Development,Health,and Disease.Front Cell Dev Biol 4,110.
Karunamuni G,Sheehan MM,Doughman YQ et al.Supplementation with themethyl donor betaine prevents congenital defects induced by prenatal alcoholexposure.Alcohol Clin Exp Res 2017;41:1917-27
Ke W.L.,Zhao W.H.&Wang X.Y.(2015)Detection of fetal cell-free DNA inmaternal plasma for Down syndrome,Edward syndrome and Patau syndrome of highrisk fetus.Int J Clin Exp Med 8,9525-30.
Klasic M.,Kristic J.,Korac P.,Horvat T.,Markulin D.,Vojta A.,ReidingK.R.,Wuhrer M.,Lauc G.&Zoldos V.(2016)DNA hypomethylation upregulatesexpression of the MGAT3 gene in HepG2cells and leads to changes in N-glycosylation of secreted glycoproteins.Sci Rep 6,24363.
Kriaucionis S,Heintz N.The nuclear DNA base 5-hydroxymethylcytosineis present in Purkinje neurons and the brain.Science 2009;324:929-30
Lakhani S.A.,Masud A.,Kuida K.,Porter G.A.,Jr.,Booth C.J.,Mehal W.Z.,Inayat I.&Flavell R.A.(2006)Caspases 3 and 7:key mediators of mitochondrialevents of apoptosis.Science 311,847-51.
Lavine K.J.,YuK.,White A.C.,Zhang X.,Smith C.,Partanen J.&Omitz D.M.(2005)Endocardial and epicardial derived FGF signals regulate myocardialproliferation and differentiation in vivo.Dev Cell 8,85-95.
Lehmann-Werman R,Neiman D,Zemmour H et al.Identification of tissue-specific cell death using methylation patterns of circulating DNA.ProcNatlAcadSci U.S.A.2016:113(13):E1826-34
Liland K.H.(2011)Multivariate methods in metabolomics-from pre-processing to dimension reduction and statistical analysis.TrAC Trends inAnalytical Chemistry 30,827-41.
Liu Y,Balaraman Y,Wang G et al.Alcohol exposure alters DNAmethylation profiles in mouse embryos at early neurulation.Epigenetics 2009;4:500-11
Mahadevan S.,Shah S.L.,Marrie T.J.&Slupsky C.M.(2008)Analysisofmetabolomic data using support vector machines.Anal Chem 80,7562-70.
Mao B,Qui J,Zhao N et al.Maternal folic acid supplementation anddietary folate intake and congenital heart defects.PLoS One 2017 November 16;12:e0187996.doi:10.1371/journal.pone.0187996
Maslen C.L.(2018)Recent Advances in Placenta-Heart Interactions.FrontPhysiol9,735.
McCulley D.J.,Kang J.O.,Martin J.F.&Black B.L.(2008)BMP4 is requiredin the anterior heart field and its derivatives for endocardial cushionremodeling,outflow tract septation,and semilunar valve development.Dev Dyn237,3200-9.
Mutlak M.&Kehat I.(2015)Extracellular signal-regulated kinases 1/2 asregulators of cardiac hypertrophy.FrontPharmacol 6,149.
Nagy B.(2019)Cell-free nucleic acids in prenatal diagnosis andpregnancy-associated diseases.EJIFCC 30,215-23.
Nester CE,Ottaviano R,Reddington J et al.Tissue type is a majormodifier of the 5-hydroxymethylcytosine content of human genes.Genome Res2012;22:467-77
Newton-Cheh C.,Guo C.Y.,Larson M.G.,Musone S.L.,Surti A.,CamargoA.L.,Drake J.A.,Benjamin E.J.,Levy D.,D′Agostino R.B.,Sr.,Hirschhorn J.N.&O′Donnell C J.(2007)Common genetic variation in KCNH2 is associated with QTinterval duration:the Framingham Heart Study.Circulation 116,1128-36.
O′Meara C.C.&Lee R.T.(2015)Peering Into the Cardiomyocyte NuclearEpigenetic State.Circ Res 117,392-4.
Park J.K.,Oh Y.S.,Choi J.H.&Yoon S.K.(2013)Single nucleotide deletionmutation of KCNH2gene is responsible for LQT syndrome in a 3-generationKorean family.JKorean Med Sci 28,1388-93.
Penton A.L.,Leonard L.D.&Spinner N.B.(2012)Notch signaling in humandevelopment and disease.Semin Cell Dev Biol23,450-7.
Peters D.G.,Mitchell H.L.,McCune S.A.,Park S.,Williams J.H.&KandarianS.C.(1997)Skeletal muscle sarcoplasmic reticulum Ca(2+)-ATPase geneexpression in congestive heart failure.Circ Res 81,703-10.
Poirier O.,Nicaud V.,McDonagh T.,Dargie H.J.,Desnos M.,Dorent R.,Roizes G.,Schwartz K.,Tiret L.,Komajda M.&Cambien F.(2003)Polymorphisms ofgenes of the cardiac calcineurin pathway and cardiac hypertrophy.Eur J HumGenet 11,659-64.
Radhakrishna U.,Albayrak S.,Alpay-Savasan Z.,Zeb A.,Turkoglu O.,Sobolewski P.&Bahado-Singh R.O.(2016)Genome-Wide DNA Methylation Analysis andEpigenetic Variations Associated with Congenital Aortic Valve Stenosis(AVS).PLoS One 11,e0154010.
Radhakrishna U.,Albayrak S.,Zafra R.,Baraa A.,Vishweswaraiah S.,Veerappa A.M.,Mahishi D.,Saiyed N.,Mishra N.K.,Guda C.,Ali-Fehmi R.&Bahado-Singh R.O.(2019)Placental epigenetics for evaluation of fetal congenitalheart defects:Ventricular Septal Defect(VSD).PLoS One 14,e0200229.
Radhakrishna U.,Vishweswaraiah S.,Veerappa A.M.,Zafra R.,Albayrak S.,Sitharam P.H.,Saiyed N.M.,Mishra N.K.,Guda C.&Bahado-Singh R.(2018)Newbornblood DNA epigenetic variations and signaling pathway genes associated withTetralogy of Fallot(TOF).PLoS One 13,e0203893.
Rafaeli-Yehudai T.,Imterat M.,Douvdevani A.,Tirosh D.,Benshalom-Tirosh N.,Mastrolia S.A.,Beer-Weisel R.,Klaitman V.,Riff R.,Greenbaum S.,Alioshin A.,Rodavsky Hanegbi G.,Loverro G.,Catalano M.R.&Erez O.(2018)Maternal total cell-free DNA in preeclampsia and fetal growth restriction:Evidence of differences in maternal response to abnormal implantation.PLoSOne 13,e0200360.
Rafi I,Hill M,Hayward Jet al.Non-invasive prenatal testing:use ofcell-free fetal DNA in Down syndrome screening.Br J Gen Pract 2017;67:298-299
Ramakrishnan A.,Lee L.J.,Mitchell L.E.&Agopian A.J.(2015)MaternalHypertension During Pregnancy and the Risk of Congenital Heart Defects inOffspring:A Systematic Review and Meta-analysis.Pediatr Cardiol36,1442-51.
Rangrez A.Y.,Bernt A.,Poyanmehr R.,Harazin V.,Boomgaarden I.,Kuhn C.,Rohrbeck A.,Frank D.&Frey N.(2013)Dysbindin is a potent inducer of RhoA-SRF-mediated cardiomyocyte hypertrophy.J Cell Biol203,643-56.
Razin A.&Kantor B.(2005)DNA methylation in epigenetic control of geneexpression.Prog Mol Subcell Biol38,151-67.
Sheinerman K.S.,Toledo J.B.,Tsivinsky V.G.,Irwin D.,Grossman M.,Weintraub D.,Hurtig H.I.,Chen-Plotkin A.,Wolk D.A.,McCluskey L.F.,Elman L.B.,Trojanowski J.Q.&Umansky S.R.(2017)Circulating brain-enriched microRNAs asnovel biomarkers for detection and differentiation of neurodegenerativediseases.Alzheimers Res Ther 9,89.
Shi S.&Stanley P.(2003)Protein O-fucosyltransferase 1 is an essentialcomponent of Notch signaling pathways.Proc Natl Acad Sci U S A 100,5234-9.
Silverman S.L.,Delmas P.D.,Kulkarni P.M.,Stock J.L.,Wong M.&PlouffeL.,Jr.(2004)Comparison of fracture,cardiovascular event,and breast cancerrates at 3 years in postmenopausal women with osteoporosis.JAm Geriatr Soc52,1543-8.
Singh A.R.,Sivadas A.,Sabharwal A.,Vellarikal S.K.,Jayarajan R.,VermaA.,Kapoor S.,Joshi A.,Scaria V.&Sivasubbu S.(2016)Chamber Specific GeneExpression Landscape of the Zebrafish Heart.PLoS One 11,e0147823.
Song CX,Szulwach KE,Fu Y et al.Selective chemical labeling revealsthe genome-wide distribution of 5-hydroxymethylcytosine.Nat Biotechol2011;29:68-72
Stewart C.M.,Kothari P.D.,Mouliere F.,Mair R.,Somnay S.,Benayed R.,Zehir A.,Weigelt B.,Dawson S.J.,Arcila M.E.,Berger M.F.&Tsui D.W.(2018)Thevalue of cell-free DNA for molecular pathology.JPathol244,616-27.
Taglauer E.S.,Wilkins-Haug L.&Bianchi D.W.(2014)Review:cell-freefetal DNA in the maternal circulation as an indication of placental healthand disease.Placenta 35 Suppl,S64-8.
Tahiliani M,Koh KP,Shen Y et al.Conversion of 5-methylcytosine to 5-hydroxymethylcytosine in mammalian DNA by MLL partner TET1.Science 2009;324:930-5
Takayanagi T.,Forrester S.J.,Kawai T.,Obama T.,Tsuji T.,Elliott K.J.,Nuti E.,Rossello A.,Kwok H.F.,Scalia R.,Rizzo V.&Eguchi S.(2016)VascularADAM17 as a Novel Therapeutic Target in Mediating Cardiovascular Hypertrophyand Perivascular Fibrosis Induced by Angiotensin II.Hypertension 68,949-55.
Tan CH,Denny CH,Cheal NE et al.Alcohol use and binge drinking amongwomen of childbearing age-United States,2011-2013.MMWR Morb Mortal Wkly Rep2015;64:1042-6
Tjoa M.L.,Cindrova-Davies T.,Spasic-Boskovic O.,Bianchi D.W.&BurtonG.J.(2006)Trophoblastic oxidative stress and the release of cell-free feto-placental DNA.Am JPathol 169,400-4.
Vallaster M.,Vallaster C.D.&Wu S.M.(2012)Epigenetic mechanisms incardiac development and disease.Acta Biochim Biophys Sin(Shanghai)44,92-102.
van Gelder M.M.,Van Bennekom C.M.,Louik C.,Werler M.M.,Roeleveld N.&Mitchell A.A.(2015)Maternal hypertensive disorders,antihypertensivemedication use,and the risk of birth defects:a case-control study.BJOG 122,1002-9.
von Oettingen J.E.,Tan W.H.&Dauber A.(2014)Skeletal dysplasia,globaldevelopmental delay,and multiple congenital anomalies in a 5-year-old boy-report of the second family with B3GAT3mutation and expansion of thephenotype.Am J Med Genet A 164A,1580-6.
Wang X.,Oka T.,Chow F.L.,Cooper S.B.,Odenbach J.,Lopaschuk G.D.,Kassiri Z.&Fernandez-Patron C.(2009)Tumor necrosis factor-alpha-convertingenzyme is a key regulator of agonist-induced cardiac hypertrophy andfibrosis.Hypertension 54,575-82.
Wataganara T.,Gratacos E.,Jani J.,Becker J.,Lewi L.,Sullivan L.M.,Bianchi D.W.&Deprest J.A.(2005)Persistent elevation of cell-free fetal DNAlevels in maternal plasma after selective laser coagulation of chorionicplate anastomoses in severe midgestational twin-twin transfusion syndrome.AmJ Obstet Gynecol192,604-9.
Ye J.,Llorian M.,Cardona M.,Rongvaux A.,Moubarak R.S.,Comella J.X.,Bassel-Duby R.,Flavell R.A.,Olson E.N.,Smith C.W.&Sanchis D.(2013)A pathwayinvolving HDAC5,cFLIP and caspases regulates expression of the splicingregulator polypyrimidine tract binding protein in the heart.J Cell Sci 126,1682-91.
Yeh W.C.,Itie A.,Elia A.J.,Ng M.,Shu H.B.,Wakeham A.,Mirtsos C.,Suzuki N.,Bonnard M.,Goeddel D.V.&Mak T.W.(2000)Requirement for Casper(c-FLIP)in regulation of death receptor-induced apoptosis and embryonicdevelopment.Immunity 12,633-42.
Zeisel SH,da Costa KA.Choline:an essential nutrient for publichealth.Nut Rev 2009;67:615-23
Zheng D.Y.,Zhao J.,Yang J.M.,Wang M.&Zhang X.T.(2016)Enhanced ADAM17expression is associated with cardiac remodeling in rats with acutemyocardial infarction.Life Sci 151,61-9.
Zolotukhina T.V.,Shilova N.V.&Voskoboeva E.Y.(2005)Analysis of cell-free fetal DNA in plasma and serum ofpreguant women.JHistochem Cytochem 53,297-9.

Claims (18)

1.一种预测或诊断有需要的受试者中的先天性心脏缺陷(CHD)的方法,其中,所述方法包括:
测定从所述受试者获得的、包含游离(cf)核酸的生物样本,以确定整个基因组中一个或多个位点处的胞嘧啶甲基化的频率或百分比;以及
将所述样本的胞嘧啶甲基化水平与对照样本的胞嘧啶甲基化进行比较。
2.根据权利要求1所述的方法,其中,所述方法还包括使用人工智能(AI)技术。
3.根据权利要求1或2所述的方法,其中,所述方法还包括使用包括以下机器学习算法中的一种或多种的人工智能(AI)技术:随机森林(RF)、支持向量机(SVM)、线性判别分析(LDA)、微阵列分析预测(PAM)、广义线性模型(GLM)或深度学习(DL)。
4.根据权利要求1至3中任一项所述的方法,其中,所述方法还包括:计算所述受试者发展CHD的风险。
5.根据权利要求1至4中任一项所述的方法,其中,所述对照样本来自一个或多个正常(健康)患者或来自一个或多个被诊断患有CHD的患者。
6.根据权利要求1至5中任一项所述的方法,其中,所述生物样本包含体液。
7.根据权利要求1至6中任一项所述的方法,其中,所述生物样本包括血液、血浆、血清、尿液、唾液、痰液、汗液、泪液、包括宫颈分泌物的生殖器分泌物、羊水、胎盘组织和在出生时获得的脐带血。
8.根据权利要求1至7中任一项所述的方法,其中,所述cf核酸包含胎儿游离(cfF)核酸。
9.根据权利要求1至8中任一项所述的方法,其中,所述生物样本包含来自妊娠早期、妊娠中期或妊娠晚期的cfF核酸。
10.根据权利要求1至9中任一项所述的方法,其中,所述cf核酸包含DNA。
11.根据权利要求1至10中任一项所述的方法,其中,所述一个或多个位点包含来自表1至表6的一个或多个位点。
12.根据权利要求1至11中任一项所述的方法,其中,所述一个或多个位点包含来自表1至表6的至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、至少10个位点。
13.根据权利要求1至12中任一项所述的方法,其中,所述一个或多个位点包含大于0.70、0.75、0.80、0.85、0.90、0.91、0.92、0.93、0.94、0.95、0.96或0.97的AUC(具有95%CI)。
14.根据权利要求1至13中任一项所述的方法,其中,所述测定是基于重亚硫酸盐的甲基化测定或全基因组甲基化测定。
15.根据权利要求1至14中任一项所述的方法,其中,所述一个或多个位点包含cg06301252、cg02807450或cg12900404。
16.根据权利要求1至14中任一项所述的方法,其中,所述一个或多个位点包括cg04761177、cg21431091、cg01263077、cg09853933、cg27142059、cg16551159、cg14957943、cg06978680或cg12592721。
17.根据权利要求1至16中任一项所述的方法,其中,所述方法还包括治疗所述CHD。
18.根据权利要求1至17中任一项所述的方法,其中,所述方法还包括通过对所述受试者施用药物和/或进行手术来治疗所述受试者。
CN202080094653.4A 2019-11-27 2020-11-25 检测先天性心脏缺陷 Pending CN115176320A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962941357P 2019-11-27 2019-11-27
US62/941,357 2019-11-27
PCT/US2020/062194 WO2021108525A1 (en) 2019-11-27 2020-11-25 Detecting congenital heart defects

Publications (1)

Publication Number Publication Date
CN115176320A true CN115176320A (zh) 2022-10-11

Family

ID=76129708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080094653.4A Pending CN115176320A (zh) 2019-11-27 2020-11-25 检测先天性心脏缺陷

Country Status (4)

Country Link
US (1) US20230002806A1 (zh)
EP (1) EP4065726A4 (zh)
CN (1) CN115176320A (zh)
WO (1) WO2021108525A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117031042A (zh) * 2023-09-05 2023-11-10 上海爱谱蒂康生物科技有限公司 用于筛查诊断先天性心脏病胎儿的生物标志物及其应用
CN117031042B (zh) * 2023-09-05 2024-05-31 上海爱谱蒂康生物科技有限公司 用于筛查诊断先天性心脏病胎儿的生物标志物及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3074538A4 (en) * 2013-11-27 2017-11-22 William Beaumont Hospital Method for predicting congenital heart defect
US11512306B2 (en) * 2016-10-19 2022-11-29 The Chinese University Of Hong Kong Gestational age assessment by methylation and size profiling of maternal plasma DNA

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117031042A (zh) * 2023-09-05 2023-11-10 上海爱谱蒂康生物科技有限公司 用于筛查诊断先天性心脏病胎儿的生物标志物及其应用
CN117031042B (zh) * 2023-09-05 2024-05-31 上海爱谱蒂康生物科技有限公司 用于筛查诊断先天性心脏病胎儿的生物标志物及其应用

Also Published As

Publication number Publication date
EP4065726A4 (en) 2024-04-03
EP4065726A1 (en) 2022-10-05
US20230002806A1 (en) 2023-01-05
WO2021108525A1 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
CN106661609B (zh) 用于预测先天性心脏缺陷的方法
JP6317354B2 (ja) 血漿による胎児または腫瘍のメチロームの非侵襲的決定
US20180218117A1 (en) Methods for assessing risk of female infertility
WO2014071279A2 (en) Gene fusions and alternatively spliced junctions associated with breast cancer
KR20100058421A (ko) 신규 발병 심부전증에 대한 개별 위험 평가용 전사체 바이오마커
Zhang et al. Characterization of the transcriptional complexity of the receptive and pre-receptive endometria of dairy goats
WO2018072705A1 (en) Gestational age assessment by methylation and size profiling of maternal plasma dna
Kim et al. Genome-wide analysis of DNA methylation in human amnion
US20140171337A1 (en) Methods and devices for assessing risk of female infertility
JP2019522997A (ja) 心臓発達遺伝子のパターン形成及び心不全に関する新規種類のバイオマーカーを同定するエピゲノムワイドな関連研究
CN110785499A (zh) 对先兆子痫具有特异性的循环rna标识
WO2021159722A1 (zh) 一种预测胎盘源性疾病的评估和预测的方法和试剂盒
US20220010353A1 (en) Nuclease-associated end signature analysis for cell-free nucleic acids
Makita et al. Methylenetetrahydrofolate reductase gene polymorphism and susceptibility to diabetic nephropathy in type 1 diabetes
CN115176320A (zh) 检测先天性心脏缺陷
KR102085663B1 (ko) Wrb 유전자의 메틸화 수준을 이용한 소혈관폐색증의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
KR102085667B1 (ko) Gpr160 유전자의 메틸화 수준을 이용한 소혈관폐색증의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
JP2023501760A (ja) 子癇前症に特異的な循環rnaシグネチャー
WO2022015998A1 (en) Gene panels and methods of use thereof for screening and diagnosis of congenital heart defects and diseases
KR102421788B1 (ko) Cuedc2 유전자의 메틸화 수준을 이용한 소혈관폐색증의 예측 또는 진단을 위한 정보제공방법 및 이를 위한 조성물
US20240182982A1 (en) Fragmentomics in urine and plasma
WO2024114678A1 (en) Fragmentomics in urine and plasma
KR102342523B1 (ko) 고혈압 또는 비만의 예측 또는 진단용 조성물
Manheimer Investigating the genetic architecture of congenital heart disease
Li et al. Genomic and RNA-Seq profiling of patients with HFrEF unraveled OAS1 mutation and aggressive expression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination