CN104619858A - 胎儿健康状态的无创性检测 - Google Patents

胎儿健康状态的无创性检测 Download PDF

Info

Publication number
CN104619858A
CN104619858A CN201280075090.XA CN201280075090A CN104619858A CN 104619858 A CN104619858 A CN 104619858A CN 201280075090 A CN201280075090 A CN 201280075090A CN 104619858 A CN104619858 A CN 104619858A
Authority
CN
China
Prior art keywords
fetus
methods according
virus
health
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280075090.XA
Other languages
English (en)
Other versions
CN104619858B (zh
Inventor
王威
李英睿
徐煜
刘萍
孙广青
曾玺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201280075090.XA priority Critical patent/CN104619858B/zh
Publication of CN104619858A publication Critical patent/CN104619858A/zh
Application granted granted Critical
Publication of CN104619858B publication Critical patent/CN104619858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Pathology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种从如病毒、细菌、真菌和寄生虫的外源性生物体鉴定胎儿健康状态的生物标志物的方法,及其用于无创性确定胎儿健康状态的用途。此外本发明还公开了用于所述方法的系统和试剂盒。

Description

胎儿健康状态的无创性检测
交叉参考相关申请
本发明要求2012年7月31日为申请日,中国专利申请号为201210271283.4,发明名称为“用于确定胎儿健康状态的方法”的权益,该申请的全部内容为了所有目的通过引用的方式并入本文。
技术领域
本发明涉及用于确定胎儿的健康状态的无创性方法。具体地,本发明涉及通过在来自怀孕女性的生物样本中评估与外源性生物体相关的生物标志物而用于检测胎儿健康状态的方法。
背景技术
具有侵入性程序的常规产前诊断方法,如绒毛膜绒毛取样和羊膜穿刺术,对胎儿和母亲均具有潜在风险。可以采用孕妇血清标志物和超声波对胎儿非整倍性进行无创性筛查,但其具有有限的灵敏度和特异性。Kagan等,Human Reproduction(2008)23:1968–1975;Malone等,N Engl J Med(2005)353:2001–2011。
随着DNA测序技术的发展,无创性检测技术已经被广泛应用于某些疾病的临床诊断,从而提供一种新的并且有效的方法。无细胞胎儿DNA可以在孕妇外周血中被检测到。Lo等,Lancet 350:485487(1997);Lo等,Am.J.hum.Genet.62:768-775(1998)。尽管胎儿DNA的量在孕妇外周血中是低的,新一代的测序技术应经被成功地应用于检测针对胎儿疾病诊断的基因异常。
病毒、细菌、寄生虫、真菌和其他病原体感染怀孕女性后可以对胎儿产生不良后果,如流产、死产、和出生缺陷。冯&沈,妇产科学,(人民卫生出版社,150-154页)。怀孕期间一些常见的临床病原体感染为:HBV、HCV、HIV、TORCH(弓形虫、风疹病毒、巨细胞病毒、和单纯疱疹病毒)、梅毒。
目前,医院里常用的用于检测HBV、HCV、HIV、TORCH、和梅毒的方法主要是通过利用基于酶联免疫吸附(ELISA)的方法检测怀孕女性的外周血中针对所述病原体的抗体而进行评估的,从而间接反映所述怀孕女性的感染状态。这些方法对检测胎儿感染一般是无效的。所述方法的一些局限性为:1)只有少数已知的病原体可以被检测到;2)每一个病原体需要相应的抗体检测试剂;3)所需要的血液量随着所需检测的病原体的数量而增加;4)这些方法非常耗时;以及5)这些方法不利于批量测试。
基于酶联免疫吸附(ELISA)的方法最致命的缺陷在于其并不适合胎儿感染的判断。例如,TORCH检测主要是通过以下而确定的:首先利用基于ELISA的方法评估孕妇外周血中IgM和IgG,随后确定所述怀孕女性的感染状态并推断对所述胎儿的可能影响。确定胎儿感染有时需要进一步的测试,如针对IgM检测的羊膜穿刺或胎儿核苷酸的PCR以确定所述胎儿是否被所述病原体所感染。然而,羊膜穿刺具有1%的流产风险,这是得其很难被怀孕女性及其家庭成员所接受。由于IgM和IgG间接反映了机体的感染状态,并且其抗体只是在一定时间段内产生于所述病原体,因此存在假阴性率。此外,由于不同的医院使用不同的检测试剂盒,并且缺少统一的质量控制标准,来自不同医院的测试结果可能并不一致。测试结果中的不一致降低了患者对于该检测的信任度和接受度,这使得医院不愿对怀孕妇女使用基于ELISA的TORCH筛查方法。
尽管最灵敏的直接检测病原体存在的方法时病原体培养,但其非常耗时并具有较高的失败率。因此,还没有看到病原体培养的大规模临床应用。
发明内容
本发明提供了用于胎儿健康状态的无创性检测方法,包含:在来自怀孕女性的生物样本中,评估至少一个来自外源性生物体的多核苷酸、多肽和/或小分子。
因此,在一方面,本发明提供了一种用于确定胎儿的健康状态的方法,所述方法包含:a)在来自怀孕女性的生物样本中,评估至少一个来自外源性生物体的多核苷酸、多肽和/或小分子的同一性和/或水平;b)分析所述外源性多核苷酸、多肽和/或小分子的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态,其中所述胎儿的所述健康状态为无HBV感染。在一些实施方案中,一些胎儿的的健康状况并非是外界生物的感染。在一些实施方案中,所述小分子可以与宿主代谢相关。
在一个实施方案中,所述胎儿是人类胎儿。在另一个实施方案中,所述分析是采用至少1个正常对照进行的。在另一个实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在另一个实施方案中,所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。在另一个实施方案中,所述健康状态为选自由以下所组成的组:基因异常、和发育异常。在一些实施方案中,所述生物样本是从至少2、5、10、20、50、100、200、500或1000个怀孕女性获得的。
在一个实施方案中,所述基因异常为胎儿非整倍性。在另一个实施方案中,所述胎儿非整倍性为选自由13三体性、18三体性和21三体性所组成的组的常染色体异常。在一些实施例中,所述胎儿非整倍性为选自由XO、XXX、XXY和XYY所组成的组的性染色体异常。
在第二方面,本发明提供了一种用于鉴定胎儿的健康状态的生物标志物的方法,所述方法包含:a)在来自至少一个怀孕女性的生物样本中,评估来自外源性生物体的多核苷酸、多肽和/或小分子的同一性和/或水平;b)对所述外源性多核苷酸、多肽和/或小分子的所述的同一性和/或水平进行统计学分析;以及c)如果统计学显著相关性建立,则鉴定所述非人类的多核苷酸、多肽或小分子作为针对所述健康状态的生物标志物,其中,所述胎儿的所述健康状态为无HBV感染,或所述生物样本是从至少100个怀孕女性获得的。在一些实施方案中,所述胎儿的所述健康状态为无所述外源性生物体感染。在一些实施方案中,所述小分子可以与宿主代谢相关。
在一些实施方案中,所述胎儿是人类胎儿。在一些实施方案中,所述统计分析是采用至少1个正常对照进行的。在另一个实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在另一个实施方案中,所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。在另一个实施方案中,述健康状态为选自由以下所组成的组:基因异常、和发育异常。
在一个实施方案中,所述基因异常为胎儿非整倍性。在另一个实施方案中,所述胎儿非整倍性为选自由13三体性、18三体性和21三体性所组成的组的常染色体异常。在一些实施方案中,所述胎儿非整倍性为选自由XO、XXX、XXY和XYY所组成的组的性染色体异常。
在一些实施方案中,所述生物标志物为选自由以下所组成的组:小地老虎核型多角体病毒(Agrotis ipsilon multiple nucleopolyhedrovirus)、假单胞杆菌噬菌体F10(Pseudomonas phage F10)、鼻疽噬菌体Bcep22(Burkholderia phage Bcep22)、脑心肌炎病毒(Encephalomyocarditis virus)、丙型肝炎病毒基因型1(Hepatitis C virusgenotype 1)、肠杆菌噬菌体M13(Enterobacteria phage M13)、人类1型疱疹病毒(Humanherpesvirus 1)、人类7型疱疹病毒(Human herpesvirus 7)、鲤疱疹病毒3(Cyprinidherpesvirus)、葡萄球菌噬菌体37(Staphylococcus phage 37)、西枞色卷蛾颗粒体病毒(Choristoneura occidentalis granulovirus)、棉铃虫裸病毒2(Helicoverpa zea nudivirus2)、和肠杆菌噬菌体Sf6。
在一些实施方案中,所述生物样本是从至少2、5、10、20、50、100、200、500或1000个怀孕女性获得的。
在第三方面,本发明提供了一种用于确定胎儿的健康状态的方法,所述方法包含:a)评估利用本发明所公开的方法在来自怀孕女性的生物样本中所鉴定出的至少一个生物标志物的同一性和/或水平;b)分析所述生物标志物的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态。
在一些实施方案中,所述胎儿是人类胎儿。在一些实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在一些实施方案中,所述生物标志物为多核苷酸。在一些实施方案中,步骤a)包含对来自所述生物样本的无细胞DNA进行纯化。在一些实施方案中,对所述DNA进行扩增。在一些实施方案中,对所述DNA建立文库。在一些实施方案中,对所述DNA进行测序。在一些实施方案中,采用高通量测序对所述DNA进行测序。在一些实施方案中,步骤b)包含:将从步骤a)获得的所述序列与所述生物标志物的序列进行比较。在一些实施方案中,在步骤b)之前,从步骤a)获得的所述序列中去除与人类基因组序列相匹配的序列。
在第四方面,本发明提供了一组用于确定人类胎儿的21三体性的生物标志物,其包含多个选自由以下所组成的组的生物体:切根虫核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2、肠杆菌噬菌体Sf6。
在第五方面,本发明提供了一种用于确定胎儿的健康状态的方法,所述方法包含:a)在来自怀孕女性的生物样本中,通过测序多核苷酸来评估来自外源性生物体的至少一个生物标志物的同一性和/或水平;b)分析所述至少一个生物标志物的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态。在一些实施方案中,所述方法采用高通量测序。
在一些实施方案中,所述胎儿为人类胎儿。在一些实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在一些实施方案中,步骤a)包含对来自所述生物样本的无细胞DNA进行纯化。在一些实施方案中,对所述DNA进行扩增。在一些实施方案中,对所述DNA建立文库。在一些实施方案中,步骤b)包含将从步骤a)获得的所述序列与所述生物标志物进行比较。在一些实施方案中,在步骤b)之前,从步骤a)获得的所述序列中去除与人类基因组序列相匹配的序列。在一些实施方案中,所述外源性生物体为选自由以下所组成的组:HBV、HCV、HIV、TORCH(弓形虫、风疹病毒、巨细胞病毒、和单纯疱疹病毒)、和梅毒。
在第六方面,本发明提供了一种用于确定胎儿的健康状态的系统,所述系统包含:a)用于在来自怀孕女性的生物样本中评估至少一个来自外源性生物体的多核苷酸、多肽和/或小分子的同一性和/或水平的手段;以及b)用于分析所述外源性多核苷酸、多肽和/或小分子的同一性和/或水平的手段。在一些实施方案中,所述胎儿的所述健康状态为无HBV感染。在一些实施方案中,所述小分子可以与宿主代谢相关。在一些实施方案中,用于评估至少一种多核苷酸、多肽和/或小分子的所述同一性和/或水平的手段可以为测序装置。在一些实施方案中,用于分析所述外源性多核苷酸、多肽和/或小分子的所述同一性和/或水平的手段可以为计算机。
在第六方面,本发明提供了一种用于确定胎儿的健康状态的试剂盒包含:a)本发明所提供的生物标志物;以及b)如何使用所述生物标志物的说明书。
附图说明
图1显示了用于鉴定针对胎儿健康状态的生物标志物的示例性过程。
具体实施方式
I、定义
除非另有定义,否则本文使用的所有技术术语和科学术语具有本发明所属领域的普通技术人员通常理解相同的含义。本文所参考的所有专利、专利申请、公布的专利申请和其他公开出版物都通过引用的方式全文纳入本文。如果此部分中陈述的定义与通过引用纳入本文的所述专利、专利申请、公布的专利申请和其他公开出版物中陈述的定义相反或在某些方面不一致,此部分中列出的定义优先于通过引用纳入本文中的定义。
除非另有指明,否则本文使用的单数形式“一(an)”、“一(a)”、和“所述(the)”包含复数的指代物。例如,“一”二聚物包含一个或多个二聚物。
本文所使用的术语“生物标志物”或“标志物”通常指分子,其包含基因、蛋白质、碳水化合物结构、糖酯,或小分子,其在哺乳动物组织或细胞的表达或所分泌,可以通过已知的方法(或本文所公开的方法)被检测到,并且具有预测性或可以用于预测(或辅助预测)胎儿的健康状态。
术语“染色体异常”是指受试者染色体和正常同源染色体的结构之间的偏差。术语“正常”是指特定物种健康个体中出现的占主导地位的核型或带型。染色体异常可以是数目的或结构的,并且包含但不限于非整倍性、多倍性、倒位、三体性、单体性、重复、缺失、部分染色体缺失、增加、部分染色体增加、插入、染色体片段、染色体区、染色体重排和易位。染色体异常可能与存在病理状态或者与倾向于发生病理状态相关。本文定义的单核苷酸多态性(“SNP”)不是染色体异常。
单体性X(XO,缺失整条X染色体)是Turner综合征的最常见类型,在每2500至3000个新生女婴中出现1例(Sybert and McCauley N Engl J Med(2004)351:1227-1238)。XXY综合征是人类男性具有一条额外X染色体的状态,在每1000名男性中大约出现1例(Bock,Understanding Klinefelter Syndrome:A Guide for XXY Males andTheir Families.NIH Pub.No.93-3202(1993))。XYY综合征是人类男性具有额外一条Y染色体的性染色体非整倍性,共有47条染色体,而不是正常的46条,在1000个出生男性中有1例受到影响,并可能导致男性不育(Aksglaede等,J Clin Endocrinol Metab(2008)93:169-176)。
Turner综合征包含几种状态,其中单体性X(XO,缺少整条性染色体,巴氏小体)最常见。女性通常具有两条X染色体,但Turner综合征中,这些性染色体中的一条缺失。在2000至5000表型女性中出现1例,该综合征自身以多种方式显现。Klinefelter综合征是人类男性具有额外一条X染色体的状态。在人类中,Klinefelter综合征是最常见的性染色体病症,并且是由存在额外染色体引起的第二常见状态。该状态在每1000名男性中出现大约1例。XYY综合征是人类男性具有一条额外Y染色体的性染色体非整倍性,共有47条染色体,而不是正常的46条。这产生了47、XYY核型。该状态通常无症状,并且1000个出生男性中有1例受到影响,这有可能导致男性不育。
13三体性(Patau综合征)、18三体性(Edward综合征)和21三体性(Down综合征)是临床上最重要的常染色体三体性,而如何检测它们一直是热点。检测以上胎儿染色体畸变在产前诊断中具有重大意义(Ostler,Diseases of the eye and skin:a color atlas。Lippincott Williams&Wilkins.pp.72.ISBN 9780781749992(2004);Driscoll and GrossN Engl J Med(2009)360:2556-2562;Kagan等,Human Reproduction(2008)23:1968-1975)。
术语“参考独特读段”是指具有独特序列的染色体片段。因此,这类片段可以被明确地分配至单染色体位置。染色体的参考独特读段可以基于发布的基因组参考序列例如hg18或hg19进行构建。
术语“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”在本文中可互换使用,是指任意长度核苷酸的聚合体形式,并且可以包含核糖核苷酸、脱氧核糖核苷酸、其类似物或其混合物。该术语仅是指所述分子的一级结构。因此,所述术语包含三链、双链和单链脱氧核糖核酸(“DNA”)以及三链、双链和单链核糖核酸(“RNA”)。它还包含修饰形式的(例如通过烷基化和/或通过加帽)多核苷酸和非修饰形式的多核苷酸。更具体地,术语“多核苷酸”、“寡核苷酸”、“核酸”和“核酸分子”包含多脱氧核糖核苷酸(含2-脱氧-D-核糖)、多核糖核苷酸(含D-核糖),包含tRNA、rRNA、hRNA和剪接或未剪接的mRNA,嘌呤或嘧啶碱基的N-糖苷或C-糖苷的任何其他类型多核苷酸,以及含非核苷酸(normucleotidic)骨架的其他多聚体,例如聚酰胺(例如核酸肽(“PNA”))和多吗啉代(可市购自Anti-Virals,Inc.,Corvallis,OR.,例如)多聚体和其他合成的特异性序列的核酸多聚体,其以多聚体包含允许碱基配对和碱基堆积的构型的核碱基为条件,例如见于DNA和RNA中。因此,这些术语包含例如3'-脱氧-2',5'-DNA、寡脱氧核糖核苷酸N3'-P5'磷酰胺酯、2'-O-烷基-取代的RNA、DNA与RNA之间或者PNAs与DNA或RNA之间的杂交体,还包含已知类型的修饰物,例如标记物、烷基化物、“帽”、以类似物取代一个或多个核苷酸置换为、核苷酸间修饰物(例如具有不带荷电连接物的那些(例如甲基磷酸酯、磷酸三酯、磷酰胺酯、氨基甲酸酯等)、具有荷负电连接物的那些(例如磷硫酰、二硫代磷酸酯等)和具有荷正电连接物的那些(例如氨烷基磷酰胺酯、氨烷基磷酸三酯),包含悬垂部分例如蛋白质(包含酶(例如核酸酶)、毒素、抗体、信号肽、聚左旋赖氨酸等)的那些,具有嵌入剂(例如吖啶、补骨脂素等)的那些,包含螯合物(例如金属、放射性金属、硼、金属氧化物等)的那些,包含烷基化物的那些,具有修饰的连接物的那些(例如α异头核酸);以及未修饰形式的所述多核苷酸或寡核苷酸。
如本文所使用的,上下文中两种蛋白质序列(或核苷酸序列)的“序列同一性”或“同一性”或“同源性”包含参照所述两个序列中的残基,它们在特定比对窗口中被最大对应比对时是相同的。在所述比对窗口中的部所述分氨基酸序列或核苷酸序列与所述参考序列进行2个序列的最优比对时,可以包含增加或缺失(即,缺口)。当序列同一性的百分比被用于蛋白质的参考时,不同的残基位置通常被认为通过保守氨基酸取代而不同,其中氨基酸被具有相似化学性质(如,电荷或疏水性)的其他氨基酸残基所取代并因此所述分子的功能性质并没有被改变。当序列的保守取代不同时,所述序列同一性的百分比可被上调以便针对所述取代的所述保守性质进行调整。通过这种保守性取代而改变的序列被称为具有“序列相似性”或“相似性”。本领域技术人员熟知进行这些校正的手段。通过确定位置数计算比例,其中在所述的位置上相同的氨基酸或核酸碱基残基出现在2个序列中以产生匹配的位置数,所述匹配的位置数被所述比较窗口中的总位置数除且结果乘100以产生序列同一性百分比。代表性地,这包含评价保守性取代作为部分而不是全部的错配,因此增加所述序列同一性的百分比。因而,例如,如果同一种氨基酸获得1分而非保守性取代获得零分,则保守性取代得分为0到1之间。计算所述保守性取代的得分,例如,依据Meyers和Miller的算法(Computer Applic.Biol.Sci.,1998,4,11-17)。
如本文所使用的,术语“同源物”被用于指通过对天然存在核酸微小修改与所述天然存在核酸(如,“原型”或“野生型”核酸)不同的核酸,然而维持所述天然存在形式的所述基本核苷酸结构。这种变化包含,但不局限于:在一个或一些核苷酸中的变化,包含缺失(例如,所述核酸的截短版本)插入和/或取代。同源物可以具有与所述天然存在的核酸相比增强的、降低的,或基本上相似的性质。同源物可以与所述天然存在的核酸互补或相匹配。可以使用本领域已知的技术生产同源物以产生核酸,包含但不限于,重组DNA技术,化学合成,等。
如本文所使用的,术语“互补或相匹配”意味着两条核酸序列具有至少50%的序列同一性。优选地,所述两条核酸序列具有至少60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的序列同一性。“互补或相匹配”还意味着两条核酸序列能在低、中和/高严谨条件下进行杂交。
如本文所使用的,术语“基本上互补或基本上匹配”意味着两条核酸序列具有至少90%的序列同一性。优选地,所述两条核酸序列具有至少95%、96%、97%、98%、99%或100%的序列同一性。可选地,“基本上互补或基本上匹配”意味着两条核酸序列能在高严谨条件下进行杂交。
通常的,所述杂交的稳定性为离子浓度的功能和温度。典型地,杂交反应是先在低严谨的条件下进行的,然后在高严谨条件下去除变异。中等严谨的杂交是指允许如探针的核酸分子与互补核酸分子相结合的条件。所述经过杂交的核酸分子通常具有至少60%的同一性,包含例如至少70%、75%、80%、85%、90%或95%任一的同一性。中等严谨条件为等同于在42摄氏度下50%甲酰胺、5x Denhardt氏溶液、5x SSPE、0.2%SDS中进行杂交,然后在42摄氏度下0.2x SSPE和0.2%SDS中进行清洗的条件。例如,可以通过在42摄氏度下50%甲酰胺、5x Denhardt氏溶液、5x SSPE、0.2%SDS中进行杂交,然后在65摄氏度下0.1x SSPE和0.1%SDS中进行清洗来提供高严谨条件。
低严谨条件是指在22摄氏度下10%甲酰胺、5x Denhardt氏溶液、6x SSPE、0.2%SDS中进行杂交,然后在37摄氏度下1x SSPE和0.2%SDS中进行清洗的条件。Denhardt氏溶液包含1%Ficoll、1%聚乙烯吡咯烷酮(polyvinylpyrolidone)、和1%牛血清白蛋白(BSA)。20x SSPE(氯化钠、磷酸钠、乙二胺四乙酸(EDTA))含有3M氯化钠、0.2M磷酸钠、和0.025M乙二胺四乙酸(EDTA)。其他适当的中等严谨和高严谨杂交缓冲液和条件为本领域技术人员所熟知。
如本文所使用的,高通量筛选(HTS)是指对大量样本进行检测的过程,例如针对疾病靶标不同化学结构的样本以鉴定“hits”(see,e.g.,Broach,等,High throughput screeningfor drug discovery,Nature,384:14-16(1996);Janzen,等,High throughput screening asa discovery tool in the pharmaceutical industry,Lab Robotics Automation 8261-265(1996);Fernandes,P.B.,Letter from the society president,J.Biomol.Screening 2:1(1997);Burbaum等,New technologies for high-throughput screening,Curr.Opin.Chem.Biol.1:72-78(1997))。HTS操作是高自动化和计算机化的,从而处理样本准备、检测程序和所述后续的大数据量的处理。
对本领域技术人员来说显而易见的是,可以使用若干不同的测序方法和变型。在一个实施例中,所述测序是使用大规模平行测序进行的。“大规模平行测序”是指用于测序数以百万计的核酸片段的技术,例如将随机片段化的基因组DNA的附着至平面的、光学透明表面上并固相扩增以形成具有百万计的簇的高密度测序流动槽(flow cell),各包含大约1,000个模板拷贝/平方厘米。这些模板采用四色DNA合成测序技术(Four-color DNAsequencing-by-synthesis technology)进行测序。大规模平行测序,例如可在454平台(Roche)(Margulies等,Nature(2005)437:376-380)、Illumina Genome Analyzer(或SolexaTM平台)或SOLiD System(Applied Biosystems)上或采用Helicos True SingleMolecule DNA测序技术(Harris等,Science(2008)320:106-109)、单分子、PacificBiosciences的实时(SMRTTM)技术和纳米孔测序技术(Soni and Meller,Clin Chem(2007)53:1996-2001)实现的那些,允许以平行的方式以高次多路对从样本分离的许多核酸分子进行测序(Dear,Brief Funct Genomic Proteomic(2003)1:397-416)。这些平台各自均可测序克隆扩增的或者甚至未扩增的核酸片段单分子。市售可得的测序设备可以用于获得所述多核苷酸片段的所述序列信息。本发明使用的测序优选在无预扩增或克隆步骤的情况下进行,但可以与基于扩增的方法相结合,该方法在微流芯片具有可以用于PCR和基于显微模板测序的反应室。仅需要约30bp的随机序列信息需要被鉴定属于特定人类的染色体序列。更长序列可以唯一地鉴定更具体的目标。在本例中,获得了大量的35bp读段。对大规模平行测序方法的进一步描述见Rogers和Ventner,Nature(2005)437:326-327。
本文中术语“多肽”、“寡肽”、“肽”和“蛋白”可以互换使用,指的是任何长度氨基酸的聚合物,例如,至少5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1000个以上的氨基酸。所述聚合物可以是线性或支链的,可以包含经过修饰的氨基酸,并且其可以被插入非氨基酸。该术语还包含经天然修饰的或通过介入修饰的氨基酸聚合物,例如,形成二硫键、糖基化、脂化、乙酰化、磷酸化、或任何其他处理或修饰,如与标签元件结合。所述定义还包含,例如,含有一个以上氨基酸(包含,例如,非自然氨基酸,等)的类似物的多肽,以及其他本领域已知的修饰。
“抗体”是通过位于免疫球蛋白分子的可变区中的至少一个抗原识别位点而能够与靶特异性结合的免疫球蛋白分子,所述靶例如糖、多核苷酸、脂质、多肽等,并且所述可以包含任何类型的抗体,例如IgG、IgM、IgA、IgD和IgE.。IgY,鸟类(如鸡)中的主要抗体类型,也包含所述定义中。如本文所使用的,该术语不仅包含完整的多克隆或单克隆抗体,还包含其片段(例如Fab、Fab’、F(ab’)2、Fv)、单链(ScFv)、其突变体、天然存在的变异型、包含具有所需特异性的抗原识别位点的抗体部分的融合蛋白、人源化抗体、嵌合抗体、以及包含具有所需特异性的抗原识别位点的免疫球蛋白分子的任何其他经修饰的构型。
如本文所使用的,术语“特异性结合”是指结合对的结合特异性。在其他潜在的靶的粗在下被特别的靶所识别是这种结合的一个特点。特异结合涉及两种不同的分子,其中一种分子通过化学或物理手段与第二种分子结合。所述两种分子在某种意义上是相关联的,即他们彼此结合使得它们能够将他们的结合搭档与具有相似特征的其他化验成分区分开来。所述结合元件的成员涉及配体和受体(抗-配体),特异性结合对(SBP)成员和SBP搭档,和类似物。分子也可以为针对分子聚合体的特异性结合对(SBP)成员;例如,针对第二抗体和其相应抗原的免疫复合物的抗体可以被认为是所述免疫复合物的特异性结合对(SBP)成员。
如本文所使用的,“与宿主代谢先关的小分子”是指可以通过外源性生物体产生的低分子量有机化合物,如病毒、细菌、真菌或寄生虫。代表性地,其并不是聚合物并且对宿主代谢有影响。一些分子能以高亲和力地结合于生物聚合体,例如蛋白质、核酸、或多糖、以及改变所述生物聚合物的活性或功能。示例可以包含微他命、抗生素和等等。
本文使用的“生物样本”是指自活体或病毒来源或其他来源的大分子和生物分子获得的任何样本,并且包含受试者的任何细胞类型或组织,从所述受试者可获得核酸、蛋白质或其他大分子。生物样本可以是从生物源直接获得的样本,或者经过加工的样本。例如,扩增的分离核酸构成了生物样本。生物样本包含但不限于体液,例如血液、血浆、血清、脑脊液、滑膜液、尿和汗液;来自动植物的组织和器官样本及其经加工样本。
应理解,本文描述的本发明的方面和实施方案包含“由……组成”和/或“基本由……组成”的方面和实施方案。
结合附图的如下详细说明,本发明的其他目标、优点和特征将变得清晰。
II.确定胎儿的健康状态
本文提供了一种用于确定胎儿的健康状态的方法,所述方法包含:
a)在来自怀孕女性的生物样本中,评估至少一个来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平;b)分析所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态,其中所述胎儿的所述健康状态为无HBV感染。在一些实施方案中,所述胎儿的所述健康状态为无所述外源性生物体感染。所述操作的步骤可以不按特定的顺序进行。在一些实施方案中,所述胎儿是人类胎儿。在一些实施方案中,所述小分子可以与宿主代谢相关的。
为了评价所述同一性和/或一种以上多核苷酸的水平,多核苷酸片段的序列信息可以通过对从生物样本的模板DNA进行测序而获得。在一些实施方案中,所述模板DNA包含母源DNA和胎儿DNA。在一些实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在一些实施方案中,模板DNA是从怀孕女性的血液中获得的。血液可以通过任何抽血的标准技术进行采集,包含但不限于静脉穿刺。例如,血液可以从肘内侧或手背的静脉中抽取。血液样本可以在胎儿妊娠的任何时间从怀孕女性采集。例如,血液样本可以从人类妇女的胎儿妊娠的第1-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40、或40-44周,而优选地在胎儿妊娠的第8至28周。
基于所述序列信息将所述多核苷酸片段与参考基因组序列进行比对。参考基因组序列用于获得所述参考独特读段。如本文所使用的,所述术语“参考独特读段”指的是基于参考基因组序列被分配至特定基因组位置的所有所述独特多核苷酸片段。在一些实施方案中,所述参考独特读段具有相同长度,例如,约10、12、15、20、25、30、35、40、50、100、200、300、500或1000bp.
在一些实施方案中,根据来自外源性生物体的参考基因组序列评价一个以上多核苷酸的所述同一性和/或水平。在一些实施方案中,所述外源性生物体所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。在一些实施方案中,来自多个外源性生物体的参考基因组序列被用于评价所述一个以上多核苷酸的所述同一性和/或水平。
在一些实施方案中,所述模板DNA可以被用于构建DNA文库。在一些实施方案中,所述模板DNA可以进行扩增和/或富集步骤。在一些实施方案中,所述模板DNA可以基于序列富集方法(Nimblegen,如美国专利公开号20090105081中所描述)被配制为溶液,和/或序列复杂度还原方法(Agilent,如美国专利号7,867,703中所描述)。
在一些实施例中,可能期望将所述多核苷酸片段最初分配至所述宿主基因组以便于外源性序列的所述鉴定。例如,当所述宿主为人类,所述人类基因组序列可以被用作参考基因组序列以分配所述多核苷酸片段。在一些其他实施方式中,人类基因组版本hg18或hg19可以被用作所述参考基因组序列。在一些实施例中,根据来自于一个以上外源性生物体的一个以上参考基因组序列来评价无法被分配至所述宿主基因组的所述多核苷酸片段。
在一些实施方案中,所述方法可以使用用于检测多肽存在的试剂。这种试剂可以为抗体或其他与多肽特异性结合的结合分子。在一些实施方案中,这些抗体或结合分子可以是能够区别作为多态性结果的所述多肽的结构变异,并且因此可以用于基因分型。所述抗体或结合分子可以用检测得到的标志物进行标记,这样的,例如,放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合物、酶、或颗粒。其他用于进行结合实验的试剂,例如ELISA,可以用于所述方法。
任何胎儿的健康状态可以通过本文所公开的所述方法进行确定。在一些实施方式中,所述胎儿的所述健康状态为无HBV感染。在一些实施方式中,所述胎儿的所述健康状态为无所述外源性生物体感染。在一些实施方式中,所述健康状态为选自由以下所组成的组:基因异常、和发育异常。基因异常可以指染色体异常、突变、等。发育异常可以指死胎、流产、宫内死胎、宫内发育迟缓、宫内感染、早期新生儿死亡和/或先天异常。参见,例如,Kumari等,J.Health Popul.Nutr.(2011)29:77-80;Ishaque等,BMC Public Health(2011)11(Suppl 3):S3;Zhang等.,World J Gastroenterol.(1998)4:61-63;Wylie等,PLoS ONE(2012)7:e27735.
所述方法可以用于检测胎儿染色体异常,并且特别适用于检测非整倍性、多倍性、单体性、三体性、21三体性、13三体性、14三体性、15三体性、16三体性、18三体性、22三体性、三倍性、四倍性,和性染色体异常包含XO、XXY、XYY和XXX。根据本方法还可以关注人类基因组中的特定区域以鉴定部分单体性和部分三体性。例如,所述方法可以涉及分析确定的染色体滑动“窗口”中的序列数据,例如分布在整个染色体上的连续的、不重叠的50kb区域。除其他之外,已经报道了部分三体性13q、8p(8p23.1)、7q、远端6p、5p、3q(3q25.1)、2q、1q(1q42.1和1q21-qter)、部分Xpand单体性4q35.1。例如,在18q21.1-qter重复的情况下,染色体18长臂的部分重复可导致爱德华兹综合征(Mewar等,Am J Hum Genet.(1993)53:1269-78)。
III.确定胎儿健康状态的生物标志物
本文还提供了一种用于鉴定胎儿的健康状态的生物标志物的方法,所述方法包含:a)在来自至少一个怀孕女性的生物样本中,评估来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平;b)对所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的所述的同一性和/或水平进行统计学分析;以及c)如果统计学显著相关性建立,则鉴定所述非人类的多核苷酸、多肽或与宿主代谢相关的小分子作为针对所述健康状态的生物标志物,其中,所述胎儿的所述健康状态为无HBV感染,或所述生物样本是从至少100个怀孕女性获得的。在一些实施方案中,所述胎儿的所述健康状态为无所述外源性生物体感染。在一些实施方案中,所述小分子可以与宿主代谢相关。
为了评价一个以上多核苷酸的所述同一性和/或水平,多核苷酸片段的序列信息可以通过对从生物样本获得的模板DNA进行测序而获得。在一些实施方式中,所述生物样本是从至少2、5、10、20、50、100、200、500或1000个怀孕女性获得的。在一些实施方案中,所述模板DNA包含母源DNA和胎儿DNA。在一些实施方案中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在一些实施方案中,模板DNA是从怀孕女性的血液中获得的。血液可以通过任何抽血的标准技术进行采集,包含但不限于静脉穿刺。例如,血液可以从肘内侧或手背的静脉中抽取。血液样本可以在胎儿妊娠的任何时间从怀孕女性采集。例如,血液样本可以从人类妇女的胎儿妊娠的第1-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40、或40-44周,而优选地在胎儿妊娠的第8至28周。
基于所述序列信息将所述多核苷酸片段与参考基因组序列进行比对。参考基因组序列用于获得所述参考独特读段。如本文所使用的,所述术语“参考独特读段”指的是基于参考基因组序列被分配至特定基因组位置的所有所述独特多核苷酸片段。在一些实施方案中,所述参考独特读段具有相同长度,例如,约10、12、15、20、25、30、35、40、50、100、200、300、500或1000bp.
在一些实施方案中,根据来自外源性生物体的参考基因组序列评价一个以上多核苷酸的所述同一性和/或水平。在一些实施方案中,所述外源性生物体所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。在一些实施方案中,来自多个外源性生物体的参考基因组序列被用于评价所述一个以上多核苷酸的所述同一性和/或水平。
在一些实施方案中,所述模板DNA可以被用于构建DNA文库。在一些实施方案中,所述模板DNA可以进行扩增和/或富集步骤。在一些实施方案中,所述模板DNA可以基于序列富集方法(Nimblegen,如美国专利公开号20090105081中所描述)被配制为溶液,和/或序列复杂度还原方法(Agilent,如美国专利号7,867,703中所描述)。
在一些实施例中,可能期望将所述多核苷酸片段最初分配至所述宿主基因组以便于外源性序列的所述鉴定。例如,当所述宿主为人类,所述人类基因组序列可以被用作参考基因组序列以分配所述多核苷酸片段。在一些其他实施方式中,人类基因组版本hg18或hg19可以被用作所述参考基因组序列。在一些实施例中,根据来自于一个以上外源性生物体的一个以上参考基因组序列来评价无法被分配至所述宿主基因组的所述多核苷酸片段。
在一些实施方案中,所述方法可以使用用于检测多肽存在的试剂。这种试剂可以为抗体或其他与多肽特异性结合的结合分子。在一些实施方案中,这些抗体或结合分子可以是能够区别作为多态性结果的所述多肽的结构变异,并且因此可以用于基因分型。所述抗体或结合分子可以用检测得到的标志物进行标记,这样的,例如,放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合物、酶、或颗粒。其他用于进行结合实验的试剂,例如ELISA,可以用于所述方法。
在一些实施方案中,经感染和正常对照样本之间的所述多核苷酸、多肽、和/或小分子的所述同一性和/或水平的比较是通过统计检验进行的。任何本领域已知的适当的统计检验可以用于进行所述比较。例如,可以使用独立性的卡方检验、Wilcoxon MannWhitney U检验(Wilcoxon秩和检验)和非成对样本t检验。选择所述正确的统计检验在本领域一个普通技术人员常识性知识范围内。
在一些实施方案中,可以使用Fisher精确检验比较具有所述健康状态的所述样本和正常对照样本之间的区别。例如,所述检验公式可以为如下:
p - value = min ( Σ i = 0 n 11 n * 1 i n - n * 1 n 1 * - i n n 1 * , Σ i = n 11 n 1 * n * 1 i n - n * 1 n 1 * - i n n 1 * , 1 2 ) × 2
针对所述数据库中各个病毒可以计算和比较具有所述健康状态的所述样本和正常样本之间的所述读段数,然后进行统计分析。针对命名为病毒A所述病毒,n表示总样本数。n*1表示具有所述健康状态的所述样本数,具有所述健康状态的所述样本的序列读段被唯一比对到病毒A基因组。相似地,n*2表示正常对照样本数,n12表示序列读段可以被唯一比对到病毒A基因组的正常对照样本数。
相似地,n*2表示正常对照样本数,n12表示序列读段可以唯一被比对到病毒A基因组的正常对照样本数。如果p值小于等于0.05,该病毒可以被定义成作为针对所述健康状态的生物标志物。
IV.使用本文所鉴定的生物标志物确定胎儿的健康状态
本文还提供了一种确定胎儿的健康状态的方法,所述方法包含:a)评估利用根据权利要求10-19任一项所述的方法在来自怀孕女性的生物样本中所鉴定出的至少一个生物标志物的同一性和/或水平;b)分析所述生物标志物的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态。
在一些实施方案中,针对所述生物标记物可以建立临界值。在一些实施方案中,具有生物标志物的水平高于所述临界值的胎儿可以表明其具有特定健康状态。
V.针对21三体性的生物标志物
在另一方面,本文提供了一组用于确定人类胎儿的21三体性的生物标志物,其包含多个选自由以下所组成的组的生物体:小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6。
本申请涉及至少2、3、4、5、10或所有13种所述生物体的任意组合,所述生物体为选自由以下所组成的组:小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6。在一些实施方案中,所述生物标志物组可以包含小地老虎核型多角体病毒和一种以上生物体,该生物体为选自由假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含假单胞杆菌噬菌体F10和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含鼻疽噬菌体Bcep22和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方案中,所述生物标志物组可以包含脑心肌炎病毒和一种以上生物体,该生物体选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含丙型肝炎病毒基因型1和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含肠杆菌噬菌体M13和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含人类1型疱疹病毒和一种以上生物体,该生物体为选自小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含人类7型疱疹病毒和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含鲤疱疹病毒3和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含葡萄球菌噬菌体37和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含西枞色卷蛾颗粒体病毒和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、棉铃虫裸病毒2和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含棉铃虫裸病毒2和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒和肠杆菌噬菌体Sf6组成的组。在一些实施方式中,所述生物标志物组可以包含肠杆菌噬菌体Sf6和一种以上生物体,该生物体为选自由小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒和棉铃虫裸病毒2组成的组。
VI.通过测序检测胎儿的健康状态
在另一方面,本文提供了一种用于确定胎儿的健康状态的方法,所述方法包含:a)在来自怀孕女性的生物样本中,通过测序多核苷酸来评估来自外源性生物体的至少一个生物标志物的同一性和/或水平;b)分析所述至少一个生物标志物的所述同一性和/或水平;以及c)确定所述胎儿的所述健康状态。在一些实施方式中,所述外源性生物体为选自由以下所组成的组:HBV、HCV、HIV、TORCH(弓形虫、风疹病毒、巨细胞病毒、和单纯疱疹病毒)、和梅毒。在一些实施方式中,所述健康状态为感染一种以上所述外源生物体。
在一些实施方式中,所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。在一些实施方式中,模板DNA是从怀孕女性的血液中获得的。血液可以通过任何抽血的标准技术进行采集,包含但不限于静脉穿刺。例如,血液可以从肘内侧或手背的静脉中抽取。血液样本可以在胎儿妊娠的任何时间从怀孕女性采集。例如,血液样本可以从人类妇女的胎儿妊娠的第1-4、4-8、8-12、12-16、16-20、20-24、24-28、28-32、32-36、36-40、或40-44周,而优选地在胎儿妊娠的第8至28周。
为了评价所述同一性和/或一种以上多核苷酸的水平,多核苷酸片段的序列信息可以通过对从生物样本的模板DNA进行测序而获得。在一些实施方案中,所述模板DNA包含母源DNA和胎儿DNA。基于所述序列信息,将所述多核苷酸片段与所述生物标志物相比较。参考基因组序列用于获得所述参考独特读段。
在一些实施方案中,所述生物标志物可以包含来自于所述外源生物体基因组序列的靶DNA序列。在一些实施方案中,所述靶DNA序列选自所述基因组的保守区域。在一些实施方案中,DNA芯片用于支持与所述靶DNA序列杂交的探针。
在一些实施方案中,所述模板DNA可以被用于构建DNA文库。在一些实施方案中,所述模板DNA可以进行扩增和/或富集步骤。在一些实施方案中,所述模板DNA可以基于序列富集方法(Nimblegen,如美国专利公开号20090105081中所描述)被配制为溶液,和/或序列复杂度还原方法(Agilent,如美国专利号7,867,703中所描述)。
在一些实施例中,可能期望将所述多核苷酸片段最初分配至所述宿主基因组以便于外源性序列的所述鉴定。例如,当所述宿主为人类,所述人类基因组序列可以被用作参考基因组序列以分配所述多核苷酸片段。在一些其他实施方式中,人类基因组版本hg18或hg19可以被用作所述参考基因组序列。在一些实施例中,根据来自于一个以上外源性生物体的一个以上参考基因组序列来评价无法被分配至所述宿主基因组的所述多核苷酸片段。
在一些实施方案中,针对所述生物标记物可以建立临界值。在一些实施方案中,具有生物标志物的水平高于所述临界值的胎儿被所述外源性生物体所感染。
VII.系统和试剂盒
在另一方面,本文提供了一种用于确定胎儿的健康状态的系统,所述系统包含:a)用于在来自怀孕女性的生物样本中评估至少一个来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平的手段;以及b)用于分析所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平的手段。在一些实施方式中,所述胎儿的所述健康状态为无HBV感染。在一些实施方式中,所述小分子与宿主代谢相关。
可以使用任何适宜的设备,例如,凝胶电泳法、色谱法、分光光度法、等,用于评价所述多核苷酸、多肽和/或小分子的所述同一性和/或水平。在一些实施方案中,所述用于评估至少一个来自外源性生物体的多核苷酸、多肽和/或小分子的同一性和/或水平的手段可以为测序设备。在一些实施方案中,所述用于分析所述外源性多核苷酸、多肽和/或小分子的同一性和/或水平的手段可以为计算机。在一些实施方式中,所述计算机可以包含计算机可读介质,所述计算机可读介质包含复数个用于分析所述外源性多核苷酸、多肽和/或小分子的同一性和/或水平的指令,例如,与所述宿主生物体的基因组序列进行序列比对,与外源生物体的基因组进行序列比对,等。
本文进一步提供了一种用于确定胎儿的健康状态的试剂盒包含:a)利用根据权利要求10-19任一项所述的方法所识别的生物标志物;以及b)如何使用所述生物标志物的说明书。
在一些实施方案中,本发明提供了组合物和包含引物和引物对的试剂盒,所述引物和引物对允许本发明的所述多核苷酸或其任何特异性部分的特异性扩增,以及与本发明的核酸分子或其任何部分选自行或特异性杂交的探针。探针可以用检测得到的标志物进行标记,这样的,例如,放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合物或酶。这种探针和引物可以被用于检测样本中多核苷酸的存在并作为用于检测通过所述多核苷酸编码的细胞表达蛋白的手段。如本领域技术人员应当理解的,可以基于本文所提供的序列制备许许多多不同的引物和探针并高效低用于扩增、克隆和/或确定基因组DNAs的存在和/或水平。
在一些实施方式中,所述试剂盒可以包含用于检测多核苷酸存在的试剂。这种试剂可以为抗体或其他与多肽特异性结合的结合分子。在一些实施方案中,这些抗体或结合分子可以是能够区别作为多态性结果的所述多肽的结构变异,并且因此可以用于基因分型。所述抗体或结合分子可以用检测得到的标志物进行标记,这样的,例如,放射性同位素、荧光化合物、生物发光化合物、化学发光化合物、金属螯合物、酶、或颗粒。其他用于进行结合实验的试剂,例如ELISA,可以包含于所述试剂盒中。
在一些实施方式中,所述试剂盒包含用于对至少两个、至少三个、至少五个、至少十个、或十五个生物标志物进行基因分型的试剂。在一些实施方式中,所述试剂盒可以进一步包含针对捕获探针的表面或基质(例如微阵列)以便用于检测经过扩增的核酸。
所述试剂盒可以进一步含有载体手段,所述载体手段被划分以便严密地接受一个以上容器手段,如瓶子、管子、和类似物,每一个所述容器手段包含一个被用于本方法的所述独立元件。例如,一个所述容器手段可以包含探针,所述探针被或能被可检测地标记。这种探针可以为特异性针对生物标志物的多核苷酸。当所述试剂盒利用核酸杂交以检测所述靶核酸,所述试剂盒还可以具有容器,所述容器内含有用于扩增所述靶核酸序列的核苷酸,和/或包含受体-手段的容器,例如生物素-结合蛋白,例如结合至抗生物素蛋白或链霉亲和素,例如酶、荧光或放射性同位素标记。
本发明的所述试剂盒将代表性地包含如上所述的容器和一个以上包含从商业和用户立场出发所需要的材料,包含缓冲液、稀释液、滤器、针、注射器、和带有使用数明的产品说明书。标记可以被呈现在所述容器上以表明用于特定治疗的所述组合物或非治疗性应用,并且还可以表明针对体外还是体内的用法,例如以上所描述的那些。
所述试剂盒可进一步包含一套说明书,和用于制备组织或细胞样本和从所述样本制备核酸(例如基因组DNA)的材料。
本发明提供了多种组合物适合在执行本发明所述的方法时使用,其可以用于试剂盒。例如,本发明提供表面,例如可被用于该方法的阵列。在一些实施方式中,本发明的阵列包含有利于检测本发明的生物标志物的核酸分子的单个或集合。例如,本发明的阵列可以包含一系列离散放置的单个核酸的寡核苷酸或核酸寡核苷酸组合的集合,二者可以杂交到含有靶核酸样本,由此这种杂交可以表明本发明的所述生物标志物的基因型。
本领域树枝几种用于将核酸附着在固相基体上的技术,例如玻片。一种方法是将经修饰的碱基或类似物并入到合成的核酸分子中,所述经修饰的碱基或类似物含又能够附着至固体基体的部分,例如胺基、胺基衍生物或携带正电荷的另一基团。所述合成产品继而与固相基体相接触,例如包覆了乙醛或会与另一反应性基团的玻片,所述另一反应性基团会与在所述经过扩增产物上的反应性基团形成共价连接并会共价连接到所述玻片。例如那些使用氨基丙基硅表面化学的其他方法也是本领域所公知的,如在cmt.corning.com和cmgm.stanford.edu/pbrown1万维网所公开的。
VIII.实施例
提供以下实施例以说明但不限制本发明。
为了便于理解,所述具体实施方式是为了有助于解释技术方案而提供的,也就是说,这些实施例只用于说明目的,而不以任何方式限制本发明的范围。除非特别说明,实施方式并不表明具体条件,按照常规条件或生产商推荐的条件。
实施例1确定作为针对唐氏综合征的生物标志物的病毒
本实施例阐明了通过从怀孕女性获取外周血(5mL)、提取游离DNA、利用新的高通量技术测序,以及生物信息分析来无创性基因分析胎儿染色体非整倍性风险。外源性序列与所述宿主生物体的序列相关。本结果表明外源性序列是与所述宿主生物体的健康状态相关的。
在所述怀孕女性知情的情况下,研究人员获取外周血样本(12-24孕周)并利用条形码进行标记以便于信息分类和样本管理。从所述外周血分离血清,并从所述血清中提取游离DNA。构建DNA文库然后进行高通量测序。测序结果与人类基因组序列进行比较。那些没有被比对到人类基因组序列的被分类为非人类序列。将非人类序列与已知的病毒序列进行比较以获得唯一比对序列。图1显示了本实施例中实验步骤的流程图。
样本收集
样本来自怀有正常胎儿和21三体性胎儿的怀孕女性。在妇产科医生的指导下,各取5毫升母源外周血并收集于含有EDTA的管中。实验者针对每个样本进行标记,并按照分类管理样本。
样本分离
将血液样本在4摄氏度下以1600g离心10分钟,将上清液收集到新的管中。然后,将经过处理的血液在摄氏度下以1600g进行10分钟的第二次离心,并将上清液再次收集到管中。最后的上清液储藏在-80摄氏度指导直到进一步处理。
提起DNA
该步骤利用Nucleon DNA提取试剂盒进行。在确保所述DNA提取的结果的前提下,磁珠法的DNA提取试剂盒(DP327)成本低并且易于自动化(≥80个样本),而TIANampMicro DNA试剂盒(DP316)成本相对较低,并执行单个样本。所述操作方法参见操作指南。
测序
根据生产商的DNA文库构建标准操作程序(参见标准文库构建指南http://www.illumina.com/),利用提取的DNA构建DNA文库,然后在Illumina HiSeq2000TM上测序。
所述测序过程的基本步骤如下:
1)DNA文库构建:将DNA打断为一定大小的片段,进行末端修复,在所述DNA片段的3’末端添加碱基”A”,对所述DNA连接接头然后进行多聚酶链反应。终产物为两端均已连接有接头的所述DNA测序片段(footage)。
2)芯片制备和测序:经处理的单链DNA片段所述芯片表面的引物通过互补碱基在芯片(流动槽)上进行锚定。将无标记多核苷酸和酶加入到所述反应系统中以便进行桥式PCR反应。利用固定在流动细胞表面的接头作为一种模板,形成dsDNA(双链DNA)桥,所述dsDNA桥是由ssDNA(单链DNA)桥扩增而来。经过30个循环的扩增,每个单分子被扩增接近1000倍以成为单克隆DNA簇,并进行线性化处理。
3)边测序边合成:向所述反应系统中加入DNA聚合酶d,所述接头引物和标记有荧光染料的四种三磷酸脱氧核糖核苷(dNTP)。由于四种dNTPs的所有3’末端羟基均使用化学方式进行了保护,在每个循环过程中只加入单个dNTP。所述dNTP被加入到合成链中后,对所有未使用的游离dNTP和DNA聚合酶进行洗脱。加入缓冲溶液以便于荧光激发,使用激光刺激荧光信号,以优选的设备进行记录。最后,利用计算机分析产生所述测序结果。加入化学试剂对荧光信号进行淬灭,并去除所述dNTP 3'-羟基保护基团以恢复其粘性,然后加入第二核苷酸。重复所属过程直到每个模板序列完全聚合为双链。对每个循环收集的荧光信号结果的分析显示了每个模板DNA片段的序列。
序列比对和统计分析
利用Illumina HiSeq 2000TM对样本进行测序并产生单末端、35bp或49bp的读段,其中每个个体具有少于1X的测序深度。从NCBI数据库(http://www.ncbi.nlm.nih.gov/)下载所述人类参考基因组,hg19版本(build37)。与人类基因组的序列比对在SOAPaligner上进行,产生非匹配序列,即指非人类序列。从所述NCBI数据库下载病毒基因组,利用SOAPaligner将所述非人类序列比对到病毒基因组并产生唯一比对读段。针对所述数据库中的各个病毒计算并比较所述唐氏综合征样本和正常对照样本的读段数,然后进行统计分析。针对命名为病毒A所述病毒,n表示总样本数。n*1表示唐氏综合征样本数,n11表示序列读段被唯一比对到病毒A基因组的唐氏综合征样本数。相似地,n*2表示正常对照样本数,n12表示序列读段可以被唯一比对到病毒A基因组的正常对照样本数。
表1 统计表如下
使用Fisher精确检验比较唐氏综合征样本和正常对照样本之间的区别。检验公式如下:
p - value = min ( Σ i = 0 n 11 n * 1 i n - n * 1 n 1 * - i n n 1 * , Σ i = n 11 n 1 * n * 1 i n - n * 1 n 1 * - i n n 1 * , 1 2 ) × 2
如果p值小于等于0.05,该病毒被定义为名义上显著,并且可以对胎儿健康有一些影响。
统计结果
利用Fisher精确检验分析110例唐氏综合征样本和300例正常对照样本以找到4个具有显著性的病毒,并利用所述相同的方法在153例唐氏综合征样本和551例正常对照样本中进行验证。最终鉴定出2个显示与唐氏综合征胎儿显著相关的候选病毒(表2)。
表2 与唐氏综合征显著相关的病毒
病毒名称 发现p值 验证p值 结合p值
小地老虎核型多角体病毒 8.67E-05 6.52E-11 8.05E-15
假单胞杆菌噬菌体F10 0.019 0.047 7.12E-04
通过利用将263例唐氏综合征样本和851例正常对照样本进行比较的所述统计分析,鉴定出具有p值小于等于0.05,可能与唐氏综合征胎儿相关的所有病毒列于表3中。
表1 与唐氏综合征显著相关的病毒
实施例2胎儿病原体的序列分析
在病原体感染发生在怀孕女性体内时,在所述怀孕女性的外周血液中存在微量所述病原体DNA。例如,我们通过DNA测序技术在所述外周血液中检测了HBV DNA。如本领域一个普通技术人员可以理解的,所述怀孕女性的外周血液中起始存在越多的所述病原体的DNA,则胎儿越有可能被所述病原体感染。因此,本文提供了一种用于检测胎儿被病原体感染的方法,其中使用含有针对所述病原体的探针的芯片。通过靶序列捕获检测病原体特异性的序列,然后进行测序。依据所述个案对照组统计分析建立临界值,所述临界值用于确定所述胎儿的所述感染状态。
本公开还涉及设计探针,所述探针与待制备到单一芯片上的病原体特异性保守的序列杂交,这将捕获相应的病原体靶序列。将所获得的序列通过高通量测序以产生原始数据。然后去除所述原始数据中的经污染的片段,同时将其与数据比对到靶参考序列。最终,唯一比对到所述相应病原体的读段数与个案对照组读段数相比较以确定所述胎儿是否被感染。Zhang等,World J Gastroenterol.(1998)4(1):61-63;Jiang,Contemporary Medicine(2012)18(7).该方法用于检测胎儿病原体感染,并具有很多优势。首先是无创性,因此怀孕妇女和胎儿是安全的;第二,多个输出,一个芯片能检测多个病原体,并可以在一次检测中捕获多个样本;第三,低成本,由于所述捕获区域小,高深度测序的成本大大降低;最后,准确,因为所述测序深度高,检测信号强,由此大大提高了检测的准确性。
本实施方式包含报道或未报道的与孕期感染相关的病原体,例如,病毒、细菌、真菌和寄生虫。所述治病试剂的特异性、保守的序列被用作参考序列。所使用的生物样本可以为血液、细胞和组织,唾液、眼泪、乳汁、尿液、粪便或其组合。所述测序试剂和设备不仅包括SOLiDTM的第二代测序平台,还包括第三代、第四代的高通量测序平台。
实验设计
所述实验包含以下步骤:
1.根据所述病原体参考基因组设计捕获探针;
2.从母源血清制备所述基因组DNA;
3.利用基于序列富集方法(Nimblegen,,如描述于美国专利公开号为20090105081中)的溶液获取病原体片段,和/或序列复杂度还原方法(Agilent,如描述于美国专利号为7,867,703中)
4.测序;
5.对原始读段进行完全过滤;
6.获得唯一比对到靶病原体的高质量读段并计算每个靶病原体基因组上独特读段的总数量;以及
7.根据所述对照组确定所述临界值,如果所述比值超过所述临界值,则所述样本呈阳性,即意味着具有病原体感染。
本实施方式使用以下信息分析模型。
1.测序
根据Illumina的说明书构建140-800bp插入片段大小的测序文库。然后进行双末端测序。
2.去除测序数据中的污染
从测序数据中去除PCR重复、低质量测序读段和含有测序接头的读段。通过此步骤获得干净数据。
去除PCR重复的策略:当两个以上测序读段完全相同时,只保留一个。
3.对能被比对到人类基因组的读段进行过滤
得到干净的读段后,使用SOAP2将所述干净的读段比对到人类基因组Hg19(UCSCBuild hg19)。SOAP2为所述SOAP(短寡核苷酸分析软件包)中的一员。过滤掉所述被比对到hg19上的读段。
4.将经过过滤的读段比对到基本数据库
然后,利用SOAP2将经过过滤的所述剩余读段比对到基本数据集。此处基本数据集是指含有各种物种的基因组序列,包含我们想要检测的靶物种。
5.计算唯一比对读段的相对丰度
当完成上述比对后,挑选出所述唯一比对到靶病原体的读段并计算唯一比对到每个靶病原体基因组的读段总数。将所述唯一比对读段数总数除以干净读段总数获得唯一比对读段比例。所述比例被定义为所述样本在所述靶病原体上的相对丰度。
如果一个测序读段在一个参考序列上只有一个唯一匹配位置,所述读段被称为唯一比对到所述参考序列上,并且所述读段被称为唯一比对读段。
6.获得临界值
从对照组获取所述临界值,所述对照组可以被定义为阴性样本。获取所述临界值的前5步与前述步骤1至步骤5相同。然而,这里的处理对象是来自对照组的样本。获得临界值的第六步是在特定靶病原体上计算所有样本的相对丰度的平均值。临界值(cutoff value)计算公式如下:
cutoff = Σ i = 1 n r i / n + 2 sd
在上述公式中,n指对照样本的总数,ri指在特定靶病原体上第一个i对照样本的相对丰度,以及sd指所述数据集r1~rn的平均标准差。
7.确定感染
在此步骤中,将在步骤5中获得的经计算的相对丰度与从所述对照组步骤6中获得的临界值进行比较。如果所述相对丰度大于所述临界值,该结果即被确定为阳性,即意味着被检测样本被所述靶病原体感染。
实施例中样本的结果
HBV
选择10例临床HBV抗原阳性怀孕女性案例,其中5例确认为胎儿HBV抗原阳性和另外5例为阴性。同时选择5例HBV抗原阴性怀孕女性和胎儿作为阴性案例。从怀孕女性中收集大约5毫升的外周血液,然后进行低速离心或静态自然沉降上清液,并将上清液吸入新的管子。依据HiSeq2000TM测序构建文库的要求,利用TIANGEN病毒基因组DNA/RNA提取试剂盒提取母源血清游离DNA。所获得的DNA片段的末端修复是利用T4DNA聚合酶、KlenowTM聚合酶和T4多核苷酸酶进行的。添加末端A-残基后,将市售可得的接头(Illumina)连接到所述DNA片段上。然后所述接头连接DNA以标准多重引物进行14个循环PCR的再次扩增。使用Agencourt AMPureTMXP磁珠对PCR产物进行纯化。
使用Agencourt AMPureTMXP对样本进行纯化,然后溶于25微升的EB缓冲液中。
确定所创建的文库是否满足Bioanalyzer 2100TM对片段分布的要求。然后通过Q-PCR方法进行定量。用定制芯片(Agilent)与所述文库杂交,并用HiSeq2000TM对杂交产物进行测序。测序策略为PE91+8+91(双末端测序、91-bp和8-bp标签序列),装置参数的设定和操作方法依据操作手册(可以从http://www.illumina.com/support/documentation.ilmn获得)。
测序数据结果如表4所示
表4 测序数据结果
将所述读段比对到HBV参考序列(gi:3582357)。依据所述阳性样本和阴性样本独特读段统计结果设置临界值。所述临界值用于确定哪个样本具有HBV感染。本实施例中的方法可以感染HBV的怀孕女性中检测其胎儿是否具有HBV感染。其结果示于表5中。
表5 HBV感染的结果
“++”指所述母亲和所述胎儿都被感染;“+-”指所述母亲被感染而所述胎儿未被感染;“--“指所述母亲和所述胎儿都未被感染。
在我们检测的15个样本中,只有一例样本与临床数据不一致,由此证明了本申请的方法的强大性能。
TORCH
选择10例临床TORCH IgM阳性怀孕女性案例,其中5例为胎儿TORCH IgM阳性,另外5例为TORCH IgM阴性。同时选取5例TORCH IgM阴性怀孕女性和胎儿作为阴性案例。从怀孕女性中收集大约5毫升的外周血液。对血液样本进行处理、结构文库、靶区域捕获、测序方法和数据分析与上述HBV实施例中详述的相似。TORCH IgM样本可以从RORCH感染的怀孕女性中检测到,并且也可以给出关于胎儿是否有TORCH感染的临界值。
在本申请和所述参考文件和附件中所涉及的所有出版物,包括专利文献和科技文章,为了达到所有目的,以相同的程度整体并入作为参考,如同各单独出版物被单独引入作为参考。
非特别说明,所有的标题都是为了便于读者阅读,而不应该用于限制该标题后面内容的含义。
上述出版物或文献的引用不作为承认任何前述的内容是有关的现有技术,也不构成承认这些出版物或者文献的内容或数据。
尽管已经参照附图对本发明的实施例进行了详细描述,可以理解的是各种变化和需改对本领域的普通技术人是显而易见的。这种变化和修改被理解为被包含在本发明的范围内。应理解的是,本发明的各个实施例只是通过举例的方式被提出,而不是用以限制本发明。同样的,各个附图可以描述本发明的示例性结构或其他配置,其被完成来帮助理解可包括在本发明中的特征和功能。本发明不限于所示的示例性结构或配置,但可使用各种可选的结构和配置来实现。此外,虽然上面按照各种示例性实施方式和实现描述了本发明,应理解,在一个或多个单独的实施方式中描述的各个特征和功能,其应用不限于他们被描述的特定实施方式。相反,它们可单独地或以某种组合应用于本发明的其他实施方式中的一个或多个,而不管这样的实施方式是否被描述以及这样的特征是否被呈现为所描述的实施方式的一部分。因此,本发明的广度和范围不应由上面描述的示例性实施方式中的任一个限制。
除非另外明确规定,在本文中使用的术语和短语及其变形应被解释为开放的,与限制相反。作为前述内容的例子:术语“包括”应被理解为意指“包括而不限于”等;术语“例子”用于提供在讨论中的项目的示例性实例,而不是其排他或限制性的列表;以及形容词例如“常规的”、“传统的”、“正常的”、“标准的”、“已知的”和类似意义的术语不应被解释为将所描述的项目限制到给定的时间段,或限制到在给定时间可用的项目。但替代地,这些术语应被理解为包括可以是现在或未来的任何时间可用的、已知的常规、传统、正常或标准技术。同样,用连词“和”连接的一组项目不应被理解为要求那些项目中的每一个都存在于该组中,而更确切地应被理解为“和/或”,除非另外明确地规定。类似的,用连词“或”连接的一组术语不应被理解为要求在该组中相互排斥,而更确切地应被理解为“和/或”,除非另外明确地规定。此外,虽然本发明的项目、元件或部件可以以单数形式进行描述或主张权利,复数形式被设想为在其范围内,除非明确地规定限于单数。例如,“至少一个”可以指单个或复数个,而并不限于其中之一。扩展词和短语例如“一个或多个”、“至少”、“但不限于”或其他类似短语的存在不应被理解为意味着在这样的扩展短语可能不存在的实例中较窄的情况是预期的或所需的。

Claims (44)

1.一种用于确定胎儿的健康状态的方法,所述方法包括:
a)在来自怀孕女性的生物样本中,评估至少一个来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平;
b)分析所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的所述同一性和/或水平;以及
c)确定所述胎儿的所述健康状态,
其中所述胎儿的所述健康状态为无HBV感染。
2.根据权利要求1所述的方法,其中所述胎儿的所述健康状态为无所述外源性生物体感染。
3.根据权利要求1或2所述的方法,其中所述胎儿是人类胎儿。
4.根据权利要求1-3任一项所述的方法,其中所述分析是采用至少1个正常对照进行的。
5.根据权利要求1-4任一项所述的方法,其中所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。
6.根据权利要求1-5任一项所述的方法,其中所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。
7.根据权利要求1-6任一项所述的方法,其中所述健康状态为选自由以下所组成的组:基因异常、和发育异常。
8.根据权利要求7所述的方法,其中所述基因异常为胎儿非整倍性。
9.根据权利要求8所述的方法,其中所述胎儿非整倍性为选自由13三体性、18三体性和21三体性所组成的组的常染色体异常,或选自由XO、XXX、XXY和XYY所组成的组的性染色体异常。
10.一种用于鉴定胎儿的健康状态的生物标志物的方法,所述方法包括:
a)在来自至少一个怀孕女性的生物样本中,评估来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平;
b)对所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的所述的同一性和/或水平进行统计学分析;以及
c)如果统计学显著相关性建立,则鉴定所述非人类的多核苷酸、多肽或与宿主代谢相关的小分子作为针对所述健康状态的生物标志物,
其中,所述胎儿的所述健康状态为无HBV感染,或所述生物样本是从至少100个怀孕女性获得的。
11.根据权利要求10所述的方法,其中所述胎儿是人类胎儿。
12.根据权利要求10或11所述的方法,其中所述生物样本是从至少2、5、10、20、50、100、200、500或1000个怀孕女性获得的。
13.根据权利要求10-12任一项所述的方法,其中所述外源性生物体为选自由以下所组成的组:病毒、细菌、真菌和寄生虫。
14.根据权利要求10-13任一项所述的方法,其中所述健康状态为选自由以下所组成的组:基因异常、和发育异常。
15.根据权利要求14所述的方法,其中所述基因异常为胎儿非整倍性。
16.根据权利要求15所述的方法,其中所述胎儿非整倍性为21三体性。
17.根据权利要求16所述的方法,其中所述生物标志物为选自由以下所组成的组:小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2、和肠杆菌噬菌体Sf6。
18.根据权利要求15所述的方法,其中所述胎儿非整倍性为选自由XO、XXX、XXY和XYY组成的组的性染色体异常。
19.根据权利要求11-18任一项所述的方法,其中所述生物样本是从至少2、5、10、20、50、100、200、500或1000个怀孕女性获得的。
20.一种用于确定胎儿的健康状态的方法,所述方法包括:
a)评估利用根据权利要求10-19任一项所述的方法在来自怀孕女性的生物样本中所鉴定出的至少一个生物标志物的同一性和/或水平;
b)分析所述生物标志物的所述同一性和/或水平;以及
c)确定所述胎儿的所述健康状态。
21.根据权利要求20所述的方法,其中所述胎儿是人类胎儿。
22.根据权利要求20或者21所述的方法,其中所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。
23.根据权利要求20-22任一项所述的方法,其中所述生物标志物为多核苷酸。
24.根据权利要求23所述的方法,其中步骤a)包括对来自所述生物样本的无细胞DNA进行纯化。
25.根据权利要求24所述的方法,其中对所述DNA进行扩增。
26.根据权利要求24或25所述的方法,其中对所述DNA建立文库。
27.根据权利要求24-26任一项所述的方法,其中对所述DNA进行测序。
28.根据权利要求27所述的方法,其中采用高通量测序对所述DNA进行测序。
29.根据权利要求23-28任一项所述的方法,其中步骤b)包括:将从步骤a)获得的所述序列与所述生物标志物的序列进行比较。
30.根据权利要求29所述的方法,其中在步骤b)之前,从步骤a)获得的所述序列中去除与人类基因组序列相匹配的序列。
31.一组用于确定人类胎儿的21三体性的生物标志物,其包含多个选自由以下所组成的组的生物体:小地老虎核型多角体病毒、假单胞杆菌噬菌体F10、鼻疽噬菌体Bcep22、脑心肌炎病毒、丙型肝炎病毒基因型1、肠杆菌噬菌体M13、人类1型疱疹病毒、人类7型疱疹病毒、鲤疱疹病毒3、葡萄球菌噬菌体37、西枞色卷蛾颗粒体病毒、棉铃虫裸病毒2、肠杆菌噬菌体Sf6。
32.一种用于确定胎儿的健康状态的方法,所述方法包含:
a)在来自怀孕女性的生物样本中,通过测序多核苷酸来评估来自外源性生物体的至少一个生物标志物的同一性和/或水平;
b)分析所述至少一个生物标志物的所述同一性和/或水平;以及
c)确定所述胎儿的所述健康状态。
33.根据权利要求32所述的方法,其中所述胎儿为人类胎儿。
34.根据权利要求32或33所述的方法,其中所述生物样本为选自由以下所组成的组:血清、血液、积液、尿液、骨髓、腹水、盆腔冲洗液、胸腔积液、脊髓液、淋巴液、粘液、痰、唾液、眼房水、鼻腔提取物、咽喉拭子、生殖道拭子、来自消化组织的细胞悬浮液、和粪便提取物。
35.根据权利要求32-34任一项所述的方法,其中步骤a)包含对来自所述生物样本的无细胞DNA进行纯化。
36.根据权利要求35所述的方法,其中对所述DNA进行扩增。
37.根据权利要求35或36所述的方法,其中对所述DNA建立文库。
38.根据权利要求32-37任一项所述的方法,其中步骤b)包含将从步骤a)获得的所述序列与所述生物标志物进行比较。
39.根据权利要求38所述的方法,在步骤b)之前,从步骤a)获得的所述序列中去除与人类基因组序列相匹配的序列。
40.根据权利要求32-39任一项所述的方法,其中所述外源性生物体为选自由以下所组成的组:HBV、HCV、HIV、TORCH(弓形虫、风疹病毒、巨细胞病毒、和单纯疱疹病毒)、和梅毒。
41.根据权利要求32-40任一项所述的方法,其中针对所述生物标志物建立临界值。
42.根据权利要求41所述的方法,其中胎儿具有所述生物的水平超过所述临界值表明所述胎儿被所述外源性生物体所感染。
43.一种用于确定胎儿的健康状态的系统,所述系统包含:
a)用于在来自怀孕女性的生物样本中评估至少一个来自外源性生物体的多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平的手段;以及
b)用于分析所述外源性多核苷酸、多肽和/或与宿主代谢相关的小分子的同一性和/或水平的手段,
其中所述胎儿的所述健康状态为无HBV感染。
44.一种用于确定胎儿的健康状态的试剂盒包含:
a)利用根据权利要求10-19任一项所述的方法所识别的生物标志物;以及
b)如何使用所述生物标志物的说明书。
CN201280075090.XA 2012-07-31 2012-09-14 胎儿健康状态的无创性检测 Active CN104619858B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201280075090.XA CN104619858B (zh) 2012-07-31 2012-09-14 胎儿健康状态的无创性检测

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201210271283 2012-07-31
CN2012102712834 2012-07-31
CN201280075090.XA CN104619858B (zh) 2012-07-31 2012-09-14 胎儿健康状态的无创性检测
PCT/CN2012/081435 WO2014019275A1 (en) 2012-07-31 2012-09-14 Noninvasive detection of fetal health status

Publications (2)

Publication Number Publication Date
CN104619858A true CN104619858A (zh) 2015-05-13
CN104619858B CN104619858B (zh) 2017-06-06

Family

ID=50027165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280075090.XA Active CN104619858B (zh) 2012-07-31 2012-09-14 胎儿健康状态的无创性检测

Country Status (3)

Country Link
CN (1) CN104619858B (zh)
HK (1) HK1208890A1 (zh)
WO (1) WO2014019275A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106086243A (zh) * 2016-08-01 2016-11-09 王燕芸 一种无创式检测怀孕中胎儿是否健康的系统及其应用
WO2019007251A1 (zh) * 2017-07-02 2019-01-10 中南大学湘雅医院 检测寄生虫感染的方法和试剂盒

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2986036C (en) 2015-05-18 2022-07-26 Karius, Inc. Compositions and methods for enriching populations of nucleic acids
FR3051482B1 (fr) 2016-05-19 2021-01-29 Life & Soft Procede de determination de la presence et quantification d'au moins un micro-organisme dans un echantillon biologique
CN109136194B (zh) * 2017-06-28 2021-08-24 菲吉乐科(南京)生物科技有限公司 新型茄科雷尔氏菌噬菌体及其组合物和应用
CN110272984A (zh) * 2018-03-13 2019-09-24 深圳华大生命科学研究院 测序获取寄生虫核酸信息及对寄生虫分类的方法和系统
KR20240089427A (ko) * 2021-10-08 2024-06-20 마이크로노마, 인크. 메타후성유전체학-기반 질환 진단

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1330271A (zh) * 2001-07-12 2002-01-09 上海晶泰生物技术有限公司 用于产前诊断的蛋白质芯片及制造方法
WO2004079011A1 (en) * 2003-02-28 2004-09-16 Ravgen, Inc. Methods for detection of genetic disorders
US20070059719A1 (en) * 2005-09-15 2007-03-15 Michael Grisham Business methods for prenatal Diagnosis
CN101535502A (zh) * 2006-05-03 2009-09-16 香港中文大学 用于产前诊断和监测的新的胎儿标志物

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1330271A (zh) * 2001-07-12 2002-01-09 上海晶泰生物技术有限公司 用于产前诊断的蛋白质芯片及制造方法
WO2004079011A1 (en) * 2003-02-28 2004-09-16 Ravgen, Inc. Methods for detection of genetic disorders
US20070059719A1 (en) * 2005-09-15 2007-03-15 Michael Grisham Business methods for prenatal Diagnosis
CN101535502A (zh) * 2006-05-03 2009-09-16 香港中文大学 用于产前诊断和监测的新的胎儿标志物

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
冯穗华 等: "Illumina测序技术在母血检测胎儿非整倍体中应用", 《中国实验诊断学》 *
刘高金 等: "《现代优生学》", 31 October 2001 *
陈常召 等: "《实用症状与体征鉴别诊断学》", 30 April 2009 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106086243A (zh) * 2016-08-01 2016-11-09 王燕芸 一种无创式检测怀孕中胎儿是否健康的系统及其应用
WO2019007251A1 (zh) * 2017-07-02 2019-01-10 中南大学湘雅医院 检测寄生虫感染的方法和试剂盒
CN109890985A (zh) * 2017-07-02 2019-06-14 中南大学湘雅医院 检测寄生虫感染的方法和试剂盒
US11702705B2 (en) 2017-07-02 2023-07-18 Xiangya Hospital Central South University Method for detecting parasitic infection and kit

Also Published As

Publication number Publication date
CN104619858B (zh) 2017-06-06
HK1208890A1 (zh) 2016-03-18
WO2014019275A1 (en) 2014-02-06

Similar Documents

Publication Publication Date Title
CN104619858B (zh) 胎儿健康状态的无创性检测
US11773429B2 (en) Reduction of bias in genomic coverage measurements
Fooks et al. Emerging technologies for the detection of rabies virus: challenges and hopes in the 21st century
Hahn et al. Determination of fetal chromosome aberrations from fetal DNA in maternal blood: has the challenge finally been met?
CN107077537A (zh) 用短读测序数据检测重复扩增
CN105392896A (zh) 快速并灵敏基因型鉴定及核酸检测
CA3153071A1 (en) Systems, methods, and compositions for the rapid early-detection of host rna biomarkers of infection and early identification of covid-19 coronavirus infection in humans
US10844424B2 (en) Reduction of bias in genomic coverage measurements
CN108449999A (zh) 使用色酰胺-tRNA合成酶诊断感染病或其并发症的组合物以及检测诊断标记物的方法
CN110914456A (zh) 检测胎儿染色体异常的方法
Boyd et al. Development of multiplexed bead arrays for the simultaneous detection of nucleic acid from multiple viruses in bat samples
Tonoyan et al. Detection of epstein–barr virus in periodontitis: a review of methodological approaches
JP2013521799A (ja) マルチプレックスリキッドアレイシステムを用いた女性生殖器病原体の検出方法及びキット
CN112662754B (zh) 用于预测小耳畸形发生概率的组合物的应用方法
WO2023021978A1 (ja) 自己免疫疾患を検査する方法
US20170206310A1 (en) Noninvasive discrimination method and discrimination system of chromosomal heteroploidy of fetus
US20220148690A1 (en) Immunorepertoire wellness assessment systems and methods
KR101256984B1 (ko) Rt-pcr elisa를 이용한 e형 간염 바이러스 검출방법 및 키트
KR101768955B1 (ko) 에볼라 바이러스 진단용 프라이머 세트 및 이의 용도
KR100615420B1 (ko) 병원성 미생물의 무증폭 다중 정량 검출킷트 및 검출방법
CN109554490A (zh) 一种与复发性流产相关的微生物及其应用
US20170121774A1 (en) Methods and compositions for assessing predicting responsiveness to a tnf inhibitor
Lan et al. Strategic research on the molecular diagnostics industry in China
CN116254335A (zh) Adam12生物标志物在冠状动脉扩张症诊断中的应用
US20200087708A1 (en) System and method for isolation and qualification of nucleic acids

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Free format text: FORMER OWNER: BGI-SHENZHEN

Effective date: 20150729

Owner name: SHENZHEN BGI CORPORATION

Free format text: FORMER OWNER: BGI-SHENZHEN CO., LTD.

Effective date: 20150729

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20150729

Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer

Applicant after: BGI SHENZHEN CO LTD

Address before: 11F-3, Beishan Industrial Zone, 146 North Mountain Road, Yantian District, Guangdong, Shenzhen, China

Applicant before: BGI-Shenzhen Co., Ltd.

Applicant before: BGI-Shenzhen

REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1208890

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1208890

Country of ref document: HK