CN103797130B - 用于确定人体具有异常状态的系统和方法 - Google Patents

用于确定人体具有异常状态的系统和方法 Download PDF

Info

Publication number
CN103797130B
CN103797130B CN201280029759.1A CN201280029759A CN103797130B CN 103797130 B CN103797130 B CN 103797130B CN 201280029759 A CN201280029759 A CN 201280029759A CN 103797130 B CN103797130 B CN 103797130B
Authority
CN
China
Prior art keywords
nucleic acid
probe
abnormality
human body
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280029759.1A
Other languages
English (en)
Other versions
CN103797130A (zh
Inventor
李伟阳
曾玺
徐佳佳
蒋慧
杨玲
易赏
陈盛培
管彦芳
易鑫
胡学达
李英睿
张秀清
杨焕明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN2011101746862A external-priority patent/CN102839211A/zh
Priority claimed from PCT/CN2011/082855 external-priority patent/WO2013075313A1/zh
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201280029759.1A priority Critical patent/CN103797130B/zh
Publication of CN103797130A publication Critical patent/CN103797130A/zh
Application granted granted Critical
Publication of CN103797130B publication Critical patent/CN103797130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

提供了用于确定人体具有异常状态的系统和方法。其中,确定人体具有异常状态的方法包括:提供人体样本的核酸序列信息,该人体样本的核酸序列信息是基于对人体样本进行检测而获得的;以及基于人体样本的核酸序列信息,确定人体是否具有异常状态。

Description

用于确定人体具有异常状态的系统和方法
优先权信息
本申请请求2011年6月24日向中国国家知识产权局提交的、专利申请号为201110174686.2的专利申请,以及2011年11月24日向中国国家知识产权局提交的、专利申请号为PCT/CN2011/082855的专利申请的优先权和权益,并且通过参照将其全文并入此处。
技术领域
本发明涉及生物医学领域。更具体地,本发明涉及用于确定人体具有异常状态的系统和方法。
背景技术
HBV是一种全球性的慢性病毒感染性疾病。我国的乙肝病毒感染率约60%-70%,而乙肝表面抗原携带率约占总人口的7.18%,以此计算,全国约有9300万人携带乙肝病毒,其中乙肝患者大约有3000万。在全世界,大约有45%的人群生活在慢性HBV感染的高发区,43%的人群生活在慢性HBV感染的中发区,并且HBV为已知的引起肝硬化以及肝癌的主要原因,现已知HBV基因组与人类基因组整合为肝癌的主要诱因之一。EBV现已知为鼻咽癌的主要诱因,初发症状到死亡的自然病程从3~13个月不等,放射治疗后5年生存率为8%~62%。幽门螺旋杆菌为胃癌的主要诱因,并且慢性胃炎患者的胃粘膜活检标本中幽门螺杆菌检出率可达80%~90%,而消化性溃疡患者更高,可达95%以上,甚至接近100%。胃癌由于局部上皮细胞已发生异化,因此检出率高低报道不一。以上病原体,包括HBV,HCV,HIV,EBV,幽门螺旋杆菌等,均能够与宿主基因组进行整合,并且与引起的相关病症直接相关,能够对感染者造成持久和高危性的危害,是高致病性,高致癌性的高危型病原微生物。因此,建立一种无创的诊断及病程追踪监测手段,既能够免除对病原体感染患者进行病理组织取样的伤害,同时可以定期跟踪检测感染者感染程度以及治疗效果,提高感染患者的治愈率以及有利于及时地指导用药,对于由病原体引起的肿瘤晚期病人也可进行及时检测判断治愈效果以及复发的可能性,能够及时有效地对患者进行病情随访并给出最佳建议。
然而,现有技术并不能满足上述要求。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于提出一种具有能够有效确定人体异常状态的方法。本发明的另一目的在于提出一种能够有效确定人体异常状态的系统。
本发明是基于发明人的下列发现而完成的:在人体样本的检测过程中,对于蛋白质的检测,通常由于实验条件的限制,无法早期获得人体的状态信息。而利用核酸序列的特性,则可以通过对于离体的人体样本进行核酸分析,尽可能早期地对人体状态进行分析。
在本发明的一个方面,本发明提出了一种确定人体具有异常状态的方法。根据本发明的实施例,该方法包括:提供人体样本的核酸序列信息,所述人体样本的核酸序列信息是基于对所述人体样本进行检测而获得的;以及基于所述人体样本的核酸序列信息,确定所述人体是否具有异常状态。根据该实施例的方法,通过对人体样本的核酸序列信息进行分析,可以根据核酸序列中所包含的信息确定人体是否具有异常状态。由于核酸序列信息与原位状态的核酸信息保持一致,因而可以有效地确定人体是否具有异常状态。
另外,根据本发明上述实施例,上述确定人体具有异常状态的方法,还可以具有如下附加的技术特征:
根据本发明的一个实施例,所述人体样本的核酸序列信息是基于对所述人体样本进行核酸序列检测而获得的。由此,可以通过核酸序列检测方法,容易地获得人体样本的核酸序列信息,从而提高了确定人体具有异常状态的效率。根据进一步的实施例,所述核酸序列检测是借助第二代测序技术或第三代测序技术进行的。由此,可以高效地对人体样本进行核酸序列进行检测,并且能够实现高通量深度测序。本发明的发明人发现基于第二代测序技术和第三代测序技术的高效、高精度的性质,可以实现对人体样本核酸序列信息的高效、高精度检测,能够非常灵敏地对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例,所述样本为所述人体的细胞、组织、血液、体液、尿液、排泄物或其组合。由此,根据本发明的实施例的确定人体具有异常状态的方法能够应用于各种人体样本,并且能够根据不同的人体样本的特点,确定多种异常状态。
根据本发明的一个实施例,所述人体样本为血浆或者血清。根据该实施例,可以利用常规的方法获得人体的血浆和血清样本,并对其进行核酸序列分析,可以直接对人体的异常状态进行确定。
根据本发明的一个实施例,所述核酸序列信息包括所述人体样本中游离核酸的序列信息。由此,可以根据游离核酸的序列信息,对人体的异常状态进行确定。并且基于游离核酸的序列信息与人体正常的核酸序列或者病原体的核酸序列进行比对分析后,可以获得多种人体的异常状态。
根据本发明的一个实施例,所述人体样本中游离核酸的序列信息是通过除去所述人体样本中的细胞后,进行测序检测而获得的。由此,可以提高游离核酸的测序检测的精度和准确度,从而能够进一步有效地确定人体具有异常状态。
根据本发明的一个实施例,所述异常状态选自疾病的发生、疾病的发展阶段、疾病的疗效和预后的至少一种。由此,可以确定与人体密切相关的疾病的发生、发展、疗效以及预后,从而有利于制定有效的治疗方案。根据本发明进一步的实施例,所述疾病是肿瘤性疾病、免疫性疾病、遗传性疾病的至少一种。根据本发明的实施例的确定人体异常状态的方法,能够有效地确定人体是否患有肿瘤性疾病、免疫性疾病、遗传性疾病。根据具体的示例,所述肿瘤性疾病是选自肺癌、肝癌、胃癌、食管癌、结直肠癌、胰腺癌、乳腺癌、膀胱癌、肾癌、卵巢癌、宫颈癌、甲状腺癌、鼻咽癌、脑胶质瘤的至少一种。根据更进一步的示例,如果所述核酸序列信息包含选自下列至少一种的核酸片段序列:HBV、HPV、EBV、幽门螺旋杆菌,则确定所述人体患有宫颈癌、肝癌、鼻咽癌、胃癌的至少一种。由此,根据本发明的实施例的确定人体具有异常状态的方法,可以基于所检测的核酸序列信息,有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。
根据本发明的一个实施例,对核酸进行测序检测之前,可以利用探针去除含有特定序列的核酸,然后对所述去除后剩余的核酸进行测序检测。由此,可以通过探针除去具有特定序列的核酸,从而能够提高对剩余材料进行序列检测的精度和准确性。根据本发明的具体示例,用于去除特定序列的核酸的探针可以结合人体基因组中的共有序列,或者为可以结合人体基因组中甲基化位点的抗体或蛋白。由此,可以进一步提高检测的精度和准确性。
根据本发明的实施例,对所述核酸进行测序检测之前,还可以利用探针捕获含有特定序列的核酸,然后对所述含有特定序列的核酸进行测序检测。由此,可以通过探针,预先对进行核酸序列分析的核酸进行筛选,从而能够进一步提高确定人体具有异常状态的方法的效率。根据进一步的实施例,所述探针对于选自下列的至少一种是特异性的:HBV、HPV、EBV、幽门螺旋杆菌,由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。
因此,在本发明的另一方面,本发明还提供了一种核酸探针集。根据本发明的实施例,该核酸探针集包括多个探针,且具有以下特征:
(1)每个探针上具有1个或多个生物素标记的dNTP;和/或
(2)生物素标记的dNTP在核酸探针集中的丰度为1:6-1:2;和/或
(3)核酸探针集的全部核酸序列覆盖对应选自HBV、HPV、EBV和幽门螺旋杆菌的至少一种病毒的基因组序列的70%-100%。
在另一优选例中,本发明的核酸探针集具有1-20000个核酸探针;较佳地,核酸探针集具有1000-5000个核酸探针;更佳地,核酸探针集具有2500个核酸探针。
在另一优选例中,生物素标记的dNTP在核酸探针集中的丰度为1:4。
在另一优选例中,核酸探针集中,探针之间具有部分重叠。
在另一优选例中,核酸探针集(在本文中有时也称为“探针集”)中的探针长度为100-500bp;较佳地,探针长度为200-300bp;更佳地,探针长度为250bp。
在另一优选例中,探针是以病毒基因组作为模板,PCR法扩增获得的,较佳地,扩增模板为乙型肝炎病毒(HBV)基因组、丙型肝炎病毒(HCV)基因组、艾滋病病毒(HIV)基因组、乳头瘤病毒(HPV)基因组,或其组合;更佳地,扩增模板为B型HBV基因组和/或C型HBV基因组。
进一步,在本发明的又一方面,还提供了一种表面固定有本发明的核酸探针集的核酸芯片。
在本发明的再一方面,还提供了本发明的核酸探针集和核酸芯片的用途,用于检测病毒在待测样本中的整合方式;较佳地,整合方式选自下组:重排、异位、插入、替换,或其组合。
在本发明的另一方面,还提供了一种制备本发明的核酸探针的方法,包括步骤:
a.获得探针来源样本;
b.对步骤(a)获得的样本进行PCR扩增,PCR扩增体系的dNTP为生物素标记的dNTP,以便获得带有生物素标记的PCR扩增产物;
c.对步骤(b)获得的生物素标记的PCR扩增产物进行打断,得到片段化的生物素标记的PCR扩增产物,即为探针。
在另一优选例中,步骤(a)所述样本具有以下特征:
样本为含有核酸的病毒样本;和/或
样本为病毒粒子、血清、血液、组织样本、脱落细胞,上皮细胞,或其组合;和/或
样本选自下组:乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、艾滋病病毒(HIV)、乳头瘤病毒(HPV),或其组合;和/或
样本为B型HBV和/或C型HBV。
在另一优选例中,步骤(b)具有以下特征:
步骤(b)所述的扩增为对样本中病毒DNA全长进行扩增;和/或
步骤(b)所述标记的dNTP为biotin-dNTP,且标记的dNTP能够与链霉素亲和磁珠结合;和/或
步骤(b)所述标记的dNTP与非标记dNTP的比例为1:2-8;优选比例为1:3-6;更优选比例为1:4。
在另一优选例中,步骤(c)所述打断为超声法打断。
在另一优选例中,还包括步骤(d):对步骤(c)获得的探针进行纯化和/或定量。
在另一优选例中,根据本发明的制备核酸探针的方法制备的探针,其长度为100-500bp;较佳地,探针的长度为200-300bp,更佳地,探针的长度为250bp。
在本发明的又一方面,本发明还提供了一种检测病毒在待测样本中基因整合方式的方法,包括步骤:
(i)获得待测样本;
(ii)对步骤(i)获得的样本进行文库构建;
(iii)将本发明的探针与步骤(ii)获得的文库进行杂交,捕获与病毒基因整合有关的核酸序列;
(iv)对步骤(iii)捕获的核酸序列进行扩增,获得与病毒整合有关的扩增产物;
(v)对步骤(iv)获得的扩增产物进行测序,获得与病毒整合方式有关核酸信息。
在另一优选例中,步骤(i)具有以下特征:
所述待测样本为组织、血液、脱落细胞,上皮细胞;和/或
所述待测样本来源于人或非人哺乳动物,较佳地来源于人;和/或
所述待测样本来源于HBV感染者或肝癌患者。
在另一优选例中,步骤(iii)具有以下特征:
所述探针为变性的单链DNA;和/或
在杂交液中加入接头封闭分子和标签封闭分子;和/或
所述接头封闭分子的序列如SEQIDNO:8所示;和/或
所述标签封闭分子的序列如SEQIDNO:9和SEQIDNO:10所示。
在另一优选例中,在步骤(v)中,将所述的扩增产物与固相载体上固定的测序探针进行杂交,进行固相桥式PCR扩增,形成测序簇;然后对所述测序簇用“边合成-边测序”法进行测序,从而得到与病毒整合方式有关核酸信息。
在另一优选例中,在步骤(ii)中,所述的文库构建为:对打断的基因组DNA进行末端修复,加入接头,对具有接头的片段进行扩增,获得的带有接头的扩增混合物即为样本文库。
在另一优选例中,所述的接头具有如SEQIDNO:1和SEQIDNO:2所示的序列;和/或,所构建的文库具有如SEQIDNO:3和SEQIDNO:4所示的标签序列。
在本发明的又一方面,本发明还提供了一种可用于本发明前面所述方法的试剂盒,所述试剂盒包括:
(1)第一容器以及位于容器内前面所述的核酸芯片,或本发明前面所述的探针;
(2)第二容器以及位于容器内的用于构建样本文库的接头;
(3)第三容器以及位于容器内的接头封闭分子;
(4)第四容器以及位于容器内的标签封闭分子;
(5)检测说明书。
在另一优选例中,所述试剂盒还包括选自下组的试剂:
用于进行PCR扩增所需的试剂、
用于进行封闭反应所需的试剂、
用于进行杂交反应所需的试剂、
用于进行测序反应所需的试剂、
或其组合。
在本发明的另一方面,本发明还提供了一种可用于本发明前面所述方法的试剂盒,所述试剂盒包括:
前面所述的核酸芯片或前面所述的探针;接头;接头封闭分子;以及标签封闭分子。
根据本发明的实施例,在该试剂盒中,所包含的成分被设置在不同的容器中,由此,可以方便使用。根据本发明的实施例,该试剂盒还包括选自下组的试剂:用于进行PCR扩增所需的试剂、用于进行封闭反应所需的试剂、用于进行杂交反应所需的试剂、用于进行测序反应所需的试剂、或其组合。
在本发明的另一方面,本发明还提供了一种用于确定人体具有异常状态的系统。根据本发明的实施例,该系统包括:核酸序列信息接收器,所述核酸序列信息接收器接收人体样本的核酸序列信息;以及核酸序列信息分析器,所述核酸序列信息分析器与所述核酸序列信息接收器相连,并基于所述人体样本的核酸序列信息,确定所述人体是否具有异常状态。利用该系统,可以有效地实施根据本发明实施例的确定人体具有异常状态的方案,其具有本发明实施例的确定人体具有异常状态的方法的全部优点,在此不再赘述。
另外,根据本发明上述实施例,上述确定人体具有异常状态的系统,还可以具有如下附加的技术特征:
根据本发明的一个实施例,所述核酸序列信息分析器内预存有选自下列的至少一种:人体正常状态的基因组序列、病原体的基因组序列、正常人群的基因组序列。从而可以有效地对核酸序列进行分析,提高了用于确定人体具有异常状态的系统的效率。根据进一步的实施例,所述病原体为选自HBV、HPV、EBV、幽门螺旋杆菌的至少一种。由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。
根据本发明的一个实施例,进一步包括核酸序列检测装置,所述核酸序列检测装置与所述核酸序列信息接收器相连,用于对所述人体样本进行核酸序列检测获得所述核酸序列信息并输送至所述核酸序列信息接收器。由此,可以直接对核酸进行序列检测,并且输送至核酸序列接收器,进而进行核酸序列分析,从而确定人体是否具有异常状态从而提高了确定人体具有异常状态的效率。根据进一步的实施例,所述核酸序列检测装置借助第二代测序技术或第三代测序技术。由此,可以高效地对人体样本进行核酸序列进行检测,并且能够实现高通量深度测序。本发明的发明人发现基于第二代测序技术和第三代测序技术的高效、高精度的性质,可以实现对人体样本核酸序列信息的高效、高精度检测,能够非常灵敏地对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例,进一步包括游离核酸捕获装置,所述游离核酸捕获装置与所述核酸序列检测装置相连,其中,所述游离核酸捕获装置设置有探针,所述探针适于捕获含有特定序列的核酸,并且将所述含有特定序列的核酸输送至所述核酸序列检测装置进行核酸序列检测;或者所述探针适于除去含有特定序列的核酸,并且将经过所述除去的核酸输送至所述核酸序列检测装置进行核酸序列检测。由此,对所述核酸进行测序检测之前,利用探针捕获含有特定序列的核酸,然后对所述含有特定序列的核酸进行测序检测。由此,可以通过探针,预先对进行核酸序列分析的核酸进行筛选,从而能够进一步提高确定人体具有异常状态的方法的效率。根据进一步的实施例,所述探针对于选自下列的至少一种是特异性的:HBV、HPV、EBV、幽门螺旋杆菌,其来源于前面所述的本发明的核酸探针集,具有其全部优点,在此不再赘述。由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。或者,可以通过探针除去具有特定序列的核酸,从而能够提高对剩余材料进行序列检测的精度和准确性。根据本发明的具体示例,用于去除特定序列的核酸的探针可以结合人体基因组中的共有序列,或者为可以结合人体基因组中甲基化位点的抗体或蛋白。由此,可以进一步提高检测的精度和准确性。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的确定人体具有异常状态的方法的流程示意图;
图2是根据本发明另一个实施例的确定人体具有异常状态的方法的流程示意图;
图3是根据本发明又一个实施例的确定人体具有异常状态的方法的流程示意图;
图4是根据本发明一个实施例的用于确定人体具有异常状态的系统的示意图;
图5是根据本发明另一个实施例的用于确定人体具有异常状态的系统的示意图;
图6是根据本发明又一个实施例的用于确定人体具有异常状态的系统的示意图;
图7是根据本发明又一个实施例的对HBV全基因组PCR扩增后的电泳检测结果;
图8是根据本发明又一个实施例的对HBV全长产物打断后的电泳检测结果;
图9是根据本发明又一个实施例的建库杂交后一种文库的片断大小检测结果;以及
图10是根据本发明又一个实施例的建库杂交另一种文库的片断大小检测结果。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,一体地连接,也可以是可拆卸连接;可以是机械连接或电连接,也可以是两个元件内部的连通;可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
本发明是基于本发明的下列发现而完成的:在人体样本的检测过程中,对于蛋白质的检测,通常由于实验条件的限制,无法直接对应其原位状态的信息,而核酸序列由于其自身性质比较稳定,因而在对于离体的人体样本进行核酸分析的结果可以直接对应其原位状态的信息,进而可以有效地对人体的状态进行分析。
下面参考附图,首先对根据本发明实施例的确定人体具有异常状态的方法进行详细描述。
参考图1,根据本发明实施例的确定人体具有异常状态的方法包括以下步骤:
步骤100:提供人体样本的核酸序列信息;以及
步骤200:基于人体样本的核酸序列信息,确定人体是否具有异常状态。
根据该实施例的方法,通过对人体样本的核酸序列信息进行分析,可以根据核酸序列中所包含的信息确定人体是否具有异常状态。由于核酸序列信息与原位状态的核酸信息保持一致,因而可以有效地确定人体是否具有异常状态。
在本发明中,术语“人体”应作广义理解,其并不限于人,其可以是任何能够通过核酸信息预测异常状态的生命体。在本发明中,术语“核酸”可以是任何包含脱氧核糖核苷酸或者核糖核苷酸的聚合物,包括但不限于经过修饰的或者未经修饰的DNA、RNA,其长度不受任何特别限制。在本发明中,术语“核酸序列信息”,是指核酸序列所包含的所有信息,包括但不限于核酸的碱基序列、是否被修饰等信息。在本发明中,术语“人体样本”的含义不受特别限制,可以应用于本发明实施例的人体样本的类型,包括但不限于人体的细胞、组织、血液、体液、尿液、排泄物或其组合,更具体的示例包括血浆或血清。更进一步的示例中,采用血浆作为人体样本。本申请的发明人发现选择血浆作为研究样本,背景噪音会较小,检测结果精度高。本领域技术人员可以根据需要选择进行检测和分析的样本类型。由此,根据本发明的实施例的确定人体具有异常状态的方法能够应用于各种人体样本,并且能够根据不同的人体样本的特点,确定多种异常状态。
在本发明中,术语“异常状态”是指人体与正常状态不同的状态,包括但不限于生理状态、心理状态,例如病理状态。根据本发明的一个实施例,异常状态选自疾病的发生、疾病的发展阶段、疾病的疗效和预后的至少一种。由此,可以确定与人体密切相关的疾病的发生、发展、疗效以及预后,从而有利于制定有效的治疗方案。根据本发明进一步的实施例,疾病是肿瘤性疾病、免疫性疾病、遗传性疾病的至少一种。由此,根据本发明的实施例的确定人体异常状态的方法,能够有效地确定人体是否患有肿瘤性疾病、免疫性疾病、遗传性疾病。根据具体的示例,所述肿瘤性疾病是选自肺癌、肝癌、胃癌、食管癌、结直肠癌、胰腺癌、乳腺癌、膀胱癌、肾癌、卵巢癌、宫颈癌、甲状腺癌、鼻咽癌、脑胶质瘤的至少一种。根据更进一步的示例,如果所述核酸序列信息包含选自下列至少一种的核酸片段序列:HBV、HPV、EBV、幽门螺旋杆菌,则确定所述人体患有宫颈癌、肝癌、鼻咽癌、胃癌的至少一种。由此,根据本发明的实施例的确定人体具有异常状态的方法,可以基于所检测的核酸序列信息,有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。
根据本发明的实施例,人体样本的核酸序列信息的来源并不受特别限制。根据本发明的一个实施例,人体样本的核酸序列信息是基于对人体样本进行检测而获得的。根据本发明的实施例,检测人体样本而获得人体样本的核酸序列信息的方法并不受特别限制,可以直接对人体样本进行核酸序列测序分析而获得,也可以通过其他方法例如质谱等。根据本发明的一些示例,可以基于对人体样本直接进行核酸序列检测而获得人体样本的核酸序列信息。即,如图2所示,根据本发明实施例,进一步包括步骤300:对核酸序列进行检测。由此,可以通过核酸序列检测方法,容易地获得人体样本的核酸序列信息,从而提高了确定人体具有异常状态的效率。根据更具体的示例,可以借助第二代测序技术或第三代测序技术进行核酸序列检测。由此,以边合成边测序方法为代表的第二代测序技术,以及以单分子测序为代表的第三代测序方法可以高效地对人体样本进行核酸序列进行检测,并且能够实现高通量深度测序。本发明的发明人发现基于第二代测序技术和第三代测序技术的高效、高精度的性质,可以实现对人体样本核酸序列信息的高效、高精度检测,能够非常灵敏地对人体样本中痕量的核酸进行检测,从而进一步提高确定人体存在异常状态的效率。这里所使用的术语“高通量”是指可以同时对大量的核酸进行测序检测,术语“深度”是指可以对核酸进行重复多次检测,例如在实施例1中可以进行100轮测序检测,当然根据样本的不同,重复的次数也可以根据需要进行选择。当然,本领域技术人员能够预见的是,未来可以采用其他更先进的测序技术。目前可以利用的第二代测序技术包括但不限于Illumina/HiSeq2000、Roche/454、ABI/SOLiD。在本发明的一个实施例中,所采用的测序方法为Illumina/HiSeq2000。
根据本发明的实施例,对核酸序列信息进行分析,从而确定异常状态的方法,不受特别限制。可以是在获得核酸序列信息后,与人体的正常基因组信息或者病原体的基因组信息进行比对,得到比对结果后,进行判断人体是否具有异常状态。也可以基于,核酸序列在样本中的含量来判断,人体的异常状态。根据本发明的实施例,可以通过分析人体样本中,游离核酸的含量,来确定人体是否存在异常状态。如实施例1所示,本发明的发明人发现,在癌症患者的外周血中,游离核酸的含量远高于正常人外周血中游离核酸的含量(为至少大约10倍)。根据本发明另外的实施例,可以分析人体样本中,游离核酸序列中是否存在突变位点或者经修饰的位点例如甲基化位点,从而判断个体是否存在某些特定的异常状态。具体地,可以采用常用的比对软件进行操作,根据本发明的一个示例,采用SOAP软件包进行比对分析,由此,能够高效地对核酸序列信息进行分析,并得到准确和精确的结果。
根据本发明的实施例,可以用于本发明实施例的确定人体具有异常状态的方法的核酸类型不受特别限制,根据本发明的一个实施例,所采用的核酸序列信息包括人体样本中游离核酸的序列信息。由此,可以根据游离核酸的序列信息,对人体的异常状态进行确定。并且基于游离核酸的序列信息与人体正常的核酸序列或者病原体的核酸序列进行比对分析后,可以获得多种人体的异常状态。为了方便理解,下面对游离核酸进行详细描述。
在本发明中,所使用的术语“游离核酸”是指在细胞外的游离状态的核酸,可以是DNA、RNA或者其他类型的核酸。本发明的发明人发现,正常状态下,会有少量的核酸由于代谢而进入到外周血中而成为游离核酸,而在异常状态下,例如癌症病人体内,游离核酸的含量大大高于正常状态下的游离核酸含量。发明人发现,在癌症病人体内,游离核酸(如游离DNA)的含量取决于肿瘤的生物学特性,即与肿瘤细胞的恶性程度、侵袭程度、是否发生转移、疾病进程等相关。因而,可以通过分析人体样本中游离核酸的含量,来确定人体是否存在异常状态,例如患有肿瘤性疾病,以及确定肿瘤性疾病的进展阶段,侵袭程度等。从而,为选择有效的治疗方案,提供有利的信息。另外,对于某些由于病原体引起的疾病,在人体样本中,可能会存在这样的游离核酸,即,它属于病原体基因组序列的一部分,这样可以确定人体已经被这些病原体侵染并且处于疾病的发生阶段。甚至有些个体样本中的游离核酸既包含病原体基因组的一部分序列,也包含人体基因组的某些序列,这样可以确定这些病原体基因组已经与人体基因组发生了整合重组。由此,可以判断个体的异常状态的阶段。根据本发明的一个实施例,人体样本中游离核酸的序列信息是通过除去人体样本中的细胞后,进行测序检测而获得的。由此,可以提高游离核酸的测序检测的精度和准确度,从而能够进一步有效地确定人体具有异常状态。
另外,根据本发明的实施例,对所述核酸进行测序检测之前,还可以包括步骤400,如图3所示,即利用探针捕获含有特定序列的核酸,然后对含有特定序列的核酸进行测序检测。由此,可以通过探针,预先对进行核酸序列分析的核酸进行筛选,从而能够进一步提高确定人体具有异常状态的方法的效率。另外,本发明的发明人惊奇地发现,通过此步骤,可以提高检测到与人体基因组发生整合的游离核酸的效率。
本领域技术人员能够理解,所使用的探针类型可以根据检测的目的进行改变,即可以根据所期望的特定序列来选择所使用的探针类型。根据本发明的实施例,特定序列可以是外源核酸序列,也可以是含有突变位点的人基因组部分序列,也可以是含有修饰位点例如甲基化的人基因组部分序列。根据进一步的实施例,所述探针对于选自下列的至少一种是特异性的:HBV、HPV、EBV、幽门螺旋杆菌,其可以以包括多个探针的核酸探针集的形式提供,并且其具有以下特征:(1)每个探针上具有1个或多个生物素标记的dNTP;和/或(2)生物素标记的dNTP在核酸探针集中的丰度为1:6-1:2;和/或(3)核酸探针集的全部核酸序列覆盖对应选自HBV、HPV、EBV和幽门螺旋杆菌的至少一种病毒的基因组序列的70%-100%。在另一优选例中,本发明的核酸探针集具有1-20000个核酸探针;较佳地,核酸探针集具有1000-5000个核酸探针;更佳地,核酸探针集具有2500个核酸探针。在另一优选例中,生物素标记的dNTP在核酸探针集中的丰度为1:4。在另一优选例中,核酸探针集中,探针之间具有部分重叠。在另一优选例中,核酸探针集(在本文中有时也称为“探针集”)中的探针长度为100-500bp;较佳地,探针长度为200-300bp;更佳地,探针长度为250bp。在另一优选例中,探针是以病毒基因组作为模板,PCR法扩增获得的,较佳地,扩增模板为乙型肝炎病毒(HBV)基因组、丙型肝炎病毒(HCV)基因组、艾滋病病毒(HIV)基因组、乳头瘤病毒(HPV)基因组,或其组合;更佳地,扩增模板为B型HBV基因组和/或C型HBV基因组。由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。
另外,根据本发明的实施例,可以在对核酸进行测序之前,通过使用特定的探针除去某些含有特定序列的核酸,例如人类基因组中的共有序列,从而提高确定人类具有异常状态的方法的准确性。具体地,可以在对所述核酸进行测序检测之前,利用探针去除含有特定序列的核酸,然后对所述去除后剩余的核酸进行测序检测。这些用于除去含有特定序列的核酸的探针如同用于捕获含有特定序列的核酸的探针一样,它们的类型不受特别限制,可以为核酸、蛋白质以及任何小分子,只要其能够特异性地结合特定的序列即可。另外,为了除去含有特定序列的核酸,所采用的探针能够结合人体基因组中的共有序列,或者也可以是能够结合人体基因组中甲基化位点的抗体或者蛋白。可以根据具体的情况对所采用的探针的类型,以及是需要对样本进行核酸捕获,还是需要进行特异性去除。
在本发明的另一方面,本发明提供了一种用于确定人体具有异常状态的系统,其可以有效地实施上述根据本发明实施例的确定人体具有异常状态的方法。根据本发明的实施例,参考图4,该系统包括:核酸序列信息接收器500、以及核酸序列信息分析器600。其中,核酸序列信息接收器500接收人体样本的核酸序列信息,核酸序列信息分析器600与核酸序列信息接收器500相连,并基于人体样本的核酸序列信息,确定人体是否具有异常状态。利用该系统,可以有效地实施根据本发明实施例的确定人体具有异常状态的方案,其具有本发明实施例的确定人体具有异常状态的方法的全部优点,在此不再赘述。
如前所述,根据本发明实施例,对核酸序列信息进行分析的方法不受特别限制,根据具体地示例,可以通过将核酸序列信息与人体正常状态的基因组序列、病原体的基因组序列、正常人群的基因组序列进行比对而确定人体是否具有异常状态。人体正常状态的基因组序列、病原体的基因组序列、正常人群的基因组序列的存放位置不受特别限制,可以存储在远程的数据库中。根据本发明的一个实施例,核酸序列信息分析器500内可以预存有选自下列的至少一种:人体正常状态的基因组序列、病原体的基因组序列、正常人群的基因组序列。由此,从而可以有效地对核酸序列进行分析,提高了用于确定人体具有异常状态的系统的效率。根据进一步的实施例,所述病原体为选自HBV、HPV、EBV、幽门螺旋杆菌的至少一种。由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。通过将核酸序列信息与人体正常状态的基因组序列(即将同一身体在不同状态下的基因组信息)进行比对,可以确定人体在一段时间内的状态变化。另外,通过将人体样本的核酸序列信息与正常人群的基因组序列信息进行比对,可以获知与正常人相比的异常状态。
根据本发明的实施例,进行分析的核酸序列信息的来源不受特别限制。根据本发明的一个实施例,参考图5,本发明的用于确定人体具有异常状态的系统可以进一步包括核酸序列检测装置700。该核酸序列检测装置700与核酸序列信息接收器500相连,用于对述人体样本进行核酸序列检测获得核酸序列信息并输送至核酸序列信息接收器500,进而进行分析和确定人体是否存在异常状态。由此,可以直接对核酸进行序列检测,并且输送至核酸序列接收器500,进而进行核酸序列分析,从而确定人体是否具有异常状态从而提高了确定人体具有异常状态的效率。根据进一步的实施例,所述核酸序列检测装置借助第二代测序技术或第三代测序技术。由此,可以高效地对人体样本进行核酸序列进行检测,并且能够实现高通量深度测序。本发明的发明人发现基于第二代测序技术和第三代测序技术的高效、高精度的性质,可以实现对人体样本核酸序列信息的高效、高精度检测,能够非常灵敏地对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例,参考图6,本发明的用于确定人体具有异常状态的系统还可以进一步包括游离核酸捕获装置800,该游离核酸捕获装置800与核酸序列检测装置700相连,并且游离核酸捕获装置800设置有探针,这些探针适于捕获含有特定序列的核酸,并且将含有特定序列的核酸输送至核酸序列检测装置700进行核酸序列检测。由此,对所述核酸进行测序检测之前,利用探针捕获含有特定序列的核酸,然后对所述含有特定序列的核酸进行测序检测。由此,可以通过探针,预先对进行核酸序列分析的核酸进行筛选,从而能够进一步提高确定人体具有异常状态的方法的效率。另外,本发明的发明人惊奇地发现,通过此步骤,可以提高检测到与人体基因组发生整合的游离核酸的效率。
本领域技术人员能够理解,所使用的探针类型可以根据检测的目的进行选择,即可以根据所期望的特定序列来选择所使用的探针类型。根据本发明的实施例,特定序列可以是外源核酸序列,也可以是含有突变位点的人基因组部分序列,也可以是含有修饰位点例如甲基化的人基因组部分序列。根据进一步的实施例,所述探针对于选自下列的至少一种是特异性的:HBV、HPV、EBV、幽门螺旋杆菌,其可以以包括多个探针的核酸探针集的形式提供,并且其具有以下特征:(1)每个探针上具有1个或多个生物素标记的dNTP;和/或(2)生物素标记的dNTP在核酸探针集中的丰度为1:6-1:2;和/或(3)核酸探针集的全部核酸序列覆盖对应选自HBV、HPV、EBV和幽门螺旋杆菌的至少一种病毒的基因组序列的70%-100%。在另一优选例中,本发明的核酸探针集具有1-20000个核酸探针;较佳地,核酸探针集具有1000-5000个核酸探针;更佳地,核酸探针集具有2500个核酸探针。在另一优选例中,生物素标记的dNTP在核酸探针集中的丰度为1:4。在另一优选例中,核酸探针集中,探针之间具有部分重叠。在另一优选例中,核酸探针集(在本文中有时也称为“探针集”)中的探针长度为100-500bp;较佳地,探针长度为200-300bp;更佳地,探针长度为250bp。在另一优选例中,探针是以病毒基因组作为模板,PCR法扩增获得的,较佳地,扩增模板为乙型肝炎病毒(HBV)基因组、丙型肝炎病毒(HCV)基因组、艾滋病病毒(HIV)基因组、乳头瘤病毒(HPV)基因组,或其组合;更佳地,扩增模板为B型HBV基因组和/或C型HBV基因组。由此,可以有效地确定人体是否患有肝癌、宫颈癌、鼻咽癌或胃癌。根据本发明的具体实施例,可以采用HPV的E1基因区域的特异性序列作为探针。由此,能够高效准确地确定患者体内的HPV是否已经与患者体内的基因组发生整合,从而判断个体是否患有宫颈癌。根据本发明的一些具体示例,可以采用HPV的全长序列作为探针,由此,能够高效地准确地确定患者体内的HPV是否已经与患者体内的基因组发生整合,从而判断个体宫颈病变程度。另外,根据本发明的具体示例,可以采用HBV的X基因和/或C基因中的特异性序列作为探针,由此,能够高效地准确地确定患者体内的HBV是否已经与患者体内的基因组发生整合,从而判断个体是否患有肝癌。根据本发明的一些实施例,可以采用HBV的全长基因区域的特异性序列作为探针,由此,能够高效地准确地确定患者体内的HBV是否已经与患者体内的基因组发生整合,从而判断个体肝炎病变程度。
另外,根据本发明的实施例,还可以采用这样的探针,其能够除去含有特定序列的核酸,从而可以在对核酸进行测序之前,通过使用特定的探针除去某些含有特定序列的核酸,例如人类基因组中的共有序列,从而提高确定人类具有异常状态的方法的准确性。具体地,可以在对所述核酸进行测序检测之前,利用探针去除含有特定序列的核酸,然后对所述去除后剩余的核酸进行测序检测。这些用于除去含有特定序列的核酸的探针如同用于捕获含有特定序列的核酸的探针一样,它们的类型不受特别限制,可以为核酸、蛋白质以及任何小分子,只要其能够特异性地结合特定的序列即可。另外,为了除去含有特定序列的核酸,所采用的探针能够结合人体基因组中的共有序列,或者也可以是能够结合人体基因组中甲基化位点的抗体或者蛋白。可以根据具体的情况对所采用的探针的类型,以及是需要对样本进行核酸捕获,还是需要进行特异性去除。
为了方便理解,下面提供具体的实施例,对本发明的技术方案进行解释,需要说明的是,这些实施例仅仅是为了说明目的,而不以任何方式限制本发明的范围。除非特别说明,实施例中未注明具体条件的,均为按照常规条件或制造商建议的条件进行。下列实施例中,所用试剂或仪器未注明生产厂商的,均为可以通过市购获得的常规产品。所使用的测序用的接头和标签序列(Index)来源于Illumina公司的MultiplexingSamplePreparationOligonutideKit。
实施例1:
1.样本文库制备
1.1样本来源
样品的来源为同一患者的肝癌组织,且此患者肝癌组织有全基因组测序信息。
1.2样本文库制备
文库构建按照Illumina公司的标准文库制备流程说明书(Paired-EndSamplePreparationGuide)进行构建,具体方法如下:
采用Covariss2打断基因组DNA,末端补平修复,末端加A,加入接头,建库过程所用的接头序列为:
5’-GATCGGAAGAGCACACGTCTGAACTCCAGTCAC-3’(SEQIDNO:1);
5’-TACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’(SEQIDNO:2)
对加入接头的片段进行PCR,得到样本文库,所构建的文库带有Index标签序列,其中Index序列如下:
5'-CAAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’(SEQIDNO:3);
5'-CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3’(SEQIDNO:4)。
将样本分别做成两种片段大小文库,对构建文库片段进行片段大小检测,主带为170bp左右和800bp左右。
2.制备HBV探针
2.1引物设计
本实施例中,所设计的引物为:
P1:TTTTTCACCTCTGCCTAATCA(SEQIDNO:5);
P2:AAAAAGTTGCATGGTGCTGG(SEQIDNO:6)
2.2PCR反应体系
PCR反应体系见表1。
表1
LA Taq 0.25μl
10×LA buffer(Mg+2.00mM) 2.5μl
dNTP(2.5mM) 4μl
P1(10μM) 1.5μl
P2(10μM) 1.5μl
HBV病毒基因组(1ng/μl) 3μl
H2O 12.25μl
总体积 25μl
(注:dNTP中biotin-dNTP与普通dNTP的比例是1:4,总浓度为2.5mM)
2.3PCR反应条件
PCR反应在AB-9700PCR仪上进行,反应程序见表2。
表2
2.4PCR产物纯化及电泳检测
反应结束后,采用1%琼脂糖凝胶电泳检测PCR产物,并用1.2-1.5倍体积AMPUREBEADS纯化,采用80μl水溶解。然后采用250MinElutePCRPurificationKit纯化,采用60μl水溶解。其中,PCR产物的1%琼脂糖凝胶电泳检测结果见图7,结果表明,扩增并纯化出了大小约3.2K的HBV的片段。
其中,HBV基因组序列(HepatitisBvirusserotypeadr,completegenome)如下:
CTCGAGGACTGGGGACCCTGCACCGAACATGGAGAGCACAACATCAGGATTCCTAGGACCCCTGCTCGTGTTACAGGCGGGGTTTTTCTTGTTGACAAGAATCCTCACAATACCACAGAGTCTAGACTCGTGGTGGACTTCTCTCAATTTTCTAGGGGGAGCACCCACGTGTCCTGGCCAAAATTCGCAGTCCCCAACCTCCAATCACTCACCAACCTCTTGTCCTCCAATTTGTCCTGGTTATCGCTGGATGTGTCTGCGGCGTTTTATCATATTCCTCTTCATCCTGCTGCTATGCCTCATCTTCTTGTTGGTTCTTCTGGACTACCAAGGTATGTTGCCCGTTTGTCCTCTACTTCCAGGAACATCAACTACCAGCACGGGACCATGCAAGACCTGCACGATTCCTGCTCAAGGAACCTCTATGTTTCCCTCTTGTTGCTGTACAAAACCTTCGGACGGAAACTGCACTTGTATTCCCATCCCATCATCCTGGGCTTTCGCAAGATTCCTATGGGAGTGGGCCTCAGTCCGTTTCTCCTGGCTCAGTTTACTAGTGCCATTTGTTCAGTGGTTCGCAGGGCTTTCCCCCACTGTTTGGCTTTCAGTTATATGGATGATGTGGTATTGGGGGCCAAGTCTGTACAACATCTTGAGTCCCTTTTTACCTCTATTACCAATTTTCTTTTGTCTTTGGGTATACATTTGAACCCTAATAAAACCAAACGTTGGGGCTACTCCCTTAACTTCATGGGATATGTAATTGGAAGTTGGGGTACTTTACCACAGGAACATATTGTATTAAAACTCAAGCAATGTTTTCGAAAACTGCCTGTAAATAGACCTATTGATTGGAAAGTATGTCAAAGAATTGTGGGTCTTTTGGGCTTTGCTGCCCCTTTTACACAATGTGGCTATCCTGCCTTGATGCCTTTGTATGCATGTATACAATCTAAGCAGGCTTTCACTTTCTCGCCAACTTATAAGGCCTTTCTGTGTCAACAATACCTGCACCTTTACCCCGTTGCCCGGCAACGGTCAGGTCTCTGCCAAGTGTTTGCTGACGCAACCCCCACTGGATGGGGCTTGGCCATAGGCCATCGGCGCATGCGTGGAACCTTTGTGGTTCCTCTGCCGATCCATACTGCGGAACTCCTAGCAGCTTGTTTTGCTCGCGACCGGTCTGGAGCAAAACTTATCGGGACTGACAACTCGGTTGTCCTCTCTCGGAAATACACCTCCTTCCCATGGCTGCTCGGGTGTGCTGCCAACTGGATCCTGCGCGGGACGTCCTTTGTCTACGTCCCGTCGGCGCTGAATCCCGCGGACGACCCGTCTCGGGGCCGTTTGGGCCTCTACCGTCCCTTGCTTTCTCTGCCGTTCCAGCCGACCACGGGGCGCACCTCTCTTTACGCGGTCTCCCCGTCTGTGCCTTCTCATCTGCCGGACCGTGTGCACTTCGCTTCACCTCTGCACGTCGCATGGAGACCACCGTGAACGGCCACCAGGTCTTGCCCAAGCTCTTACATAAGAGGACTCTTGGACTCTCAGCAATGTCAACAACCGACCTTGAGGCATACTTCAAAGACTGTTTGTTTAAAGACTGGGAGGAGTTGGGGGAGGAGATTAGGTTAAAGGTCTTTGTACTAGGAGGCTGTAGGCATAAATTGGTCTGTTCACCAGCACCATGCAACTTTTTCACCTCTGCCTAATCATCTCATGTTCATGTCCTACTGTTCAAGCCTCCAAGCTGTGCCTTGGGTGGCTTTGGGGCATGGACATTGACCCGTATAAAGAATTTGGAGCTTCTGTGGAGTTACTCTCTTTTTTGCCTTCTGACTTCTTTCCTTCTATTCGAGATCTCCTCGACACCGCCTCTGCTCTGTATCGGGAGGCCTTAGAGTCTCCGGAACATTGTTCACCTCACCATACAGCACTCAGGCAAGCTATTCTGTGTTGGGGTGAGTTGATGAATTTGGCCACCTGGGTGGGAAGTAATTTGGAAGACCCAGCATCCAGGGAATTAGTAGTCAGCTATGTCAATGTTAATATGGGCCTAAAAATCAGACAACTATTGTGGTTTCATATTTCCTGTCTTACTTTTGGAAGAGAAACTGTTCTTGAGTATTTGGTGTCTTTTGGAGTGTGGATTCGCACTCCTCCCGCTTACAGACCACCAAATGCCCCTATCTTATCAACACTTCCGGAAACTACTGTTGTTAGACGACGAGGCAGGTCCCCTAGAAGAAGAACTCCCTCGCCTCGCAGACGAAGGTCTCAATCGCCGCGTCGCAGAAGATCTCAATCTCGGGAATCTCAATGTTAGTATCCCTTGGACTCATAAGGTGGGAAACTTTACTGGGCTTTATTCTTCTACTGTACCTGTCCTTAATCCTGAGTGGCAAACTCCCTCCTTTCCTAACATTCATTTACAGGAGGACATTATTAATAGATGTCAACAATATGTGGGCCCTCTTACAGTTAATGAAAAAAGGAGATTAAAATTAATTATGCCTGCTAGGTTCTATCCTAACCTTACCAAATATTTGCCCTTGGATAAAGGCATTAAACCTTATTATCCTGAACATGCAGTTAATCATTACTTCAAAACTAGGCATTATTTACATACTCTGTGGAAGGCTGGCATTCTATATAAAAGAGAAACTACACGCAGCGCTTCATTTTGTGGGTCACCATATTCTTGGGAACAAGAGCTACGGCATGGGAGGTTGGTCTTCCAAACCTCGACAAGGCATGGGGACGAATCTTTCTGTTCCCAATCCTCTGGGATTCTTTCCCGATCACCAGTTGGACCCTGCGTTCGGAGCCAACTCAAACAATCCAGATTGGGACTTCAACCCCAACAAGGATCACTGGCCAGAGGCAATCAAGGTAGGAGCGGGAGACTTCGGGCCAGGGTTCACCCCACCACACGGCGGTCTTTTGGGGTGGAGCCCTCAGGCTCAGGGCATATTGACAACAGTGCCAGCAGCGCCTCCTCCTGTTTCCACCAATCGGCAGTCAGGAAGACAGCCTACTCCCATCTCTCCACCTCTAAGAGACAGTCATCCTCAGGCCATGCAGTGGAACTCCACAACATTCCACCAAGCTCTGCTAGATCCCAGAGTGAGGGGCCTATATTTTCCTGCTGGTGGCTCCAGTTCCGGAACAGTAAACCCTGTTCCGACTACTGTCTCACCCATATCGTCAATCTT(SEQIDNO:7)。
2.5PCR产物片段化
将经过纯化的PCR产物全部转移至Covaris打断小管并补加TE缓冲液至总体积为80μl(Nanodrop检测其总量为5μg),CovarisS2仪器(基因有限公司)进行打断,由此,获得片段化产物,其中打断条件见表3。
表3
负载比 强度 循环/脉冲 打断时间
10% 5 200 30s×7个循环
2.6片段化产物电泳检测
2%琼脂糖凝胶电泳检测片段化产物的大小,结果见图8,结果显示片段化产物的主带在250-300bp,表明所获得的片段化产物即可用作杂交的探针。
2.7探针保存
使用MinElutePCRPurificationKit纯化片段产物,溶于40μl缓冲液中,用Nanodrop仪检测探针DNA的浓度,使得探针的浓度为120ng/μl左右。得到的探针可以保存在-20℃或-80℃。
3.HBV探针与样本文库进行杂交
3.1探针变性
探针使用前必须95℃变性10分钟,然后迅速放于冰上冷却形成单链。
3.2选用已确定的整合文库,文库用量为1μg,探针用量为600ng(Nanodrop定量),加入接头封闭分子,接头封闭分子的量与文库量的比值为1nmol:1μg,标签封闭分子与文库量的比值为1nmol:1μg。
接头封闭分子序列为:
5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'(SEQIDNO:8);
标签封闭分子序列为:
5'-AAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(SEQIDNO:9);
5'-AAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(SEQIDNO:10)。
在一个1.5mL的EP管中加入1μg的待杂交文库,1nmol接头封闭分子,1nmol标签封闭分子,5μgCotDNA。盖好管盖,用干净的50ml注射器针在分装的EP管盖上戳一个孔,然后置于60℃旋蒸仪中蒸干。使用新的离心管管盖替换戳孔的管盖,并做好标记。EP管中分别加入EZ杂交系统中的两种试剂:2×SCHybridiationBuffer杂交缓冲液7.5μl和1×SCHybridiationComponentA3μl,然后95℃变性10分钟,在上述杂交混合物加入自制探针600ng,探针体积共5μl。震荡混匀后置于离心机上全速离心10秒,并将样品全部转移到200μlPCR小管中。
杂交混合物中含有的成分见表4。
表4
将200μlPCR小管放置于PCR仪上,47℃条件下杂交24h。
4.杂交后洗脱
4.1准备链霉亲和素磁珠(InvitrogenM280)
提前从冰箱中拿出链霉亲和素磁珠;漩涡震荡磁珠1min,使其充分混匀;在1.5mL的EP管中加入100μl磁珠;将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;保持EP管在磁力架上,加入200μl(2倍体积)的结合缓冲液(购于Agilent公司);从磁力架上取下EP管,漩涡震荡10s,使其混匀;将EP管重新放回磁力架至液体澄清,用移液器小心地去除上清;重复清洗两次;用100μl的Agilent结合缓冲液r悬浮磁珠;将其转入0.2ml的小管中;用磁力架结合磁珠(将小管靠到磁力架上),直到液体澄清,用移液器小心去除上清;现在磁珠可以用来结合捕获的DNA了。
4.2将捕获到的DNA结合到链霉素磁珠上
将杂交混合物吸出来,加到上步准备好的磁珠中;用移液器吹打10次混匀;将小管放在PCR仪上47℃孵育45min(每隔15min拿出来漩涡震荡3s以防止磁珠沉淀);孵育45min后,将混合物从0.2mL的小管中转入1.5mL的EP管中。
4.3洗涤结合了捕获DNA的链霉亲和素磁珠
1)将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;
2)加100μL预热到47℃的1×清洗缓冲液I;
3)漩涡震荡10s,使其混匀;
4)将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;
5)从磁力架上取下EP管,加入200μl预热到47℃的1×严谨清洗缓冲液,用移液器吹打混匀10次(该步操作应迅速以尽量使管中液体温度不低于47℃);
6)47℃孵育5min;
7)重复步骤5)-7),总共用1×严谨清洗缓冲液洗两次;
8)将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;
9)加200μL室温下放置的1×清洗缓冲液I(不用47℃预热的),漩涡震荡2min,使其混匀;
10)将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;
11)加200μL室温下放置的1×清洗缓冲液II,漩涡震荡1min,使其混匀;
12)将EP管置于磁力架上至液体澄清,用移液器小心的去除上清;
13)加200μL室温下放置的1×清洗缓冲液III,漩涡震荡30s,使其混匀;
14)将EP管置于磁力架上至液体澄清,用移液器小心地去除上清;
15)从磁力架上取下EP管,加入76μl超纯水(不用将DNA从磁珠上洗脱下来,可以直接进行PCR,取样35μl进行后面的PCR反应)。
5.PCR反应
预先从-20℃保存的试剂盒中取出PFX聚合酶(购于Invirtogen公司),PFX反应缓冲液(10×),dNTP(10mM)。引物序列为:
PCRFlowcell-PrimerF(10pm/μl):
AATGATACGGCGACCACCGAGATC(SEQIDNO:11);
PCRFlowcell-PrimerR(10pm/μl):
CAAGCAGAAGACGGCATACGA(SEQIDNO:12)。
在PCR小管上,每孔按照表格5配置PCR反应体系。
表5
DNA 35μl16 -->
PFX酶 1μl
PFX反应缓冲液(10*) 5μl
MgSO4 2μl
dNTP(10mM) 2μl
Flowcell-primer-F1(10pm/μl) 2.5μl
Flowcell-primer-R1(10pm/μl) 2.5μl
总体积 50μl
反应条件见表6。
表6
PCR结束后,每个样品都用1.5倍体积的AmprueBeads纯化,回收的PCR产物溶于30μl超纯水中,Nanodrop1000测浓度。
6.PCR产物上机测序
上述纯化后的PCR产物经2100Bioanalyzer(Agilent)确定大小及插入片段大小见图9和图10,纯化产物大小分别为271bp和876bp,QPCR精确定量后上机测序。在本实施例中,上机测序按照Illumina/Solexa官方公布的c-Bot和HISEQ2000Hiseq2000说明书进行操作。
7.信息分析
将下机数据除去重复和被接头污染的reads,统计下机数据的基本信息(文库长度;reads长度;reads条数;碱基数;重复率等);分别截取PE的两条reads前面的50bp碱基,形成一对长为50bp新reads,即PE50reads。将新的PE50reads运用soap比对软件(-r1-v2)分别与人的参考序列(hg19)和HBV各种参考序列进行比对,从比对结果中挑选出一条read比到人的参考序列并且另一条比对到HBV参考序列的一对reads;这样的reads很有可能跨过HBV插入的位点;统计这部分reads比对信息,找到在人类基因组的插入热点区域。
杂交结果见表7。
表7
表7的结果为采用上机数据得到结果,样本L-170,L-800,Genome均来自同一肝癌样本,L-170为插入片段170bp,L-800为800bp文库,genome为全基因组测序。从表7中可以得出自制探针对于捕获基因片段的准确性,以及片段长度的影响。通过本发明的方法完全可以得到稳定以及可靠的位点,且所需数据量仅为全基因组测序数据的1%左右。
实施例2:对宫颈癌患者外周血样品进行全基因组分析
1、DNA提取及测序
根据常规方法,对宫颈癌患者进行静脉取血,得到宫颈癌患者的外周血样本,通过离心得到血浆样本。按照TiangenMicroKit(DP316)微量基因组操作流程从血浆样本提取DNA,分别用Qubit(Invitrogen,theQuant-iTTMdsDNAHSAssayKit)定量,所提取的DNA总量分别为5~50ng。
将所提取到的DNA,分别按照制造商提供的标准建库规程(参见http://www.illumina.com/提供的Illumina标准建库说明书)建立DNA文库。简言之,在DNA分子两端加上测序用的接头,并被加上不同的标签序列,然后与测序芯片表面互补接头杂交,使核酸分子成簇生长,然后在IlluminaHiSeq2000上通过100轮深度测序循环,得到长度为100bp的DNA片段序列。本实施例中,对于获自肿瘤病人外周血的DNA样本分批按照制造商提供的操作说明书(参见Illumina官方公布说明书)进行上机测序操作。
2、数据分析
根据制造商Illumina提供的Pipeline操作说明书(参见http://www.illumina.com/提供的Pipeline方法说明书),将步骤DNA测序部分中测得的序列信息经过图形转化获得测序序列信息,去掉测序质量低的序列之后最终可以获得针对NCBI版本36的人类基因组参考序列的ELAND比对结果。
将获得的数据使用SOAP软件包进行比对分析,使用两个末端测序信息进行比对时去除两个末端均比对至人基因组的序列,保留其中一条链比对至人基因组的序列,将另一末端序列比对至HPV基因组序列中,获得HPV在人基因组重组信息,包括人基因组中重组位置以及HPV类型。
3、分析结果:
根据数据分析部分中的数据分析流程,通过使用高通量测序平台对宫颈癌样品进行深度测序以及数据分析,共检测到45个超过10条测序序列支持的HPV整合基因,发生整合HPV区域均为E1区,发生整合的HPV型别为HPV16型。
表8、检测出来的支持数超过10的HPV整合情况
本实施例表明通过由于第二代测序技术能够对肿瘤样品进行深度测序,从而能够快速地对病毒与人体基因的整合进行检测,并且能准确提供被整合的人基因组区域信息以及整合外源序列信息。
实施例3:对肝癌样品外周血通过目标区域分析
实验方法:
1、DNA提取及文库构建:
外周血DNA提取和文库制备方法与实施例2相同,只是样品来源为多名肝癌患者。
2、捕获游离核酸:
本实施例中将使用核酸探针芯片(Nimblegen)对含有外源序列区域的核酸片段进行捕获。实验流程如下:
a.样品准备:
其中,核酸探针是以具有SEQIDNO:7所示的核酸序列的HBV基因组(HepatitisBvirusserotypeadr,completegenome)为模板,以60bp为一个探针长度,每间隔5bp设置一个探针,进行设计得到的。
PEBlock1.0:
5'-AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3'(SEQIDNO:13);
PEBlock2.0:
5'-AAGCAGAAGACGGCATACGAGATATTGGCGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT-3'(SEQIDNO:14)。
b.将准备好的样品置于SpeedVac中60℃蒸干,然后加入11.2μL超纯水溶解样品。
c.全速离心样品30秒,分别加入以下两种试剂:18.5μL的2×SCHybridiationBuffer(RocheNimbleGen公司)和7.3μL的SCHybridiationComponentA(RocheNimbleGen公司)。震荡混匀后置于离心机上全速离心30秒,然后于95℃使DNA变性10分钟。
d.根据制造商提供的说明书,将带有相应探针的芯片固定在杂交仪(RocheNimbleGen公司)上,将变性后的样品加入芯片中并封闭芯片,然后设定杂交程序,于42℃杂交64-72小时。
e.芯片洗涤与样品洗脱:
f.将NaOH洗脱液回收,并用32μL20%冰醋酸中和,得到中和液。
g.将上述中和液用QiagenMinElutePCRPurificationKit纯化,捕获后的样品最后溶解于138μL纯水中。
h.PCR扩增捕获的DNA文库,分为6管50μL反应进行PCR,PCR的反应物组成如下:
DNA 138μL
Phusion DNA聚合酶 150μL
PE Post Primer1.0 6μL
PE Post Primer2.0 6μL
总体积 300μL
其中,
PEPostPrimer1.0:AATGATACGGCGACCACCGAGATC(SEQIDNO:15);
PEPostPrimer2.0:CAAGCAGAAGACGGCATACGA(SEQIDNO:16)。
PCR的反应条件如下:
i.用QiagenQIAquickPCRPurificationKit纯化PCR产物,最后溶于30μL纯水中。
3、高通量测序
本实施例中,对于获自肿瘤病人外周血DNA样本分批按照制造商提供的操作说明书(参见Illumina/Solexa官方公布的cBot)进行上机测序操作。通过100轮测序循环,得到长度为100bp的DNA片段序列。
4、数据分析
根据制造商Illumina提供的Pipeline操作说明书(参见http://www.illumina.com/提供的Pipeline方法说明书),将步骤高通量测序部分中测得的序列信息经过图形转化获得测序序列信息,去掉测序质量低的序列之后最终可以获得针对NCBI版本36的人类基因组参考序列的ELAND比对结果。
获得的数据使用SOAP软件包进行比对分析,使用两个末端测序信息进行比对时去除两个末端均比对至人基因组的序列,保留其中一条链比对至人基因组的序列,将另一末端序列比对至HBV基因组序列中,获得HBV在人基因组重组信息,包括人基因组中重组位置以及HBV类型。
5、数据结果
上述结果表明通过表明本发明的用于确定人体具有异常状态方法能够准确有效地检测到肝癌样品中HBV病毒整合信息,即一段733bpHBV序列整合至1号染色体区域。
实施例4:对肝癌样品外周血及组织通过目标区域捕获分析
实验方法:
1、DNA提取及测序
根据常规方法,对肝癌患者进行静脉取血,得到患者的外周血样本,通过离心得到血浆样本。按照TiangenMicroKit(DP316)微量基因组操作流程从血浆样本提取DNA,并分别用Qubit(Invitrogen,theQuant-iTTMdsDNAHSAssayKit)定量,所提取的各样本的DNA总量均为5~50ng。
根据常规方法,取肝癌患者,癌组织样本对组织样本进行全基因组提取,取3微克进行常规建库,文库插入片段主带为170bp.
将所提取到的DNA,分别按照制造商提供的标准建库规程(参见http://www.illumina.com/提供的Illumina标准建库说明书)建立DNA文库。简言之,在DNA分子两端加上测序用的接头,并被加上不同的标签序列,然后与测序芯片表面互补接头杂交,使核酸分子成簇生长,然后在IlluminaHiSeq2000上测序PE101,得到长度为100bp的DNA片段序列。
2、捕获游离核酸:
本实施例中将使用HBV(Nimblegen)核酸探针芯片对含有外源序列区域的核酸片段进行捕获。实验流程如下:
a.样品准备:
组分 重量/体积
Cot-1DNA 5μg
DNA文库 1μg
PE Block(1000μM) 1μL
PE INDEX Block(1000μM) 1μL
其中,HBV核酸探针是由HBV的A,B,C,D,E,F,G,H八个型别的基因组进行设计得到的,各基因组序列具体可见公知数据库中的HBV基因组序列。具体地,按照HBV基因组长度,每次在基因组上10bp滑动移动一次,合成60-90bp长度且带Bio-tin标记的探针。具体探针是委托相应的公司合成的。
b.将准备好的样品置于SpeedVac中60℃蒸干。
c.全速离心样品30秒,分别加入以下两种试剂:7.5μL的2×SCHybridiationBuffer(RocheNimbleGen公司)和3.0μL的SCHybridiationComponentA(RocheNimbleGen公司)。震荡混匀后置于离心机上全速离心30秒,然后于95℃使DNA变性10分钟,而后加入探针4.5μl于47℃杂交24小时。
e.芯片洗涤与样品洗脱:按照标准的EZ洗脱流程进行洗脱,回收。
f.预先从-20℃保存的试剂盒中取出Pfx酶(Invirtogen),Pfxbuffer(10*),dNTP(10mM),PCRPrimerF(10pm/μl),PCRPrimerR(10pm/μl)。
在PCR小管上,每孔按照下面的表格配置PCR反应体系:
DNA 35μl
Pfx酶 1μl
Pfx缓冲液(10*) 5μl
MgSO4 2μl
dNTP(10mM) 2μl
Flowcell-primer-F1(10pm/μl) 2.5μl
Flowcell-primer-R1(10pm/μl) 2.5μl
总体积 50μl
其中,
Flowcell-primer-F1:AATGATACGGCGACCACCGAGATC(SEQIDNO:17);
Flowcell-primer-R1:CAAGCAGAAGACGGCATACGA(SEQIDNO:18)。
程序如下:
94℃2min;
94℃15s,58℃30s,72℃30s,14个循环;
72℃5min,
4℃∞。
PCR结束后,每个样品都用1.5倍体积的AmprueBeads纯化,回收的PCR产物溶于30μl超纯水中,Nanodrop1000测其浓度为10ng/μl。
3、高通量测序
本实施例中,对于获自肿瘤病人外周血DNA样本分批按照制造商提供的操作说明书(参见Illumina/Solexa官方公布的cBot)进行上机测序操作。
4、数据分析
将下机数据除去重复和被接头污染的reads,统计下机数据的基本信息(文库长度;reads长度;reads条数;碱基数;重复率等);分别截取PE的两条reads前面的50bp碱基,形成一对长为50bp新reads,即PE50reads。将新的PE50reads运用soap比对软件(-r1-v2)分别与人的参考序列(hg19)和HBV各种参考序列进行比对,从比对结果中挑选出一条read比到人的参考序列并且另一条比对到HBV参考序列的一对reads;这样的reads很有可能跨过HBV插入的位点;组装这部分reads,采用BWA比对找到在人类基因组的插入热点区域。
5、数据结果
A患者组织DNA,经过杂交后1G(碱基)数据量结果如下:
染色体号 位置 支持数目
chr18 11550976 124
chr18 11550851 119
chr17 18778136 14
chr17 18778051 14
chr17 18778353 11
chr17 18778266 8
A患者血浆DNA,经过杂交后5G(碱基)数据量结果如下:
染色体号 位置 支持数目
chr18 11550851 18
chr18 11550976 18
chr2 219543496 4
chr2 219543519 2
采用上述方法对同一患者的血浆与肝癌组织中的整合状态进行查找,发现组织中存在的支持数最高的位置,在血浆中同样存在,此方法不仅证明组织与血浆游离DNA之间的关系,并且能够准确有效地找出血浆中的整合位置,表明本发明的用于确定人体具有异常状态方法为能够有效地应用于病原体引起染色体整合相关疾病的无创检测。
实施例5:对HPV患者子宫颈脱落细胞目标区域捕获分析
实验方法:
1、DNA提取及测序
根据常规方法,对HPV患者进行子宫颈脱落细胞取样,样本按照TiangenMicroKit(DP316)微量基因组操作流程从血浆样本提取DNA,分别用Qubit(Invitrogen,theQuant-iTTMdsDNAHSAssayKit)定量,所提取的DNA总量分别为100~500ng。
将所提取到的DNA,分别按照制造商提供的标准建库规程(参见http://www.illumina.com/提供的Illumina标准建库说明书)建立170bpDNA文库。简言之,在DNA分子两端加上测序用的接头,并被加上不同的标签序列,然后与测序芯片表面互补接头杂交,使核酸分子成簇生长,然后在IlluminaHiSeq2000上测序PE101,得到长度为100bp的DNA片段序列。
2、捕获游离核酸:
本实施例中将使用(Mygenostics公司)HPV核酸探针芯片对含有外源序列区域的核酸片段进行捕获。实验流程如下:
a.样品准备:
其中,HPV核酸探针是由HPV的6,11,16,18,31,33,35,39,45,52,56,58,59,66,68,69,82型别的基因组进行设计得到的,各基因组序列具体可见公知数据库中的HPV基因组。具体地,按照HPV基因组长度,每次在基因组上10bp滑动移动一次,合成60-90bp长度且带Bio-tin标记的探针。具体探针是委托相应的公司合成的。
b.芯片洗涤与样品洗脱:按照标准(MyGenostics)洗脱流程进行洗脱,回收,具体步骤如下:
1)提前将温浴器调至65℃;
2)用漩涡混合仪剧烈振荡重悬MyonebeadsC1(Invitrogen)至混匀;
3)每一个杂交反应取50μlMyonebeadsC1磁珠于一新的1.5mL离心管中,放于磁力架上,然后去除上清;
4)洗涤磁珠:
a)加入50μL1*结合缓冲液;
b)用漩涡混合仪剧烈振荡5秒钟重悬磁珠;
c)将离心管放于磁力架上,待液体变澄清;
d)去除上清液;
e)重复2次“步骤a到步骤d”;
5)加入80μL(根据不同大小捕获区域区域加入量不同,具体按照KIT要求加入)1*结合缓冲液重悬磁珠;
6)加入64μL2*结合缓冲液重悬磁珠(与杂交液体积同等体积),将液体转移到EP1后,总体积约为200微升;
7)振荡混匀后在室温下放于ROATER上进行1小时;
8)震荡混匀后将样品放于磁力架上,去除上清;
9)加入500μlWB1,振荡混匀后旋转混匀15分钟,然后放于磁力架上去上清;
10)加入500μlWB3,振荡混匀后放于65度温浴,850rpm,10分钟,放于磁力架上去上清;
11)重复(10)5次,最后一次完全去除上清;
12)加入50μl洗脱缓冲液,振荡混匀,室温放置10分钟,放于磁力架上取上清转入另一EP管(管内包含70μlNE缓冲液);
13)采用QIAquickMinelute进行纯化,最终溶解42μlEB。
c.捕获样品的扩增与纯化
1)从-20℃冰箱中取出2*PHUSIONMASTER,Flowcellprimers(10μM),将其置于冰上化冻并充分混匀。
2)在冰上为每个捕获样品配制一份Mix,另外加入一个无模板的阴性对照,按以下表格组分配制反应Mix并用移液器混匀:
反应个数 1个样品
2*PHUSION MASTER 25μL
Flowcell primerF(10μM) 2μL
Flowcell primerR(10μM) 2μL
样品 21μL
总体积 50μL
3)在热循环仪中运行下列程序:
PCR结束后,每个样品都用1.5倍体积的AmprueBeads纯化,回收的PCR产物溶于30μl超纯水中,Nanodrop1000测浓度,并记录,其浓度为10ng/μl。
3、高通量测序
本实施例中,对于获自HPV患者的子宫颈脱落细胞DNA样本分批按照制造商提供的操作说明书(参见Illumina/Solexa官方公布的cBot)进行上机测序操作。通过100轮测序循环,得到长度为100bp的DNA片段序列。
4、数据分析
将下机数据除去重复和被接头污染的reads,统计下机数据的基本信息(文库长度;reads长度;reads条数;碱基数;重复率等);分别截取PE的两条reads前面的50bp碱基,形成一对长为50bp新reads,即PE50reads。将新的PE50reads运用Soap比对软件(-r1-v2)分别与人的参考序列(hg19)和HBV各种参考序列进行比对,从比对结果中挑选出一条read比到人的参考序列并且另一条比对到HBV参考序列的一对reads;这样的reads很有可能跨过HBV插入的位点;组装这部分reads,采用BWA比对找到在人类基因组的插入热点区域。
5、数据结果
HPV16型感染且宫颈病变程度为CIN四期病人,数据量1G,结果如下:
染色体 位置 支持数
chr4 124686065 824
chr4 124686035 529
chr2 133034596 16
上述方法采用宫颈病变程度为CIN四期病人,感染的宫颈脱落细胞进行检测,结果准确发现高频整合位置,证明了表明本发明的用于确定人体具有异常状态方法具有可行性。
工业实用性
本发明的用于确定人体具有异常状态的系统和方法,能够有效地应用于人体疾病的无创检测,通过对人体样本的核酸序列信息进行分析,可以根据核酸序列中所包含的信息准确地确定人体是否具有异常状态。
尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims (11)

1.一种用于确定人体具有异常状态的系统,其特征在于,包括:
核酸序列信息接收器,所述核酸序列信息接收器接收人体样本的核酸序列信息;以及
核酸序列信息分析器,所述核酸序列信息分析器与所述核酸序列信息接收器相连,并基于所述人体样本的核酸序列信息,确定所述人体是否具有异常状态,
其中,
所述核酸序列信息分析器内预存有选自下列的至少一种:人体正常状态的基因组序列、病原体的基因组序列、正常人群的基因组序列,
所述病原体为选自HBV、HPV、EBV、幽门螺旋杆菌的至少一种,
进一步包括核酸序列检测装置,所述核酸序列检测装置与所述核酸序列信息接收器相连,用于对所述人体样本进行核酸序列检测获得所述核酸序列信息并输送至所述核酸序列信息接收器,
进一步包括:
游离核酸捕获装置,所述游离核酸捕获装置与所述核酸序列检测装置相连,
其中,
所述游离核酸捕获装置设置有探针,
所述探针适于捕获含有特定序列的核酸,并且将所述含有特定序列的核酸输送至所述核酸序列检测装置进行核酸序列检测,
利用选自下列方法的任意一种,制备获得所述探针:
(1)以病毒基因组作为模板进行PCR扩增,然后将PCR产物进行随机打断,打断产物即为所述探针;或者
(2)针对HBV病原体,参照HBV病毒基因组的序列,按照HBV病毒基因组的长度,在HBV基因组上间隔10bp滑动移动一次,合成60-90bp长度的探针;或者针对HBV病毒基因组间隔5bp滑动移动一次,合成60bp长度的探针。
2.根据权利要求1所述的用于确定人体具有异常状态的系统,其特征在于,所述核酸序列检测装置借助第二代测序技术或第三代测序技术。
3.根据权利要求1所述的用于确定人体具有异常状态的系统,其特征在于,
所述适于捕获含有特定序列的核酸的探针对于选自下列的至少一种是特异性的:HBV、HPV、EBV、幽门螺旋杆菌。
4.根据权利要求1所述的用于确定人体具有异常状态的系统,其特征在于,所述探针为核酸探针集,包括多个探针,所述核酸探针集具有以下特征:
(1)每个探针上具有1个或多个生物素标记的dNTP;和/或
(2)所述生物素标记的dNTP在所述探针集中的丰度为1:6-1:2;和/或
(3)所述探针集的全部核酸序列覆盖对应选自HBV、HPV、EBV和幽门螺旋杆菌的至少一种病毒的基因组序列的70%-100%。
5.根据权利要求4所述的用于确定人体具有异常状态的系统,其特征在于,所述探针集具有1-20000个核酸探针。
6.根据权利要求5所述的用于确定人体具有异常状态的系统,其特征在于,所述探针集具有1000-5000个核酸探针。
7.根据权利要求6所述的用于确定人体具有异常状态的系统,其特征在于,所述探针集具有2500个核酸探针。
8.根据权利要求4所述的用于确定人体具有异常状态的系统,其特征在于,所述生物素标记的dNTP在所述探针集中的丰度为1:4。
9.根据权利要求4所述的用于确定人体具有异常状态的系统,其特征在于,在所述探针集中,所述探针之间具有部分重叠。
10.根据权利要求1所述的用于确定人体具有异常状态的系统,其特征在于,所述模板为选自HBV基因组、HCV基因组、HIV基因组和HPV基因组的至少一种。
11.根据权利要求10所述的用于确定人体具有异常状态的系统,其特征在于,所述模板为B型HBV基因组和/或C型HBV基因组。
CN201280029759.1A 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法 Active CN103797130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201280029759.1A CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN2011101746862A CN102839211A (zh) 2011-06-24 2011-06-24 用于确定人体具有异常状态的系统和方法
CN201110174686.2 2011-06-24
CN2011101746862 2011-06-24
PCT/CN2011/082855 WO2013075313A1 (zh) 2011-11-24 2011-11-24 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
CNPCT/CN2011/082855 2011-11-24
CN201280029759.1A CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法
PCT/CN2012/077175 WO2012175013A1 (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Publications (2)

Publication Number Publication Date
CN103797130A CN103797130A (zh) 2014-05-14
CN103797130B true CN103797130B (zh) 2016-07-27

Family

ID=47422031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280029759.1A Active CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Country Status (2)

Country Link
CN (1) CN103797130B (zh)
WO (1) WO2012175013A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145627A1 (en) * 2017-02-07 2018-08-16 Tcm Biotech International Corp. Probe combination for detection of cancer

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150119260A1 (en) * 2013-10-18 2015-04-30 National Taiwan University Circulating cancer biomarker and its use
CN109957492A (zh) * 2017-12-26 2019-07-02 安诺优达基因科技(北京)有限公司 一种用于二代测序dna文库构建的自动化液体处理工作站
CN108753922A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建转录组测序文库的方法及相应的接头序列和试剂盒

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101743320A (zh) * 2007-04-24 2010-06-16 伊维什遗传诊断公司 来自基因转录产物检测的具有广泛基础的疾病结合
CN101921874A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法
CN102203273A (zh) * 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1932033A (zh) * 2006-09-22 2007-03-21 东南大学 基于微阵列芯片的核酸测序方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101743320A (zh) * 2007-04-24 2010-06-16 伊维什遗传诊断公司 来自基因转录产物检测的具有广泛基础的疾病结合
CN102203273A (zh) * 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法
CN101921874A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Experiences with array-based sequence capture;toward clinical applications;Rowida Almomani,et al;《European Journal of Human Genetics》;20101124;第19卷;第50-55页 *
Targeted next-generation sequencing by specific capture of multiple genomic loci using low-volume microfluidic DNA arrays;Stephan Bau,et al;《Anal Bioanal Chem》;20081029;第393卷;第171-175页 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018145627A1 (en) * 2017-02-07 2018-08-16 Tcm Biotech International Corp. Probe combination for detection of cancer

Also Published As

Publication number Publication date
WO2012175013A1 (zh) 2012-12-27
CN103797130A (zh) 2014-05-14

Similar Documents

Publication Publication Date Title
Tang et al. Application of magnetic nanoparticles in nucleic acid detection
JP4794052B2 (ja) 癌の指標である核酸を検出するための方法
WO2010043114A1 (zh) 血清/血浆miRNA在HBV感染和肝癌早期诊断中的应用
CN107405540A (zh) 小核酸的富集
CN105734679B (zh) 核酸靶序列捕获测序文库的制备方法
CN109777877B (zh) 基于ptbp1甲基化辅助诊断脑动脉瘤的检测试剂盒及其应用
CN103797130B (zh) 用于确定人体具有异常状态的系统和方法
Wang et al. Circulating tumor DNA analysis for tumor diagnosis
CN112680452B (zh) 一种特异性结合肺癌血清的寡核苷酸适配体及应用
CN106103742A (zh) 一种富集循环肿瘤dna的方法和试剂
CN104152567B (zh) miRNA-199a在制备诊断试剂盒中的用途
CN106755506A (zh) 用于检测肿瘤ffpe样本中基因变异的试剂盒
TW201321566A (zh) 用於確定人體具有異常狀態的系統和方法
CN105874068B (zh) 游离核酸和生物标志物
Wei et al. The new horizon of liquid biopsy in sarcoma: the potential utility of circulating tumor nucleic acids
CN110468211A (zh) 膀胱癌肿瘤突变基因特异性引物、试剂盒和文库构建方法
WO2019024341A1 (zh) 一种体液游离dna的文库构建方法及其应用
CN110157808A (zh) 一种与喉鳞癌发生发展相关的非编码rna的应用
CN102839211A (zh) 用于确定人体具有异常状态的系统和方法
WO2020010311A2 (en) Viral oncogene influences and gene expression patterns as indicators of early tumorigenesis
CN109679945A (zh) 一种用于提高血浆样本中游离dna提取率的助沉剂
CN114410795A (zh) 基于miRNA特征标记的肝癌早期检测
CN106591486A (zh) 用于检测血液病相关基因变异的试剂盒
CN102021169A (zh) 一种血清/血浆miRNA组合物及其应用
Chen et al. Single-molecule assay guided crRNA optimization enhances specific microRNA detection by CRISPR-Cas12a

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20161221

Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer

Patentee after: BGI SHENZHEN CO LTD

Address before: North Road No. 146, building 11F-3 Industrial Zone in Yantian District of Shenzhen city of Guangdong Province in 518083

Patentee before: Shenzhen BGI Co., Ltd.

Patentee before: Shenzhen BGI Research Institute

TR01 Transfer of patent right