CN103797130A - 用于确定人体具有异常状态的系统和方法 - Google Patents

用于确定人体具有异常状态的系统和方法 Download PDF

Info

Publication number
CN103797130A
CN103797130A CN201280029759.1A CN201280029759A CN103797130A CN 103797130 A CN103797130 A CN 103797130A CN 201280029759 A CN201280029759 A CN 201280029759A CN 103797130 A CN103797130 A CN 103797130A
Authority
CN
China
Prior art keywords
nucleic acid
probe
human body
abnormality
human
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280029759.1A
Other languages
English (en)
Other versions
CN103797130B (zh
Inventor
李伟阳
曾玺
徐佳佳
蒋慧
杨玲
易赏
陈盛培
管彦芳
易鑫
胡学达
李英睿
张秀清
杨焕明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BGI Shenzhen Co Ltd
Original Assignee
BGI Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN2011101746862A external-priority patent/CN102839211A/zh
Priority claimed from PCT/CN2011/082855 external-priority patent/WO2013075313A1/zh
Application filed by BGI Shenzhen Co Ltd filed Critical BGI Shenzhen Co Ltd
Priority to CN201280029759.1A priority Critical patent/CN103797130B/zh
Publication of CN103797130A publication Critical patent/CN103797130A/zh
Application granted granted Critical
Publication of CN103797130B publication Critical patent/CN103797130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material

Abstract

本发明提供了用于确定人体具有异常状态的系统和方法。其中,确定人体具有异常状态的方法包括:提供人体样本的核酸序列信息,该人体样本的核酸序列信息是基于对人体样本进行检测而获得的;以及基于人体样本的核酸序列信息,确定人体是否具有异常状态。

Description

用于确定人体具有异常状态的系统和方法 优先权信息
本申请请求 2011 年 6 月 24 日向中国国家知识产权局提交的、 专利申请号为 201110174686.2的专利申请, 以及 2011年 11月 24 日向中国国家知识产权局提交的、 专利申请号为 PCT/CN201 1/082855 的专利申请的优先权和权益, 并且通过参照将其全 文并入此处。 技术领域
本发明涉及生物医学领域。 更具体地, 本发明涉及用于确定人体具有异常状态的系 统和方法。 背景技术
HBV是一种全球性的慢性病毒感染性疾病。 我国的乙肝病毒感染率约 60%-70%, 而乙肝表面抗原携带率约占总人口的 7.18% , 以此计算, 全国约有 9300万人携带乙肝 病毒, 其中乙肝患者大约有 3000 万。 在全世界, 大约有 45%的人群生活在慢性 HBV 感染的高发区, 43%的人群生活在慢性 HBV感染的中发区, 并且 HBV为已知的引起肝 硬化以及肝癌的主要原因, 现已知 HBV基因组与人类基因组整合为肝癌的主要诱因之 一。 EBV 现已知为鼻咽癌的主要诱因, 初发症状到死亡的自然病程从 3 ~ 13个月不等, 放射治疗后 5年生存率为 8% ~ 62%。 幽门螺旋杆菌为胃癌的主要诱因, 并且慢性胃炎 患者的胃粘膜活检标本中幽门螺杆菌检出率可达 80% ~ 90% , 而消化性溃疡患者更高, 可达 95%以上, 甚至接近 100%。 胃癌由于局部上皮细胞已发生异化, 因此检出率高低 •ί艮道不一。 以上病原体, 包括 HBV, HCV, HIV, EBV, 幽门螺旋杆菌等, 均能够与 宿主基因组进行整合, 并且与引起的相关病症直接相关, 能够对感染者造成持久和高危 性的危害, 是高致病性, 高致癌性的高危型病原微生物。 因此, 建立一种无创的诊断及 病程追踪监测手段, 既能够免除对病原体感染患者进行病理组织取样的伤害, 同时可以 定期跟踪检测感染者感染程度以及治疗效果,提高感染患者的治愈率以及有利于及时地 指导用药,对于由病原体引起的肿瘤晚期病人也可进行及时检测判断治愈效果以及复发 的可能性, 能够及时有效地对患者进行病情随访并给出最佳建议。
然而, 现有技术并不能满足上述要求。 发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。 为此, 本发明的一个目的在 于提出一种具有能够有效确定人体异常状态的方法。 本发明的另一目的在于提出一种能够 有效确定人体异常状态的系统。
本发明是基于发明人的下列发现而完成的: 在人体样本的检测过程中, 对于蛋白盾的 检测, 通常由于实验条件的限制, 无法早期获得人体的状态信息。 而利用核酸序列的特性, 则可以通过对于离体的人体样本进行核酸分析, 尽可能早期地对人体状态进行分析。
在本发明的一个方面, 本发明提出了一种确定人体具有异常状态的方法。 根据本发明 的实施例, 该方法包括: 提供人体样本的核酸序列信息, 所述人体样本的核酸序列信息是 基于对所述人体样本进行检测而获得的; 以及基于所述人体样本的核酸序列信息, 确定所 述人体是否具有异常状态。 根据该实施例的方法, 通过对人体样本的核酸序列信息进行分 析, 可以根据核酸序列中所包含的信息确定人体是否具有异常状态。 由于核酸序列信息与 原位状态的核酸信息保持一致, 因而可以有效地确定人体是否具有异常状态。
另外, 根据本发明上述实施例, 上述确定人体具有异常状态的方法, 还可以具有如下 附加的技术特征:
根据本发明的一个实施例, 所述人体样本的核酸序列信息是基于对所述人体样本进行 核酸序列检测而获得的。 由此, 可以通过核酸序列检测方法, 容易地获得人体样本的核酸 序列信息, 从而提高了确定人体具有异常状态的效率。 根据进一步的实施例, 所述核酸序 列检测是借助第二代测序技术或第三代测序技术进行的。 由此, 可以高效地对人体样本进 行核酸序列进行检测, 并且能够实现高通量深度测序。 本发明的发明人发现基于第二代测 序技术和第三代测序技术的高效、 高精度的性盾 , 可以实现对人体样本核酸序列信息的高 效、 高精度检测, 能够非常灵敏地对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例, 所述样本为所述人体的细胞、 组织、 血液、 体液、 尿液、 排泄物或其组合。 由此, 根据本发明的实施例的确定人体具有异常状态的方法能够应用于 各种人体样本, 并且能够根据不同的人体样本的特点, 确定多种异常状态。
根据本发明的一个实施例, 所述人体样本为血浆或者血清。 根据该实施例, 可以利用 常规的方法获得人体的血浆和血清样本, 并对其进行核酸序列分析, 可以直接对人体的异 常状态进行确定。
根据本发明的一个实施例, 所述核酸序列信息包括所述人体样本中游离核酸的序列信 息。 由此, 可以根据游离核酸的序列信息, 对人体的异常状态进行确定。 并且基于游离核 酸的序列信息与人体正常的核酸序列或者病原体的核酸序列进行比对分析后, 可以获得多 种人体的异常状态。
根据本发明的一个实施例, 所述人体样本中游离核酸的序列信息是通过除去所述人体 样本中的细胞后, 进行测序检测而获得的。 由此, 可以提高游离核酸的测序检测的精度和 准确度, 从而能够进一步有效地确定人体具有异常状态。
根据本发明的一个实施例, 所述异常状态选自疾病的发生、 疾病的发展阶段、 疾病的 疗效和预后的至少一种。 由此, 可以确定与人体密切相关的疾病的发生、 发展、 疗效以及 预后, 从而有利于制定有效的治疗方案。 根据本发明进一步的实施例, 所述疾病是肿瘤性 疾病、 免疫性疾病、 遗传性疾病的至少一种。 根据本发明的实施例的确定人体异常状态的 方法, 能够有效地确定人体是否患有肿瘤性疾病、 免疫性疾病、 遗传性疾病。 根据具体的 示例, 所述肿瘤性疾病是选自肺癌、 肝癌、 胃癌、 食管癌、 结直肠癌、 胰腺癌、 乳腺癌、 膀胱癌、 肾癌、 卵巢癌、 宫颈癌、 甲状腺癌、 鼻咽癌、 脑胶盾瘤的至少一种。 根据更进一 步的示例, 如果所述核酸序列信息包含选自下列至少一种的核酸片段序列: HBV、 HPV、 EBV、 幽门螺旋杆菌, 则确定所述人体患有宫颈癌、 肝癌、 鼻咽癌、 胃癌的至少一种。 由 此, 根据本发明的实施例的确定人体具有异常状态的方法, 可以基于所检测的核酸序列信 息, 有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。
根据本发明的一个实施例, 对核酸进行测序检测之前, 可以利用探针去除含有特定序 列的核酸, 然后对所述去除后剩余的核酸进行测序检测。 由此, 可以通过探针除去具有特 定序列的核酸, 从而能够提高对剩余材料进行序列检测的精度和准确性。 根据本发明的具 体示例, 用于去除特定序列的核酸的探针可以结合人体基因组中的共有序列, 或者为可以 结合人体基因组中甲基化位点的抗体或蛋白。 由此, 可以进一步提高检测的精度和准确性。
根据本发明的实施例, 对所述核酸进行测序检测之前, 还可以利用探针捕获含有特定 序列的核酸, 然后对所述含有特定序列的核酸进行测序检测。 由此, 可以通过探针, 预先 对进行核酸序列分析的核酸进行筛选, 从而能够进一步提高确定人体具有异常状态的方法 的效率。根据进一步的实施例,所述探针对于选自下列的至少一种是特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌, 由此, 可以有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。
因此, 在本发明的另一方面, 本发明还提供了一种核酸探针集。 根据本发明的实施例, 该核酸探针集包括多个探针, 且具有以下特征:
( 1 )每个探针上具有 1个或多个生物素标记的 dNTP; 和 /或
( 2 )生物素标记的 dNTP在核酸探针集中的丰度为 1 : 6-1 : 2; 和 /或
( 3 )核酸探针集的全部核酸序列覆盖对应选自 HBV、 HPV、 EBV和幽门螺旋杆菌的 至少一种病毒的基因组序列的 70%-100%。
在另一优选例中, 本发明的核酸探针集具有 1-20000个核酸探针; 较佳地, 核酸探针集 具有 1000-5000个核酸探针; 更佳地, 核酸探针集具有 2500个核酸探针。
在另一优选例中, 生物素标记的 dNTP在核酸探针集中的丰度为 1 : 4。
在另一优选例中, 核酸探针集中, 探针之间具有部分重叠。
在另一优选例中,核酸探针集(在本文中有时也称为 "探针集")中的探针长度为 100-500 bp; 较佳地, 探针长度为 200-300 bp; 更佳地, 探针长度为 250 bp。
在另一优选例中, 探针是以病毒基因组作为模板, PCR法扩增获得的, 较佳地, 扩增 模板为乙型肝炎病毒(HBV )基因组、 丙型肝炎病毒 ( HCV )基因组、 艾滋病病毒(HIV ) 基因组、 乳头瘤病毒(HPV )基因组, 或其组合; 更佳地, 扩增模板为 B型 HBV基因组和 /或 C型 HBV基因组。
进一步, 在本发明的又一方面, 还提供了一种表面固定有本发明的核酸探针集的核酸 芯片。
在本发明的再一方面, 还提供了本发明的核酸探针集和核酸芯片的用途, 用于检测病 毒在待测样本中的整合方式; 较佳地, 整合方式选自下组: 重排、 异位、 插入、 替换, 或 其组合。 在本发明的另一方面, 还提供了一种制备本发明的核酸探针的方法, 包括步骤: a. 获得探针来源样本;
b. 对步骤( a )获得的样本进行 PCR扩增, PCR扩增体系的 dNTP为生物素标记的 dNTP , 以便获得带有生物素标记的 PCR扩增产物;
c 对步骤(b )获得的生物素标记的 PCR扩增产物进行打断, 得到片段化的生物素标 记的 PCR扩增产物, 即为探针。
在另一优选例中, 步骤( a )所述样本具有以下特征:
样本为含有核酸的病毒样本; 和 /或
样本为病毒粒子、 血清、 血液、 组织样本、 脱落细胞, 上皮细胞, 或其组合; 和 /或 样本选自下组: 乙型肝炎病毒(HBV )、 丙型肝炎病毒(HCV )、 艾滋病病毒(HIV )、 乳头瘤病毒(HPV ), 或其组合; 和 /或
样本为 B型 HBV和 /或 C型 HBV。
在另一优选例中, 步骤( b )具有以下特征:
步骤(b )所述的扩增为对样本中病毒 DNA全长进行扩增; 和 /或
步骤( b )所述标记的 dNTP为 biotin-dNTP, 且标记的 dNTP能够与链霉素亲和磁珠结 合; 和 /或
步骤(b )所述标记的 dNTP与非标记 dNTP的比例为 1 : 2-8; 优选比例为 1 : 3-6; 更 优选比例为 1 : 4。
在另一优选例中, 步骤( c )所述打断为超声法打断。
在另一优选例中, 还包括步骤(d ): 对步骤(c )获得的探针进行纯化和 /或定量。 在另一优选例中,根据本发明的制备核酸探针的方法制备的探针,其长度为 100-500 bp; 较佳地, 探针的长度为 200-300 bp, 更佳地, 探针的长度为 250 bp。
在本发明的又一方面, 本发明还提供了一种检测病毒在待测样本中基因整合方式的方 法, 包括步骤:
( i )获得待测样本;
( ϋ )对步骤( i )获得的样本进行文库构建;
( iii )将本发明的探针与步骤(ii )获得的文库进行杂交, 捕获与病毒基因整合有关的 核酸序列;
( iv )对步骤(iii )捕获的核酸序列进行扩增, 获得与病毒整合有关的扩增产物; ( V )对步骤(iv )获得的扩增产物进行测序, 获得与病毒整合方式有关核酸信息。 在另一优选例中, 步骤( i )具有以下特征:
所述待测样本为组织、 血液、 脱落细胞, 上皮细胞; 和 /或
所述待测样本来源于人或非人哺乳动物, 较佳地来源于人; 和 /或
所述待测样本来源于 HBV感染者或肝癌患者。
在另一优选例中, 步骤( iii )具有以下特征:
所述探针为变性的单链 DNA; 和 /或 在杂交液中加入接头封闭分子和标签封闭分子; 和 /或
所述接头封闭分子的序列如 SEQ ID NO: 8所示; 和 /或
所述标签封闭分子的序列如 SEQ ID NO: 9和 SEQ ID NO: 10所示。
在另一优选例中, 在步骤(V ) 中, 将所述的扩增产物与固相载体上固定的测序探针进 行杂交, 进行固相桥式 PCR扩增, 形成测序簇; 然后对所述测序簇用 "边合成-边测序"法进 行测序, 从而得到与病毒整合方式有关核酸信息。
在另一优选例中, 在步骤(ii ) 中, 所述的文库构建为: 对打断的基因组 DNA进行末 端修复, 加入接头, 对具有接头的片段进行扩增, 获得的带有接头的扩增混合物即为样本 文库。
在另一优选例中, 所述的接头具有如 SEQ ID NO: 1和 SEQ ID NO: 2所示的序列; 和
/或, 所构建的文库具有如 SEQ ID NO: 3和 SEQ ID NO: 4所示的标签序列。
在本发明的又一方面, 本发明还提供了一种可用于本发明前面所述方法的试剂盒, 所 述试剂盒包括:
(1)第一容器以及位于容器内前面所述的核酸芯片, 或本发明前面所述的探针; (2)第二容器以及位于容器内的用于构建样本文库的接头;
(3)第三容器以及位于容器内的接头封闭分子;
(4)第四容器以及位于容器内的标签封闭分子;
(5)检测说明书。
在另一优选例中, 所述试剂盒还包括选自下组的试剂:
用于进行 PCR扩增所需的试剂、
用于进行封闭反应所需的试剂、
用于进行杂交反应所需的试剂、
用于进行测序反应所需的试剂、
或其组合。
在本发明的另一方面, 本发明还提供了一种可用于本发明前面所述方法的试剂盒, 所 述试剂盒包括:
前面所述的核酸芯片或前面所述的探针; 接头; 接头封闭分子; 以及标签封闭分子。 根据本发明的实施例, 在该试剂盒中, 所包含的成分被设置在不同的容器中, 由此, 可以方便使用。 根据本发明的实施例, 该试剂盒还包括选自下组的试剂: 用于进行 PCR扩 增所需的试剂、 用于进行封闭反应所需的试剂、 用于进行杂交反应所需的试剂、 用于进行 测序反应所需的试剂、 或其组合。
在本发明的另一方面, 本发明还提供了一种用于确定人体具有异常状态的系统。 根据 本发明的实施例, 该系统包括: 核酸序列信息接收器, 所述核酸序列信息接收器接收人体 样本的核酸序列信息; 以及核酸序列信息分析器, 所述核酸序列信息分析器与所述核酸序 列信息接收器相连, 并基于所述人体样本的核酸序列信息, 确定所述人体是否具有异常状 态。 利用该系统, 可以有效地实施根据本发明实施例的确定人体具有异常状态的方案, 其 具有本发明实施例的确定人体具有异常状态的方法的全部优点, 在此不再赘述。 另外, 根据本发明上述实施例, 上述确定人体具有异常状态的系统, 还可以具有如下 附加的技术特征:
根据本发明的一个实施例, 所述核酸序列信息分析器内预存有选自下列的至少一种: 人体正常状态的基因组序列、 病原体的基因组序列、 正常人群的基因组序列。 从而可以有 效地对核酸序列进行分析, 提高了用于确定人体具有异常状态的系统的效率。 根据进一步 的实施例, 所述病原体为选自 HBV、 HPV、 EBV、 幽门螺旋杆菌的至少一种。 由此, 可以 有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。
根据本发明的一个实施例, 进一步包括核酸序列检测装置, 所述核酸序列检测装置与 所述核酸序列信息接收器相连, 用于对所述人体样本进行核酸序列检测获得所述核酸序列 信息并输送至所述核酸序列信息接收器。 由此, 可以直接对核酸进行序列检测, 并且输送 至核酸序列接收器, 进而进行核酸序列分析, 从而确定人体是否具有异常状态从而提高了 确定人体具有异常状态的效率。 根据进一步的实施例, 所述核酸序列检测装置借助第二代 测序技术或第三代测序技术。 由此, 可以高效地对人体样本进行核酸序列进行检测, 并且 能够实现高通量深度测序。 本发明的发明人发现基于第二代测序技术和第三代测序技术的 高效、 高精度的性盾, 可以实现对人体样本核酸序列信息的高效、 高精度检测, 能够非常 灵敏地对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例, 进一步包括游离核酸捕获装置, 所述游离核酸捕获装置与 所述核酸序列检测装置相连, 其中, 所述游离核酸捕获装置设置有探针, 所述探针适于捕 获含有特定序列的核酸, 并且将所述含有特定序列的核酸输送至所述核酸序列检测装置进 行核酸序列检测; 或者所述探针适于除去含有特定序列的核酸, 并且将经过所述除去的核 酸输送至所述核酸序列检测装置进行核酸序列检测。 由此, 对所述核酸进行测序检测之前, 利用探针捕获含有特定序列的核酸, 然后对所述含有特定序列的核酸进行测序检测。 由此, 可以通过探针, 预先对进行核酸序列分析的核酸进行筛选, 从而能够进一步提高确定人体 具有异常状态的方法的效率。 根据进一步的实施例, 所述探针对于选自下列的至少一种是 特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌, 其来源于前面所述的本发明的核酸探针集, 具有其全部优点, 在此不再赘述。 由此, 可以有效地确定人体是否患有肝癌、 宫颈癌、 鼻 咽癌或胃癌。 或者, 可以通过探针除去具有特定序列的核酸, 从而能够提高对剩余材料进 行序列检测的精度和准确性。 根据本发明的具体示例, 用于去除特定序列的核酸的探针可 以结合人体基因组中的共有序列, 或者为可以结合人体基因组中甲基化位点的抗体或蛋白。 由此, 可以进一步提高检测的精度和准确性。
本发明的附加方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变得明 显, 或通过本发明的实践了解到。 附图说明
本发明的上述和 /或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和 容易理解, 其中:
图 1是根据本发明一个实施例的确定人体具有异常状态的方法的流程示意图; 图 2是根据本发明另一个实施例的确定人体具有异常状态的方法的流程示意图; 图 3是根据本发明又一个实施例的确定人体具有异常状态的方法的流程示意图; 图 4是才 居本发明一个实施例的用于确定人体具有异常状态的系统的示意图; 图 5是根据本发明另一个实施例的用于确定人体具有异常状态的系统的示意图; 图 6是根据本发明又一个实施例的用于确定人体具有异常状态的系统的示意图; 图 7是根据本发明又一个实施例的对 HBV全基因组 PCR扩增后的电泳检测结果; 图 8是根据本发明又一个实施例的对 HB V全长产物打断后的电泳检测结果; 图 9是根据本发明又一个实施例的建库杂交后一种文库的片断大小检测结果; 以及 图 10是根据本发明又一个实施例的建库杂交另一种文库的片断大小检测结果。 发明详细描述
下面详细描述本发明的实施例, 所述实施例的示例在附图中示出, 其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。 下面通过参考附图描 述的实施例是示例性的, 仅用于解释本发明, 而不能理解为对本发明的限制。
在本发明的描述中, 需要说明的是, 除非另有明确的规定和限定, 术语 "相连"、 "连 接,, 应做广义理解, 例如, 可以是固定连接, 一体地连接, 也可以是可拆卸连接; 可以是 机械连接或电连接, 也可以是两个元件内部的连通; 可以是直接相连, 也可以通过中间媒 介间接相连, 对于本领域的普通技术人员而言, 可以根据具体情况理解上述术语的具体含 义。
本发明是基于本发明的下列发现而完成的: 在人体样本的检测过程中, 对于蛋白盾的 检测, 通常由于实验条件的限制, 无法直接对应其原位状态的信息, 而核酸序列由于其自 身性盾比较稳定, 因而在对于离体的人体样本进行核酸分析的结果可以直接对应其原位状 态的信息, 进而可以有效地对人体的状态进行分析。
下面参考附图, 首先对根据本发明实施例的确定人体具有异常状态的方法进行详细描 述。
参考图 1 , #>据本发明实施例的确定人体具有异常状态的方法包括以下步骤: 步骤 100: 提供人体样本的核酸序列信息; 以及
步骤 200: 基于人体样本的核酸序列信息, 确定人体是否具有异常状态。
根据该实施例的方法, 通过对人体样本的核酸序列信息进行分析, 可以根据核酸序列 中所包含的信息确定人体是否具有异常状态。 由于核酸序列信息与原位状态的核酸信息保 持一致, 因而可以有效地确定人体是否具有异常状态。
在本发明中, 术语 "人体,, 应作广义理解, 其并不限于人, 其可以是任何能够通过核 酸信息预测异常状态的生命体。 在本发明中, 术语 "核酸,, 可以是任何包含脱氧核糖核苷 酸或者核糖核苷酸的聚合物, 包括但不限于经过修饰的或者未经修饰的 DNA、 RNA, 其长 度不受任何特别限制。 在本发明中, 术语 "核酸序列信息", 是指核酸序列所包含的所有信 息, 包括但不限于核酸的碱基序列、 是否被修饰等信息。 在本发明中, 术语 "人体样本" 的含义不受特别限制, 可以应用于本发明实施例的人体样本的类型, 包括但不限于人体的 细胞、 组织、 血液、 体液、 尿液、 排泄物或其组合, 更具体的示例包括血浆或血清。 更进 一步的示例中, 釆用血浆作为人体样本。 本申请的发明人发现选择血浆作为研究样本, 背 景噪音会较小, 检测结果精度高。 本领域技术人员可以根据需要选择进行检测和分析的样 本类型。 由此, 根据本发明的实施例的确定人体具有异常状态的方法能够应用于各种人体 样本, 并且能够才 居不同的人体样本的特点, 确定多种异常状态。
在本发明中, 术语 "异常状态" 是指人体与正常状态不同的状态, 包括但不限于生理 状态、 心理状态, 例如病理状态。 据本发明的一个实施例, 异常状态选自疾病的发生、 疾病的发展阶段、 疾病的疗效和预后的至少一种。 由此, 可以确定与人体密切相关的疾病 的发生、 发展、 疗效以及预后, 从而有利于制定有效的治疗方案。 根据本发明进一步的实 施例, 疾病是肿瘤性疾病、 免疫性疾病、 遗传性疾病的至少一种。 由此, 居本发明的实 施例的确定人体异常状态的方法, 能够有效地确定人体是否患有肿瘤性疾病、 免疫性疾病、 遗传性疾病。 根据具体的示例, 所述肿瘤性疾病是选自肺癌、 肝癌、 胃癌、 食管癌、 结直 肠癌、 胰腺癌、 乳腺癌、 膀胱癌、 肾癌、 卵巢癌、 宫颈癌、 甲状腺癌、 鼻咽癌、 脑胶盾瘤 的至少一种。 根据更进一步的示例, 如果所述核酸序列信息包含选自下列至少一种的核酸 片段序列: HBV、 HPV、 EBV、 幽门螺旋杆菌, 则确定所述人体患有宫颈癌、 肝癌、 鼻咽 癌、 胃癌的至少一种。 由此, 根据本发明的实施例的确定人体具有异常状态的方法, 可以 基于所检测的核酸序列信息, 有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。
根据本发明的实施例, 人体样本的核酸序列信息的来源并不受特别限制。 根据本发明 的一个实施例, 人体样本的核酸序列信息是基于对人体样本进行检测而获得的。 根据本发 明的实施例, 检测人体样本而获得人体样本的核酸序列信息的方法并不受特别限制, 可以 直接对人体样本进行核酸序列测序分析而获得, 也可以通过其他方法例如盾谱等。 根据本 发明的一些示例, 可以基于对人体样本直接进行核酸序列检测而获得人体样本的核酸序列 信息。 即, 如图 2所示, 根据本发明实施例, 进一步包括步骤 300: 对核酸序列进行检测。 由此, 可以通过核酸序列检测方法, 容易地获得人体样本的核酸序列信息, 从而提高了确 定人体具有异常状态的效率。 根据更具体的示例, 可以借助第二代测序技术或第三代测序 技术进行核酸序列检测。 由此, 以边合成边测序方法为代表的第二代测序技术, 以及以单 分子测序为代表的第三代测序方法可以高效地对人体样本进行核酸序列进行检测, 并且能 够实现高通量深度测序。 本发明的发明人发现基于第二代测序技术和第三代测序技术的高 效、 高精度的性盾, 可以实现对人体样本核酸序列信息的高效、 高精度检测, 能够非常灵 敏地对人体样本中痕量的核酸进行检测, 从而进一步提高确定人体存在异常状态的效率。 这里所使用的术语 "高通量" 是指可以同时对大量的核酸进行测序检测, 术语 "深度" 是 指可以对核酸进行重复多次检测, 例如在实施例 1 中可以进行 100轮测序检测, 当然根据 样本的不同, 重复的次数也可以根据需要进行选择。 当然, 本领域技术人员能够预见的是, 未来可以釆用其他更先进的测序技术。 目前可以利用的第二代测序技术包括但不限于 Illumina/HiSeq 2000 ^ Roche/454 ^ ABI/SOLiD。 在本发明的一个实施例中, 所釆用的测序方 法为 Illumina/HiSeq 2000。
根据本发明的实施例, 对核酸序列信息进行分析, 从而确定异常状态的方法, 不受特 别限制。 可以是在获得核酸序列信息后, 与人体的正常基因组信息或者病原体的基因组信 息进行比对, 得到比对结果后, 进行判断人体是否具有异常状态。 也可以基于, 核酸序列 在样本中的含量来判断, 人体的异常状态。 根据本发明的实施例, 可以通过分析人体样本 中, 游离核酸的含量, 来确定人体是否存在异常状态。 如实施例 1 所示, 本发明的发明人 发现,在癌症患者的外周血中, 游离核酸的含量远高于正常人外周血中游离核酸的含量(为 至少大约 10倍)。 根据本发明另外的实施例, 可以分析人体样本中, 游离核酸序列中是否 存在突变位点或者经修饰的位点例如甲基化位点, 从而判断个体是否存在某些特定的异常 状态。 具体地, 可以釆用常用的比对软件进行操作, 根据本发明的一个示例, 釆用 SOAP 软件包进行比对分析, 由此, 能够高效地对核酸序列信息进行分析, 并得到准确和精确的 结果。
根据本发明的实施例, 可以用于本发明实施例的确定人体具有异常状态的方法的核酸 类型不受特别限制, #>据本发明的一个实施例, 所釆用的核酸序列信息包括人体样本中游 离核酸的序列信息。 由此, 可以根据游离核酸的序列信息, 对人体的异常状态进行确定。 并且基于游离核酸的序列信息与人体正常的核酸序列或者病原体的核酸序列进行比对分析 后, 可以获得多种人体的异常状态。 为了方便理解, 下面对游离核酸进行详细描述。
在本发明中,所使用的术语 "游离核酸"是指在细胞外的游离状态的核酸,可以是 DNA、
RNA或者其他类型的核酸。 本发明的发明人发现, 正常状态下, 会有少量的核酸由于代谢 而进入到外周血中而成为游离核酸, 而在异常状态下, 例如癌症病人体内, 游离核酸的含 量大大高于正常状态下的游离核酸含量。 发明人发现, 在癌症病人体内, 游离核酸(如游 离 DNA ) 的含量取决于肿瘤的生物学特性, 即与肿瘤细胞的恶性程度、 侵袭程度、 是否发 生转移、 疾病进程等相关。 因而, 可以通过分析人体样本中游离核酸的含量, 来确定人体 是否存在异常状态, 例如患有肿瘤性疾病, 以及确定肿瘤性疾病的进展阶段, 侵袭程度等。 从而, 为选择有效的治疗方案, 提供有利的信息。 另外, 对于某些由于病原体引起的疾病, 在人体样本中, 可能会存在这样的游离核酸, 即, 它属于病原体基因组序列的一部分, 这 样可以确定人体已经被这些病原体侵染并且处于疾病的发生阶段。 甚至有些个体样本中的 游离核酸既包含病原体基因组的一部分序列, 也包含人体基因组的某些序列, 这样可以确 定这些病原体基因组已经与人体基因组发生了整合重组。 由此, 可以判断个体的异常状态 的阶段。 根据本发明的一个实施例, 人体样本中游离核酸的序列信息是通过除去人体样本 中的细胞后, 进行测序检测而获得的。 由此, 可以提高游离核酸的测序检测的精度和准确 度, 从而能够进一步有效地确定人体具有异常状态。
另外, 根据本发明的实施例, 对所述核酸进行测序检测之前, 还可以包括步骤 400, 如 图 3 所示, 即利用探针捕获含有特定序列的核酸, 然后对含有特定序列的核酸进行测序检 测。 由此, 可以通过探针, 预先对进行核酸序列分析的核酸进行筛选, 从而能够进一步提 高确定人体具有异常状态的方法的效率。 另外, 本发明的发明人惊奇地发现, 通过此步骤, 可以提高检测到与人体基因组发生整合的游离核酸的效率。
本领域技术人员能够理解, 所使用的探针类型可以根据检测的目的进行改变, 即可以 根据所期望的特定序列来选择所使用的探针类型。 根据本发明的实施例, 特定序列可以是 外源核酸序列, 也可以是含有突变位点的人基因组部分序列, 也可以是含有修饰位点例如 甲基化的人基因组部分序列。 根据进一步的实施例, 所述探针对于选自下列的至少一种是 特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌, 其可以以包括多个探针的核酸探针集的形 式提供, 并且其具有以下特征: (1 )每个探针上具有 1 个或多个生物素标记的 dNTP; 和 / 或(2 )生物素标记的 dNTP在核酸探针集中的丰度为 1 : 6-1 : 2; 和 /或(3 )核酸探针集的 全部核酸序列覆盖对应选自 HBV、 HPV、 EBV和幽门螺旋杆菌的至少一种病毒的基因组序 列的 70%-100%。在另一优选例中,本发明的核酸探针集具有 1-20000个核酸探针;较佳地, 核酸探针集具有 1000-5000个核酸探针; 更佳地, 核酸探针集具有 2500个核酸探针。 在另 一优选例中, 生物素标记的 dNTP在核酸探针集中的丰度为 1 : 4。 在另一优选例中, 核酸 探针集中, 探针之间具有部分重叠。 在另一优选例中, 核酸探针集 (在本文中有时也称为 "探针集") 中的探针长度为 100-500 bp; 较佳地, 探针长度为 200-300 bp; 更佳地, 探针 长度为 250 bp。 在另一优选例中, 探针是以病毒基因组作为模板, PCR法扩增获得的, 较 佳地, 扩增模板为乙型肝炎病毒(HBV )基因组、 丙型肝炎病毒(HCV )基因组、 艾滋病 病毒(HIV )基因组、 乳头瘤病毒(HPV )基因组, 或其组合; 更佳地, 扩增模板为 B 型 HBV基因组和 /或 C型 HBV基因组。 由此, 可以有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。
另外, 根据本发明的实施例, 可以在对核酸进行测序之前, 通过使用特定的探针除去 某些含有特定序列的核酸, 例如人类基因组中的共有序列, 从而提高确定人类具有异常状 态的方法的准确性。 具体地, 可以在对所述核酸进行测序检测之前, 利用探针去除含有特 定序列的核酸, 然后对所述去除后剩余的核酸进行测序检测。 这些用于除去含有特定序列 的核酸的探针如同用于捕获含有特定序列的核酸的探针一样, 它们的类型不受特别限制, 可以为核酸、 蛋白盾以及任何小分子, 只要其能够特异性地结合特定的序列即可。 另外, 为了除去含有特定序列的核酸, 所釆用的探针能够结合人体基因组中的共有序列, 或者也 可以是能够结合人体基因组中甲基化位点的抗体或者蛋白。 可以根据具体的情况对所釆用 的探针的类型, 以及是需要对样本进行核酸捕获, 还是需要进行特异性去除。
在本发明的另一方面, 本发明提供了一种用于确定人体具有异常状态的系统, 其可以 有效地实施上述根据本发明实施例的确定人体具有异常状态的方法。 根据本发明的实施例, 参考图 4, 该系统包括: 核酸序列信息接收器 500、 以及核酸序列信息分析器 600。 其中, 核酸序列信息接收器 500接收人体样本的核酸序列信息, 核酸序列信息分析器 600与核酸 序列信息接收器 500相连, 并基于人体样本的核酸序列信息, 确定人体是否具有异常状态。 利用该系统, 可以有效地实施根据本发明实施例的确定人体具有异常状态的方案, 其具有 本发明实施例的确定人体具有异常状态的方法的全部优点, 在此不再赘述。
如前所述, 根据本发明实施例, 对核酸序列信息进行分析的方法不受特别限制, 根据 具体地示例, 可以通过将核酸序列信息与人体正常状态的基因组序列、 病原体的基因组序 列、 正常人群的基因组序列进行比对而确定人体是否具有异常状态。 人体正常状态的基因 组序列、 病原体的基因组序列、 正常人群的基因组序列的存放位置不受特别限制, 可以存 储在远程的数据库中。 根据本发明的一个实施例, 核酸序列信息分析器 500 内可以预存有 选自下列的至少一种: 人体正常状态的基因组序列、 病原体的基因组序列、 正常人群的基 因组序列。 由此, 从而可以有效地对核酸序列进行分析, 提高了用于确定人体具有异常状 态的系统的效率。 根据进一步的实施例, 所述病原体为选自 HBV、 HPV、 EBV、 幽门螺旋 杆菌的至少一种。 由此, 可以有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。 通 过将核酸序列信息与人体正常状态的基因组序列 (即将同一身体在不同状态下的基因组信 息)进行比对, 可以确定人体在一段时间内的状态变化。 另外, 通过将人体样本的核酸序 列信息与正常人群的基因组序列信息进行比对, 可以获知与正常人相比的异常状态。
根据本发明的实施例, 进行分析的核酸序列信息的来源不受特别限制。 根据本发明的 一个实施例, 参考图 5 , 本发明的用于确定人体具有异常状态的系统可以进一步包括核酸序 列检测装置 700。 该核酸序列检测装置 700与核酸序列信息接收器 500相连, 用于对述人体 样本进行核酸序列检测获得核酸序列信息并输送至核酸序列信息接收器 500 ,进而进行分析 和确定人体是否存在异常状态。 由此, 可以直接对核酸进行序列检测, 并且输送至核酸序 列接收器 500, 进而进行核酸序列分析, 从而确定人体是否具有异常状态从而提高了确定人 体具有异常状态的效率。 根据进一步的实施例, 所述核酸序列检测装置借助第二代测序技 术或第三代测序技术。 由此, 可以高效地对人体样本进行核酸序列进行检测, 并且能够实 现高通量深度测序。 本发明的发明人发现基于第二代测序技术和第三代测序技术的高效、 高精度的性盾, 可以实现对人体样本核酸序列信息的高效、 高精度检测, 能够非常灵敏地 对人体样本中痕量的核酸进行检测。
根据本发明的一个实施例, 参考图 6, 本发明的用于确定人体具有异常状态的系统还可 以进一步包括游离核酸捕获装置 800,该游离核酸捕获装置 800与核酸序列检测装置 700相 连, 并且游离核酸捕获装置 800设置有探针, 这些探针适于捕获含有特定序列的核酸, 并 且将含有特定序列的核酸输送至核酸序列检测装置 700进行核酸序列检测。 由此, 对所述 核酸进行测序检测之前, 利用探针捕获含有特定序列的核酸, 然后对所述含有特定序列的 核酸进行测序检测。 由此, 可以通过探针, 预先对进行核酸序列分析的核酸进行筛选, 从 而能够进一步提高确定人体具有异常状态的方法的效率。 另外, 本发明的发明人惊奇地发 现, 通过此步骤, 可以提高检测到与人体基因组发生整合的游离核酸的效率。
本领域技术人员能够理解, 所使用的探针类型可以根据检测的目的进行选择, 即可以 根据所期望的特定序列来选择所使用的探针类型。 根据本发明的实施例, 特定序列可以是 外源核酸序列, 也可以是含有突变位点的人基因组部分序列, 也可以是含有修饰位点例如 甲基化的人基因组部分序列。 根据进一步的实施例, 所述探针对于选自下列的至少一种是 特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌, 其可以以包括多个探针的核酸探针集的形 式提供, 并且其具有以下特征: (1 )每个探针上具有 1 个或多个生物素标记的 dNTP; 和 / 或(2 )生物素标记的 dNTP在核酸探针集中的丰度为 1 : 6-1 : 2; 和 /或(3 )核酸探针集的 全部核酸序列覆盖对应选自 HBV、 HPV、 EBV和幽门螺旋杆菌的至少一种病毒的基因组序 列的 70%-100%。在另一优选例中,本发明的核酸探针集具有 1-20000个核酸探针;较佳地, 核酸探针集具有 1000-5000个核酸探针; 更佳地, 核酸探针集具有 2500个核酸探针。 在另 一优选例中, 生物素标记的 dNTP在核酸探针集中的丰度为 1 : 4。 在另一优选例中, 核酸 探针集中, 探针之间具有部分重叠。 在另一优选例中, 核酸探针集 (在本文中有时也称为 "探针集") 中的探针长度为 100-500 bp; 较佳地, 探针长度为 200-300 bp; 更佳地, 探针 长度为 250 bp。 在另一优选例中, 探针是以病毒基因组作为模板, PCR法扩增获得的, 较 佳地, 扩增模板为乙型肝炎病毒(HBV )基因组、 丙型肝炎病毒(HCV )基因组、 艾滋病 病毒(HIV )基因组、 乳头瘤病毒(HPV )基因组, 或其组合; 更佳地, 扩增模板为 B 型 HBV基因组和 /或 C型 HBV基因组。 由此, 可以有效地确定人体是否患有肝癌、 宫颈癌、 鼻咽癌或胃癌。 根据本发明的具体实施例, 可以釆用 HPV的 E1基因区域的特异性序列作 为探针。 由此, 能够高效准确地确定患者体内的 HPV是否已经与患者体内的基因组发生整 合, 从而判断个体是否患有宫颈癌。 根据本发明的一些具体示例, 可以釆用 HPV的全长序 列作为探针, 由此, 能够高效地准确地确定患者体内的 HPV是否已经与患者体内的基因组 发生整合, 从而判断个体宫颈病变程度。 另外, 根据本发明的具体示例, 可以釆用 HBV的 X基因和 /或 C基因中的特异性序列作为探针,由此,能够高效地准确地确定患者体内的 HBV 是否已经与患者体内的基因组发生整合, 从而判断个体是否患有肝癌。 根据本发明的一些 实施例, 可以釆用 HBV的全长基因区域的特异性序列作为探针, 由此, 能够高效地准确地 确定患者体内的 HBV是否已经与患者体内的基因组发生整合,从而判断个体肝炎病变程度。
另外, 根据本发明的实施例, 还可以釆用这样的探针, 其能够除去含有特定序列的核 酸, 从而可以在对核酸进行测序之前, 通过使用特定的探针除去某些含有特定序列的核酸, 例如人类基因组中的共有序列, 从而提高确定人类具有异常状态的方法的准确性。 具体地, 可以在对所述核酸进行测序检测之前, 利用探针去除含有特定序列的核酸, 然后对所述去 除后剩余的核酸进行测序检测。 这些用于除去含有特定序列的核酸的探针如同用于捕获含 有特定序列的核酸的探针一样, 它们的类型不受特别限制, 可以为核酸、 蛋白盾以及任何 小分子, 只要其能够特异性地结合特定的序列即可。 另外, 为了除去含有特定序列的核酸, 所釆用的探针能够结合人体基因组中的共有序列, 或者也可以是能够结合人体基因组中甲 基化位点的抗体或者蛋白。 可以根据具体的情况对所釆用的探针的类型, 以及是需要对样 本进行核酸捕获, 还是需要进行特异性去除。 为了方便理解, 下面提供具体的实施例, 对本发明的技术方案进行解释, 需要说明的 是, 这些实施例仅仅是为了说明目的, 而不以任何方式限制本发明的范围。 除非特别说明, 实施例中未注明具体条件的, 均为按照常规条件或制造商建议的条件进行。 下列实施例中, 所用试剂或仪器未注明生产厂商的, 均为可以通过市购获得的常规产品。 所使用的测序用 的接头和标签序列( Index )来源于 Illumina公司的 Multiplexing Sample Preparation Oligonutide Kit。 实施例 1:
1. 样本文库制备
1.1 样本来源
样品的来源为同一患者的肝癌组织, 且此患者肝癌组织有全基因组测序信息。
1.2样本文库制备
文库构建按照 Illumina公司的标准文库制备流程说明书 ( Paired-End Sample Preparation
Guide )进行构建, 具体方法如下:
釆用 Covaris s2打断基因组 DNA, 末端补平修复, 末端加 A, 加入接头, 建库过程所 用的接头序列为:
5 ' -GATCGGAAGAGC AC ACGTCTGAACTCC AGTC AC-3 ' ( SEQ ID NO: 1 );
5 ' -TAC ACTCTTTCCCTAC ACGACGCTCTTCCGATCT-3 ' ( SEQ ID NO: 2 )
对加入接头的片段进行 PCR, 得到样本文库, 所构建的文库带有 Index标签序列, 其中 Index序列如下:
5'-CAAGC,
TCTTCCGATCT-3' ( SEQ ID NO: 3 );
TCTTCCGATCT-3' ( SEQ ID NO: 4 )。
将样本分别做成两种片段大小文库,对构建文库片段进行片段大小检测,主带为 170 bp 左右和 800 bp左右。 2. 制备 HBV探针
2.1 引物设计
本实施例中, 所设计的引物为:
PI : TTTTTCACCTCTGCCTAATCA ( SEQ ID NO: 5 );
P2: AAAAAGTTGCATGGTGCTGG ( SEQ ID NO: 6 )
2.2 PCR反应体系
PCR反应体系见表 1。 表 1
(注: dNTP中 biotin-dNTP与普通 dNTP的比例是 1 : 4, 总浓度为 2.5 mM )
2.3 PCR反应条件
PCR反应在 AB-9700PCR仪上进行, 反应程序见表 2。
表 2
2.4 PCR产物纯化及电泳检测
反应结束后, 釆用 1%琼脂糖凝胶电泳检测 PCR产物, 并用 1.2-1.5倍体积 AMPURE BEADS纯化, 釆用 80 μ1水溶解。 然后釆用 25 OMinElute PCR Purification Kit纯化, 釆用 60 μΐ水溶解。 其中, PCR产物的 1%琼脂糖凝胶电泳检测结果见图 7, 结果表明, 扩增并纯化 出了大小约 3.2 Κ的 HBV的片段。
, HBV基因组序列 ( Hepatitis B virus serotype adr, complete genome )如下:

2.5 PCR产物片段化
将经过纯化的 PCR产物全部转移至 Covaris打断小管并补加 TE緩冲液至总体积为 80 ^(Nanodrop检测其总量为 5 g), Covaris S2仪器(基因有限公司)进行打断, 由此, 获得 片段化产物, 其中打断条件见表 3。
表 3
2.6 片段化产物电泳检测
2%琼脂糖凝胶电泳检测片段化产物的大小, 结果见图 8 , 结果显示片段化产物的主带 在 250-300 bp, 表明所获得的片段化产物即可用作杂交的探针。
2.7探针保存
使用 MinElute PCR Purification Kit纯化片段产物, 溶于 40 μΐ緩冲液中, 用 Nanodrop 仪检测探针 DNA的浓度 , 使得探针的浓度为 120 ng/μΐ左右。 得到的探针可以保存在 -20 C 或 -80°C。
3. HBV探针与样本文库进行杂交
3.1 探针变性
探针使用前必须 95 °C变性 10分钟, 然后迅速放于水上冷却形成单链。
3.2 选用已确定的整合文库, 文库用量为 1 g, 探针用量为 600 ng ( Nanodrop定量), 加入接头封闭分子, 接头封闭分子的量与文库量的比值为 l nmol: l g, 标签封闭分子与文 库量的比值为 1 nmol: 1 μg.
接头封闭分子序列为:
5'-AATGATACGGCG.
ATCT-3' ( SEQ ID NO: 8 );
标签封闭分子序列为:
5'-AAGCAGAAGAC(
CTTCCGATCT-3' ( SEQ ID NO: 9 ); CTTCCGATCT-3' ( SEQ ID NO: 10 )。
在一个 1.5 mL的 EP管中加入 1 的待杂交文库, 1 nmol接头封闭分子, 1 nmol标签 封闭分子, 5 g Cot DNA。 盖好管盖, 用千净的 50 ml注射器针在分装的 EP管盖上戳一个 孔, 然后置于 60°C旋蒸仪中蒸千。 使用新的离心管管盖替换戳孔的管盖, 并做好标记。 EP 管中分别加入 EZ杂交系统中的两种试剂: 2 X SC Hybridiation Buffer杂交緩冲液 7.5 μΐ和 1 X SC Hybridiation Component A 3 μΐ, 然后 95 °C变性 10分钟, 在上述杂交混合物加入自制 探针 600 ng, 探针体积共 5 μ1。 震荡混勾后置于离心机上全速离心 10秒, 并将样品全部转 移到 200 μΙ ΡΟ 小管中。
杂交混合物中含有的成分见表 4。
表 4
将 200 μΐ PCR小管放置于 PCR仪上, 47 °C条件下杂交 24 h。
4. 杂交后洗脱
4.1 准备链霉亲和素磁珠 (Invitrogen M280)
提前从水箱中拿出链霉亲和素磁珠; 漩涡震荡磁珠 1 min, 使其充分混匀; 在 1.5 mL 的 EP管中加入 ΙΟΟ μΙ磁珠; 将 ΕΡ管置于磁力架上至液体澄清,用移液器小心地去除上清; 保持 ΕΡ管在磁力架上, 加入 200 μΐ ( 2倍体积) 的结合緩冲液(购于 Agilent公司); 从磁 力架上取下 EP管, 漩涡震荡 10 s, 使其混匀; 将 EP管重新放回磁力架至液体澄清, 用移 液器小心地去除上清; 重复清洗两次; 用 100 μΐ 的 Agilent 结合緩冲液 r悬浮磁珠; 将其转 入 0.2 ml的小管中; 用磁力架结合磁珠(将小管靠到磁力架上), 直到液体澄清, 用移液器 小心去除上清; 现在磁珠可以用来结合捕获的 DNA了。
4.2 将捕获到的 DNA结合到链霉素磁珠上
将杂交混合物吸出来 , 加到上步准备好的磁珠中; 用移液器吹打 10次混匀; 将小管放 在 PCR仪上 47°C孵育 45 min (每隔 15 min拿出来漩涡震荡 3 s以防止磁珠沉淀);孵育 45 min 后, 将混合物从 0.2 mL的小管中转入 1.5 mL的 EP管中。
4.3 洗涤结合了捕获 DNA的链霉亲和素磁珠
1 )将 EP管置于磁力架上至液体澄清, 用移液器小心地去除上清;
2 )加 100 μL预热到 47°C的 1 χ清洗緩冲液 I;
3 )漩涡震荡 10 s, 使其混匀; 4 )将 EP管置于磁力架上至液体澄清, 用移液器小心地去除上清;
5)从磁力架上取下 EP管, 加入 200 μΐ预热到 47°C的 1 χ严谨清洗緩冲液, 用移液器 吹打混匀 10次(该步操作应迅速以尽量使管中液体温度不低于 47°C );
6 ) 47°C孵育 5 min;
7 )重复步骤 5 ) -7 ), 总共用 1 严谨清洗緩冲液洗两次;
8 )将 EP管置于磁力架上至液体澄清, 用移液器小心地去除上清;
9 )加 200 μL室温下放置的 1 χ清洗緩冲液 I (不用 47°C预热的), 漩涡震荡 2 min, 使 其混匀;
10 )将 EP管置于磁力架上至液体澄清, 用移液器小心地去除上清;
11 )加 200 μL室温下放置的 1 χ清洗緩冲液 II, 漩涡震荡 1 min, 使其混匀;
12 )将 EP管置于磁力架上至液体澄清, 用移液器小心的去除上清;
13 ) 加 200 μ 室温下放置的 1 χ清洗緩冲液 III, 漩涡震荡 30 s, 使其混匀;
14) 将 EP管置于磁力架上至液体澄清, 用移液器小心地去除上清;
15)从磁力架上取下 EP管, 加入 76 μΐ超纯水(不用将 DNA从磁珠上洗脱下来, 可以 直接进行 PCR, 取样 35 μΐ进行后面的 PCR反应)。
5. PCR反应
预先从 -20°C保存的试剂盒中取出 PFX聚合酶 (购于 Invirtogen公司), PFX反应緩冲液 (10 X ) , dNTP(10 mM)。 引物序列为:
PCR Flowcell-Primer F ( 10 pm/μΐ ):
AATGATACGGCGACCACCGAGATC ( SEQ ID NO: 11 );
PCR Flowcell-Primer R ( 10 pm/μΐ ):
CAAGCAGAAGACGGCATACGA ( SEQ ID NO: 12 )。
在 PCR小管上, 每孔按照表格 5配置 PCR反应体系。
表 5
反应条件见表 6。 表 6
PCR结束后, 每个样品都用 1.5倍体积的 Amprue Beads纯化, 回收的 PCR产物溶于 30 μΐ超纯水中, Nanodrop 1000测浓度。 6. PCR产物上机测序
上述纯化后的 PCR产物经 2100 Bioanalyzer (Agilent)确定大小及插入片段大小见图 9和 图 10, 纯化产物大小分别为 271 bp和 876 bp, QPCR精确定量后上机测序。 在本实施例中, 上机测序按照 Illumina/Solexa官方公布的 c-Bot和 HISEQ2000Hiseq 2000说明书进行操作。 7. 信息分析
将下机数据除去重复和被接头污染的 reads,统计下机数据的基本信息(文库长度; reads 长度; reads条数; 碱基数; 重复率等); 分别截取 PE的两条 reads 前面的 50 bp碱基, 形 成一对长为 50 bp新 reads,即 PE50 reads„将新的 PE50 reads运用 soap比对软件( -r 1 -v 2 ) 分别与人的参考序列(hgl9)和 HBV各种参考序列进行比对,从比对结果中挑选出一条 read 比到人的参考序列并且另一条比对到 HBV参考序列的一对 reads; 这样的 reads很有可能跨 过 HBV插入的位点; 统计这部分 reads比对信息, 找到在人类基因组的插入热点区域。
杂交结果见表 7。
表 7
表 7的结果为釆用上机数据得到结果, 样本 L-170, L-800, Genome均来自同一肝癌样 本, L-170为插入片段 170 bp, L-800为 800bp文库, genome为全基因组测序。 从表 7中可 以得出自制探针对于捕获基因片段的准确性, 以及片段长度的影响。 通过本发明的方法完 全可以得到稳定以及可靠的位点, 且所需数据量仅为全基因组测序数据的 1%左右。 实施例 2: 对宫颈癌患者外周血样品进行全基因组分析
1、 DN A提取及测序
根据常规方法, 对宫颈癌患者进行静脉取血, 得到宫颈癌患者的外周血样本, 通过离 心得到血浆样本。 按照 Tiangen Micro Kit (DP316) 量基因组操作流程从血浆样本提取 DNA,分别用 Qubit ( Invitrogen , the Quant-iT™ dsDNAHS Assay Kit )定量,所提取的 DNA 总量分别为 5 ~ 50 ng。
将所提取到 的 DNA , 分别按照制造商提供的标准建库规程 ( 参见 http://www.illumina.com/提供的 Illumina标准建库说明书)建立 DNA文库。筒言之,在 DNA 分子两端加上测序用的接头, 并被加上不同的标签序列, 然后与测序芯片表面互补接头杂 交, 使核酸分子成簇生长, 然后在 Illumina HiSeq 2000上通过 100轮深度测序循环, 得到长 度为 lOObp的 DNA片段序列。 本实施例中, 对于获自肿瘤病人外周血的 DNA样本分批按 照制造商提供的操作说明书 (参见 Illumina官方公布说明书)进行上机测序操作。
2、 数据分析
根据制造商 Illumina提供的 Pipeline操作说明书 (参见 http://www.illumina.com/提供的 Pipeline方法说明书),将步骤 DNA测序部分中测得的序列信息经过图形转化获得测序序列 信息, 去掉测序盾量低的序列之后最终可以获得针对 NCBI版本 36的人类基因组参考序列 的 ELA D比对结果。
将获得的数据使用 SOAP软件包进行比对分析, 使用两个末端测序信息进行比对时去 除两个末端均比对至人基因组的序列, 保留其中一条链比对至人基因组的序列, 将另一末 端序列比对至 HPV基因组序列中, 获得 HPV在人基因组重组信息, 包括人基因组中重组 位置以及 HPV类型。
3、 分析结果:
根据数据分析部分中的数据分析流程, 通过使用高通量测序平台对宫颈癌样品进行深 度测序以及数据分析 , 共检测到 45个超过 10条测序序列支持的 HP V整合基因, 发生整合 HPV区域均为 E1区, 发生整合的 HPV型别为 HPV16型。
表 8、 检测出来的支持数超过 10的 HPV整合情况
ARHGEFIOL chrl hpv-9,hpv- 10,hpv- 11 El HPV16 55160
TMC07 chrl6 hpv-9,hpv- 10,hpv- 11 El HPV16 79613
PPEF1 chrX hpv-9,hpv- 10,hpv- 11 El HPV16 5475
PRKD2 chrl 9 hpv-9,hpv- 10,hpv- 11 El HPV16 25865
UNC13A chrl 9 hpv-9,hpv- 10,hpv- 11 El HPV16 23025
DENNDIA chr9 hpv-9,hpv- 10,hpv- 11 El HPV16 57706
ZCCHC7 chr9 hpv-9,hpv- 10,hpv- 11 El HPV16 84186
GLG1 chrl 6 hpv-9,hpv- 10,hpv- 11 El HPV16 2734
PCCA chrl 3 hpv-9,hpv- 10,hpv- 11 El HPV16 5095
SMYD3 chrl hpv-9,hpv- 10,hpv- 11 El HPV16 64754
DOCK1 chrlO hpv-9,hpv- 10,hpv- 11 El HPV16 1793
INSR chrl 9 hpv-9,hpv- 10,hpv- 11 El HPV16 3643
C2orG4 chr2 hpv-9,hpv- 10,hpv- 11 El HPV16 79823
JUP chrl 7 hpv-9,hpv- 10,hpv- 11 El HPV16 3728
NSF chrl 7 hpv-9,hpv- 10,hpv- 11 El HPV16 4905
GPC3 chrX hpv-9,hpv- 10,hpv- 11 El HPV16 2719
CAC B2 chrlO hpv-9,hpv- 10,hpv- 11 El HPV16 783
CHD9 chrl 6 hpv-9,hpv- 10,hpv- 11 El HPV16 80205
ADK chrlO hpv-9,hpv- 10,hpv- 11 El HPV16 132
INTS4 chrl l hpv-9,hpv- 10,hpv- 11 El HPV16 92105
ACVR1B chrl2 hpv-9,hpv- 10,hpv- 11 El HPV16 91
DT B chr2 hpv-9,hpv- 10,hpv- 11 El HPV16 1838
BMPR2 chr2 hpv-9,hpv- 10,hpv- 11 El HPV16 659
UVRAG chrl l hpv-9,hpv- 10,hpv- 11 El HPV16 7405
BPHL chr6 hpv-9,hpv- 10,hpv- 11 El HPV16 670
ADCY2 chr5 hpv-9,hpv- 10,hpv- 11 El HPV16 108
NVL chrl hpv-9,hpv- 10,hpv- 11 El HPV16 4931
SAMHD1 chr20 hpv-9,hpv- 10,hpv- 11 El HPV16 25939
VKORCILI chr7 hpv-9,hpv- 10,hpv- 11 El HPV16 154807
ATP1B3 chr3 hpv-9,hpv-10 El HPV16 483
DE ND2C chrl hpv-9,hpv-10 El HPV16 163259
ACACA chrl 7 hpv-9,hpv- 10,hpv- 11 El HPV16 31
STYXL1 chr7 hpv-9,hpv- 10,hpv- 11 El HPV16 51657
ADD3 chrlO hpv-9,hpv-l l El HPV16 120
DPP8 chrl 5 hpv-9,hpv- 10,hpv- 11 El HPV16 54878 11 SLC4A5 chr2 hpv-9,hpv- 10,hpv- 11 El HPV16 57835
10 ABR chrl7 hpv-9,hpv- 10,hpv- 11 El HPV16 29
10 MYOM1 chrl8 hpv-9,hpv- 10,hpv- 11 El HPV16 8736
10 DSTN chr20 hpv-9,hpv- 10,hpv- 11 El HPV16 11034
10 ASTN2 chr9 hpv-9,hpv- 10,hpv- 11 El HPV16 23245
10 FBX043 chr8 hpv-9,hpv- 10,hpv- 11 El HPV16 286151
10 HCN1 chr5 hpv-9,hpv- 10,hpv- 11 El HPV16 348980 本实施例表明通过由于第二代测序技术能够对肿瘤样品进行深度测序, 从而能够快速 地对病毒与人体基因的整合进行检测, 并且能准确提供被整合的人基因组区域信息以及整 合外源序列信息。 实施例 3: 对肝癌样品外周血通过目标区域分析
实验方法:
1、 DNA提取及文库构建:
外周血 DNA提取和文库制备方法与实施例 2相同, 只是样品来源为多名肝癌患者。
2、 捕获游离核酸:
本实施例中将使用核酸探针芯片 (Mmblegen )对含有外源序列区域的核酸片段进行捕 获。 实验流程如下:
a. 样品准备:
其中,核酸探针是以具有 SEQ ID NO: 7所示的核酸序列的 HBV基因组( Hepatitis B virus serotype adr, complete genome ) 为模板, 以 60 bp为一个探针长度, 每间隔 5 bp设置一个探 针, 进行设计得到的。
PE Block 1.0:
5'-AATGATA'
ATCT-3' ( SEQ ID NO: 13 );
PE Block 2.0: CTTCCGATCT-3' ( SEQ ID NO: 14 )。
b. 将准备好的样品置于 SpeedVac中 60°C蒸千, 然后加入 11.2 超纯水溶解样品。 c 全速离心样品 30秒, 分别加入以下两种试剂: 18.5 的 2 X SC Hybridiation Buffer ( Roche NimbleGen公司)和 7.3 μL的 SC Hybridiation Component A ( Roche NimbleGen公 司)。 震荡混匀后置于离心机上全速离心 30秒, 然后于 95 °C使 DNA变性 10分钟。
d. 根据制造商提供的说明书, 将带有相应探针的芯片固定在杂交仪 ( Roche NimbleGen 公司)上, 将变性后的样品加入芯片中并封闭芯片, 然后设定杂交程序, 于 42 °C杂交 64-72 小时。
e. 芯片洗涤与样品洗脱:
f. 将 NaOH洗脱液回收, 并用 32 20%水醋酸中和, 得到中和液。
g. 将上述中和液用 Qiagen MinElute PCR Purification Kit纯化, 捕获后的样品最后溶解 于 138 μL纯水中。
h. PCR扩增捕获的 DNA文库, 分为 6管 50 反应进行 PCR, PCR的反应物组成如下:
其巾,
PE Post Primer 1.0: AATGATACGGCGACCACCGAGATC ( SEQ ID NO: 15 );
PE Post Primer 2.0: CAAGCAGAAGACGGCATACGA ( SEQ ID NO: 16 )。
PCR的反应条件如下: ( a ) . 98 °C 30 s
( b ) . 98 °C 15 s
( c ) . 62 °C 30 s
( d ) . 72 °C 30 s
( e ) . 重复( b ) - ( d ) 步骤 11-19次 (共扩增 12-20次)
( f) . 72 °C 5 min
( g ) . 4°C 静置
i.用 Qiagen QIAquick PCR Purification Kit纯化 PCR产物, 最后溶于 30 纯水中。
3、 高通量测序
本实施例中,对于获自肿瘤病人外周血 DNA样本分批按照制造商提供的操作说明书(参 见 Illumina/Solexa官方公布的 cBot )进行上机测序操作。 通过 100轮测序循环, 得到长度 为 100 bp的 DNA片段序列。
4、 数据分析
根据制造商 Illumina提供的 Pipeline操作说明书 (参见 http://www.illumina.com/提供的 Pipeline 方法说明书), 将步骤高通量测序部分中测得的序列信息经过图形转化获得测序序 列信息, 去掉测序盾量低的序列之后最终可以获得针对 NCBI版本 36的人类基因组参考序 列的 ELA D比对结果。
获得的数据使用 SOAP软件包进行比对分析, 使用两个末端测序信息进行比对时去除 两个末端均比对至人基因组的序列, 保留其中一条链比对至人基因组的序列, 将另一末端 序列比对至 HBV基因组序列中, 获得 HBV在人基因组重组信息, 包括人基因组中重组位 置以及 HBV类型。
5、 数据结果
测到肝癌样品中 HBV病毒整合信息, 即一段 733 bp HBV序列整合至 1号染色体区域。 实施例 4: 对肝癌样品外周血及组织通过目标区域捕获分析
实验方法:
1、 DN A提取及测序
根据常规方法, 对肝癌患者进行静脉取血, 得到患者的外周血样本, 通过离心得到血 浆样本。 按照 Tiangen Micro Kit (DP316)微量基因组操作流程从血浆样本提取 DNA, 并分 别用 Qubit ( Invitrogen , the Quant-iT™ dsDNAHS Assay Kit )定量,所提取的各样本的 DNA 总量均为 5 ~ 50 ng。
根据常规方法, 取肝癌患者, 癌组织样本对组织样本进行全基因组提取, 取 3 微克进 行常规建库, 文库插入片段主带为 170bp.
将所提取到 的 DNA , 分别按照制造商提供的标准建库规程 ( 参见 http://www.illumina.com/提供的 Illumina标准建库说明书)建立 DNA文库。筒言之,在 DNA 分子两端加上测序用的接头, 并被加上不同的标签序列, 然后与测序芯片表面互补接头杂 交, 使核酸分子成簇生长, 然后在 Illumina HiSeq 2000上测序 PE101 , 得到长度为 lOObp的 DNA片段序列。
2、 捕获游离核酸:
本实施例中将使用 HBV ( Nimblegen )核酸探针芯片对含有外源序列区域的核酸片段进 行捕获。 实验流程如下:
a. 样品准备:
其中, HBV核酸探针是由 HBV的 A, B , C, D, E, F, G, H八个型别的基因组进行 设计得到的,各基因组序列具体可见公知数据库中的 HB V基因组序列。具体地,按照 HB V 基因组长度, 每次在基因组上 10 bp滑动移动一次, 合成 60-90 bp长度且带 Bio-tin标记的 探针。 具体探针是委托相应的公司合成的。
b. 将准备好的样品置于 SpeedVac中 60°C蒸千。
c 全速离心样品 30秒, 分别加入以下两种试剂: 7.5 的 2 X SC Hybridiation Buffer ( Roche NimbleGen公司 )和 3.0 μL的 SC Hybridiation Component A ( Roche NimbleGen公 司)。 震荡混匀后置于离心机上全速离心 30秒, 然后于 95 °C使 DNA变性 10分钟, 而后加 入探针 4.5 μΐ于 47°C杂交 24小时。
e. 芯片洗涤与样品洗脱: 按照标准的 EZ洗脱流程进行洗脱, 回收。
f. 预先从 -20°C保存的试剂盒中取出 Pfx酶 (Invirtogen), Pfx bufFer(10*), dNTP(lO mM), PCR Primer F(10 pm/μΐ), PCR Primer R( 10 ριη/μ1)。
在 PCR小管上, 每孔按照下面的表格配置 PCR反应体系: Pfx緩冲液 (10*) 5 μΐ
MgS04 2 μΐ
dNTP(10 mM) 2 μΐ
Flowcell-primer-F 1 (10 pm/μΐ) 2.5 μΐ
Flowcell-primer-Rl (10 pm/μΐ) 2.5 μΐ
总体积 50 μΐ
其巾,
Flowcell-primer-F 1 : AATGATACGGCGACCACCGAGATC ( SEQ ID NO: 17 );
Flowcell-primer-Rl : CAAGCAGAAGACGGCATACGA ( SEQ ID NO: 18 )。
程序如下:
94 °C 2min;
94 °C 15s, 58 °C 30s, 72 °C 30s, 14个循环;
72 °C 5min,
4°C ∞。
PCR结束后, 每个样品都用 1.5倍体积的 Amprue Beads纯化, 回收的 PCR产物溶于 30 μΐ超纯水中, NanodroplOOO测其浓度为 10
3、 高通量测序
本实施例中,对于获自肿瘤病人外周血 DNA样本分批按照制造商提供的操作说明书(参 见 Illumina/Solexa官方公布的 cBot )进行上机测序操作。
4、 数据分析
将下机数据除去重复和被接头污染的 reads,统计下机数据的基本信息(文库长度; reads 长度; reads条数; 碱基数; 重复率等); 分别截取 PE的两条 reads 前面的 50bp碱基, 形成 一对长为 50bp新 reads, 即 PE50 reads„ 将新的 PE50 reads运用 soap比对软件( -r 1 -v 2 ) 分别与人的参考序列(hgl9)和 HBV各种参考序列进行比对,从比对结果中挑选出一条 read 比到人的参考序列并且另一条比对到 HBV参考序列的一对 reads; 这样的 reads很有可能跨 过 HBV插入的位点;组装这部分 reads,釆用 BWA比对找到在人类基因组的插入热点区域。
5、 数据结果
A患者组织 DNA, 经过杂交后 1G (碱基 )数据量结果如下:
chrl7 18778266 8
A患者血浆 DNA, 经过杂交后 5G (碱基 )数据量结果如下:
釆用上述方法对同一患者的血浆与肝癌组织中的整合状态进行查找, 发现组织中存在 的支持数最高的位置, 在血浆中同样存在, 此方法不仅证明组织与血浆游离 DNA之间的关 系, 并且能够准确有效地找出血浆中的整合位置, 表明本发明的用于确定人体具有异常状 态方法为能够有效地应用于病原体引起染色体整合相关疾病的无创检测。 实施例 5: 对 HPV患者子宫颈脱落细胞目标区域捕获分析
实验方法:
1、 DN A提取及测序
根据常规方法, 对 HPV 患者进行子宫颈脱落细胞取样, 样本按照 Tiangen Micro Kit
(DP316) 量基因组操作流程从血浆样本提取 DNA, 分别用 Qubit ( Invitrogen , the Quant-iT™ dsDNAHS Assay Kit )定量, 所提取的 DNA总量分别为 100 ~ 500 ng。
将所提取到 的 DNA , 分别按照制造商提供的标准建库规程 ( 参见 http:〃 www.illumina.com/提供的 Illumina标准建库说明书)建立 170 bp DNA文库。 筒言之, 在 DNA分子两端加上测序用的接头, 并被加上不同的标签序列, 然后与测序芯片表面互补 接头杂交, 使核酸分子成簇生长, 然后在 Illumina HiSeq 2000上测序 PE101 , 得到长度为 100 bp的 DNA片段序列。
2、 捕获游离核酸:
本实施例中将使用(Mygenostics公司) HPV核酸探针芯片对含有外源序列区域的核酸片 段进行捕获。 实验流程如下:
a. 样品准备:
总体积
65度 22小时
其中, HPV核酸探针是由 HPV的 6, 11 , 16, 18, 31 , 33 , 35 , 39, 45 , 52, 56, 58, 59, 66, 68, 69, 82型别的基因组进行设计得到的, 各基因组序列具体可见公知数据库中 的 HPV基因组。 具体地, 按照 HPV基因组长度, 每次在基因组上 10 bp滑动移动一次, 合 成 60-90 bp长度且带 Bio-tin标记的探针。 具体探针是委托相应的公司合成的。
b. 芯片洗涤与样品洗脱: 按照标准(MyGenostics )洗脱流程进行洗脱, 回收, 具体步 骤如下:
1 )提前将温浴器调至 65 °C ;
2 )用漩涡混合仪剧烈振荡重悬 Myone beads CI ( Invitrogen ) 至混匀;
3 )每一个杂交反应取 50 μΐ Myone beads CI磁珠于一新的 1.5 mL离心管中,放于磁力 架上, 然后去除上清;
4 ) 洗涤磁珠:
a) 加入 50 μL 1*结合緩冲液;
b) 用漩涡混合仪剧烈振荡 5秒钟重悬磁珠;
c) 将离心管放于磁力架上, 待液体变澄清;
d) 去除上清液;
e) 重复 2次 "步骤 a到步骤 d" ;
5 )加入 80 μL (根据不同大小捕获区域区域加入量不同, 具体按照 KIT要求加入) 1* 结合緩冲液重悬磁珠;
6 )加入 64 μL 2*结合緩冲液重悬磁珠(与杂交液体积同等体积), 将液体转移到 EP1 后, 总体积约为 200 升;
7 )振荡混匀后在室温下放于 ROATER上进行 1小时;
8 )震荡混匀后将样品放于磁力架上, 去除上清;
9 )加入 500 μ1 \¥Β1 , 振荡混匀后旋转混匀 15分钟, 然后放于磁力架上去上清;
10 )加入 500 μΐ WB3 , 振荡混匀后放于 65度温浴, 850 rpm, 10分钟, 放于磁力架上 去上清;
11 )重复( 10 ) 5次, 最后一次完全去除上清;
12 )加入 50 μΐ洗脱緩冲液, 振荡混勾, 室温放置 10分钟, 放于磁力架上取上清转入 另一 ΕΡ管 (管内包含 70 μΐ Ε緩冲液);
13 )釆用 QIAquick Minelute进行纯化, 最终溶解 42 μΐ ΕΒ。
c. 捕获样品的扩增与纯化
1)从 -20°C水箱中取出 2*PHUSION MASTER, Flowcell primer s( 10 μΜ), 将其置于水上 化冻并充分混匀。
2)在水上为每个捕获样品配制一份 Mix, 另外加入一个无模板的阴性对照, 按以下表 格组分配制反应 Mix并用移液器混匀:
3)在热循环仪中运行下列程序:
a. 98 °C 30s
b. 98 °C 25 s
c. 65 °C 30 s
d. 72 °C 30 s
e. 重复 b-d步骤 (共 15次循环)
f. 72 °C 5 min
g. 4 °C Hold
PCR结束后, 每个样品都用 1.5倍体积的 Amprue Beads纯化, 回收的 PCR产物溶于
30 μΐ超纯水中, NanodroplOOO测浓度, 并记录, 其浓度为 10
3、 高通量测序
本实施例中, 对于获自 HPV患者的子宫颈脱落细胞 DNA样本分批按照制造商提供的 操作说明书 (参见 Illumina/Solexa官方公布的 cBot )进行上机测序操作。 通过 100轮测序 循环, 得到长度为 100 bp的 DNA片段序列。
4、 数据分析
将下机数据除去重复和被接头污染的 reads,统计下机数据的基本信息(文库长度; reads 长度; reads条数; 碱基数; 重复率等); 分别截取 PE的两条 reads 前面的 50bp碱基, 形成 一对长为 50bp新 reads, 即 PE50 reads„ 将新的 PE50 reads运用 Soap比对软件 ( -r 1 -v 2 ) 分别与人的参考序列(hgl9)和 HBV各种参考序列进行比对,从比对结果中挑选出一条 read 比到人的参考序列并且另一条比对到 HBV参考序列的一对 reads; 这样的 reads很有可能跨 过 HBV插入的位点;组装这部分 reads,釆用 BWA比对找到在人类基因组的插入热点区域。
5、 数据结果
HPV16型感染且宫颈病变程度为 CIN四期病人, 数据量 1G, 结果如下: chr2 133034596 16
上述方法釆用宫颈病变程度为 CIN四期病人, 感染的宫颈脱落细胞进行检测, 结果准 确发现高频整合位置, 证明了袅明太 明 ^用千硇 工业实用性
本发明的用于确定人体具有异常状态的系统和方法,能够有效地应用于人体疾病的无 创检测, 通过对人体样本的核酸序列信息进行分析, 可以根据核酸序列中所包含的信息准 确地确定人体是否具有异常状态。 尽管本发明的具体实施方式已经得到详细的描述, 本领域技术人员将会理解。 根据已 经公开的所有教导, 可以对那些细节进行各种修改和替换, 这些改变均在本发明的保护范 围之内。 本发明的全部范围由所附权利要求及其任何等同物给出。
在本说明书的描述中, 参考术语 "一个实施例"、 "一些实施例"、 "示意性实施例"、 "示 例"、 "具体示例"、 或 "一些示例" 等的描述意指结合该实施例或示例描述的具体特征、 结 构、 材料或者特点包含于本发明的至少一个实施例或示例中。 在本说明书中, 对上述术语 的示意性表述不一定指的是相同的实施例或示例。 而且, 描述的具体特征、 结构、 材料或 者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

Claims (23)

  1. 权利要求书
    1、 一种确定人体具有异常状态的方法, 其特征在于, 包括:
    提供人体样本的核酸序列信息, 所述人体样本的核酸序列信息是基于对所述人体样本 进行检测而获得的; 以及
    基于所述人体样本的核酸序列信息, 确定所述人体是否具有异常状态。
  2. 2、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于, 所述人体样本 的核酸序列信息是基于对所述人体样本进行核酸序列检测而获得的。
  3. 3、 根据权利要求 2所述的确定人体具有异常状态的方法, 其特征在于, 所述核酸序列 检测是借助第二代测序技术或第三代测序技术进行的。
  4. 4、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于, 所述样本为所 述人体的细胞、 组织、 血液、 体液、 尿液、 排泄物或其组合。
  5. 5、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于, 所述人体样本 为血浆或者血清。
  6. 6、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于, 所述核酸序列 信息包括所述人体样本中游离核酸的序列信息。
  7. 7、 根据权利要求 6所述的确定人体具有异常状态的方法, 其特征在于, 所述人体样本 中游离核酸的序列信息是通过除去所述人体样本中的细胞后, 进行测序检测而获得的。
  8. 8、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于, 所述异常状态 选自疾病的发生、 疾病的发展阶段、 疾病的疗效和预后的至少一种。
  9. 9、 根据权利要求 8所述的确定人体具有异常状态的方法, 其特征在于, 所述疾病是肿 瘤性疾病、 免疫性疾病、 遗传性疾病的至少一种。
  10. 10、 根据权利要求 9 所述的确定人体具有异常状态的方法, 其特征在于, 所述肿瘤性 疾病是选自肺癌、 肝癌、 胃癌、 食管癌、 结直肠癌、 胰腺癌、 乳腺癌、 膀胱癌、 肾癌、 卵 巢癌、 宫颈癌、 甲状腺癌、 鼻咽癌、 脑胶盾瘤的至少一种。
  11. 11、 根据权利要求 8 所述的确定人体具有异常状态的方法, 其特征在于, 如果所述核 酸序列信息包含选自下列至少一种的核酸片段序列: HBV、 HPV、 EBV、 幽门螺旋杆菌, 则确定所述人体患有宫颈癌、 肝癌、 鼻咽癌、 胃癌的至少一种。
  12. 12、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于,
    对所述核酸进行测序检测之前, 利用探针捕获含有特定序列的核酸, 然后对所述含有 特定序列的核酸进行测序检测。
  13. 13、 根据权利要求 12所述的确定人体具有异常状态的方法, 其特征在于,
    所述探针对于选自下列的至少一种是特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌, 任选地, 所述探针为核酸探针集, 包括多个探针, 所述核酸探针集具有以下特征: ( 1 )每个探针上具有 1个或多个生物素标记的 dNTP; 和 /或
    ( 2 )所述生物素标记的 dNTP在所述探针集中的丰度为 1 : 6-1 : 2; 和 /或 ( 3 )所述探针集的全部核酸序列覆盖对应选自 HBV、 HPV、 EBV和幽门螺旋杆菌的 至少一种病毒的基因组序列的 70%-100%,
    优选地, 所述探针集具有 1-20000个核酸探针; 较佳地, 所述探针集具有 1000-5000个 核酸探针; 更佳地, 所述探针集具有 2500个核酸探针,
    优选地, 所述生物素标记的 dNTP在所述探针集中的丰度为 1 : 4,
    优选地, 在所述探针集中, 所述探针之间具有部分重叠,
    优选地, 所述探针长度为 100-500 bp; 较佳地, 所述探针长度为 200-300 bp; 更佳地, 所述探针长度为 250 bp,
    优选地, 所述探针是以病毒基因组作为模板, PCR法扩增获得的, 较佳地, 所述模板 为选自 HBV基因组、 HCV基因组、 HIV基因组和 HPV基因组的至少一种; 更佳地, 所述 模板为 B型 HBV基因组和 /或 C型 HBV基因组。
  14. 14、 根据权利要求 1所述的确定人体具有异常状态的方法, 其特征在于,
    在对所述核酸进行测序检测之前, 利用探针去除含有特定序列的核酸, 然后对所述去 除后剩余的核酸进行测序检测。
  15. 15、 根据权利要求 14所述的确定人体具有异常状态的方法, 其特征在于,
    所述探针可以结合人体基因组中的共有序列, 或者为可以结合人体基因组中甲基化位 点的抗体或者蛋白。
  16. 16、 一种用于确定人体具有异常状态的系统, 其特征在于, 包括:
    核酸序列信息接收器, 所述核酸序列信息接收器接收人体样本的核酸序列信息; 以及 核酸序列信息分析器, 所述核酸序列信息分析器与所述核酸序列信息接收器相连, 并 基于所述人体样本的核酸序列信息, 确定所述人体是否具有异常状态。
  17. 17、 根据权利要求 16所述的用于确定人体具有异常状态的系统, 其特征在于, 所述核酸序列信息分析器内预存有选自下列的至少一种: 人体正常状态的基因组序列、 病原体的基因组序列、 正常人群的基因组序列。
  18. 18、 根据权利要求 17所述的用于确定人体具有异常状态的系统, 其特征在于, 所述病 原体为选自 HBV、 HPV、 EBV、 幽门螺旋杆菌的至少一种。
  19. 19、 根据权利要求 18所述的用于确定人体具有异常状态的系统, 其特征在于, 进一步 包括核酸序列检测装置, 所述核酸序列检测装置与所述核酸序列信息接收器相连, 用于对 所述人体样本进行核酸序列检测获得所述核酸序列信息并输送至所述核酸序列信息接收 器。
  20. 20、 根据权利要求 19所述的用于确定人体具有异常状态的系统, 其特征在于, 所述核 酸序列检测装置借助第二代测序技术或第三代测序技术。
  21. 21、 根据权利要求 19所述的用于确定人体具有异常状态的系统, 其特征在于, 进一步 包括
    游离核酸捕获装置, 所述游离核酸捕获装置与所述核酸序列检测装置相连,
    其巾, 所述游离核酸捕获装置设置有探针 ,
    所述探针适于捕获含有特定序列的核酸, 并且将所述含有特定序列的核酸输送至所述 核酸序列检测装置进行核酸序列检测; 或者
    所述探针适于去除含有特定序列的核酸, 并且将所述去除后的核酸输送至所述核酸序 列检测装置进行核酸序列检测。
  22. 22、 根据权利要求 21所述的确定人体具有异常状态的方法, 其特征在于,
    所述适于捕获含有特定序列的核酸的探针对于选自下列的至少一种是特异性的: HBV、 HPV、 EBV、 幽门螺旋杆菌,
    任选地, 所述探针为核酸探针集, 包括多个探针, 所述核酸探针集具有以下特征: ( 1 )每个探针上具有 1个或多个生物素标记的 dNTP; 和 /或
    ( 2 )所述生物素标记的 dNTP在所述探针集中的丰度为 1 : 6-1 : 2; 和 /或
    ( 3 )所述探针集的全部核酸序列覆盖对应选自 HBV、 HPV, EBV和幽门螺旋杆菌的 至少一种病毒的基因组序列的 70%-100%,
    优选地, 所述探针集具有 1-20000个核酸探针; 较佳地, 所述探针集具有 1000-5000个 核酸探针; 更佳地, 所述探针集具有 2500个核酸探针,
    优选地, 所述生物素标记的 dNTP在所述探针集中的丰度为 1 : 4,
    优选地, 在所述探针集中, 所述探针之间具有部分重叠,
    优选地, 所述探针长度为 100-500 bp; 较佳地, 所述探针长度为 200-300 bp; 更佳地, 所述探针长度为 250 bp,
    优选地, 所述探针是以病毒基因组作为模板, PCR法扩增获得的, 较佳地, 所述模板 为选自 HBV基因组、 HCV基因组、 HIV基因组和 HPV基因组的至少一种; 更佳地, 所述 模板为 B型 HBV基因组和 /或 C型 HBV基因组。
  23. 23、 根据权利要求 21所述的确定人体具有异常状态的方法, 其特征在于,
    所述适于除去含有特定序列的核酸的探针为可以结合人体基因组中的共有序列, 或者 为可以结合人体基因组中甲基化位点的抗体或者蛋白。
CN201280029759.1A 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法 Active CN103797130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201280029759.1A CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN2011101746862 2011-06-24
CN201110174686.2 2011-06-24
CN2011101746862A CN102839211A (zh) 2011-06-24 2011-06-24 用于确定人体具有异常状态的系统和方法
PCT/CN2011/082855 WO2013075313A1 (zh) 2011-11-24 2011-11-24 一种检测病毒在待测样本中整合方式的探针及其制备方法和应用
CNPCT/CN2011/082855 2011-11-24
PCT/CN2012/077175 WO2012175013A1 (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法
CN201280029759.1A CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Publications (2)

Publication Number Publication Date
CN103797130A true CN103797130A (zh) 2014-05-14
CN103797130B CN103797130B (zh) 2016-07-27

Family

ID=47422031

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280029759.1A Active CN103797130B (zh) 2011-06-24 2012-06-19 用于确定人体具有异常状态的系统和方法

Country Status (2)

Country Link
CN (1) CN103797130B (zh)
WO (1) WO2012175013A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11319602B2 (en) 2017-02-07 2022-05-03 Tcm Biotech Internationl Corp. Probe combination for detection of cancer

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150119260A1 (en) * 2013-10-18 2015-04-30 National Taiwan University Circulating cancer biomarker and its use
CN109957492A (zh) * 2017-12-26 2019-07-02 安诺优达基因科技(北京)有限公司 一种用于二代测序dna文库构建的自动化液体处理工作站
CN108753922A (zh) * 2018-06-04 2018-11-06 广州微芯生物科技有限公司 一种构建转录组测序文库的方法及相应的接头序列和试剂盒

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1932033A (zh) * 2006-09-22 2007-03-21 东南大学 基于微阵列芯片的核酸测序方法
CN101743320A (zh) * 2007-04-24 2010-06-16 伊维什遗传诊断公司 来自基因转录产物检测的具有广泛基础的疾病结合
CN101921874A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法
CN102203273A (zh) * 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1932033A (zh) * 2006-09-22 2007-03-21 东南大学 基于微阵列芯片的核酸测序方法
CN101743320A (zh) * 2007-04-24 2010-06-16 伊维什遗传诊断公司 来自基因转录产物检测的具有广泛基础的疾病结合
CN102203273A (zh) * 2008-09-09 2011-09-28 生命技术公司 生成基因特异性的文库的方法
CN101921874A (zh) * 2010-06-30 2010-12-22 深圳华大基因科技有限公司 基于Solexa测序法的检测人类乳头瘤病毒的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ROWIDA ALMOMANI,ET AL: "Experiences with array-based sequence capture;toward clinical applications", 《EUROPEAN JOURNAL OF HUMAN GENETICS》, vol. 19, 24 November 2010 (2010-11-24), pages 50 - 55 *
STEPHAN BAU,ET AL: "Targeted next-generation sequencing by specific capture of multiple genomic loci using low-volume microfluidic DNA arrays", 《ANAL BIOANAL CHEM》, vol. 393, 29 October 2008 (2008-10-29), pages 171 - 175, XP019652995 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11319602B2 (en) 2017-02-07 2022-05-03 Tcm Biotech Internationl Corp. Probe combination for detection of cancer

Also Published As

Publication number Publication date
CN103797130B (zh) 2016-07-27
WO2012175013A1 (zh) 2012-12-27

Similar Documents

Publication Publication Date Title
Tang et al. Application of magnetic nanoparticles in nucleic acid detection
US20230340590A1 (en) Method for verifying bioassay samples
CN107190329B (zh) 基于dna的融合基因定量测序建库、检测方法及其应用
CN105734679B (zh) 核酸靶序列捕获测序文库的制备方法
WO2020233094A1 (zh) 一种ngs建库分子接头及其制备方法和用途
CN111575380B (zh) 多基因检测用的探针库、杂交试剂盒和多基因检测的方法
EP3612641A1 (en) Compositions and methods for library construction and sequence analysis
CN109777877B (zh) 基于ptbp1甲基化辅助诊断脑动脉瘤的检测试剂盒及其应用
CN108753954B (zh) 痴呆相关基因的捕获探针组、试剂盒、文库构建方法和用途
CN109536579A (zh) 单链测序文库的构建方法及其应用
EP3904515A1 (en) Tumor marker stamp-ep3 based on methylation modification
CN106757379A (zh) 肺癌多基因变异文库构建方法
TW201321566A (zh) 用於確定人體具有異常狀態的系統和方法
CN103797130A (zh) 用于确定人体具有异常状态的系统和方法
CN106755506A (zh) 用于检测肿瘤ffpe样本中基因变异的试剂盒
CN106701936A (zh) 乳腺癌易感基因brca1和brca2检测试剂盒及方法
CN111386362A (zh) 一种体液游离dna的文库构建方法及其应用
CN102140509B (zh) 一种基于固相载体上核酸扩增的基因突变检测方法
CN110157808A (zh) 一种与喉鳞癌发生发展相关的非编码rna的应用
US20180023138A1 (en) Assays for Single Molecule Detection and Use Thereof
CN106282361B (zh) 用于捕获血液病相关基因的基因捕获试剂盒
CN102839211A (zh) 用于确定人体具有异常状态的系统和方法
CN110484619A (zh) 一种利用rs11249454检测氯吡格雷药效试剂盒
CN115627541B (zh) 从微量DNA建立cfDNA库的方法、系统和应用
KR102539423B1 (ko) 엑소좀 유래 rna를 이용한 비침습적 대장암 진단 및 분석법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20161221

Address after: Yantian District of Shenzhen City, Guangdong province 518083 Hongan street No. 21 China Comprehensive Park 7 Building 7 layer -14 layer

Patentee after: BGI SHENZHEN CO LTD

Address before: North Road No. 146, building 11F-3 Industrial Zone in Yantian District of Shenzhen city of Guangdong Province in 518083

Patentee before: Shenzhen BGI Co., Ltd.

Patentee before: Shenzhen BGI Research Institute