CN109971831A

CN109971831A - 等位基因核酸富集方法

Info

Publication number: CN109971831A
Application number: CN201910311573.9A
Authority: CN
Inventors: 杨敬敏; 徐辉; 李文涛
Original assignee: Shanghai Wickham Biomedical Technology Co Ltd
Current assignee: Shanghai Wickham Biomedical Technology Co Ltd
Priority date: 2019-04-18
Filing date: 2019-04-18
Publication date: 2019-07-05

Abstract

本发明提供一种富集核酸延伸产物的方法，包括a.在探针与核酸杂交的条件下将探针与含有核酸的样品接触，其中，所述核酸包含等位基因对，所述探针包括分别靶向等位基因对中两条等位基因的至少两种探针，并且靶向其中一条等位基因的探针的延伸受到抑制，b.延伸探针，和c.富集延伸产物。本发明提供用于单倍型分离的试剂盒。

Description

等位基因核酸富集方法

技术领域

本发明属于核酸富集领域，具体涉及利用核酸的杂交和延伸而富集等位基因的方法。

背景技术

生物单倍体、二倍体和多倍体生物。包括人在内的许多物种都是二倍体生物，即含有两组染色体，单组染色体即为单倍体。在单倍体中，紧密连锁的多个等位基因的线性组合，每种组合方式即为一种单倍型。单倍型可以由多个SNP位点构成，包含丰富的遗传信息，研究单倍型比单个SNP位点具有更好的分析效果，更能有效反映出疾病的遗传机制，其在遗传病检测领域有着越来越广泛的需求。

遗传信息的变异是所有基因组的共同特征，而单碱基对的差异，也称单核苷酸多态性(SNP)是变异中最常见的一种形式，占所有已知多态性的90％以上。SNP位点并不是独立遗传的，而是在染色体上成组地遗传。一般来说，一个SNP位点只有两种等位基因，因此又叫双等位基因。单核苷酸多态性是研究人类家族和动植物品系遗传变异的重要依据，因此被广泛用于群体遗传学研究和疾病相关基因的研究，在药物基因组学、诊断学和生物医学研究中起重要作用。

基因分型(Phasing)还称为基因定相、单倍体分型或单倍体构建。基因分型是指把二倍体(甚至是多倍体)基因组上的等位基因(包括杂合位点，例如SNP)，按照其亲本正确地定位到父亲或者母亲的染色体上，最终使得所有来自同一个亲本的等位基因都能够排列在同一条染色体里。

现有的NGS测序技术，都是把序列打乱混在一起测序。这种方法无法直接区分这些序列中哪一个是父源，哪一个是母源的。通常只能检测出基因组上有哪些变异，以及这些变异的碱基组成(纯合、杂合)，也就是平时所说的基因型。只有经过基因分型，才能够实现这个基因型的区分。

基因分型在遗传学研究中应用广泛。例如，人群基因分型后形成的单倍型参考序列集是基因型推断必须的数据材料。而基因型推断是基因型-表型关联分析研究中必不可少的环节。高质量的参考序列集能提升关联分析的统计功效，而对被研究的对象进行基因分型也可以极大地提高基因型推断的准确性。还例如，用多个位点组成的单倍型组，而不是简单的单位点基因型，可实现群体遗传历史的研究。此外，通过基因分型的家系人群单倍型序列，可以计算染色体重组率、重组热点等重要遗传参数。基因分型还可用于探测频发突变、选择信号以及基因表达的顺势调控。

SNP作为最常见也是最稳定的一种人类可遗传变异，可靠的SNP分析检测对于疾病的预防与诊断以及实现个性化医疗等均具有重要意义。目前对SNP检测的检测方法有很多。TaqMan探针法针对染色体上的不同SNP位点分别设计PCR引物和TaqMan探针，利用荧光基团和淬灭荧光基团进行实时荧光PCR扩增；SNaPshot法是由美国应用生物公司(ABI)开发的基于荧光标记单碱基延伸原理的分型技术，也称小测序；高分辨率熔解曲线分析(HRM)通过实时监测升温过程中双链DNA荧光染料与PCR扩增产物的结合情况，判断是否存在SNP。MassArray法通过引物延伸或切割反应与MALDI-TOF-MS技术相结合，实现基因分型检测；均相无标记的SNP基因分型技术(Hong-Qi Wang等，Analytical Chemistry,2011,83,1883-1889)基于连接酶介导的链置换放大技术以及DNA酶催化的化学发光反应；以及基于二代测序的目标区域捕获技术(多重PCR和探针捕获)。这些技术在检测单倍型方面有两个缺陷。

第一，绝大部分检测方法都是以DNA为模板进行实验，首先都要从待测样本中提取出DNA，在提取过程中，所有染色体都在同一个反应管内，即两组单倍体是混合在一起的，所以检测结果所能提供的SNP信息来自两组单倍体的总和，也就是说无法判断出哪些基因型来自同一个单倍体，最终无法获得单倍型。第二，受检测平台限制，DNA在检测时都已高度片段化，所以检测结果较难反映出SNP点附近的信息。这些问题因为二代测序较弱的读长能力而无法解决。第三代测序的SMRT技术，依靠其超长的读长能力，虽然可以解决以上两个问题，但受限于第三代测序平台的成本，并不能作为单倍型检测的常规检测手段。

现有的HSE(Haplotype-Specific Separation)技术可以从物理层面将两个单倍体中的一种分离出来再进行后续的基因型检测，可应用于后续STR分型，法医领域鉴别混合样本等。与HSE技术相仿的RSE(Region-Specific Extraction)技术则是应用于大片段区域的连续捕获和研究，可应用于高通量测序。

HSE利用特异性识别SNP其中一种型的探针，来结合该型所在单倍体的那条DNA序列，聚合酶以探针3’末端为起始，沿着模板序列进行延伸，并参入生物素修饰的碱基，形成含有生物素修饰的DNA序列，最后用链霉亲和素修饰磁珠结合生物素的特性捕获该条DNA序列，达到物理分离的效果。分离的效果取决于起始DNA的质量和探针的特异性，一般在捕获点附近效果最好，离捕获点越远，效果越差。HSE一般能够分离长度约20kb-50kb的DNA片段，远高于常规检测手段所能检测的长度。

HSE技术所依赖的探针特异性建立在以下方面。第一是碱基互补配对的原则上的，即腺嘌呤A一定与胸腺嘧啶T配对，鸟嘌呤G一定与胞嘧啶C配对。然而研究发现，4种碱基之间依然存在着可能错配的情况(Mei-Mei Huang等，Nucleic Acids Research,Vol.20,No.17 4567-4573)。第二是聚合酶只能在探针3’末端的碱基完全配对的情况下才能进行延伸。然而，聚合酶在部分错配条件下依然可以进行有效延伸(同上)。第三是探针的长度，分离的成功率随着探针长度的增加会变低，然而较短的探针也会带来非特异性的问题(J.Zander等，Forensic Science International:Genetics29(2017)242-249)。这些都给HSE技术的实验设计带来了挑战。

本领域仍需要高特异性、高通量、快速、低成本的单倍型分离方法。

发明内容

本发明方法在同一个反应体系中针对一个等位基因(例如SNP位点)设计两条探针，分别捕获SNP的两种分型，两条探针中的一条探针的延伸反应受到抑制。这样的设计显著提高了探针的特异性，保证更好的分离效果。本发明方法可使用任何长度的探针，降低了探针设计难度。同时，本发明方法无需考虑部分碱基的错配导致分离效率不高的问题。本发明方法可与二代测序方法结合，显著降低单倍型分析的成本。

在一个方面，本发明提供一种延伸核酸的方法，包括：

a.在探针与核酸杂交的条件下将探针与含有核酸的样品接触，所述核酸包含等位基因对，其中，所述探针包括分别靶向等位基因对中两条等位基因的至少两种探针，和

b.延伸探针。

在一个实施方式中，所述靶向其中一条等位基因的探针包含能抑制该探针延伸的修饰。在一个实施方式中，所述修饰为碱基的双脱氧修饰和/或硫化修饰。在一个实施方式中，碱基的双脱氧修饰位于探针的3’末端。在一个实施方式中，等位基因对中两条等位基因的序列不同。在一个实施方式中，核酸可为基因组DNA。在一个实施方式中，核酸包含多组等位基因对。在一个实施方式中，多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制。在一个实施方式中，在多组等位基因对中的每一组中，探针的延伸受抑制的等位基因位于相同染色体上。在一个实施方式中，步骤b的延伸包括使用NTP和/或dNTP和核酸聚合酶。在一个实施方式中，等位基因对包含SNP对。

在第二方面，本发明提供一种富集核酸延伸产物的方法，包括

a.在探针与核酸杂交的条件下将探针与含有核酸的样品接触，其中，所述核酸包含等位基因对，所述探针包括分别靶向等位基因对中两条等位基因的至少两种探针，并且靶向其中一条等位基因的探针的延伸受到抑制，

b.延伸探针，和

c.富集延伸产物。

在一个实施方式中，所述靶向其中一条等位基因的探针包含能抑制该探针延伸的修饰。在一个实施方式中，所述修饰为碱基的双脱氧修饰。在一个实施方式中，碱基的双脱氧修饰位于探针的3’末端。在一个实施方式中，等位基因对中两条等位基因的序列不同。在一个实施方式中，核酸可为基因组DNA。在一个实施方式中，核酸包含多组等位基因对。在一个实施方式中，多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制。在一个实施方式中，在多组等位基因对中的每一组中，探针的延伸受抑制的等位基因位于相同染色体上。在一个实施方式中，步骤b的延伸包括使用NTP和/或dNTP和核酸聚合酶。在一个实施方式中，NTP和/或dNTP包括具有富集标记物的NTP和/或dNTP。在一个实施方式中，富集标记物为生物素，所述富集通过使用带有链酶亲和素的磁珠进行。在一个实施方式中，等位基因对包含SNP对。

在第三方面，本发明提供一种核酸文库的制备方法，包括：

b.延伸探针，

c.富集延伸产物，和

在一个实施方式中，方法还包括步骤d：对富集的延伸产物进行PCR扩增。在一个实施方式中，所述靶向其中一条等位基因的探针包含能抑制该探针延伸的修饰。在一个实施方式中，所述修饰为碱基的双脱氧修饰。在一个实施方式中，碱基的双脱氧修饰位于探针的3’末端。在一个实施方式中，等位基因对中两条等位基因的序列不同。在一个实施方式中，核酸可为基因组DNA。在一个实施方式中，核酸包含多组等位基因对。在一个实施方式中，多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制。在一个实施方式中，在多组等位基因对中的每一组中，探针的延伸受抑制的等位基因位于相同染色体上。在一个实施方式中，步骤b的延伸包括使用NTP和/或dNTP和核酸聚合酶。在一个实施方式中，NTP和/或dNTP包括具有富集标记物的NTP和/或dNTP。在一个实施方式中，富集标记物为生物素，所述富集通过使用带有链酶亲和素的磁珠进行。在一个实施方式中，等位基因对包含SNP对。

在第四方面，本发明提供一种单倍型分离方法，包括：

b.延伸探针，和

c.富集延伸产物。

在第五方面，本发明提供一种用于单倍型分离的试剂盒，包含：

核酸探针，所述探针包括分别靶向等位基因对中两条等位基因的至少两种探针，并且靶向其中一条等位基因的探针包含能抑制该探针延伸的修饰，

核酸聚合酶，和

具有富集标记物的NTP和/或dNTP。

在一个实施方式中，修饰为碱基的双脱氧修饰。在一个实施方式中，碱基的双脱氧修饰位于探针的3’末端。在一个实施方式中，等位基因对中两条等位基因的序列不同。在一个实施方式中，等位基因对是多组等位基因对。在一个实施方式中，对于多组等位基因对中的每一组，靶向一条等位基因的探针的延伸受到抑制。在一个实施方式中，对于多组等位基因对中的每一组，探针的延伸受抑制的等位基因位于相同染色体上。在一个实施方式中，富集标记物为生物素。在一个实施方式中，等位基因对是SNP对。在一个实施方式中，核酸聚合酶是DNA聚合酶。在一个实施方式中，试剂盒还包括用于PCR的试剂，包括但不限于裂解试剂、缓冲液、引物、阴性对照和阳性对照。在一些实施方式中，试剂盒还包括进行本文所述方法的说明。

附图说明

图1：本文所述方法的一个实施方式的流程图。

图2：本文所述方法的一个实施方式的原理图。标记1：探针特异结合其中一个单倍型，无法和另外一个单倍型完全结合。标记2：聚合酶沿着结合位置延伸并掺入生物素修饰的dNTP。标记3：含有链霉亲和素的磁珠捕获包含生物素的DNA链，达到物理分离的效果。

图3：本文所述方法的一个实施方式的文库电泳图。M：Takara 100bp DNA梯度。标记1：探针1有block。标记2：探针1无block。标记3：探针2有block。标记4：探针2无block

具体实施方式

除非另外定义，本文中使用的所有技术和科学术语具有本领域普通技术人员通常所理解的同样含义。参见例如Lackie，DICTIONARY OF CELLAND MOLECμLAR BIOLOGY(《细胞分子生物学词典》)，埃尔斯威尔出版社(Elsevier)(第4版2007)；Green等，MOLECμLARCLONING,A LABORATORY MANUAL(《分子克隆，实验室手册》)，冷泉港实验室出版社(冷泉港，纽约2012)。

术语“一个”或“一种”意在表示“一个或多个”或“一种或多种”。术语“包含”及其各种变体例如“包括”和“含有”用来表示添加其它的步骤或要素是任选的，并且是非排它性的。当用以定义组合物和方法时，“基本由……组成”应表示排除当用于意图目的时对该组合具有任何基本意义的其它要素。“由……组成”应表示排除多于其它成分的微量元素和基本方法步骤的部分。本发明的实践中可以使用与本文所述类似或等价的任何方法、装置和材料。本文提供的以下定义是用来帮助理解本文经常用到的某些术语，不对本发明的范围构成限制。

如本文所用的术语“样品”是指来自对象的任何组织或流体，其适于富集核酸。对象可以是任何活体或非活体生物，包括但不限于人、非人动物、植物、细菌、真菌或原生生物。能选择任何人或非人动物，包括但不限于哺乳动物、爬行动物、鸟类、两栖类、鱼类、有蹄类动物、反刍动物、牛科动物(如牛)、马科动物(如马)、山羊和绵羊类动物(如绵羊、山羊)、猪科动物(如猪)、羊驼类动物(如骆驼、美洲驼、羊驼)、猴子、猿(如大猩猩、黑猩猩)、熊科动物(如熊)、家禽、犬、猫、小鼠、大鼠、鱼、海豚、鲸鱼和鲨鱼。对象可为男性或女性(例如妇女、妊娠妇女)。对象可为任何年龄(如胚胎、胎儿、婴儿、儿童、成人)。

核酸可以从任何类型的合适生物试样或样品中分离。样品或测试样品可为分离或获自对象或其部分的任何试样。试样的非限制性示例包括对象的液体或组织，包括但不限于血液或血液制品、脐带血、绒毛、羊水、脑脊液、脊髓液、洗液、活检样品、膜间液样品、细胞或其部分、女性生殖道清洗物、尿、粪便、痰、唾液、鼻黏膜、前列腺液、灌洗液、精液、淋巴液、胆汁、眼泪、汗液、母乳、乳腺体液等或其组合。在一些实施方式中，生物样品可以是血液，而有时是血浆或血清。其他合适的生物样品对于相关领域的普通技术人员来说是熟悉的。可以使用完全在临床实践者的普通知识范围内的技术获得生物样品。本文所公开的方法可用于富集任何类型样品中的核酸，例如用于基因组DNA的样品中的核酸。

术语“分离的”是指材料，例如核酸分子和/或蛋白质，其基本上不含天然存在的环境中通常伴随或与材料相互作用的组分或从其中移出。分离多核苷酸可以从它们天然存在的宿主细胞中纯化。本领域技术人员已知的常规核酸纯化方法可用于获得分离的多核苷酸。

术语“核酸”、“核酸分子”“多核苷酸”、“多核苷酸序列”、“核酸序列”和“核酸片段”在本文中可互换使用，指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物，及其互补物。核酸的示例包括单链和双链DNA，单链和双链RNA(包括siRNA)，以及具有单链和双链DNA和RNA的混合物的杂合分子，其任选地含有合成的，非天然的或改变的核苷酸碱基。DNA聚合物形式的多核苷酸可包含一条或多条cDNA链，基因组DNA，合成DNA或其混合物。本发明的核酸可包含碱基(包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤次黄嘌呤、异胞嘧啶和异鸟嘌呤)的组合。本发明的核酸可经合成以包含非天然氨基酸修饰。本发明的核酸可通过化学合成方法或通过重组方法来获得。

在一些实施方式中，本发明方法之前、期间或之后对核酸进行片段化或切割。本文所用的“片段化”或“切割”指使核酸分子(如核酸模板基因分子或其扩增产物)可以分成两个或更多较小核酸分子的方法或条件。核酸片段可含有重叠的核苷酸序列，这样的重叠序列可促进构建未片段化的对应核酸或其区段的核苷酸序列。在某些实施方式中，核酸可以是部分片段化的(例如，来自未完全的或中止的特异性剪切反应)或完全片段化的。这种片段化或剪切可以是序列特异性、碱基特异性或非特异性的，并且能通过任意不同方法、试剂或条件(包括例如化学、酶、物理片段化)来完成。

术语“延伸”指从与模板(RNA或DNA)结合的引物3’端开始，在核酸聚合酶的作用下，按照碱基配对的原则，逐个连上核苷酸，由5’→3’方向合成与模板互补链的过程。术语“延伸产物”是指在延伸反应过程中产生的核酸片段。延伸组合物可包含用于核酸延伸的组分，例如：核苷酸三磷酸(NTP或dNTP)，具有适当序列的一种或多种引物或探针，聚合酶，缓冲液，溶质和蛋白质。NTP或dNTP包括具有富集标记物的NTP或dNTP。

术语“扩增产物”是指在引物定向扩增反应过程中产生的核酸片段。引物定向扩增的一般方法包括聚合酶链反应(PCR)，连接酶链反应(LCR)或链置换扩增(SDA)。如果选择PCR方法，则复制组合物可包含用于核酸复制的组分，例如：核苷酸三磷酸，具有适当序列的两种(或更多种)引物，热稳定聚合酶，缓冲液，溶质和蛋白质。

术语“引物”是指合成的寡核苷酸，当其置于互补链的合成被聚合酶催化的条件下时，能够起到核酸合成或沿互补链复制的起始点的作用。引物还可含有富集标记物。

术语“探针”是指与感兴趣多核苷酸互补(但不一定完全互补)并通过与感兴趣多核苷酸的至少一条链杂交形成双链体结构的合成寡核苷酸。本发明的探针可包含单链核酸，其在严谨杂交条件下杂交至核酸中的靶序列。"靶序列"是限定结合分子例如探针将杂交例如结合的核酸部分的核酸序列，前提是存在杂交的充分条件。探针还可含有富集标记物。探针可基于本发明熟知的方法进行设计。例如，可按以下原则进行探针设计：1.探针的3’端包含与SNP位点上的碱基互补的碱基，该互补的碱基可以是3’端最后一个碱基或倒数第二个碱基，2.GC含量30-70％，3.Tm值在50-58℃内，4.无发卡，无自连结构，无4个连续的G或C碱基。优选地，本发明探针长度为15-22nt。

在一个实施方式中，探针包括分别靶向等位基因对中两条等位基因的至少两种探针，并且靶向其中一条等位基因的探针的延伸受到抑制或阻断。在一个实施方式中，等位基因对包括多组等位基因对。多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制或阻断。在一个实施方式中，在多组等位基因对中的每一组中，探针的延伸受抑制或阻断的等位基因位于相同染色体上。在一些实施方式中，本发明方法包括未标记的探针和经标记的探针，用于富集核酸。

本发明术语“靶向”指对特定目标(分子、细胞、个体等)采取的行动。如外源基因在宿主细胞基因组DNA预期位置上的定向插入；药物分子对效应靶组织或细胞的定向传送或作用。本发明术语“杂交”通过两条单链DNA或RNA的碱基配对而可以实现核酸的靶向。本发明通过序列特异性寡核苷酸分离、选择和/或富集样品中的核酸亚组用于进一步加工。

如本文所用，术语“标记”，“标记物”，“富集标记物”等是指能够用于富集核酸的分子，包括但不限于酶，金属离子，金属溶胶，半导体纳米晶体和配体(例如，生物素，亲和素，链霉亲和素或半抗原)。富集标记物的示例可为生物素，此时可使用带有例如链酶亲和素的固相进行核酸富集。

提及两种或更多种多核酸时，术语“相同性百分比”指采用BLAST或BLAST2.0序列比对算法，利用默认参数，或通过手动比对和视觉检查测量为相同的，或具有特定百分比的相同核苷酸(即，当在比较窗或指定区域上以最大对应性比较和比对时，在特定区域上具有约60％相同性，优选65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更高相同性)的两个或更多个序列或子序列。参见例如NCBI网站ncbi.nlm.nih.gov/BLAST。然后，可称这些序列“基本相同”。通常在最佳比对序列上确定相同性百分比，使得该定义适用于具有缺失和/或添加的序列，以及具有取代的序列。本领域常用的算法考虑了缺口等。通常，相同性存在于包含长度为至少约25个核苷酸的序列的区域上，或长度为50-100个核苷酸的区域上，或参考序列的整个长度的区域上。

关于核酸的术语“选择性地”或“选择性”是指在靶核酸序列(例如，等位基因的靶序列)与非靶核酸序列(例如，等位基因的非靶序列)之间的区分。如果引物或探针与非靶序列发生很少或没有杂交，则靶向对序列是选择性的。

等位基因(allele)，又称对偶基因，是一些占据染色体的基因座的可以复制的脱氧核糖核酸。等位基因对一般指位于一对同源染色体的相同位置上控制着相对性状的一对基因或序列或甚至单个核苷酸。本发明富集方法利用核酸中含有的等位基因对富集核酸亚组。因此，本文核酸可包含等位基因对。在一个实施方式中，核酸包含一组或多组等位基因对。在一个实施方式中，等位基因对中两条等位基因的序列不同。等位基因可以是SNP。等位基因可包含SNP。SNP是指在基因组水平上由单个核苷酸的变异(包括转换、颠换、缺失和插入)所引起的DNA序列多态性。从理论上来看每一个SNP位点都可以有4种不同的变异形式，但实际上发生的只有两种，即转换和颠换。在一个实施方式中，等位基因对可以是SNP对。

如本文全文所用的术语"修饰"意在表示该序列被以任何方式而改变。感兴趣核酸序列的修饰(及其缺失)可以是全部所需形式。本发明所述修饰没有限制，只要修饰能抑制或阻断核苷酸延伸即可。对核酸的修饰包括使碱基加上某一基团，如甲基化，也包括催化稀有碱基进入RNA或DNA中的作用。修饰还可以是碱基的双脱氧修饰，其能终止核酸的延伸，例如多核苷酸3’末端碱基的双脱氧修饰。在一个实施方式中，本发明探针包含能抑制或阻断该探针延伸的修饰。在一个实施方式中，靶向等位基因对中一条等位基因的探针包含能抑制或阻断该探针延伸的修饰。在一个实施方式中，靶向等位基因对中两条等位基因的探针都包含能抑制或阻断该探针延伸的修饰。在一个实施方式中，对核酸的修饰是双脱氧修饰。在一个实施方式中，双脱氧修饰位于3’末端。

本文所用“富集”、“浓缩”、“分离”和“纯化”可互换使用，指利用较多组分中一种或多种组分在物理性质或化学性质上的差异，使一种或多种组分相对地分配至不同的空间区域或在不同的时间依次分配至同一空间区域的过程。富集可从较多组分中汇集其中一种或多种组分，从而提高该组分浓度、将该组分与其他组分分开、或去除该组分中的其他组分等。本文中，富集可表示使多种等位基因(例如SNP)中的一种或多种与其他等位基因分开从而浓度提高的过程。在一个实施方式中，本文的富集方法可以使一组等位基因对中的一条等位基因与另一条等位基因在空间上分开。在一个实施方式中，本文的富集方法可以使一组或多组等位基因对中的一条或多条等位基因与其他等位基因在空间上分开。本文的富集方法可以使延伸未受抑制的探针所靶向的等位基因与延伸受到抑制的探针所靶向的等位基因在空间上分开。在一个实施方式中，当多组等位基因对中的每组中都有一条等位基因被延伸受到抑制的探针所靶向，则本文的富集方法可以使多组等位基因对中的每组都有一条等位基因与另一条等位基因在空间上分开。例如，本文方法得到的富集产物可以包含多组等位基因对中的每组的一条等位基因。有利地，使多核苷酸附连至固相支持物，以促进所述富集。例如，多核苷酸可存在于丙烯酰胺或琼脂糖凝胶基质中，或者更优选地，固定于膜表面、颗粒表面或处于微滴定板的孔中。所述附连至固相支持物可通过具有富集标记物的NTP或dNTP和固体支持物上与富集标记物关联的分子来实现。例如，在富集标记物是生物素的实施方式中，多核苷酸可附连至带有链酶亲和素的固相支持物(例如颗粒)，从而实现富集。固相支持物可为磁性颗粒或响应磁性吸附的颗粒，从而利用磁性吸附而方便地富集附连有多核苷酸的固相支持物。

术语“聚合酶链式反应”(PCR)是一种用于放大扩增特定的DNA片段的分子生物学技术。PCR技术的基本原理类似于DNA的天然复制过程，其特异性依赖于与靶序列两端互补的寡核苷酸引物。常见PCR由变性--退火--延伸三个基本反应步骤构成。

术语“约”或“大约”表示在本领域普遍技术人员确定的特定数值的可接受误差范围内，这将取决于该数值的测量或确定方式，例如，测量体系的极限。例如，“约”可表示在1个或多个标准偏差范围内。或者，“约”可表示给定值的多至20％，或多至10％，或多至5％，或多至1％的范围。或者，尤其对于生物系统或过程而言，该术语可表示某值的一定数量级内，优选5倍内，更优选2倍内。本申请和权利要求书中描述具体值时，除非另有说明，假定术语“约”表示该具体值的可接受的误差范围内。

除非有明确的另外说明，所有的百分数和比例/比率都是以重量计。

除非另有说明，所有百分比和比例是基于组合物总量计算的。

贯穿本公开内容给出的每个最大数值限制包括每个较低的数值限制，如同这些较低的数值限制在本文中明确写出一样。本公开全文中给出的每个最小数值限定包括每个较高的数值限定，如同这些较高的数值限定清楚写在这里。本公开全文中给出的每个数值范围包括落入所述较宽数值范围的每个较窄数值范围，如同本文中明确写明这些较窄数值范围。

本文所述的值不应理解为严格限定为所述的精确的数值。相反，除非另有具体说明，所述值各自用于指所述的值和该值周围的功能等同的范围。例如，公开为“20μl”的值意在表示“约20μl”。

除非明确排除或者其他方式限制，否则本文所引述的每篇文献，包括任何交叉引用和相关的专利或申请，通过引用结合入本文。任何文献的引用不是对其作为本文所公开的或受权利要求书保护的任何发明的现有技术，或者其单独地或者与任何其它参考文献的任何组合，或者参考、提出、建议或公开任何此类发明的认可。此外，当本文中术语的任何含义或定义与以引用方式并入的文件中术语的任何含义或定义矛盾时，应当服从在本文中赋予该术语的含义或定义。

虽然已经图示和描述了本公开的特定实施例，但是在不脱离本公开的精神和范围的情况下，可以进行各种其他改变和修改。所附权利要求的范围包括在本公开范围内的所有这些改变和修改。

实施例

为了可以更有效地理解本文公开的发明，下面提供实施例。应当理解，这些实施例仅用于说明目的，不应理解为以任何方式限制本发明。除非另有说明，否则贯穿这些实施例的分子克隆反应和其它标准重组DNA技术，根据Maniatis等，《分子克隆–实验室手册》(Molecμlar Cloning-A Laboratory Manual)，第2版，冷泉港出版社(Cold Spring HarborPress)(1989)所述的方法进行，采用市售可得的试剂。

实施例中涉及的部分试验

(一)探针设计

按以下原则进行探针设计：

1.探针的3’端包含与SNP位点上的碱基互补的碱基，

2.GC含量30-70％，

3.Tm值在50-58℃内，

4.无发卡，无自连结构，无4个连续的G或C碱基。

(二)探针杂交和延伸

表1：杂交和延伸体系

	浓度	体积
			DNA		250ng
探针	100uM	1.5μl
			Taq		0.5μl
10xBu ffer		2μl
			dATP	4mM	1μl
dTTP	4mM	1μl
			dCTP	4mM	0.8μl
dGTP	4mM	1μl
			bio-14-dCTP	0.4mM	2μl
H<sub>2</sub>O		x
			total		20μl

杂交和延伸程序：95℃：7.5分钟，64℃：20分钟。

(三)IDT捕获：

1.根据下表准备1x工作液

	浓缩缓冲液	无核酸酶水
			2x珠洗涤缓冲液	250	250
10x洗涤缓冲液1	30	270
			10x洗涤缓冲液2	20	180
10x洗涤缓冲液3	20	180
			10x Stringent洗涤缓冲液	40	360

2.将配制好的1x洗涤缓冲液1分装100μl至65℃金属浴，剩余200μl常温放置，将全部400μl 1x Stringent洗涤缓冲液放置65℃金属浴。

3.准备M-270链霉亲和素磁珠磁珠(以下简称磁珠)

3.1将磁珠放置于室温下30分钟，涡旋混匀磁珠

3.2分装100μl磁珠至1.5ml离心管

3.3将离心管至于磁力架上，待磁珠和上清液分离后，吸弃上清

3.4加入200μl 1x珠洗涤缓冲液，涡旋混匀10s

3.5将离心管至于磁力架上，待磁珠和上清液分离后，吸弃上清

3.6重复步骤3.4-3.5一次

3.7加入100μl1x珠洗涤缓冲液，涡旋混匀

3.8将100μl磁珠悬浮液转移至0.2ml离心管并置于磁力架上，待磁珠和上清液分离后，吸弃上清

4将杂交、延伸完后的核酸样本全部转移至步骤3准备好的磁珠内，用移液器吹打混匀，并继续在64℃下孵育45分钟，期间每12分钟用移液器吹打混匀5.洗涤磁珠

5.1取100μl预热的1x洗涤缓冲液1加入至步骤4样本中，涡旋混匀并转移至1.5ml离心管中

5.2将离心管置于磁力架上，待磁珠和上清液分离后，吸弃上清

5.3加入200μl预热的1x Stringent洗涤缓冲液，用移液器温和吹打混匀10次，65℃孵育5分钟

5.4将离心管置于磁力架上，待磁珠和上清液分离后，吸弃上清

5.5重复步骤5.3-5.4一次

5.6加入200μl室温放置的1x洗涤缓冲液1，涡旋混匀2分钟

5.7将离心管置于磁力架上，待磁珠和上清液分离后，吸弃上清

5.8加入200μl室温放置的1x洗涤缓冲液2，涡旋混匀1分钟

5.9将离心管置于磁力架上，待磁珠和上清液分离后，吸弃上清

5.10加入200μl室温放置的1x洗涤缓冲液3，涡旋混匀30s

5.11将离心管置于磁力架上，待磁珠和上清液分离后，吸弃上清

5.12加入24μl无核酸酶水重悬浮磁珠

(四)文库构建

1.第一轮多重PCR

使用Vazyme公司的2x Mμltiplex PCR mix对捕获后DNA进行扩增PCR体系

名称	体积
		2x Mμltiplex PCR buffer	25μl
捕获后DNA	24μl
		引物panel	1μl
总计	50μl

反应条件：

2.磁珠纯化

使用Beckman公司的AMPure XP珠纯化第一轮PCR产物。

3.第二轮PCR

使用KAPA Biosystems公司的KAPA HiFi HotStart ReadyMix(2x)进行第二轮PCR扩增。

PCR体系

名称	体积
		2x KAPA HiFi HotStart ReadyMix	20μl
DNA	19μl
		引物(带barcode)	1μl
总计	40μl

反应条件

4.文库质检

使用1％浓度的琼脂糖凝胶电泳检测文库条带。

5.上机测序

上机平台为NextSeq 500。

实施例1：待测样本基因型测序

HSE技术的前提条件是探针设计位点的基因型必须是已知的，所以首先要对待测位点进行基因分型，然后针对杂合位点进行探针设计，而纯合位点不能做为待测位点，不同个体之间的基因多态性是不一样的，本方案以单个个体为例，对其部分位点进行检测，测序位点及结果表2所示。

表2

#CHROM	POS	r<sub>s</sub>号	杂合/纯合*
				chr11	4657966	rs1983101	0/0:0,255,255:4871:4863,5
chr11	4659187	rs4625457	0/1:183,0,207:9308:4537,4757
				chr11	4660721	rs10836399	0/1:197,0,195:9149:4651,4487
chr11	4666216	rs10768150	0/1:198,0,179:7863:3969,3886
				chr11	4667693	rs7937180	0/1:208,0,192:7771:3809,3951
chr11	4669813	rs10836414	0/1:191,0,189:9508:4669,4794
				chr11	4677509	rs12574901	0/1:197,0,195:4496:2271,2214
chr11	4682376	rs10768157	0/1:204,0,191:3719:1797,1919
				chr11	4687238	rs7124760	0/0:0,255,255:7778:7739,7
chr11	4707571	rs10836470	0/0:0,255,255:1391:1388,1

*：0/0代表纯合，0/1代表杂合

实施例2：探针设计

选择rs7937180(C/A杂合)作为探针设计候选点。其它位点作为验证分离效果的候选点。以相同的方法设计阻断(blo_ck)探针，如表3所示。探针捕获C，blo_ck探针捕获A。blo_ck探针的3’末端被双脱氧修饰。

表3

实施例3：核酸杂交、延伸和捕获

设置两组不同的实验，以比较有无blo_ck探针对分离效果的影响。如下表4所示，反应体系中其他组分如表1所示。通过IDT进行捕获。

表4

实施例4：文库制备

将表5中的位点的引物混合为一个组(panel)，对捕获后的DNA进行多重PCR建库，电泳图如图3所示。引物序列如如列表所示。

表5

#CHROM	POS	rs号	相对杂交点距离
				chr11	4659187	rs4625457	8.5k
chr11	4660721	rs10836399	6.9k
				chr11	4666216	rs10768150	1.4k
chr11	4667693	rs7937180	探针杂交位点
				chr11	4669813	rs10836414	2k
chr11	4677509	rs12574901	10k
				chr11	4682376	rs10768157	15k

实施例5：单倍型分离效果

本方案在杂交点上下游各10k-15k的位置挑选了部分SNP位点作为检测实验是否成功的依据，正常情况下，杂合子的两种型测序数据各占50％左右。当一个杂合子其中一个型被捕获的比例超过61％，视为分离成功。位点与杂交点的相对位置如表6所示。单倍型分离如表7和8所示。

表6：位点与杂交点的相对位置

表7：结果

表8

数据显示含有block的体系分离效果好于无block的体系。有block组有效分离位点6个，无block组无有效分离位点。可以看出含有block的体系分离效果明显优于不含block的体系。

序列表

<110> 上海韦翰斯生物医药科技有限公司

<120> 等位基因核酸富集方法

<130> WS0001

<141> 2019-04-18

<160> 1

<170> SIPOSequenceListing 1.0

<210> 1

<211> 46

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

Claims

1.一种富集核酸延伸产物的方法，包括

b.延伸探针，和

c.富集延伸产物。

2.如权利要求1所述的方法，其中，靶向等位基因对中一条等位基因的探针包含能抑制该探针延伸的修饰。

3.如权利要求1所述的方法，其中，核酸包含多组等位基因对，并且多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制。

4.如权利要求1所述的方法，其中，等位基因对包含SNP对。

5.一种单倍型分离方法，包括：

b.延伸探针，和

c.富集延伸产物。

6.如权利要求5所述的方法，其中，靶向其中一条等位基因的探针包含能抑制该探针延伸的修饰。

7.如权利要求5所述的方法，其中，核酸包含多组等位基因对，并且多组等位基因对中的每一组中，靶向一条等位基因的探针的延伸受到抑制。

8.如权利要求5所述的方法，其中，等位基因对包含SNP对。

9.一种用于单倍型分离的试剂盒，包含：

核酸聚合酶，和

具有富集标记物的NTP和/或dNTP。

10.如权利要求9所述的试剂盒，其中，等位基因对是SNP对。