CN117363706A - 通过纳米孔指导的核酸检测方法 - Google Patents

通过纳米孔指导的核酸检测方法 Download PDF

Info

Publication number
CN117363706A
CN117363706A CN202311365839.0A CN202311365839A CN117363706A CN 117363706 A CN117363706 A CN 117363706A CN 202311365839 A CN202311365839 A CN 202311365839A CN 117363706 A CN117363706 A CN 117363706A
Authority
CN
China
Prior art keywords
polynucleotide
target
guide
dna
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311365839.0A
Other languages
English (en)
Inventor
安德鲁·约翰·赫伦
詹姆斯·爱德华·格拉哈姆
理查德·亚历山大·古铁雷斯
瑞贝卡·维多利亚·鲍恩
詹姆斯·怀特
克莱夫·加文·布朗
丹尼尔·乔治·福德姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technology Public Co ltd
Original Assignee
Oxford Nanopore Technology Public Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technology Public Co ltd filed Critical Oxford Nanopore Technology Public Co ltd
Publication of CN117363706A publication Critical patent/CN117363706A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Nanotechnology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

本发明提供一种检测样品中的靶多核苷酸的方法,其包含:(a)使所述样品与跟所述靶多核苷酸中的序列结合的指导多核苷酸和多核苷酸指导的效应蛋白接触,其中所述指导多核苷酸和多核苷酸指导的效应蛋白与所述样品中存在的任何靶多核苷酸形成复合物;(b)使所述样品与包含跨膜孔的膜接触;(c)对所述膜施加电位;以及(d)监测由所述复合物与所述跨膜孔的相互作用引起的效应的存在或不存在,以确定所述复合物的存在或不存在,从而检测所述样品中的所述靶多核苷酸。

Description

通过纳米孔指导的核酸检测方法
本申请是申请日为2017年9月29日,申请号为201780073778.7,发明名称为“通过纳米孔指导的核酸检测方法”的分案申请。
技术领域
本发明大体上涉及一种使用跨膜孔来检测和/或分析靶多核苷酸的方法。本发明还涉及用于所述方法中的新颖探针和探针组以及用于实施所述方法的试剂盒。所述方法有许多用途。具体来说,所述方法可以用于多态性的诊断、检测以及V(D)J谱系分析。
背景技术
当前在广泛的应用范围内需要快速且便宜的多核苷酸(例如,DNA或RNA)测序和鉴定技术。现有技术缓慢且昂贵,主要是因为它们依赖于扩增技术来产生大量多核苷酸并且需要大量的专用荧光化学品进行信号检测。
跨膜孔(和其它纳米孔)作为聚合物和各种小分子的直接电子生物传感器具有巨大的潜力。具体来说,最近正在关注纳米孔作为潜在的DNA测序技术。
当跨纳米孔施加电位时,当如核苷酸等分析物在桶中暂时停留一段时间时,电流会发生改变。核苷酸的纳米孔检测给出了已知特征和持续时间的电流改变。在链测序方法中,使单条多核苷酸链通过孔并且推导出核苷酸的同一性。链测序可以涉及使用分子刹车来控制多核苷酸通过孔的移动。
发明内容
本发明人已经鉴定了指导RNA和DNA以及RNA指导的和DNA指导的效应蛋白的新用途,其形成CRISPR基因编辑机制的一部分。本发明人设计了经过修饰的指导RNA序列,其可以与相关的RNA指导的效应蛋白结合使用,以测试样品中一种或多种靶多核苷酸的存在、不存在或量。本发明人已经开发了使用指导RNA和RNA指导的效应蛋白并结合跨膜孔来检测靶多核苷酸的方法。所述方法可以通过多种方式进行,但共同的是它们使用指导RNA和RNA指导的效应蛋白来选择靶多核苷酸并涉及向跨膜孔递送包含靶多核苷酸、指导RNA和RNA指导的效应蛋白的复合物。所述方法可以扩展到其它多核苷酸指导的蛋白质效应系统,包括使用C2c2的RNA编辑系统。指导多核苷酸,例如指导RNA,可以特别适用于基于纳米孔的检测方法。
本发明人开发的方法是灵敏的,并且可用于检测样品中痕量的多核苷酸,而不需要单独的分离步骤来把靶多核苷酸从样品中的其它组分中萃取出来。因此,所述方法简单并且不需要复杂的步骤,例如富集或纯化步骤。因此,所述方法是快速的并且可以用于获得快速结果和从粗制和/或“脏”样品获得结果。因此,所述方法在需要快速诊断的诊断设置中特别有用。所述方法还特别适用于靶向基因或基因组的特定片段或区域。所述方法的关键益处是:在测量靶或衔接子之前,不是非常需要从靶多核苷酸中去除多核苷酸指导的效应蛋白。在本发明的一些实施例中,靶多核苷酸可以被检测或表征,同时仍与多核苷酸指导的效应蛋白连接。在本发明的其它实施例中,多核苷酸指导的效应蛋白可以在靶的测量期间通过跨膜孔自动去除。在一些实施例中,所述方法使用特别设计的指导多核苷酸以促进靶多核苷酸与样品中的其它组分的分离。
所述方法使得能够对含有许多其它多核苷酸序列的样品中的多核苷酸序列的感兴趣的区域进行表征,例如测序,因为它固有地包括分离步骤。例如,可以仅对存在于大基因组中的感兴趣的基因进行测序。测序可以限于含有SNP的区域,或者限于其它感兴趣的区域,例如T细胞中的V(D)J区域。这提高了灵敏度和效率,无需复杂或耗时的片段化或下拉样品制备方法即可访问所需信息。它还减少了进行纳米孔实验所花费的时间,因为仅测量感兴趣的靶多核苷酸片段,或者相对于样品中的总多核苷酸片段,其测量比例增加。在非靶多核苷酸的量超过靶多核苷酸的量的情况下,由于不需要测量非靶多核苷酸或测量非靶多核苷酸的需求降低,所以检测靶多核苷酸所花费的时间会显著减少。所述方法还受益于不需要PCR或其它靶富集方法。
因此,本发明提供一种检测样品中的靶多核苷酸的方法,其包含:
(a)使所述样品与跟所述靶多核苷酸中的序列结合的指导多核苷酸和多核苷酸指导的效应蛋白接触,其中所述指导多核苷酸和多核苷酸指导的效应蛋白与所述样品中存在的任何靶多核苷酸形成复合物;
(b)使所述样品与包含跨膜孔的膜接触;
(c)跨所述膜施加电位差;以及
(d)监测由所述复合物与所述跨膜孔的相互作用引起的效应的存在或不存在,以确定所述复合物的存在或不存在,从而检测所述样品中的所述靶多核苷酸。
还提供了一种检测样品中的靶多核苷酸的方法,其包含:
(a)使所述样品与跟所述靶多核苷酸中的序列结合的指导多核苷酸和多核苷酸指导的效应蛋白接触,其中所述指导多核苷酸和多核苷酸指导的效应蛋白与所述样品中存在的任何靶多核苷酸形成复合物;
(b)使所述样品与纳米孔接触;
(c)跨所述纳米孔施加电位差;以及
(d)监测由所述复合物与所述纳米孔的相互作用引起的效应的存在或不存在,以确定所述复合物的存在或不存在,从而检测所述样品中的所述靶多核苷酸。
本发明还提供了:
-一种指导多核苷酸,其包含与靶多核苷酸中的序列结合的核苷酸序列、与多核苷酸指导的效应蛋白结合的核苷酸序列以及衔接子序列和/或能够与表面偶联的锚;
-一组两种或更多种本发明的指导多核苷酸;
-一种指导多核苷酸/多核苷酸指导的效应蛋白复合物,其包含本发明的指导多核苷酸和多核苷酸指导的效应蛋白;
-一种试剂盒,其包含:多核苷酸指导的效应蛋白和能够与表面偶联的锚;以及
-一种检测样品中的包含双链多核苷酸的靶的方法,其包含:
(a)使所述样品与第一探针和第二探针接触,其中所述第一探针和所述第二探针与所述样品中存在的任何靶多核苷酸形成复合物,所述第一探针与所述靶双链多核苷酸中的第一序列结合并且包含能够与表面偶联的锚,并且所述第二探针与所述靶双链多核苷酸中的第二序列结合并且包含衔接子序列;
(b)使所述样品与跨膜孔接触;
(c)对所述跨膜孔施加电位;以及
(d)监测由所述复合物与所述跨膜孔的相互作用引起的效应的存在或不存在,以确定所述复合物的存在或不存在,从而检测所述样品中的所述靶双链多核苷酸。
附图说明
应理解的是,附图仅用于说明本发明的特定实施例而并不旨在是限制性的。
图1显示了携带延伸的CRISPR RNA(crDNA)的灭活CRISPR-Cas9复合物如何用于接触特定基因组DNA序列‘a’的实例。在此图中,Cas9蛋白A接触基因组DNA B中的特定基因座a。CRISPR RNA C携带a的序列,其在‘PAM’位点D之前。Cas9催化a的解链和与非靶链a'的杂交。crRNA还可以携带与tracrRNA E具有部分互补性的序列和延伸部分F,其使得锚定多核苷酸或多核苷酸结合蛋白负载的多核苷酸能够杂交。tracrRNA还可以携带延伸部分G,其使得锚定多核苷酸或多核苷酸结合蛋白负载的多核苷酸能够杂交。或者,Cas9可以携带肽标签,或多核苷酸亲和标签,或反应性部分H,其使得蛋白质能够结合或下拉至表面以进行锚定或纯化。还显示了野生型Cas9核酸酶的典型裂解位点I、J,它们两个在‘死的’Cas9(dCas9)中均被灭活,并且其中一个在Cas9的‘切口酶’突变体(化脓性链球菌(Streptococcus pyogenes)蛋白中的残基H10和D840的突变)中被灭活。
图2显示了图1的替代方法,其中具有零个或一个灭活核酸酶位点的CRISPR-Cas9与特定基因座结合(如图1所示),并且携带酶B和与序列a互补的序列的衔接子延伸并且直接连接到靶DNA。C显示了活性或部分活性Cas9核酸酶在一个或两个位点D和E处诱导的靶中的双链断裂。F显示了由物种B与CRISPR-Cas9复合物的置换链的结合诱导的CRISPR-Cas9复合物的解离。G显示了在聚合酶-核酸外切酶如大肠杆菌(E.coli)DNA聚合酶I和连接酶如大肠杆菌DNA连接酶存在下延伸物种B的3'端的效果。
图3显示了载酶衔接子(‘Y-衔接子’),物种A如何与携带适当3'延伸部分的crRNA-tracrRNA杂交体,物种B杂交。物种A包含:寡核苷酸C,其与物种B的3'延伸部分具有部分互补性a*并且具有用于负载酶D的5'延伸部分;与物种C具有部分互补性的寡核苷酸E。寡核苷酸物种B包含:寡核苷酸F,其携带:序列S1、crRNA的原型间隔区序列、与tracrRNA G的部分互补序列;以及与序列a*互补的序列a的3'延伸部分。
图4显示锚定物种A,如携带胆固醇部分的寡核苷酸,如何与携带适当的3'延伸部分的crRNA-tracrRNA杂交体,物种B杂交。除了以下之外,所有部分都类似于图3:序列S2是物种B特有的原型间隔区序列,并且靶向与图3中所示的杂交体不同的序列;序列b,与锚定物种A上的序列b*互补的crRNA的3'延伸部分。物种A携带锚定部分C,如胆固醇或生物素或脱硫生物素。
图5显示如何通过CRISPR-Cas9复合物C的识别将双链DNA靶A与非特异性DNA B区分开。
除了混合物中的特异性和非特异性DNA可以用衔接子部分A衍生,可以用于通过纳米孔捕获靶和非靶DNA之外,图6与图5相同。
除了衔接子部分A可以携带用于控制靶和非靶DNA通过纳米孔的移动的多核苷酸结合蛋白B之外,图7与图6相同。
图8显示了一个实例,其中针对靶DNA C上的两个相邻基因座的CRISPR-Cas9复合物(A、B)可用于肯定地鉴定样品。复合物A含有携带载酶延伸部分的crRNA,如图3所示。复合物B含有携带锚定延伸部分的crRNA复合物,如图4所示。携带结合复合物B的基因座的DNA与表面D结合,例如三嵌段聚合物膜。与复合物A结合的酶可以控制条形码化DNA分析物E通过纳米孔的移动。在从溶液中去除非特异性分析物(包括没有靶基因座的物种,F)之后,通过冲洗系统,将仅检测携带两个基因座的实体G,而不检测实体F、H或I。
图9显示了一个实例,其中携带含有锚定部分的延伸部分的非活性Cas9(‘dCas9’)可用于通过多核苷酸结合蛋白控制通过纳米孔的易位来富集和确定靶分析物的序列。在此实例中,将酶结合的衔接子部分连接到溶液中所有DNA的一端或两端。只有含有靶基因座的DNA才能结合锚定dCas9复合物。
图10显示了具有连接的酶结合衔接子的DNA分析物,其可用于控制DNA分析物通过纳米孔的移动。
图11显示了具有结合酶的DNA分析物,类似于图10,其中酶的易位可以通过与特定基因座结合的CRISPR-dCas9复合物瞬时停滞。
图12显示了检测与靶多核苷酸分析物结合的dCas9的方法,其中靶分析物的两条链和结合的dCas9通过纳米孔易位,其中纳米孔具有允许靶分析物和结合的dCas9通过的收缩,并且其中dCas9产生通过纳米孔测量的离子电流的特征偏转。
图13显示了检测与靶多核苷酸分析物结合的dCas9的方法,其中靶分析物的两条链通过纳米孔易位,但纳米孔的收缩防止结合的dCas9易位并产生通过纳米孔测量的离子电流的特征偏转或停留时间。
图14显示了用于检测与靶多核苷酸分析物结合的dCas9的方法,其中靶分析物用无多核苷酸结合蛋白的衔接子衍生,如图6所示,并且其中多核苷酸分析物的两条链中的一条易位通过纳米孔,并且其中与靶分析物结合的dCas9产生通过纳米孔测量的离子电流的特征偏转或停留时间。
图15显示了结合有dCas9的靶分析物的测序方法,其中靶分析物用多核苷酸结合蛋白结合的衔接子衍生,如图7所示,并且其中通过多核苷酸结合蛋白控制多核苷酸分析物的两条链中的一条通过纳米孔的易位。在此实例中,与靶分析物结合的dCas9可以产生多核苷酸结合蛋白的易位的特征停滞,并因此产生通过纳米孔测量的离子电流的特征停滞。
图16显示了用于鉴定如图8所示锚定于膜的靶DNA的方法,所述方法是通过携带胆固醇部分的延伸的CRISPR-dCas9,如图4所示,并通过条形码化多核苷酸结合蛋白负载的寡核苷酸分析物的受控制移动来鉴定,所述分析物与延伸的CRISPR-dCas9复合物杂交,如图3所示,并且其与跟胆固醇延伸的CRISPR-dCas9相邻的基因座结合。
图17显示图16的衍生物,其中锚定部分可以是例如生物素或脱硫生物素,并且锚定部分可以与链霉亲和素(streptavidin)衍生的珠粒或纳米颗粒结合。
图18显示了通过与已知或常见基因座结合的胆固醇延伸的CRISPR-dCas9复合物锚定于膜上的靶DNA的实例,并且其中同一个靶DNA含有多个未知序列,其存在或不存在由酶延伸的CRISPR-dCas9复合物决定。在此实例中,每个酶延伸的CRISPR-dCas9复合物都携带独特的条形码,其可用于组合地肯定地鉴定基因座的存在或不存在,如图16所示。靶DNA也可以直接与膜偶联,而不是通过胆固醇延伸的CRISPR-dCas9复合物。
图19显示了示例性多核苷酸、λ噬菌体DNA以及距基因组末端2,855bp的特定靶基因座A的位置。
图20显示了图19的靶基因座,其中结合的CRISPR-dCas9携带胆固醇延伸部分,随机片段化成1-3kb区段,每个区段在任一端或两端携带多核苷酸结合蛋白负载的Y-衔接子以确定靶多核苷酸的序列。组装体通过胆固醇部分锚定于膜表面。
图21显示了与来自实验的噬菌体λ参考比对的序列数据的覆盖图,在所述实验中,噬菌体λDNA被随机片段化成1-3kb区段;将酶-Y-衔接子连接到片段化的DNA上;并且胆固醇延伸的CRISPR-dCas9与图19中所示的靶结合。覆盖图显示特定基因座A在预期位置(距离λ噬菌体基因组末端2,855bp)的富集。上图显示从正向(B)和反向(C)读段方向累积的比对,并且下图显示正向和反向方向的聚集。
图22显示了在图19和20所示的基因座处通过多核苷酸结合蛋白控制的携带结合的胆固醇延伸的dCas9的靶DNA的易位而检测到的纳米孔电流特征的示例性迹线。在此实例中,dCas9瞬时停滞酶的易位。电流迹线包含:开孔水平A、前导序列特征B、靶分析物特征C以及停滞D。
图23显示了通过如图16所示的条形码化寡核苷酸在酶延伸的dCas9上的由酶控制的移动而检测到的纳米孔电流特征的示例性迹线。电流迹线包含:开孔水平A、前导序列特征B以及条形码特征C。
图24示出了如何使用指导多核苷酸/多核苷酸指导的效应蛋白来将多核苷酸靶带到包含跨膜孔的膜。可以在施加跨膜电位和使用跨膜孔检测多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物之前冲洗掉未结合的多核苷酸。
图25显示了如何将衔接子和前导序列连接到指导RNA的实例。
图26显示了如何使用本发明的方法,使用包含用于将多核苷酸拴系到膜上的膜锚的指导多核苷酸/多核苷酸指导的效应蛋白以及对不同SNP具有特异性并且包含条形码化接附子以区分SNP的指导多核苷酸/多核苷酸指导的效应蛋白来检测SNP的存在或不存在。
图27显示如何使用一对指导多核苷酸/多核苷酸指导的效应蛋白来获得包含感兴趣区域(region of interest,ROI)的多核苷酸片段。第一指导多核苷酸/多核苷酸指导的效应蛋白可以使其核酸酶活性禁用,使得其起作用以使多核苷酸结合蛋白停滞,如图11中所示,使得能够使用跨膜孔表征感兴趣区域。
图28A显示靶DNA分析物(A)的固定,所述分析物包含与两端连接并且在两端通过各自携带胆固醇部分(D)的寡核苷酸拴系在膜(C)表面上的酶结合的Y-衔接子(B)。携带胆固醇锚(F)的结合的CRISPR-dCas9(E)在第三位置将分析物拴系到膜上。此图显示在加入MgATP以起始DNA上的酶易位之前的系统。图28B显示靶DNA分析物(A)的固定,所述分析物包含与各自携带胆固醇部分(D)的两端连接的酶结合的Y-衔接子(B)。携带亲和标签,如生物素部分(F)的结合的CRISPR-dCas9(E)将分析物拴系到珠粒(C),如链霉亲和素。此图显示在加入MgATP以起始DNA上的酶易位之前的系统。图28C显示靶DNA分析物(A)的固定,所述分析物包含与携带胆固醇部分(D)的一端连接的酶结合的Y-衔接子(B)。另一末端具有发夹(G)。携带亲和标签,如生物素部分(F)的结合的CRISPR-dCas9(E)将分析物拴系到珠粒(C),如链霉亲和素。此图显示在加入MgATP以起始DNA上的酶易位之前的系统。
图29显示由图28引入,在加入MgATP之后的系统。酶朝向CRISPR-dCas9复合物的易位在遇到CRISPR-dCas9复合物(A)后停止。
图30显示了由图29引入,在跨膜施加电位并通过纳米孔(A)捕获靶分析物的末端之后的系统。
图31显示了由图30引入,在施加于分析物的电位释放出与CRISPR-dCas9复合物结合的酶并且酶恢复了易位(A)之后的系统。
图32显示了在加入MgATP后约2350秒的示例迹线,其包含初始的预dCas9易位事件(B)、停滞(C)以及易位恢复(D)。突出并延伸停滞恢复(E)。
图33是遇到孔的双链DNA链的示意图,所述孔的大小仅足够使DNA的单链穿过。当第一链通过时,互补链被孔剥去。
图34显示了易位通过纳米孔的DNA链的电流与时间的图。当孔中没有DNA时,迹线始于开孔水平A。在每个末端具有衔接子的双链DNA链然后遇到孔并开始易位。孔对于双链DNA来说太小而不能通过,因此只有单链易位,如图33所示。DNA的易位产生特征信号(区域B),并且然后返回到开孔水平A。事件通常持续少于0.5秒。下图是上图的放大图。
图35显示除了如图14中所示,DNA链具有与其结合的dCas9酶之外与图34相同的实验。在与孔中的DNA相关的电流水平下观察到持续10秒的长暂停。当电位反转时,这些事件中的一些仅返回到开孔水平。
图36显示除了如图14中所示,DNA链具有与其结合的dCas9酶之外与图34相同的实验。它显示了一个事件,其中链易位并且信号返回到开孔水平A。第二和第三张图放大了第一张图的视图,第二张图显示事件的开始并且第三张图显示结束。从此迹线可以看出,所述信号具有与图34中相同的特征模式,但其中具有新的长暂停水平C。这表明与DNA链结合的dCas9导致对在单独的DNA下观察到的信号的修改。
图37显示了双链DNA链完整地通过大小足够容纳它的孔的示例性电流迹线。电流随着DNA通过孔而从开孔电流A下降到较低水平B,并且然后返回到开孔水平。
图38显示了双链DNA链完整地通过大小足够容纳它的孔的示例性电流迹线。在这种情况下,DNA具有与其结合的蛋白质,如图12中所示。此处,来自DNA水平的电流存在额外偏转,其表示蛋白质易位(C)。
图39显示双链DNA链完整地通过大小足够容纳它的孔的示例性电流迹线,其中多个蛋白质与DNA结合。每个蛋白质都会对电流产生单独的偏转。
图40显示双链DNA链完整地通过大小足够容纳它的孔的示例性电流迹线,其中多个蛋白质与DNA结合(在与图39中不同的位置)并且蛋白质已被修饰或修改成这样,当它们通过孔时,它们会产生不同的信号。
图41显示用于将dCas9接触的靶A富集到珠粒表面B并进行检测或测序的示例性方法,其中crRNA C和tracrRNA携带具有序列a的5'DNA延伸部分D。靶A可以是任何大小,长度在数十个核苷酸到大于兆碱基的范围内。B可以例如是珠粒表面(在本体溶液中或呈柱状)或膜。与B的连接由寡核苷酸E介导,其携带与D的延伸部分互补的序列a',所述延伸部分携带化学部分,例如生物素,如果B被蛋白质如链霉亲和素包被,那么所述化学部分能够连接到珠粒B上。随后可以将非靶DNA从B洗掉。当靶与珠粒结合时,可以实现衔接子F与靶A的平端或互补端的酶促或点击化学连接,洗掉过量的衔接子,以产生靶-dCas9-珠粒组装体G。然后通过将组装体G递送至含有膜H和胆固醇修饰的寡核苷酸系链I的流通池来实现靶A的测序或检测,所述系链I通过与t互补的序列t'与衔接子F杂交。如果例如珠粒B是顺磁性的,那么可以通过重力或通过外加磁场将组装体G递送到膜上。
图42显示示例性覆盖图,其显示了使用针对rrsH基因的crRNA探针,从总的大肠杆菌基因组样品富集所有16S(rrs)基因(大肠杆菌K-12的坐标223771-225312,菌株MG1655,峰i)。A上图显示了正向(正数)和反向(负数)方向读段的覆盖度与位置的图。识别出七个靶峰,即i到vii,其相对于背景B被过度代表(over-represented)。A下图显示正向和反向读段的聚合。C显示成功定位到参考的所有读段的读段长度的直方图,其以每个区域中定位的碱基数归一化。D显示了下拉中使用的单个探针的七个预期结合位置。峰vii位于靶序列上,这是典型的‘脱靶’位点,但携带与探针序列的20个匹配中的19个。
图43显示对dCas9接触的DNA样品相继施加热胁迫、后续SPRI-珠粒清除和基于珠粒的dCas9下拉对靶分子和非靶分子的结合比例的影响,如通过纳米孔测序所确定。
图44显示依序‘下拉’和‘立足点洗脱(toehold elution)’方法的实例,所述方法利用来自dCas9接触的靶分子A的tracrRNA和crRNA各自的两个不同的寡核苷酸延伸部分:序列[a-c]和d,并且可以用于依序选择tracrRNA和crRNA的存在(或反之亦然)。携带与tracrRNA延伸部分a部分互补的序列a'-b'的寡核苷酸B首先与纯化表面C结合;将A与[B+C]一起孵育,并洗掉任何非靶DNA。当与[A+B+C]一起孵育时,携带与寡核苷酸B完全互补的序列[a+b]的寡核苷酸D将通过称为‘立足点置换(toehold displacement)’的现象从A的tracrRNA延伸部分置换寡核苷酸B,从[B+C]释放出A。A可以被调整并递送至流通池以进行纳米孔测序或检测,如图41中所概述,或然后可以与第二类表面E结合,其携带具有与crRNA延伸部分G(序列d)互补的突出端d'的双链寡核苷酸F,产生F。还可以对F进行调整和测序或检测,如图41中所概述。表面C和E可以是珠粒(无论是块状还是柱状)或膜。
图45显示热胁迫(55℃,5分钟)、SPRI纯化(在热胁迫后,适用时进行;1×)以及使用单个crRNA探针从16S rrs基因的下拉进行的立足点置换方法(在珠粒捕获后进行)的组合效应,如实例7中所述。A,没有热胁迫、SRRI或立足点的对照。B,仅SRRI。C,仅热胁迫。D,热胁迫和SPRI。E,仅立足点。F,SPRI和立足点。G,热胁迫和立足点。H,热胁迫、SPRI和立足点。每组(A至H)显示示例性大肠杆菌覆盖图,类似于图42中所示。
图46比较了用dCas9的野生型或‘特异性增强型’突变体进行的下拉,如实例8中所述。A显示了对照实验,其中在其它方面是野生型的背景中使用dCas9突变体变体来拉出大肠杆菌rrs 16S基因,如图42和实例6中所述。峰如图42中所鉴定。B显示等同实验,其中野生型dCas9突变体变体用‘特异性增强型’dCas9突变体D10A/H840A/K848A/K1003A/R1060A替换。峰C和D也对应于图42的峰vii,并且对应于rrsD基因,其在-2位携带相对于PAM的错配。
图47显示来自用无催化活性(dCas9,A)或具有催化活性的(B)Cas9进行的下拉的各轮纳米孔DNA测序的覆盖图,如实例9中所述。A显示了对照实验,其中在其它方面是野生型的背景中使用dCas9突变体变体来拉出大肠杆菌rrs 16S基因,如图42和实例6中所述。此实验中的孵育温度是30℃。B显示类似的下拉实验,其中用催化活性Cas9替换dCas9突变体。此实验中的孵育温度是37℃。*表示由此实验中使用的与实例6相比而言较高的孵育温度引起的额外的峰。C和D显示dCas9和活Cas9下拉的覆盖图,其中覆盖度按读段的方向性分组;正数表示正向读段,而负数表示反向读段。
图48中A显示珠粒-靶缀合物,类似于图41中所示的缀合物,但另外在载酶衔接子与靶分子C之间含有条形码衔接子B。其它组分如图41中所述。D显示来自单轮6小时测序的覆盖图,其含有七个单独条形码化的样品,NB01至NB07。每个条形码与不同的一组crRNA探针相关,并且因此与大肠杆菌基因组的不同靶区域相关,如实例10的正文中所述。探针组合列于实例10的正文中。
图49显示了三个示例性工作流,其涉及将衔接子连接到所捕获的靶分析物,而所述分析物通过dCas9结合到珠粒上。A,dCas9的无酶检测,通过将无酶衔接子连接到与珠粒结合的所捕获的靶分析物的末端;B,通过PCR衔接子的连接来富集靶,然后如上所述对靶进行PCR扩增,以从珠粒中释放靶,对其进行扩增和测序;以及C,依序连接1D2条形码衔接子,然后对衔接子测序以便高准确度纳米孔测序,而dCas9与靶结合,并且靶与珠粒结合。
图50显示了实例11中所述的示例性工作流,其用于通过转座酶介导的DNA剪切,同时加入粘性末端用于通过点击化学进行衔接子连接,从高分子量DNA快速富集靶。然后如实例11中所述,将dCas9与剪切的DNA结合;通过胁迫步骤使脱靶效应最小化,如先前在实例6中所述,并对通过点击化学连接的衔接子测序。此工作流利用Oxford NanoporeTechnologies SQK-RAD003试剂盒,在转座酶片段化与衔接子连接步骤之间插入Cas9结合和珠粒捕获步骤,如实例11中所述。
图51显示用于使Cpf1或dCpf1接触的靶A富集到珠粒表面B并对其进行检测或测序的假设示例性方法,其中crRNA携带具有序列a的5'DNA延伸部分C。靶A可以是任何大小,长度在数十个核苷酸到大于兆碱基的范围内。B可以例如是珠粒表面(在本体溶液中或呈柱状)或膜。与B的连接由寡核苷酸E介导,其携带与C的延伸部分互补的序列a',所述延伸部分携带化学部分,例如生物素,如果B被蛋白质如链霉亲和素包被,那么所述化学部分能够连接到珠粒B上。随后可以将非靶DNA从B洗掉。当靶与珠粒结合时,可以实现衔接子F与靶A的平端或互补端的酶促或点击化学连接,洗掉过量的衔接子,以产生靶-Cpf1-珠粒组装体G。然后通过将组装体G递送至含有膜H和胆固醇修饰的寡核苷酸系链I的流通池来实现靶A的测序或检测,所述系链I通过与t互补的序列t'与衔接子F杂交。如果例如珠粒B是顺磁性的,那么可以通过重力或通过外加磁场将组装体G递送到膜上。
图52显示了一个假设的实例,其中进行‘配对衔接子(paired-adaptor)’下拉,如实例13中所述。靶DNA分析物A(携带靶序列y和z)以从零到数百纳克范围内的不同浓度的A与非靶DNA分析物B混合。如实例8中所述的C是dCas9-tracrRNA-crRNA复合物,其在携带纳米孔测序衔接子和任选的条形码序列b的crRNA上携带DNA延伸部分。D是dCas9-tracrRNA-crRNA复合物,其在携带使得crRNA能够拴系到表面的序列t的crRNA上携带DNA延伸部分。将物种C和D加入到A和B的混合物中允许在B的背景中检测A。只有携带序列y和z的靶分子通过胆固醇修饰的寡核苷酸E(具有与D的延伸部分t互补的序列t')被拴系到膜表面F并携带允许检测靶分析物的酶衔接子。因此,与H的捕获相比,G的纳米孔捕获增强。以电子方式测量纳米孔J对G和H的捕获。K显示被捕获事件L1和开孔电流L2打断的示例性纳米孔电流迹线。L1的频率取决于膜上物种G的浓度和溶液中H的背景水平。M显示事件L1的频率相对于靶分析物A的浓度的假设图。N显示来自溶液的物种‘G’的背景捕获水平并且因此是‘假阳性’率。
具体实施方式
应理解,所公开的产品和方法的不同应用可以根据本领域的特定需要而定制。还应理解,本文所用的术语仅出于描述本发明的特定实施例的目的,而不打算是限制性的。
另外除非上下文另外明确规定,否则如本说明书和所附权利要求书中所使用,单数形式“一个/一种(a/an)”和“所述(the)”包括复数个指示物。因此,例如,提及“多核苷酸”包括两个或更多个多核苷酸,提及“锚”是指两个或更多个锚,提及“解旋酶”包括两个或更多个解旋酶,并且提及“跨膜孔”包括两个或更多个孔,等等。
本文中,无论是上文还是下文,所引用的所有公开、专利和专利申请特此通过引用以其全部内容并入。
方法
本发明提供一种检测样品中的靶多核苷酸的方法,其包含:(a)使样品与跟靶多核苷酸中的序列结合的指导多核苷酸和多核苷酸指导的效应蛋白接触,其中指导多核苷酸和多核苷酸指导的效应蛋白与样品中存在的任何靶多核苷酸形成复合物;(b)使样品与包含跨膜孔的膜接触;(c)跨膜施加电位差;以及(d)监测由复合物与跨膜孔的相互作用引起的效应的存在或不存在,以确定复合物的存在或不存在,从而检测样品中的靶多核苷酸。步骤(a)和(b)可以同时进行或按任一种顺序依序进行。
所述方法可以包含(a)使样品与跟靶多核苷酸中的序列结合的指导多核苷酸和多核苷酸指导的效应蛋白接触以形成复合物,其中样品与包含跨膜孔的膜接触并且其中对跨膜孔施加电位;和(b)随着复合物的至少一部分相对于跨膜孔移动,进行一次或多次测量,以检测复合物的存在或不存在,从而检测样品中的靶多核苷酸。
在一些实施例中,所述方法包含:(a)使样品与跟靶多核苷酸中的序列结合的指导多核苷酸、多核苷酸指导的效应蛋白以及包含跨膜孔的膜接触;(b)跨膜施加电位差;以及(c)测量通过跨膜孔的离子流,或由样品、指导多核苷酸和多核苷酸指导的效应蛋白与跨膜孔的相互作用产生的其它信号,以确定包含指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸的复合物的存在或不存在,从而检测样品中的靶多核苷酸。离子流的测量可以包含测量通过孔的电流。
所述方法可以按多种不同方式进行。所述方法可用于进行各种不同的应用。所述方法可用于例如确定单个靶多核苷酸或多个靶多核苷酸的存在或不存在。所述方法可以是定量的。例如,可以使用本发明的方法确定样品中存在的靶多核苷酸的量(例如浓度)和/或可以确定样品中存在的不同多核苷酸的相对量。所述方法可提供关于靶多核苷酸的进一步信息,例如多态性的存在或不存在和/或多态性的属性。
所述方法可以包含确定与指导多核苷酸连接的衔接子是否与跨膜孔相互作用。可以进行所述方法,使得包含未与靶多核苷酸结合的衔接子的指导多核苷酸不与跨膜孔相互作用。通常在将跨膜电位施加到膜上之前洗掉这种未结合的指导多核苷酸。靶多核苷酸可以拴系到表面,例如膜,以防止包含衔接子的结合的指导多核苷酸被洗掉。靶多核苷酸可以具有系链,例如膜锚,直接与其连接,例如,与其一端连接。或者,可以使用包含系链,例如膜锚的第二指导多核苷酸/多核苷酸指导的效应蛋白以将靶多核苷酸系拴到表面,例如膜。
靶多核苷酸被栓系的表面可以是珠粒。
衔接子通常为靶多核苷酸所特有的,并且在与跨膜孔相互作用时产生不同的信号。可以向样品中加入多个指导多核苷酸,各自对不同的靶多核苷酸具有选择性并且具有不同的衔接子,从而基于由不同的衔接子与跨膜孔相互作用产生的不同信号来检测和/或定量不同的靶多核苷酸。在这个实施例中,可以认为衔接子包含条形码。
所述方法可以使用与不同多核苷酸序列结合的多个指导多核苷酸。不同的多核苷酸序列可以例如是同一个靶多核苷酸中的不同序列(例如靶多核苷酸的不同部分)、不同靶多核苷酸的序列或靶多核苷酸内的替代序列,例如包含多态性,例如单核苷酸多态性(single nucleotide polymorphism,SNP)的序列。
在一些实施例中,所述方法可以包含进一步表征靶多核苷酸。例如,所述方法可以包含对全部或一部分靶多核苷酸进行测序。
在一些实施例中,所述方法可以包含使用与靶多核苷酸的不同区域结合的两个或更多个指导多核苷酸和/或两个或更多个多核苷酸指导的效应蛋白来检测靶多核苷酸的存在、不存在或量,其中如果靶多核苷酸存在于样品中,那么两个不同的指导多核苷酸/多核苷酸指导的效应蛋白与靶多核苷酸的结合将产生可检测信号,例如通过跨膜孔的可检测的电流改变。所述信号可以是指导多核苷酸/多核苷酸指导的效应复合物中的一个中的衔接子的特征,其中所述信号只有或主要是在所述指导多核苷酸被“连接”到包含膜锚的第二指导多核苷酸/多核苷酸指导的效应蛋白时观察到,并且此“连接”发生在指导多核苷酸/多核苷酸指导的效应蛋白均与靶多核苷酸结合时。换句话说,靶多核苷酸用于将包含衔接子的指导多核苷酸/多核苷酸指导的效应复合物“连接”到包含膜锚的指导多核苷酸/多核苷酸指导的效应复合物。在多核苷酸指导的效应蛋白包含膜锚的实施例中,连接可以通过蛋白质本身,例如通过使用strep-tag/flag-tag/his-tag。
在一些实施例中,所述方法可以包含通过用靶多核苷酸特异性的指导多核苷酸/多核苷酸指导的效应蛋白复合物标记每个靶多核苷酸,使用跨膜孔选择性地表征靶多核苷酸,例如测序,使得靶多核苷酸可以被选择性地测序,而不需要在使样品与跨膜孔接触之前将靶多核苷酸与样品中的其它多核苷酸分离。
例如,指导多核苷酸/多核苷酸指导的效应蛋白复合物可以用膜锚标记,使得只有靶多核苷酸被拴系到膜上。样品中的其它多核苷酸可以洗掉。或者,能够沿着多核苷酸移动的多核苷酸结合蛋白可以与样品中的多核苷酸的末端结合,例如使用本领域中已知的技术,并且可以使多核苷酸结合蛋白在复合物形成后沿着多核苷酸移动,例如,通过加入多核苷酸结合蛋白移动所必需的辅因子。在这个实施例中,结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物使多核苷酸结合蛋白停滞在靶多核苷酸上,而多核苷酸结合蛋白经过加工而远离非靶多核苷酸的末端。然后,当施加跨膜电位时,电位的力和与孔的接触使结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物从靶多核苷酸移位,使得靶多核苷酸易位通过孔。没有结合多核苷酸结合蛋白的非靶多核苷酸如此快速地通过孔以至于没有检测到信号,或者使得所获得的任何信号可以容易地与由靶多核苷酸与孔相互作用产生的信号区分开。样品中的多核苷酸,包括靶多核苷酸和非靶多核苷酸的3'端链可被降解,例如使用核酸外切酶。以这种方式,可以选择性地表征靶多核苷酸,例如测序。可以通过加入辅因子,例如ATP或另一种核苷例如和γsGTP,使多核苷酸结合蛋白沿着多核苷酸移动。
在另一个实施例中,多核苷酸指导的效应蛋白可用于在选定的点切割多核苷酸。这可以用于限制通过所述方法获得的关于感兴趣区域的信息,例如序列信息。例如,可以使用具有核酸酶活性的两个多核苷酸指导的效应蛋白来获得感兴趣的多核苷酸片段,如图27中所示。作为替代方案,可以使用具有被灭活或被禁用的核酸酶活性的经过修饰的多核苷酸指导的效应蛋白来使停滞多核苷酸结合蛋白,如上所述,并且可以使用第二多核苷酸指导的效应蛋白来截短被表征的片段。此实施例例如在V(D)J谱系分析应用中特别有用。
此外,在一些实施例中,指导多核苷酸/多核苷酸指导的效应蛋白复合物标记或标注靶多核苷酸,使得指导多核苷酸/多核苷酸指导的效应蛋白复合物对通过孔的电流的作用可用于确定靶多核苷酸的存在或不存在,定量或鉴定靶多核苷酸。
例如,指导多核苷酸或多核苷酸指导的效应蛋白可以连接到可以用于鉴定用膜锚标记的靶多核苷酸的衔接子,因为当衔接子与被拴系到膜上的靶多核苷酸结合时,衔接子将仅与跨膜孔相互作用。未结合的指导多核苷酸和多核苷酸指导的效应蛋白可以洗掉。可以向样品中加入多个指导多核苷酸,各自对不同的靶多核苷酸具有选择性并且具有不同的衔接子,从而基于由不同的衔接子与跨膜孔相互作用产生的不同信号来检测和/或定量不同的靶多核苷酸。
或者,当靶多核苷酸通过跨膜孔时,与靶多核苷酸结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物可以产生可检测信号。当跨膜孔太小而不允许指导多核苷酸/多核苷酸指导的效应蛋白通过时,例如允许单链多核苷酸通过但不允许双链多核苷酸通过的孔,当指导多核苷酸/多核苷酸指导的效应蛋白到达孔时,多核苷酸通过孔的移动被阻断。这影响通过孔的电流并允许检测指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物的存在。例如,指导多核苷酸/多核苷酸指导的效应蛋白复合物可以通过孔的作用力和外加电位从靶多核苷酸上剥离(当靶多核苷酸被外加电位拉过孔时,引起指导多核苷酸/多核苷酸指导的效应蛋白复合物与孔接触,并且对靶多核苷酸的持续拉力迫使指导多核苷酸/多核苷酸指导的效应蛋白复合物抵着孔,使得指导多核苷酸/多核苷酸指导的效应蛋白复合物被迫远离靶多核苷酸(即,导致与靶多核苷酸去结合)),产生可检测的电流影子带(stutter)。可以在所述方法中使用与靶多核苷酸的不同部分结合的两个或更多个指导多核苷酸/多核苷酸指导的效应蛋白复合物。当每个结合的多核苷酸/多核苷酸指导的效应蛋白复合物到达孔时,它将产生影子带。因此,可以使用多个指导多核苷酸/多核苷酸指导的效应蛋白复合物来鉴定靶多核苷酸。例如,可以设计一种或多种指导多核苷酸以仅在靶多核苷酸中存在特定多态性时与靶多核苷酸结合。在多核苷酸通过孔时观察到的影子带的数量或在多核苷酸通过孔时特定影子带的存在或不存在可以指示多态性的存在或不存在。
当跨膜孔足够大以允许双链多核苷酸和结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物通过时,双链多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物通过孔,将产生当指导多核苷酸/多核苷酸指导的效应蛋白复合物通过孔时可识别的信号。因此,可以使用一种或多种指导多核苷酸/多核苷酸指导的效应蛋白复合物来鉴定靶多核苷酸。例如,指导多核苷酸可以设计成仅在靶多核苷酸中存在特定多态性时结合。在靶多核苷酸通过孔时观察到的由结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物引起的信号的数量或在靶多核苷酸通过孔时特定信号的存在或不存在可以指示多态性的存在或不存在。允许双链多核苷酸和结合的多核苷酸/多核苷酸指导的效应蛋白通过的纳米孔包括例如纳米毛细管。因此,在此实施例中,孔可以不包含在膜中。通常修饰指导多核苷酸、多核苷酸指导的效应蛋白和/或靶多核苷酸中的一个或多个以使所述方法能够进行。因此,本发明还提供了经过修饰的指导多核苷酸、多核苷酸指导的效应蛋白、指导多核苷酸/多核苷酸指导的效应蛋白复合物,以及多组适用于本发明的此类多核苷酸指导物和效应分子。
所述方法可以进一步包含确定靶多肽的量或靶多核苷酸的一个或多个特征。所述一个或多个特性通常选自:(i)靶多核苷酸的长度;(ii)靶多核苷酸的同一性;(iii)靶多核苷酸的序列;(iv)靶多核苷酸的二级结构;以及(v)靶多核苷酸是否被修饰。
步骤(a)可以进一步包含使样品与复合物的一种或多种组分所结合的珠粒(例如微粒)接触。或者,(a)中使用的一种或多种组分,例如靶多核苷酸、指导多核苷酸或多核苷酸指导的效应蛋白,可以与珠粒(例如微粒)预结合。
样品可以在水性介质中提供,或者可以将样品加入含有多核苷酸指导的效应蛋白和指导多核苷酸的水性介质中。水性介质通常将包含离子,以在跨膜施加电位差后提供穿过跨膜孔的离子流。水性介质通常还包含缓冲剂。水性介质通常具有6到9范围内的pH和/或100到200mM盐范围内的离子浓度,盐例如NaCl。
珠粒通常比水性介质更密实并下沉通过介质以接触膜,因此有效地增强了与膜表面的锚连接的物种的浓度。
在所述方法中,外加电位可以是电压电位。或者,外加电位可以是化学势。其实例是跨两亲层使用盐梯度。盐梯度公开于例如Holden等人,《美国化学会志》(J Am ChemSoc.)2007年7月11日:129(27):8650-5中。
在不需要置换结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物的实施例中,指导多核苷酸和/或效应蛋白可以与靶多核苷酸交联。
在本发明的方法中,指导多核苷酸/多核苷酸指导的效应蛋白可以用与双链多核苷酸结合的探针替换。探针可以与酶相关或不相关。例如,探针可以是RecA包被的探针、肽核酸(peptide nucleic acid,PNA)、桥接核酸(bridged nucleic acid,BNA)、锁核酸(locked nucleic acid,LNA)、γPNA、三链DNA或吗啉代探针。探针通常包含与靶多核苷酸中的序列互补的单链区。探针可以包含双链区和/或二级结构,例如环,例如发夹环或三链体。探针的长度通常是约8至约50、约10至约40,例如约15至约30,优选约18至约25,例如19、20、21、22、23或24个核苷酸。探针可以具有能够与膜或与其连接的衔接子偶联的锚定序列。例如,探针可以是指导多核苷酸/多核苷酸指导的效应蛋白复合物,或RecA包被的探针。探针可以是PNA、BNA、LNA、γPNA、三链DNA或吗啉代探针。探针可以具有能够沿着与其连接的多核苷酸移动的多核苷酸结合蛋白。多核苷酸结合蛋白可以与衔接子中所包含的前导序列结合。
在所述方法中,指导多核苷酸/多核苷酸指导的效应蛋白可以用与具有特定核苷酸序列的多核苷酸结合的蛋白质替换。与具有特定核苷酸序列的多核苷酸结合的蛋白质包括例如转录激活因子样效应物核酸酶(transcription activator-like effectornuclease)和锌指核酸酶。此类核酸酶可以被工程化以与靶多核苷酸内的特定位点结合。
在一个特定实施例中,所述方法可以是检测样品中的包含双链多核苷酸的靶多核苷酸的方法,所述方法包含:(a)使样品与第一探针和第二探针接触,其中第一探针和第二探针与样品中存在的任何靶多核苷酸形成复合物,第一探针与靶双链多核苷酸中的第一序列结合并包含能够与膜偶联的锚,并且第二探针与靶双链多核苷酸中的第二序列结合并包含衔接子序列;(b)使样品与跨膜孔接触;(c)对跨膜孔施加电位;以及(d)监测由复合物与跨膜孔的相互作用引起的效应的存在或不存在,以确定复合物的存在或不存在,从而检测样品中的靶双链多核苷酸。可以在步骤(c)之前洗掉任何未结合的探针。步骤(d)通常包含监测衔接子与跨膜孔的相互作用。靶多核苷酸中的第一序列和第二序列通常各自是双链多核苷酸的一部分。
第二探针可以进一步包含能够沿着多核苷酸移动的多核苷酸结合蛋白。第二探针中的衔接子可以包含前导序列,并且多核苷酸结合蛋白可以与前导序列结合,和/或衔接子可以包含条形码。
所述方法的步骤(a)可以包含使样品与两个或更多个第一探针接触,其中两个或更多个探针与不同的序列结合。所述方法的步骤(a)可以包含使样品和跨膜孔与两个或更多个第二探针接触。通常,两个或更多个第二探针包含不同的条形码。
在使用与不同序列结合的指导多核苷酸或探针的方法中,那些序列可以存在于不同的靶多核苷酸中、同一个靶多核苷酸内,或可以是可以存在于靶多核苷酸中的替代序列,例如SNP。
在一个实施例中,所述方法使用多对,例如2至50、3至40、4至30、5至25、6至15或8至10对第一和第二探针,其中每对与不同的靶多核苷酸结合。在一个替代实施例中,所述方法可以使用单个第一探针和多个第二探针,其可以用于鉴定靶多核苷酸内的不同序列或替代序列。
所述方法可用于在富集靶分子后检测复杂背景中的一个或多个,例如2、3、4、5、6、7、8、9、10、20、30个或更多个靶多核苷酸。在一个实施例中,使用测序,例如纳米孔测序来进行检测。因此,在此实施例中,靶DNA分子可以主要通过其序列来鉴定。
所述方法可以按多重分析形式进行。多重分析可以使用不同的条形码。条形码可以例如各自具有不同的核苷酸序列,使得条形码能够被纳米孔识别。在一个实施例中,在使样品与指导多核苷酸和多核苷酸指导的结合蛋白接触之前,可以将条形码序列连接到样品中的所有多核苷酸。在使样品与指导多核苷酸和多核苷酸指导的结合蛋白接触之前,可以将第二条形码加入至第二样品。第一和第二样品可在加入指导多核苷酸和多核苷酸指导的结合蛋白之前或之后组合,优选在指导多核苷酸和多核苷酸指导的结合蛋白已经与靶多核苷酸结合之后。在指导多核苷酸和多核苷酸指导的结合蛋白已经与靶多核苷酸结合后发生样品合并的情况下,可以在合并之前或之后进行纯化步骤(包括胁迫、去除非靶结合蛋白和/或去除非靶多核苷酸)。多个样品,例如2、3、4、5、6、7、8、9、10、20、30个样品,可以用条形码标记,并且然后以这种方式组合。在此实施例中,可以同时对所有样品进行测序,例如使用同一个流通池,并使用其条形码衔接子进行鉴定。
在另一个实施例中,条形码和测序衔接子可以在指导多核苷酸和多核苷酸指导的结合蛋白已经与靶多核苷酸结合之后加入。例如,条形码和测序衔接子可以连接在珠粒上。在指导多核苷酸和多核苷酸指导的结合蛋白已经与靶多核苷酸结合之后并且任选地在已进行一个或多个纯化步骤(例如胁迫、去除非靶结合蛋白和/或去除非靶多核苷酸)之后,可以将载靶条形码化调整后的珠粒加入到样品中。
所述方法可以包含去除任何不与靶多核苷酸特异性结合的多核苷酸指导的效应蛋白和/或指导多核苷酸,例如指导多核苷酸/多核苷酸指导的效应蛋白复合物。存在于样品中的不与靶多核苷酸结合的过量的多核苷酸指导的效应蛋白和/或指导多核苷酸,例如指导多核苷酸/多核苷酸指导的效应蛋白复合物,会在监测靶多核苷酸/指导多核苷酸/多核苷酸指导效应蛋白复合物与孔的相互作用时产生背景。不与靶多核苷酸特异性结合的指导多核苷酸、多核苷酸指导的效应蛋白和/或多核苷酸指导的效应蛋白/指导多核苷酸复合物可以通过使样品中的多核苷酸与表面,例如珠粒或柱子结合,而与包含指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸的复合物分离。靶多核苷酸还可以通过使样品中的指导多核苷酸、多核苷酸指导的效应蛋白和/或多核苷酸指导的效应蛋白/指导多核苷酸复合物与表面,例如珠粒或柱子结合,而与样品中的非靶多核苷酸分离。靶多核苷酸可以例如通过用指导多核苷酸/多核苷酸指导的效应蛋白复合物上的捕获部分‘下拉’而与背景分离。
所述方法可以包含在步骤(b)之前选择性地使任何未与靶多核苷酸特异性结合的多核苷酸指导的效应蛋白变性。通过对结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物施加热和/或化学胁迫,可以降低指导多核苷酸/多核苷酸指导的效应蛋白复合物结合的‘脱靶’效应。通常,在此实施例中,通过所施加的热胁迫或化学胁迫而选择性地使非靶结合的多核苷酸指导的效应蛋白变性。可以选择所施加的热或化学处理,使得仅游离的多核苷酸指导的效应蛋白(即,不与样品中的多核苷酸结合,但可以与指导多核苷酸结合的多核苷酸指导的效应蛋白)和非靶结合的多核苷酸指导的效应蛋白(即,与样品中的多核苷酸非特异性结合的多核苷酸指导的效应蛋白,或“脱靶”多核苷酸指导的效应蛋白)变性。靶结合的多核苷酸指导的效应蛋白在热胁迫或化学胁迫期间保持与靶多核苷酸结合。任何脱靶多核苷酸指导的效应蛋白从其与样品中的多核苷酸的非特异性结合中释放。在一个实施例中,仅与指导多核苷酸中的相应序列精确互补的靶序列结合的多核苷酸指导的效应蛋白在胁迫期间保持与多核苷酸结合。
可以使用任何合适的化学胁迫,例如尿素(例如高达6M、5M或4M)、盐酸胍、极端pH(酸性或碱性,例如低于pH6、pH5或pH4或高于pH8、pH9或pH10)或高盐浓度。本领域的技术人员可以容易地确定合适的条件。
化学胁迫可以持续任何能够引起对多核苷酸指导的效应蛋白与多核苷酸的非特异性结合的选择性破坏,但不破坏多核苷酸指导的效应蛋白与靶多核苷酸的特异性结合的时间段。化学胁迫可以进行约30秒至约10分钟,例如约1分钟、约2分钟、约3分钟、约5分钟、约6分钟、约7分钟、约8分钟或约9分钟。
热胁迫可以在任何合适的温度下进行。通常,温度足够高以破坏多核苷酸指导的效应蛋白与多核苷酸的非特异性结合,但是足够低以使多核苷酸指导的效应蛋白与靶多核苷酸的特异性结合不被破坏。例如,可以将样品加热至约40℃至约65℃、约45℃至约65℃、约50℃至约60℃,例如约55℃的温度。
热胁迫可以持续任何能够引起对多核苷酸指导的效应蛋白与多核苷酸的非特异性结合的选择性破坏,但不破坏多核苷酸指导的效应蛋白与靶多核苷酸的特异性结合的时间段。热胁迫可以进行约30秒至约10分钟,例如约1分钟、约2分钟、约3分钟、约5分钟、约6分钟、约7分钟、约8分钟或约9分钟。
可以使用纯化步骤来去除过量的未结合的多核苷酸指导的效应蛋白和/或指导多核苷酸。这可以通过例如向样品中加入聚乙二醇(PEG)和氯化钠并使样品与涂有羧基的顺磁珠接触以使得样品中存在的多核苷酸与珠粒结合来实现。合适的珠粒包括市售的SPRI珠粒,并且可以使用本领域中已知的标准方案。在一个实施例中,随后可以使用表面,例如不同的捕获珠粒,将靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物与非靶多核苷酸分离。通常,此处指导多核苷酸/多核苷酸指导的效应蛋白可以含有结合部分,其用于将靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物特异性结合至表面。任何非结合的多核苷酸可以洗掉。靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物可以通过任何合适的方法从表面洗脱,或者表面可以用于将复合物递送至孔,例如在表面是珠粒的情况下。
‘脱靶’效应可以通过以下进一步最小化:使用指导多核苷酸/多核苷酸指导的效应蛋白上,例如指导多核苷酸上的第一结合部分来纯化捕获表面上的靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物,使用指导多核苷酸/多核苷酸指导的效应蛋白上,例如指导多核苷酸上的第二结合部分来洗脱靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物并将靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物转移至第二特异性捕获表面。这是可以实现的,例如,其中第一结合部分和第二结合部分均是指导多核苷酸上的末端延伸部分或是能够与寡核苷酸结合的其它单链多核苷酸序列。指导多核苷酸上的第一末端延伸部分具有与第一捕获表面,例如珠粒上的第一捕获寡核苷酸互补的序列,并且指导多核苷酸上的第二末端延伸部分具有与第二捕获表面,例如珠粒上的第二捕获寡核苷酸互补的序列。它的一种配置方法如图44中所描述。在图44中,crRNA包含用于捕获珠粒、柱子或表面上的靶分子的3'DNA延伸部分(图44的序列d)并且tracrRNA包含5'DNA延伸部分(图44的序列a·c)。通过称为立足点置换的现象可以实现靶从第一捕获表面,例如珠粒的释放。
首先通过捕获携带与第一末端延伸部分互补的第一捕获寡核苷酸的珠粒,将靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物与非靶多核苷酸分离。洗掉非靶多核苷酸。靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物可以通过立足点置换,通过加入竞争寡核苷酸而从珠粒洗脱,所述竞争寡核苷酸与指导多核苷酸上的第一末端延伸部分竞争与珠粒的结合。在此实施例中,第一捕获寡核苷酸比第一末端延伸部分长并且包含第一序列和第二序列,其中第一序列与第一末端延伸部分中的序列互补,并且第一和第二序列均与竞争寡核苷酸的序列互补。通常,第一序列的长度为5至40,例如10至30或15至25个核苷酸,例如20个核苷酸,并且第二序列的长度为5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。竞争寡核苷酸的长度可以为10至80,例如20至60或30至50个核苷酸,例如40个核苷酸。第一捕获寡核苷酸的长度可以是10至80,例如20至60或30至50个核苷酸,例如40个核苷酸。捕获寡核苷酸可以具有与竞争寡核苷酸相同的长度,或者捕获寡核苷酸可以比竞争寡核苷酸长或短,条件是捕获寡核苷酸和竞争寡核苷酸具有在第一和第二序列上互补的序列。在此实施例中,第一末端延伸部分包含末端部分,其位于5'端延伸部分的5'端或3'端延伸部分的3'端,其具有与第一捕获寡核苷酸中的序列不互补的序列,和具有与第一捕获寡核苷酸中的第一序列互补的序列的部分。第一末端延伸部分的末端部分的长度通常可以是2至10个核苷酸,例如3、4、5或6个核苷酸。与第一捕获寡核苷酸互补的第一末端延伸部分的部分的长度通常可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。
在靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物的洗脱后,复合物通过指导多核苷酸上的第二末端延伸部分与第二‘递送’珠粒结合。第二‘递送’珠粒包含与第二末端延伸部分互补的第二捕获寡核苷酸。第二捕获寡核苷酸的长度可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸,或长度是10至80,例如20至60或30至50个核苷酸,例如40个核苷酸。第二末端延伸部分的长度可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。第二捕获寡核苷酸可以具有与第二末端延伸部分相同的长度,或第二捕获寡核苷酸可以比末端延伸部分长或短,条件是第二捕获寡核苷酸和第二末端延伸部分具有在5至40,例如10至30或15至25个核苷酸,例如20个核苷酸的长度上互补的序列。第二末端延伸部分具有与第一捕获核苷酸、第一末端延伸部分或竞争寡核苷酸杂交的序列。第二捕获寡核苷酸还具有与第一捕获核苷酸、第一末端延伸部分或竞争寡核苷酸杂交的序列。
因此,在指导多核苷酸包含第一末端延伸部分和第二末端延伸部分的情况下,所述方法可以包含在步骤(b)之前:
(i)使样品与结合有第一捕获寡核苷酸的表面接触,所述第一捕获寡核苷酸包含与第一末端延伸部分互补的序列,使得指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物与表面结合;
(ii)使与表面结合的指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物与竞争寡核苷酸接触,使得指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物从表面释放;
(iii)使指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物与结合有第二捕获寡核苷酸的珠粒接触,所述第二捕获寡核苷酸包含与第二末端延伸部分互补的序列,使得指导多核苷酸/多核苷酸指导的效应蛋白/靶多核苷酸复合物与珠粒结合;并且任选地
(iv)将珠粒递送到跨膜孔。
在本发明的不同实施例中,可能:(i)没有热或化学胁迫、用以去除过量的未结合和/或非靶结合的多核苷酸指导的效应蛋白的纯化或立足点纯化;(ii)只有热或化学胁迫;(iii)只有用以去除过量的未结合的和/或非靶结合的多核苷酸指导的效应蛋白的纯化;(iv)只有立足点纯化;(v)存在热或化学胁迫以及用以去除过量的未结合的和/或非靶结合的多核苷酸指导的效应蛋白的纯化;(vi)存在热或化学胁迫和立足点纯化;(vii)存在用以去除过量的未结合的和/或非靶结合的多核苷酸指导的效应蛋白的纯化和立足点纯化;或(viii)存在热或化学胁迫、用以去除过量的未结合的和/或非靶结合的多核苷酸指导的效应蛋白的纯化和立足点纯化。
可以使用与靶多核苷酸/指导多核苷酸/多核苷酸指导的效应蛋白复合物结合的珠粒将复合物递送至孔。例如,珠粒可以是磁性的,并且与珠粒结合的靶多核苷酸可以通过施加置于流通池下方的磁场而被吸入包含孔的流通池的孔中,或者可以通过重力使其沉降。可以通过使系链,例如与衔接子末端杂交的寡核苷酸-胆固醇系链,流过珠粒来引发测序,所述系链将珠粒拴系到膜上。或者,可以在加入珠粒-靶多核苷酸缀合物之前将系链引入膜中。例如,在加入珠粒-靶多核苷酸之前,通过使操作缓冲液和系链流过流通池,可以将与衔接子末端杂交的寡核苷酸-胆固醇系链整合到流通池中的膜中。在这种情况下,当将珠粒-靶多核苷酸加入到流通池中时,当它们遇到通过胆固醇锚定在膜中的寡核苷酸时,它们被拴系到膜上。
在一些实施例中,靶多核苷酸可以适用于纳米孔测序。例如,在所述方法的步骤(a)之前,样品中的所有多核苷酸可以具有加入到一端或两端的测序衔接子。在加入测序衔接子之前,可以将样品中的多核苷酸片段化。或者,在步骤(a)之后,靶多核苷酸可以具有加入到一端或两端的测序衔接子。在此实施例中,可以在靶多核苷酸与非靶多核苷酸分离之前或之后加入测序衔接子。测序衔接子通常包含能够沿着多核苷酸移动的多核苷酸结合蛋白。当在步骤(a)之后加入测序衔接子时,多核苷酸指导的效应蛋白/指导多核苷酸复合物保持与靶多核苷酸结合。在衔接子结合后,在一些实施例中,通常在衔接子加入之前已将靶多核苷酸与非靶多核苷酸分离,多核苷酸指导的效应蛋白/指导多核苷酸复合物可以被能够沿着负载在衔接子上的多核苷酸移动的多核苷酸结合蛋白置换。能够沿着多核苷酸移动的多核苷酸结合蛋白对多核苷酸指导的效应蛋白/指导多核苷酸复合物的置换可以通过加入多核苷酸结合蛋白沿着多核苷酸移动所需的一种或多种辅因子来控制。
靶多核苷酸可以适用于纳米孔测序,通过将衔接子连接到其游离末端中的任一个或两个,同时通过指导多核苷酸/多核苷酸指导的效应蛋白与表面,例如柱子或珠粒结合。末端可以加dA尾以促进衔接子结合。
靶多核苷酸
多核苷酸可以是核酸,例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与一条DNA链杂交的一条RNA链。多核苷酸可以是本领域中已知的任何合成核酸,如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其它合成聚合物。PNA主链由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元构成。GNA主链由通过磷酸二酯键连接的重复二醇单元构成。TNA主链由通过磷酸二酯键连接在一起的重复苏糖构成。LNA由如上文所论述的具有额外的连接核糖部分中的2'氧和4'碳的桥的核糖核苷酸形成。
多核苷酸优选是DNA、RNA或DNA或RNA杂交体,最优选是DNA。靶多核苷酸包含与指导多核苷酸和多核苷酸指导的效应蛋白结合的双链区。靶多肽可以是双链的。靶多肽可以包含单链区和具有其它结构的区域,例如发夹环、三链体和/或四链体。DNA/RNA杂交体可以在同一条链上包含DNA和RNA。优选地,DNA/RNA杂交体包含与RNA链杂交的一条DNA链。
靶多核苷酸可以是任何长度。例如,多核苷酸的长度可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸或核苷酸对。靶多核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对,长度是5000个或更多个核苷酸或核苷酸对,或100000个或更多个核苷酸或核苷酸对。靶多核苷酸可以是寡核苷酸。寡核苷酸是短核苷酸聚合物,其通常具有50个或更少核苷酸,如40个或更少、30个或更少、20个或更少、10个或更少或5个或更少核苷酸。靶寡核苷酸的长度优选是约15至约30个核苷酸,例如长度是约20至约25个核苷酸。例如,寡核苷酸的长度可以是约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。
靶多核苷酸可以是与疾病和/或微生物相关的多核苷酸。
所述方法可以检测多个,例如2至50个、3至40个、4至30个、5至25个、6至15个或8至10个靶多核苷酸。靶多核苷酸可以是一组多核苷酸。例如,所述组可以与特定表型相关联。所述组可以与特定类型的细胞相关联。例如,所述组可以指示细菌细胞。所述组可以指示病毒、真菌、细菌、分枝杆菌或寄生虫。
靶多核苷酸可以是一组两个或更多个多核苷酸,所述多核苷酸是或包含与特定疾病或病状相关的生物标志物。生物标志物可用于诊断或预测疾病或病状。合适的生物标志物组是本领域中已知的,例如如以下各者中所述:Edwards,A.V.G.等人(2008)《分子与细胞蛋白质组学》(Mol.Cell.Proteomics)7,第1824-1837页;Jacquet,S.等人(2009),《分子与细胞蛋白质组学》8,第2687-2699页;Anderson N.L.等人(2010)《临床化学》(Clin.Chem.)56,177-185。所述疾病或病状优选是癌症;心脏病,包括冠心病和心血管疾病;或传染病,例如结核病或脓毒症。
靶寡核苷酸或多核苷酸优选是微小RNA(或miRNA)或小干扰RNA(siRNA)。两个或更多个靶多核苷酸的组可以是两个或更多个miRNA的组。适用于本发明的miRNA是本领域中众所周知的。例如,合适的miRNA存储在公开可用的数据库中(Jiang Q.,Wang Y.,Hao Y.,Juan L.,Teng M.,Zhang X.,Li M.,Wang G.,Liu Y.,(2009)miR2Disease:一个关于人类疾病中微小RNA失调的手动策划数据库。《核酸研究》(Nucleic Acids Res.))。
多核苷酸指导的效应蛋白
多核苷酸指导的效应蛋白可以是与指导多核苷酸结合并且与跟指导多核苷酸结合的多核苷酸结合的任何蛋白质。作为非限制性实例,多核苷酸指导的效应蛋白可以包含靶多核苷酸识别结构域和至少一个核酸酶结构域。识别结构域结合指导多核苷酸(例如RNA)和靶多核苷酸(例如DNA)。多核苷酸指导的效应蛋白可以含有一个核酸酶结构域,其切割双链多核苷酸的一条或两条链,或可以含有两个核酸酶结构域,其中第一核酸酶结构域定位成用于裂解靶多核苷酸的一条链并且第二核酸酶结构域定位成用于裂解靶多核苷酸的互补链。核酸酶结构域可以是活性的或非活性的。例如,核酸酶结构域或两个核酸酶结构域中的一个或两个可以通过突变灭活。
指导多核苷酸可以是指导RNA、指导DNA或含有DNA和RNA的指导物。指导多核苷酸优选是指导RNA。因此,多核苷酸指导的效应蛋白优选是RNA指导的效应蛋白。
RNA指导的效应蛋白可以是与指导RNA结合的任何蛋白质。RNA指导的效应蛋白通常与不是与靶多核苷酸结合的指导RNA区域的指导RNA区域结合。例如,当指导RNA包含crRNA和tracrRNA时,RNA指导的效应蛋白通常与tracrRNA结合,并且crRNA通常与靶多核苷酸结合。RNA指导的效应蛋白优选还与靶多核苷酸结合。与靶多核苷酸结合的指导RNA区域也可以与RNA指导的效应蛋白结合。RNA指导的效应蛋白通常与靶多核苷酸的双链区结合。与RNA指导的效应蛋白结合的靶多核苷酸区域通常位于与指导RNA杂交的序列附近。指导RNA和RNA指导的效应蛋白通常形成复合物,然后所述复合物在由指导RNA的序列确定的位点处与靶多核苷酸结合。
RNA指导的效应蛋白可以结合与指导RNA结合的序列的上游或下游。例如,RNA指导的效应蛋白可以与位于与指导RNA结合的序列旁边的DNA中的原型间隔区相邻基序(protospacer adjacent motif,PAM)结合。PAM是短(小于10,通常为2至6个碱基对)序列,例如5'-NGG-3'(其中N是任何碱基)、5'-NGA-3'、5'-YG-3'(其中Y是嘧啶)、5'TTN-3'或5'-YTN-3'。不同的RNA指导的效应蛋白与不同的PAM结合。RNA指导的效应蛋白可以与不包含PAM的靶多核苷酸结合,特别是当靶是RNA或DNA/RNA杂交体时。
RNA指导的效应蛋白通常是核酸酶,例如RNA指导的核酸内切酶。RNA指导的效应蛋白通常是Cas蛋白。RNA指导的效应蛋白可以是Cas、Csn2、Cpf1、Csf1、Cmr5、Csm2、Csy1、Cse1或C2c2。Cas蛋白可以是Cas3、Cas4、Cas8a、Cas8b、Cas8c、Cas9、Cas10或Cas10d。优选地,Cas蛋白是Cas9。当靶多核苷酸包含双链DNA区域时,优选使用Cas、Csn2、Cpf1、Csf1、Cmr5、Csm2、Csy1或Cse1。当靶多核苷酸包含双链RNA区域时,优选使用C2c2。
DNA指导的效应蛋白,例如来自RecA家族的蛋白质,可用于靶向DNA。可以使用的来自RecA家族的蛋白质的实例是RecA、RadA和Rad51。可以禁用RNA指导的核酸内切酶的核酸酶活性。RNA指导的核酸内切酶的一个或多个催化核酸酶位点可以被灭活。例如,当RNA指导的核酸内切酶包含两个催化核酸酶位点时,可以灭活一个或两个催化位点。通常,催化位点中的一个将切割与其特异性结合的多核苷酸的一条链,并且另一个催化位点将切割多核苷酸的相反链。因此,RNA指导的核酸内切酶可以切割靶多核苷酸的双链区的两条链、一条链,或两条链均不切割。
作为非限制性实例,多核苷酸指导的效应蛋白可以是Cas9。Cas9具有二瓣叶(bi-lobed)多结构域蛋白质结构,其包含靶识别和核酸酶瓣叶。识别瓣叶结合指导RNA和DNA。核酸酶瓣叶含有HNH和RuvC核酸酶结构域,其定位成用于裂解靶DNA的互补链和非互补链。Cas9的结构详细描述于Nishimasu,H.等人,(2014)与指导RNA和靶DNA复合的Cas9的晶体结构(Crystal Structure of Cas9 in Complex with Guide RNA and Target DNA).《细胞》(Cell)156,935-949中。Cas9的相关PDB参考是5F9R(与预先准备好进行靶DNA裂解的单指导的RNA和双链DNA复合的具有催化活性的化脓性链球菌CRISPR-Cas9的晶体结构)。
与野生型Cas9相比,所述Cas9可以是‘特异性增强型’Cas9,其显示降低的脱靶结合。这样的‘特异性增强型’Cas9的实例是化脓性链球菌Cas9D10A/H840A/K848A/K1003A/R1060A。ONLP12296是化脓性链球菌Cas9D10A/H840A/K848A/K1003A/R1060A的氨基酸序列,其具有带TEV可切割接头的C端Twin-Strep标签。
RNA指导的核酸内切酶的催化位点可以通过突变灭活。突变可以是取代、插入或缺失突变。例如,可以在催化位点发生一个或多个,例如2、3、4、5或6个氨基酸的取代或插入或缺失。突变优选是取代插入,更优选是在催化位点处的单个氨基酸取代。本领域的技术人员将能够容易地鉴定RNA指导的核酸内切酶的催化位点和使它们灭活的突变。例如,当RNA指导的核酸内切酶是Cas9时,一个催化位点可以通过D10处的突变而被灭活,并且另一个通过H640处的突变而被灭活。
灭活(‘死的’)多核苷酸指导的效应蛋白不切割靶多核苷酸并且因此不显示方向性偏差。切割靶多核苷酸的活性(‘活的’)多核苷酸指导的效应蛋白可以保持仅与切割位点的两个末端中的一个结合并且因此可以显示一些方向性偏差。
多核苷酸指导的效应蛋白通常保持与靶多核苷酸长时间结合。在不存在跨膜孔和跨膜电位的情况下,多核苷酸指导的效应蛋白优选保持与靶多核苷酸结合至少约1至至少约10,例如约2至约8小时或约4至约6小时。多核苷酸指导的效应蛋白可以通过在外加电位下与跨膜孔相互作用而从靶多核苷酸移位。
在一个实施例中,多核苷酸指导的效应蛋白可以在移位时在短时间内将靶多肽保持在跨膜孔中。这产生可检测信号,其可以被视为通过孔的电流迹线中的影子带,但也可以通过其它手段检测,例如通过光学测量或隧穿(tunneling)。
多核苷酸指导的效应蛋白可以具有沿着多核苷酸移动并减慢多核苷酸的能力。例如,RNA指导的效应蛋白可以用作滑动分子刹车。在此实施例中,RNA指导的效应蛋白可被用作马达蛋白(motor protein),以控制靶多核苷酸或指导RNA通过跨膜孔的移动。
指导多核苷酸
指导多核苷酸包含能够与靶多核苷酸杂交并且还能够与多核苷酸指导的效应蛋白结合的序列。指导多核苷酸可以具有使其能够与靶多核苷酸和多核苷酸指导的效应蛋白结合的任何结构。
指导多核苷酸通常与靶多核苷酸中约20个核苷酸的序列杂交。与指导RNA结合的序列可以是约10至约40,例如约15至约30,优选约18至约25,例如19、20、21、22、23或24个核苷酸。指导多核苷酸通常与靶多核苷酸的双链区的一条链互补。指导多核苷酸包含约10至约40,例如约15至约30,优选约18至约25,例如19、20、21、22、23或24个核苷酸的核苷酸序列,其与靶多核苷酸的序列或靶多核苷酸中的序列互补。互补程度优选是精确的。
指导RNA可以与靶多核苷酸中位于PAM的5'的区域互补。当靶多核苷酸包含DNA时,这是优选的,特别是在RNA效应蛋白是Cas9或Cpf1的情况下。指导RNA可以与靶多核苷酸中侧翼为鸟嘌呤的区域互补。当靶多核苷酸包含RNA时,这是优选的,特别是在RNA效应蛋白是C2c2的情况下。
指导RNA可以具有任何能够使其与靶多核苷酸和RNA指导的效应蛋白结合的结构。指导RNA可以包含与靶多核苷酸中的序列结合的crRNA和tracrRNA。tracrRNA通常与RNA指导的效应蛋白结合。指导RNA的典型结构是本领域中已知的。例如,crRNA通常是单链RNA,并且tracrRNA通常具有双链区,其中一条链连接至crRNA的3'端,以及在不是连接至crRNA的链的3'端形成发夹环的部分。crRNA和tracrRNA可以在体外作为单片sgRNA转录。
指导RNA可以包含其它组分,例如额外的RNA碱基或DNA碱基或其它核碱基(nucleobase)。指导RNA中的RNA和DNA碱基可以是天然碱基或修饰后的碱基。可以使用指导DNA代替指导RNA,并使用DNA指导的效应蛋白代替RNA指导的效应蛋白。当靶多核苷酸是RNA时,可以优选使用指导DNA和DNA指导的效应蛋白。
指导多核苷酸可被特异性地修饰以用于本发明的方法。本发明提供了指导多核苷酸,特别是指导RNA,其包含(i)衔接子序列,任选地包括前导序列或(ii)能够与膜偶联的锚。
本发明的指导多核苷酸可以是本文中所论述的任何与(i)衔接子和/或(ii)能够与膜偶联的锚连接的指导多核苷酸。
(i)锚或(ii)衔接子可以存在于tracrRNA的5'端、tracrRNA的3'端、crRNA的3'端、或内部,例如,其中tracrRNA和crRNA被包含在sgRNA中。有关实例,参看图2至4和25。(i)锚或(ii)衔接子可以加入到crRNA的5'端,例如通过化学基团或间隔区。(i)锚或(ii)衔接子可以通过化学基团或间隔区加入到指导多核苷酸中。(i)锚或(ii)衔接子可以连接到指导多核苷酸的5'或3'端,例如通过任何合适的方式连接到tracrRNA的5'或3'端或crRNA的5'或3'端,所述方式例如连接,通过化学基团,例如硫醇、点击基团、生物素等,或通过DNA、RNA、PNA、BNA、LNA、TNA间隔区。当间隔区是多核苷酸时,间隔区的长度可以是1至30,例如2至20、3至15、4至10,例如5、6、7、8或9个核苷酸。
锚可以连接至与指导多核苷酸中的末端延伸部分或内环序列互补的寡核苷酸(锚寡核苷酸)。tracrRNA的5'端、tracrRNA的3'端、crRNA的3'端或crRNA的5'端可以具有长度为例如5至40,例如10至30或15至25个核苷酸,例如20个核苷酸的末端延伸部分。锚寡核苷酸可以具有与末端延伸部分相同的长度,或锚寡核苷酸可以比末端延伸部分长或短,条件是锚寡核苷酸和末端延伸部分具有在5至40,例如10至30或15至25个核苷酸,例如20个核苷酸的长度上互补的序列。锚寡核苷酸的长度可以是例如5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。内环序列可以具有上面指定的任何长度。
可以合成方式修饰指导多核苷酸。crRNA和tracrRNA的5'和3'端均可以被修饰。参见Lee等人,(2017)以合成方式修饰的指导RNA和供体DNA是CRISPR-Cas9工程化的通用平台(Synthetically modified guide RNA and donor DNA are a versatile platform forCRISPR-Cas9engineering).eLIFE;6:e25312,以引用的方式并入本文中。合成修饰可以包含将修饰后的或人工的碱基掺入指导RNA(或指导DNA),包括DNA、RNA、PNA、LNA、BNA、DNA间隔区、RNA间隔区以及无碱基间隔区,例如Sp18。或者,修饰可以包含用化学部分修饰,所述化学部分在结构上与核苷酸碱基无关,例如平面疏水分子、化学标签、荧光分子、适体序列、胺、叠氮化物、炔烃、硫醇、点击基团、生物素。
本发明的指导多核苷酸可以具有能够沿着与其连接的多核苷酸移动的多核苷酸结合蛋白。多核苷酸结合蛋白可以靠近指导RNA链的一端结合,通常靠近5'端。与多核苷酸结合蛋白结合的末端通常通过加入衔接子,优选包含前导序列的衔接子来修饰。当指导RNA包含前导序列时,多核苷酸结合蛋白通常与前导序列结合。
当指导RNA包含crRNA时,多核苷酸结合蛋白可以定位成使得其能够沿着crRNA移动。这种指导RNA可用于crRNA易位通过跨膜孔以检测复合物的存在或不存在的方法中。
指导多核苷酸可能特别适合于实现在表面,例如珠粒或柱子上捕获靶多核苷酸。这允许与指导多核苷酸/多核苷酸指导的效应蛋白复合物结合的靶多核苷酸被捕获并与样品中的非靶多核苷酸分离,然后可以洗掉非靶多核苷酸。指导多核苷酸可以包含在3'或5'端的末端延伸部分,其具有与捕获寡核苷酸的序列互补的序列,所述捕获寡核苷酸与表面结合,例如与珠粒或柱子结合。例如,捕获寡核苷酸可以通过亲和标签与表面结合。可以使用任何合适的亲和标签。一个实例是生物素-链霉亲和素亲和标签。捕获寡核苷酸的长度可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸,或长度是10至80,例如20至60或30至50个核苷酸,例如40个核苷酸。末端延伸部分的长度可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。捕获寡核苷酸可以具有与末端延伸部分相同的长度,或者捕获寡核苷酸可以比末端延伸部分长或短,条件是捕获寡核苷酸和末端延伸部分具有在5至40,例如10至30或15至25个核苷酸,例如20个核苷酸的长度上互补的序列。
指导多核苷酸可以包含第一结合部分和第二结合部分。第一结合部分和第二结合部分可以均是指导多核苷酸上的末端延伸部分,或能够与寡核苷酸结合的其它单链多核苷酸序列。指导多核苷酸上的第一末端延伸部分可以具有与第一捕获表面,例如珠粒上的第一捕获寡核苷酸互补的序列,并且指导多核苷酸上的第二末端延伸部分可以具有与第二捕获表面,例如珠粒上的第二捕获寡核苷酸互补的序列。它的一种配置方法如图44中所描述。在图44中,crRNA包含用于捕获珠粒、柱子或表面上的靶分子的3'DNA延伸部分(图44的序列d)并且tracrRNA包含5'DNA延伸部分(图44的序列a·c)。在一个实施例中,第一末端延伸部分包含末端部分,其位于5'端延伸部分的5'端或3'端延伸部分的3'端,其具有与第一捕获寡核苷酸中的序列不互补的序列,和具有与第一捕获寡核苷酸中的第一序列互补的序列的部分。第一末端延伸部分的末端部分的长度通常可以是2至10个核苷酸,例如3、4、5或6个核苷酸。与第一捕获寡核苷酸互补的第一末端延伸部分的部分的长度通常可以是5至40,例如10至30或15至25个核苷酸,例如20个核苷酸。
第二末端延伸部分具有与第一捕获核苷酸、第一末端延伸部分或竞争寡核苷酸杂交的序列。第二捕获寡核苷酸还具有与第一捕获核苷酸、第一末端延伸部分或竞争寡核苷酸杂交的序列。末端延伸部分可以连接到指导多核苷酸的5'或3'端,例如连接到tracrRNA的5'或3'端或crRNA的5'或3'端。末端延伸部分可以通过任何合适的方式与指导多核苷酸连接。末端延伸部分例如可以通过化学基团或间隔区加入,例如连接,通过化学基团,例如硫醇、点击基团、生物素等,或通过DNA、RNA、PNA、BNA、LNA、TNA间隔区。当间隔区是多核苷酸时,间隔区的长度可以是1至30,例如2至20、3至15、4至10,例如5、6、7、8或9个核苷酸。末端延伸部分可以存在于tracrRNA的5'端、tracrRNA的3'端、crRNA的3'端、crRNA的5'端,或可以被加入指导RNA内部的序列取代,例如,其中tracrRNA和crRNA被包含在sgRNA中。有关实例,参看图41和44。当使用内部序列来执行本文关于末端延伸部分所述的功能时,其通常存在于指导多核苷酸内的环结构中,或者可以按其它方式与捕获寡核苷酸杂交。
本发明还提供了与如本文中所定义的多核苷酸指导的效应蛋白结合的本发明的指导多核苷酸。
本发明还提供了一组指导多核苷酸,优选本发明的指导RNA,和一组指导多核苷酸/多核苷酸指导的效应蛋白复合物,优选本发明的指导RNA/RNA指导的效应蛋白复合物。这组指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以被包含在试剂盒中。
本发明的组可以包含本发明的指导多核苷酸和一组指导多核苷酸和多核苷酸指导的效应蛋白,它们可以一起用于本发明的方法中。指导多核苷酸和多核苷酸指导的效应蛋白可以存在于指导多核苷酸/多核苷酸指导的效应蛋白复合物中。
一组可以包含:包含能够与膜偶联的锚的第一指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物,和包含衔接子的第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物,其中第一指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物和第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物与同一个靶多核苷酸中的不同序列结合。所述组可以包含多个,例如2至50、3至40、4至30、5至25、6至15或8至10个此类第一和第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。当所述组包含多个第一和第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物时,每个第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物通常包含不同的衔接子。这使得所述组能够区分样品中存在的不同靶多核苷酸。
一组可以包含与靶多核苷酸的第一序列结合的第一指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物和与靶多核苷酸的第二序列结合的第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。可以在所述组中包括与同一个靶多核苷酸的其它序列结合的其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。第一、第二和其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以包含相同或不同的衔接子,或可以不包含衔接子。第一指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以包含膜锚,并且第二和/或其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以包含相同的衔接子或优选不同的衔接子。
当所述组被用于通过检测信号来检测与靶多核苷酸结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物与跨膜孔相互作用的效应的方法中时,不需要在指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物中包括衔接子,所述信号例如通过孔的电流的改变,由指导多核苷酸/多核苷酸指导的效应蛋白复合物使靶多核苷酸停滞通过孔或由结合的指导多核苷酸/多核苷酸指导的效应蛋白复合物通过孔引起。
第一、第二和/或其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以与靶多核苷酸的相同部分结合,但是各自可以对靶多核苷酸的所述部分中存在的不同多态性具有特异性。在此实施例中,对不同多态性具有特异性的每个指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物可以包含不同的衔接子和/或前导序列。本发明的方法可以区分不同的衔接子和/或不同的前导序列,并且因此可以用于鉴定多态性。
一组可以包含与第一靶多核苷酸结合的第一指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物和与第二靶多核苷酸结合的第二指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。可以在所述组中包括与其它靶多核苷酸结合的其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。例如,第一、第二和/或其它指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白可以各自与锚和/或其它结合部分偶联。这样的组可用于将样品中的多个感兴趣的多核苷酸递送至跨膜孔以进行进一步表征,例如通过测序。例如,这样的组将选择多个感兴趣的多核苷酸并将它们系拴到包含跨膜孔的膜上,使得样品中的其它多核苷酸可以在施加膜电位之前被洗掉。
样品
样品可以是任何合适的样品。样品通常是已知含有或怀疑含有至少一种靶多核苷酸的样品。所述方法可用于选择靶多核苷酸以递送至跨膜孔。样品的其它组分可以洗掉,例如,可以将它们从包含跨膜孔的细胞中冲洗出来。此类其它组分包括以下一种或多种:可折叠或未折叠的蛋白质、肽、碳水化合物、聚合物,例如非靶多核苷酸,以及细胞碎片。
样品可以是生物样品。可以对从任何生物体或微生物中获得或提取的样品体外执行本发明。生物体或微生物通常是古细菌、原核或真核生物,并且通常属于以下五界之一:植物界、动物界、真菌界、原核生物界和原生生物界。可以对从任何病毒中获得或提取的样品体外执行本发明。
样品优选是流体样品。样品通常包含体液。体液可以从人或动物获得。人或动物可能患有疾病,疑似患有疾病或有患病风险。样品可以是尿液、淋巴液、唾液、粘液、精液或羊水,但优选是全血、血浆或血清。通常,样品来源于人,但其或者可以来自另一种哺乳动物,如来自商业养殖动物,如马、牛、羊或猪,或者可以是宠物,如猫或狗。
或者,来源于植物的样品通常从经济作物获得,如谷物、豆科植物、水果或蔬菜,例如小麦、大麦、燕麦、油菜、玉米、大豆、水稻、香蕉、苹果、蕃茄、马铃薯、葡萄、烟草、菜豆、小扁豆、甘蔗、可可、棉花、茶叶或咖啡。
样品可以是非生物样品。非生物样品优选是流体样品。非生物样品的实例包括手术液;水,如饮用水、海水或河水;以及实验室测试用试剂。
可以在分析前处理样品,例如通过离心或通过膜,所述膜过滤掉不需要的分子或细胞,如红血细胞。样品可以在获取之后立即测量。通常还可以在分析之前,优选在低于-70℃下储存样品。
样品可以包含基因组DNA。基因组DNA可以被片段化,或者所述方法的步骤(a)可以进一步包含使基因组DNA片段化。可以通过任何合适的方法使DNA片段化。例如,DNA的片段化方法是本领域中已知的。此类方法可以使用转座酶,例如MuA转座酶。
样品可以包含T细胞DNA。
样品可以包含非靶多核苷酸。在一个实施例中,靶多核苷酸和非靶多核苷酸可以衍生自相同的基因或基因组。
监测复合物与孔的相互作用
所述方法包含监测由指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸形成的复合物与跨膜孔的相互作用引起的效应的存在或不存在,以确定复合物的存在或不存在。所述效应指示与跨膜孔相互作用的由指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸形成的复合物。所述效应可能是由与复合物的一种组分——靶多核苷酸或指导多核苷酸连接的衔接子易位通过孔引起的。所述效应指示与复合物的一种组分——靶多核苷酸或指导多核苷酸连接的衔接子通过孔的易位。
可以使用电学测量和/或光学测量来监测效应。在这种情况下,效应是所测量到的电量或光学量的改变。
电学测量可以是电流测量、阻抗测量、隧穿测量或场效应晶体管(field effecttransistor,FET)测量。
效应可以是通过跨膜孔的离子流的改变,导致电流改变、电阻改变或光学性质改变。效应可以是穿过跨膜孔的电子隧穿。效应可以是由于复合物与跨膜孔的相互作用引起的电位改变,其中在FET测量中使用局部电位传感器监测效应。
衔接子
衔接子可以包含至少一个单链多核苷酸或非多核苷酸区域。单链多核苷酸是有用的,因为它们可以通过孔并且可以容易地分成至少两个不同的区域,这些区域以不同的方式影响流过孔的电流。例如,具有不同序列的多核苷酸的不同区域通常以不同方式影响流过孔的电流。至少两个不同区域优选对应于至少两段不同核苷酸。例如,单链多核苷酸区域可以包含一段腺嘌呤核苷酸和一段无碱基核苷酸。每一段将以不同的方式影响流过孔的电流。
或者,至少两段不同的核苷酸是不同的多核苷酸条形码。多核苷酸条形码是本领域中众所周知的(Kozarewa,I.等人,(2011),《分子生物学方法》(Methods Mol.Biol.)733,第279-298页)。条形码是多核苷酸的特定序列,其以特定且已知的方式影响流过孔的电流。
衔接子可以包含不能通过孔的双链多核苷酸。这种双链区的存在可以延迟衔接子移动通过孔,因为所述区域中的一条链在电位的影响下从探针上剥离。这种延迟产生可检测信号,例如流过孔的电流的变化。双链区的长度可以在不同的多核苷酸衔接子之间变化,使得延迟的长度可以用于鉴定与孔相互作用的衔接子。双链区的典型长度是约4至约50个碱基对,例如5、6、7、8、9或10至20、30或40个碱基对,或4与50之间的任何整数。
在衔接子中包括一个或多个双链多核苷酸区域增加了可以从指导多核苷酸组中的衔接子群体获得的可能信号的数量,并且因此增加了可以使用本发明的方法分析的靶多核苷酸的数量。
双链多核苷酸区域例如可以用于在孔的桶或通道中保持衔接子的特定区域,例如指示指导多核苷酸的条形码,从而可以根据本发明读取它。
衔接子可以包含核苷酸序列。核苷酸通常含有核碱基、糖以及至少一个磷酸基。核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,以及更具体地,腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶以及胞嘧啶。糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。磷酸可以连接在核苷酸的5'或3'侧上。
核苷酸包括但不限于:单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、5-甲基胞苷单磷酸、5-甲基胞苷二磷酸、5-甲基胞苷三磷酸、5-羟甲基胞苷单磷酸、5-羟甲基胞苷二磷酸、5-羟甲基胞苷三磷酸、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)、5-甲基-2'-脱氧胞苷单磷酸、5-甲基-2'-脱氧胞苷二磷酸、5-甲基-2'-脱氧胞苷三磷酸、5-羟甲基-2'-脱氧胞苷单磷酸、5-羟甲基-2'-脱氧胞苷二磷酸以及5-羟甲基-2'-脱氧胞苷三磷酸。衔接子中的核苷酸优选地选自AMP、TMP、GMP、UMP、dAMP、dTMP、dGMP或dCMP。核苷酸可以是无碱基的(例如,缺乏核碱基)。核苷酸可以含有额外修饰。具体来说,合适的修饰后核苷酸包括但不限于2'氨基嘧啶(如2'-氨基胞苷和2'-氨基尿苷)、2'-羟基嘌呤(如2'-氟嘧啶(如2'-氟胞苷和2'-氟尿苷)、羟基嘧啶(如5'-α-P-硼烷尿苷)、2'-O-甲基核苷酸(如2'-O-甲基腺苷、2'-O-甲基鸟苷、2'-O-甲基胞苷和2'-O-甲基尿苷)、4'-硫代嘧啶(如4'-硫代尿苷和4'-硫代胞苷),并且核苷酸具有对核碱基的修饰(如5-戊炔基-2'-脱氧尿苷、5-(3-氨丙基)-尿苷以及1,6-二氨基己基-N-5-氨基甲酰基甲基尿苷)。
衔接子可以包含一种或多种不同的核苷酸物种。例如,T k聚体(T k-mer)(例如中心核苷酸是基于胸腺嘧啶的k聚体,如TTA、GTC、GTG和CTA)通常具有最低的电流状态。可以将修饰版本的T核苷酸引入修饰后的多核苷酸中以进一步降低电流状态,并且从而增加当衔接子移动通过孔时所见的总电流范围。
G k聚体(例如中心核苷酸是基于鸟嘌呤的k聚体,例如TGA、GGC、TGT和CGA)往往会受到k聚体中其它核苷酸的强烈影响,并且因此对修饰后的多核苷酸中的G核苷酸进行修饰可以帮助它们具有更独立的当前位置。
包括同一核苷酸物种的三个拷贝而不是三个不同物种可以促进表征,因为那样仅需要定位修饰后的多核苷酸中的例如3-核苷酸k聚体。但是,这种修饰确实减少了衔接子提供的信息。
在衔接子中包括一个或多个具有无碱基核苷酸的核苷酸物种导致特征性电流尖峰。这允许清楚地突出衔接子中一个或多个核苷酸物种的位置。
衔接子中的核苷酸物种可以包含化学原子或基团,例如丙炔基、硫基、氧代基、甲基、羟甲基、甲酰基、羧基、羰基、苯甲基、炔丙基或炔丙胺基。化学基团或原子可以是或可以包含荧光分子、生物素、地高辛(digoxigenin)、二硝基苯酚(DNP)、光不稳定基团、炔烃、DBCO、叠氮化物、游离氨基、氧化还原染料、汞原子或硒原子。
衔接子可以包含含有卤素原子的核苷酸物种。卤素原子可以连接到不同核苷酸物种,例如核碱基和/或糖上的任何位置。卤素原子优选地是氟(F)、氯(Cl)、溴(Br)或碘(I)。卤素原子最优选是F或I。
衔接子可以包含能够形成四链体的序列。四链体是由四条序列链形成的三维结构。四链体不能易位或移动通过孔的最窄部分。四链体比孔的最窄部分宽。例如,野生型α-HL孔的最窄部分的直径是1.3nm。α-HL-NN孔的最窄部分的直径是1.5nm。如果在本发明中使用这些孔中的任何一个,那么四链体优选具有大于1.3nm,例如大于1.5nm,例如大于2nm、大于3nm或大于5nm的宽度。本领域的普通技术人员将能够针对所使用的孔设计出合适尺寸的四链体。当四链体形成序列未形成四链体时,其能够易位或移动通过孔的最窄部分。四链体形成序列优选是多核苷酸。它可以是本文论述的任何多核苷酸。
四链体可以是任何类型的四链体。四链体可以是分子间四链体,如双分子四链体或四分子四链体。四链体形成序列优选能够形成分子内四链体。
四链体形成序列优选能够形成G-四链体(也称为G-四分体或G4-DNA)。这些是富含鸟嘌呤并且能够形成四链结构的多核苷酸序列。四个鸟嘌呤碱基可以通过Hoogsteen氢键结合,形成被称为鸟嘌呤四分体的方形平面结构,并且两个或更多个鸟嘌呤四分体可以堆叠在彼此之上以形成G-四链体。通过存在阳离子,尤其是钾,进一步稳定四链体结构,所述阳离子位于每对四分体之间的中心通道中。形成G-四链体是本领域中众所周知的(Marathias和Bolton,《核酸研究》(Nucleic Acids Research),2000;28(9):1969-1977;Kankia和Marky,《美国化学会志》2001,123,10799-10804;以及Marusic等人,《核酸研究》,2012,1-11)。
四链体形成序列更优选地包含序列Ga,接着是Nb,接着是Gc,接着是Nd,接着是Ge,接着是Nf,接着是Gg,其中G是包含鸟嘌呤的核苷酸,其中a、c、e和g独立地选自1、2、3、4和5,其中N是任何核苷酸,并且其中b、d和f是2到50。a、c、e和g的值可以相同。G优选是单磷酸鸟苷(GMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧鸟苷(dGMP)、单磷酸双脱氧鸟苷、N2-甲基-GMP、N2-甲基-cGMP、N2-甲基-dGMP、N2-甲基-双脱氧鸟苷单磷酸、N2-甲基-06-甲基-GMP、N2-甲基-06-甲基-cGMP、N2-甲基-06-甲基-dGMP、N2-甲基-06-甲基-双脱氧鸟苷单磷酸、2'-O-甲基-GMP、2'-O-甲基-cGMP、2'-O-甲基-dGMP、2'-O-甲基-双脱氧鸟苷单磷酸、6-硫代-GMP、6-硫代-cGMP、6-硫代-dGMP、6-硫代-双脱氧鸟苷单磷酸、7-甲基-GMP、7-甲基-cGMP、7-甲基-dGMP、7-甲基-双脱氧鸟苷单磷酸、7-脱氮-GMP、7-脱氮-cGMP、7-脱氮-dGMP、7-脱氮-双脱氧鸟苷单磷酸、8-氧代-GMP、8-氧代-cGMP、8-氧代-dGMP或8-氧代-双脱氧鸟苷单磷酸。
WO 2014/072703中公开了合适的四链体形成序列。
由于四链体不能易位通过孔的最窄部分,因此它起到制动作用并且保持衔接子或指导多核苷酸的另一个,通常是单链区域在孔的最窄部分中。然后,衔接子区域产生独特的电流,其鉴定指导多核苷酸并因此鉴定复合物中的靶多核苷酸。片刻之后,四链体通常会在所施加的电位和解折叠的影响下变得不稳定。因此,四链体的制动作用通常是暂时的。解折叠的四链体形成序列在外加电位的影响下通常易位或移动通过孔。
偶联
可以使用锚将包含指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸的复合物与膜偶联。可以使用一个或多个锚来将复合物与膜偶联。通常,所述一个或多个锚存在于复合物的同一种组分上,例如存在于靶多核苷酸、指导多核苷酸或多核苷酸指导的效应蛋白上。或者,所述一个或多个锚可以存在于不同组分上,例如存在于指导多核苷酸和多核苷酸指导的效应蛋白上。
如果膜是如三嵌段共聚物膜等两亲层,那么所述一个或多个锚优选包含可以被插入膜中的多肽锚和/或疏水性锚。疏水性锚优选是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸盐或生育酚。在优选实施例中,所述一个或多个锚不是孔。
膜组分,如两亲分子、共聚物或脂质,可以经过化学修饰或功能化而形成所述一个或多个锚。下文更详细地论述了合适的化学修饰和使膜组分功能化的合适方式的实例。可以对任何比例的膜组分进行功能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
一个或多个锚优选包含接头。一个或多个锚可以包含一个或多个,例如2、3、4个或更多个接头。可以使用一个接头将指导多核苷酸和多核苷酸指导的效应蛋白两者与膜偶联。
优选的接头包括但不限于聚合物,如多核苷酸、聚乙二醇(PEG)、多糖以及多肽。这些接头可以是线性的、支化的或环状的。例如,接头可以是环状多核苷酸。靶多核苷酸或指导多核苷酸可以与环状多核苷酸接头上夫人互补序列杂交。
一个或多个锚或一个或多个接头可以包含能被切割或分解的组分,如限制位点或光不稳定基团。
功能化的接头和其与分子的偶联方式是本领域中已知的。例如,用马来酰亚胺基团功能化的接头将与蛋白质中的半胱氨酸残基反应并且与之连接。
可以使用“锁和钥”布置来避免多核苷酸的交联。每个接头只有一端可以一起反应形成更长的接头,并且接头的另一端各自分别与多核苷酸或膜反应。这种接头描述于WO2010/086602中。
在本发明的测序方法中使用接头是优选的。如果多核苷酸是在它不会在与孔相互作用时解偶联的意义上被永久性地直接与膜偶联的,那么因为该轮测序由于膜与孔之间的距离而不能持续到多核苷酸的末端,所以一些序列数据将丢失。如果使用接头,那么多核苷酸可以得到完全处理。
偶联可以是永久性的或稳定的。换句话说,偶联可以是这样的,复合物在与孔相互作用时保持与膜偶联。
偶联可以是暂时的。换句话说,偶联可以是这样的,复合物在与孔相互作用时与膜解偶联。对于复合物检测和多核苷酸测序,暂时性质的偶联是优选的。如果永久性或稳定接头直接连接到多核苷酸的5'或3'端并且接头比膜与跨膜孔的通道之间的距离短,那么因为该轮测序不能持续到多核苷酸的末端,所以一些序列数据将丢失。如果偶联是暂时的,那么当偶联的末端随机摆脱膜时,多核苷酸就可以得到完全处理。形成永久性/稳定或暂时连接的化学基团在下文更详细地论述。使用胆固醇或脂肪酰基链,可以将复合物暂时与两亲层或三嵌段共聚物膜偶联。可以使用长度为6至30个碳原子的任何脂肪酰基链,如十六烷酸。
在优选实施例中,锚将复合物与两亲层,如三嵌段共聚物膜或脂质双层偶联。先前已用各种不同的栓系策略进行了核酸与合成脂质双层的偶联。这些总结在下文表1中。
表1
合成多核苷酸和/或接头可以在合成反应中使用修饰后的亚磷酰胺来功能化,所述修饰后的亚磷酰胺容易与直接加入的合适的锚定基团相容,所述锚定基团例如胆固醇、生育酚、棕榈酸盐、硫醇、脂质以及生物素基团。这些不同的连接化学为多核苷酸的连接提供了一套选择。每个不同的修饰基团以稍微不同的方式偶联多核苷酸,并且偶联未必总是永久性的,因此赋予多核苷酸在膜上不同的停留时间。
多核苷酸与接头或与功能化膜的偶联还可以通过多种其它手段来实现,条件是可以向多核苷酸中加入互补反应性基团或锚定基团。先前已经报道了向多核苷酸的任一末端加入反应性基团。可以使用T4多核苷酸激酶和ATPγS向ssDNA或dsDNA的5'加入硫醇基(Grant,G.P.和P.Z.Qin(2007).“一种用于在核酸的5'端处连接氮氧化物自旋标记的简易方法(A facile method for attaching nitroxide spin labels at the 5'terminus ofnucleic acids).”《核酸研究》35(10):e77)。可以使用T4多核苷酸激酶和γ-[2-叠氮基乙基]-ATP或γ-[6-叠氮基己基]-ATP向ssDNA或dsDNA的5'-磷酸中加入叠氮基团。使用硫醇或点击化学,含有硫醇、碘乙酰胺OPSS或马来酰亚胺基团(对硫醇具有反应性)或二苯并环辛炔(DIBO)或炔基(对叠氮化物具有反应性)中的任一个的系链可以共价连接至多核苷酸。可以使用末端转移酶增加更多样的化学基团选择,如生物素、硫醇和荧光团,从而将修饰后的寡核苷酸掺入ssDNA的3'(Kumar,A.,P.Tchen等人(1988).“末端脱氧核苷酸转移酶对合成寡核苷酸探针的非放射性标记(Nonradioactive labeling of syntheticoligonucleotide probes with terminal deoxynucleotidyl transferase).”《分析生物化学》(Anal Biochem)169(2):376-82)。链霉亲和素/生物素和/或链霉亲和素/脱硫生物素偶联可以用于任何其它多核苷酸。也有可能,可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸盐)的末端转移酶,直接向多核苷酸加入锚。
一个或多个锚可以通过杂交将复合物与膜偶联。杂交可以是在一个或多个锚与靶多核苷酸或指导多核苷酸之间、在一个或多个锚内或在一个或多个锚与膜之间。如上文所论述的,在一个或多个锚中的杂交允许以暂时方式进行偶联。举例来说,接头可以包含两个或更多个杂交在一起的多核苷酸,如3、4或5个多核苷酸。一个或多个锚可以与靶多核苷酸或指导多核苷酸杂交。一个或多个锚可以直接与靶多核苷酸或指导多核苷酸杂交、直接与连接至多核苷酸的Y衔接子和/或前导序列杂交或直接与连接至多核苷酸的发夹环衔接子杂交。或者,一个或多个锚可以与一个或多个,如2或3个中间多核苷酸(或“夹板”)杂交,所述中间多核苷酸与多核苷酸、与连接至多核苷酸的Y衔接子和/或前导序列或与连接至多核苷酸的发夹环衔接子杂交。
一个或多个锚可以包含单链或双链多核苷酸。锚的一部分可以连接到单链或双链多核苷酸分析物上。已经报道过使用T4 RNA连接酶I来连接ssDNA的短片(Troutt,A.B.,M.G.McHeyzer-Williams等人(1992).“连接锚定PCR:一种具有单侧特异性的简单扩增技术(Ligation-anchored PCR:a simple amplification technique with single-sidedspecificity).”《美国国家科学院院刊》(Proc Natl Acad Sci U S A)89(20):9823-5)。或者,可以将单链或双链多核苷酸连接到双链多核苷酸上,并且然后通过热或化学变性分离两条链。对于双链多核苷酸,可以将一片单链多核苷酸加入到双链体的一端或两端,或将双链多核苷酸加入到一端或两端。为了将单链多核苷酸加入到双链多核苷酸中,可以使用T4RNA连接酶I来实现与单链多核苷酸的其它区域的连接。为了将双链多核苷酸加入到双链多核苷酸中,那么连接可以是“平端的”,其中互补的3'dA/dT尾分别在多核苷酸和所加入的多核苷酸上(这是许多样品制备应用的常规做法,用以防止多联体或二聚体形成),或使用通过限制性消化多核苷酸和连接相容的衔接子生成的“粘端”。接着,当双链体解链时,如果使用单链多核苷酸进行连接,那么每条单链将具有5'或3'端修饰;或者如果使用双链多核苷酸进行连接,那么每条单链将在5'端、3'端或两端具有修饰。
如果多核苷酸是合成链,那么可以在化学合成多核苷酸期间掺入一个或多个锚。例如,可以使用连接有反应性基团的引物来合成多核苷酸。
腺苷酸化多核苷酸是连接反应中的中间物,其中单磷酸腺苷连接至多核苷酸的5'-磷酸。可获得各种用于生成这种中间物的试剂盒,例如来自NEB的5'DNA腺苷酰化试剂盒。通过用反应中的ATP取代修饰后的三磷酸核苷酸,就可以向多核苷酸的5'加入反应性基团(如硫醇、胺、生物素、叠氮化物等)。还可以使用具有适当修饰的核苷酸(例如胆固醇或棕榈酸盐)的5'DNA腺苷酰化试剂盒将锚直接加入到多核苷酸中。
用于扩增基因组DNA区段的常见技术是使用聚合酶链式反应(PCR)。这里,使用两个合成的寡核苷酸引物,可以生成同一个DNA区段的许多拷贝,其中对于每个拷贝,双链体中每条链的5'将是合成的多核苷酸。可以通过采用聚合酶将单个或多个核苷酸加入到单链或双链DNA的3'端。可以使用的聚合酶的实例包括但不限于末端转移酶、Klenow以及大肠杆菌Poly(A)聚合酶。通过用反应中的ATP取代修饰后的三磷酸核苷酸,就可以将锚,如胆固醇、硫醇、胺、叠氮化物、生物素或脂质,掺入到双链多核苷酸中。因此,所扩增多核苷酸的每个拷贝都将含有锚。
理想地,多核苷酸与膜偶联而不必使多核苷酸功能化。这可以通过将一个或多个锚,如多核苷酸结合蛋白或化学基团,与膜偶联并且使所述一个或多个锚与多核苷酸相互作用或通过使膜功能化来实现。所述一个或多个锚可以通过本文所述的任何方法与膜偶联。具体来说,所述一个或多个锚可以包含一个或多个接头,如马来酰亚胺功能化的接头。在这个实施例中,多核苷酸通常是RNA、DNA、PNA、TNA或LNA,并且可以是双链的或单链的。此实施例特别适合基因组DNA多核苷酸。
所述一个或多个锚可以包含与单链或双链多核苷酸、多核苷酸内的特定核苷酸序列或多核苷酸内的修饰后的核苷酸的模式或多核苷酸上存在的任何其它配体偶联、结合或相互作用的任何基团。
适合用于锚中的结合蛋白包括但不限于:大肠杆菌单链结合蛋白、P5单链结合蛋白、T4gp32单链结合蛋白、TOPO V dsDNA结合区、人类组蛋白蛋白质、大肠杆菌HU DNA结合蛋白,以及其它古细菌的、原核生物的或真核生物的单链或双链多核苷酸(或核酸)结合蛋白,包括下文所列的那些。
特异性核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶(topoisomerase)或复制起始因子识别的序列。修饰后的核苷酸的模式可以是甲基化模式或损伤模式。
所述一个或多个锚可以包含与多核苷酸偶联、结合、插入或相互作用的任何基团。基团可以通过静电、氢键或范德华(Van der Waals)相互作用而插入多核苷酸中或与多核苷酸相互作用。此类基团包括赖氨酸单体、聚赖氨酸(其将与ssDNA或dsDNA相互作用)、溴化乙锭(其插入dsDNA中)、通用碱基或通用核苷酸(其可以与任何多核苷酸杂交)以及锇络合物(其可以与甲基化碱基反应)。因此,多核苷酸可以使用连接至膜的一个或多个通用核苷酸而与膜偶联。每个通用核苷酸可以使用一个或多个接头与膜偶联。通用核苷酸优选包含以下核碱基中的一种:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(C6芳环)。通用核苷酸更优选包含以下核苷中的一种:2'-脱氧肌苷、肌苷、7-脱氮-2'-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-O'-甲基肌苷、4-硝基吲哚2'-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2'-脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2'-脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2'-脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2'-脱氧核苷、硝基咪唑核苷、4-硝基吡唑2'-脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2'-脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2'-脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2'-脱氧核苷、4-氨基苯并咪唑核苷、5-硝基吲唑2'-脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2'-脱氧核苷、4-氨基苯并咪唑核苷、苯基C-核苷、苯基C-2'-脱氧核糖基核苷、2'-脱氧烟云杯伞素、2'-脱氧异鸟苷、K-2'-脱氧核苷、P-2'-脱氧核糖以及吡咯烷。通用核苷酸更优选包含2'-脱氧肌苷。通用核苷酸更优选是IMP或dIMP。通用核苷酸最优选是dPMP(2'-脱氧-P-核苷单磷酸)或dKMP(N6-甲氧基-2,6-二氨基嘌呤单磷酸)。
一个或多个锚可以通过Hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向Hoogsteen氢键(其中一个核碱基相对于另一个核碱基旋转180°)与多核苷酸偶联(或结合)。例如,一个或多个锚可以包含与多核苷酸形成Hoogsteen氢键或反向Hoogsteen氢键的一个或多个核苷酸、一个或多个寡核苷酸或一个或多个多核苷酸。这些类型的氢键允许第三多核苷酸链缠绕双链螺旋体并形成三链体。一个或多个锚可以通过与双链双链体形成三链体而与双链多核苷酸偶联(或结合)。
在此实施例中,可以使至少1%、至少10%、至少25%、至少50%或100%的膜组分功能化。
当一个或多个锚包含蛋白质时,所述一个或多个锚可能能够直接锚定至膜而无需进一步功能化,例如当其已具有与膜相容的外部疏水区时。此类蛋白质的实例包括但不限于跨膜蛋白、膜内蛋白以及膜蛋白。或者,蛋白质可以表达成具有与膜相容的基因融合的疏水区。这种疏水性蛋白质区域是本领域中已知的。
一个或多个锚优选在递送到膜之前与多核苷酸混合,但是一个或多个锚可以与膜接触并且随后与多核苷酸接触。
另一方面,可以使用上文所述的方法使多核苷酸功能化,使得其可以被特异性结合基团识别。具体来说,多核苷酸可以用配体进行功能化,所述配体例如生物素(用于与链霉亲和素结合)、直链淀粉(用于与麦芽糖结合蛋白或融合蛋白结合)、Ni-NTA(用于与聚组氨酸或聚组氨酸标记的蛋白质结合)或肽(如抗原)。
根据一个优选实施例,一个或多个锚可以用于在多核苷酸与前导序列连接时将多核苷酸与膜偶联,所述前导序列优选旋入孔中。优选地,多核苷酸与优先旋入孔中的前导序列连接(attach)(如连接(ligate))。这种前导序列可以包含同聚多核苷酸或无碱基区。前导序列通常设计成直接与一个或多个锚杂交,或通过一个或多个中间多核苷酸(或夹板)与所述一个或多个锚杂交。在这些情况下,一个或多个锚通常包含与前导序列中的序列或一个或多个中间多核苷酸(或夹板)中的序列互补的多核苷酸序列。在这些情况下,一个或多个夹板通常包含与前导序列中的序列互补的多核苷酸序列。
上文论述的任何用于使多核苷酸与例如两亲层的膜偶联的方法当然可以应用于其它多核苷酸和膜组合。在一些实施例中,氨基酸、肽、多肽或蛋白质与例如三嵌段共聚物层或脂质双层的两亲层偶联。可以获得各种用于这类多核苷酸的化学连接的方法。化学连接中使用的分子的实例是EDC(1-乙基-3-[3-二甲氨基丙基]碳化二亚胺盐酸盐)。还可以使用市售试剂盒(Thermo Pierce,产品号22980)向多核苷酸的5'中加入反应性基团。合适的方法包括但不限于使用组氨酸残基和Ni-NTA的暂时亲和力连接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳健的共价连接。
前导序列
前导序列通常包含聚合物。聚合物优选是带负电的。聚合物优选是多核苷酸,如DNA或RNA;修饰后的多核苷酸(如无碱基DNA);PNA;LNA;聚乙二醇(PEG)或多肽。前导序列优选包含多核苷酸,并且更优选包含单链多核苷酸。单链前导序列最优选包含DNA的单链,如poly dT区段。前导序列优选包含一个或多个间隔区。
前导序列可以是任何长度,但其长度通常是10至150个核苷酸,例如长度是20至150个核苷酸。前导序列的长度通常取决于所述方法中使用的跨膜孔。
前导序列优先旋入跨膜孔中,并且从而促进多核苷酸通过孔的移动。前导序列还可以用于将多核苷酸连接到如本文所论述的一个或多个锚。
测序衔接子-Y衔接子
用于纳米孔测序的Y-衔接子是本领域中已知的。Y衔接子通常包含(a)双链区和(b)单链区或在另一端不互补的区域。如果Y衔接子包含单链区,那么它可以被描述为具有突出端。Y衔接子中非互补区的存在赋予了衔接子Y形状,因为两条链通常不彼此杂交,不同于双链部分。Y衔接子可以包含一个或多个锚。
Y衔接子优选包含优选旋入孔中的前导序列。
可以使用本领域中已知的任何方法将Y衔接子和/或发夹环连接到多核苷酸。可以使用连接酶,如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶以及9°N DNA连接酶,来连接衔接子中的一个或两个。或者,可以使用下文论述的方法,向多核苷酸中加入衔接子。
在优选的实施例中,所述方法包含对样品中的双链多核苷酸加以修饰,使得其在一端包含Y衔接子并且在另一端包含发夹环。可以使用任何修饰方式。所述方法优选包含对双链靶多核苷酸加以修饰。
通过使多核苷酸与MuA转座酶和一群双链MuA底物接触,可以向双链多核苷酸提供衔接子,例如Y衔接子和发夹环,或锚。转座酶将双链多核苷酸片段化并且将MuA底物连接到片段的一端或两端。这样就产生了多个修饰后的双链多核苷酸,其包含衔接子或锚。然后可以使用本发明的方法研究修饰后的双链多核苷酸。
这些基于MuA的方法公开于WO 2015/022544和WO 2016/059363中。还在WO2015/150786中详细论述了这些方法。
双链多核苷酸可以在一端具有Y衔接子,并且在另一端具有发夹环。例如,群体中的一部分MuA底物可以是包含前导序列的Y衔接子,并且群体中一定比例的底物可以是发夹环。
Y衔接子可以包含捕获序列、亲和标签或孔系链,其在与衔接子连接的双链区展开时显露。捕获序列或标签用于在双链多核苷酸随着双链多核苷酸的第一链通过孔而展开时防止双链多核苷酸的第二链扩散远离纳米孔,其中孔与系链结合或用寡核苷酸标记,所述寡核苷酸包含与Y衔接子中的捕获序列互补的序列,Y-衔接子上的标签的亲和配偶体。
发夹环
用于纳米孔测序的发夹环衔接子是本领域中已知的。发夹环可以设置在双链多核苷酸的一端,所述方法优选还包含在多核苷酸的一端为多核苷酸提供发夹环。多核苷酸的两条链可以在一端与发夹环连接。
可以使用本领域中已知的方法来设计合适的发夹环。发夹环可以是任何长度。发夹环的长度通常是110个或更少核苷酸,如100个或更少核苷酸、90个或更少核苷酸、80个或更少核苷酸、70个或更少核苷酸、60个或更少核苷酸、50个或更少核苷酸、40个或更少核苷酸、30个或更少核苷酸、20个或更少核苷酸、或10个或更少核苷酸。发夹环的长度优选是约1至110个、2至100个、5至80个或6至50个核苷酸。如果环与衔接子的有差别的选择能力有关,那么如50至110个核苷酸的较长长度的发夹环是优选的。类似地,如果环与如下文所论述的可选择结合无关,那么如1至5个核苷酸的较短长度的发夹环是优选的。
发夹环可以设置在多核苷酸的任一端,例如5'或3'端。可以使用本领域中已知的任何方法将发夹环连接到多核苷酸。可以使用连接酶,如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶以及9°N DNA连接酶,来连接发夹环。
在通过测序来表征多核苷酸的方法中,可以使用本领域中已知的任何方法分离通过发夹环连接的双链多核苷酸的两条链。然后使多核苷酸的两条链一次一条链地移动通过孔。以此方式连接和询问双链构建体上的两条链提高了表征的效率和准确度。
发夹环优选包含可选择结合部分。这允许纯化或分离多核苷酸。可选择结合部分是可以基于其结合性质而选择的部分。因此,可选择结合部分优选是特异性结合于表面的部分。如果可选择结合部分以比在本发明中使用的任何其它部分高出许多的程度结合于表面,那么其与表面特异性地结合。在优选的实施例中,所述部分结合于不与本发明中使用的其它部分结合的表面。
合适的选择性结合部分是本领域中已知的。优选的选择性结合部分包括但不限于:生物素;多核苷酸序列;抗体;抗体片段,如Fab和ScSv;抗原;多核苷酸结合蛋白;聚组氨酸尾部以及GST标签。最优选的选择性结合部分是生物素和可选择多核苷酸序列。生物素与涂有抗生物素蛋白的表面特异性地结合。可选择多核苷酸序列与涂有同源序列的表面特异性地结合(例如杂交)。或者,可选择多核苷酸序列与涂有多核苷酸结合蛋白的表面特异性地结合。
发夹环和/或可选择结合部分可以包含可以被切割、刻缺口、裂解或水解的区域。可以设计这种区域以允许多核苷酸在纯化或分离后从其所结合的表面去除。合适的区域是本领域中已知的。合适的区域包括但不限于RNA区域、包含脱硫生物素和链霉亲和素、二硫键的区域以及可光裂解区。
珠粒
可以使用珠粒,通常是微粒,来将复合物递送到跨膜孔。这描述于WO 2016/059375中。可以在本发明的方法中使用任何数量的微粒。例如,所述方法可以使用单个微粒或2、3、4、5、6、7、8、9、10、20、30、50、100、1,000、5,000、10,000、100,000、500,000或1,000,000个或更多个微粒。如果使用两个或更多个微粒,那么微粒可以是相同的。或者,可以使用不同微粒的混合物。
每个微粒可以连接有一个复合物。或者,每个微粒可以连接有两个或更多个复合物,如3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、20个或更多个、30个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、5,000个或更多个、10,000个或更多个、100,000个或更多个、1000,000个或更多个、或5000,000个或更多个多核苷酸。微粒可以基本上或完全被复合物涂布或覆盖。微粒可以将复合物连接在其基本上整个或整个表面上。微粒可以通过衔接子与复合物连接。衔接子可以是Y-衔接子或发夹衔接子。
复合物可以通过其任何一种或多种组分与微粒连接。指导多核苷酸、多核苷酸指导的效应蛋白和/或靶多核苷酸可以与微粒连接。例如,多核苷酸指导的效应蛋白、指导多核苷酸和/或靶多核苷酸可以连接有将与微粒表面结合的结合部分。
合适的结合部分的实例包括:蛋白质结合标签(strep标签、flag标签等)、缀合连接(多核苷酸、聚合物、生物素、肽)以及氨基酸(半胱氨酸、Faz等)。
复合物可以与两个或更多个微粒连接。
微粒是微观颗粒,其大小通常以微米(μm)为单位测量。微粒也可以被称为微球或微珠。微粒可以是纳米颗粒。纳米颗粒是微观颗粒,其大小通常以纳米(nm)为单位测量。
微粒通常具有约0.001μm至约500μm的粒径。例如,纳米颗粒可以具有约0.01μm至约200μm或约0.1μm至约100μm的粒径。更常见的是,微粒具有约0.5μm至约100μm,或例如约1μm至约50μm的粒径。微粒可以具有约1nm至约1000nm,如约10nm至约500nm、约20nm至约200nm或约30nm至约100nm的粒径。
微粒可以是球形或非球形。球形微粒可以被称为微球。非球形颗粒可以是例如板状、针状、不规则状或管状。如本文所使用的术语“粒径”意指颗粒的直径,如果颗粒是球形的,或者如果颗粒是非球形的,那么意指基于体积的粒径。基于体积的粒径是与所论述的非球形颗粒具有相同体积的球体的直径。
如果在所述方法中使用两个或更多个微粒,那么微粒的平均粒径可以是上文所论述的任何大小,如约0.5μm至约500μm。两个或更多个微粒的群体优选具有10%或更小,如5%或更小或2%或更小的变异系数(标准差与平均值的比率)。
可以使用任何方法来确定微粒的大小。合适的方法包括但不限于流式细胞术(参见例如Chandler等人,《血栓形成与止血杂志》(J Thromb Haemost.)2011年6月;9(6):1216-24)。
微粒可以由任何材料形成。微粒优选由陶瓷、玻璃、二氧化硅、聚合物或金属形成。聚合物可以是天然聚合物,如聚羟基烷酸酯、葡聚糖、聚丙交酯、琼脂糖、纤维素、淀粉或壳聚糖,或合成聚合物,如聚氨酯、聚苯乙烯、聚(氯乙烯)、硅烷或甲基丙烯酸酯。合适的微粒是本领域中已知的并且是可商购的。陶瓷和玻璃微球可购自二氧化硅和聚合物微粒可购自EPRUI Nanoparticles&Microspheres Co.Ltd.。微粒也可以购自PolysciencesInc.、Bangs Laboratories Inc.和Life Technologies。
微粒可以是固体。微粒可以是中空的。微粒可以由聚合物纤维形成。
微粒可以衍生自用于提取和分离多核苷酸的试剂盒。
微粒表面可以与分析物相互作用并连接分析物。所述表面自然地就可以与如多核苷酸的分析物相互作用,不需要功能化。通常将微粒表面功能化以促进分析物的连接。合适的功能化是本领域中已知的。例如,微粒表面可以用以下各者进行功能化:多组氨酸标签(六组氨酸标签、6xHis-标签、His6标签或)、Ni-NTA、链霉亲和素、生物素、寡核苷酸、多核苷酸(如DNA、RNA、PNA、GNA、TNA或LNA)、羧基、季胺基、硫醇基、叠氮基、炔基、DIBO、脂质、FLAG-标签(FLAG八肽)、多核苷酸结合蛋白(包括下文所论述的任何一种)、肽、蛋白质、抗体或抗体片段。微粒还可以用下文所论述的任何接头或基团进行功能化。
微粒可以用与多核苷酸特异性地结合的分子或基团进行功能化。在这种情况下,将要与微粒连接并被递送到跨膜孔的多核苷酸可以被称为靶多核苷酸。这允许微粒从含有其它多核苷酸的样品中选择或捕获靶多核苷酸。如果分子或基团优先地或以高亲和力与靶多核苷酸结合,但不与其它多核苷酸或不同的多核苷酸结合或仅以低亲和力结合,那么所述分子或基团与靶多核苷酸特异性地结合。如果分子或基团以1×10-6M或更小、更优选地1×10-7M或更小、5×10-8M或更小、更优选地1×10-8M或更小或更优选地5×10-9M或更小的Kd结合,那么所述分子或基团优先地或以高亲和力结合。如果分子或基团以1×10-6M或更大、更优选地1×10-5M或更大、更优选地1×10-4M或更大、更优选地1×10-3M或更大、甚至更优选地1×10-2M或更大的Kd结合,那么所述分子或基团以低亲和力结合。
优选地,所述分子或基团与靶多核苷酸结合的亲和力是其对其它多核苷酸的亲和力的至少10倍,如至少50倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少1000倍或至少10,000倍。亲和力可以使用已知的结合分析来测量,如利用荧光和放射性同位素的结合分析。竞争性结合分析也是本领域中已知的。肽或蛋白质与多核苷酸之间的结合强度可以使用纳米孔力光谱来测量,如Hornblower等人,《自然·方法》(NatureMethods.)4:315-317.(2007)中所述。
微粒可以用与靶多核苷酸或指导多核苷酸特异性地杂交或包含与靶多核苷酸或指导多核苷酸的一部分或区域互补的部分或区域的寡核苷酸或多核苷酸进行功能化。这允许微粒从含有其它多核苷酸的样品中选择或捕获靶多核苷酸或指导多核苷酸。
当寡核苷酸或多核苷酸优先地或以高亲和力与靶多核苷酸杂交,但与其它多核苷酸基本上不杂交、不杂交或仅以低亲和力杂交时,所述寡核苷酸或多核苷酸与靶多核苷酸特异性地杂交。如果寡核苷酸或多核苷酸与靶多核苷酸以解链温度(Tm)比其对其它序列的Tm高出至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃或至少10℃杂交,那么所述寡核苷酸或多核苷酸会发生特异性杂交。更优选地,寡核苷酸或多核苷酸与靶多核苷酸以Tm比其对其它核酸的Tm高出至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃杂交。优选地,寡核苷酸或多核苷酸与靶多核苷酸以Tm比其对与靶多核苷酸相差一个或多个核苷酸,如1个、2个、3个、4个或5个或更多个核苷酸的序列的Tm高出至少2℃,如至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或至少40℃杂交。寡核苷酸或多核苷酸通常与靶多核苷酸以至少90℃,如至少92℃或至少95℃的Tm杂交。Tm可以使用已知技术通过实验测量,包括使用DNA微阵列,或者可以使用公众可获得的Tm计算器计算,如可通过互联网获得的计算器。
允许杂交的条件是本领域中众所周知的(例如,Sambrook等人,2001,《分子克隆:实验室手册》(Molecular Cloning:a laboratory manual),第3版,冷泉港实验室出版社(Cold Spring Harbour Laboratory Press);和《当代分子生物学实验手册》(CurrentProtocols in Molecular Biology),第2章,Ausubel等人编,格林出版与威利交叉科学出版社(Greene Publishing and Wiley-lnterscience),纽约(1995))。杂交可以在低严格度条件下进行,例如在37℃下在30%至35%甲酰胺、1M NaCl以及1%十二烷基硫酸钠(SDS)的缓冲溶液存在下,然后在50℃下在1X(0.1650M Na+)至2X(0.33M Na+)标准柠檬酸钠(SSC)中洗涤20次。杂交可以在中等严格度条件下进行,例如在37℃下在40%至45%甲酰胺、1MNaCl以及1% SDS的缓冲溶液存在下,然后在55℃下在0.5X(0.0825M Na+)至1X(0.1650MNa+)SSC中洗涤。杂交可以在高严格度条件下进行,例如在37℃下在50%甲酰胺、1M NaCl以及1% SDS的缓冲溶液存在下,然后在60℃下在0.1X(0.0165M Na+)SSC中洗涤。
寡核苷酸或多核苷酸可以包含与靶多核苷酸或指导多核苷酸的部分或区域基本上互补的部分或区域。因此,与靶多核苷酸或指导多核苷酸中的部分或区域相比,寡核苷酸或多核苷酸的区域或部分可以在5、10、15、20、21、22、30、40或50个核苷酸的区域内具有1、2、3、4、5、6、7、8、9、10个或更多个错配。
区域的一部分通常为50个核苷酸或更少,如40个核苷酸或更少、30个核苷酸或更少、20个核苷酸或更少、10个核苷酸或更少或5个核苷酸或更少。
微粒优选是顺磁性或磁性的。微粒优选包含顺磁性或超顺磁性材料或顺磁性或超顺磁性金属,如铁。可以使用任何合适的磁性微粒。例如,可以使用可购自例如Clontech、Promega、Invitrogen ThermoFisher Scientific以及NEB的磁珠。在一些实施例中,微粒包含连接着有机基团的磁性颗粒,有机基团例如金属螯合基团,如次氮基三乙酸(NTA)。有机组分可以例如包含选自以下的基团:-C(=O)O-、-C-O-C-、-C(=O)-、-NH-、-C(=O)-NH、-C(=O)-CH2-I、-S(=O)2-以及-S-。有机组分可以包含金属螯合基团,如次氮基三乙酸(NTA)。通常,如金、铁、镍或钴等金属也连接在金属螯合基团上。这种磁珠通常用于捕获His标记的蛋白质,但也适用于本发明。
微粒最优选是可购自Life Technologies的His-Tag来自IBA的MagStrep珠粒、来自NEB的链霉亲和素磁珠、来自Beckman Coulter的固相可逆固定化(SolidPhase Reversible Immobilization,SPRI)珠粒或Agencourt AMPure XP珠粒或MyOneTM链霉亲和素C1(ThermoFisher Scientific)。
根据本发明可以使用任何膜。合适的膜在本领域中是众所周知的。膜优选是两亲层或固态层。
两亲层是由两亲分子形成的层,所述两亲分子如磷脂,其具有亲水性和亲脂性两种特性。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物是本领域中已知的,并且包括例如嵌段共聚物(Gonzalez-Perez等人,《朗缪尔》,2009,25,10447-10450)。嵌段共聚物是两个或更多个单体亚单元聚合在一起以产生单个聚合物链的聚合材料。嵌段共聚物通常具有由每个单体亚单元贡献的性质。然而,嵌段共聚物可以具有由单独的亚单元形成的聚合物所不具备的独特性质。嵌段共聚物可以被工程化,使得其中一个单体亚单元在水性介质中是疏水性的(例如亲脂性的),而其它亚单元是亲水性的。在这种情况下,嵌段共聚物可以具备两亲性质,并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚单元组成),但也可以由多于两个单体亚单元构建以形成表现为两亲物的更复杂布置。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选是三嵌段共聚物膜。
古细菌双极性四醚脂质是天然存在的脂质,其被构建成使得脂质形成单层膜。这些脂质一般发现于在苛刻生物环境中存活的嗜极生物、嗜热生物、嗜盐生物和嗜酸生物中。认为其稳定性是源于最终双层的融合性质。直接了当的做法是,通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构建模拟这些生物实体的嵌段共聚物材料。这种材料可形成表现类似于脂质双层并且涵盖从囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜相对于生物脂质膜保持若干优势。因为三嵌段共聚物是合成的,所以可小心地控制准确的构建,以提供形成膜并与孔和其它蛋白质相互作用所需的正确链长度和特性。
还可以由不被归类为脂质亚材料的亚单元来构建嵌段共聚物,例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性亚区段还可以具备低蛋白质结合特性,这允许产生当暴露于原始生物样品时具有高度抗性的膜。这种头基单元还可来源于非经典的脂质头基。
与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或pH范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。
膜最优选是WO2014/064443或WO2014/064444中所公开的膜中的一种。
两亲分子可以进行化学修饰或功能化以促进复合物的偶联。
两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以是支撑式的。两亲层可以是凹入的。两亲层可以从凸起的柱子上悬挂下来,使得两亲层的周边区域(其与柱子连接)高于两亲层区域。这可以允许微粒如上文所描述的沿着膜行进、移动、滑动或滚动。
两亲膜通常天然地是可移动的,基本上以大致10-8cm s-1的脂质扩散速率充当二维液体。这意味着孔和偶联的复合物通常可以在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且用作一系列实验研究的极佳平台。例如,脂质双层可以用于通过单通道记录对膜蛋白进行体外研究。或者,脂质双层可以用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。适当的脂质双层包括但不限于平面脂质双层、支撑双层或脂质体。脂质双层优选是平面脂质双层。合适的脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484中。
用于形成脂质双层的方法是本领域中已知的。脂质双层通常通过Montal和Mueller(《美国国家科学院院刊》,1972;69:3561-3566)的方法形成,其中脂质单层携载于通过开孔的任一侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,并且然后使一滴溶剂在开孔的任一侧上的水溶液的表面上蒸发,来将脂质加入到电解质水溶液的表面。一旦有机溶剂已蒸发,那么开孔任一侧上的溶液/空气界面物理地上下移动通过开孔,直到形成双层。平面脂质双层可以穿过膜中的开孔或穿过凹槽中的开口形成。
Montal和Mueller的方法很受欢迎,因为它是一种经济有效且相对简单的形成适合于蛋白孔插入的优质脂质双层的方法。其它常见的双层形成方法包括脂质体双层的尖端浸渍、涂刷双层和膜片钳。
尖端浸渍双层形成法需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,首先通过将溶解于有机溶剂中的一滴脂质在溶液表面蒸发而在溶液/空气界面处产生脂质单层。然后通过朗缪尔-沙佛(Langmuir-Schaefer)过程形成双层,并且所述双层需要机械自动化以使开孔相对于溶液表面移动。
对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接施加至开孔,所述开孔浸没在水性测试溶液中。使用画刷或等同物将脂质溶液薄薄地铺展在孔上。溶剂的薄化导致脂质双层的形成。然而,难以从双层完全去除溶剂,并且因此通过这种方法形成的双层在电化学测量期间不太稳定并且更容易产生噪声。
膜片钳常用于生物细胞膜的研究中。通过抽吸将细胞膜夹在移液管的末端,并将膜片贴在开孔上。所述方法已经适用于通过夹持脂质体来产生脂质双层,然后脂质体破裂以留下密封在移液管开孔上的脂质双层。所述方法需要稳定的、巨大的和单层的脂质体以及在具有玻璃表面的材料中制造小开孔。
脂质体可以通过超声处理、挤出或Mozafari方法(Colas等人(2007)《微米》(Micron)38:841-847)来形成。
在一个优选的实施例中,脂质双层如WO 2009/077734中所述形成。在此方法中有利的是,脂质双层是由干燥的脂质形成的。在一个最优选的实施例中,脂质双层跨开口形成,如WO2009/077734中所描述。
脂质双层由相对的两层脂质形成。两个脂质层被布置成使得其疏水性尾基面朝彼此以形成疏水性内部。脂质的亲水性头基向外朝向双层各侧上的水环境。双层可以存在于许多脂质相中,包括但不限于液体无序相(流体层状)、液体有序相、固体有序相(层状凝胶相、交叉凝胶相)以及平面双层晶体(层状亚凝胶相、层状结晶相)。
可以使用形成脂质双层的任何脂质组合物。对脂质组合物加以选择,以便形成具有所需特性的脂质双层,所述特性例如表面电荷、支撑膜蛋白的能力、堆积密度或机械特性。脂质组合物可以包含一种或多种不同脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选含有1至10种脂质。脂质组合物可以包含天然存在的脂质和/或人工脂质。
脂质通常包含头基、界面部分和可以相同或不同的两个疏水性尾基。合适的头基包括但不限于:中性头基,如二酰基甘油酯(DG)和神经酰胺(CM);两性离子头基,如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电头基,如磷脂酰甘油(PG);磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸(PA)和心磷脂(CA);以及带正电头基,如三甲基铵-丙烷(TAP)。合适的界面部分包括但不限于天然存在的界面部分,如基于甘油或基于神经酰胺的部分。合适的疏水性尾基包括但不限于:饱和烃链,如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷酸);以及支链烃链,如植烷酰基。不饱和烃链中链的长度和双键的位置与数量可以变化。支链烃链中链的长度和支链,如甲基的位置和数量可以变化。疏水性尾基可以作为醚或酯连接于界面部分。脂质可以是分枝菌酸。
脂质还可以进行化学修饰。脂质的头基或尾基可以进行化学修饰。头基已进行化学修饰的合适脂质包括但不限于:PEG修饰的脂质,如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];功能化的PEG脂质,如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-N-[生物素基(聚乙二醇)2000];以及针对缀合修饰的脂质,如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-(生物素基)。尾基已进行化学修饰的合适脂质包括但不限于:可聚合脂质,如1,2-双(10,12-二十三碳二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,如1-软脂酰基-2-(16-氟软脂酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-D62-sn-甘油-3-磷酸胆碱;以及醚连接的脂质,如1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或功能化以促进复合物的偶联。
两亲层,例如脂质组合物,通常包含将影响层的特性的一种或多种添加剂。合适的添加剂包括但不限于:脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇和油醇;甾醇,如胆固醇、麦角固醇、羊毛甾醇、谷甾醇和豆甾醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;以及神经酰胺。
固态层可以由有机材料和无机材料形成,所述材料包括但不限于:微电子材料;绝缘材料,如Si3N4、A12O3和SiO;有机和无机聚合物,如聚酰胺;塑料,如或弹性体,如双组分加成固化的硅橡胶;以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开在WO2009/035647中。Yusko等人,《自然·纳米技术》(Nature Nanotechnology),2011;6:253-260和美国专利申请第2013/0048499号描述了在不使用微粒的情况下将蛋白质递送至固态层中的跨膜孔。本发明的方法可用于改进这些文献中公开的方法中的递送。
通常使用以下来进行所述方法:(i)包含孔的人工两亲层;(ii)包含孔的分离的天然存在的脂质双层;或(iii)插入有孔的细胞。通常使用人工两亲层,如人工三嵌段共聚物层来进行所述方法。所述层可以包含其它跨膜蛋白和/或膜内蛋白以及除孔以外的其它分子。下文论述了合适的设备和条件。通常在体外进行本发明的方法。
将复合物递送到通常包含在液体中的膜。液体使膜保持“湿润”并防止其变干。液体通常是水溶液。水溶液通常具有与水相同的密度。水溶液的密度通常是约1g/cm3。溶液的密度可以根据温度和溶液的确切组成而变化。水溶液的密度通常在约0.97与约1.03g/cm3之间。
膜通常将两个体积的水溶液隔开。膜抵挡所述体积之间的电流流动。插入膜中的跨膜孔选择性地允许离子通过膜,这可以记录为由两个体积的水溶液中的电极检测到的电信号。包含靶多核苷酸的复合物的存在可调节离子的流动,并通过观察所产生的电信号变化来检测。
阵列
膜通常是膜阵列的一部分,其中每个膜优选包含跨膜孔。因此,本发明提供了一种使用膜阵列检测靶多核苷酸的方法。
膜可以被包含在具有电隔离膜阵列的设备中,每个膜使用其自己的电极单独寻址,使得阵列等同于从测试样品平行测量的许多单独传感器。膜可以相对密集地填充,允许大量的膜用于给定体积的测试样品。在本领域中,例如在WO 2009/077734和WO2012/042226中描述了合适的膜阵列和设备。例如,WO 2009/077734公开了在微孔孔口阵列上形成的多个可单独寻址的脂质双层,每个微孔含有电极和与脂质双层接触的水性介质。
所述设备通常以‘即用’状态提供给最终用户,其中膜和跨膜孔是预先插入的。以‘即用’状态提供的典型设备包含两亲膜阵列,每个膜包含跨膜孔并且跨含有液体的孔设置。WO2014/064443公开了这样的设备和其制造方法。将待分析的测试液体施加到两亲膜的上表面。
然而,以‘即用’状态提供的设备还需要考虑另外的因素,即传感器不会变干,即液体不会通过两亲膜而从孔中损失,那样的话会导致性能损失或损坏传感器。解决传感器变干问题的一种解决方案是在两亲膜的表面上设置含缓冲液的装置,使得通过膜表面的任何蒸发最小化,并且在膜的任一侧提供的液体可以具有相同的离子强度以减少任何渗透效应。在使用中,可以从两亲膜表面去除缓冲液,并引入待分析的测试液体以接触表面。
一些应用可以使用跨膜电特性的测量,例如离子电流。为了提供这样的测量,所述设备可以进一步在每个隔室中包含相应的电极,使其与包含极性介质的体积电接触。可以进行其它类型的测量,例如光学测量,例如荧光测量和FET测量。光学测量和电学测量可以同时进行(Heron AJ等人,《美国化学会志》2009;131(5):1652-3)。
所述设备可以进一步包含公共电极。所述设备可以进一步包含连接在公共电极与每个隔室中的相应电极之间的电路,布置所述电路是为了进行电学测量。这种电学测量可以取决于在膜处或穿过膜发生的过程。
所述设备可以包含FET阵列来测量纳米孔阵列。
纳米孔是至少一个维度在纳米尺度上的孔口。纳米孔可以通过成孔蛋白产生或作为合成材料中的孔,如硅或石墨烯。或者,纳米孔可以是这些的混合物,例如,设置在合成膜中的蛋白质通道。纳米孔也可以是DNA折纸孔或玻璃毛细管。纳米孔的直径通常小于约20nm,但直径可长达约100nm。
跨膜孔是在某种程度上穿过膜的结构。它允许由外加电位驱动的水合离子流过膜或流入膜内。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不是必须得穿过膜。它的一端可以封闭。例如,孔可以是膜中的阱、间隙、通道、沟槽或狭缝,水合离子可以沿着它流动或流入其中。
本发明中可以使用任何跨膜孔。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是DNA折纸孔(Langecker等人,《科学》(Science),2012;338:932-936)。跨膜孔优选是跨膜蛋白孔。跨膜蛋白孔是多肽或多肽的集合,其允许如多核苷酸的水合离子从膜的一侧流到膜的另一侧。在本发明中,跨膜蛋白孔能够形成孔,所述孔允许由外加电位驱动的水合离子从膜的一侧流到另一侧。跨膜蛋白孔优选地允许多核苷酸从膜,如三嵌段共聚物膜的一侧流到另一侧。跨膜蛋白孔允许如DNA或RNA的多核苷酸移动通过孔。
跨膜蛋白孔可以是单体或低聚物。孔优选由几个重复亚单元组成,如至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚单元。孔优选是六聚体、七聚体、八聚体或九聚体孔。孔可以是同型低聚物或异型低聚物。
跨膜蛋白孔通常包含可以让离子流过的桶或通道。孔的亚单元通常围绕中心轴线并且为跨膜桶或通道或跨膜α-螺旋束或通道提供链。
跨膜蛋白孔的桶或通道通常包含促进与s,如核苷酸、多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选地位于桶或通道的收缩部附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸,如精氨酸、赖氨酸或组氨酸,或芳香族氨基酸,如酪氨酸或色氨酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以衍生自β-桶形孔或α-螺旋束孔。β-桶形孔包含由β-链形成的桶或通道。合适的β-桶形孔包括但不限于β-毒素,如α-溶血素、炭疽毒素和杀白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白(Msp),例如MspA、MspB、MspC或MspD、CsgG,外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A以及奈瑟氏球菌(Neisseria)自主转运蛋白脂蛋白(NalP)以及其它孔,如胞溶素(lysenin)。α-螺旋束孔包含由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,如WZA和ClyA毒素。
跨膜孔可以衍生自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Sp1以及溶血蛋白溶血毒素(fragaceatoxin)C(FraC)。跨膜蛋白孔优选衍生自CsgG,更优选衍生自大肠杆菌菌株K-12亚株MC4100的CsgG。WO 2016/034591中公开了衍生自CsgG的合适的孔。跨膜孔可以衍生自胞溶素。WO 2013/153359中公开了衍生自胞溶素的合适的孔。
野生型α-溶血素孔由7个相同的单体或亚单元形成(即,它是七聚体)。α-溶血素-NN的一个单体或亚单元的序列公开在例如WO2016/059375中。
跨膜蛋白孔优选衍生自Msp,更优选衍生自MspA。WO 2012/107778中公开了衍生自MspA的合适的孔。
可以例如通过加入组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、flag标签、SUMO标签、GST标签或MBP标签,或在多肽天然地不含信号序列的情况下通过加入这样的序列以促进其从细胞分泌,来修饰本文所述的任何蛋白质,如跨膜蛋白孔,从而帮助其鉴定或纯化。引入基因标签的替代方案是将标签化学反应到孔或构建体上的天然的或工程化的位置上。这种操作的实例是使凝胶迁移试剂与孔外部的工程化半胱氨酸反应。这已被证明是一种用于分离溶血素异型低聚物的方法(《生物化学》(Chem Biol).1997年7月;4(7):497-505)。
孔可以用显露标记来进行标记。显露标记可以是允许孔被检测到的任何合适的标记。合适的标记包括但不限于荧光分子;放射性同位素,例如125I、35S;酶;抗体;抗原;多核苷酸;以及配体,如生物素。
本文所描述的任何蛋白质,如跨膜蛋白孔,可以合成方式或通过重组手段制得。例如,可以通过体外翻译和转录(IVTT)来合成孔。孔的氨基酸序列可以经过修饰而包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成手段制造蛋白质时,可以在制造期间引入此类氨基酸。还可以在合成或重组制造后改变孔。
本文所述的任何蛋白质,如跨膜蛋白孔,可以使用本领域中已知的标准方法制造。编码孔或构建体的多核苷酸序列可以使用本领域中的标准方法衍生和复制。编码孔或构建体的多核苷酸序列可以使用本领域中的标准技术在细菌宿主细胞中表达。可以通过从重组表达载体原位表达多肽而在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法描述于Sambrook,J.和Russell,D.(2001).《分子克隆:实验室手册》,第3版.纽约冷泉港的冷泉港实验室出版社中。
可以在通过任何蛋白质液相色谱系统纯化之后或在重组表达之后,从产蛋白质生物体大规模产生孔。典型的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统以及Gilson HPLC系统。
诊断
本发明的方法可用于诊断或预测疾病或病状。所述疾病或病状优选是癌症、冠心病、心血管疾病、结核病或脓毒症。
所述疾病或病状的实例包括腹主动脉瘤、急性成淋巴细胞性白血病(acutelymphoblastic leukemia,ALL)、急性骨髓性白血病(acute myeloid leukemia,AML)、急性心肌梗塞、急性早幼粒细胞性白血病(acute promyelocytic leukemia,APL)、腺瘤、肾上腺皮质癌、酒精性肝病、阿尔茨海默病(Alzheimer's disease)、间变性甲状腺癌(anaplasticthyroid carcinoma,ATC)、焦虑症、哮喘、星形细胞瘤、特应性皮炎、孤独症谱系障碍(autism spectrum disorder,ASD)、B细胞慢性淋巴细胞性白血病、B细胞淋巴瘤、贝克氏型肌营养不良症(Becker muscular dystrophy,BMD)、膀胱癌、脑肿瘤、乳腺癌、伯基特淋巴瘤(Burkitt lymphoma)、心脏肥大、心肌病、心血管疾病、小脑神经变性、宫颈癌、胆管癌、胆脂瘤、绒膜癌、慢性淋巴细胞性白血病、慢性骨髓性白血病、慢性胰腺炎、结肠癌、结直肠癌、先天性心脏病、冠状动脉疾病、考登综合征(cowden syndrome)、皮肌炎(dermatomyositis,DM)、糖尿病性肾病、腹泻为主的肠易激综合征、弥漫性大B细胞淋巴瘤、扩张型心肌病、唐氏综合征(down syndrome,DS)、杜氏肌营养不良症(duchenne muscular dystrophy,DMD)、子宫内膜癌、子宫内膜样腺癌、子宫内膜异位症、上皮性卵巢癌、食道癌、食道鳞状细胞癌、原发性血小板增多症(essential thrombocythemia,ET)、面肩肱型肌营养不良症(facioscapulohumeral muscular dystrophy,FSHD)、滤泡性淋巴瘤(follicularlymphoma,FL)、滤泡性甲状腺癌(follicular thyroid carcinoma,FTC)、额颞叶痴呆、胃癌(gastric cancer/stomach cancer)、成胶质细胞瘤、多形性成胶质细胞瘤(glioblastomamultiforme,GBM)、神经胶质瘤、肾小球疾病、肾小球硬化、错构瘤、HBV相关肝硬化、HCV感染、头颈癌、头颈部鳞状细胞癌(head and neck squamous cell carcinoma,HNSCC)、听力损失、心脏病、心力衰竭、乙型肝炎、丙型肝炎、肝细胞癌(hepatocellular carcinoma,HCC)、肝门胆管癌、霍奇金氏淋巴瘤(Hodgkin's lymphoma)、纯合性镰状细胞病(homozygous sickle cell disease,HbSS)、亨廷顿氏病(Huntington's disease,HD)、高血压、下咽癌、包涵体肌炎(inclusion body myositis,IBM)、胰岛素瘤、肝内胆管癌(intrahepatic cholangiocarcinoma,ICC)、肾癌、肾病、喉癌、晚期失眠(睡眠疾病)、肺平滑肌瘤、白血病、肢带型肌营养不良症2A型(limb-girdle muscular dystrophies types2A,LGMD2A)、脂肪瘤、肺腺癌、肺癌、淋巴组织增生病、恶性淋巴瘤、恶性黑素瘤、恶性间皮瘤(malignant mesothelioma,MM)、套细胞淋巴瘤(mantle cell lymphoma,MCL)、成神经管细胞瘤、黑素瘤、脑膜瘤、代谢疾病、三好氏肌病(miyoshi myopathy,MM)、多发性骨髓瘤(multiple myeloma,MM)、多发性硬化、MYC重排淋巴瘤、骨髓增生异常综合征、骨髓增生症、心肌梗塞、心肌损伤、肌瘤、鼻咽癌(nasopharyngeal carcinoma,NPC)、杆状体肌病(nemaline myopathy,NM)、肾炎、成神经细胞瘤(neuroblastoma,NB)、中性粒细胞增多症、C型尼曼-皮克(Niemann-Pick type C,NPC)病、非酒精性脂肪性肝病(non-alcoholic fattyliver disease,NAFLD)、非小细胞肺癌(non-small cell lung cancer,NSCLC)、肥胖、口腔癌骨肉瘤、卵巢癌(ovarian cancer,OC)、胰腺癌、胰腺导管腺癌(pancreatic ductaladenocarcinoma,PDAC)、胰腺肿瘤、恐慌症、乳头状甲状腺癌(papillary thyroidcarcinoma,PTC)、帕金森病(Parkinson's disease)、PFV-1感染、咽部疾病、垂体腺瘤、多囊肾病、多囊肝病、真性红细胞增多症(polycythemia vera,PV)、多发性肌炎(polymyositis,PM)、原发性胆汁性肝硬化(primary biliary cirrhosis,PBC)、原发性骨髓纤维化、朊病毒病、前列腺癌、牛皮癣性关节炎、牛皮癣、肺动脉高压、复发性卵巢癌、肾细胞癌、肾透明细胞癌、视网膜色素变性(retinitis pigmentosa,RP)、成视网膜细胞瘤、横纹肌肉瘤、风湿性心脏病和心房颤动、类风湿性关节炎、肉瘤、精神分裂症、脓毒症、浆液性卵巢癌、塞扎里综合征(Sezary syndrome)、皮肤病、小细胞肺癌、脊髓小脑性共济失调、鳞状细胞癌、T细胞白血病、畸胎癌、睾丸生殖细胞肿瘤、地中海贫血、甲状腺癌、舌鳞状细胞癌、图雷特综合征(tourette'ssyndrome)、2型糖尿病、溃疡性结肠炎(ulcerative colitis,UC)、子宫平滑肌瘤(uterine leiomyoma,ULM)、葡萄膜黑素瘤、血管疾病、水疱性口炎或瓦尔登斯特伦巨球蛋白血症(Waldenstrom macroglobulinemia,WM)。
因为在使用多重方法的实施例中,可以确定两种或更多种靶多核苷酸(例如,至少5种或更多种、10种或更多种、20种或更多种或30种或更多种)的存在的不存在,所以有可能预测或诊断上面列出的疾病中的任两种或更多种(例如,3、4、5、6种或更多种)。因此,提供了用于检测和/或分析多种(例如,至少2种或更多种、至少3种或更多种、至少10种或更多种、至少20种或更多种或至少30种或更多种)靶多核苷酸的多重方法。
所述方法还可用于检测衍生自微生物或微生物组的多核苷酸。这在疾病诊断和监测方面是有用的,但也有其它的应用。例如,所述方法可用于分析肠或阴道菌群、皮肤上或其它地方存在的微生物。微生物可以是例如细菌、病毒、真菌或分枝杆菌。所述方法可用于确定哪种传染性病原体是致病的并由此确定最佳治疗过程。例如,尿路感染和其它感染越来越多地发展出抗菌抗性。所述方法可用于确定导致感染的细菌,并且从而鉴定将成功治疗感染的抗生素或其它治疗。
所述方法可用于表征基因组DNA。在一个特定示例性实施例中,所述方法可用于鉴定多态性,例如SNP。在另一个实施例中,本发明方法可以用于谱系分析,例如V(D)J区的分析。这些方法可以使用衍生自血细胞或T细胞的样品进行分析。
这些方法也可用于表征未知序列。
多核苷酸结合蛋白
多核苷酸结合蛋白可以是能够与多核苷酸结合并且控制其通过孔的移动的任何蛋白质。在本领域中确定蛋白质是否与多核苷酸结合是很简单的。蛋白质通常与多核苷酸相互作用并且修饰其至少一种性质。蛋白质可以通过裂解多核苷酸以形成单独的核苷酸或如二核苷酸或三核苷酸的更短的核苷酸链来修饰多核苷酸。所述部分可以通过将多核苷酸定向或移动到特定位置,例如控制其移动,来修饰多核苷酸。
多核苷酸结合蛋白优选衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并且修饰其至少一种性质的多肽。所述酶可以通过裂解多核苷酸以形成单独的核苷酸或如二核苷酸或三核苷酸的更短的核苷酸链来修饰多核苷酸。所述酶可以通过将多核苷酸定向或移动到特定位置来修饰多核苷酸。多核苷酸处理酶并不需要展现酶活性,只要其能够结合多核苷酸并且控制其通过孔的移动即可。例如,酶可以经过修饰以去除其酶活性或可以在防止其起酶作用的条件下使用。下文更详细地论述了这种条件。
多核苷酸处理酶优选衍生自溶核酶。在酶的构建体中使用的多核苷酸处理酶更优选衍生自以下酶分类(Enzyme Classification,EC)组中的任何组的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。所述酶可以是WO 2010/086603中所公开的任何酶。
优选的酶是聚合酶、核酸外切酶、解旋酶、易位酶以及拓扑异构酶,如旋转酶。合适的酶包括但不限于来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III酶、来自极端嗜热菌(T.thermophilus)的RecJ以及噬菌体λ核酸外切酶、TatD核酸外切酶以及其变体。聚合酶可以是3173DNA聚合酶(其可购自/>公司)、SD聚合酶(可购自)或其变体。酶优选是Phi29DNA聚合酶或其变体。拓扑异构酶优选是部分分类(EC)组5.99.1.2和5.99.1.3中的任一个的成员。
所述酶最优选衍生自解旋酶。解旋酶可以是或衍生自Hel308解旋酶;RecD解旋酶,如TraI解旋酶或TrwC解旋酶;XPD解旋酶或Dda解旋酶。解旋酶可以是或衍生自Hel308 Mbu、Hel308 Csy Hel308 Tga、Hel308 Mhu、TraI Eco、XPD Mbu或其变体。
解旋酶可以是WO 2013/057495、WO 2013/098562、WO2013098561、WO 2014/013260、WO 2014/013259、WO 2014/013262以及WO/2015/055981中所公开的任何解旋酶、修饰后的解旋酶或解旋酶构建体。
Dda解旋酶优选包含WO/2015/055981和WO 2016/055777中所公开的任何修饰。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1、2、3、4、5、6、7、8、9、10个或更多个解旋酶。在一些实施例中,可以使用不同数量的解旋酶。可以使用上述两个或更多个解旋酶的任何组合。两个或更多个解旋酶可以是两个或更多个Dda解旋酶。两个或更多个解旋酶可以是一个或多个Dda解旋酶和一个或多个TrwC解旋酶。两个或更多个解旋酶可以是同一种解旋酶的不同变体。
两个或更多个解旋酶优选彼此连接。两个或更多个解旋酶更优选彼此共价连接。解旋酶可以按任何次序并且使用任何方法连接。用于本发明的优选解旋酶构建体描述于WO2014/013260、WO 2014/013259、WO 2014/013262和WO2015/055981中。
多核苷酸结合能力可以使用本领域中已知的任何方法来测量。例如,可以使蛋白质与多核苷酸接触,并且可以测量蛋白质与多核苷酸结合并沿所述多核苷酸移动的能力。蛋白质可以包括有助于多核苷酸结合和/或有助于其在高盐浓度和/或室温下的活性的修饰。蛋白质可以经过修饰,使得其结合多核苷酸(例如保留多核苷酸结合能力),但不起解旋酶作用(例如当具备所有便于移动的必需组分,例如ATP和Mg2+时,不沿多核苷酸移动)。这种修饰是本领域中已知的。例如,解旋酶中的Mg2+结合结构域的修饰通常产生不起解旋酶作用的变体。这些变体类型可以充当分子刹车。
酶可以共价连接至孔。可以使用任何方法将酶共价连接至孔。
在链测序中,多核苷酸顺着或逆着外加电位易位通过孔。在双链多核苷酸上逐渐或逐步起作用的核酸外切酶可以在孔的顺侧使用以在外加电位下供给剩余的单链,或在反侧使用以在反向电位下供给剩余的单链。同样,还可以以类似的方式使用展开双链DNA的解旋酶。还可以使用聚合酶。需要逆着外加电位发生链易位的测序应用也是有可能的,但是DNA必须首先在相反电位或无电位下被酶“捕获”。随着电位随后在结合后转换,链将以顺式到反式的方式通过孔并且通过电流保持呈延长的构形。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达,以将最近易位的单链以受控的逐步方式逆着外加电位从反式到顺式从孔中拉回来。
可以在本发明中使用任何解旋酶。解旋酶可以两种模式对孔起作用。首先,优选使用解旋酶来进行所述方法,使得在由外加电压造成的场的作用下,所述解旋酶使多核苷酸移动通过孔。在这种模式中,多核苷酸的5'端首先被捕获在孔中,并且解旋酶使多核苷酸移动到孔中,使得其在场的作用下通过孔,直到其最终易位通过,到达膜的反侧为止。或者,优选这样进行所述方法,解旋酶使多核苷酸逆着由外加电压造成的场而移动通过孔。在这种模式中,多核苷酸的3'端首先被捕获在孔中,并且解旋酶使多核苷酸移动通过孔,使得其逆着外加场被拉出孔,直到其最终被推回到膜的顺侧为止。
还可以沿相反的方向进行所述方法。多核苷酸的3'端可以首先被捕获在孔中,并且解旋酶可以使多核苷酸移动到孔中,使得其在场的作用下通过孔,直到其最终易位通过,到达膜的反侧为止。
当解旋酶不具备便于移动的必需组分或被修饰成阻止或防止其移动时,所述解旋酶可以与多核苷酸结合并且在多核苷酸被外加场拉入孔中时充当刹车以减慢多核苷酸的移动。在非活性模式中,多核苷酸的3'或5'是否被捕获不重要,在充当刹车的酶的作用下将多核苷酸朝向反侧拉入孔中的是外加场。当在非活性模式中时,解旋酶对多核苷酸的移动的控制可以用多种方式来描述,包括齿合、滑动和制动。还可以用这种方式来使用缺乏解旋酶活性的解旋酶变体。
多核苷酸与多核苷酸结合蛋白和孔可以按任何次序接触。优选的是,当使多核苷酸与如解旋酶的多核苷酸结合蛋白和孔接触时,多核苷酸首先与蛋白质形成复合物。当跨孔施加电压时,多核苷酸/蛋白质复合物就会与孔形成复合物并且控制多核苷酸通过孔的移动。
使用多核苷酸结合蛋白的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物和促进多核苷酸结合蛋白的作用的酶辅因子存在下进行。游离核苷酸可以是上文论述的任何单独的核苷酸中的一种或多种。游离核苷酸包括但不限于:单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)以及三磷酸脱氧胞苷(dCTP)。游离核苷酸优选选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选是三磷酸腺苷(ATP)。酶辅因子是允许构建体起作用的因子。酶辅因子优选是二价金属阳离子。二价金属阳离子优选是Mg2 +、Mn2+、Ca2+或Co2+。酶辅因子最优选是Mg2+
分子刹车可以是与多核苷酸结合并且减慢多核苷酸通过孔的移动的任何化合物或分子。分子刹车可以是上文论述的任何一种。分子刹车优选包含与多核苷酸结合的化合物。所述化合物优选是大环。合适的大环包括但不限于环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱芳烃、其衍生物或其组合。环糊精或其衍生物可以是Eliseev,A.V.和Schneider,H-J.(1994)《美国化学会志》116,6081-6088中所公开的任何环糊精或其衍生物。环糊精更优选是七-6-氨基-β-环糊精(am7-βCD)、6-单脱氧-6-单氨基-β-环糊精(am1-CD)或七-(6-脱氧-6-胍基)-环糊精(gu7-βCD)。
多核苷酸表征
所述方法可以涉及表征靶多核苷酸。在靶多核苷酸与孔接触时,随着多核苷酸相对于孔移动进行一种或多种测量,其指示靶多核苷酸的一个或多个特征。
所述方法可以涉及测量每种多核苷酸的两个、三个、四个或五个或更多个特征。一个或多个特征优选选自:(i)多核苷酸的长度,(ii)多核苷酸的同一性,(iii)多核苷酸的序列,(iv)多核苷酸的二级结构,以及(v)多核苷酸是否被修饰。可以根据本发明来测量(i)到(v)的任何组合,如:{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}或{i,ii,iii,iv,v}。
对于(i),可以例如通过确定多核苷酸与孔之间的相互作用的数量或多核苷酸与孔之间的相互作用的持续时间来测量多核苷酸的长度。
对于(ii),可以用多种方式来测量多核苷酸的同一性。可以结合测量多核苷酸的序列或不测量多核苷酸的序列来测量多核苷酸的同一性。前者是很简单的;对多核苷酸进行测序并由此鉴定所述多核苷酸。后者可以按若干方式进行。举例来说,可以测量多核苷酸中的特定基序的存在情况(不测量多核苷酸的其余序列)。或者,所述方法中的特定电信号和/或光学信号的测量可以将多核苷酸鉴定为来自于特定来源。
对于(iii),可以如先前所描述般测定多核苷酸的序列。在Stoddart D等人,《美国国家科学院院刊》,12;106(19):7702-7;Lieberman KR等人,《美国化学会志》2010;132(50):17961-72;以及国际申请WO 2000/28312中描述了合适的测序方法,特别是使用电学测量的那些。
对于(iv),可以用多种方式测量二级结构。例如,如果所述方法涉及电学测量,那么可以使用停留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链多核苷酸和双链多核苷酸的区域。
对于(v),可以测量任何修饰的存在或不存在。所述方法优选包含:用一个或多个蛋白质或用一个或多个标记、标签或间隔区确定多核苷酸是否通过甲基化、通过氧化、通过损坏来修饰。特定的修饰将引起与孔的特定的相互作用,这可以使用下文所描述的方法测量。例如,可以基于在孔与每个核苷酸相互作用期间流过孔的电流将甲基胞嘧啶与胞嘧啶区分开。
可以使用适合于研究膜/孔系统的任何设备来进行所述方法,在所述系统中,孔存在于膜中。可以使用适合于跨膜孔感测的任何设备来进行所述方法。例如,设备包含腔室,所述腔室包含水溶液和将腔室分成两个部分的屏障。屏障通常具有孔口,在其中形成含有孔的膜。或者,屏障形成其中存在孔的膜。
可以使用在WO 2008/102120中所述的设备来进行所述方法。
可以进行各种不同类型的测量。这包括但不限于:电学测量和光学测量。《美国化学会志》2009,131 1652-1653公开了一种合适的光学方法,其涉及荧光测量。可能的电学测量包括:电流测量、阻抗测量、隧穿测量(Ivanov AP等人,《纳米快报》(Nano Lett.)2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(Soni GV等人,《科学仪器评论》(Rev Sci Instrum.)2010年1月;81(1):014301)。测量可以是跨膜电流测量,如对流过孔的离子电流的测量。
可以使用标准单通道记录设备来进行电学测量,如以下文献中所述:
Stoddart D等人,《美国国家科学院院刊》,12;106(19):7702-7;Lieberman KR等人,《美国化学会志》2010;132(50):17961-72;以及国际申请WO 2000/28312。或者,可以使用多通道系统进行电学测量,例如如国际申请WO 2009/077734和国际申请WO 2011/067559中所描述。
所述方法优选在跨膜施加电位的情况下进行。外加电位可以是电压电位。或者,外加电位可以是化学势。化学势的实例是跨膜,如跨两亲层使用盐梯度。Holden等人,《美国化学会志》2007年7月11日;129(27):8650-5中公开了盐梯度。在一些情况下,使用在多核苷酸相对于孔移动时通过孔的电流来评估或确定多核苷酸的序列。这就是链测序。
所述方法可以涉及测量在多核苷酸相对于孔移动时通过孔的电流。因此,所述设备还可以包含能够跨膜和孔施加电位并测量电信号的电路。可以使用膜片钳或电压钳来进行所述方法。所述方法优选涉及使用电压钳。
所述方法可以涉及测量在多核苷酸相对于孔移动时通过孔的电流。适合测量通过跨膜蛋白孔的离子电流的条件是本领域中已知的并且在实例中公开。所述方法通常在跨膜和孔施加电压的情况下进行。所使用的电压通常是+5V至-5V,如+4V至-4V、+3V至-3V、或+2V至-2V。所使用的电压通常是-600mV至+600mV或-400mV至+400mV。所使用的电压优选在具有下限和上限的范围内,下限选自:-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV,上限独立地选自:+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV。所使用的电压更优选在100mV至240mV的范围内,并且最优选在120mV至220mV的范围内。通过使用增加的外加电位,可以增加孔对不同核苷酸的区分。
通常在存在任何电荷载流子的情况下进行所述方法,所述电荷载流子如金属盐,例如碱金属盐;卤盐,例如氯化物盐,如碱金属氯化物盐。电荷载流子可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上文论述的示例性设备中,盐存在于腔室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl),或亚铁氰化钾和铁氰化钾的混合物。KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物是优选的。电荷载流子可以是跨膜不对称的。例如,膜的每一侧上的电荷载流子的类型和/或浓度可以不同。
盐浓度可以是饱和的。盐浓度可以是3M或更低,并且通常是0.1至2.5M、0.3至1.9M、0.5至1.8M、0.7至1.7M、0.9至1.6M或1M至1.4M。盐浓度优选是150mM至1M。所述方法优选使用至少0.3M的盐浓度进行,例如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M。高盐浓度提供高信噪比并允许相对于正常电流波动的背景鉴定指示核苷酸的存在的电流。
通常在存在缓冲液的情况下进行所述方法。在上文论述的示例性设备中,缓冲液存在于腔室中的水溶液中。在本发明的方法中可以使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液是HEPES和Tris-HCl缓冲液。通常在以下pH下进行所述方法:4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5。所用pH优选是约7.5。
可以在以下温度下进行所述方法:0℃至100℃、15℃至95℃、16℃至90℃、17℃至85℃、18℃至80℃、19℃至70℃或20℃至60℃。通常在室温下进行所述方法。任选地在支持酶功能的温度下进行所述方法,如在约37℃下进行。
游离核苷酸和辅因子
通常在存在游离核苷酸或游离核苷酸类似物和/或促进多核苷酸结合蛋白的作用的酶辅因子的情况下进行所述方法。所述方法也可以在不存在游离核苷酸或游离核苷酸类似物并且不存在酶辅因子的情况下进行。游离核苷酸可以是上文论述的任何单独的核苷酸中的一种或多种。游离核苷酸包括但不限于:单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)以及三磷酸脱氧胞苷(dCTP)。游离核苷酸优选选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选是三磷酸腺苷(ATP)。酶辅因子是允许多核苷酸结合蛋白起作用的因子。酶辅因子优选是二价金属阳离子。二价金属阳离子优选是Mg2+、Mn2+、Ca2+或Co2+。酶辅因子最优选是Mg2+
测量类型
可以进行各种不同类型的测量。这包括但不限于:电学测量和光学测量。《美国化学会志》2009,131 1652-1653公开了一种涉及荧光测量的合适的光学方法。可能的电学测量包括:电流测量、阻抗测量、隧穿测量(Ivanov AP等人,《纳米快报》2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(Soni GV等人,《科学仪器评论》2010年1月;81(1):014301)。测量可以是跨膜电流测量,如对流过孔的离子电流的测量。
可以使用标准单通道记录设备来进行电学测量,如以下文献中所述:
Stoddart D等人,《美国国家科学院院刊》,12;106(19):7702-7;Lieberman KR等人,《美国化学会志》2010;132(50):17961-72;以及国际申请
WO 2000/28312。或者,可以使用多通道系统来进行电学测量,
例如如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。
所述方法优选在跨膜施加电位的情况下进行。外加电位可以是电压电位。或者,外加电位可以是化学势。化学势的实例是跨膜,如跨两亲层使用盐梯度。Holden等人,《美国化学会志》2007年7月11日;129(27):8650-5中公开了盐梯度。在一些情况下,使用在多核苷酸相对于孔移动时通过孔的电流来评估或确定多核苷酸的序列。这就是链测序。
试剂盒
本发明还提供了用于本发明方法的试剂盒。所述试剂盒通常包含:多核苷酸指导的效应蛋白和能够偶联至膜的锚。试剂盒可以进一步包含指导多核苷酸、衔接子序列、能够沿着多核苷酸移动的多核苷酸结合蛋白和/或前导序列中的一种或多种。所述试剂盒可以进一步包含微粒。
指导多核苷酸、多核苷酸指导的效应蛋白、锚、衔接子、多核苷酸结合蛋白、前导序列和/或微粒可以是本文所定义的那些中的任一种。试剂盒可以包含一组指导多核苷酸或指导多核苷酸/多核苷酸指导的效应蛋白复合物。该组通常是为了特定目的而设计的,例如用于检测特定微生物、与疾病相关的标志物、特定多态性等。
试剂盒可以包含上文所公开的任何膜的组分,所述膜例如两亲层或三嵌段共聚物膜。试剂盒可以进一步包含跨膜孔。上文参考所述方法论述的任何实施例同样适用于试剂盒。
试剂盒可以另外包含一种或多种能够实施上述任何实施例的其它试剂或仪器。此类试剂或仪器包括以下各项中的一个或多个:合适的缓冲液(水溶液)、用于从受试者获得样品的装置(如包含针的容器或仪器)、用于扩增和/或表达多核苷酸的装置、如上文所定义的膜或电压钳或膜片钳设备。试剂可以按干燥状态存在于试剂盒中,使得流体样品用于再悬浮试剂。试剂盒还可以任选地包含使所述试剂盒能够用于本文所述的方法的说明书或关于所述方法可以用于何种生物体的详情。所述试剂盒可以包含磁铁或电磁铁。试剂盒可以任选地包含核苷酸。
试剂盒可以包含指导多核苷酸,其具有末端延伸部分或如本文所述的第一和第二末端延伸部分,以及捕获寡核苷酸或如本文所述的第一和第二捕获寡核苷酸。试剂盒可以进一步包含如本文所述的竞争寡核苷酸。试剂盒可以进一步包含含有一半亲和分子对(例如链霉亲和素)的珠粒和含有另一半亲和分子对(例如生物素)的第一和第二捕获寡核苷酸。第一和第二捕获寡核苷酸可以各自结合至单独的表面,例如结合至单独的珠粒群。第一捕获寡核苷酸可以结合至例如“纯化”珠粒或“纯化”柱。第二捕获寡核苷酸可以结合至例如“递送”珠粒。“纯化”珠粒和/或“递送”珠粒可以是磁性的。
还提供了用于检测样品中的靶多核苷酸的系统,其包含:纳米孔;多核苷酸指导的效应蛋白,其包含指导多核苷酸结合结构域;以及指导多核苷酸,其包含与靶多核苷酸的一部分中的序列互补的第一部分和适于与多核苷酸指导的效应蛋白的指导多核苷酸结合结构域结合的结构。在一个实施例中,所述系统进一步包含膜,其中在膜中存在纳米孔。在一个实施例中,所述系统进一步包含靶多核苷酸。在所述系统的一个实施例中,靶多核苷酸、指导多核苷酸以及多核苷酸指导的效应蛋白形成复合物。在所述系统的一个实施例中,靶多核苷酸与膜偶联。
以下非限制性实例展示了本发明。
实例1:
此实例描述了通过纳米孔检测混合物中特定靶多核苷酸的方法。在此实例中,使用与靶多核苷酸结合的两种类型的CRISPR-Cas探针鉴定靶DNA。第一种含有通过胆固醇标记的CRISPR-Cas探针将靶多核苷酸锚定到膜上的延伸部分。第二种(“分析物”)携带载有结合的多核苷酸结合蛋白(解旋酶)的延伸部分,并通过多核苷酸结合蛋白控制分析物上的条形码序列通过纳米孔的移动而间接地肯定地鉴定靶多核苷酸。
材料和方法
将寡核苷酸AR131和AR132各自以40μM在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mMNaCl中以0.6℃/分钟从95℃至25℃退火。杂交的DNA被称为“胆固醇hyb”(ONLA17351)。
将寡核苷酸AR130和ONLA11326各自以40μM在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以0.6℃/分钟从95℃至25℃退火。杂交的DNA被称为ONLA17350。按以下将多核苷酸结合蛋白加载于ONLA17350的含有停滞的链上并封闭:使用Zeba脱盐柱(Thermo)将解旋酶缓冲液更换成50mM HEPES(pH 8.0)、100mM乙酸钾、1mM EDTA;通过将(200μl)500nM(分子)ONLA17350与3.5μM更换过缓冲液的解旋酶一起在50mM HEPES(pH 8.0)、100mM乙酸钾中在室温下孵育5分钟,将解旋酶加载于ONLA17350上。然后通过将混合物与100μM TMAD一起在室温下孵育1小时(最终体积,220μl),使解旋酶在DNA周围封闭。在室温下,使用0.25体积当量包含的5mM ATP、10mM MgCl2、2.5MNaCl、100mM Tris(pH 8.0)的盐-ATP胁迫缓冲液(55μl),使衔接子离开非特异性结合的并且未封闭的解旋酶(最终体积,275μl),持续25分钟。在室温下,通过在25mM Tris-Cl(pH 7.5,在21℃下)、28%(w/v)PEG-8000、2.5M NaCl中加入3.7体积当量的SPRI珠粒,对复合物进行5分钟SPRI纯化。使珠粒在磁力架上沉淀并去除上清液。在仍然在磁力架上时,用500μl的50mM Tris(pH 7.5,在21℃下)、2.5M NaCl、20% PEG(w/v)8,000洗涤珠粒,转360°以浸洗架子上的沉淀。去除洗涤缓冲液,并将沉淀在离心机中短暂脉冲,然后返回磁力架以去除最后残留的溶液。随后在室温下将沉淀在30μl的25mM Tris-Cl(pH 7.5,在21℃下)、20mM NaCl中再悬浮5分钟,然后将其放置在磁力架上以回收纯化后的衔接子,所述衔接子被称为“解旋酶-Y-衔接子hyb”。
使用针对λ噬菌体基因组DNA的特异性引物通过PCR扩增3.6千碱基的测试分析物,得到携带平端的双链DNA分析物。这种分析物被称为“平端λ3.6kb”。
携带允许与“胆固醇hyb”或“解旋酶-Y-衔接子hyb”杂交的3'延伸部分的CRISPRRNA(“crRNA”)通过使40μM“Alt-RTM”tracrRNA(购自IDT)退火而与tracrRNA杂交,每个crRNA分别在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以1.0℃/分钟从65℃至25℃退火,得到被称为“指导RNA”的复合物。CRISPR-dCas9复合物通过以下形成:将100nM“指导RNA”与100nM dCas9(ONLP11836)一起在Cas9结合缓冲液(20mM HEPES-NaOH、100mM NaCl、5mMMgCl2、0.1mM EDTA,pH 6.5,在25℃下)中在21℃下孵育10分钟,得到100nM CRISPR-dCas9复合物。根据“胆固醇hyb”或“解旋酶-Y-衔接子hyb”是否可以与crRNA 3'延伸部分退火,这些具有结合的dCas9的复合物分别被称为“锚探针”或“解旋酶探针”。
在此实例中,“锚探针”包含寡核苷酸AR145或AR138或AR141或AR142,其分别与tracrRNA杂交,具有结合的dCas9,每个指定物种的分子浓度是100nM。
在此实例中,“解旋酶探针”包含100nM寡核苷酸AR133或AR134或AR135,其分别与tracrRNA杂交,具有结合的dCas9,每个指定物种的分子浓度是100nM。
根据下表,将“锚探针”和“解旋酶探针”按以下组合合并在一起,总共20μl:
“探针组合” “锚探针” “解旋酶探针”
A AR145 AR133
B 无(对照) AR133
C AR145 无(对照)
D AR138、AR141、AR142 AR134、AR135
E 无(对照) 无(对照)
这些混合物被称为“探针组合”。
向20μl“探针组合”(100nM分子)中加入1.1μl靶DNA(“平端3.6kb,ONLA17510”)至最终浓度为10nM分子的ONLA17510,得到被称为“探针-靶复合物”的复合物。将21.1μL“探针-靶复合物”在“解旋酶-Y-衔接子hyb”、“胆固醇hyb”、HEPES-KOH、KCl、MgCl2以及rATP的混合物中稀释至最终体积100μL,得到最终浓度的25mM HEPES-KOH、500mM KCl、10mMMgCl2、10mM rATP、30nM“解旋酶-Y-衔接子hyb”、100nM“胆固醇hyb”、10nM“CRISPR-dCas9复合物”,pH 8.0,被称为“MinION反应混合物”。将“MinION反应混合物”在环境温度下孵育10分钟,然后对混合物进行纳米孔分析,如下:
从插入37℃下的缓冲液(25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)中的嵌段共聚物中的单个CsgG纳米孔获得电学测量。在到达插入于嵌段共聚物中的单个孔之后,使缓冲液(2mL,25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)流过系统,以去除任何过量的CsgG纳米孔。所有后续步骤均在34℃下进行。用500μl的25mM HEPES-KOH(pH 8.0)、500mM KCl、10mM MgCl2以及10mM rATP(被称为“洗涤缓冲液”)平衡顺式隔室,每次洗涤间隔10分钟。将在21℃下预孵育10分钟的75μl“MinION反应混合物”应用于流通池并孵育10分钟以使任何接触靶DNA的探针-dCas9复合物连接至嵌段共聚物。再过10分钟后,再将2mL“洗涤缓冲液”灌注通过流通池以去除任何非特异性靶DNA,包括任何不接触靶的dCas9结合的CRISPR探针和“解旋酶-Y-衔接子hyb”。在180mV下进行实验,并且监测解旋酶控制的DNA移动。通过计数由独特的电流信号鉴定的解旋酶-Y-衔接子hyb的纳米孔的频率来分析由DNA链的易位产生的电信号。
结果
解旋酶用于控制通过“胆固醇hyb”拴系至三嵌段共聚物的Cas接触的预测序混合物通过CsgG纳米孔的移动。图8显示了携带两个CRISPR-dCas9探针的靶DNA分子,所述探针与靶DNA中的同源位点结合。图23显示了由解旋酶控制分析物易位通过纳米孔产生的电信号。示例信号显示“锚探针”和“解旋酶探针”均接触靶DNA。数据证明,通过拴系的CRISPR-dCas9复合物固定靶多核苷酸成功鉴定了靶DNA多核苷酸。
实例2
此实例描述了一种通过纳米孔测序从混合物中直接富集和测序含有特定20nt靶DNA多核苷酸序列(“靶”)的片段的方法,其中靶DNA接触胆固醇标记的CRISPR-Cas探针并且DNA通过纳米孔的移动由DNA马达蛋白控制。在此实例中,“靶”直接通过其序列肯定地鉴定。结合的CRISPR-Cas探针可以瞬时停滞解旋酶的易位,并且因此也可以用于另外肯定地鉴定样品。
材料和方法
将寡核苷酸AR131和AR132各自以40μM在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mMNaCl中以0.6℃/分钟从95℃至25℃退火。杂交的DNA被称为“胆固醇hyb”(ONLA17351)。
携带允许与“胆固醇hyb”杂交的3'延伸部分的CRISPR RNA(“crRNA”)通过将40μM“Alt-RTM”tracrRNA(购自IDT)与寡核苷酸AR139一起在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以1.0℃/分钟从65℃至25℃退火而与tracrRNA杂交,得到被称为“指导RNA”的复合物。CRISPR-dCas9复合物通过以下形成:将100nM“指导RNA”与100nM dCas9(ONLP11836)一起在Cas9结合缓冲液(20mM HEPES-NaOH、100mM NaCl、5mM MgCl2、0.1mMEDTA,pH 6.5,在25℃下)中在21℃下孵育10分钟,得到100nM CRISPR-dCas9复合物。这些具有结合的dCas9的复合物被称为“锚探针”,因为“胆固醇hyb”可以与crRNA 3'延伸部分退火。
使用gTube(Covaris公司)将肠细菌λ噬菌体基因组DNA片段化至平均大小约1kb。使用NEBNext末端修复/加dA尾模块(NEB)对片段化的DNA进行末端修复和加dA尾。将标准SK007衔接子连接到使用SPRI珠粒纯化的末端修复后的片段化的λ噬菌体DNA上。在室温下持续>5分钟向所得文库(25μl;1μg总DNA)中加入275nM(分子)的ONLA16941以阻断前导序列抗“胆固醇hyb”的非特异性杂交。在两个DNA末端上携带末端连接的负载解旋酶的所得DNA文库被称为“预测序混合物”。
向12μl预测序混合物中加入33μl“锚探针”,得到含有73nM“锚探针”和约0.32nM靶位点的混合物。使结合在21℃下进行10分钟,之后使用SPRI磁珠对混合物进行纯化步骤,如下:将0.4体积当量的AMPure XP SPRI磁珠(Beckman Coulter)加入混合物中并将所得混合物在21℃下搅拌5分钟。使用磁力分离器沉淀磁珠,吸出上清液,并将100μl的50mM Tris-Cl、2.5M NaCl、20% PEG 8,000(pH 7.5,在25℃下)加入到珠粒中,同时仍然在架子上,将沉淀转360°以洗涤架子上的沉淀。立即将珠粒再次沉淀并吸出上清液,之后从架子上取下管,并将45μl含有25mM Tris-Cl、20mM NaCl(pH 7.5,在25℃下)的缓冲液加入到珠粒中,通过在21℃下孵育5分钟来洗脱DNA。使用磁力分离器沉淀珠粒,并保留洗脱液(被称为“探针-靶复合物”)。
将45μL“探针-靶复合物”在ONLA17351、HEPES-KOH、KCl、MgCl2以及rATP的混合物中稀释至330μL的最终体积,得到最终浓度的25mM HEPES-KOH、500mM KCl、10mM MgCl2、10mM rATP、10nM ONLA17351、10nM“CRISPR-dCas9复合物”以及约44pM靶位点,pH 8.0,被称为“MinION反应混合物”。
从插入37℃下的缓冲液(25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)中的嵌段共聚物中的单个CsgG纳米孔获得电学测量。在到达插入于嵌段共聚物中的单个孔之后,使缓冲液(2mL,25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)流过系统,以去除任何过量的CsgG纳米孔。所有后续步骤均在34℃下进行。用500μl的25mM HEPES-KOH(pH 8.0)、500mM KCl、10mM MgCl2以及10mM rATP(被称为“洗涤缓冲液”)平衡顺式隔室,每次洗涤间隔10分钟。将在21℃下预孵育10分钟的150μl“MinION反应混合物”应用于流通池并孵育10分钟以使任何接触靶DNA的胆固醇:CRISPR探针:dCas9复合物连接至嵌段共聚物。再过10分钟后,再将2mL“洗涤缓冲液”灌注通过流通池以去除任何非特异性靶DNA。在180mV下进行实验,并且监测解旋酶控制的DNA移动。分析由DNA链的易位产生的电信号并确定其核苷酸序列。
结果
解旋酶用于控制通过“胆固醇hyb”拴系至三嵌段共聚物的Cas接触的预测序混合物通过CsgG纳米孔的移动。图9显示了携带末端负载的解旋酶、与其同源位点结合的CRISPR-dCas9以及胆固醇系链的靶DNA分子。图15显示解旋酶的路径以及在遇到结合的CRISPR-dCas9复合物时其易位如何瞬时停滞。图22显示了由解旋酶控制的靶DNA(在这种情况下,λDNA的3.6千碱基片段)通过纳米孔的易位和在易位事件中途的一个这样的瞬时停滞事件产生的电信号。示例信号显示dCas9接触靶DNA,并且解旋酶接触dCas9。数据证明,通过拴系的CRISPR-dCas9复合物固定靶多核苷酸成功地优先于其它非特异性片段实现了靶DNA多核苷酸的富集(参见图21)和测序。
实例3
此实例描述了一种通过纳米孔测序从DNA多核苷酸(“DNA”)的混合物中直接富集和测序含有特定20nt靶DNA多核苷酸序列(“靶”)的片段的方法,其中靶DNA接触胆固醇标记的CRISPR-Cas探针。在此实例中,寡核苷酸的混合物携带多核苷酸结合蛋白,其负载于DNA混合物的每个末端的Y-衔接子上。在此实例中,Y-衔接子不含停滞位点,而是通过含有与Y-衔接子杂交的胆固醇部分的系链寡核苷酸锚定在膜表面上。马达蛋白完全展开混合物中不含有结合的CRISPR-Cas复合物的任何DNA,从而从膜上释放非靶DNA。另外,核酸外切酶,例如大肠杆菌核酸外切酶I,可用于与DNA运动易位同时降解靶的非易位链,以及样品中完全展开的任何非靶DNA。多核苷酸结合蛋白部分地展开含有结合的CRISPR-Cas复合物的任何DNA,但在遇到独立于纳米孔的CRISPR-Cas复合物时停滞。在通过纳米孔捕获靶后,通过外加电位将CRISPR-Cas复合物从靶上移走,从而恢复靶上多核苷酸结合蛋白的易位。分析物的序列和停滞的位置可用于肯定地鉴定样品。
方法
将寡核苷酸AR131和AR132各自以40μM在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mMNaCl中以0.6℃/分钟从95℃至25℃退火。杂交的DNA被称为“胆固醇hyb”(ONLA17351)。
携带允许与“胆固醇hyb”杂交的3'延伸部分的CRISPR RNA(“crRNA”)通过将40μM“Alt-RTM”tracrRNA(购自IDT)与寡核苷酸AR145一起在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以1.0℃/分钟从65℃至25℃退火而与tracrRNA杂交,得到被称为“指导RNA”的复合物。CRISPR-dCas9复合物通过以下形成:将100nM“指导RNA”与100nM dCas9(ONLP11836)一起在Cas9结合缓冲液(20mM HEPES-NaOH、100mM NaCl、5mM MgCl2、0.1mMEDTA,pH 6.5,在25℃下)中在21℃下孵育10分钟,得到100nM CRISPR-dCas9复合物。这些具有结合的dCas9的复合物被称为“锚探针”,因为“胆固醇hyb”可以与crRNA 3'延伸部分退火。
在环境温度下,使用20,000单位的NEB Quick T4 DNA连接酶,在66mM Tris-Cl(pH8.0)、10mM MgCl2、2mM ATP S、4.5%(w/v)PEG-8000中,以100μl的体积,使约20nM的携带解旋酶的Y-衔接子ONLA17917连接至1μg的末端修复的加dA尾的3.6kb DNA CS(ONLA17510),持续10分钟。除了在24μl的20mM CAPS、40mM KCl(pH 10)中洗脱DNA之外,如在实例2中所详述般通过SPRI纯化来纯化所连接的DNA。向此DNA中加入10nM(分子)的“锚探针”,并将样品在环境温度下孵育10分钟以使锚探针接触靶。向此DNA中加入10nM(分子)的SK43,一种携带可以与Y-衔接子杂交的胆固醇部分的寡核苷酸。这产生了3.6千碱基的靶双链DNA,其在每个末端携带多核苷酸结合蛋白负载的Y-衔接子,被称为“MinION测序混合物”。
将预测序混合物稀释至150μl的体积以进行分析,得到含有以下的混合物:25mMHEPES-KOH(pH 8.0)、500mM KCl、10nM胆固醇hyb(ONLA17351)以及约250ng MinION测序混合物。
从插入37℃下的缓冲液(25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)中的嵌段共聚物中的单个CsgG纳米孔获得电学测量。在到达插入于嵌段共聚物中的单个孔之后,使缓冲液(2mL,25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)流过系统,以去除任何过量的CsgG纳米孔。所有后续步骤均在34℃下进行。用500μl的25mM HEPES-KOH(pH 8.0)、500mM KCl(被称为“较少燃料的洗涤缓冲液(fuel-less wash buffer)”)平衡顺式隔室两次,每次洗涤间隔10分钟。将在21℃下预孵育10分钟的150μl“MinION反应混合物”应用于流通池并孵育10分钟以使任何接触靶DNA的胆固醇:CRISPR探针:dCas9复合物连接至嵌段共聚物。再过10分钟后,再将2mL“较少燃料的洗涤缓冲液”灌注通过流通池以去除任何未结合的靶DNA。在180mV下进行实验,并且监测纳米孔电流约800秒,之后用2mL的25mM HEPES-KOH(pH 8.0)、500mM KCl、10mM ATP、0.1mMMgCl2灌注流通池。分析由DNA链的易位产生的电信号并确定其核苷酸序列。
结果
解旋酶在非可水解的ATP类似物ATP S的存在下连接在靶两端,并被用于展开不含结合的CRISPR-dCas9或独立于纳米孔在CRISPR-dCas9停滞之前的任何靶DNA。将CRISPR-dCas9和连接的Y-衔接子通过“胆固醇hyb”和通过与靶两端杂交的寡核苷酸拴系至三嵌段共聚物。图28显示了靶于膜表面的固定。靶携带结合的CRISPR-dCas9探针,并且在不存在MgATP的情况下,解旋酶位于靶DNA的末端。图29显示了加入MgATP后两个解旋酶向结合的CRISPR-dCas9复合物的易位和停滞。停滞可以通过一个或两个解旋酶完成。图30显示了在施加电位后纳米孔对靶分析物的捕获。图31显示了在通过纳米孔捕获靶后解旋酶对结合的CRISPR-dCas9复合物的移位。图32显示了在加入MgATP后约2350秒的示例迹线,其包含初始的预dCas9易位事件(B)、停滞(C)以及易位恢复(D)。突出并延伸停滞恢复(E)。
序列
寡核苷酸
tracrRNA
全文所用的tracrRNA是购自IDT的67mer(“Alt-RTM”tracrRNA;目录号1072534)
此申请中所用的定制寡核苷酸:
/5Phos/=5'磷酸盐部分;/iBNA-meC/=支链核酸甲基胞嘧啶碱基;/iBNA-A/=支链核酸腺苷碱基;/3CholTEG/=3'胆固醇部分,通过三乙二醇连接;r=核糖核苷酸碱基(RNA);3=C3间隔区;iSp18=内部Sp18间隔区
DNA样品文库:序列和制备
●肠细菌噬菌体λ的3.6kb衍生物(“λ3.6kb”)
>λ_3.6kb
GCCATCAGATTGTGTTTGTTAGTCGCTGCCATCAGATTGTGTTTGTTAGTCGCTTTTTTTTTTTGGA
ATTTTTTTTTTGGAATTTTTTTTTTGCGCTAACAACCTCCTGCCGTTTTGCCCGTGCATATCGGTCA
CGAACAAATCTGATTACTAAACACAGTAGCCTGGATTTGTTCTATCAGTAATCGACCTTATTCCTAA
TTAAATAGAGCAAATCCCCTTATTGGGGGTAAGACATGAAGATGCCAGAAAAACATGACCTGTTGGC
CGCCATTCTCGCGGCAAAGGAACAAGGCATCGGGGCAATCCTTGCGTTTGCAATGGCGTACCTTCGC
GGCAGATATAATGGCGGTGCGTTTACAAAAACAGTAATCGACGCAACGATGTGCGCCATTATCGCCT
AGTTCATTCGTGACCTTCTCGACTTCGCCGGACTAAGTAGCAATCTCGCTTATATAACGAGCGTGTT
TATCGGCTACATCGGTACTGACTCGATTGGTTCGCTTATCAAACGCTTCGCTGCTAAAAAAGCCGGA
GTAGAAGATGGTAGAAATCAATAATCAACGTAAGGCGTTCCTCGATATGCTGGCGTGGTCGGAGGGA
ACTGATAACGGACGTCAGAAAACCAGAAATCATGGTTATGACGTCATTGTAGGCGGAGAGCTATTTA
CTGATTACTCCGATCACCCTCGCAAACTTGTCACGCTAAACCCAAAACTCAAATCAACAGGCGCCGG
ACGCTACCAGCTTCTTTCCCGTTGGTGGGATGCCTACCGCAAGCAGCTTGGCCTGAAAGACTTCTCT
CCGAAAAGTCAGGACGCTGTGGCATTGCAGCAGATTAAGGAGCGTGGCGCTTTACCTATGATTGATC
GTGGTGATATCCGTCAGGCAATCGACCGTTGCAGCAATATCTGGGCTTCACTGCCGGGCGCTGGTTA
TGGTCAGTTCGAGCATAAGGCTGACAGCCTGATTGCAAAATTCAAAGAAGCGGGCGGAACGGTCAGA
GAGATTGATGTATGAGCAGAGTCACCGCGATTATCTCCGCTCTGGTTATCTGCATCATCGTCTGCCT
GTCATGGGCTGTTAATCATTACCGTGATAACGCCATTACCTACAAAGCCCAGCGCGACAAAAATGCC
AGAGAACTGAAGCTGGCGAACGCGGCAATTACTGACATGCAGATGCGTCAGCGTGATGTTGCTGCGC
TCGATGCAAAATACACGAAGGAGTTAGCTGATGCTAAAGCTGAAAATGATGCTCTGCGTGATGATGT
TGCCGCTGGTCGTCGTCGGTTGCACATCAAAGCAGTCTGTCAGTCAGTGCGTGAAGCCACCACCGCC
TCCGGCGTGGATAATGCAGCCTCCCCCCGACTGGCAGACACCGCTGAACGGGATTATTTCACCCTCA
GAGAGAGGCTGATCACTATGCAAAAACAACTGGAAGGAACCCAGAAGTATATTAATGAGCAGTGCAG
ATAGAGTTGCCCATATCGATGGGCAACTCATGCAATTATTGTGAGCAATACACACGCGCTTCCAGCG
GAGTATAAATGCCTAAAGTAATAAAACCGAGCAATCCATTTACGAATGTTTGCTGGGTTTCTGTTTT
AACAACATTTTCTGCGCCGCCACAAATTTTGGCTGCATCGACAGTTTTCTTCTGCCCAATTCCAGAA
ACGAAGAAATGATGGGTGATGGTTTCCTTTGGTGCTACTGCTGCCGGTTTGTTTTGAACAGTAAACG
TCTGTTGAGCACATCCTGTAATAAGCAGGGCCAGCGCAGTAGCGAGTAGCATTTTTTTCATGGTGTT
ATTCCCGATGCTTTTTGAAGTTCGCAGAATCGTATGTGTAGAAAATTAAACAAACCCTAAACAATGA
GTTGAAATTTCATATTGTTAATATTTATTAATGTATGTCAGGTGCGATGAATCGTCATTGTATTCCC
GGATTAACTATGTCCACAGCCCTGACGGGGAACTTCTCTGCGGGAGTGTCCGGGAATAATTAAAACG
ATGCACACAGGGTTTAGCGCGTACACGTATTGCATTATGCCAACGCCCCGGTGCTGACACGGAAGAA
ACCGGACGTTATGATTTAGCGTGGAAAGATTTGTGTAGTGTTCTGAATGCTCTCAGTAAATAGTAAT
GAATTATCAAAGGTATAGTAATATCTTTTATGTTCATGGATATTTGTAACCCATCGGAAAACTCCTG
CTTTAGCAAGATTTTCCCTGTATTGCTGAAATGTGATTTCTCTTGATTTCAACCTATCATAGGACGT
TTCTATAAGATGCGTGTTTCTTGAGAATTTAACATTTACAACCTTTTTAAGTCCTTTTATTAACACG
GTGTTATCGTTTTCTAACACGATGTGAATATTATCTGTGGCTAGATAGTAAATATAATGTGAGACGT
TGTGACGTTTTAGTTCAGAATAAAACAATTCACAGTCTAAATCTTTTCGCACTTGATCGAATATTTC
TTTAAAAATGGCAACCTGAGCCATTGGTAAAACCTTCCATGTGATACGAGGGCGCGTAGTTTGCATT
ATCGTTTTTATCGTTTCAATCTGGTCTGACCTCCTTGTGTTTTGTTGATGATTTATGTCAAATATTA
GGAATGTTTTCACTTAATAGTATTGGTTGCGTAACAAAGTGCGGTCCTGCTGGCATTCTGGAGGGAA
ATACAACCGACAGATGTATGTAAGGCCAACGTGCTCAAATCTTCATACAGAAAGATTTGAAGTAATA
TTTTAACCGCTAGATGAAGAGCAAGCGCATGGAGCGACAAAATGAATAAAGAACAATCTGCTGATGA
TCCCTCCGTGGATCTGATTCGTGTAAAAAATATGCTTAATAGCACCATTTCTATGAGTTACCCTGAT
GTTGTAATTGCATGTATAGAACATAAGGTGTCTCTGGAAGCATTCAGAGCAATTGAGGCAGCGTTGG
TGAAGCACGATAATAATATGAAGGATTATTCCCTGGTGGTTGACTGATCACCATAACTGCTAATCAT
TCAAACTATTTAGTCTGTGACAGAGCCAACACGCAGTCTGTCACTGTCAGGAAAGTGGTAAAACTGC
AACTCAATTACTGCAATGCCCTCGTAATTAAGTGAATTTACAATATCGTCCTGTTCGGAGGGAAGAA
CGCGGGATGTTCATTCTTCATCACTTTTAATTGATGTATATGCTCTCTTTTCTGACGTTAGTCTCCG
ACGGCAGGCTTCAATGACCCAGGCTGAGAAATTCCCGGACCCTTTTTGCTCAAGAGCGATGTTAATT
TGTTCAATCATTTGGTTAGGAAAGCGGATGTTGCGGGTTGTTGTTCTGCGGGTTCTGTTCTTCGTTG
ACATGAGGTTGCCCCGTATTCAGTGTCGCTGATTTGTATTGTCTGAAGTTGTTTTTACGTTAAGTTG
ATGCAGATCAATTAATACGATACCTGCGTCATAATTGATTATTTGACGTGGTTTGATGGCCTCCACG
CACGTTGTGATATGTAGATGATAATCATTATCACTTTACGGGTCCTTTCCGGTGAAAAAAAAGGTAC
CAAAAAAAACATCGTCGTGAGTAGTGAACCGTAAGC
●肠细菌噬菌体λ基因组:GenBank登录ID J02459.1
●噬菌体λ的七片段衍生物,ONLA15339
用SnaBI和BamHI-HF(NEB)消化噬菌体λDNA(GenBank登录ID J02459.1;从NEB获得),并使用NEBNext Ultra末端修复/加dA尾模块(NEB)进行末端修复和加dA尾。使用NEB平端/TA连接酶主混合物将解旋酶负载的衔接子连接至加dA尾的DNA。
片段1(噬菌体λ的位置1-5505)
/>
/>
片段2(噬菌体λ的位置5509-12910)
/>
/>
/>
片段3(噬菌体λ的位置12910-22346)
/>
/>
/>
/>
/>
片段4(噬菌体λ的位置22350-27972)
/>
/>
片段5(噬菌体λ的位置27976-34499)
/>
/>
/>
片段6(噬菌体λ的位置34503-41732)
/>
/>
/>
/>
片段7(噬菌体λ的位置41736-48502)
/>
/>
/>
所用酶组分的序列
可以留下标签以允许纯化Cas-多核苷酸靶复合物,或通过TEV裂解去除。
>Spy_Cas9_野生型:来自化脓性链球菌的携带C端Strep(II)标签的野生型Cas9MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDGGSENLYFQGGSWSHPQFEKGGGSWSHPQFEK
>Spy_Cas9_D10A:来自化脓性链球菌的携带C端Strep(II)标签的Cas9切口酶
/>
>Spy_Cas9_H840A:来自化脓性链球菌的携带C端Strep(II)标签的Cas9切口酶
>Spy_Cas9_D10A_H840A:来自化脓性链球菌的携带C端Strep(II)标签的死Cas9(‘dCas9’)
纯化为ONLP11836。
SK007衔接子包含以下三个杂交在一起的序列
/5SpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3// iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3// iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3/G G C G T C T G C TT G G G T G T T T A A C C T T T T T T T T T T/iSp18//iSp18// iSp18//iSp18/A A T G T A C T T C G T T C A G T T A C G T A T T GC T
/5Phos/G C A A T A C G T A A C T G A A C G A A G T/iBNA-A//iBNA-meC// iBNA-A//iBNA-T//iBNA-T/T T T G A G G C G A G C G G T C A A/5BNA-G//iBNA-G// iBNA-T//iBNA-T//iBNA-A/A A C A C C C A A G CA G A C G C C T T
序列SK43
/5//CholTEG/TTGACCGCTCGCCTC
实例4
此实例描述了通过直接检测靶/探针复合物从混合物中检测含有特定20nt靶DNA多核苷酸序列(“靶”)的片段的方法,其中靶DNA接触CRISPR-Cas探针。在此实例中,“靶”通过由与纳米孔相互作用的靶/探针复合物给出的独特信号肯定地鉴定。在这种情况下,孔的大小仅足够允许单链DNA进入(图14)。
材料和方法
将在两端经过末端修复和加dA尾的3.6kb长度的λDNA连接到没有解旋酶的SK007衔接子(ONLA16389,顶部+ONLA19936,底部+ONLA19750,阻断剂)。然后使用SPRI珠粒按以下对其进行纯化:将0.4体积当量的AMPure XP SPRI磁珠(Beckman Coulter)加入混合物中,并将所得混合物在21℃下搅拌5分钟。使用磁力分离器沉淀磁珠,吸出上清液,并将100μl的50mM Tris-Cl、2.5M NaCl、20% PEG 8,000(pH 7.5,在25℃下)加入到珠粒中,同时仍然在架子上,将沉淀转360°以洗涤架子上的沉淀。立即将珠粒再次沉淀并吸出上清液,之后从架子上取下管,并将45μl含有25mM Tris-Cl、20mM NaCl(pH 7.5,在25℃下)的缓冲液加入到珠粒中,通过在21℃下孵育5分钟来洗脱DNA。使用磁力分离器沉淀珠粒,并保留洗脱液。这是“双Y 3.6kb”。
具有靶向3.6kbλ先前所用的区域的序列的CRISPR RNA(“crRNA”)AR148通过与40μM“Alt-RTM”tracrRNA(购自IDT)在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以1.0℃/分钟从65℃至25℃退火而与tracrRNA杂交,得到被称为“指导RNA”的复合物。CRISPR-dCas9复合物通过以下形成:将100nM“指导RNA”与100nM dCas9(ONLP11836)一起在Cas9结合缓冲液(20mM HEPES-NaOH、100mM NaCl、5mM MgCl2、0.1mM EDTA,pH 6.5,在25℃下)中在21℃下孵育10分钟,得到100nM“CRISPR-dCas9复合物”。
将0.5μg双Y 3.6kb与50μL的CRISPR-dCas9复合物一起在20℃下孵育至少10分钟。然后向其中加入65μL的2×c17缓冲液(1M KCl、50mM HEPES,pH 8)、12.5μL ELB以及去离子水,使最终体积达到150μL。这是“芯片样品”。
从插入37℃下的缓冲液(25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)中的嵌段共聚物中的单个CsgG纳米孔获得电学测量。在到达插入于嵌段共聚物中的单个孔之后,使缓冲液(2mL,25mM HEPES-KOH、150mM亚铁氰化钾(II)、150mM铁氰化钾(III),pH 8.0)流过系统,以去除任何过量的CsgG纳米孔。所有后续步骤均在34℃下进行。用500μl的25mM HEPES(pH 8.0)、500mM KCl(被称为“c17”)平衡顺式隔室,每次洗涤间隔10分钟。然后将150μl芯片样品加入到芯片中,并在34℃下在100mV下记录数据。
结果
当CRISPR-dCas9复合物不存在时,或当CRISPR-dCas9复合物不具有双Y 3.6kb中存在的crRNA序列时,所获得的信号是60-80pA下的事件的特征,通常持续<0.5秒。图33和34显示双Y 3.6kb,没有与其结合的CRISPR-dCas9复合物易位通过孔。
当CRISPR-dCas9复合物存在但双Y 3.6kb不存在时,没有观察到事件。
当双Y 3.6kb与如上所述具有在双Y 3.6kb中发现的crRNA序列的CRISPR-dCas9复合物结合时,所述信号中约60pA下的长区块占主导。这些区块通常持续>>10秒。有时这些事件会自发地返回到开孔电流。这些事件具有与上述事件相同的特征轮廓,但在两个Y-衔接子之间具有新的长静态水平。图14、图35和图36显示DNA易位通过孔直到CRISPR-dCas9复合物到达孔,此时双Y 3.6kb暂停,直到CRISPR-dCas9复合物因为孔的作用力而转移,此时双Y3.6kb继续易位。
实例5
此实例描述了通过直接检测靶/探针复合物从混合物中检测含有特定20核苷酸靶DNA多核苷酸序列(“靶”)的片段的方法,其中靶DNA接触CRISPR-Cas探针。在此实例中,“靶”通过由与纳米孔相互作用的靶/探针复合物给出的独特信号肯定地鉴定。在这种情况下,孔的大小足够允许连接有探针的双链DNA进入(参见图12)。
材料和方法
制备并纯化3.6kb长度的λDNA。这是3.6kb。
具有靶向3.6kb的区域的序列的CRISPR RNA(“crRNA”)AR148通过与40μM“Alt-RTM”tracrRNA(购自IDT)在10mM Tris-Cl(pH 8.0)、1mM EDTA、100mM NaCl中以1.0℃/分钟从65℃至25℃退火而与tracrRNA杂交,得到被称为“指导RNA”的复合物。CRISPR-dCas9复合物通过以下形成:将200nM“指导RNA”与200nM dCas9(ONLP11836)一起在Cas9结合缓冲液(20mMHEPES-NaOH、100mM NaCl、5mM MgCl2、0.1mM EDTA,pH6.5,在25℃下)中在21℃下孵育10分钟,得到200nM CRISPR-dCas9复合物。
将0.5μg的3.6kb与25μL的CRISA-dCas9复合物一起在20℃下孵育至少10分钟。然后向其中加入25μL的2×1M缓冲液(2M KCl、50mM HEPES,pH 8)。这是芯片样品。
从通过介质击穿形成的单个15nm直径的SiN ALD孔获得电学测量(但是可以使用直径>10nM的任何孔,例如固态、蛋白质、DNA折纸或任何其它材料)。顺式和反式是在1M KCl下而电压不同。在没有样品的一段时间的孔表征之后,用芯片样品替换顺式隔室的体积,并且在20℃下在不同电压下进行测量。
结果
当CRISPR-dCas9复合物不存在时,或当CRISPR-dCas9复合物不具有与3.6kb中的DNA序列互补的crRNA序列时,所获得的信号是在3.6kb通过孔时的短暂的电流偏转(图37)。当3.6kb与如上所述具有与3.6kb中发现的DNA序列互补的crRNA序列的CRISPR-dCas9复合物结合时,所述信号现在具有代表通过孔的CRISPR-dCas9复合物的额外分段(图38)。当多个CRISPR-dCas9复合物与DNA结合时,每个复合物都会引起单独的电流偏转(图39)。当dCas被修饰或修改时,信号随着每个复合物通过孔而变化(图40)。由复合物引起的电流偏转的信号位置的变化可用于提供关于多核苷酸(例如DNA)的信息。
序列信息
/>
/>
/>
实例6
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定。通过用dCas9分子上的捕获部分‘下拉’,将靶分子与背景分离。dCas9优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过对结合的dCas9蛋白质施加热和盐胁迫,联合在所捕获的珠粒表面上的后续纯化前的SPRI纯化步骤以去除过量的未结合的dCas9,来降低‘脱靶’效应。靶DNA分子适用于纳米孔测序,并且dCas9保持与其靶结合,直至被负载于衔接子上的酶置换。
dCas9携带tracrRNA分子,其携带能够捕获珠粒-捕获寡核苷酸缀合物上的靶分子的5'DNA延伸部分(图41的序列a),所述缀合物携带与此延伸部分互补的DNA序列(图41的序列a')。在此实例中,捕获寡核苷酸通过生物素部分连接至珠粒。在此实例中,洗掉非靶DNA,并且靶分子保持与珠粒结合。靶分子然后通过连接至其游离的加dA尾的末端的任一个或两个而适用于纳米孔测序,而dCas9-靶分子与珠粒结合。然后将整个珠粒-靶-RNP组装体递送至流通池以进行测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
方法
大肠杆菌全基因组文库ONLA18816(NCBI参考序列:NC_000913.3)使用CovarisgTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。然后使用NEB Ultra II试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。
将200nM DNA延伸的tracrRNA(AR363)加入到含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl以及1mM MgCl2的缓冲液(被称为dCas9结合缓冲液)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM dCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。然后将250nM crRNA(AR400)加入到反应中并在室温(约21℃)下再孵育10分钟。最终体积是50μL。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成dCas9-靶复合物,将500ng(约1.2μL)上文基因组DNA(ONLA18816)加入到RNP中并在室温下孵育20分钟。然后将混合物在55℃下孵育5分钟以去除未与其既定靶结合的dCas9。按以下对混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
通过以下使dCas9结合的靶分子与捕获珠粒结合:将12.5μL SPRI洗脱液与10μg捕获珠粒(1μL)和65μL戴诺磁珠(Dynabeads)千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。随后用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mMNaCl、1mM EDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mMNaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘珠粒-靶复合物’。
来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×LAQA1缓冲液(由New England Biolabs公司赠送)、7μL无核酸酶水、5μL AMX 1D(SQK-LSK108的一部分)以及0.5μL T4 DNA连接酶(NEB目录号M0202)的连接混合物使以上沉淀的珠粒再悬浮而被连接至珠粒-靶复合物。将珠粒在连接混合物中在搅拌下孵育10分钟,沉淀,并用约125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤一次以去除游离的未连接的衔接子。在洗涤后,将珠粒再沉淀一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
图41显示了dCas9-crRNA-tracrRNA-靶-珠粒缀合物的所期望的外观,所述缀合物这里也被称为上样样品。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个50μL上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
结果
图42显示了使用上述方案在6小时测序轮中收集的数据,其使用Oxford NanoporeTechnologies MinION流通池,用MinKNOW 1.7.14软件运行标准基线测序脚本。期望此下拉中所用的单一crRNA探针AR400能将dCas9导向图42D中列出的七个16S核糖体基因位点中的每一个,其中一个位置被鉴定为位置vii,在相对于PAM位点的位置-2处携带单个错配,并且另一个位置被鉴定为峰i,在相对于PAM位点的位置-6处携带单个错配。在约4.6Mb基因组中,约35kb(约0.76%)的输入DNA(7×中值读段长度,5.9kb)可被认为是靶。从这轮获得92,942个测序读段,并通过标准碱基判读和比对分析工作流放置所述读段。可将85,126个读段定位到大肠杆菌MG1655基因组(NC_000913.3),其中62,943个(73.9%)被定位到每个所期望的探针杂交位置的3个中值读段长度内。对于位置i、ii、iii、iv、v以及vi中的每一个,测序读段的堆积得到9,000-10,000×的覆盖深度。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分:
/>
实例7
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定。通过用dCas9分子上的捕获部分‘下拉’,将靶分子与背景分离。dCas9优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过以下使‘脱靶’效应降至最低:对dCas9蛋白质施加热和盐胁迫,然后纯化并洗脱对tracrRNA具有特异性的捕获表面上的dCas9-靶复合物,并将dCas9-靶复合物转移到对crRNA具有特异性的第二特异性捕获表面。通过称为立足点置换的现象可以实现靶从第一‘纯化’珠粒的释放。靶DNA分子适用于纳米孔测序,并且dCas9保持与其靶结合,直至被负载于衔接子上的酶置换。
crRNA还携带用于捕获珠粒、柱子或表面上的靶分子的3'DNA延伸部分(图44的序列d)。dCas9还携带tracrRNA分子,其携带能够捕获‘纯化’珠粒、柱子或表面上的靶分子的5'DNA延伸部分(图44的序列a·c)。首先通过在携带与tracrRNA的DNA延伸部分互补的寡核苷酸的珠粒上捕获而使靶与非靶DNA分离。在此步骤期间洗掉非靶DNA。通过立足点置换,通过加入与DNA延伸的tracrRNA分子竞争结合珠粒的寡核苷酸,从珠粒上洗脱靶分子。在洗脱靶分子后,靶通过crRNA上的DNA延伸部分与第二‘递送’珠粒结合。靶分子然后通过连接至其游离的加dA尾的末端中的任一个或两个而适用于纳米孔测序,而dCas9-靶分子仍然与珠粒结合。然后将整个珠粒-靶-RNP组装体递送至流通池以进行测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约7kb的中值大小来制备。然后使用NEB Ultra II试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。对经过末端修复、加dA尾、片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。
将200nM DNA延伸的tracrRNA(AR363)加入到含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl以及1mM MgCl2的缓冲液(被称为dCas9结合缓冲液,BB)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM dCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。然后将携带3'DNA延伸部分的250nM crRNA(AR191)加入到反应中,并在室温(约21℃)下再孵育10分钟。最终体积是50μL。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成dCas9-靶复合物,将500ng(约1.2μL)上文基因组DNA(ONLA18816)加入到RNP中并在室温下孵育20分钟。然后将混合物在55℃下孵育5分钟以去除未与其既定靶结合的dCas9。按以下对混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR667捕获寡核苷酸(包含序列a'-b',和3'生物素部分)一起在包含50mM Tris-Cl(pH 8.0,在4℃下)、2MNaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘纯化珠粒’。
使用PCR热循环仪,通过将40μM的每个寡核苷酸在标准TE缓冲液(10mM Tris-Cl、1mM EDTA,pH 8.0)+200mM NaCl中孵育,在95℃下加热2分钟,并在约2小时内缓慢冷却至25℃,使寡核苷酸AR132和AR196杂交。将12.5的这种携带与crRNA序列的DNA延伸部分互补的突出端的双螺旋DNA与50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)一起在约120μL的包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。在每个洗涤步骤,通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘递送珠粒’。
通过以下使dCas9结合的靶分子与纯化珠粒结合:将12.5μL SPRI洗脱液与50μg纯化珠粒和67.5μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在室温下在搅拌下孵育20分钟。用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mMEDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mM NaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘纯化珠粒-靶复合物’。
在靶DNA-RNP复合物的固定之后,通过加入20μL含有25μM携带图44的序列a·b的寡核苷酸AR668、20mM Tris-Cl(pH 8.0)以及100mM NaCl的缓冲液从纯化珠粒洗脱靶DNA,在室温下在温和搅拌下持续10分钟。将洗脱液保留为‘纯化珠粒洗脱液’。
随后通过以下将纯化珠粒洗脱液固定在递送珠粒上:将20μL的纯化珠粒洗脱液与1μL的递送珠粒和105μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。随后用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mMNaCl、1mM EDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mMNaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘递送珠粒-靶复合物’。
来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×LAQA1缓冲液(由New England Biolabs公司赠送)、7μL无核酸酶水、5μL AMX 1D(SQK-LSK108的一部分)以及0.5μL T4 DNA连接酶(NEB目录号M0202)的连接混合物使以上沉淀的珠粒再悬浮而被连接至珠粒-靶复合物。将珠粒在连接混合物中在搅拌下孵育10分钟,沉淀,并用约125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤一次。在洗涤后,将珠粒再沉淀一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
图44显示了此实例中所述的依序系列步骤,所述步骤为使用立足点置换寡核苷酸从纯化珠粒洗脱靶结合的dCas9分子并将其转移至第二递送珠粒以便加载于OxfordNanopore MinION流通池上所需的。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个50μL上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
结果
图45显示了热胁迫、SPRI纯化、纯化珠粒结合、立足点置换以及捕获珠粒结合对于从非靶大肠杆菌DNA富集大肠杆菌16S基因靶的组合效应。结果汇总在下表中,其显示了靶上读段的%。
SPRI 立足点 靶上%
A 10.7%
B 29.5%
C 26.4%
D 48.4%
E 21.4%
F 30.0%
G 50.2%
H 76.1%
具体而言,图45H显示了所有三种富集方法的累加效应。使用上述方案,使用Oxford Nanopore Technologies MinION流通池,用MinKNOW 1.7.14软件运行标准基线测序脚本,在6小时测序轮中收集图45H的数据。期望此下拉中所用的单一crRNA探针AR191能将dCas9导向图42D中列出的七个16S核糖体基因位点中的每一个,其中一个位置被鉴定为位置vii,在相对于PAM位点的位置-2处携带单个错配,并且另一个位置被鉴定为峰i,在相对于PAM位点的位置-6处携带单个错配。在约4.6Mb基因组中,约36kb(约0.78%)的输入DNA(7×中值读段长度,5.1kb)可被认为是靶。
从这轮获得10,482个测序读段,并通过标准碱基判读和比对分析工作流放置所述读段。可将9,245个读段定位到大肠杆菌MG1655基因组(NC_000913.3),其中7,975个(76.1%)被定位到每个所期望的探针杂交位置的3个中值读段长度内。对于位置i、ii、iii、iv、v以及vi中的每一个,测序读段的堆积得到>1,000×的覆盖深度。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
实例8
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定。通过用dCas9分子上的捕获部分‘下拉’,将靶分子与背景分离。dCas9优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过用其它方面为野生型背景的dCas9酶的突变衍生物取代dCas9,所述突变衍生物被称为‘特异性增强型dCas9’,并通过对结合的dCas9蛋白质施加热和盐胁迫,联合在捕获珠粒表面上的后续纯化前的SPRI纯化步骤以去除过量未结合的dCas9,由此降低脱靶,即错配区域的结合。靶DNA分子适用于纳米孔测序,并且dCas9保持与其靶结合,直至被负载于衔接子上的酶置换。
dCas9携带tracrRNA分子,其携带能够捕获珠粒-捕获寡核苷酸缀合物上的靶分子的5'DNA延伸部分(图41的序列a),所述缀合物携带与此延伸部分互补的DNA序列(图41的序列a')。在此实例中,捕获寡核苷酸通过生物素部分连接至珠粒。在此实例中,洗掉非靶DNA,并且靶分子保持与珠粒结合。靶分子然后通过连接至其游离的加dA尾的末端的任一个或两个而适用于纳米孔测序,而dCas9-靶分子与珠粒结合。然后将整个珠粒-靶-RNP组装体递送至流通池以进行测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。然后使用NEB UltraII试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。
将200nM DNA延伸的tracrRNA(AR363)加入到含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl以及1mM MgCl2的缓冲液(被称为dCas9结合缓冲液)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM野生型dCas9(ONLP12326)或‘特异性增强型’dCas9(ONLP12296)并将反应在室温(约21℃)下孵育10分钟。然后将携带3'延伸部分的250nM crRNA(此处不使用延伸部分;AR191)加入到反应中并在室温(约21℃)下再孵育10分钟。最终体积是50μL。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成dCas9-靶复合物,将500ng(约1.2μL)上文基因组DNA(ONLA18816)加入到RNP中并在室温下孵育20分钟。然后将混合物在55℃下孵育5分钟以去除未与其既定靶结合的dCas9。按以下对混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
通过以下使dCas9结合的靶分子与捕获珠粒结合:将12.5μL SPRI洗脱液与10μg捕获珠粒(1μL)和65μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。随后用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mMEDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mM NaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘珠粒-靶复合物’。
来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×LAQA1缓冲液(由New England Biolabs公司赠送)、7μL无核酸酶水、5μL AMX 1D(SQK-LSK108的一部分)以及0.5μL T4 DNA连接酶(NEB目录号M0202)的连接混合物使以上沉淀的珠粒再悬浮而被连接至珠粒-靶复合物。将珠粒在连接混合物中在搅拌下孵育10分钟,沉淀,并用约125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤一次以去除游离的未连接的衔接子。在洗涤后,将珠粒再沉淀一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
图41显示了dCas9-crRNA-tracrRNA-靶-珠粒缀合物的所期望的外观,所述缀合物这里也被称为上样样品。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个50μL上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
结果
图46显示了使用上述方案在6小时测序轮中收集的数据,其使用Oxford NanoporeTechnologies MinION流通池,用MinKNOW 1.7.14软件运行标准基线测序脚本。期望此下拉中所用的单一crRNA探针AR191能将dCas9导向图42D中列出的七个16S核糖体基因位点中的每一个,其中被鉴定为字母C和D的一个位置在相对于PAM位点的位置-2处携带单个错配。这个位置对应于图42D中鉴定的峰vii。最大峰与被标识为C或D的错配峰的高度比对于野生型dCas9和‘特异性增强型’dCas9变体分别是3.33:1和9.45:1。
材料
DNA和寡核苷酸
蛋白质
ONLP12296:化脓性链球菌Cas9 D10A/H840A/K848A/K1003A/R1060A,被称为‘特异性增强型dCas9’:具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
实例9
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定,并且研究了催化活性(‘活的’,野生型)和死的(D10A/H840A)Cas9对读段方向性偏差的影响。方向性偏差可以用于富集特定的读段方向。通过用Cas9分子上的捕获部分‘下拉’,将靶分子与背景分离。Cas9优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过对结合的Cas9蛋白质施加热和盐胁迫,联合在所捕获的珠粒表面上的后续纯化前的SPRI纯化步骤以去除过量的未结合的Cas9,来降低‘脱靶’效应。靶DNA分子适用于纳米孔测序,并且Cas9保持与其靶结合,直至被负载于衔接子上的酶置换。
Cas9携带tracrRNA分子,其携带能够捕获珠粒-捕获寡核苷酸缀合物上的靶分子的5'DNA延伸部分(图41的序列a),所述缀合物携带与此延伸部分互补的DNA序列(图41的序列a')。在此实例中,捕获寡核苷酸通过生物素部分连接至珠粒。在此实例中,洗掉非靶DNA,并且靶分子保持与珠粒结合。靶分子然后通过连接至其游离的加dA尾的末端的任一个或两个而适用于纳米孔测序,而Cas9-靶分子与珠粒结合。然后将整个珠粒-靶-RNP组装体递送至流通池以进行测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
期望催化活性的Cas9能在每个靶位点处产生双链断裂。如果活的Cas9仅保持与切割一侧结合,如Sternberg等人,《自然》(Nature)507,62-67(2014)所展示,那么可期望显著的方向性偏差。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。然后使用NEB UltraII试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。
为了形成含有死的Cas9的核糖核苷酸-蛋白质复合物,将200nM DNA延伸的tracrRNA(AR363)加入到含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl和1mM MgCl2的缓冲液(被称为dCas9结合缓冲液)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM dCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。然后将250nMcrRNA(AR400)加入到反应中并在室温(约21℃)下再孵育10分钟。最终体积是50μL。这种混合物被称为死的RNP。
为了形成含有活的Cas9的核糖核苷酸-蛋白质复合物,将200nM DNA延伸的tracrRNA(AR363)加入到含有20mM HEPES、100mM NaCl、5mM MgCl2、0.1mM EDTA、pH 6.5在25℃下的缓冲液中,所述缓冲液被称为dCas9裂解缓冲液。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM野生型化脓性链球菌dCas9(New England Biolabs公司,目录号M0386T)并将反应在室温(约21℃)下孵育10分钟。然后将250nM crRNA(AR400)加入到反应中并在室温(约21℃)下再孵育10分钟。最终体积是50μL。这种混合物被称为活的RNP。
为了形成Cas9-靶复合物,将500ng(约1.2μL)上文基因组DNA(ONLA18816)加入RNP中并在30℃下孵育30分钟(死的RNP)或在37℃下孵育30分钟(活的RNP)。然后将混合物在55℃下孵育5分钟以去除未与其既定靶结合的Cas9。按以下对混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
通过以下使Cas9结合的靶分子与捕获珠粒结合:将12.5μL SPRI洗脱液与10μg捕获珠粒(1μL)和65μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。随后用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mMEDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mM NaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘珠粒-靶复合物’。
来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×LAQA1缓冲液(由New England Biolabs公司赠送)、7μL无核酸酶水、5μL AMX 1D(SQK-LSK108的一部分)以及0.5μL T4 DNA连接酶(NEB目录号M0202)的连接混合物使以上沉淀的珠粒再悬浮而被连接至珠粒-靶复合物。将珠粒在连接混合物中在搅拌下孵育10分钟,沉淀,并用约125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤一次以去除游离的未连接的衔接子。在洗涤后,将珠粒再沉淀一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
图41显示了Cas9-crRNA-tracrRNA-靶-珠粒缀合物的所期望的外观,所述缀合物这里也被称为上样样品。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个50μL上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
结果
图47显示了使用上述方案在6小时测序轮中收集的数据,其使用Oxford NanoporeTechnologies MinION流通池,用MinKNOW 1.7.14软件运行标准基线测序脚本,在下拉中使用无催化活性的Cas9(‘死的’,A)或具有催化活性的Cas9(‘活的’,B)。期望在这种下拉中使用的单一crRNA探针AR400能将Cas9导向图42D中列出的七个16S核糖体基因位点中的每一个。还可以看到另外的峰*,这是由此实例中升高的孵育温度引起的。‘死的’和‘活的’Cas9的覆盖方向性图分别标识为C和D,表明了由活的Cas9施加的轻微额外方向性偏差。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
实例10
此实例描述了在富集靶分子后通过纳米孔测序多重检测复杂背景中的特定多核苷酸的混合物的方法。在此实例中,对同一个大肠杆菌总基因组样品进行多次单独的富集dCas9‘下拉’,其涉及不同的crRNA探针组合。每个样品与特定DNA条形码衔接子序列连接,使所有样品能够使用同一个流通池同时测序,并使用其条形码衔接子进行鉴定。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。然后使用NEB UltraII试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。然后将500ng的这种文库与来自Oxford Nanopore Technologies的天然条形码试剂盒1D(目录号EXP-NBD103)的七个天然条形码(NB)衔接子NB01、NB02、NB03、NB04、NB05、NB06和NB07中的每一个根据制造商的说明连接。
单独地制备七个样品,每个样品具有不同的crRNA探针组合,如下:将220nM DNA延伸的tracrRNA(AR363)加入含有50mM Tris-Cl(pH 8.0)、150mM NaCl以及1mM EDTA的缓冲液(被称为dCas9-EDTA缓冲液)中。加入100nM dCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。然后将200nM crRNA(总的)加入到反应中并在室温(约21℃)下再孵育10分钟。最终体积是50μL。crRNA的组合如下:(NB01)AR398,(NB02)AR399,(NB03)AR400,(NB04)AR398和AR399,(NB05)AR398和AR400,(NB06)AR399和AR400,(NB07)AR398、AR399和AR400。这七种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
根据下表,此实例中使用的三种crRNA探针中的每一种靶向大肠杆菌染色体的独特区域:
为了形成RNP-靶复合物,将500ng上述携带每个条形码的基因组DNA(ONLA18816)分别加入到每个RNP混合物(NB01至NB07;总共七个)中,并在室温下孵育20分钟。然后将每个混合物在55℃下孵育5分钟以去除未与其既定靶结合的dCas9。按以下对混合物进行1×SPRI纯化:将约50μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。此时,将所有七个样品合并到一个管中。使用磁力分离器使珠粒沉淀,并用约1mL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
通过以下使dCas9结合的靶分子与捕获珠粒结合:将12.5μL的SPRI洗脱液与30μg捕获珠粒(1μL)和65μL的包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液一起在搅拌下孵育20分钟。随后用含有50mM Tris-Cl(pH8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤珠粒三次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘条形码化珠粒-靶复合物’。
来自Oxford Nanopore Technologies的天然条形码试剂盒1D(EXP-NBD103)的载酶衔接子混合物(管‘BAM’)通过用包含12.5μL 2×平端/TA连接酶主混合物(New EnglandBiolabs公司,目录号M0367)、5μL BAM(Oxford Nanopore Technologies有限公司,试剂盒EXP-NBD103)以及7.5μL无核酸酶水的连接混合物使以上沉淀的珠粒在室温下再悬浮10分钟而被连接到条形码化珠粒-靶复合物,使其沉淀,并用约125μL的含有50mM Tris-Cl(pH8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤一次以去除游离的未连接的衔接子。在洗涤后,将珠粒再沉淀一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为条形码化上样样品。
图48A显示了dCas9-crRNA-tracrRNA-靶-珠粒缀合物的所期望的外观,其连接有条形码衔接子,在此也被称为条形码化上样样品。除了在靶与载酶衔接子之间存在条形码衔接子序列之外,所述样品类似于图41中所示的样品,所述条形码衔接子序列(除了靶序列外)鉴定样品。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个50μL条形码化上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据Oxford Nanopore Technologies的天然条形码试剂盒的标准客户工作流收集和分析数据。
结果
图48D显示了使用上述多重方案在6小时测序轮中收集的与大肠杆菌基因组比对的读段的覆盖图。在单个Oxford Nanopore Technologies MinION流通池上操作样品,使用MinKNOW 1.7.14软件运行标准基线测序脚本,并使用适合于所用天然条形码试剂盒的Oxford Nanopore Technologies工作流进行分析。
根据下表,NB01至NB07中的每个条形码都与大肠杆菌序列的特定区域的下拉相关。图48D的覆盖图显示了每个特定靶区的条形码序列的成功解卷积。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
实例11
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定。通过用dCas9分子上的捕获部分‘下拉’,将靶分子与背景分离。dCas9优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过对结合的dCas9蛋白质施加热和盐胁迫,联合在珠粒表面上的后续捕获前的SPRI纯化步骤以去除过量的未结合的dCas9,来降低‘脱靶’效应。
在此实例中,DNA分析物可以在与捕获珠粒结合的同时以不同方式进行调整:(1)可以对高分子量基因组DNA进行剪切,末端修复,加dA尾,并使用适当的末端连接至衔接子;或(2)可以使用转座酶系统,例如Oxford Nanopore Technologies快速1D测序试剂盒(SQK-RAD003)所采用的转座酶系统,同时剪切和调整高分子量DNA。衔接子可允许在珠粒上对捕获的分析物进行其它化学反应,同时洗掉过量组分,如游离衔接子。例如,通过在连接酶衔接子之前连接适当的衔接子化学物质,分析物可以适用于Oxford Nanopore Technologies的1D2技术。或者,可以连接衔接子,其允许通过PCR扩增捕获的靶,并从珠粒中释放捕获的分析物。
除了通过PCR释放捕获的靶的实例之外,将整个珠粒-靶-RNP组装体递送至流通池用于测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。使用NEB Ultra II试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。这种样品被称为‘加dA尾的基因组DNA’。
在室温下,使500ng的加dA尾的基因组DNA与来自Oxford NanoporeTechnologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(‘AMX 1D’)在包含12.5μL 2×平端/TA主混合物(New England Biolabs公司,目录号M0367)、7.5μL无核酸酶水以及5μL AMX 1D(SQK-LSK108的一部分)中连接10分钟。连接后,通过0.4×SPRI纯化去除未连接的衔接子,并在10mM Tris-Cl、20mM NaCl,pH 8.0中从SPRI珠粒洗脱调整后的文库。这种样品被称为‘预连接的基因组DNA’。
剪切1μg大肠杆菌高分子量基因组DNA样品并通过以下在单个步骤中引入粘端:将约1μg DNA与2.5μL FRA(来自Oxford Nanopore Technologies有限公司的SQK-RAD003)一起以总体积10μL在30℃下孵育20分钟,然后在80℃下孵育1分钟。将500μL AMPure XP SPRI珠粒在无核酸酶水中洗涤五次,然后再悬浮于初始体积的包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液中,得到‘洗涤后的SPRI珠粒’。基因组DNA样品使用0.4ב洗涤后的SPRI珠粒’进行纯化,并通过将SPRI珠粒与12.5μL包含0.1×TE的缓冲液一起在室温下孵育5分钟进行洗脱。使珠粒再沉淀一次,并保留被称为‘转座酶片段化的基因组DNA’的上清液。
将200nM DNA延伸的tracrRNA(AR363)加入到含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl以及1mM MgCl2的缓冲液(被称为dCas9结合缓冲液)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nM dCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。然后将250nM crRNA(AR400)加入到反应中并在室温(约21℃)下再孵育10分钟。每个反应的最终体积是50μL。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成dCas9-靶复合物,将500ng(约1.2μL)的转座酶片段化的基因组DNA、加dA尾的基因组DNA或预连接的基因组DNA加入到每个反应的RNP中并在室温下孵育20分钟。然后将混合物在55℃下孵育5分钟以去除未与其既定靶结合的dCas9。按以下对每个混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
dCas9结合的靶分子(与转座酶片段化的基因组DNA、加dA尾的基因组DNA或预调整的基因组DNA结合的)通过以下与捕获珠粒结合:将12.5μL SPRI洗脱液与10μg捕获珠粒(1μL)和65μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mM NaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘珠粒-靶复合物’。
在一个反应中,来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×平端/TA主混合物(NewEngland Biolabs公司,目录号M0367)、7.5μL无核酸酶水以及5μL AMX 1D(SQK-LSK108的一部分)的连接混合物使以上沉淀的珠粒在室温下再悬浮10分钟而被连接至被捕获在珠粒上的加dA尾的基因组DNA。这种样品被称为‘珠粒连接的1D’样品。
在第二反应中,通过进行两次依序连接来使分析物准备好进行‘1D2’测序,同时靶与珠粒结合。在第一连接反应中,将珠粒再悬浮于2.5μl 1D2衔接子、25μl平端/TA连接酶主混合物以及22.5μL无核酸酶水中,并在室温下孵育10分钟。孵育10分钟后,将另外的10μLBAM和10μL平端/TA连接酶主混合物加入到珠粒中,并在室温下再孵育10分钟。这种样品被称为‘1D2’样品。
在第三反应中,与珠粒结合的转座酶片段化的基因组DNA通过将珠粒在含有1×RBF和1μL RPD(来自SQK-RAD003)的缓冲液中再悬浮10分钟而适用于测序。这种样品被称为‘快速1D’样品。
在上述每次连接后,使珠粒在连接后沉淀,在125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液中洗涤一次,并再悬浮于50μL的RBF(来自SQK-LSK108)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
对于含有与珠粒结合的经过预调整的基因组DNA的样品,将珠粒在125μL含有50mMTris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液中再洗涤一次,并再悬浮于50μL的RBF(SQK-LSK108的组分)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为‘预连接的样品’。
在另一个反应中,来自Oxford Nanopore Technologies的低输入PCR试剂盒(SQK-LWP001)的PCR-衔接子(管‘PCA’)通过用包含50μL 2×平端/TA主混合物(New EnglandBiolabs公司,目录号M0367)、30μL无核酸酶水以及20μL PCA的连接混合物使以上沉淀的珠粒在室温下再悬浮10分钟而被连接至被捕获在珠粒上的加dA尾的基因组DNA。连接后,将珠粒在另外125μL的10mM Tris-Cl(pH 8.0)、20mM NaCl中洗涤,并再悬浮于含有50μLLongAmp Taq 2×主混合物(NEB目录号M0287)、2μL WGP引物以及48μL无核酸酶水的混合物中。对混合物进行PCR扩增,包括在94℃下30秒变性,以及10个以下循环:在94℃下30秒变性,在62℃下30秒退火以及在65℃下500秒延伸。使用如上所述预洗涤的AMPure XP珠粒对这个样品进行0.4×SPRI纯化。在室温下,从10μL的10mM Tris-Cl(pH8.0)、20mM NaCl中的SPRI珠粒洗脱样品5分钟。在从SPRI珠粒洗脱之后,加入1μL RPD(SQK-LWP001),并将混合物在室温下孵育10分钟以通过点击化学连接测序衔接子。还另外加入了35μL的RBF、25μL的LLB以及5μL无核酸酶水。这种样品被称为‘PCR’样品。
给五个Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。每个样品:1D2、PCR、快速1D、珠粒连接的以及预连接的,用移液管逐滴移取至五个流通池中的每一个的SpotON孔口中,并使流体被芯吸至流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
图49显示了三个示例性工作流:(1)通过将无酶衔接子连接到与珠粒结合的被捕获的靶分析物的末端而进行的dCas9无酶检测;(2)通过连接PCR衔接子,然后如上所述对靶进行PCR扩增,以从珠粒中释放靶来富集靶;以及(3)1D2条形码衔接子,然后是测序衔接子的依序连接,用于高准确度纳米孔测序。
图50显示了实例11中所述的示例工作流,用于通过转座酶介导的DNA剪切从高分子量DNA快速富集靶,同时伴随加入粘端用于衔接子连接。然后如实例11中所述,将dCas9与剪切后的DNA结合;通过胁迫步骤使脱靶效应最小化,并通过点击化学连接测序衔接子。这个工作流利用Oxford Nanopore Technologies SQK-RAD003试剂盒,其中在转座酶片段化和衔接子连接步骤之间插入Cas9结合和珠粒捕获步骤,如实例10中所述。
结果
上述每个工作流的结果产生的结果与图42中描述的结果非常相似,即从全基因组样品靶向富集大肠杆菌rrs基因。此实例中唯一的不同之处是用于连接测序衔接子的最终制备方法。通过依序连接条形码,然后是载酶测序衔接子来连接1D2衔接子的能力提高了纳米孔测序的单分子准确度。通过转座酶连接衔接子,然后通过点击化学进行无酶连接的能力,可以为最终用户提供更大的便利,从而加快样品制备时间。连接PCR衔接子的能力可以为最终用户提供显著改善的灵敏度,实现从更低输入量的起始材料中检测富集靶。
在靶分析物与珠粒结合时测序衔接子的连接能够使过量的衔接子在连接步骤后被方便地洗掉,过量衔接子会通过污染孔或消耗核苷酸浓度而使纳米孔测序反应中毒。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。
实例12
此实例描述了在富集靶分子后通过纳米孔测序检测复杂背景中的特定多核苷酸的方法。在此实例中,靶DNA分子主要通过其序列来鉴定。通过用具有催化活性的(‘活的’,野生型)Cpf1(ONLP12350)或死的(E993A或D908A)dCpf1(ONLZ11882或ONLZ11883)上的捕获部分‘下拉’,将靶分子与背景分离。Cpf1或dCpf1优选通过针对大肠杆菌的核糖体16S(rrs)基因的crRNA与靶分子结合。通过对结合的Cpf1或dCpf1蛋白质施加热和盐胁迫,联合在珠粒表面上的后续捕获前的SPRI纯化步骤以去除过量的未结合的Cpf1或dCpf1,来降低‘脱靶’效应。
Cpf1或dCpf1携带crRNA分子,其携带能够捕获珠粒-捕获寡核苷酸缀合物上的靶分子的5'DNA延伸部分(AR766),所述缀合物携带与此延伸部分互补的DNA序列(AR364),如图RB12所描绘。在此实例中,捕获寡核苷酸通过生物素部分连接至珠粒。在此实例中,洗掉非靶DNA,并且靶分子保持与珠粒结合。靶分子然后通过连接至其游离的加dA尾的末端中的任一个或两个而适用于纳米孔测序,同时Cpf1靶分子与珠粒结合。然后将整个珠粒-靶-RNP组装体递送至流通池以进行测序。组装体通过施加放置在流通池下方的磁场而被带到流通池的阱中,或可以通过重力沉降。通过使与衔接子末端杂交的寡核苷酸胆固醇系链流过珠粒以使珠粒拴系至膜而开始测序。或者,在将珠粒-靶缀合物加入到流通池之前,可以在‘冲洗’步骤期间将胆固醇系链引入膜中。
方法
大肠杆菌全基因组文库ONLA18816使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5.9kb的中值大小来制备。使用NEB Ultra II试剂盒根据制造商的说明对此文库进行末端修复和加dA尾。在末端修复和加dA尾之后,对片段化的基因组DNA进行0.4×SPRI纯化并将其从0.1×TE中的SPRI珠粒上洗脱下来。这种样品被称为‘加dA尾的基因组DNA’。
将250nM DNA延伸的crRNA(AR766)加入到含有50mM Tris-HCl(pH 8.0)、100mMNaCl、10mM MgCl2以及1mM DTT的缓冲液(被称为Cpf1结合缓冲液)中。将crRNA加热至95℃保持2分钟并使其冷却至室温,之后加入500nM Cpf1(ONLP12326)并将反应在室温(约21℃)下孵育20分钟。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成Cpf1-靶复合物,将500ng(约1.2μL)上文基因组DNA(ONLA18816)加入到RNP中并在室温下孵育60分钟。将混合物在55℃下孵育5分钟以去除未与其既定靶结合的Cpf1。按以下对混合物进行1×SPRI纯化:将51μL AMPure XP珠粒加入混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mMTris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL包含40mM CAPS(pH 10.0)、40mM KCl的缓冲液一起孵育5分钟来进行洗脱。将珠粒再沉淀一次,并保留被称为‘SPRI洗脱液’的上清液。
将50μg Solulink‘Nanolink’链霉亲和素磁珠(5μL)与2.5μL的AR364捕获寡核苷酸一起在约120μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2M NaCl、1mM EDTA、0.05%(v/v)Tween-20的缓冲液中在搅拌下孵育约1小时。通过用相同的缓冲液洗涤珠粒两次去除未结合的寡核苷酸,使用磁力分离器使珠粒沉淀。这种缀合物被称为‘捕获珠粒’。
通过以下使Cpf1或dCpf1结合的靶分子与捕获珠粒结合:将12.5μL SPRI洗脱液与10μg捕获珠粒(1μL)和65μL戴诺磁珠千碱基BINDER结合溶液(Thermo Scientific目录号60101)一起在搅拌下孵育20分钟。用含有50mM Tris-Cl(pH 8.0,在4℃下)、150mM NaCl、1mM EDTA的缓冲液洗涤珠粒三次,并用含有50mM Tris-Cl(pH 8.0,在4℃下)、20mM NaCl的缓冲液洗涤一次。在这个步骤之后,使珠粒沉淀并去除上清液。这种样品被称为‘珠粒-靶复合物’。
来自Oxford Nanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的载酶衔接子(管‘AMX 1D’)通过用包含12.5μL 2×平端/TA主混合物(New England Biolabs公司,目录号M0367)、7.5μL无核酸酶水以及5μL AMX 1D(SQK-LSK108的一部分)的连接混合物使以上沉淀的珠粒在室温下再悬浮10分钟而被连接至被捕获在珠粒上的加dA尾的基因组DNA。这种样品被称为‘珠粒连接的1D’样品。
使珠粒在连接后沉淀,在125μL含有50mM Tris-Cl(pH 8.0,在4℃下)、150mMNaCl、1mM EDTA的缓冲液中洗涤一次,并再悬浮于50μL的RBF(来自SQK-LSK108)中,所述RBF根据制造商的说明稀释至1×。这种混合物被称为上样样品。
给Oxford Nanopore MinION流通池灌注800μL含有50nM系链寡核苷酸的1×RBF,所述物质用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将上样样品用移液管逐滴移取到流通池的SpotON孔口中,并使流体被芯吸到流通池中。立即开始MinION数据收集,并根据标准客户协议收集和分析数据。
结果
上述工作流的结果产生的结果与图42中所示的结果和图47中所示的结果非常相似,即从全基因组样品靶向富集大肠杆菌rrs基因。活的Cpf1可能会产生方向性偏差。此实例中的不同之处是:用于形成RNP的CRISPR蛋白质(即Cpf1或dCpf1,而不是Cas9或dCas9),以及使用单个DNA延伸的crRNA来形成RNP。
在靶分析物与珠粒结合时测序衔接子的连接能够使过量的衔接子在连接步骤后被方便地洗掉,过量衔接子会通过污染孔或消耗核苷酸浓度而使纳米孔测序反应中毒。
材料
DNA和寡核苷酸
蛋白质
ONLP12350:氨基酸球菌属Cpf1,具有TEV可裂解接头的N端Twin-Strep标签;括号中的粗体显示被TEV裂解的部分:
/>
ONLZ11882:氨基酸球菌属Cpf1 D908A,具有TEV可裂解接头的N端Twin-Strep标签;括号中的粗体显示被TEV裂解的部分:
ONLZ11883:氨基酸球菌属Cpf1 E993A,具有TEV可裂解接头的N端Twin-Strep标签;括号中的粗体显示被TEV裂解的部分:
实例13
此实例描述了一种通过纳米孔检测对人类背景中的特定噬菌体λ多核苷酸进行快速检测和定量的方法。在此实例中,通过一个或多个携带亲和标签的dCas9-RNP复合物来接触靶DNA,所述亲和标签可以用于将靶分子固定在表面上(‘固定dCas9复合物’),而一个或多个额外的dCas9-RNP复合物(‘条形码Cas9复合物’)接触第二区域中的靶DNA分子。‘条形码dCas9复合物’携带载酶衔接分子,其电流特征用于确认dCas9与其靶结合。通过条形码鉴定靶区域的存在,而通过固定在膜表面上来增强靶DNA相对于非靶DNA的检测灵敏度。因此,两种类型的dCas9复合物都需要与相同的靶分子结合以成功检测条形码序列。在此实例中,不需要洗掉非靶DNA。
方法
噬菌体λ全基因组文库(NEB目录号N3013)使用Covaris gTube按照制造商的说明通过随机片段化大肠杆菌高分子量基因组DNA至约5kb的中值大小来制备。人类全基因组文库也是通过使用Covaris gTube按照制造商的说明通过随机片段化高分子量基因组DNA(Sigma Aldrich,目录号000000011691112001)至约5kb的中值大小来制备。
‘载酶crRNA’通过以下制备:使寡核苷酸OLIGO_1,一种携带3'DNA延伸部分的crRNA寡核苷酸,和OLIGO_2,一种DNA衔接子寡核苷酸,在PCR机器中在10mM Tris-Cl(pH8.0)、1mM EDTA、200mM NaCl中以40μM的每个寡核苷酸通过加热至95℃持续2分钟并在约2小时内缓慢冷却至20℃来进行杂交。这个退火反应产生具有crRNA部分和DNA延伸部分的杂交分子,它是双链体并携带3'dA-突出端,被称为‘crRNA衔接子’。来自OxfordNanopore Technologies的1D测序连接试剂盒(SQK-LSK108)的AMX 1D酶衔接子通过将5μLAMX 1D(其携带dT-突出端)与1μM的‘crRNA衔接子’(1.25μL)、50μL 2×NEB平端/TA主混合物以及43.8μL无核酸酶水一起以约100μL的总体积在室温下孵育10分钟而被连接至‘crRNA衔接子’。通过以下去除过量的未连接材料:加入3.8×体积的AMPure XP SPRI珠粒,所述珠粒已经在50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、28%(w/v)PEG-8000中经过平衡,在包含10mM Tris-Cl(pH 8.0)、20mM NaCl的缓冲液中洗脱‘载酶crRNA’。
‘胆固醇系链’通过以下制备:使寡核苷酸AR131和AR132在PCR机器中在10mMTris-Cl(pH 8.0)、1mM EDTA、200mM NaCl中以40μM每个寡核苷酸通过加热至95℃持续2分钟并在约2小时内缓慢冷却至20℃来进行杂交。此退火反应产生含有与下文crRNA AR140具有互补性的3'突出端的杂交分子。
将200nM‘Alt-R’tracrRNA(Integrated DNA Technologies公司,目录号1072532)加入含有25mM HEPES-NaOH(pH 8.0)、150mM NaCl以及1mM MgCl2的缓冲液(被称为dCas9结合缓冲液)中。将tracrRNA加热至90℃持续2分钟并在湿冰上快速冷却,之后加入100nMdCas9(ONLP12326)并将反应在室温(约21℃)下孵育10分钟。加入两种crRNA的等摩尔混合物:125nM AR140,其携带一个3'DNA延伸序列;和125nM上文‘载酶crRNA’,其携带测序衔接子。在室温(约21℃)下继续孵育10分钟。最终体积是约50μL。这种混合物被称为核糖核苷酸-蛋白质复合物(RNP)。
为了形成dCas9-靶复合物,将从0至100ng的不同量的上文噬菌体λ基因组DNA与恒定的1μg(总共5μL)的上文人类DNA混合,加入RNP中并在室温下孵育20分钟。按以下对混合物进行1×SPRI纯化以去除过量未结合的dCas9、crRNA和tracrRNA:将51μLAMPure XP珠粒加入到混合物中,通过温和再悬浮混合,并在室温下孵育10分钟。使用磁力分离器使珠粒沉淀,并用约250μL包含50mM Tris-Cl(pH 8.0,在4℃下)、2.5M NaCl、20%(w/v)PEG-8000的缓冲液洗涤两次,并且通过将SPRI珠粒与12.5μL的10mM Tris-Cl(pH 8.0)、20mM NaCl一起孵育来进行洗脱。向12.5μL的洗脱液中加入35μL RBF、25μLLLB(均为SQK-LSK108的组分,Oxford Nanopore Technologies)以及2.5μL无核酸酶水。这种样品被称为‘上样样品’。
给Oxford Nanopore MinION流通池灌注800μL含有50nM‘胆固醇系链’的1×RBF,其携带与AR134A的互补性和胆固醇部分,用移液管通过其入口端移取;然后暂停10分钟;随后灌注200μL相同的混合物,所述混合物用移液管通过其入口端移取,SpotON孔口打开。将整个75μL上样样品用移液管逐滴移取到SpotON孔口中,并使流体被芯吸到流通池中。不冲洗流通池,并且靶分析物相对于背景的定量是可能的,因为膜拴系的分析物优先被纳米孔捕获。立即开始MinION数据收集,并通过计数衔接子事件的数量来收集和分析数据。
结果
图52以草图形式显示了上述实例。纳米孔测序读出被特征事件L1(其可以通过碱基判读产生条形码序列b)打断,所述事件取决于载酶衔接子C,所述衔接子的频率取决于靶分析物(膜拴系的物种G,和溶液物种H)的浓度;膜拴系的物种G优先被纳米孔J捕获,因为它靠近纳米孔。针对恒定量的人类非靶DNA滴定靶分析物(噬菌体λ)产生事件L1的频率对靶分析物浓度的图M。事件L1在零靶分析物浓度下的频率(N)证明了从溶液中捕获的物种H(即未被拴系在表面上)的‘假阳性’或背景检测速率。
材料
DNA和寡核苷酸
蛋白质
ONLP12326:化脓性链球菌Cas9 D10A/H840A,具有TEV可裂解接头的C端Twin-Strep标签;括号内的粗体显示被TEV裂解的部分(以上序列)。

Claims (10)

1.一种检测样品中的靶多核苷酸的方法,其包含:
(a)使所述样品与以下的(i)和(ii)接触;
(i)为与所述靶多核苷酸中的第一序列结合的第一指导多核苷酸和第一多核苷酸指导的效应蛋白,其中,所述第一指导多核苷酸上连接有衔接子;
(ii)为与所述靶多核苷酸中的第二序列结合的第二指导多核苷酸和第二多核苷酸指导的效应蛋白,其中,所述第二指导多核苷酸或第二多核苷酸指导的效应蛋白上连接有能够与表面偶联的衔接子;
其中,所述指导多核苷酸是指导RNA,所述多核苷酸指导的效应蛋白是Cas蛋白,所述指导多核苷酸和多核苷酸指导的效应蛋白与所述样品中存在的任何靶多核苷酸形成复合物,
(b)使所述样品与包含跨膜孔的膜接触;
(c)跨所述膜施加电位差;以及
(d)监测由所述复合物与所述跨膜孔的相互作用引起的效应的存在或不存在,以确定所述复合物的存在或不存在,从而检测所述样品中的所述靶多核苷酸。
2.根据权利要求1所述的方法,其中,所述Cas蛋白的核酸酶活性被禁用。
3.根据权利要求2所述的方法,其中,所述Cas核酸内切酶的一个或多个催化核酸酶位点被灭活。
4.根据权利要求3所述的方法,其中,所述Cas蛋白是Cas9。
5.根据权利要求1至4中任一项所述的方法,其中,所述靶多核苷酸是双链的或包含双链区域和/或是DNA、DNA/RNA杂交体或RNA。
6.根据权利要求1至5中任一项所述的方法,其进一步包含在步骤(b)之前选择性地使任何未与所述靶多核苷酸特异性结合的多核苷酸指导的效应蛋白变性和/或去除任何未与所述靶多核苷酸特异性结合的多核苷酸指导的效应蛋白。
7.根据权利要求6所述的方法,其中,任何未与所述靶多核苷酸特异性结合的多核苷酸指导的效应蛋白通过加热到约50℃至约60℃而变性。
8.根据权利要求6或7所述的方法,其中,未与所述靶多核苷酸特异性结合的多核苷酸指导的效应蛋白与包含所述指导多核苷酸、多核苷酸指导的效应蛋白以及靶多核苷酸的所述复合物通过使所述样品中的所述多核苷酸与珠粒或柱子结合而分离。
9.根据权利要求8所述的方法,其包含向所述样品中加入聚乙二醇(PEG)和氯化钠并使所述样品与涂有羧基的顺磁珠接触,使得所述样品中存在的所述多核苷酸与所述珠粒结合。
10.根据权利要求1至9中任一项所述的方法,其中,所述指导多核苷酸包含与所述靶多核苷酸中的序列结合的核苷酸序列和与所述多核苷酸指导的效应蛋白结合的核苷酸序列。
CN202311365839.0A 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法 Pending CN117363706A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
GB1616590.4 2016-09-29
GBGB1616590.4A GB201616590D0 (en) 2016-09-29 2016-09-29 Method
CN201780073778.7A CN110088299B (zh) 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法
PCT/GB2017/052946 WO2018060740A1 (en) 2016-09-29 2017-09-29 Method for nucleic acid detection by guiding through a nanopore

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201780073778.7A Division CN110088299B (zh) 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法

Publications (1)

Publication Number Publication Date
CN117363706A true CN117363706A (zh) 2024-01-09

Family

ID=57571132

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201780073778.7A Active CN110088299B (zh) 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法
CN202311365839.0A Pending CN117363706A (zh) 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201780073778.7A Active CN110088299B (zh) 2016-09-29 2017-09-29 通过纳米孔指导的核酸检测方法

Country Status (6)

Country Link
US (2) US11085078B2 (zh)
EP (1) EP3519585B1 (zh)
JP (1) JP7065083B2 (zh)
CN (2) CN110088299B (zh)
GB (1) GB201616590D0 (zh)
WO (1) WO2018060740A1 (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9758823B2 (en) 2011-10-21 2017-09-12 Oxford Nanopore Technologies Limited Enzyme method
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
CN117947149A (zh) 2013-10-18 2024-04-30 牛津纳米孔科技公开有限公司 经修饰的酶
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
GB201616590D0 (en) 2016-09-29 2016-11-16 Oxford Nanopore Technologies Limited Method
WO2018200847A1 (en) * 2017-04-27 2018-11-01 The Regents Of The University Of California Methods of producing ribosomal ribonucleic acid complexes
GB201808554D0 (en) 2018-05-24 2018-07-11 Oxford Nanopore Tech Ltd Method
JP2021531025A (ja) * 2018-07-27 2021-11-18 パロゲン, インコーポレイテッドPalogen, Inc. ナノポアデバイスおよびこれを用いた荷電粒子の検出方法
EP3650553B1 (en) * 2018-11-07 2023-07-12 Siemens Healthcare GmbH Method for detection of specific nucleic acids
EP3650558A1 (en) * 2018-11-07 2020-05-13 Siemens Healthcare GmbH Liquid sample workflow for nanopore sequencing
US20220154173A1 (en) * 2019-07-12 2022-05-19 Iiiumina Cambridge Limited Compositions and Methods for Preparing Nucleic Acid Sequencing Libraries Using CRISPR/CAS9 Immobilized on a Solid Support
GB201913997D0 (en) 2019-09-27 2019-11-13 Oxford Nanopore Tech Ltd Method
CN112831395B (zh) * 2019-11-25 2024-01-16 深圳华大生命科学研究院 用于纳米孔测序的类细胞膜
CN111440846B (zh) * 2020-04-09 2020-12-18 江苏先声医学诊断有限公司 一种用于纳米孔测序建库的位置锚定条码系统
CN111424075B (zh) * 2020-04-10 2021-01-15 西咸新区予果微码生物科技有限公司 一种基于第三代测序技术的微生物检测方法及系统
CN111638332B (zh) * 2020-07-13 2023-12-19 浙江省人民医院 一种新型冠状病毒IgA/IgM/IgG抗体ELISA检测试剂盒
CN112301116B (zh) * 2020-08-18 2023-04-11 天津大学 非诊断目的基于CRISPR/Cas技术超灵敏检测miRNA的方法
US20240125797A1 (en) * 2021-01-26 2024-04-18 CZ Biohub SF, LL Quantification of cellular proteins using barcoded binding moieties
CN112941178B (zh) * 2021-02-04 2024-01-23 南京邮电大学 一种用于snp位点检测的检测探针、检测方法及其应用
CN113252764B (zh) * 2021-04-27 2022-04-29 广州大学 一种核酸纳米结构及其制备方法与应用
WO2023023561A1 (en) * 2021-08-17 2023-02-23 Quantapore, Inc. Multiplex binding assays with optical nanopore readout
GB202114183D0 (en) 2021-10-04 2021-11-17 Oxford Nanopore Tech Ltd Method
CN114134142B (zh) * 2021-11-23 2024-05-28 成都齐碳科技有限公司 衔接体、复合物、单链分子、试剂盒、方法和应用
CN114262735A (zh) * 2021-12-15 2022-04-01 成都齐碳科技有限公司 用于表征多核苷酸的衔接体及其用途
GB202204919D0 (en) 2022-04-04 2022-05-18 Oxford Nanopore Tech Plc Method
WO2023222657A1 (en) 2022-05-17 2023-11-23 Oxford Nanopore Technologies Plc Method and adaptors
WO2023229010A1 (ja) * 2022-05-26 2023-11-30 キッコーマン株式会社 微生物の検出方法及び検出デバイス

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016028843A2 (en) * 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids
WO2016059375A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Methods for delivering an analyte to transmembrane pores

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
EP2122344B8 (en) 2007-02-20 2019-08-21 Oxford Nanopore Technologies Limited Lipid bilayer sensor system
US8698481B2 (en) 2007-09-12 2014-04-15 President And Fellows Of Harvard College High-resolution molecular sensor
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
JP2012516145A (ja) 2009-01-30 2012-07-19 オックスフォード ナノポア テクノロジーズ リミテッド ハイブリダイゼーションリンカー
JP5873023B2 (ja) 2009-12-01 2016-03-01 オックスフォード ナノポール テクノロジーズ リミテッド 生化学分析機器
US9593370B2 (en) 2010-10-01 2017-03-14 Oxford Nanopore Technologies Ltd. Biochemical analysis apparatus and rotary valve
US9751915B2 (en) 2011-02-11 2017-09-05 Oxford Nanopore Technologies Ltd. Mutant pores
US9347929B2 (en) 2011-03-01 2016-05-24 The Regents Of The University Of Michigan Controlling translocation through nanopores with fluid wall
US9758823B2 (en) 2011-10-21 2017-09-12 Oxford Nanopore Technologies Limited Enzyme method
US10385382B2 (en) 2011-12-29 2019-08-20 Oxford Nanopore Technologies Ltd. Enzyme method
EP2798083B1 (en) 2011-12-29 2017-08-09 Oxford Nanopore Technologies Limited Method for characterising a polynucelotide by using a xpd helicase
WO2013153359A1 (en) 2012-04-10 2013-10-17 Oxford Nanopore Technologies Limited Mutant lysenin pores
DE202013012242U1 (de) 2012-05-25 2016-02-02 Emmanuelle Charpentier Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription
EP2875152B1 (en) 2012-07-19 2019-10-09 Oxford Nanopore Technologies Limited Enzyme construct
EP2875128B8 (en) 2012-07-19 2020-06-24 Oxford Nanopore Technologies Limited Modified helicases
EP2875154B1 (en) 2012-07-19 2017-08-23 Oxford Nanopore Technologies Limited SSB method for characterising a nucleic acid
CA2889664C (en) 2012-10-26 2020-12-29 Oxford Nanopore Technologies Limited Droplet interfaces
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
EP2917366B1 (en) 2012-11-06 2017-08-02 Oxford Nanopore Technologies Limited Quadruplex method
US11466306B2 (en) 2013-02-14 2022-10-11 Osaka University Method for isolating specific genomic regions with use of molecule capable of specifically binding to endogenous DNA sequence
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
US9873907B2 (en) 2013-05-29 2018-01-23 Agilent Technologies, Inc. Method for fragmenting genomic DNA using CAS9
CN117947149A (zh) 2013-10-18 2024-04-30 牛津纳米孔科技公开有限公司 经修饰的酶
WO2015075056A1 (en) 2013-11-19 2015-05-28 Thermo Fisher Scientific Baltics Uab Programmable enzymes for isolation of specific dna fragments
CN106460061B (zh) 2014-04-04 2020-03-06 牛津纳米孔技术公司 在双链核酸分子的两端使用纳米孔和锚分子来表征所述双链核酸的方法
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
CA2955382C (en) 2014-07-21 2023-07-18 Illumina, Inc. Polynucleotide enrichment using crispr-cas systems
WO2016028887A1 (en) 2014-08-19 2016-02-25 Pacific Biosciences Of California, Inc. Compositions and methods for enrichment of nucleic acids
WO2016034591A2 (en) 2014-09-01 2016-03-10 Vib Vzw Mutant pores
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
GB201616590D0 (en) 2016-09-29 2016-11-16 Oxford Nanopore Technologies Limited Method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016028843A2 (en) * 2014-08-19 2016-02-25 President And Fellows Of Harvard College Rna-guided systems for probing and mapping of nucleic acids
WO2016059375A1 (en) * 2014-10-17 2016-04-21 Oxford Nanopore Technologies Limited Methods for delivering an analyte to transmembrane pores

Also Published As

Publication number Publication date
WO2018060740A1 (en) 2018-04-05
US20200024654A1 (en) 2020-01-23
JP7065083B2 (ja) 2022-05-11
JP2019532642A (ja) 2019-11-14
EP3519585B1 (en) 2022-06-08
CN110088299A (zh) 2019-08-02
US11085078B2 (en) 2021-08-10
US20220064723A1 (en) 2022-03-03
CN110088299B (zh) 2024-03-12
EP3519585A1 (en) 2019-08-07
GB201616590D0 (en) 2016-11-16
US11739379B2 (en) 2023-08-29

Similar Documents

Publication Publication Date Title
CN110088299B (zh) 通过纳米孔指导的核酸检测方法
US20230084931A1 (en) Methods and systems for characterizing analytes using nanopores
US20220090192A1 (en) Method of nanopore sequencing of concatenated nucleic acids
US20210087621A1 (en) Method of target molecule characterisation using a molecular pore
EP3207157B2 (en) Methods for delivering a polynucleotide to transmembrane pores
US11920193B2 (en) Method of characterizing a polynucleotide
EP4063521B1 (en) Method of nanopore sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination