CN117337333A - 用于补体链测序的方法 - Google Patents

用于补体链测序的方法 Download PDF

Info

Publication number
CN117337333A
CN117337333A CN202280035082.6A CN202280035082A CN117337333A CN 117337333 A CN117337333 A CN 117337333A CN 202280035082 A CN202280035082 A CN 202280035082A CN 117337333 A CN117337333 A CN 117337333A
Authority
CN
China
Prior art keywords
nucleic acid
stranded nucleic
nanopore
pair
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280035082.6A
Other languages
English (en)
Inventor
保罗·理查德·穆迪
詹森·罗伯特·海德
詹姆斯·安东尼·克拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oxford Nanopore Technology Public Co ltd
Original Assignee
Oxford Nanopore Technology Public Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oxford Nanopore Technology Public Co ltd filed Critical Oxford Nanopore Technology Public Co ltd
Publication of CN117337333A publication Critical patent/CN117337333A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。在一些实施方案中,所述方法包括:增加系链剂的浓度。在一些实施方案中,所述方法包括:使用具有刚性(或加强)前导区段的衔接子。还提供了可以在所述方法中使用的组合物和系统,所述组合物和系统包括例如用于附接至双链多核苷酸和/或系链剂的衔接子。

Description

用于补体链测序的方法
背景技术
目前,广泛的应用需要快速且廉价的多核苷酸(例如,DNA或RNA)测序和识别技术。链测序通常涉及使用多核苷酸结合蛋白(诸如解旋酶)来控制多核苷酸通过纳米孔的移动。双链多核苷酸可以通过在通过纳米孔的易位之前分离链以提供单链多核苷酸来确定。双链多核苷酸的两条链可以通过桥接部分(诸如发夹环)连接,以便确保正向(模板)链的易位之后是反向(补体)链的易位。然而,这种发夹连接的多核苷酸的制备会增加样品制备时间并导致有价值分析物的损失。此外,发夹连接的模板和补体多核苷酸链通过纳米孔的易位可能引起该纳米孔另一(反式)侧上的链的重新杂交。这可能会改变易位速率,从而导致较低的测序准确性。
发明内容
本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。还提供了可以在该方法中使用的组合物和系统,该组合物和系统包括例如用于附接至双链多核苷酸和/或系链剂的衔接子。
在一些方面,本公开提供了一种方法,其包括:将多条系链添加到包含设置在膜中的纳米孔的孔中,其中添加到该孔中的系链的浓度为至少100nM;使该纳米孔与包含一对非共价结合的单链核酸的双链核酸复合物接触,该一对中的每个单链核酸包含具有前导区的衔接子;以及对该膜施加电势以促进该单链核酸通过该纳米孔的易位。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,一对中的第一单链核酸的衔接子定位在该第一单链核酸的5'端上。在一些实施例中,一对中的第二单链核酸的衔接子定位在该第二单链核酸的5'端上。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,任选地,其中聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔,任选地,其中该纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。在一些实施例中,添加到孔中的系链的浓度包括约100nM至1μM、500nM至2μM、1μM至10μM或5μM至50μM。
在一些实施例中,该方法进一步包括以下步骤:测量指示一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。
在一些实施例中,该方法进一步包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过孔的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
在一些方面,本公开提供了包含双链核酸复合物的系统,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过该纳米孔的易位,并且其中该系统被配置使得一对中的核酸顺序易位通过该纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性。
在一些方面,本公开提供了包含双链核酸复合物的系统,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过纳米孔的易位,并且其中该膜包含多条系链,该多条系链被配置和布置成促进非共价结合的单链核酸对中的成员以至少10%的后续读取频率顺序易位通过该纳米孔。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,一对中的第一单链核酸的衔接子定位在该第一单链核酸的5'端上。在一些实施例中,一对中的第二单链核酸的衔接子定位在该第二单链核酸的5'端上。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,任选地,其中聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔。在一些实施例中,纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。
在一些实施例中,一对中的核酸顺序易位通过纳米孔的可能性比来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性大至少15%、20%、25%或30%。
在一些实施例中,每条系链包含疏水锚定物和包含与该疏水锚定物偶联的多核苷酸的系链接头,其中每个衔接子包含多核苷酸,该多核苷酸的至少一部分与该系链接头的相应部分杂交以形成一段具有长度为约24至30个碱基对的双链多核苷酸。
在一些方面,本公开提供了用于使两个非共价结合的分子顺序易位通过纳米孔的方法,该方法包括:接触包含一对非共价结合的单链核酸的双链核酸复合物,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,该膜包含在孔中,其中添加到该孔中的系链的浓度为至少1μM;以及向该膜施加电势,其中在施加电势之后,第一单链核酸易位通过该纳米孔,并且当该第一单链核酸易位时,使第二单链核酸与该系链中的存在于该膜上的至少一条系链可逆地结合,并且在该一对中的该第一单链核酸已经完全易位通过该纳米孔之后,使该一对中的该第二单链核酸易位通过该纳米孔。
在一些方面,本公开提供了用于使两个非共价结合的分子顺序易位通过纳米孔的方法,该方法包括:提供包含一对非共价结合的单链核酸的双链核酸复合物,该一对中的每个单链核酸包含具有前导区的衔接子;在促进该一对中的第一单链核酸通过该纳米孔的条件下,使(i)中的该双链核酸复合物与设置在包含多条系链的膜中的纳米孔接触,该膜包含在孔中,其中添加到该孔中的系链的浓度为至少1μM;使第二单链核酸与该系链中的存在于该膜上的至少一条系链可逆地结合;以及在该一对中的该第一单链核酸已经完全易位通过该纳米孔之后,使该一对中的该第二单链核酸易位通过该纳米孔。
在一些实施例中,一对中的第一核酸和第二核酸各自是DNA或RNA。在一些实施例中,一对中的第一核酸和第二核酸是彼此互补的。
在一些实施例中,每个前导区包括一个或多个聚dT区段。在一些实施例中,每个前导区包括两个或更多个聚dT区段,其中这些聚dT区段中的每个聚dT区段是不连续的。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,纳米孔是蛋白质纳米孔。在一些实施例中,纳米孔是CsgG纳米孔。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚,任选地,其中系链中的每条系链包含辛基-生育酚。在一些实施例中,添加到孔中的系链的浓度包括约1μM至5μM、2μM至20μM或10μM至50μM。
在一些实施例中,促进该一对中的第一单链核酸通过纳米孔的易位的条件包括跨膜施加电势。
在一些实施例中,使该一对中的第二单链核酸易位通过纳米孔包括:通过纳米孔捕获第二单链核酸的前导区。
在一些实施例中,该一对中的第二单链核酸紧接该一对中的第一单链核酸之后易位通过纳米孔。
在一些实施例中,不是复合物一部分的一种或多种核酸在该一对中的第二单链核酸易位通过纳米孔之前易位通过该纳米孔。
在一些实施例中,在第一单链核酸完全易位通过纳米孔之后,该第一单链核酸和第二单链核酸不再非共价结合。
在一些实施例中,该方法进一步包括:测量指示该一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。
在一些实施例中,该方法进一步包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过孔的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
在一些方面,本公开提供了双链核酸复合物,该双链核酸复合物包含第一单链核酸和第一衔接子,该第一单链核酸包含第一模板核酸区段,其中该第一衔接子包含前导序列,该前导序列包含至少两个非连续的聚dT区段,其中该第一单链核酸与第二单链核酸非共价结合,该第二单链核酸包含与该第一模板核酸区段互补的第二模板核酸区段,以及第二衔接子,其中该第二衔接子包含前导序列,该前导序列包含至少两个不连续的聚dT区段;以及系链。
在一些实施例中,第一模板核酸区段和/或第二模板核酸区段是DNA或RNA。
在一些实施例中,每个前导区包括三个或更多个不连续的聚dT区段。
在一些实施例中,每个衔接子进一步包含一个或多个间隔子。在一些实施例中,一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
在一些实施例中,每个衔接子进一步包含一种或多种经修饰的核苷酸。在一些实施例中,经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
在一些实施例中,系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。在一些实施例中,系链中的每条系链包含生育酚。在一些实施例中,系链中的每条系链包含辛基-生育酚。
在一些方面,本公开提供了一种用于核酸测序的系统,该系统包括:孔,该孔包括设置在膜中的纳米孔;多条系链,其中添加到该孔中的该多条系链的浓度为至少100nM;双链核酸分子,该双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,该前导序列包含至少两个不连续的聚dT区段。
附图说明
图1示出了与仅包含iSpC3间隔分子的前导区相比,当使用包含聚dT的前导区时孔中的链捕获增加,如实例2中详述。
图2示出了使用四种不同杂交长度获得的后续百分比,如实例3中详述。后续分类根据重点从上到下呈现在每个条中。
具体实施方式
本公开的方面涉及用于使用纳米孔来表征核酸的组合物和方法。本公开部分基于用于增加核酸链的后续测序的方法。如本文所用,“后续”或“后续事件”是指双链核酸分子的两条互补核酸链以顺序(例如,一条链接着另一条链)方式易位通过纳米孔。在一些实施例中,后续包括:双链核酸分子的两条互补核酸链(例如,一对链)紧接着易位通过纳米孔(例如,在该一对中的两条核酸链之前没有其他分子的单链核酸通过孔)。在一些实施例中,后续包括:不是互补核酸对(例如,双链核酸分子的互补链)的一部分的一种或多种(例如,1、2、3、4、5种等)核酸在该一对中的第一核酸和第二核酸通过纳米孔的易位之间易位通过孔。在一些实施例中,后续包括:不是互补核酸对(例如,双链核酸分子的互补链)的一部分的少于10种(例如,10、9、8、7、6、5、4、3、2或1种)核酸在该一对中的第一核酸和第二核酸通过纳米孔的易位之间易位通过孔。在一些实施例中,本文所述的方法和系统惊人地将纳米孔测序期间的后续事件增加至超过约10%、15%、25%或30%。在一些实施例中,本文所述的方法和系统令人惊讶地将纳米孔测序期间的后续事件增加至超过30%。在一些实施例中,本文所述的方法和系统令人惊讶地将纳米孔测序期间的后续事件增加至超过约35%、40%、45%、50%、55%、60%、65%、70%或75%。不希望受任何特定理论的束缚,由本文所述的组合物、系统和方法介导的后续事件的增加改善了例如通过Q分数测量的测序质量。
在一些实施例中,本文所述的方法进一步包括:执行比对以识别双链核酸复合物的单链核酸对,其中在候选对的序列之间或候选对的序列与参考序列之间进行比对。在一个实施例中,在单链核酸被识别为与多于一条其他核酸链配对的情况下,在时间上彼此最接近地易位纳米孔的两条链可以被确定为实际对。在一个实施例中,该方法因此还可以包括:测量单链核酸的易位时间以确定易位顺序和易位之间的时间。
核酸
本公开的方面涉及用于对核酸进行测序的组合物和方法。在一些实施例中,核酸是双链的。在一些实施例中,双链核酸包含一对非共价结合的单链核酸。
如本文所用,术语“非共价结合的分子”是指包含第一成员和第二成员的分子,其中该第一成员和该第二成员通过非共价附接的方式彼此相关联并且可以彼此分离作为单独的实体。第一成员和第二成员之间的分离和结合过程是可逆的。非共价附接方式的实例包括但不限于互补碱基配对、离子相互作用、疏水相互作用和/或范德华相互作用。
在一些实施例中,非共价结合的分子包含互补的多核苷酸链。两条多核苷酸链之间的互补区(例如,链之间发生互补碱基配对的区)的长度可以变化。在一些实施例中,两条多核苷酸链在该两条多核苷酸链的整个长度上是至少50%、60%、70%、80%、90%、95%、99%或99%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链的整个长度上是100%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链中较短者的长度上是至少50%、60%、70%、80%、90%、95%、99%或99%互补的。在一些实施例中,两条多核苷酸链在该两条多核苷酸链中较短者的长度上是100%互补的。
在一些实施例中,非共价结合的分子对包含与衔接子偶联的靶核酸(例如,靶双链多核苷酸)。衔接子在整个说明书中进行了一般性描述,并且在下面标题为“衔接子”的部分中进行了详细描述。
应当注意的是,本文所述的衔接子可以附接至双链多核苷酸的任一端或两端(例如,每条多核苷酸链的5'端、每条多核苷酸链的3'端、或者每条多核苷酸链的5'端和3'端两者)。在一些实施例中,相同的衔接子附接至双链多核苷酸的两端。在一些实施例中,不同衔接子可以附接至双链多核苷酸的端。不同衔接子与双链多核苷酸的端的附接可以例如通过将两个或更多个不同衔接子群体与双链多核苷酸混合在一起来实现。通常,形成与不同衔接子附接的双链多核苷酸的混合物,但也存在获得所需异源衔接子混合物的方法(例如,通过纯化或通过控制衔接子与双链多核苷酸的端的附接)。
多核苷酸可以是核酸,诸如脱氧核糖核酸(DNA)或核糖核酸(RNA)。多核苷酸可以包含与DNA的一条链杂交的RNA的一条链。多核苷酸可以是本领域已知的任何合成核酸,诸如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其他合成聚合物。PNA主链由通过肽键连接的重复N-(2-氨基乙基)-甘氨酸单元构成。GNA主链由通过磷酸二酯键连接的重复二醇单元组成。TNA主链由通过磷酸二酯键连接的重复苏糖组成。LNA由如上所讨论的核糖核苷酸形成,具有连接核糖部分中的2'氧和4'碳的额外桥。
多核苷酸优选是DNA、RNA或DNA或RNA杂交体,最优选DNA。靶多核苷酸可以是双链的。靶多核苷酸可以包含单链区和具有其他结构的区,诸如发夹环、三链体和/或四链体。DNA/RNA杂交体可以包含同一链上的DNA和RNA。优选地,DNA/RNA杂交体包含与RNA链杂交的一条DNA链。
在一些实施例中,靶多核苷酸不包含发夹结构或任何用于连接模板和补体的共价键。在一些实施例中,靶多核苷酸(例如,模板)和与该靶多核苷酸互补的多核苷酸(例如,补体)不通过桥接部分(诸如发夹环)连接。然而,在一些实施例中,当单链(例如,模板或补体)易位通过纳米孔时,由于其两端上的衔接子的相互作用,该链本身可以形成发夹结构。这种衔接子设计可以有利于表征长多核苷酸,例如,通过保持链的另一端靠近纳米孔。
复合物的每条核酸链(例如,靶多核苷酸链或其互补链)可以为任何长度。例如,多核苷酸在长度上可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸或核苷酸对。靶多核苷酸在长度上可以是1000或更多个核苷酸或核苷酸对、5000或更多个核苷酸或核苷酸对、或者100000或更多个核苷酸或核苷酸对、或者500,000或更多个核苷酸或核苷酸对、或者1,000,000或更多个核苷酸或核苷酸、10,000,000个或更多个核苷酸或核苷酸对、或者100,000,000或更多个核苷酸或核苷酸对、或者200,000,000或更多个核苷酸或核苷酸对、或者染色体的整个长度。靶多核苷酸可以是寡核苷酸。寡核苷酸是短核苷酸聚合物,其通常具有50或更少个核苷酸,诸如40或更少、30或更少、20或更少、10或更少或5或更少个核苷酸。靶寡核苷酸在长度上优选为约15至约30个核苷酸,诸如长度为约20至约25个核苷酸。例如,寡核苷酸在长度上可以是约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29或约30个核苷酸。
靶多核苷酸可以是较长靶多核苷酸的片段。在该实施例中,较长的靶多核苷酸通常被片段化成多个(诸如两个或更多个)较短的靶多核苷酸。本发明的方法可以用于对那些较短的靶多核苷酸中的一个或多个(诸如2、3、4、5或更多个)较短的靶多核苷酸进行测序。
在一些实施例中,本文所述的各个方面的方法可以用于对样品内的多个靶多核苷酸(诸如2、3、4或5至10、15、20或更多个靶多核苷酸)进行取样。
在一些实施例中,本文所述的各个方面的方法可以用于对样品中以双链形式存在的多核苷酸进行测序。
在一些实施例中,双链多核苷酸可以在其3'端或5'端具有衔接子。这种构型在本文中也可以称为双链核酸复合物。
在一些实施例中,双链多核苷酸可以具有附接至每条多核苷酸链的3'端或每条多核苷酸链的5'端的衔接子。这种构型在本文中也可以称为双链核酸复合物。
靶多核苷酸通常存在于包含该靶多核苷酸的多个拷贝的样品中和/或包含多种不同多核苷酸的样品中。在一些实施例中,本文所述的任何方面的方法可以包括:确定样品中的一种或多种靶多核苷酸的序列。该方法可以包括:使孔与两种或更多种双链多核苷酸接触。例如,该方法可以包括:使孔与样品接触,其中基本上所有双链多核苷酸在其两条链中的每一条链上都具有单链前导序列。在一些实施例中,双链多核苷酸仅经由互补碱基配对彼此偶联。在这些实施例中,双链多核苷酸可以具有四个自由端,其中自由端是多核苷酸链的端。多核苷酸链的端可以是单链的(例如,单链突出端)或与另一条多核苷酸链碱基配对。在一些实施例中,被测序的双链多核苷酸的两条链不是共价附接的(例如,没有发夹或其他共价附接)。然而,可以将不桥接模板和互补多核苷酸的部分添加到自由端中的一个或多个自由端。
样品
本公开的方面涉及对样品(例如,从受试者(例如人类受试者)获得的样品)中存在的一种或多种分析物(例如,靶多核苷酸)进行测序。分析物可以包括蛋白质、肽、分子、多肽、多核苷酸等。样品可以是任何合适的样品。样品可以是生物样品。本文所述的方法的任何实施例可以在从任何生物体或微生物获得或提取的样品上体外执行。生物体或微生物通常是古生菌、原核生物或真核生物,并且通常属于五个界中的一个界:植物界、动物界、真菌界、原核生物界和原生界。在一些实施例中,本文所述的各个方面的方法可以在从任何病毒获得或提取的样品上体外执行。
样品优选是流体样品。样品通常包含体液。体液可以获自人或动物。人或动物可能患有、怀疑患有疾病或处于患病风险中。样品可以是尿液、淋巴液、唾液、粘液、精液或羊水,但优选是全血、血浆或血清。通常,样品源自人类,但或者,它可以来自另一哺乳动物(诸如来自商业养殖的动物(诸如马、牛、羊或猪))或者可以另选地是宠物,诸如猫或狗。
或者,植物来源的样品通常获自商业作物,诸如谷类、豆类、水果或蔬菜,例如,小麦、大麦、燕麦、油菜籽、玉米、大豆、稻米、香蕉、苹果、西红柿、马铃薯、葡萄、烟草、豆类、扁豆、甘蔗、可可、棉花、茶或咖啡。
样品可以是非生物样品。非生物样品优选是流体样品。非生物样品的实例包括手术液、水(诸如饮用水、海水或河水)以及用于实验室测试的试剂。
可以在测定之前对样品进行处理,例如通过离心或通过穿过过滤掉不需要的分子或细胞(诸如红细胞)的膜。取样后可以立即进行测量。样品通常也可以在测定之前储存,优选低于-70℃。
在一些实施例中,样品可以包含基因组DNA。基因组DNA可以被片段化,或者本文所述的任何方法还可以包括片段化基因组DNA。DNA可以通过任何合适的方法片段化。例如,片段化DNA的方法是本领域已知的。此类方法可以使用转座酶,诸如MuA转座酶或市售的G管。
前导区
本公开的方面涉及包含第一核酸链和第二核酸链的双链核酸复合物,每条链包含前导区(也称为前导序列)。前导序列通常包含聚合物。聚合物优选带负电荷。聚合物优选是多核苷酸(诸如DNA或RNA)、经修饰的多核苷酸(诸如碱性DNA)、PNA、LNA、聚乙二醇(PEG)或多肽。前导区优选包含多核苷酸,并且更优选包含单链多核苷酸。
前导区可以为任何长度,但在长度上通常为10至150个核苷酸,诸如为20至150个核苷酸。前导区的长度通常取决于该方法中使用的跨膜孔。
本公开部分基于这样的认识:在一些实施例中,刚性或加强前导序列(例如,相对于先前使用的前导序列)在对双链核酸的链测序期间提供增强的后续。在一些实施例中,前导区(例如,加强或刚性前导区)包含一个或多个聚dT区段。在一些实施例中,前导区(例如,硬化或刚性前导区)包含2、3、4、5、6、7、8、9或10个聚dT区段。每个聚dT区段的长度可以不同。在一些实施例中,每个聚dT区段在长度上的范围为约2至约15个dT核苷酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸)。在一些实施例中,每个聚dT区段在长度上的范围为约2至约30个dT核苷酸(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸)。在一些实施例中,每个聚dT区段在长度上的范围为约5至约10个dT核苷酸(例如,5、6、7、8、9或10个核苷酸)。
在一些实施例中,聚dT区段是不连续的(例如,每个聚dT区段沿着相同的基于磷酸酯的主链存在,但被一个或多个不包含dT核苷的核苷酸分隔开)。分隔聚dT区段的前导序列的长度可以不同。在一些实施例中,非聚dT前导序列的长度范围为约1至约5(例如,1、2、3、4或5)个核苷酸。非聚dT核苷酸中的每个非聚dT核苷酸可以选自A、G或C或它们的修饰版本。在一些实施例中,前导区(例如,刚性前导区)包含少于1、2、3、4、5、6、7、8、9或10个非dT核苷酸的核苷酸。
本公开部分基于相对于先前使用的前导区包括较少间隔分子的前导区。不希望受理论束缚,间隔分子的减少被认为增加了前导区的刚性(例如,刚度)并有助于改善纳米孔测序期间的后续。在一些实施例中,前导区包括1、2、3、4、5、6、7、8、9或10个间隔分子。在一些实施例中,每个间隔分子单独选自iSpC3、iSpC9和iSpC18分子,例如如Integrated DNATechnologies所述(也称为C3、iSp9和iSp18间隔分子)。
在一些实施例中,间隔分子可以包含硝基吲哚、肌苷、吖啶、2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向胸苷、反向双脱氧胸苷、双脱氧-胞苷(ddC)、5-甲基胞苷、5-羟甲基胞苷、2'-邻甲基RNA碱基、异脱氧胞苷(Iso-dC)、异脱氧鸟苷(Iso-dG)、C3(OC3H6OPO3)基团、光可裂解(PC)[OC3H6-C(O)NHCH2-C6H3NO2-CH(CH3)OPO3]基团、己二醇基团、间隔子9(iSp9)[(OCH2CH2)3OPO3]基团或间隔子18(iSp18)[(OCH2CH2)6OPO3]基团。
前导序列优先穿入跨膜孔,并且因此促进多核苷酸穿过该孔的移动。前导序列也可以用于将多核苷酸连接至如本文所讨论的一个或多个锚定物。
通常,前导序列存在于靶多核苷酸的一端以及与该靶多核苷酸互补的多核苷酸的一端处。前导序列可以存在于靶多核苷酸的5'端和该靶多核苷酸的补体的5'端处。或者,前导序列可以存在于靶多核苷酸的3'端和该靶多核苷酸的补体的3'端处。前导序列可以存在于靶多核苷酸的5'端和互补多核苷酸的3'端处,或反之亦然。在这些后面的实施例中,通常使用两种不同多核苷酸结合蛋白(例如,多核苷酸解旋酶),其中第一多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿多核苷酸在5'至3'的方向上移动,并且第二多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿多核苷酸在3'至5'的方向上移动。
前导序列可以通过任何合适的方法附接至双链多核苷酸。例如,前导序列可以连接至靶多核苷酸和/或其补体。或者,前导序列可以通过消化双链多核苷酸的一条链以在另一条链上产生单链突出端来生成。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以在其附接至靶多核苷酸或其补体之前与前导序列结合。多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以与存在于双链多核苷酸中的前导序列结合。与前导序列结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)的活性可以停滞,直到多核苷酸接触跨膜孔。使多核苷酸结合蛋白(例如,多核苷酸解旋酶)停滞的方法是本领域已知的,例如在WO 2014/135838中。
衔接子
前导序列可以存在于衔接子中。在一些实施例中,衔接子包含双链区(例如,双链体茎)和至少一个单链区。单链区中的至少一个单链区可以是前导序列。衔接子可以包含至少一个非多核苷酸区。附接至靶双链多核苷酸两端的衔接子可以是相同或不同的。优选地,该一对中的衔接子是相同的。
前导序列优选存在于衔接子一条链的5'端(或3'端)处的第一单链区中。第二单链区可以存在于衔接子的另一条链的3'端(或5'端)处。衔接子的第一和第二单链区是不互补的。在该实施例中,衔接子可以称为Y衔接子。
Y衔接子通常包含(a)双链区(例如,双链体茎)和(b)单链区或在另一端不互补的区。如果Y衔接子包含单链区,则它可以被描述为具有突出端。Y衔接子中非互补区的存在赋予衔接子其Y形状,因为与双链部分不同,两条链通常不会彼此杂交。Y衔接子可以包括一个或多个锚定物。
在一些实施例中,Y衔接子包含优先穿入孔中的前导序列。在一些实施例中,可以使用本领域已知的任何方法将Y衔接子附接至多核苷酸。例如,衔接子中的一个或两个衔接子可以使用连接酶连接,诸如T4 DNA连接酶、大肠杆菌DNA连接酶、Taq DNA连接酶、Tma DNA连接酶和9°N DNA连接酶。
在一些实施例中,样品中的双链多核苷酸被修饰,使得它们在两端包含Y衔接子。可以使用任何方式的修饰。该方法可以包括:通过添加衔接子来修饰双链靶多核苷酸。
通过使多核苷酸与MuA转座酶和双链MuA底物群体接触,可以为双链多核苷酸提供衔接子,诸如Y衔接子或锚定物(例如,系链)。转座酶将双链多核苷酸片段化并将MuA底物连接至片段的一端或两端。这产生了多个包含衔接子或锚定物的经修饰的双链多核苷酸。然后可以使用本发明的方法研究经修饰的双链多核苷酸。这些基于MuA的方法公开于WO2015/022544和WO 2016/059363中。它们也在WO2015/150786中进行详细讨论。
衔接子还可以包含锚定物以将包含靶多核苷酸的双链多核苷酸和/或其补体拴系至包含孔的膜,即衔接子还可以包含膜系链。锚定物优选附接至不是前导序列的单链区。
在一些实施例中,衔接子具有与其结合(例如与前导区结合)的多核苷酸结合蛋白。用于将多核苷酸结合蛋白加载到多核苷酸衔接子上的合适的方法描述于WO 2020/234612中,其通过引用的方式整体并入本文。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以与衔接子中的前导序列结合,或者可以在衔接子已经附接至双链多核苷酸之后添加多核苷酸结合蛋白(例如,多核苷酸解旋酶)。与前导序列结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)的活性可以停滞,直到多核苷酸接触跨膜孔。
前导序列或衔接子可以通过任何合适的方法附接至双链多核苷酸。例如,前导序列可以连接至靶多核苷酸和/或其补体,或者衔接子可以连接至双链多核苷酸。
在一些实施例中,双链条形码序列可以连接至靶双链多核苷酸的一端或两端。可以在添加前导序列或衔接子之前将条形码序列添加到双链多核苷酸。例如,条形码序列可以位于靶双链多核苷酸的端和衔接子之间。在一些实施例中,条形码序列包含在衔接子中。
唯一的条形码序列可以附接(例如连接)至样品中的每个双链多核苷酸。条形码序列可以用于识别对应于靶多核苷酸和与该靶多核苷酸互补的多核苷酸顺序易位通过孔的信号。
在一些实施例中,本文所述的衔接子(例如,不包含前导区的衔接子区段)可以包含一个或多个间隔子以防止预结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿着双链多核苷酸移动并解旋该双链多核苷酸。这些间隔子防止多核苷酸结合蛋白(例如,多核苷酸解旋酶)的进一步移动,直到该多核苷酸结合蛋白(例如,多核苷酸解旋酶)位于孔处并且跨孔施加电势差。电势差提供的附加力将多核苷酸结合蛋白(例如,多核苷酸解旋酶)推到间隔子上并允许其解旋并控制多核苷酸通过纳米孔的移动。因此,多核苷酸结合蛋白(例如,多核苷酸解旋酶)的移动通常仅在多核苷酸位于纳米孔中时而不是之前发生。间隔子和用于防止预结合的多核苷酸结合蛋白(例如,多核苷酸解旋酶)沿着双链多核苷酸移动并解旋该双链多核苷酸直至多核苷酸处于纳米孔中的方法的实例描述于例如WO2015/110813中,其内容通过引用的方式整体并入本文。
适合在表征双链多核苷酸的方法中使用的衔接子的另外的实例描述于WO 2018/100370和WO 2020/234612中,其内容通过引用的方式整体并入本文。
系链
本公开的各个方面涉及用于改善后续的方法和系统,其包含系链剂(也称为锚定物、系链或膜系链)。可以使用一个或多条系链将双链核酸复合物(例如,双链靶多核苷酸,其中多核苷酸的每条链包含前导区或衔接子)与膜偶联。通常,一个或多条系链附接至靶多核苷酸的每条链。在一些实施例中,系链是衔接子的一部分。系链和将系链附接至衔接子的方法的实例公开于WO 2012/164270和WO 2015/150786中,其内容通过引用的方式整体并入本文。
如果膜是两亲层(诸如三嵌段共聚物膜),则一个或多条系链优选包含可以插入膜中的多肽锚定物和/或疏水锚定物。疏水锚定物优选包含脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸酯或生育酚。在优选的实施例中,一个或多条系链不连接(例如,结合)纳米孔。
在一些实施例中,系链剂是系链复合物的一部分,并且系链复合物集中于两亲层的区域中。将系链复合物集中于在两亲层的区域中的方法描述于PCT/GB2020/053104(对应于国际公开WO 2021/111139)中,其通过引用的方式整体并入本文。
膜的组分(诸如两亲分子、共聚物或脂质)可以被化学修饰或功能化以形成一个或多个锚定物。下面更详细地讨论合适的化学修饰和功能化膜的组分的合适的方法的实例。任何比例的膜组分可以被功能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。
在一些实施例中,一种或多种锚定物优选包含一种或多种接头。一种或多种锚定物可以包含一种或多种(诸如2、3、4或更多种)接头。在一些实施例中,每个接头选自iSpC3、iSpC9(iSp9)和iSpC18(iSp18)分子,例如,如Integrated DNA Technologies所述。接头的另外的实例包括但不限于聚合物,诸如多核苷酸、聚乙二醇(PEG)、多糖和多肽。这些接头可以是直链、支链或环状的。例如,接头可以是环状多核苷酸。靶多核苷酸可以与环多核苷酸接头上的互补序列杂交。
在一些实施例中,一种或多种系链或一种或多种接头可以包含可以被切割或分解的组分,诸如限制位点或光不稳定基团。
功能化接头和它们可以偶联分子的方法是本领域已知的。例如,用马来酰亚胺基团功能化的接头将与蛋白质中的半胱氨酸残基反应并附接。
使用“锁和钥匙”布置可以避免多核苷酸的交联。每个接头仅一端可以一起反应以形成更长的接头,并且该接头的另一端各自分别与多核苷酸或膜反应。此类接头描述于WO2010/086602中。
双链核酸复合物经由一个或多条系链与膜的偶联可以是永久的或稳定的。换句话说,偶联可以使得多核苷酸在与孔相互作用时保持与膜偶联。
这种偶联可以是瞬时的。换句话说,偶联可以使得多核苷酸在与孔相互作用时可以与膜解偶联。对于多核苷酸测序,偶联的瞬时性质是优选的。如果永久或稳定的接头直接附接至多核苷酸的5'或3'端,并且该接头短于膜和跨膜孔的通道之间的距离,那么一些序列数据将丢失,因为测序运行不能继续到多核苷酸的端。如果偶联是瞬时的,那么当偶联的端随机脱离膜时,则可以将多核苷酸加工至完成。靶多核苷酸和/或其补体可以瞬时偶联至膜,诸如两亲层,例如,使用胆固醇、脂肪酰基链或生育酚的三嵌段共聚物膜或脂质膜。可以使用长度为6至30个碳原子的任何脂肪酰基链,诸如十六烷酸。
在一些实施例中,系链包含生育酚。生育酚是包含具有羟基的色满环和疏水侧链的化合物。生育酚的四种已知形式(α(alpha)、β(beta)、γ(gamma)和δ(delta))的不同之处在于甲基在色满环上的定位。在一些实施例中,系链包含生育酚和一个或多个接头(例如,iSpC3接头、iSpC8接头、iSpC9分子等)。在一些实施例中,系链包含生育酚和iSpC8接头(也称为辛基-生育酚)。
本公开部分基于以下认识:增加包含设置在膜中的纳米孔的孔中的系链的浓度提高后续事件频率。系链的浓度(例如,添加到包含设置在膜中的纳米孔的孔中的系链浓度)可以不同。在一些实施例中,添加到孔中的浓度为约100nM与500nM、250nM与800nM、400nM与1μM、600nM与1.5μM、1.0μM与2.5μM、2.0μM与4.0μM或3.0与5.0μM之间。在一些实施例中,添加到孔中的浓度超过5.0μM(例如,8μM、10μM、15μM)。如实例中所述,已经观察到增加系链的浓度令人惊讶地增加纳米孔测序期间的后续事件。该观察结果是令人惊讶的,因为之前认为包含设置在膜中的纳米孔的孔中的系链(例如,添加>50nM系链)的浓度增加会不期望地导致孔堵塞。
在一些实施例中,在递送至膜之前将一个或多条系链与双链核酸复合物混合。在一些实施例中,一个或多条系链与膜接触,并且随后与双链核酸复合物接触。
根据一些实施例,当复合物的一条链附接至优先穿入孔中的前导序列(例如,加强或刚性先导区)时,一个或多条系链(例如,辛基-生育酚系链)可以用于将双链核酸复合物偶联至膜。
在一些实施例中,双链核酸复合物包含衔接子,并且该复合物经由该衔接子与系链之间的相互作用与膜偶联。
在一些实施例中,系链包含疏水锚定物和与疏水锚定物偶联的接头(也称为系链接头),该接头包含多核苷酸。在一些实施例中,疏水锚定物包含生育酚。在一些实施例中,疏水锚定物包含辛基-生育酚。
在一些实施例中,疏水锚定物和系链接头经由一个或多个间隔分子(例如,1、2、3、4、5、6、7、8、9或10个间隔分子)彼此连接,诸如本文所述。在一些实施例中,一种或多种间隔分子是iSpC3间隔分子、iSp9间隔分子或iSp18间隔分子。
在一个实施例中,系链接头包含长度为约24至约30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为约25至约30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为24、25、26、27、28、29或30个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为24、25或26个核苷酸的多核苷酸。
在一个实施例中,系链接头包含长度为25个核苷酸的多核苷酸。
在一些实施例中,衔接子包含多核苷酸,该多核苷酸的至少一部分与系链接头的相应部分杂交以形成双链多核苷酸区段。衔接子中包含的多核苷酸的至少一部分和系链接头的相应部分可以彼此互补,例如,可以包含互补核酸序列或由互补核酸序列组成。
在一个实施例中,由此形成的双链多核苷酸区段具有约24至30个碱基对、约25至30个碱基对或者约20、21、22、23、24、25、26、27、28、29或30个碱基对的长度。在一个实施例中,双链多核苷酸区段具有24、25或26个碱基对的长度。在一个实施例中,双链多核苷酸片段具有25个碱基对的长度。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的相应部分杂交。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含长度为24、25或26个核苷酸的多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为24、25或26个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸的至少一部分与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
在一个实施例中,系链接头包含多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
在一个实施例中,系链包含长度为25个核苷酸的多核苷酸,该多核苷酸与衔接子的互补多核苷酸区段杂交以形成长度为25个碱基对的双链多核苷酸。
发明人发现,当杂交部分在长度上为约24至约30个碱基对时,经由系链接头和衔接子之间的杂交将系链连接至衔接子可以提供增加的后续率。不希望受理论的束缚,发明人相信,通过增加杂交部分的长度,在系链和衔接子之间产生更强的附接,这降低了模板在模板链穿过孔时补体链衔接子从膜脱离的可能性,并且因此增加了补体链接头保留在孔附近并在模板链穿过孔后立即被捕获用于测序的可能性,从而提高了后续率。
纳米孔
跨膜孔是在某种程度上穿过膜的结构。它允许由施加的电势驱动的水合离子流过膜或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不必穿过膜。它的一端可以是封闭的。例如,孔可以是膜中的间隙、通道、沟槽或狭缝,水合离子可以沿着其流动或流入其中。
任何跨膜孔都可以用于本发明中。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是DNA折纸孔(Langecker等人,Science,2012;338:932-936)。孔可以是马达蛋白纳米孔,例如,允许双链多核苷酸易位的纳米孔。在一些实施例中,马达蛋白纳米孔能够解旋双链多核苷酸。示例性马达蛋白纳米孔包括但不限于phi29马达蛋白纳米孔,例如,如Wendell等人"Translocation of double-stranded DNAthrough membrane-adapted phi29 motor protein nanopores"Nat Nanotechnol,4(2009),第765-772页中所述。在一些实施例中,Feng等人"Nanopore-based fourth-generation DNA sequencing technology"Genomics,Proteomics&Bioinformatics(2015),第13卷,第1期,第4-16页中所述或引用的任何纳米孔可以用于本文所述的各个方面中。
跨膜孔优选为跨膜蛋白孔。跨膜蛋白孔是允许水合离子(诸如多核苷酸)从膜的一侧流到该膜的另一侧的多肽或多肽的集合。在本发明中,跨膜蛋白孔能够形成允许由施加的电势驱动的水合离子从膜的一侧流到另一侧的孔。跨膜蛋白孔优选允许多核苷酸从膜(诸如三嵌段共聚物膜)的一侧流到另一侧。跨膜蛋白孔允许多核苷酸(诸如DNA或RNA)穿过孔。
跨膜蛋白孔可以是单体或寡聚物。孔优选地由数个重复亚基组成,诸如至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15或至少16个亚基。孔优选是六聚体、七聚体、八聚体或九聚体孔。孔可以是同源低聚物或异源低聚物。
跨膜蛋白孔通常包括离子可以流过的桶或通道。孔的亚基通常围绕中心轴并为跨膜β桶或通道或跨膜α-螺旋束或通道贡献链。
跨膜蛋白孔的桶或通道通常包含促进与核苷酸、多核苷酸或核酸相互作用的氨基酸。这些氨基酸优选位于桶或通道的缩颈附近。跨膜蛋白孔通常包括一种或多种带正电荷的氨基酸,诸如精氨酸、赖氨酸或组氨酸或芳香族氨基酸,诸如酪氨酸或色氨酸。这些氨基酸通常促进孔与核苷酸、多核苷酸或核酸之间的相互作用。
根据本发明使用的跨膜蛋白孔可以源自β-桶孔或α-螺旋束孔。β-桶孔包含由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素(诸如α-溶血素、炭疽毒素和杀白细胞素)以及细菌的外膜蛋白/孔蛋白(诸如耻垢分枝杆菌孔蛋白(Msp),例如,MspA、MspB、MspC或MspD、CsgG、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟菌自转运脂蛋白(NalP))和其他孔,诸如溶素。α-螺旋束孔包含由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和外膜蛋白,诸如WZA和ClyA毒素。在一些实施例中,纳米孔是CsgG纳米孔。
跨膜孔可以源自或基于Msp、α-溶血素(α-HL)、胞溶素、CsgG、ClyA、Spl和溶血蛋白茶香毒素C(FraC)。跨膜蛋白孔优选源自CsgG,更优选源自大肠杆菌链K-12子链MC4100的CsgG。来自CsgG的合适的孔公开于WO 2016/034591、WO 2017/149316、WO 2017/149317、WO2017/149318和WO 2019/002893中。跨膜结构域可以源自胞溶素。源自胞溶素的合适的孔公开于WO 2013/153359中。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白孔)可以被修饰以帮助其识别或纯化,例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉抗生物素蛋白标签、标记标签、SUMO标签、GST标签或MBP标签或者通过添加信号序列以促进它们从其中多肽天然不含有这样的序列的细胞中分泌。引入遗传标签的另一方法是将标签化学反应到孔或构建体上的天然或工程化位置上。这样的实例是使凝胶转移试剂与在孔外部工程化的半胱氨酸反应。这已经被证明是一种分离溶血素异寡聚物的方法(Chem Biol.1997年7月;4(7):497-505)。孔可以用显示标签来标记。显示标记可以是允许检测孔的任何合适的标记。合适的标记包括但不限于荧光分子、放射性同位素(例如,125I、35S)、酶、抗体、抗原、多核苷酸和配体,诸如生物素。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白孔)可以合成制备或通过重组的方式制备。例如,孔可以通过体外翻译和转录(IVTT)来合成。孔的氨基酸序列可以被修饰以包括非天然存在的氨基酸或以增加蛋白质的稳定性。当通过合成方式生产蛋白质时,可以在生产期间中引入此类氨基酸。孔也可以在合成或重组生产之后进行改变。
本文所述的蛋白质中的任何蛋白质(诸如跨膜蛋白质孔)可以使用本领域已知的标准方法来生产。编码孔或构建体的多核苷酸序列可以使用本领域的标准方法得到和复制。编码孔或构建体的多核苷酸序列可以使用本领域的标准技术在细菌宿主细胞中进行表达。可以通过来自重组表达载体的多肽的原位表达来在细胞中产生孔。表达载体任选地携带诱导型启动子以控制多肽的表达。这些方法描述于Sambrook,J.和Russell,D.(2001),Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY。
可以在通过任何蛋白质液相色谱系统从蛋白质产生生物体进行纯化之后或在重组表达之后大规模产生孔。典型的蛋白质液相色谱系统包括FPLC、AKTA系统、Bio-Cad系统、Bio-Rad BioLogic系统和Gilson HPLC系统。
孔可以以阵列的形式提供,诸如包含多个纳米孔的纳米孔阵列。此类阵列描述于例如WO 2014/064443中,其通过引用的方式整体并入本文。
在一些实施例中,孔不包含缀合至孔的标签(例如,核酸标签),该标签与双链核酸复合物的一部分结合。例如,在一些实施例中,孔不包含缀合至孔的标签,诸如WO 2018/100370中所述;因此,在一些实施例中,孔不是标签修饰的孔,诸如WO 2018/100370中所述。
根据本文所述的各个方面可以使用任何膜。合适的膜是本领域众所周知的。膜优选是两亲层或固态层。
两亲层是由两亲分子(诸如磷脂)形成的层,其具有亲水性和亲脂性。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物是本领域已知的并且包括例如嵌段共聚物(Gonzalez-Perez等人,Langmuir,2009,25,10447-10450)。嵌段共聚物是其中两个或多个单体亚基聚合在一起以形成单个聚合物链的聚合物材料。嵌段共聚物通常具有由每个单体亚基贡献的特性。然而,嵌段共聚物可能具有由各个亚基形成的聚合物所不具备的独特特性。嵌段共聚物可以被工程化使得单体亚基中的一个单体亚基是疏水性的(即亲脂性的),而其他亚基在水性介质中时是亲水性的。在这种情况下,嵌段共聚物可以具有两亲特性并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚基组成),但也可以由两个以上的单体亚基构建以形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选是三嵌段共聚物膜。
古细菌双极性四醚脂质是天然存在的脂质,该脂质被构造使得脂质形成单层膜。这些脂质通常存在于在恶劣的生物环境中生存的极端微生物、嗜热微生物、嗜盐微生物和嗜酸微生物中。据信它们的稳定性源自最终双层的融合性质。通过产生具有亲水-疏水-亲水一般基序的三嵌段聚合物,可以直接构建模拟这些生物实体的嵌段共聚物材料。这种材料可以形成单体膜,其行为类似于脂质双层,并涵盖从囊泡到层状膜的一系列相行为。由这些三嵌段共聚物形成的膜与生物脂质膜相比具有多个优点。由于三嵌段共聚物是合成的,因此可以仔细控制精确的结构,以提供形成膜和与孔和其他蛋白质相互作用所需的正确链长和特性。
嵌段共聚物也可以由不属于脂质子材料的亚基构建;例如,疏水聚合物可以由硅氧烷或其他非烃基单体制成。嵌段共聚物的亲水子区段也可以具有低蛋白质结合特性,这允许产生在暴露于原始生物样品时具有高度耐受性的膜。该头基单元也可以源自非经典脂质头基。
与生物脂质膜相比,三嵌段共聚物膜还具有增加的机械稳定性和环境稳定性,例如,更高的操作温度或pH范围。嵌段共聚物的合成性质提供了一个平台为各种应用定制聚合物基膜。
膜最优选是WO2014/064443或WO2014/064444中公开的膜中的一者。
两亲分子可以被化学修饰或功能化以促进多核苷酸的偶联。
两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以被支撑。两亲层可以是凹的。两亲层可以悬挂在凸起的柱上,使得该两亲层的外围区(其附接至柱)高于两亲层区。这可以允许微粒沿着膜行进、移动、滑动或滚动,如上所述。
两亲膜通常是天然可移动的,本质上充当二维流体,脂质扩散速率约为10-8cm s-1。这意味着孔和偶联的多核苷酸通常可以在两亲膜内移动。
膜可以是脂质双层。脂质双层是细胞膜的模型,并且充当用于一系列实验研究的优秀平台。例如,脂质双层可以用于通过单通道记录进行膜蛋白的体外研究。或者,脂质双层可以用作生物传感器来检测一系列物质的存在。脂质双层可以是任何脂质双层。合适的脂质双层包括但不限于平面脂质双层、支撑双层或脂质体。脂质双层优选是平面脂质双层。合适的脂质双层公开于WO 2008/102121、WO 2009/077734和WO 2006/100484中。
用于形成脂质双层的方法是本领域已知的。脂质双层通常通过Montal和Mueller的方法形成(Proc.Natl.Acad.Sci.美国,1972;69:3561-3566),其中脂质单层通过垂直于水溶液/空气界面的孔的任一侧承载在该水溶液/空气界面上。通常通过以下将脂质添加到电解质水溶液的表面:首先将其溶解在有机溶剂中,并且然后让一滴溶剂在孔的任一侧的水溶液表面上蒸发。一旦有机溶剂蒸发,孔的任一侧上的溶液/空气界面就会物理地上下移动经过孔,直到形成双层。平面脂质双层可以跨过膜中的孔或跨进入凹部的开口形成。
Montal和Mueller的方法很受欢迎,因为它是一种具有成本效益且相对简单的形成适合蛋白质孔插入的优质脂质双层的方法。双层形成的其他常见方法包括尖端浸渍、涂层双层和脂质体双层的膜片钳。
尖端浸渍双层形成需要将孔表面(例如,移液管吸头)接触到携带单层脂质的测试溶液的表面。同样,通过允许溶解在有机溶剂中的一滴脂质在溶液表面蒸发来首先在溶液/空气界面处生成脂质单层。然后双层通过Langmuir-Schaefer工艺来形成,并且需要机械自动化来相对于溶液表面移动孔。
对于涂层双层,将溶解在有机溶剂中的一滴脂质直接涂在孔上,将其浸入测试水溶液中。使用画笔或类似物将脂质溶液薄薄地涂在孔上。溶剂的稀释导致脂质双层的形成。然而,从双层中完全去除溶剂是困难的,并且因此通过该方法形成的双层不太稳定且在电化学测量期间更容易产生噪声。
膜片钳常用于生物细胞膜的研究中。通过吸力将细胞膜夹在移液管端,并将一小块膜附接在孔上。该方法已经适用于通过夹紧脂质体来产生脂质双层,然后脂质体破裂,留下密封在移液管的孔上的脂质双层。该方法需要稳定、巨大且单层的脂质体,并在具有玻璃表面的材料中制造小孔。
脂质体可以通过超声处理、挤压或Mozafari方法形成(Colas等人(2007)Micron38:841-847)。
在一个优选的实施例中,脂质双层如WO 2009/077734中所述形成。有利地,在该方法中,脂质双层由干燥的脂质形成。在最优选的实施例中,脂质双层跨开口形成,如WO2009/077734中所述。
脂质双层由两个相对的脂质层形成。排列两层脂质使得它们的疏水尾基彼此面对以形成疏水内部。脂质的亲水头基团向外面向双层每侧的水环境。双层可以存在于许多脂质相中,包括但不限于液体无序相(流体层状)、液体有序相、固体有序相(层状凝胶相、叉指状凝胶相)和平面双层晶体(层状亚凝胶相、层状晶体相)。
可以使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得形成具有所需特性(诸如表面电荷、支撑膜蛋白的能力、堆积密度或机械特性)的脂质双层。脂质组合物可以包括一种或多种不同脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选含有1至10种脂质。脂质组合物可以包括天然存在的脂质和/或人造脂质。
脂质通常包含头基、界面部分和两个可以相同或不同的疏水尾基。合适的头基包括但不限于:中性头基,诸如二酰基甘油酯(DG)和神经酰胺(CM);两性离子头基,诸如磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)和鞘磷脂(SM);带负电荷的头基,诸如磷脂酰甘油(PG);磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷酸(PA)和心磷脂(CA);以及带正电的头基,诸如三甲基铵丙烷(TAP)。合适的界面部分包括但不限于天然存在的界面部分,诸如基于甘油或基于神经酰胺的部分。合适的疏水尾基包括但不限于:饱和烃链,诸如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,诸如油酸(顺式-9-十八烷酸);以及支链烃链,诸如植烷酰基。不饱和烃链中链的长度以及双键的位置和数量可以不同。支链烃链中链的长度以及支链(诸如甲基)的位置和数量可以不同。疏水尾基可以作为醚或酯连接至界面部分。脂质可以是霉菌酸。
脂质也可以被化学修饰。脂质的头基或尾基可以被化学修饰。其头基已经被化学修饰的合适的脂质包括但不限于:PEG修饰的脂质,诸如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];功能化的PEG脂质,诸如1,2-二硬脂酰-sn-甘油-3磷酸乙醇胺-N-[生物素(聚乙二醇)2000];以及缀合修饰的脂质,诸如1,2-二油酰-sn-甘油-3-磷酸乙醇胺-N-(琥珀酰)和1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺-N-(生物素)。其尾基已经被化学修饰的合适的脂质包括但不限于:可聚合脂质,诸如1,2-双(10,12-二十三碳二炔酰基)-sn-甘油-3-磷酸胆碱;氟化脂质,诸如1-棕榈酰-2-(16-氟棕榈酰)-sn-甘油-3-磷酸胆碱;氘化脂质,诸如1,2-二棕榈酰-D62-sn-甘油-3-磷酸胆碱;以及醚连接的脂质,诸如1,2-二-邻植烷酰基-sn-甘油-3-磷酸胆碱。脂质可以被化学修饰或功能化以促进多核苷酸的偶联。
两亲层(例如,脂质组合物)通常包含将影响该层的特性的一种或多种添加剂。合适的添加剂包括但不限于:脂肪酸,诸如棕榈酸、肉豆蔻酸和油酸;脂肪醇,诸如棕榈醇、肉豆蔻醇和油醇;甾醇,诸如胆固醇、麦角甾醇、羊毛甾醇、谷甾醇和豆甾醇;溶血磷脂,诸如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;以及神经酰胺。
固态层可以由有机和无机材料形成,包括但不限于微电子材料、绝缘材料(诸如Si3N4、Al2O3和SiO)、有机和无机聚合物(诸如聚酰胺、塑料(诸如特氟隆)或弹性体(诸如双组分加成固化硅橡胶))以及玻璃。固态层可以由石墨烯形成。合适的石墨烯层公开于WO2009/035647中。Yusko等人,Nature Nanotechnology,2011;6:253-260和美国专利申请号2013/0048499描述了在不使用微粒的情况下将蛋白质递送至固态层中的跨膜孔。本发明的方法可以用于改进这些文献中公开的方法中的递送。
该方法通常使用以下来执行:(i)包含孔的人工两亲层、(ii)包含孔的分离的天然存在的脂质双层或(iii)孔插入其中的细胞。该方法通常使用人造两亲层(诸如人造三嵌段共聚物层)来执行。除了孔之外,层还可以包括其他跨膜和/或膜内蛋白质以及其他分子。下面讨论合适的装置和条件。本发明的方法通常在体外执行。
根据本发明的方法对其递送多核苷酸的膜包含在液体中。液体使膜保持“湿润”并防止其干燥。液体通常是水溶液。水溶液通常具有与水相同的密度。水溶液的密度通常为约1g/cm3。溶液的密度可能取决于温度和溶液的具体成分而有所不同。水溶液通常具有约0.97至约1.03g/cm3的密度。
膜通常分离两体积的水溶液。膜阻止电流在体积之间的流动。插入膜中的跨膜孔选择性地允许离子穿过膜,这可以记录为电极在两体积水溶液中检测到的电信号。靶多核苷酸的存在调节离子流,并且通过观察电信号的最终变化来检测。
多核苷酸结合蛋白
本公开的方面涉及包含一种或多种多核苷酸结合蛋白的方法、组合物和系统。多核苷酸结合蛋白(例如,多核苷酸解旋酶)可以是能够与多核苷酸结合并控制其通过孔的移动的任何蛋白质。
本文所述的方法中的任何方法可以包括以下步骤:控制单链核酸(例如,最初包含在如本文所述的双链核酸复合物中的单链核酸)通过纳米孔的移动(例如,易位)。
在本领域中确定蛋白质是否与多核苷酸结合是简单的。蛋白质通常与多核苷酸相互作用并修饰多核苷酸的至少一种特性。蛋白质可以通过切割多核苷酸以形成单独的核苷酸或更短的核苷酸链(诸如二核苷酸或三核苷酸)来修饰该多核苷酸。部分可以通过将多核苷酸定向或将其移动到特定位置(即控制其移动)来修饰该多核苷酸。
多核苷酸结合蛋白(例如,多核苷酸解旋酶)优选源自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸的至少一种特性相互作用并对其进行修饰的多肽。酶可以通过切割多核苷酸以形成单独的核苷酸或更短的核苷酸链(诸如二核苷酸或三核苷酸)来修饰该多核苷酸。酶可以通过将多核苷酸定向或移动至特定位置来修饰该多核苷酸。多核苷酸处理酶不需要表现出酶活性,只要它能够结合多核苷酸并控制其通过孔的移动即可。例如,酶可以被修饰以去除其酶活性或者可以在阻止其充当酶的条件下使用。下面更详细地讨论此类条件。
通常,多核苷酸结合蛋白是解旋酶、聚合酶、核酸外切酶、拓扑异构酶或它们的变体。
多核苷酸处理酶优选源自核酸水解酶。用于酶构建体的多核苷酸处理酶更优选源自酶分类(EC)组3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31中任一者的成员。酶可以是WO 2010/086603中公开的那些酶中的任一者。
优选的酶是聚合酶、解旋酶、转位酶和拓扑异构酶,诸如旋转酶。聚合酶可以是PyroPhage 3173DNA聚合酶(其可从Lucigen Corporation商购)、SD聚合酶(可从Bioron商购)或它们的变体。聚合酶优选是Phi29 DNA聚合酶或其变体。拓扑异构酶优选是部分分类(EC)组5.99.1.2和5.99.1.3中任一者的成员。
酶最优选源自解旋酶。解旋酶可以是或源自He1308解旋酶、RecD解旋酶,诸如Tral解旋酶或TrwC解旋酶、XPD解旋酶或Dda解旋酶。解旋酶可以是或源自He1308 Mbu、He1308Csy、He1308 Tga、He1308 Mhu、Tral Eco、XPD Mbu或它们的变体。
解旋酶可以是WO 2013/057495、WO 2013/098562、WO2013098561、WO 2014/013260、WO 2014/013259、WO 2014/013262和WO/2015/055981中公开的解旋酶、经修饰的解旋酶或解旋酶构建体中的任一者。
Dda解旋酶优选包含WO/2015/055981和WO 2016/055777中公开的修饰中的任一者。
根据本发明可以使用任何数量的解旋酶。例如,可以使用1种、2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种解旋酶。在一些实施例中,可以使用不同数量的解旋酶。可以使用上述解旋酶中的两种或者更多种解旋酶的任何组合。两种或更多种解旋酶可以是两种或更多种Dda解旋酶。两种或更多种解旋酶可以是一种或多种Dda解旋酶和一种或多种TrwC解旋酶。两种或更多种解旋酶可以是相同解旋酶的不同变体。
两种或更多种解旋酶优选彼此附接。两种或更多种解旋酶更优选彼此共价附接。解旋酶可以以任何顺序并使用任何方法附接。用于本发明的优选解旋酶构建体描述于WO2014/013260、WO 2014/013259、WO 2014/013262和WO2015/055981中。
在一些实施例中,多核苷酸结合蛋白是多核苷酸解旋酶。多核苷酸解旋酶是能够将双链多核苷酸解旋成单链的酶。在一些实施例中,多核苷酸解旋酶能够将双链DNA解旋成单链。在一些实施例中,多核苷酸解旋酶是具有解旋酶活性的酶。多核苷酸解旋酶的实例包括例如本文所述的解旋酶。
可以使用本领域已知的任何方法测量多核苷酸结合能力。例如,可以使蛋白质与多核苷酸接触,并且可以测量其结合多核苷酸并沿着多核苷酸移动的能力。蛋白质可以包括促进多核苷酸结合和/或促进其在高盐浓度和/或室温下的活性的修饰。蛋白质可以被修饰使得它们结合多核苷酸(即保留多核苷酸结合能力),但不充当解旋酶(即,当具有促进移动的所有必要组分(例如ATP和Mg2+时,不沿着多核苷酸移动)。此类修饰在领域是已知的。例如,解旋酶中Mg2+结合结构域的修饰通常产生不充当解旋酶的变体。这些类型的变体可以充当分子制动器。
酶可以共价附接至孔。可以使用任何方法将酶共价附接至孔。
在链测序中,多核苷酸在施加的电势下或逆着施加的电势易位通过孔。渐进地或持续地作用于双链多核苷酸的核酸外切酶可以用于孔的顺式侧,以在施加的电势下使剩余的单链馈送通过,或者在反向电势下用于反式侧。同样,解旋双链DNA的解旋酶也可以以类似的方式使用。也可以使用聚合酶。测序应用也可能需要逆着施加的电势进行链易位,但DNA必须首先在反向电势或无电势下被酶“捕获”。随着结合后电势被切换回来,链将从顺式到反式穿过孔,并通过电流保持在延伸构象中。单链DNA核酸外切酶或单链DNA依赖性聚合酶可以充当分子马达,以受控的逐步方式(从反式到顺式)逆着施加的电势将最近易位的单链拉回通过孔。
任何解旋酶均可以用于本发明。解旋酶对于孔可以以两种模式工作。首先,该方法优选使用解旋酶执行,使得其利用由施加的电压产生的场使多核苷酸移动通过孔。在这种模式下,多核苷酸的5'端首先被捕获在孔中,并且解旋酶将多核苷酸移动到孔中,使得它通过具有场的孔,直到它最终易位通过到膜的反式侧。或者,该方法优选执行,使得解旋酶逆着由所施加的电压产生的场使多核苷酸移动通过孔。在这种模式下,多核苷酸的3'端首先被捕获在孔中,并且解旋酶将多核苷酸移动通过孔,使得它逆着施加的场被拉出孔,直到最终弹回到膜的顺式侧。
该方法也可以以相反的方向执行。多核苷酸的3'端首先被捕获在孔中,并且解旋酶可以将多核苷酸移动到孔中,使得它通过具有场的孔,直到它最终易位通过到膜的反式侧。
当解旋酶不具有促进移动的必要成分或被修饰以阻碍或阻止其移动时,它可以与多核苷酸结合,并在多核苷酸被施加的场拉入孔中时充当减慢多核苷酸移动的制动器。在不活动模式下,多核苷酸是在3'还是5'向下捕获并不重要,是施加的场将多核苷酸拉向反式侧进入孔中,其中酶充当制动器。当在非活动模式下时,解旋酶对多核苷酸的移动控制可以以多种方式描述,包括棘轮、滑动和制动。缺乏解旋酶活性的解旋酶变体也可以以这种方式使用。
多核苷酸可以以任何顺序与多核苷酸结合蛋白(例如,多核苷酸解旋酶)和孔接触。优选的是,当多核苷酸与多核苷酸结合蛋白((例如,多核苷酸解旋酶)诸如解旋酶)和孔接触时,多核苷酸首先与多核苷酸结合蛋白(例如,多核苷酸解旋酶)形成复合物。当跨孔施加电压时,多核苷酸/多核苷酸结合蛋白(例如,多核苷酸解旋酶)复合物随后与孔形成复合物并控制多核苷酸通过孔的移动。
可以修饰多核苷酸结合蛋白以防止该多核苷酸结合蛋白从多核苷酸脱离。因此,靶多核苷酸优选不从多核苷酸结合蛋白脱离。
如本文所用,术语“脱离”是指多核苷酸结合蛋白从靶多核苷酸解离。因此,可以修饰多核苷酸结合蛋白以防止其从靶多核苷酸解离,例如进入反应介质中。区分多核苷酸结合蛋白的潜在“脱离”和多核苷酸结合蛋白从靶多核苷酸“解开”是重要的。如本文所用,“解开”是指靶多核苷酸瞬时释放到多核苷酸结合蛋白的活动位点(本文更详细地描述),但并不意味着脱离。因此,例如,可以修饰多核苷酸结合蛋白以防止多核苷酸结合蛋白从多核苷酸脱离,但不防止多核苷酸结合蛋白从多核苷酸解开。当未结合时,多核苷酸结合蛋白保持与靶多核苷酸接合。例如,多核苷酸结合蛋白可以保持与靶多核苷酸接合(即,可以防止它从靶多核苷酸脱离),因为它在靶多核苷酸周围是拓扑上闭合的。多核苷酸结合位点可以保持自由以结合或解开靶多核苷酸,使得多核苷酸结合蛋白可以与靶多核苷酸结合或解开,同时多核苷酸结合蛋白保持与靶多核苷酸接合。当多核苷酸结合蛋白从靶多核苷酸解开时,它能够在施加的力下在靶多核苷酸上(例如,沿着)移动并且能够与靶多核苷酸重新结合。当接合于靶多核苷酸上但从靶多核苷酸解开时,多核苷酸结合蛋白不能从靶多核苷酸解离。
多核苷酸结合蛋白可以适合于以任何合适的方式防止脱离。例如,可以将多核苷酸结合蛋白加载到多核苷酸上并且然后进行修饰以便防止其从多核苷酸脱离。或者,可以修饰多核苷酸结合蛋白以防止其在加载到多核苷酸上之前从多核苷酸脱离。对多核苷酸结合蛋白和/或多核苷酸结合蛋白进行修饰以便防止其从多核苷酸脱离可以使用本领域已知的方法来实现,诸如WO 2014/013260中讨论的那些,其通过引用的方式整体并入本文,并且特别参考描述对多核苷酸结合蛋白(诸如解旋酶)进行修饰以便防止其与多核苷酸链脱离的段落。例如,可以通过用四甲基偶氮二甲酰胺(TMAD)处理来修饰多核苷酸结合蛋白。各种其他闭合部分描述于WO 2021/255476(其通过引用的方式整体并入本文)中。
例如,多核苷酸结合蛋白和/或多核苷酸结合蛋白可以具有多核苷酸非结合开口,例如,当多核苷酸结合蛋白从链脱离时多核苷酸链可以通过的空腔、裂缝或空隙。多核苷酸非结合开口可以是当多核苷酸结合蛋白从多核苷酸脱离时多核苷酸可以通过的开口。针对给定的多核苷酸结合蛋白的多核苷酸非结合开口可以通过参考其结构来确定,例如,通过参考其X射线晶体结构。X射线晶体结构可以在存在和/或不存在多核苷酸底物的情况下获得。多核苷酸非结合开口在给定的多核苷酸结合蛋白中的位置可以使用本领域已知的标准包通过分子建模来推断或确认。多核苷酸非结合开口可以通过一个或多个部分(例如,多核苷酸结合蛋白的一个或多个结构域)的移动来瞬时产生。
可以通过闭合多核苷酸非结合开口来修饰多核苷酸结合蛋白。可以用闭合部分闭合多核苷酸非结合开口。因此,闭合多核苷酸非结合开口可以防止多核苷酸结合蛋白从多核苷酸脱离。例如,可以通过共价闭合多核苷酸非结合开口来修饰多核苷酸结合蛋白。然而,如上所解释,闭合多核苷酸非结合开口不一定阻止靶多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开。用于以这种方式寻址的优选蛋白质是解旋酶。
多核苷酸结合蛋白可以用闭合部分来修饰,用于:(i)拓扑上闭合靶多核苷酸周围的多核苷酸结合蛋白的多核苷酸结合位点和(ii)促进靶多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开和/或延迟靶多核苷酸与多核苷酸结合蛋白的多核苷酸结合位点的重新结合。多核苷酸结合蛋白可以以任何合适的方式修饰以促进此类闭合部分的附接。
闭合部分可以包含双功能交联部分。闭合部分可以包含双功能交联剂。双功能交联剂可以在多核苷酸结合蛋白上的两个点处附接并闭合多核苷酸结合蛋白的多核苷酸非结合开口,从而防止多核苷酸从多核苷酸结合蛋白脱离,同时允许多核苷酸从多核苷酸结合蛋白的多核苷酸结合位点解开。
闭合部分可以附接在多核苷酸结合蛋白上的任何合适的位置处。例如,闭合部分可以交联多核苷酸结合蛋白的两个氨基酸残基。通常,通过闭合部分交联的至少一种氨基酸是半胱氨酸或非天然氨基酸。可以通过对多核苷酸结合蛋白的天然存在的氨基酸残基的取代或修饰来将半胱氨酸或非天然氨基酸引入多核苷酸结合蛋白中。用于引入非天然氨基酸的方法是本领域众所周知的,并且包括例如与包含此类非天然氨基酸的合成多肽链的天然化学连接。用于将半胱氨酸引入多核苷酸结合蛋白中的方法同样在本领域技术人员的能力范围内,例如,使用参考文献中公开的技术,诸如Sambrook等人,Molecular Cloning:ALaboratory Manual,第4版,Cold Spring Harbor Press,Plainsview,New York(2012);以及Ausubel等人,Current Protocols in Molecular Biology(附录114),John Wiley&Sons,New York(2016)。
闭合部分可以具有约至约/>的长度。闭合部分的长度可以根据静态键长或更优选地使用分子动力学模拟来计算。长度可以例如为约/>至约/>诸如约/>至约例如,约/>至约/>诸如约/>至约/>或约/>例如,约/>
本文更详细地讨论了适合于使用如上所述的闭合部分来闭合的多核苷酸结合蛋白。多核苷酸结合蛋白优选是解旋酶,例如,本文所述的Dda解旋酶。
多核苷酸结合蛋白可以是外切核酸酶或可以源自外切核酸酶。合适的酶包括但不限于来自大肠杆菌的核酸外切酶I、来自大肠杆菌的核酸外切酶III、来自嗜热链球菌的RecJ和噬菌体λ核酸外切酶、TatD核酸外切酶及它们的变体。
多核苷酸结合蛋白可以是聚合酶。聚合酶可以是3173DNA聚合酶(其可从/>Corporation商购)、SD聚合酶(可从/>商购)、来自NEB的Klenow或其变体。在一个实施例中,酶是Phi29 DNA聚合酶或其变体。可以用于本发明的Phi29聚合酶的修饰版本公开于美国专利号5,576,204中。
多核苷酸结合蛋白可以是拓扑异构酶。在一个实施例中,拓扑异构酶是部分分类(EC)组5.99.1.2和5.99.1.3中的任一者的成员。拓扑异构酶可以是逆转录酶,其是能够催化从RNA模板形成cDNA的酶。它们可从例如New England和/>商购。
多核苷酸结合蛋白优选是解旋酶。可以根据本发明的方法使用任何合适的解旋酶。例如,根据本公开内容使用的该酶或每种酶可以独立地选自Hel308解旋酶、RecD解旋酶、TraI解旋酶、TrwC解旋酶、XPD解旋酶和Dda解旋酶或它们的变体。单体解旋酶可以包括附接在一起的几个结构域。例如,TraI解旋酶和TraI亚组解旋酶可以含有两个RecD解旋酶结构域、一个松弛酶结构域和一个C末端结构域。这些结构域通常形成单体解旋酶,该解旋酶能够在不形成寡聚体的情况下发挥作用。合适的解旋酶的具体实例包括Hel308、NS3、Dda、UvrD、Rep、PcrA、Pif1和TraI。这些解旋酶通常作用于单链DNA。可以沿着双链DNA的两条链移动的解旋酶的实例包括FtfK和六聚酶复合物或多亚基复合物,诸如RecBCD。多核苷酸结合蛋白优选是Dda(DNA依赖性ATP酶)解旋酶。
Hel308解旋酶在公开(诸如WO 2013/057495)中描述,其全部内容通过引用的方式并入。RecD解旋酶在公开(诸如WO 2013/098562)中描述,其全部内容通过引用的方式并入。XPD解旋酶在公开(诸如WO 2013/098561)中描述,其全部内容通过引用的方式并入。Dda解旋酶在公开(诸如WO 2015/055981和WO 2016/055777)中描述,其全部内容通过引用的方式并入。
解旋酶可以是Trwc Cba或其变体、Hel308 Mbu或其变体或Dda或其变体。变体可以以本文讨论的任何方式不同于天然序列。Dda的示例性变体包括E94C/A360C。Dda的另一示例性变体包括E94C/A360C,并且然后包括(ΔM1)G1G2(即,删除M1,并且然后添加G1和G2)。
方法
在一些方面,本公开涉及通过使复合物的链易位通过纳米孔并检测或测量一种或多种信号来对双链核酸复合物进行测序的方法。在一些实施例中,该方法包括:测量指示一对中的第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的该第一和第二核酸两者的数据来确定双链核酸复合物的特征。在一些实施例中,该方法包括:检测对应于通过纳米孔的离子流的信号,以检测易位通过该纳米孔的一对中的第一和第二核酸的多核苷酸;识别对应于该一对中的第一核酸的易位的信号和对应于该一对中的该第二核酸的单独易位的顺序信号;以及分析识别到的该信号,从而对双链核酸复合物进行测序。
如本文所用,术语“易位(translocate)”或“易位(translocation)”是指沿着纳米孔的至少一部分的移动。在一些实施例中,易位是从纳米孔的顺式侧移动到该纳米孔的反式侧。
可以使用电学测量和/或光学测量来监测通过跨膜孔的离子流。
电学测量可以是电流测量、阻抗测量、隧道测量或场效应晶体管(FET)测量。
当多肽易位通过跨膜孔时,通过跨膜孔的离子流的变化可以被检测为电流、电阻或光学特性的变化。测量的效应可以是穿过跨膜孔的电子隧道效应。测量的效应可以是由于多核苷酸与跨膜孔的相互作用而引起的电势的变化,其中在FET测量中使用局部电势传感器来监测该效应。
可以进行多种不同类型的测量。这包括但不限于:电学测量和光学测量。涉及荧光测量的合适的光学方法公开于J.Am.Chem.Soc.2009,131 1652-1653中。可能的电学测量包括电流测量、阻抗测量、隧道测量(Ivanov A P等人,Nano Lett.2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(SoniG V等人,Rev Sci Instrum.2010年1月;81(1):014301)。测量可以是跨膜电流测量,诸如流过孔的离子电流的测量。
可以使用标准单通道记录设备进行电学测量,如Stoddart D等人,Proc NatlAcad Sci,12;106(19):7702-7,Lieberman K R等人,J Am Chem Soc.2010;132(50):17961-72以及国际申请WO 2000/28312中所述。或者,可以使用多通道系统进行电学测量,例如,如WO 2009/077734和WO 2011/067559中所述。
方法优选在跨膜施加的电势下执行。施加的电势可以是电压电势。或者,施加的电势可以是化学势。在一些实施例中,施加的电势可以由渗透压不平衡来驱动。这个的实例是使用跨膜的盐梯度,诸如两亲层。盐梯度公开于Holden等人,J Am Chem Soc.2007年7月11日;129(27):8650-5中。在一些情况下,当多核苷酸相对于孔移动时穿过该孔的电流用于估计或确定多核苷酸的序列。
在本文所述的各个方面的一些实施例中,该方法可以涉及进一步表征靶多核苷酸。当靶多核苷酸与孔接触时,当多核苷酸相对于该孔移动时,进行指示靶多核苷酸的一个或多个特征的一种或多种测量。
该方法可以涉及确定多核苷酸是否被修饰。可以测量任何经修饰的存在或不存在。该方法优选包括:确定多核苷酸是否被甲基化、氧化、损伤、用一种或多种蛋白质或用一种或多种标记、标签或间隔子修饰。特定的修饰将导致与孔的特定的相互作用,这可以使用下述方法进行测量。例如,甲基胞嘧啶可以基于在其与每个核苷酸相互作用期间通过孔的离子流来与胞嘧啶进行区分。
系统
本公开的方面涉及用于执行本文所述方法的系统。在一些实施例中,系统包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,该一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨该膜施加电势以促进该单链核酸通过该纳米孔的易位,并且其中该系统被配置使得一对中的核酸顺序易位通过该纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过该纳米孔的可能性。在一些实施例中,系统包括孔(例如,测序装置的孔),该孔包括设置在膜中的纳米孔;多条系链,其中添加到该孔中的该多条系链的浓度为至少100nM;双链核酸分子,该双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,该前导序列包含至少两个非连续的聚dT区段。
该系统可以是适合于研究其中膜中存在孔的膜/孔系统的任何装置的一部分。该方法可以使用适合于跨膜孔感测的任何装置来执行。例如,装置包括包含水溶液的室和将该室分成两个部分的屏障。屏障通常具有孔(例如,孔),在孔中(或穿过孔)形成含有孔的膜。或者,屏障形成其中存在孔的膜。
该方法可以使用WO 2008/102120中所述的装置来执行。可以进行多种不同类型的测量。这包括但不限于:电学测量和光学测量。涉及荧光测量的合适的光学方法公开于J.Am.Chem.Soc.2009,131 1652-1653中。可能的电学测量包括:电流测量、阻抗测量、隧道测量(Ivanov AP等人,Nano Lett.2011年1月12日;11(1):279-85)以及FET测量(国际申请WO 2005/124888)。光学测量可以与电学测量相结合(Soni G V等人,Rev SciInstrum.2010年1月;81(1):014301)。测量可以是跨膜电流测量,诸如流过孔的离子电流的测量。
可以使用标准单通道记录设备进行电学测量,如Stoddart D等人,Proc NatlAcad Sci,12;106(19):7702-7,Lieberman K R等人,J Am Chem Soc.2010;132(50):17961-72以及国际申请WO 2000/28312中所述。或者,可以使用多通道系统进行电学测量,例如,如国际申请WO 2009/077734和国际申请WO 2011/067559中所述。
方法优选在跨膜施加的电势下执行。施加的电势可以是电压电势。或者,施加的电势可以是化学势。这个的实例是使用跨膜的盐梯度,诸如两亲层。盐梯度公开于Holden等人,J Am Chem Soc.2007年7月11日;129(27):8650-5中。在一些情况下,当多核苷酸相对于孔移动时穿过该孔的电流用于估计或确定多核苷酸的序列。
该方法可以涉及测量当多核苷酸相对于孔移动时通过孔的电流。因此,装置也可以包括能够施加电势并测量穿过膜和孔的电信号的电路。该方法可以使用膜片钳或电压钳来执行。该方法优选地涉及电压钳的使用。
本发明的方法可以涉及当多核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的合适的条件是本领域已知的并且公开于实例中。方法通常通过在膜和孔上施加电压来执行。所使用的电压通常为+5V至-5V,诸如+4V至-4V、+3V至-3V或+2V至-2V。所使用的电压通常为-600mV至+600mV或-400mV至+400mV。所使用的电压优选在具有选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV的下限和独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV的上限的范围内。所使用的电压更优选在100mV至240mV的范围内并且最优选在120mV至220mV的范围内。通过使用增加的施加电势可以增加孔对不同核苷酸的区分。
该方法通常在任何电荷载流子的存在下执行,诸如金属盐(例如,碱金属盐)、卤化物盐(例如,氯化物盐(诸如碱金属氯化物盐))。电荷载体可以包括离子液体或有机盐,例如,四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基氯化咪唑鎓。在上面讨论的示例性装置中,盐存在于室中的水溶液中。通常使用氯化钾(KCl)、氯化钠(NaCl)、氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。优选KCl、NaCl以及亚铁氰化钾和铁氰化钾的混合物。电荷载流子可以在膜上是不对称的。例如,膜的每侧上的电荷载流子的类型和/或浓度可以不同。
盐浓度可以处于饱和状态。盐浓度可以为3M或更低,并且通常为0.1至2.5M、0.3至1.9M、0.5至1.8M、0.7至1.7M、0.9至1.6M或1M至1.4M。盐浓度优选为150mM至1M。该方法优选使用至少0.3M(诸如至少0.4M、至少0.5M、至少0.6M、至少0.8M、至少1.0M、至少1.5M、至少2.0M、至少2.5M或至少3.0M)的盐浓度执行。高盐浓度提供高信噪比并允许在正常电流波动的背景下识别指示核苷酸的存在的电流。
该方法通常在缓冲液的存在下执行。在上面讨论的示例性装置中,缓冲液存在于室中的水溶液中。任何缓冲液均可以用于本发明的方法中。通常,缓冲液是磷酸盐缓冲液。其他合适的缓冲液是HEPES和Tris-HCl缓冲液。该方法通常在4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5的pH下执行。所使用的pH优选为约7.5。
该方法可以在0℃至100℃、15℃至95℃、16℃至90℃、17℃至85℃、18℃至80℃、19℃至70℃或20℃至60℃执行。该方法通常在室温下进行。该方法任选地在支持酶功能的温度下进行,诸如约37℃。
数据分析和比对
如本文所述,在一些实施例中,本文所述的方法进一步包括执行比对步骤。核酸序列比对可以使用本领域已知的各种比对方法中的任一种比对方法执行,例如,诸如WO2015140535或Rang等人,Genome Biol 19,90(2018)中所公开。
可以执行候选对的全部或部分比对。可以指定最小比对重叠,即确定要比对的一对中的核酸的最小数量。对(通常是碱基对)的最小数量可以选自20、50、100、500、1000或更大之间的值。
为了确定核苷酸序列,可以执行本领域已知的各种方法,例如,诸如WO 2015/140535、WO 2013/121224、WO 2020/109773或WO 2018/203084中所公开,所有这些均据此通过引用的方式整体并入本文。
实例1
较高浓度的辛基-生育酚系链可以提高后续率
来自大肠杆菌的基因组DNA被扩增并片段化。使用Oxford NanoporeTechnologies的连接测序试剂盒SQK-LSK109将定制测序衔接子连接到DNA片段,以形成测序文库。
电学测量是在Oxford Nanopore Technologies的GridION流动池上获得的。流动池用冲洗缓冲液装填,并在添加测序文库之前将含有指定浓度的测试系链的冲洗系链添加到该流动池中。将10ng测序文库添加到流动池中。
后续率被确定为被识别为后续事件的链的百分比。
表1
系链 后续百分比
50nM OTT-a 15%
1μM OTT-a 25%
50nM CHOL 12%
50nM OTT-b 12%
表2
定制测序衔接子由以下顶链组成,包括5'前导序列:
3333//99/CTTATTTTTTTATTTTTTTATTTT/3/CTACATCTCCTTATTCGCTGCAC/333/TTmUmUTT/8/CCTGTACTTCGTTCAGTTACGTATTGCT-N3
其中3=iSpC3、8=iSp18、mU=2'OMe RNA、9=iSp9、N3=用叠氮基己酸标记的3'氨基C7。间隔子经由Integrated DNA Technologies,Inc使用的代码表示。
实例2
包含一个或多个聚dT部分的前导区提供增强的孔捕获
根据实例1所述的方法制备DNA测序文库。比较了包含以下前导序列的定制测序衔接子:
聚T:33333333TTTTTTTTTTTTTTTTTTTTTTTT
间隔子:333333333333333333333333333333
3=iSpC3间隔子。
与间隔子前导区相比,聚T前导区的孔捕获和所得灵敏度有所增加(图1)。
实例3
较长的系链和衔接子之间的杂交长度提供增加的后续
根据实例1所述的方法制备DNA测序文库。在添加3ng连接文库之前,用200nM系链引发流动池。
比较了以下系链:
8=iSp18间隔子
较长的杂交序列提高了后续率。用25个碱基对杂交长度实现了最高的后续率(或“双链”数据),提供了大约40%的后续率(所获得的所有数据的百分比)。结果呈现在图2中。
序列表
<110> OXFORD NANOPORE TECHNOLOGIES PLC
<120> 用于补体链测序的方法
<130> N424437WO
<150> US 63/190,689
<151> 2021-05-19
<160> 9
<170> PatentIn版本3.5
<210> 1
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8888,其中8是iSp18间隔子
<220>
<221> misc_feature
<222> (15)..(15)
<223> 3'-Cy5
<400> 1
ttgaccgctc gcctc 15
<210> 2
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[胆固醇]-8888,其中8是iSp18间隔子
<400> 2
ttgaccgctc gcctc 15
<210> 3
<211> 15
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-33,其中3是iSp3间隔子
<400> 3
ttgaccgctc gcctc 15
<210> 4
<211> 81
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-333399,其中3是iSpC3并且9是iSp9
<220>
<221> misc_feature
<222> (24)..(25)
<223> iSpC3
<220>
<221> misc_feature
<222> (47)..(48)
<223> 333,其中3是iSpC3
<220>
<221> misc_feature
<222> (50)..(50)
<223> 2'-邻甲基RNA
<220>
<221> misc_feature
<222> (51)..(51)
<223> 2'-邻甲基RNA
<220>
<221> misc_feature
<222> (53)..(54)
<223> iSp18
<220>
<221> misc_feature
<222> (81)..(81)
<223> 用叠氮基己酸标记的C3'-氨基C7
<400> 4
cttatttttt tattttttta ttttctacat ctccttattc gctgcacttu uttcctgtac 60
ttcgttcagt tacgtattgc t 81
<210> 5
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-33333333,其中3是iSpC3间隔子
<400> 5
tttttttttt tttttttttt tttt 24
<210> 6
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 6
gtcaggatta gtgcgtctac atggc 25
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 7
gtcaggatta gtgcgtctac a 21
<210> 8
<211> 16
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 8
gtcaggatta gtgcgt 16
<210> 9
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 合成序列
<220>
<221> misc_feature
<222> (1)..(1)
<223> 5'-[辛基-生育酚]-8,其中8是iSp18间隔子
<400> 9
gtcaggatta gt 12

Claims (59)

1.一种方法,其包括:
(i)将多条系链添加到包含设置在膜中的纳米孔的孔中,其中添加到所述孔中的系链的浓度为至少100nM;
(ii)使所述纳米孔与包含一对非共价结合的单链核酸的双链核酸复合物接触,所述一对中的每个单链核酸包含具有前导区的衔接子;以及
(iii)向所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位。
2.根据权利要求1所述的方法,其中所述一对中的第一核酸和第二核酸各自是DNA或RNA。
3.根据权利要求1或2所述的方法,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
4.根据权利要求1至3中任一项所述的方法,其中所述一对中的第一单链核酸的衔接子定位在所述第一单链核酸的5'端上且/或所述一对中的第二单链核酸的衔接子定位在所述第二单链核酸的5'端上。
5.根据权利要求1至4中任一项所述的方法,其中每个前导区包括一个或多个聚dT区段。
6.根据权利要求5所述的方法,其中每个前导区包括两个或更多个聚dT区段,任选地,其中所述聚dT区段中的每个聚dT区段是不连续的。
7.根据权利要求1至6中任一项所述的方法,其中每个衔接子进一步包含一个或多个间隔子。
8.根据权利要求7所述的方法,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
9.根据权利要求1至8中任一项所述的方法,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
10.根据权利要求1至9中任一项所述的方法,其中所述纳米孔是蛋白质纳米孔,任选地,其中所述纳米孔是CsgG纳米孔。
11.根据权利要求1至10中任一项所述的方法,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
12.根据权利要求11所述的方法,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
13.根据权利要求1至12中任一项所述的方法,其中添加到所述孔中的系链的所述浓度包括约100nM至1μM、500nM至2μM、1μM至10μM或5μM至50μM。
14.根据权利要求1至13中任一项所述的方法,其进一步包括以下步骤:测量指示所述一对中的所述第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的所述第一和第二核酸两者的数据来确定所述双链核酸复合物的特征。
15.根据权利要求1至14中任一项所述的方法,其进一步包括:(iv)检测对应于通过所述纳米孔的离子流的信号,以检测易位通过所述孔的所述第一和第二核酸的多核苷酸;(v)识别对应于所述一对中的所述第一核酸的易位的信号和对应于所述一对中的所述第二核酸的单独易位的顺序信号;以及(vi)分析(v)中识别到的所述信号,从而对所述双链核酸复合物进行测序。
16.一种系统,其包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,所述一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位,并且其中所述系统被配置使得一对中的核酸顺序易位通过所述纳米孔的可能性大于来自不同对的非共价结合的单链核酸的核酸顺序易位通过所述纳米孔的可能性。
17.一种系统,其包含双链核酸复合物,每个复合物包含一对非共价结合的单链核酸,所述一对中的每个单链核酸包含具有通向设置在膜中的纳米孔的前导区的衔接子,其中跨所述膜施加电势以促进所述单链核酸通过所述纳米孔的易位,并且其中所述膜包含多条系链,所述多条系链被配置和布置成促进非共价结合的单链核酸对中的成员以至少10%的后续读取频率顺序易位通过所述纳米孔。
18.根据权利要求16或权利要求17所述的系统,其中所述一对中的所述第一核酸和所述第二核酸各自是DNA或RNA。
19.根据权利要求16至18中任一项所述的系统,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
20.根据权利要求16至19中任一项所述的系统,其中所述一对中的第一单链核酸的衔接子定位在所述第一单链核酸的5'端上且/或所述一对中的第二单链核酸的衔接子定位在所述第二单链核酸的5'端上。
21.根据权利要求16至20中任一项所述的系统,其中每个前导区包括一个或多个聚dT区段。
22.根据权利要求21所述的系统,其中每个前导区包括两个或更多个聚dT区段,任选地,其中所述聚dT区段中的每个聚dT区段是不连续的。
23.根据权利要求16至22中任一项所述的系统,其中每个衔接子进一步包含一个或多个间隔子。
24.根据权利要求16至23中任一项所述的系统,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
25.根据权利要求16至24中任一项所述的系统,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
26.根据权利要求16至25中任一项所述的系统,其中所述纳米孔是蛋白质纳米孔,任选地,其中所述纳米孔是CsgG纳米孔。
27.根据权利要求16至26中任一项所述的系统,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
28.根据权利要求27所述的系统,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
29.根据权利要求16至28中任一项所述的系统,其中一对中的核酸顺序易位通过所述纳米孔的可能性比来自不同非共价结合的单链核酸对的核酸顺序易位通过所述纳米孔的可能性大至少15%、20%、25%或30%。
30.一种用于使两个非共价结合的分子顺序易位通过纳米孔的方法,所述方法包括:
(i)接触包含一对非共价结合的单链核酸的双链核酸复合物,所述一对中的每个单链核酸包含衔接子,所述衔接子具有通向设置在包含多条系链的膜中的纳米孔的前导区,所述膜包含在孔中,其中添加到所述孔中的系链的浓度为至少1μM;以及
(ii)向所述膜施加电势,其中在施加所述电势之后,第一单链核酸易位通过所述纳米孔,并且当所述第一单链核酸易位时,使第二单链核酸与所述系链中的存在于所述膜上的至少一条系链可逆地结合,并且在所述一对中的所述第一单链核酸已经完全易位通过所述纳米孔之后,所述一对中的所述第二单链核酸易位通过所述纳米孔。
31.一种用于使两个非共价结合的分子顺序易位通过纳米孔的方法,所述方法包括:
(i)提供包含一对非共价结合的单链核酸的双链核酸复合物,所述一对中的每个单链核酸包含具有前导区的衔接子;
(ii)在促进所述一对中的第一单链核酸易位通过所述纳米孔的条件下,使(i)中的所述双链核酸复合物与设置在包含多条系链的膜中的纳米孔接触,所述膜包含在孔中,其中添加到所述孔中的系链的浓度为至少1μM;
(iii)使所述第二单链核酸与所述系链中的存在于所述膜上的至少一条系链可逆地结合;以及
(iv)在所述一对中的所述第一单链核酸已经完全易位通过所述纳米孔之后,使所述一对中的所述第二单链核酸易位通过所述纳米孔。
32.根据权利要求30或31所述的方法,其中所述一对中的所述第一核酸和所述第二核酸各自是DNA或RNA。
33.根据权利要求30至32中任一项所述的方法,其中所述一对中的所述第一核酸和第二核酸是彼此互补的。
34.根据权利要求30至33中任一项所述的方法,其中每个前导区包括一个或多个聚dT区段。
35.根据权利要求34所述的方法,其中每个前导区包括两个或更多个聚dT区段,其中所述聚dT区段中的每个聚dT区段是不连续的。
36.根据权利要求30至35中任一项所述的方法,其中每个衔接子进一步包含一个或多个间隔子。
37.根据权利要求36所述的方法,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
38.根据权利要求30至37中任一项所述的方法,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
39.根据权利要求30至38中任一项所述的方法,其中所述纳米孔是蛋白质纳米孔。
40.根据权利要求30至39中任一项所述的方法,其中所述纳米孔是CsgG纳米孔。
41.根据权利要求30至40中任一项所述的方法,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
42.根据权利要求41所述的方法,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
43.根据权利要求30至42中任一项所述的方法,其中添加到所述孔中的系链的所述浓度包括约1μM至5μM、2μM至20μM或10μM至50μM。
44.根据权利要求31至43中任一项所述的方法,其中促进所述一对中的第一单链核酸通过所述纳米孔的易位包括:跨所述膜施加电势。
45.根据权利要求30至44中任一项所述的方法,其中使所述一对中的所述第二单链核酸易位通过所述纳米孔包括:通过所述纳米孔捕获所述第二单链核酸的所述前导区。
46.根据权利要求30至45中任一项所述的方法,其中所述一对中的所述第二单链核酸紧接在所述一对中的所述第一单链核酸之后易位通过所述纳米孔。
47.根据权利要求30至45中任一项所述的方法,其中不是所述复合物的一部分的一种或多种核酸在所述一对中的所述第二单链核酸易位通过所述纳米孔之前易位通过所述纳米孔。
48.根据权利要求30至47中任一项所述的方法,其中在所述第一单链核酸完全易位通过所述纳米孔之后,所述第一单链核酸和所述第二单链核酸不再非共价结合。
49.根据权利要求30至49中任一项所述的方法,其进一步包括以下步骤:测量指示所述一对中的所述第一和第二核酸的易位的特性;获得指示所测量的特性的数据;以及基于所获得的所述第一和第二核酸两者的数据来确定所述双链核酸复合物的特征。
50.根据权利要求30至49中任一项所述的方法,其进一步包括:(a)检测对应于通过所述纳米孔的离子流的信号,以检测易位通过所述孔的所述第一和第二核酸的多核苷酸;(b)识别对应于所述一对中的所述第一核酸的易位的信号和对应于所述一对中的所述第二核酸的单独易位的顺序信号;以及(c)分析(b)中识别到的信号,从而对所述双链核酸复合物进行测序。
51.一种双链核酸复合物,其包含:
(i)第一单链核酸和第一衔接子,所述第一单链核酸包含第一模板核酸,其中所述第一衔接子包含前导序列,所述前导序列包含至少两个非连续的聚dT区段,其中
所述第一单链核酸与第二单链核酸非共价结合,所述第二单链核酸包含与第一模板核酸区段互补的第二模板核酸区段,以及第二衔接子,其中所述第二衔接子包含前导序列,所述前导序列包含至少两个非连续的聚dT区段;以及
(ii)系链。
52.根据权利要求51所述的复合物,其中所述第一模板核酸区段和/或所述第二模板核酸区段是DNA或RNA。
53.根据权利要求51或52所述的复合物,其中每个前导区包括三个或更多个不连续的聚dT区段。
54.根据权利要求51至53中任一项所述的复合物,其中每个衔接子进一步包含一个或多个间隔子。
55.根据权利要求54所述的复合物,其中所述一个或多个间隔子中的每个间隔子选自iSp3C间隔子、iSpC9间隔子和iSpC18间隔子。
56.根据权利要求51至55中任一项所述的复合物,其中每个衔接子进一步包含一种或多种经修饰的核苷酸,任选地,其中所述经修饰的核苷酸是2'-邻甲基(2'OMe)修饰的核苷酸。
57.根据权利要求51至56中任一项所述的复合物,其中所述系链中的每条系链是脂质、脂肪酸、甾醇、碳纳米管、多肽、蛋白质或氨基酸。
58.根据权利要求57所述的复合物,其中所述系链中的每条系链包含生育酚,任选地,其中所述系链中的每条系链包含辛基-生育酚。
59.一种包括孔的用于核酸测序的系统,所述系统包括:
(i)设置在膜中的纳米孔;
(ii)多条系链,其中添加到所述孔中的所述多条系链的浓度是至少100nM;
(iii)双链核酸分子,所述双链核酸分子包含与互补的第二链杂交的第一链,每条链包含前导序列,所述前导序列包含至少两个非连续的聚dT区段。
CN202280035082.6A 2021-05-19 2022-05-19 用于补体链测序的方法 Pending CN117337333A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163190689P 2021-05-19 2021-05-19
US63/190,689 2021-05-19
PCT/GB2022/051269 WO2022243692A1 (en) 2021-05-19 2022-05-19 Methods for complement strand sequencing

Publications (1)

Publication Number Publication Date
CN117337333A true CN117337333A (zh) 2024-01-02

Family

ID=81854718

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280035082.6A Pending CN117337333A (zh) 2021-05-19 2022-05-19 用于补体链测序的方法

Country Status (3)

Country Link
EP (1) EP4341433A1 (zh)
CN (1) CN117337333A (zh)
WO (1) WO2022243692A1 (zh)

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
US6267872B1 (en) 1998-11-06 2001-07-31 The Regents Of The University Of California Miniature support for thin films containing single channels or nanopores and methods for using same
WO2005124888A1 (en) 2004-06-08 2005-12-29 President And Fellows Of Harvard College Suspended carbon nanotube field effect transistor
GB0505971D0 (en) 2005-03-23 2005-04-27 Isis Innovation Delivery of molecules to a lipid bilayer
EP2126588A1 (en) 2007-02-20 2009-12-02 Oxford Nanopore Technologies Limited Formation of lipid bilayers
EP3540436B1 (en) 2007-09-12 2023-11-01 President And Fellows Of Harvard College High-resolution molecular sensor
GB0724736D0 (en) 2007-12-19 2008-01-30 Oxford Nanolabs Ltd Formation of layers of amphiphilic molecules
CN102439043A (zh) 2009-01-30 2012-05-02 牛津纳米孔技术有限公司 杂交连接物
US9127313B2 (en) 2009-12-01 2015-09-08 Oxford Nanopore Technologies Limited Biochemical analysis instrument
US9347929B2 (en) 2011-03-01 2016-05-24 The Regents Of The University Of Michigan Controlling translocation through nanopores with fluid wall
EP4273092A3 (en) 2011-05-27 2024-01-17 Oxford Nanopore Technologies plc Method and apparatus for determining the presence, absence or characteristics of an analyte
BR112014009579B1 (pt) 2011-10-21 2021-06-22 Oxford Nanopore Technologies Limited Métodos para caracterizar um polinucleotídeo alvo, e para formar um sensor, uso de uma helicase, kit, e, aparelho de análise
US9617591B2 (en) 2011-12-29 2017-04-11 Oxford Nanopore Technologies Ltd. Method for characterising a polynucleotide by using a XPD helicase
US10385382B2 (en) 2011-12-29 2019-08-20 Oxford Nanopore Technologies Ltd. Enzyme method
CN104321441B (zh) 2012-02-16 2016-10-19 牛津楠路珀尔科技有限公司 聚合物的测量的分析
BR112014025157B1 (pt) 2012-04-10 2022-02-08 Oxford Nanopore Technologies Limited Monômero de lisenina mutante, construto, poro, método para caracterizar um analito alvo, uso de um poro, e, kit
EP2875154B1 (en) 2012-07-19 2017-08-23 Oxford Nanopore Technologies Limited SSB method for characterising a nucleic acid
CA2879261C (en) 2012-07-19 2022-12-06 Oxford Nanopore Technologies Limited Modified helicases
EP2875152B1 (en) 2012-07-19 2019-10-09 Oxford Nanopore Technologies Limited Enzyme construct
WO2014064444A1 (en) 2012-10-26 2014-05-01 Oxford Nanopore Technologies Limited Droplet interfaces
GB201313121D0 (en) 2013-07-23 2013-09-04 Oxford Nanopore Tech Ltd Array of volumes of polar medium
GB201314695D0 (en) 2013-08-16 2013-10-02 Oxford Nanopore Tech Ltd Method
WO2014135838A1 (en) 2013-03-08 2014-09-12 Oxford Nanopore Technologies Limited Enzyme stalling method
JP6677640B2 (ja) 2013-10-18 2020-04-08 オックスフォード ナノポール テクノロジーズ リミテッド 修飾酵素
WO2015110813A1 (en) 2014-01-22 2015-07-30 Oxford Nanopore Technologies Limited Method for attaching one or more polynucleotide binding proteins to a target polynucleotide
WO2015140535A1 (en) 2014-03-21 2015-09-24 Oxford Nanopore Technologies Limited Analysis of a polymer from multi-dimensional measurements
WO2015150786A1 (en) 2014-04-04 2015-10-08 Oxford Nanopore Technologies Limited Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
GB201417712D0 (en) 2014-10-07 2014-11-19 Oxford Nanopore Tech Ltd Method
CN117164682A (zh) 2014-09-01 2023-12-05 弗拉芒区生物技术研究所 突变csgg孔
GB201418159D0 (en) 2014-10-14 2014-11-26 Oxford Nanopore Tech Ltd Method
EP3423485B1 (en) 2016-03-02 2021-12-29 Oxford Nanopore Technologies plc Mutant pore
GB201620450D0 (en) * 2016-12-01 2017-01-18 Oxford Nanopore Tech Ltd Method
GB201707138D0 (en) 2017-05-04 2017-06-21 Oxford Nanopore Tech Ltd Machine learning analysis of nanopore measurements
EP4273156A3 (en) 2017-06-30 2024-01-17 Vib Vzw Novel protein pores
GB201809323D0 (en) * 2018-06-06 2018-07-25 Oxford Nanopore Tech Ltd Method
GB201819378D0 (en) 2018-11-28 2019-01-09 Oxford Nanopore Tech Ltd Analysis of nanopore signal using a machine-learning technique
GB201907244D0 (en) 2019-05-22 2019-07-03 Oxford Nanopore Tech Ltd Method
GB201917742D0 (en) 2019-12-04 2020-01-15 Oxford Nanopore Tech Ltd Method
US20240076729A9 (en) 2020-06-18 2024-03-07 Oxford Nanopore Technologies Plc Method

Also Published As

Publication number Publication date
WO2022243692A1 (en) 2022-11-24
EP4341433A1 (en) 2024-03-27

Similar Documents

Publication Publication Date Title
US11946102B2 (en) Coupling method
US11649490B2 (en) Method of target molecule characterisation using a molecular pore
EP3548636B1 (en) Methods and systems for characterizing analytes using nanopores
EP3464624B1 (en) Method of nanopore sequencing of concatenated nucleic acids
EP3126515B1 (en) Method for characterising a double stranded nucleic acid using a nano-pore and anchor molecules at both ends of said nucleic acid
EP3207157B1 (en) Methods for delivering an analyte to transmembrane pores
CN117337333A (zh) 用于补体链测序的方法
CN116478983B (zh) 一种rna-dna嵌合接头及其应用
CN117587110A (zh) 富集方法、表征分析物的方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination