CN116478983B

CN116478983B - 一种rna-dna嵌合接头及其应用

Info

Publication number: CN116478983B
Application number: CN202211473395.8A
Authority: CN
Inventors: 张宁
Original assignee: Beijing Puyi Biotechnology Co ltd
Current assignee: Beijing Puyi Biotechnology Co ltd
Priority date: 2022-11-21
Filing date: 2022-11-21
Publication date: 2023-10-24
Anticipated expiration: 2042-11-21
Also published as: WO2024109455A1; CN116478983A

Abstract

本发明提出一种RNA‑DNA嵌合接头及其应用，属于生物分析检测以及基因测序领域，尤其涉及一种用于确保单个解旋酶结合以及阻滞解旋酶移动的测序接头序列设计、构建方法以及应用。采用RNA结合DNA的方式，特异性保证解旋酶在接头上的结合位置、个数等；而RNA‑DNA杂合结构具有比单独RNA双链结构更稳定的特性，并且只能被RNaseH所识别(RNaseH特异性识别RNA‑DNA杂合结构)，切除RNA‑DNA杂合结构中的RNA链，从而暴露出作为引导链的单链DNA。adapter引入Cy3，Cy3能够有效阻滞Dda。本发明所述的RNA‑DNA嵌合adapter主要应用在纳米孔测序中，通过本发明实验的系统验证，该adapter以及adapter mix能够有效进行纳米孔测序。

Description

一种RNA-DNA嵌合接头及其应用

技术领域

本发明属于生物分析检测以及基因测序领域，尤其涉及一种RNA-DNA嵌合接头及其应用。

背景技术

纳米孔测序技术是近年被开发出来的新型核酸测序技术。依据孔道类型可分为固态孔和生物纳米孔，生物纳米孔即能够允许底物通过的孔道蛋白，以下纳米孔测序单指生物纳米孔测序技术。在电场力的作用下，带电核酸底物能够通过生物纳米孔。当核酸通过纳米孔时，能够阻碍纳米孔的电流，产生不同的电流信号，通过对电流信号的解析，可以获得核酸的碱基信息。

测序常用底物多为双链DNA或RNA，而双链核酸无法自由穿过纳米孔，需要能将核酸双链解旋形成单链，或者采用聚合的方式，以双链核酸为模板合成单链，因此，在纳米孔测序过程中，多采用解旋酶或者聚合酶等生物酶来得到由双链产生单链的目的。此外，电场力作用下(180mV)，单链核酸底物穿过纳米孔速度过快，以至于检测电流无法记录。所以还需要对待测单链核酸进行限速，此时解旋酶或者聚合酶本身的活性(解旋效率，聚合效率)都能起到限速的作用。

测序过程中，接头(adapter)是由长度不同的互补DNA退火形成的单双链结构(overhang，图1)，它的主要作用是，1.单链区作为引导序列，将adapter与解旋酶复合物(adapter mix)引向孔道附近，产生底物过孔电场力；2.后续双链区连接待测双链DNA底物；3.单双链交会区，结合解旋酶，并将解旋酶阻滞于此，在产生过孔电场力前不能解开双链结构(在由ATP和Mg²⁺条件下)。单链区可以结合多个解旋酶(多数解旋酶在无ATP和Mg²⁺会停在单双链嵌合位置)，这样会造成引导序列短，还可以引起多个解旋酶作用存在差异，使得解旋效率变低。已有专利(WO2014135838A1)，常用策略是采用iSp18、iSpC3等不含碱基基团的核苷酸类似物来阻滞或者封堵解旋酶的结果，在保证引导序列足够长的前提下，常用多个iSp18等核苷酸类似物(非天然氨基酸)串联。这种方案首先合成这些类似物存在较大难度，步骤繁琐，串联效率低且串联个数较多时，链容易断裂。不均一的adapter会影响解旋酶的结合数量，阻滞效果，从而影响测序效率；其次，合成成本较高。因此，保证单个解旋酶结合在adapter上，以及阻滞解旋酶的方案存在需要。

发明内容

采用RNA结合DNA的方式，特异性保证解旋酶在接头上的结合位置、个数等；而RNA-DNA杂合结构具有比单独RNA双链结构更稳定的特性，并且只能被RNaseH所识别(RNaseH特异性识别RNA-DNA杂合结构)，切除RNA-DNA杂合结构中的RNA链，从而暴露出作为引导链的单链DNA。在RNA结合时，adapter单链区只允许一个解旋酶分子结合，以此排除多个解旋酶结合，对于解旋活性以及多个解旋酶对adapter引导序列结合使得待测样品进孔效率变差。同时，为了阻止解旋酶在接头上的非目的性移动(接头制备过程，测序过程，ATP等需要先与待测DNA孵育，此时解旋酶会具有活性而解开双链DNA区域)，本发明还提供一种解旋酶的阻滞方案，即在单双链交会处引入Cy3(四甲基吲哚-碳菁)，Cy3在ATP和Mg²⁺存在的条件下，无外加电场时，Cy3能够有效阻滞Dda的解旋能力。经过鉴定，本发明所述方案能够产生有效的纳米孔测序数据。

第一方面，本发明提供一种用于表征靶多核苷酸的嵌合接头，所述嵌合接头包含三段核酸：核酸A、核酸B和核酸C；核酸A是DNA，核酸B是DNA，核酸C为RNA。

其中一些实施方案中，核酸A是DNA，从5’到3’包含四段区域a4、a1、a2、a3；a1为引导区区域，同时与核酸C的RNA片段结合，封阻多核苷酸结合蛋白的结合；a2为多核苷酸结合蛋白结合和阻滞区区域；a3为形成互补双链区区域，同时与靶多核苷酸连接；a4为引导区a1的补充区域。

其中一些实施方案中，核酸A的a2区域中还包含阻滞化合物Cy3。

其中一些实施方案中，核酸B是DNA，包含b3区域，5’端含有磷酸化，b3为与核酸A中的a3区域形成互补的区域。

其中一些实施方案中，核酸C为RNA，包含c1区域，c1为与核酸A中的a1区域形成互补的区域。

其中一些实施方案中，核酸A中，a1的序列如SEQ ID NO2所示，a2的序列如SEQ IDNO3所示，a3的序列如SEQ ID NO4所示，a4的序列如SEQ ID NO5所示。

其中一些实施方案中，核酸A的序列如SEQ ID NO1所示。

其中一些实施方案中，核酸B的序列如SEQ ID NO6所示。

其中一些实施方案中，核酸C的序列如SEQ ID NO7所示。

其中一些实施方案中，嵌合接头的序列如SEQ ID NO1、SEQ ID NO6和SEQ ID NO7所示。

其中一些实施方案中，所述靶多核苷酸是完全双链多核苷酸、部分双链多核苷酸或单链多核苷酸。

第二方面，本发明提供一种用于表征靶多核苷酸的复合物，其中，所述复合物包含多核苷酸结合蛋白和上述嵌合接头。

其中一些实施方案中，所述多核苷酸结合蛋白衍生自多核苷酸处理酶；优选地，所述多核苷酸处理酶选自聚合酶、解旋酶或核酸外切酶；更优选地，所述多核苷酸处理酶为解旋酶；最优选地，解旋酶为T4 Dda解旋酶(E94C/C109A/C136A/A360C)。

其中一些实施方案中，用于表征靶多核苷酸的复合物只结合单个多核苷酸结合蛋白。

第三方面，本发明提供上述用于表征靶多核苷酸的复合物的制备方法，包括以下步骤：

1)合成核酸A、B和C，并用不含RNA酶的TE缓冲液溶解；

2)等体积混合核酸A、B和C，PCR仪缓慢降温退火，形成RNA-DNA嵌合结构；

3)将RNA-DNA嵌合结构与多核苷酸结合蛋白孵育；

4)孵育结束后使用分子筛将多余的多核苷酸结合蛋白分离去除；

5)纯化后的接头与多核苷酸结合蛋白复合物，使用RNase H进行消化；

6)消化后再经分子筛纯化，去除RNase H，得到表征靶多核苷酸的复合物。

其中一些实施方案中，步骤1)中，不含RNA酶的TE缓冲液为20mM Tris-HCl pH8.0、100mM NaCl、2mM EDTA。

其中一些实施方案中，步骤1)中，核酸A、B和C的浓度均为0.01mM。

其中一些实施方案中，步骤2)中，PCR仪程序设定为98℃到25℃，每循环降低2℃持续10s。

其中一些实施方案中，步骤3)中，RNA-DNA嵌合结构与多核苷酸结合蛋白按摩尔比1：1.5孵育。

其中一些实施方案中，步骤3)中，孵育温度为30℃，孵育时间为1小时。

其中一些实施方案中，步骤3)中，孵育缓冲液为20mM Tris-HCl pH 7.0，200mMNaOAc(醋酸钠)。

其中一些实施方案中，步骤4)中，分子筛的缓冲液为20mM Tris-HCl pH7.0，200mMNaCl。

其中一些实施方案中，步骤5)中，消化温度为37℃，消化时间为1小时。

其中一些实施方案中，步骤6)中，分子筛的缓冲液为：20mM Tris-HCl、pH 7.0、200mM NaCl。

第四方面，本发明提供一种用于表征靶多核苷酸的构建体，所述构建体包含靶多核苷酸和上述用于表征靶多核苷酸的复合物。

第五方面，本发明提供一种控制靶多核苷酸穿过跨膜孔的移动的方法，所述方法包括以下步骤：

(a)制备上述用于表征靶多核苷酸的复合物；

(b)将步骤(a)中上述用于表征靶多核苷酸的复合物与靶多核苷酸连接，得到用于表征靶多核苷酸的构建体；

(c)将步骤(b)中的构建体与跨膜孔接触；

以及

(d)对所述跨膜孔施加电场，使得用于表征靶多核苷酸的复合物中的多核苷酸结合蛋白移动穿过引导区区域，并控制靶多核苷酸穿过跨膜孔的移动。

其中一些实施方案中，所述方法包括提供系链用于使构建体靠近跨膜孔；所述系链包括捕获区和锚定区，所述捕获区用于捕获构建体的嵌合接头，所述锚定区用于与跨膜孔或跨膜孔所在的膜锚定结合。

其中一些实施方案中，当未施加电场时，靶多核苷酸无法穿过所述跨膜孔进行移动。

其中一些技术方案中，步骤(a)中进一步包括，制备得到上述用于表征靶多核苷酸的复合物后，使用二硫键对多核苷酸结合蛋白进行交联。

其中一些技术方案中，步骤(b)中进一步包括，纯化用于表征靶多核苷酸的构建体；优选地，使用磁珠纯化用于表征靶多核苷酸的构建体。

其中一些实施方案中，跨膜孔是蛋白孔或固态孔，优选为蛋白孔，更优选为大肠杆菌CsgG蛋白孔。

其中一些实施方案中，跨膜孔中的膜是两亲层或固态层，优选为磷脂膜层，更优选为DPhPC磷脂膜层。

第六方面，本发明提供一种表征靶多核苷酸的方法，所述方法包括：

(a)实施上述控制靶多核苷酸穿过跨膜孔的移动的方法；以及

(b)随着靶多核苷酸相对于跨膜孔移动，获取一个或多个测量值，其中所述测量值代表靶多核苷酸的一个或多个特征，并由此表征靶多核苷酸。

第七方面，本发明提供一种用于控制靶多核苷酸移动的试剂盒，所述试剂盒包括：

(a)如本发明所述的嵌合接头，(b)多核苷酸结合蛋白，和/或(c)跨膜孔。

第八方面，本发明提供所述的嵌合接头、所述的复合物、所述的构建体、所述控制靶多核苷酸穿过跨膜孔的移动的方法、所述表征靶多核苷酸的方法、所述的试剂盒在制备用于表征靶多核苷酸的产品或在表征靶多核苷酸中的应用。

有益效果

本发明提出一种新的纳米孔测序adapter构建方案，此方案所述方法合成难度小，操作简便，可以进行测序。能够降低adapter制作成本。

术语定义

为了更清楚地解释本发明的实施方式，本文中使用了一些科学术语和专有名词。除非在本文中进行了明确定义，所有这些术语和名词应当被理解为具有本领域技术人员所通常理解的含义。为了更清楚起见，对于本文中使用的某些术语进行了以下定义。

待测核酸片段或靶多核苷酸

本发明的方法用于对单链、部分双链和双链多核甘酸进行测序。

多核苷酸可为核酸，例如脱氧核糖核酸(DNA)或核糖核酸(RNA)。靶多核苷酸可包含与一条DNA链杂交的一条RNA链。多核苷酸可为本领域已知的任何合成核酸，例如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或其他具有核苷酸侧链的合成聚合物。

多核苷酸优选是DNA、RNA、DNA或RNA杂交体。靶多核苷酸可以包含单链区和具有其它结构的区域，例如发夹环、三链体和/或四链体。DNA/RNA杂交体可以在同一条链上包含DNA和RNA。优选地，DNA/RNA杂交体包含与RNA链杂交的一条DNA链。

靶多核苷酸可为任意长度。例如，多核苷酸可为至少10个，至少50个，至少100个，至少150个，至少200个，至少250个，至少300个，至少400个或至少500个核苷酸对的长度。多核苷酸可为1000或更多个核苷酸对，5000或更多个核苷酸对的长度或100000或更多个核苷酸对的长度。

靶多核苷酸可以存在于任何合适的样品中。本发明通常对已知含有或怀疑含有靶多核苷酸的样品进行。或者，本发明可对样品进行，以确定一种或多种已知或预期存在于样品中的靶多核苷酸的种类。

复合物

在本发明中，用于测序的复合物，或用于多核苷酸表征的复合物具有相同的含义，皆指本发明所述的嵌合接头与多核苷酸结合蛋白结合形成的复合物。

构建体

构建体包含靶多核苷酸和本发明上述的复合物。

多核苷酸结合蛋白

多核苷酸结合蛋白可以是能够与多核苷酸结合并且控制其通过孔的移动的任何蛋白质。在本领域中确定蛋白质是否与多核苷酸结合是很简单的。蛋白质通常与多核苷酸相互作用并且修饰其至少一种性质。蛋白质可以通过裂解多核苷酸以形成单独的核苷酸或如二核苷酸或三核苷酸的更短的核苷酸链来修饰多核苷酸。所述部分可通过将多核苷酸定位或移动到特异性位置(即控制其移动)来修饰多核苷酸。

在一些实施方案中，多核苷酸结合蛋白是多核苷酸解链酶，例如ED1酶。多核苷酸解链酶是能够使双链靶多核苷酸解链成单链的酶。在一些实施方案中，多核苷酸解链酶能够使双链DNA解链成单链。在一些实施方案中，多核苷酸解链酶是具有解旋酶活性的酶。多核苷酸解链酶的实例包括例如本文所述的解旋酶。

多核苷酸结合能力可以使用本领域中已知的任何方法来测量。例如，可以使蛋白质与多核苷酸接触，并且可以测量蛋白质与多核苷酸结合并沿所述多核苷酸移动的能力。蛋白质可以包括有助于多核苷酸结合和/或有助于其在高盐浓度和/或室温下的活性的修饰。蛋白质可进行修饰，使得其结合多核苷酸(即保持多核苷酸结合能力)但不充当解链酶(即当具备所有便于移动的必需组分(例如ATP和Mg²⁺)时不沿多核苷酸移动)。此类修饰是所属领域中已知的。例如，解旋酶中的Mg²⁺结合结构域的修饰通常产生不起解旋酶作用的变体。

酶可以共价附接至孔。可以使用任何方法将酶共价附接至孔。

在链测序中，多核苷酸顺着或逆着外加电位易位通过孔。在双链靶多核苷酸上逐渐或逐步起作用的核酸外切酶可以在孔的顺侧使用以在外加电位下供给剩余的单链，或在反侧使用以在反向电位下供给剩余的单链。同样，还可以以类似的方式使用使双链DNA解链的解旋酶。还可以使用聚合酶。需要逆着外加电位发生链易位的测序应用也是有可能的，但是DNA必须首先在相反电位或无电位下被酶“捕获”。随着电位随后在结合后转换，链将以顺式到反式的方式通过孔并且通过电流保持呈延长的构型。单链DNA核酸外切酶或单链DNA依赖性聚合酶可充当分子马达，以将最近易位的单链以受控的逐步方式逆着外加电位从反式到顺式从孔中拉回来。

可以在本发明中使用任何解旋酶。解旋酶可以两种模式对孔起作用。首先，优选使用解旋酶来进行所述方法，使得在由外加电压造成的场的作用下，所述解旋酶使多核苷酸移动通过孔。在这种模式中，多核苷酸的5’端首先被捕获在孔中，并且解旋酶使多核苷酸移动到孔中，使其在场的作用下通过孔，直到其最终易位通过，到达膜的反侧为止。或者，优选这样进行所述方法，解链酶使多核苷酸逆着由外加电压造成的场而移动通过孔。在这种模式中，多核苷酸的3’端首先被捕获在孔中，并且解链酶使多核苷酸移动通过孔，使得其逆着外加场被拉出孔，直到其最终被推回到膜的顺侧为止。

还可以沿相反的方向进行所述方法。多核苷酸的3’端可以首先被捕获在孔中，并且解链酶可以使多核苷酸移动到孔中，使得其在场的作用下通过孔，直到其最终易位通过，到达膜的反侧为止。

当解链酶不具备便于移动的必需组分或被修饰成阻止或防止其移动时，所述解链酶可以与多核苷酸结合并且在多核苷酸被外加场拉入孔中时充当刹车以减慢多核苷酸的移动。在非活性模式中，多核苷酸的3’或5’是否被捕获不重要，在充当刹车的酶的作用下将多核苷酸朝向反侧拉入孔中的是外加场。当在非活性模式中时，解链酶对多核苷酸的移动的控制可以用多种方式来描述，包括齿合、滑动和制动。还可以用这种方式来使用缺乏解链酶活性的解链酶变体。

多核苷酸与多核苷酸结合蛋白(例如，多核苷酸解链酶)和孔可以按任何次序接触。优选的是，当使多核苷酸与如解旋酶的多核苷酸结合蛋白(例如，多核苷酸解链酶)和孔接触时，多核苷酸首先与多核苷酸结合蛋白(例如，多核苷酸解链酶)形成复合物。当跨孔施加电压时，多核苷酸/多核苷酸结合蛋白(例如，多核苷酸解链酶)复合物就会与孔形成复合物并且控制多核苷酸通过孔的移动。

使用多核苷酸结合蛋白(例如，多核苷酸解链酶)的方法中的任何步骤通常在游离核苷酸或游离核苷酸类似物和促进多核苷酸结合蛋白(例如，多核苷酸解链酶)的作用的酶辅因子存在下进行。游离核苷酸可以是任何单独的核苷酸中的一种或多种。游离核苷酸包括但不限于：单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、单磷酸鸟苷(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷(dCDP)以及三磷酸脱氧胞苷(dCTP)。游离核苷酸优选选自AMP、TMP、GMP、CMP、UMP、dAMP、dTMP、dGMP或dCMP。游离核苷酸优选是三磷酸腺苷(ATP)。酶辅因子是允许构建体起作用的因子。酶辅因子优选是二价金属阳离子。二价金属阳离子优选是Mg²⁺、Mn²⁺、Ca²⁺或Co²⁺。酶辅因子最优选是Mg²⁺。

膜

可根据本发明使用任何膜。合适的膜被本领域中所熟知。所述膜优选地为两亲性层。两亲性层是由具有亲水性和亲脂性的两亲性分子(例如磷脂)形成的层。两亲分子可为合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在本领域中已知，包括，例如，嵌段共聚物(Gonzalez-Perez etal.,Langmuir,2009,25,10447-10450)。嵌段共聚物是聚合材料，其中两种或多种单体亚单位聚合在一起以产生单个的聚合物链。嵌段共聚物通常具有由每种单体亚单位提供的特性。然而，嵌段共聚物可具有由单独亚单位形成的聚合物所不具有的独特性质。可将嵌段共聚物设计成这样：一种单体亚单位是疏水性的(即亲脂性的)，而其他的一种或多种亚单位在水性介质中时是亲水性的。在这种情况下，嵌段共聚物可具有两亲性质，并可形成模拟生物膜的结构。嵌段共聚物可为二嵌段(由两种单体亚单位组成)，但还可由多于两种单体亚单位构成，以形成更复杂的表现为两亲物的排列。所述共聚物可为三嵌段、四嵌段或五嵌段共聚物。

古细菌双极性四醚脂质是天然存在的脂质，其被构造为使所述脂质形成单层膜。这些脂质通常被发现于在恶劣的生物环境中生存的嗜极生物、嗜热生物、嗜盐生物和嗜酸生物中。认为它们的稳定性来自最终双层的融合性质。很容易通过产生具有通用基序亲水-疏水-亲水的三嵌段聚合物，来构建模拟这些生物实体的嵌段共聚物材料。该材料可形成表现与脂双层相似且具有一系列从囊泡到层膜的相状态的单体膜。由这些三嵌段共聚物形成的膜具有一些优于生物脂质膜的优势。因为所述三嵌段共聚物是合成的，可仔细地控制所述精确构建，以提供形成膜以及与孔和其他蛋白质相互作用所需的正确的链长度和性质。

还可由不被分类为脂质亚材料的亚单位构建嵌段共聚物；例如疏水性聚合物可由硅氧烷或其他基于非烃化合物的单体制成。嵌段共聚物亲水性的亚部分还可具有低的蛋白质结合性质，这使得能够产生在暴露于未加工的生物样品时具有高度抵抗力的膜。该首基单位还可衍生自非典型的脂质首基。

与生物脂质膜相比，三嵌段共聚物膜还具有增强的机械稳定性和环境稳定性，例如高得多的操作温度或pH范围。所述嵌段共聚物的合成性质提供了定制基于聚合物的膜用于大量应用的平台。

可化学修饰或功能化所述两亲性分子以促进分析物的偶联。

两亲性层可为单层或双层。两亲性层通常为平面的。两亲性层可为非平面的例如弯曲的。

两亲性层通常为脂双层。脂双层是细胞膜的模型，并为一系列的实验性研究充当极好的平台。例如，脂双层可用于使用单通道记录的膜蛋白的体外研究。或者，脂双层可用作生物传感器来检测一系列物质的存在。所述脂双层可为任何脂双层。合适的脂双层包括但不限于平面的脂双层、支撑的双层或脂质体。脂双层优选地为平面的脂双层。

用于形成脂双层的方法是本领域中已知的。合适的方法在实施例中有公开。脂双层通常通过Montal和Mueller的方法(Proc.Natl.Acad.Sc1.USA.，1972；69:3561-3566)形成，其中脂单层被携载在水溶液/空气界面上，并通过与该界面垂直的孔的某一侧。

Montal和Mueller的方法之所以流行是因为，它是一种形成适合于蛋白孔插入的高品质脂双层的方法，该方法具有成本效益且相对容易。其他常用的形成双层的方法包括头部浸渍(tip-dipping)、涂布双层(painting bilayer)和脂质体双层的膜片钳。

在另一个优选实施方案中，所述膜是固态层。固态层不是生物来源的。换言之，固态层不衍生自或者分离自生物环境，例如生物体或细胞，或者合成制造形式的生物学可用结构。固态层可以用有机或无机材料形成，包括但不限于，微电子材料，绝缘材料如Si₃N₄、Al₂O₃、和SiO₂，有机和无机聚合物如聚酰胺，塑料如或弹性体如双组分加成型硅橡胶(two-component addition-cure silicone rubber)和玻璃。固态层可以用石墨烯形成。

跨膜孔

跨膜孔是允许外加电势驱动的水合离子从膜的一侧流动到膜的另一侧的结构。

跨膜孔优选地为跨膜蛋白孔。跨膜蛋白孔为允许水合离子(例如分析物)从膜的一侧流动到膜的另一侧的多肽或多肽的集合。在本发明中，跨膜蛋白孔能够形成允许外加电势驱动的水合离子从膜的一侧流动到另一侧的孔。跨膜蛋白孔优选地允许分析物(例如核苷酸)从膜(例如脂双层)的一侧流动到另一侧。跨膜蛋白孔允许多核苷酸(例如DNA或RNA)移动通过所述孔。

跨膜蛋白孔可为单体或寡聚体。所述孔优选地由数个重复亚基(例如6、7或8个亚基)构成。所述孔更优选地为七聚体或八聚体孔。

跨膜蛋白孔通常包含桶状体或通道，所述离子可通过所述桶状体或通道流动。所述孔的亚基通常围绕中心轴并且为跨膜β桶状体或通道或者跨膜α-螺旋束状体或通道提供链。

跨膜蛋白孔的桶状体或通道通常包含促进与分析物(例如核苷酸、多核苷酸或核酸)的相互作用的氨基酸。这些氨基酸优选地位于所述桶状体或通道的缩窄处附近。跨膜蛋白孔通常包含一个或多个带正电的氨基酸(例如精氨酸、赖氨酸或组氨酸)或者芳香族氨基酸(例如酪氨酸或色氨酸)。这些氨基酸通常促进所述孔与核苷酸或多核苷酸或核酸之间的相互作用。

可用于本发明的跨膜蛋白孔可衍生自β-桶状体孔或α-螺旋束状体孔，β-桶状体孔包含由β-链形成的桶状体或通道。合适的β-桶状体孔包括但不局限于β-毒素，例如α-溶血素、炭疽毒素和杀白细胞素，以及细菌的外膜蛋白/孔蛋白(porin)，例如包皮垢分支杆菌(Mycobacterium smegmatis)孔蛋白(Msp)(例如MspA)、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A和奈瑟氏菌(Neisseria)自转运脂蛋白(NalP)。α-螺旋束状体孔包含由α-螺旋形成的桶状体或通道。合适的α-螺旋束状体孔包括但不局限于内膜蛋白和α-外膜蛋白，例如WZA和ClyA毒素。跨膜孔可衍生自Msp或α-溶血素(α-HL)。

跨膜蛋白孔优选地衍生自Msp，优选衍生自MspA。这类孔是低聚体，并且通常包含7、8、9或10个衍生自Msp的单体。所述孔可为衍生自Msp的包含相同单体的同低聚体(homo-oligomeric)孔。或者，所述孔可为衍生自Msp的含有至少一个与其他单体不同的单体的异寡聚体(hetero-oligomeric)孔。所述孔还可包含一个或多个构建体，所述构建体包含两个或多个共价连接的衍生自Msp的单体。

跨膜蛋白孔还优选地衍生自α-溶血素(α-HL)。野生型α-HL孔由7个相同的单体或亚基形成(即其为七聚体)。

在一些实施方案中，所述跨膜蛋白孔被化学修饰。可用任何方式在任何位点化学修饰所述孔。优选地通过分子与一个或多个半胱氨酸的结合(半胱氨酸连接)、分子与一个或多个赖氨酸的结合、分子与一个或多个非天然氨基酸的结合、表位的酶修饰或者末端的修饰，对跨膜蛋白孔进行化学修饰。进行这类修饰的合适方法在本领域中是熟知的。可通过结合任何分子来化学修饰所述跨膜蛋白孔。例如，可通过结合染料或荧光团来化学修饰所述孔。

可化学修饰所述孔中任意数量的单体。优选地，如上所述化学修饰一个或多个例如2、3、4、5、6、7、8、9或10个所述单体。

移动

在本发明的方法中，使所述靶多核苷酸移动通过所述跨膜孔并被测序。使靶多核苷酸移动通过所述跨膜孔是指使所述多核苷酸从所述孔的一侧移动到另一侧。所述靶多核苷酸通过所述孔的移动可受电势或酶促作用或电位和酶促作用驱动或控制。所述移动可以是单向的，或可允许向后和向前移动。

优选地使用多核苷酸结合蛋白来控制所述多核苷酸移动通过所述孔。

多核苷酸表征

所述表征方法可以包括测量靶多核苷酸的一个、两个、三个、四个或五个或更多个特征。所述特征优选选自(i)多核苷酸的长度，(ii)多核苷酸的同一性，(iii)多核苷酸的序列，(iv)多核苷酸的二级结构，以及(v)多核苷酸是否被修饰。

本发明的方法包含移动所述单链多核苷酸通过所述跨膜孔，使得所述单链多核苷酸的一部分核苷酸与所述孔相互作用。

所述方法可使用如上所述的任何合适的膜进行，优选脂双层系统，其中孔被插入脂双层中。所述方法通常使用如下膜进行：(i)包含孔的人造双层，(ii)分离的天然存在的含孔脂双层，或(iii)有孔插入其中的细胞。所述方法优选地使用人造脂双层进行。除了所述孔之外，所述双层可包含其他跨膜蛋白和/或膜内蛋白以及其他分子。下文参考本发明的测序实施方案详述了合适的装置和条件。本发明的方法通常在体外进行。

对于(i)，多核苷酸的长度例如可以通过确定所述目标多核苷酸和所述孔的相互作用数量，以及目标多核苷酸与所述孔相互作用之间的持续时间来测定。

对于(ii)，所述多核苷酸的同一性可以通过多种方式测定。多核苷酸的同一性可以联合目标多核苷酸的序列的测定，或不联合目标多核苷酸的序列的测定进行测定。前者是直接的；对所述多核苷酸进行测序，并由此进行鉴定。后者可以以几种方式来完成。例如，可以测定多核苷酸中特定模序的存在(而无需测定该多核苷酸的其余序列)。或者，方法中测定的特定的电和/或光信号可鉴定来自特定来源的目标多核苷酸。

对于(iii)，多核苷酸的序列可以如前所述确定。合适的测序方法，特别是那些使用电测量的方法，描述于StoddartD etal.,Proc Natl Acad Sci,12；106(19):7702-7,Lieberman KRetal,J Am Chem Soc.2010；132(50):17961-72,和国际申请WO2000/28312中。

对于(iv)，所述二级结构可以以多种方式测量。例如，如果该方法包含电测量，二级结构可以利用穿过孔的停留时间的改变或电流变化进行测量。这使得单链和双链多核苷酸的区域能够得到识别。

对于(v)，可以测定任何存在或不存在修饰。该方法优选包括确定所述目标多核苷酸是否通过甲基化，氧化，损伤，用一个或多个蛋白质或一个或多个标记物，标签或间隔区进行了修饰。特异性修饰将导致与孔的特异性相互作用，其可以使用下面描述的方法来测定。例如，可以基于孔与每个核苷酸的相互作用过程中穿过孔的电流，识别胞嘧啶与甲基化的胞嘧啶。

试剂盒

本发明还提供了用于制备用于表征靶多核苷酸的试剂盒。所述试剂盒包含(a)本发明的嵌合接头，(b)多核苷酸结合蛋白，和/或(c)跨膜孔。

所述试剂盒优选地还包含一个或多个与跨膜孔相互作用时产生特征性电流的标志物。这类标志物为本领域技术人员已知。所述试剂盒优选还包含将所述靶多核苷酸偶联到膜上的工具(means)，所述偶联的工具优选地包含反应基团。合适的基团包括但不限于巯基、胆固醇、脂质和生物素基团。所述试剂盒还可包含膜的组分，例如形成脂双层所需的磷脂。

附图说明

图1是本发明所述Adapter以及adapter mix生成示意图。

图2是本发明所述Adapter结合Dda量多少的EMSA结果图。

图3是验证Adapter结合Dda能力的实验设计示意图。

图4是验证Adapter结合Dda能力的EMSA结果图。

图5是本发明所述Adapter mix过孔信号图。

图6是本发明所述Adapter mix连接1kb待测底物EMSA结果图。

图7是本发明所述Adapter mix连接1kb待测底物的电流检测结果图。

具体实施方式

下文将结合具体实施例对本发明的技术方案做更进一步的详细说明。应当理解，下列实施例仅为示例性地说明和解释本发明，而不应被解释为对本发明保护范围的限制。凡基于本发明上述内容所实现的技术均涵盖在本发明旨在保护的范围内。

除非另有说明，以下实施例中使用的原料和试剂均为市售商品，或者可以通过已知方法制备。

实施例1：RNA-DNA嵌合adapter的制备方法

此实施例包含RNA-DNA嵌合adapter的序列，制备方案。本实施例中所示核酸序列均为5’到3’顺序。嵌合adapter包含三段核酸A、B和C，序列以及结构信息如图1所示(SEQ IDNO1)。其中核酸A是DNA，包含4段a1-a4，a1为RNA封阻序列(SEQ ID NO2)，a2为解旋酶结合和阻滞序列(SEQ ID NO3)，Cy3是引入的阻滞化合物；a3形成互补双链区序列(SEQ ID NO4)，a4为引导区补充序列(SEQ ID NO5)；核酸B同样是DNA，包含b3为a3的互补序列(SEQ IDNO6)，5’端含有磷酸化(5’P)，与核酸A的a3互补后形成突出T结构，便于连接待测底物；核酸C为RNA(SEQ ID NO7)，包含c1与a1互补，能退火形成RNA-DNA嵌合结构(附图1，第一步)。

其中，Cy3的结构以及DNA嵌入cy3的结构分别如下式所示：

adapter的制备流程如下：

1.人工合成核酸A、B和C，用不含RNA酶的TE buffer(20mM Tris-HCl pH 8.0，100mM NaCl，2mM EDTA)溶解，浓度均为0.01mM，对应技术方案中第一步；

2.等体积混合核酸A、B和C，PCR仪缓慢降温退火，程序设定为98℃到25℃，每循环降低2℃持续10s，形成RNA-DNA嵌合结构，称为adapter1，对应技术方案中第二步；

3.作为对照等体积核酸A和B，PCR仪缓慢降温退火，程序设定为98℃到25℃，每循环降低2℃持续10s，形成只有DNA结构，称为adapter2；

4.将adapter1和adapter2与解旋酶按摩尔比1：1.5孵育，孵育温度为30℃，孵育时间为1小时，本实施例中所用解旋酶为T4 Dda解旋酶(E94C/C109A/C136A/A360C)，孵育buffer为20mM Tris-HCl pH 7.0，200mM NaOAc(醋酸钠)，对应技术方案中第三、四步；

5.孵育结束后使用分子筛(buffer：20mM Tris-HCl pH 7.0，200mM NaCl)将多余的解旋酶分离去除，对应技术方案中第五步；

6.纯化后的adapter与解旋酶复合物(adapter复合物，adapter mix)，使用RNaseH进行消化，消化温度为37℃，消化时间为1小时，对应技术方案中第六步；

7.消化后再经分子筛(buffer：20mM Tris-HCl、pH 7.0、200mM NaCl)纯化，去除RNase H，得到最后adapter1只结合单个解旋酶的产物(adapter mix1)，对应技术方案中第七步。

实施例2：RNA-DNA嵌合adapter结合解旋酶Dda性质鉴定

此实施例验证依照实施例1方法产生的adapter，与Dda进行结合(对应实施例1步骤1-4)，后续通过凝胶阻滞实验(EMSA)，验证adapter结合Dda的多少。具体操作如下：

1.根据实施例1中第1到第4步方案，得到Dda与adapter1和adapter2的结合产物，按照底物浓度计算EMSA上样量，核酸总上样量为150ng；

2.电压100V，冰水浴电泳1小时后GelRed染色、记录结果。

附图2中，Line1为核酸marker(分子量范围)，Line2-3为单独adapter2和adapter1EMSA结果；Line4-5分别为adapter2和adapter1与过量Dda结合之后的EMSA结果。结果可以看到，含有阻遏RNA的adapter1结合Dda的量明显少于不含有RNA的adapter2。但从这个结果并不能证明Line5对应的adapter1只结合了1个Dda。

因此，本发明人设计了不同长度与核酸C对应的核酸D(d1-d4，为DNA，序列d1为SEQID NO8，序列d2为SEQ ID NO9，序列d3为SEQ ID NO10，序列d4为SEQ ID NO11)，退火后会在A的a2区域形成不同长度的单链区，以此来验证Dda的结合个数。附图3中展示了作为阻遏DNA，核酸D的四种序列(附图3B)，附图3C为按照实施例1退火形成的四种含有不同长度核酸结合单链区的示意图，单链区长度分别为5nt(a2d1，adpater3)，12nt(a2d2，adpater4，与阻遏RNA长度相同，核酸C)，18nt(a2d3，adpater5)和24nt(a2d4，adpater6)。按照本实施例中EMSA步骤，验证这4个adapter结合Dda的量。Adapter与Dda的孵育结合，EMSA步骤与实施例1和实施例2相同。

结果如图4所示，单链区为5nt能结合Dda，但是量很低(附图4，Line2和Line3，对应分子量为250bp处)；单链区为12nt结合Dda具有清晰条带，分子量大小与adapter1结合Dda后类似，对应250bp处(附图2Line5和附图4Line4)，对应结合比例Dda比adapter为1:1；单链区为18nt时，出现2:1的结合条带(附图4Line5，对应2:1处)；单链区为24nt时，2:1结合条带变的弥散，可能是复合物在电泳过程中存在解离的现象(附图4Line 6)。由此，可以说明，Dda与本发明所述的adapter1结合比例为1:1，adapter复合物对应大小在250bp左右。

实施例3：RNA-DNA嵌合adapter中Cy3对解旋酶Dda阻滞效果鉴定

本实施例中，主要验证Cy3对Dda的阻滞作用，判断标准为在仅含有ATP和Mg²⁺存在的条件下，Dda不能解开含有Cy3的双链。具体步骤如下：

1.将实施例1所述产生的adapter mix1浓度调整到20ng/μL；

2.使用大肠杆菌CsgG作为纳米孔，依照专利(US20170283470A1)中所属方法，进行成膜(磷脂为DPhPC)和嵌入纳米孔，选取嵌入单个纳米孔的孔道，加入adapter mix1 10μL，在180mV电压下记录电流信号变化。

如图5所示，在354-356s和366-368s存在特异性的信号阻遏，且两次信号较为相似，而无法阻滞Dda的adapter无法监测到类似电流信号变化：原因是无阻滞的Dda adaptermix会在测序条件下，存在ATP和Mg²⁺时解开adapter的双链结构。附图5中可以看到，Cy3的特征电流信号为，在封堵过程中，存在两次量较小的电流开放。因此，可以说明本实施例中的Cy3结构能够有效阻滞Dda在无电场条件下的通过。

实施例4：RNA-DNA嵌合adapter 1kb DNA底物的测序性质鉴定

本实施例主要是验证按照实施例1中产生的adapter mix1，连接1kb待测DNA底物，能否进行纳米孔测序。

1kb待测底物构建及测序步骤如下：

3.按照实施例1的步骤得到adapter与单个Dda结合的产物。并按照专利(WO2014135838A1)所述方法，对Dda进行二硫键交联，保证待测底物不会在测序过程中不会脱落；

4.二硫键交联产物与1kb底物进行连接，连接使用T4 DNA连接酶，室温连接1h；

5.连接产物使用磁珠纯化，去除连接酶、连接buffer成分以及未成功连接的adapter，使用EB buffer(20mM Tris-HCl pH 8.0，100mM NaCl)进行洗脱，得到待测1kb待测样品(附图6，Line3)；

6.使用未结合Dda的adapter1与1kb底物使用同样方法进行连接、纯化，得到对照样品(附图6，Line2)；

7.使用大肠杆菌CsgG作为纳米孔，依照专利(US20170283470A1)中所述方法，进行成膜(磷脂为DPhPC)和嵌入纳米孔，选取嵌入单个纳米孔的孔道，加入待测样品10μL(20ng/μL)，在180mV电压下记录电流信号变化。

步骤5完成之后，对得到的待测样品进行EMSA检测，如附图6所示。Line1对用Marker，Line2对应步骤6产生的对照1kb底物(未结合DDA)，Line3为步骤5得到的adaptermix1与1kb底物连接产物。附图6结果可以看到Line3正确形成了待测样品。使用这个样品进行电流信号检测，结果可以看到(附图7)，记录到了具有明显台阶的电流信号。因此，可以说明，按照本发明所述序列、方法产生的RNA-DNA嵌合adapter具有较好的测序能力。

以上，对本发明的实施方式进行了说明。但是，本发明不限定于上述实施方式。凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种用于表征靶多核苷酸的嵌合接头，其特征在于，所述嵌合接头包含三段核酸：核酸A、核酸B和核酸C；

核酸A是DNA，从5’到3’包含四段区域a4、a1、a2、a3；a1为引导区区域，同时与核酸C的RNA片段结合、封阻多核苷酸结合蛋白的结合；a2为多核苷酸结合蛋白结合和阻滞区区域；a3为形成互补双链区区域，同时与靶多核苷酸连接；a4为引导区a1的补充区域；

核酸B是DNA，包含b3区域，5’端含有磷酸化，b3为与核酸A中的a3区域形成互补的区域；

核酸C为RNA，包含c1区域，c1为与核酸A中的a1区域形成互补的区域。

2.根据权利要求1所述的嵌合接头，其特征在于，

核酸A的a2区域中还包含阻滞化合物Cy3。

3.根据权利要求1或2所述的嵌合接头，其特征在于，

核酸A中，a1的序列如SEQ ID NO2所示，

和/或，a2的序列如SEQ ID NO3所示，

和/或，a3的序列如SEQ ID NO4所示，

和/或，a4的序列如SEQ ID NO5所示。

4.根据权利要求1或2所述的嵌合接头，其特征在于，

核酸A的序列如SEQ ID NO1所示；

和/或，核酸B的序列如SEQ ID NO6所示；

和/或，核酸C的序列如SEQ ID NO7所示；

5.根据权利要求1或2所述的嵌合接头，其特征在于，

嵌合接头的序列如SEQ ID NO1、SEQ ID NO6和SEQ ID NO7所示。

6.根据权利要求1或2所述的嵌合接头，其特征在于，

所述靶多核苷酸是完全双链多核苷酸、部分双链多核苷酸或单链多核苷酸。

7.一种用于表征靶多核苷酸的复合物，其特征在于，所述复合物包含多核苷酸结合蛋白和权利要求1-6任一项中所述的嵌合接头。

8.根据权利要求7所述的复合物，其特征在于，

所述多核苷酸结合蛋白衍生自多核苷酸处理酶。

9.根据权利要求8所述的复合物，其特征在于，

所述多核苷酸处理酶选自聚合酶、解旋酶或核酸外切酶。

10.根据权利要求9所述的复合物，其特征在于，

所述多核苷酸处理酶为解旋酶。

11.根据权利要求10所述的复合物，其特征在于，

解旋酶为T4 Dda解旋酶。

12.根据权利要求7-11任一项所述的复合物，其特征在于，

用于表征靶多核苷酸的复合物只包含单个多核苷酸结合蛋白。

13.一种用于表征靶多核苷酸的复合物的制备方法，其特征在于，包括以下步骤：

1)合成核酸A、B和C，并用不含RNA酶的TE缓冲液溶解；

3)将RNA-DNA嵌合结构与多核苷酸结合蛋白孵育；

6)消化后再经分子筛纯化，去除RNase H，得到表征靶多核苷酸的复合物；

其中，核酸A、B、C具有如权利要求1-4任一项所述的定义。

14.根据权利要求13所述的制备方法，其特征在于，多核苷酸结合蛋白具有如权利要求8-10任一项所述的定义。

15.根据权利要求13或14所述的制备方法，其特征在于，所述靶多核苷酸是完全双链多核苷酸、部分双链多核苷酸或单链多核苷酸。

16.根据权利要求13或14所述的制备方法，其特征在于，

步骤1)中，不含RNA酶的TE缓冲液为20mM Tris-HCl pH 8.0、100mM NaCl、2mM EDTA；

和/或，步骤1)中，核酸A、B和C的浓度均为0.01mM；

和/或，步骤2)中，PCR仪的程序设定为98℃到25℃，每循环降低2℃持续10s；

和/或，步骤3)中，RNA-DNA嵌合结构与多核苷酸结合蛋白按摩尔比1：1.5孵育；

和/或，步骤3)中，孵育温度为30℃，孵育时间为1小时；

和/或，步骤3)中，孵育的缓冲液为20mM Tris-HClpH 7.0，200mM NaOAc(醋酸钠)；

和/或，步骤4)中，分子筛的缓冲液为20mM Tris-HClpH 7.0，200mM NaCl；

和/或，步骤5)中，消化温度为37℃，消化时间为1小时；

和/或，步骤6)中，分子筛的缓冲液为：20mM Tris-HCl、pH 7.0、200mM NaCl。

17.一种用于表征靶多核苷酸的构建体，其特征在于，所述构建体包含靶多核苷酸，和权利要求7-12任一项中所述的用于表征靶多核苷酸的复合物。

18.一种控制靶多核苷酸穿过跨膜孔的移动的方法，其特征在于，所述方法包括以下步骤：

(a)按照权利要求13-16任一项所述的制备方法制备用于表征靶多核苷酸的复合物；

(b)将步骤(a)中用于表征靶多核苷酸的复合物与靶多核苷酸连接，得到用于表征靶多核苷酸的构建体；

(c)将步骤(b)中的构建体与跨膜孔接触；

以及

(d)对所述跨膜孔施加电场，使得用于表征靶多核苷酸的复合物中的多核苷酸结合蛋白移动穿过a3区域，并控制靶多核苷酸穿过跨膜孔的移动。

19.根据权利要求18所述的方法，其特征在于，所述方法还包括提供系链用于使构建体靠近跨膜孔；所述系链包括捕获区和锚定区，所述捕获区用于捕获构建体的嵌合接头，所述锚定区用于与跨膜孔或跨膜孔所在的膜锚定结合。

20.根据权利要求18或19所述的方法，其特征在于，核酸A的a2区域中还包含阻滞化合物Cy3；多核苷酸结合蛋白选自解旋酶；

当未施加电场时，靶多核苷酸无法穿过所述跨膜孔进行移动。

21.根据权利要求18或19所述的方法，其特征在于，

步骤(a)中进一步包括，制备得到用于表征靶多核苷酸的复合物后，使用二硫键对多核苷酸结合蛋白进行交联；

和/或，步骤(b)中进一步包括，纯化用于表征靶多核苷酸的构建体。

22.根据权利要求21所述的方法，其特征在于，

步骤(b)中，使用磁珠纯化用于表征靶多核苷酸的构建体。

23.根据权利要求18或19所述的方法，其特征在于，

跨膜孔是蛋白孔或固态孔；

和/或，跨膜孔中的膜是两亲层或固态层。

24.根据权利要求23所述的方法，其特征在于，

跨膜孔是蛋白孔；

和/或，跨膜孔中的膜是磷脂膜层。

25.根据权利要求24所述的方法，其特征在于，

跨膜孔是大肠杆菌CsgG蛋白孔；

和/或，跨膜孔中的膜是DPhPC磷脂膜层。

26.一种表征靶多核苷酸的方法，所述方法包括：

(a)实施权利要求18-25任一项中所述的控制靶多核苷酸穿过跨膜孔的移动的方法；以及

27.一种用于控制靶多核苷酸移动的试剂盒，所述试剂盒包括：

(a)权利要求1-6任一项中所述的嵌合接头，(b)多核苷酸结合蛋白，和/或(c)跨膜孔。

28.权利要求1-6任一项中所述的嵌合接头、权利要求7-12任一项中所述的复合物、权利要求17所述的构建体、权利要求18-25任一项中所述控制靶多核苷酸穿过跨膜孔的移动的方法、权利要求26所述表征靶多核苷酸的方法、权利要求27所述的试剂盒在制备用于表征靶多核苷酸的产品或在表征靶多核苷酸中的应用。