CN117355746A

CN117355746A - 通过纳米孔捕获对分析物的结构分析

Info

Publication number: CN117355746A
Application number: CN202280034924.6A
Authority: CN
Inventors: 黄硕; 刘瑶; 王玉琴; 张善雨
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2021-05-13
Filing date: 2022-05-12
Publication date: 2024-01-05
Also published as: EP4352499A1; WO2022237883A1; US20240272137A1

Abstract

一种在纳米孔系统中表征分析物或所述分析物与试剂之间的相互作用的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：i)在所述第一导电液体介质和所述第二导电液体介质之间施加电位差以将所述分析物驱动到所述纳米孔中，并且任选地使所述试剂与所述分析物接触；ii)测量通过所述蛋白质纳米孔的离子电流以提供测试电流模式，所述模式至少含有在所述分析物处于所述MspA、所述MspA同源物或其变体的前庭内期间测量的离子电流；iii)将所述测试电流模式与所述分析物的至少一种特征或所述分析物与试剂之间的相互作用相关联。

Description

通过纳米孔捕获对分析物的结构分析

相关申请的交叉引用

本申请要求2021年5月13日提交的国际申请PCT/CN2021/093507和2021年12月3日提交的国际申请PCT/CN2021/135373的优先权，这些申请的全部内容均通过引用并入本文。

技术领域

本发明一般性地涉及纳米孔的用途，特别是通过纳米孔捕获对分子(例如生物分子，如RNA或蛋白质)进行结构分析。

背景技术

RNA的功能多样性部分源于它能折叠成复杂的三级结构的能力，这种三级结构可以与配体特异性结合以调节细胞活动^1,2。已发现了RNA的许多新生物学作用^3,4，使得对测定RNA三级结构的需求日益增长。包括X射线晶体学⁵和NMR波谱^6,7在内的经典结构生物学技术对RNA三级结构测定做出了最大贡献，尤其是那些具有小RNA结构的⁸。作为补充，冷冻电镜(cryoEM)在揭示较大(>50kDa)RNA分子的结构方面发挥着越来越重要的作用^9,10。诸如单分子共振能量转移(smFRET)¹¹和单分子力谱¹²等新兴技术也已应用于在分子水平上探测RNA结构和相互作用动力学。然而，需要高端设备并进行费力的样品制备，并且还存在干扰RNA结构内非共价相互作用的风险。因此，直接探究原生态RNA的三级结构仍然是一项挑战。

RNA结构可以通过固态纳米孔进行探测^13-17，并且临床应用，例如定量检测严重急性呼吸系统综合征冠状病毒2，也得到了证实¹⁴。然而，固态纳米孔的厚度使其无法产生精细的传感信息，从而限制了其分辨率，无法清晰解析结构相似的RNA结构。此外，固态纳米孔的几何再现性仍然是一个技术瓶颈，当使用不同批次的纳米孔时，会降低传感的一致性。生物纳米孔代表了一个不断壮大的用于单分子传感的通道蛋白家族¹⁸。新出现的纳米孔，例如异羟肟酸铁盐摄取组分A(FhuA)或气单胞菌溶素，能够以高准确度和一致性对核酸¹⁹、蛋白质-蛋白质相互作用²⁰或氨基酸²¹进行传感。此前使用生物纳米孔对转移RNA(tRNA)进行的研究是用野生型α-溶血素(α-HL)进行的²²。然而，这需要与前导链进行化学连接，并且所获得的信息反映的是不同tRNA的展开动力学或一级序列的差异，而不是整体的三级结构差异，这主要是由于孔缢缩处的尺寸有限造成的。为了让大型生物分子通过，最近人们努力开发具有大缢缩部位的新型生物纳米孔。这些纳米孔包括细胞溶素A(ClyA)²³、Phi29连接蛋白²⁴、Fragaceatoxin C(FraC)²⁵、FhuA²⁰和侧耳溶血素A(PlyA)/侧耳溶血素B(PlyB)²⁶，用它们深入研究了dsDNA、蛋白质或蛋白质小分子复合物。然而，据我们所知，尚未对这种具有RNA三级结构的复合物进行研究。这些大型纳米孔还与各种问题相关联，例如储存时间短²³、孔组装不均匀²⁷或施加大电位时自发门控²⁷。

蛋白质的作用通常涉及构象变化，^101-104例如侧链波动、环动力学、结构域运动或变构运动。^105,106诸如傅里叶变换红外光谱(FTIR)、¹⁰⁷超快二维红外光谱(2D IR)¹⁰⁸和NMR波谱¹⁰⁹等方法已广泛应用于此类结构变化的分析。然而，通过这些方法获得的信息仅反映了所研究蛋白质的总体平均行为，而不能解析单个分子的活动。单分子技术，例如基于AFM的单分子力谱(SMFS)、^110-112扫描隧道显微镜(STM)、¹¹³单分子共振能量转移(smFRET)、^114,115光镊、^116-118磁镊、^119-121热泳阱¹²²和静电流体阱¹²³，可以直接检查单个蛋白质的大小、电荷、迁移率、折叠、配体结合或变构现象。这些单分子工具提供了大量有关单个蛋白质的内在功能机制的信息，但不可避免地受到蛋白质荧光标记或表面固定化要求的限制。一些基于成像的技术显示出的时间分辨率也有限，这可能会导致忽略蛋白质构象变化的短暂性事件。

纳米孔技术(其中单分子分析物在移位通过纳米孔传感器期间被直接探测)，已被用于研究蛋白质。使用纳米孔可以直接研究蛋白质的单分子性质，例如结构折叠/展开、^124-28聚集、¹²⁹大小、¹³⁰电荷、¹³¹几何形状、¹³²偶极矩、¹³³酶动力学¹³⁴或柔性¹³⁵。这类技术不需要对所述蛋白质进行化学标记，并实现～μs的时间分辨率。¹³⁶蛋白质的纳米孔传感是用基于蛋白质、¹³⁷固态的¹³⁷或基于DNA的纳米孔¹³⁸进行的。固态纳米孔的孔径更大，孔尺寸是高度可调的，这在探测大尺寸蛋白质时有优势。¹²⁴,130-133,135,136,139-141然而，固态纳米孔通常存在再现性较差和额外噪声源¹⁴²的问题，这限制了令人满意的测量一致性和进一步精细的传感分辨率。

蛋白质纳米孔提供了原子级精确的结构和高度精细的传感分辨率，但传统蛋白质纳米孔(例如FhuA¹⁴³、OmpG¹⁴⁴和α-溶血素¹⁴⁵)的缢缩处通常小于大多数感兴趣的蛋白质分析物。因此，蛋白质分析物必须通过电泳或酶解方式展开才能实现纳米孔移位，因此，对原生形式蛋白质进行探测变得不可行。¹²⁶,146^,147然而，通过将受体模块缀合到纳米孔的外缘，可以对折叠蛋白质进行纳米孔传感，从而报告了在单通道记录期间由分析物-受体相互作用引起的电流扰动^143-145,148。在所述纳米孔和所述受体之间进行缀合的难度很大，传感分辨率也受到限制，因为感兴趣的蛋白质距离所述纳米孔缢缩处较远。

最近对大型蛋白质纳米孔例如细胞溶素A(ClyA)、¹⁴⁹Fragaceatoxin C(FraC)¹⁵⁰和侧耳溶血素AB(PlyAB)¹⁵¹的研究提供了一种鼓舞人心的策略，其中直接将蛋白质分析物放置在所述纳米孔的大内腔中，从而实现了对蛋白质生物标记物、^152,153蛋白质-配体相互作用、^154,155催化过程中的构象体互换、¹³⁴翻译后蛋白修饰¹⁵⁶的直接传感。然而，这些纳米孔通常与自发孔插入困难、¹³⁹纳米孔组装不均匀、¹⁵⁷结构不稳定¹⁵⁸以及高电压下自发门控¹⁵⁷等问题有关。尽管为克服这些缺点，人们在通过定向进化进行纳米孔工程化方面做出了巨大努力，但这些新开发纳米孔的一致性和稳定性仍不能令人满意。最近一份关于自下而上制造多组分纳米孔传感器以研究蛋白质分析物的报告令人振奋¹⁴⁷，但相关的蛋白质工程挑战却远远超出了大多数学术实验室的能力范围。

在分子水平上识别蛋白质对于疾病的早期诊断和治疗重要。通常，蛋白质可以通过免疫测定法或质谱法(MS)进行识别。然而，在MS检测前进行复杂的预处理，包括纯化、变性、烷基化、酶解和脱盐，对于在更丰富的背景环境中检测靶蛋白至关重要。^193-195至于免疫测定法，需要针对所述靶蛋白的高度特异性抗体，这就需要成本高昂地反复制备靶向不同底物的抗体。¹⁹⁶此外，这两种方法都不能从整体中提取单个蛋白质的特征。单分子荧光蛋白质指纹可以解决这些限制，¹⁹⁷但也面临其他问题，例如单分子荧光检测中常见的暗读数。¹⁹⁴此外，这些策略具备的分辨率都无法直接解析蛋白质构象变化。开发一种蛋白质组学方法，能够识别不同的蛋白质，并区分由配体/药物结合和融合等过程引起的同一蛋白质不同结构状态，仍然是基础研究中的一项挑战。

已经开发出多种用于单个蛋白分析的纳米孔技术。^198-202这些技术通常报告的优点是具有单分子分辨率且配置简单。还可以以高通量和便携的方式进行。²⁰³样品预处理的要求也是最低的。原则上，在外部电位的作用下，蛋白质会以移位的形式被检测到，在此过程中，会观察到通过纳米孔的离子电流受到扰动。通常可以实现微秒级的时间分辨率。²⁰⁴与核酸不同，蛋白质具有不同的电荷性质和不均匀的电荷分布、结构紧凑，形状各异。据报道，一种策略涉及使用带负电荷的聚合物来包裹蛋白质。这种聚合物有助于捕获分析物，并可作为纳米孔可寻址条形码，从而简化蛋白质识别。^205-208也有许多无标记尝试，通过在纳米孔内腔中引入带电氨基酸来产生EOF。EOF对通过纳米孔的分子输运有很大影响，因为它对分析物的电荷没有偏好。^209-221然而，通过定点突变进行的电荷修饰可能会导致纳米孔的结构严重紊乱，并可能导致纳米孔制备的产量显著降低。^222-223此外，带负电荷的蛋白质和带正电荷的纳米孔内表面之间不利的静电和空间相互作用可能会限制纳米孔在同时传感电荷性质相冲突的蛋白质方面的应用。²¹⁹使用纳米孔同时高分辨率地区分电荷性质相冲突的不同蛋白质分析物仍然是一项挑战。

发明内容

本发明的第一方面提供了在纳米孔系统中表征分析物的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

i)在所述第一导电液体介质和所述第二导电液体介质之间施加电位差以将所述分析物驱动到所述纳米孔中；

ii)测量通过所述蛋白质纳米孔的离子电流以提供测试电流模式，所述模式至少含有在所述分析物处于所述MspA、所述MspA同源物或其变体的前庭内期间测量的离子电流；

iii)将所述测试电流模式与所述分析物的至少一种特征相关联。

在一些实施方案中，所述分析物选自由以下组成的组：核酸，蛋白质，多糖，聚合物，酶和核酸、蛋白质、肽、多糖、聚合物、酶，以及能够与它们相互作用的试剂的复合物。

在一些实施方案中，所述核酸选自由以下组成的组：LMW RNA，核酸双链体，适体，核酶或具有吻环(kissing loop)、三向接合(three-way junction)、假结(pseudoknot)、扭结转角(kink-turn)或G-四链体结构(G-quadruplex)的核酸。

在一些实施方案中，所述LMW RNA包含具有突出端或平端的siRNA、tRNA、miRNA和/或rRNA。

在一些实施方案中，所述核酸双链体具有突出端或平端。

在一些实施方案中，所述核酸双链体由miRNA和核酸探针组成，并且所述核酸探针是RNA、DNA或核酸类似物。

在一些实施方案中，所述蛋白质分析物选自由以下组成的组：带正电荷的、中性的或带负电荷的。

在一些实施方案中，所述分析物包含两种或更多种不同的分析物，并且这些分析物的表征在一次测量中完成。

在一些实施方案中，步骤iii)包含将所述测试电流模式与选自由以下组成的组的至少一种特征相关联：存在或不存在所述分析物、所述分析物的身份、所述分析物的序列、所述分析物的突变、所述分析物的构象、所述分析物的局部结构、所述分析物的含量、所述分析物总体尺寸、所述分析物的电荷和极性。

在一些实施方案中，所述分析物是由靶分子和辅助分子的组合形成的复合物。

在一些实施方案中，步骤iii)包含将所述测试电流模式与所述靶分子的至少一种特征相关联。

在一些实施方案中，所述靶分子是miRNA。

在一些实施方案中，步骤iii)是通过将所述测试电流模式与参考电流模式进行比较或者通过使用机器学习算法来进行。

在一些实施方案中，所述MspA、所述MspA同源物或其变体前庭侧的导电液体介质含有单价阳离子，而所述MspA、所述MspA同源物或其变体缢缩部位侧的导电液体介质包含二价阳离子。

在一些实施方案中，所述单价阳离子是碱金属离子，优选选自K⁺、Na⁺和Li⁺。

在一些实施方案中，所述二价阳离子是碱土金属离子，优选选自Ca²⁺、Mn²⁺、Mg²⁺和Ba²⁺。

本发明的第二方面提供了用于在纳米孔系统中表征分析物与试剂之间的相互作用的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

i)使所述分析物与所述试剂接触，并通过所述第一导电液体介质和所述第二导电液体介质之间的电位差将所述分析物驱动到所述纳米孔中；

iii)将所述电流模式与所述分析物和所述试剂之间的相互作用相关联。

本发明的第二方面还提供了一种用于在纳米孔系统中表征能够与分析物相互作用的试剂的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

iii)将所述电流模式与所述试剂相关联。

在步骤i)中，对“使所述分析物与所述试剂接触”和“通过所述第一导电液体介质和所述第二导电液体介质之间的电位差将所述分析物驱动到所述纳米孔中”的顺序没有限制，每一个都可以先进行。例如，可以首先使所述分析物与所述试剂接触，然后通过所述第一导电液体介质和所述第二导电液体介质之间的电位差将所述分析物驱动到所述纳米孔中。还可以首先通过所述第一导电液体介质和所述第二导电液体介质之间的电位差将所述分析物驱动到所述纳米孔中，然后使所述分析物与所述试剂接触。

在一些实施方案中，所述分析物选自由以下组成的组：核酸、蛋白质、多糖、聚合物和酶。

在一些实施方案中，所述核酸是适体或核酶。

在一些实施方案中，所述分析物可以与离子、小分子、配体、受体或底物相互作用。

在一些实施方案中，所述试剂是离子、小分子、配体、受体或底物。

在一些实施方案中，所述试剂是多糖，优选肽聚糖、壳聚糖或甲壳素。

在一些实施方案中，所述分析物是溶菌酶。

在一些实施方案中，所述MspA、所述MspA同源物或其变体前庭侧的导电液体介质含有单价阳离子，而所述MspA、所述MspA同源物或其变体缢缩处侧的导电液体介质含有二价阳离子。

本发明的第三方面提供了一种用于在纳米孔系统中检测样品中的感兴趣的分析物的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、所述MspA同源物或其变体，其中所述感兴趣的分析物具有构象，并且具有初始构象的感兴趣的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

i)将所述样品添加到所述第一导电液体介质和第二导电液体介质中的所述至少一种，并在所述第一导电液体介质和所述第二导电液体介质之间施加适于将所述感兴趣的分析物驱动到所述纳米孔中的电位差；

ii)在一段时间内测量通过所述蛋白质纳米孔的离子电流，以提供测试电流模式；

iii)将所述测试电流模式与参考电流模式进行比较，所述参考电流模式至少包含在所述感兴趣的分析物处于所述MspA、所述MspA同源物或其变体的前庭内期间测量的离子电流迹线；

iv)通过iii)的比较来确定所述样品中存在或不存在所述感兴趣的分析物和/或所述样品中所述感兴趣的分析物含量。

在步骤i)中，对“将所述样品添加到所述第一导电液体介质和第二导电液体介质的所述至少一种中”和“在所述第一导电液体介质和所述第二导电液体介质之间施加适于将所述感兴趣的分析物驱动到所述纳米孔中的电位差”的顺序没有限制，每一个都可以先进行。例如，可以首先将所述样品添加到所述第一导电液体介质和第二导电液体介质中的至少一种参考电流模式，然后在所述第一导电液体介质和所述第二导电液体介质之间施加适于将所述感兴趣的分析物驱动到所述纳米孔中的电位差。还可以首先在所述第一导电液体介质和所述第二导电液体介质之间施加适于将所述感兴趣的分析物驱动到所述纳米孔中的电位差，然后将所述样品添加到所述第一导电液体介质和第二导电流体介质的所述至少一种中。

在一些实施方案中，所述感兴趣的分析物选自由以下组成的组：核酸、蛋白质、多糖、聚合物和酶。

在一些实施方案中，所述分析物是乳清蛋白。

在一些实施方案中，所述分析物是α-乳白蛋白和/或β-乳球蛋白。

在一些实施方案中，其中所述样品是乳品或蛋白粉。

附图说明

图1显示了不同蛋白质纳米孔之间的稳定性比较情况。L1：蛋白质标记物(precision plus蛋白质标准品)，BIO-RAD，USA)；L2：新制备的WTα-HL七聚体；L3：WTα-HL七聚体，在80℃下处理15分钟；L4：WTα-HL七聚体，在-80℃下储存3个月；L5：新制备的M2MspA；L6：M2 MspA，在80℃下处理15分钟；L7：M2MspA，在-80℃下储存3个月；L8：新制备的ClyA-RR；L9：ClyA-RR，在80℃下处理15分钟；L10：ClyA-RR，在-80℃下储存3个月。在所有三种纳米孔中，M2 MspA表现出的稳定性最佳，显示出八聚体组装形式未改变；新制备的WTα-HL七聚体的一部分在加热或储存3个月后出现解寡聚状态；ClyA-RR在SDS-PAGE条件下出现完全解寡聚现象。

图2显示了M2 MspA和ClyA-RR之间高电压性能的比较情况。用MspA在高施加电位下进行的连续长期测量显示出稳定的开孔电流。基于先前的文献报告，M2 MspA可以在高达+200mV的施加电位下进行长期测量。另一方面，ClyA-RR的性能要差得多。当施加电位超过+100mV时，经常观察到出现自发门控或孔塌缩。如方法中所述进行电生理学测量。使用1.5MKCl(cis)/1M CaCl₂(trans)的电解质缓冲液。

图3显示了hsa-miR-21延迟移位通过MspA。A.hsa-miR-21移位通过MspA的示意图。将单个MspA插入隔开cis室和trans室的脂质膜中。cis室填充1.5M KCl缓冲液，trans室填充1.5M KCl或1M CaCl₂缓冲液。将Hsa-miR-21添加到cis中，终浓度为200nM。连续施加+150mV的跨膜电位。B.MspA的电流-电压(I–V)曲线。应用不同组合的电解质缓冲液，并且不添加分析物。C.左图：含有hsa-miR-21连续移位的代表性迹线。在cis侧和trans侧均为1.5MKCl缓冲液的情况下进行测量。虚线框：在该迹线上用三角形标记的部分的放大视图。标记了开孔电流(I_o)、阻塞电流(I_b)、停留时间(t_off)和事件间持续时间(t_on)。D.左图：含有hsa-miR-21连续移位的代表性迹线。在cis侧为1.5M KCl缓冲液且trans侧为1M CaCl₂缓冲液的情况下进行测量。虚线框：在该迹线上用三角形标记的部分的放大视图。在这种情况下，与C中的移位事件相比，移位事件出现得更频繁，并且系统性地延迟。E.下图：hsa-miR-21移位的％I_b与t_off的散点图。将％I_b定义为(I_o-I_b)/I_o。上图：％I_b的对应直方图。当trans侧应用1M CaCl₂缓冲液时，％I_b更大且分布更均匀。F.hsa-miR-21移位的t_off事件直方图。G.hsa-miR-21移位的t_on事件直方图。根据方程y＝a*exp(-x/τ)对F和G的直方图进行了单指数拟合。平均停留时间(τ_off)或平均事件间间隔(τ_on)分别从拟合结果得出。统计期间忽略了停留时间<1ms的事件。

图4显示了MspA中EOF的实验证据。与之前的研究^92,93类似，MspA中的EOF是通过观察中性分析物产生事件的电压依赖性来确定的。将三甲基-β-环糊精(TriM-β-CD)作为分析物应用。A.当分别向cis和trans侧加入1.5M KCl缓冲液和1M CaCl₂缓冲液时，使用MspA进行TriM-β-CD传感的电压依赖性。施加电位越高，事件出现率越高。在负电位下未观察到任何事件。这意味着当施加电位时，MspA中存在从cis到trans侧的EOF。B.在负(左图)电位和正(右图)电位时MspA中EOF流的卡通图。EOF的方向用红色箭头表示。C.在对称1.5M KCl缓冲液中使用MspA进行TriM-β-CD传感的电压依赖性。事件出现率低于A中的事件出现率。然而，在较高电位下观察到的事件略多，表明存在弱EOF。D.在负(左图)电位和正(右图)电位时MspA中EOF流的卡通图。EOF的方向用红色箭头表示。如方法中所述进行(A、C)中的测量。施加电位在(A、C)的x轴上表示。将TriM-β-CD添加到cis侧，终浓度为2mM。

图5显示了不同盐组合的miRNA传感。A-D.用以下缓冲液进行miRNA传感的代表性迹线：1.5M KCl(cis)/1.5M KCl(A)、1.5M KCl(cis)/1M CaCl₂(trans)

(B)、1M CaCl₂(cis)/1M CaCl₂(trans)(C)或1.5M CaCl₂(cis)/1.5M KCl(trans)(D)。E.不同盐组合的miRNA事件的I_p。F.不同盐组合的miRNA事件的τ_off。G.不同组合miRNA事件的τ_on。红色箭头表示我们手稿中使用的KCl/CaCl₂不对称缓冲液条件。对每种条件进行三次独立测量，以形成统计数据。将Has-miR-21添加到cis侧，终浓度为200nM。测量期间持续施加+150mV的电压。

图6显示了用M1 MspA或M2 MspA进行miRNA传感。A.MspA突变体(M1MspA或M2MspA)的内部电荷分布。B.miRNA移位通过M1 MspA或M2 MspA的代表性电流迹线。C.用M1MspA或M2 MspA进行miRNA移位事件的直方图。D.用M1MspA或M2 MspA进行miRNA移位事件的t_off直方图。E.用M1 MspA或M2 MspA进行miRNA移位事件的t_on直方图。由于纳米孔内腔中存在带正电荷的氨基酸，所述M2MspA显示的RNA分子捕获率更高。在1.5M KCl(cis)/1M CaCl₂(trans)中进行电生理学测量。将miRNA添加到cis侧，终浓度为200nM。在测量期间持续施加+150mV的电压。

图7显示了用MspA区分LMW RNA三级结构的情况。A.使用MspA进行纳米孔捕获/移位的方案。左图：通过纳米孔捕获进行RNA结构分析。在这种情况下，RNA以电泳的方式被捕获在纳米孔前庭中，从而产生高度依赖于分析物结构的阻塞水平。右图：通过纳米孔移位进行RNA结构分析。在这种情况下，捕获的RNA以电泳的方式解链以移位通过纳米孔，通常会造成更深程度的阻塞。捕获和移位之间的电流波动揭示了RNA的身份。TRNA在该方案中被用作实例。B.本手稿中使用MspA通过纳米孔捕获/移位研究的代表性RNA分子。研究了五种类型的非编码RNA，包括miRNA(单链，22nt)、突出端siRNA(双链，21bp)、平端siRNA(双链，21bp)、tRNA(L形，76nt)和5S rRNA(Y形，120nt)。如方法中所述进行测量。将miRNA(has-miR-21)、突出端siRNA(SiFoxA1)、平端siRNA(荧光素酶siRNA)或tRNA(tRNA^phe)添加到cis室中，每种分析物的终浓度为200nM。将大肠杆菌5S rRNA添加到cis侧，终浓度为10nM。C.miRNA、突出端siRNA、平端siRNA、tRNA或5S rRNA连续移位通过MspA的代表性迹线。开孔电流(I_o)用虚线标记。D.相应迹线上三角形标记的代表性移位事件的放大视图。不同类型RNA的移位产生了高度可区分的事件特征。miRNA产生快速尖峰事件。突出端siRNA产生两阶跃(two-step)事件。平端siRNA和tRNA都会产生两种类型的事件，称为1型和2型。5S rRNA产生三种类型的信号，其中最具特征的类型在图中所示。%I_b指的是第一水平阻塞幅度，其定义如D中所标记。E.五种RNA样品的%I_b与t_off散点图(散点图从左到右分别对应于miRNA、突出端siRNA、平端siRNA、tRNA和5S rRNA)。三种类型RNA的事件可清楚区分。F.不同RNA类型(从左到右分别对应于miRNA、突出端siRNA、平端siRNA、tRNA和5S rRNA)的％I_b相应事件直方图。黑线是对数据的高斯(Gaussian)拟合。G.同时传感siRNA、tRNA和5S rRNA期间的代表性迹线。将不同的RNA类型(突出端siRNA:25nM；平端siRNA:10nM；tRNA:400nM；5SrRNA:30nM)同时添加到cis侧。从该迹线可以清楚地识别出不同RNA类型的特征事件，这些事件分别用蓝色、绿色、红色或紫色柱条标记。

图8显示了突出端siRNA移位事件。A.突出端siRNA(PDB:1RUP)的结构。突出端siRNA的二级结构(上图)由一条19bp的双链和两个2-nt的突出组成。它们折叠成A型双链体(下图)。B.代表性的突出端siRNA移位事件(下图)和建议的移位模型(上图)。该模型表明，突出端siRNA首先部分阻塞纳米孔，然后是电泳驱动的双链体解链。在连续施加+150mV电位的情况下进行测量。在这种情况下，大多数突出端siRNA移位事件表现为特征性的两阶跃(two-step)形事件(下图左侧)，从初始的部分阻塞(水平1)开始，然后是进一步更深度的阻塞(水平2)。请注意，一些事件可能缺少水平1或水平2。然而，水平1缺失的事件极为罕见。由于水平1的特征对事件身份的评估更为重要，因此水平2缺失的事件可以很好地识别。C.％I_b与t_off的散点图。D.％I_b的相应事件直方图。如方法中所述进行纳米孔测量。在cis侧添加杂交的突出端siFoxA1(材料，表1)，终浓度为200nM。

图9显示了不同电压下突出端siRNA移位事件。A.在+150mV下获得的突出端siRNA移位的代表性迹线。B.在+200mV下获得的突出端siRNA移位的代表性迹线。在施加强电泳力的情况下，由突出端siRNA引起的事件会出现，水平1的停留时间显著缩短，表明分析物已移位通过纳米孔。C.在+150mV下水平1的t_off事件直方图。D.在+200mV下水平1的t_off事件直方图。如方法中所述进行纳米孔测量。在cis侧添加杂交的突出端siFoxA1(材料，表1)，终浓度为200nM。

图10显示了用MspA区分突出端siRNA和平端siRNA。A-B.突出端siRNA和平端siRNA的二级结构。C.用MspA进行突出端siRNA传感的代表性迹线。特征事件表现为两阶跃(two-step)阻塞。D.用MspA进行平端siRNA传感的代表性迹线。观察到阻塞幅度不同的两种类型信号。E.两种RNA样品t_off与％I_b的散点图(散点图从上到下分别对应于突出端siRNA、平端siRNA 1型和平端siRNA 2型)。两种类型RNA的事件是明显可区分的。F.两种RNA样品的%I_b相应事件直方图。黑线是对数据的高斯拟合。G.两种RNA样品的特征水平(在C和D中进行标记)的标准差。对每种类型的20个事件进行分析以形成统计数据。在1.5M KCl(cis)/1MCaCl₂(trans)中进行电生理学测量。将RNA添加到cis侧，终浓度为200nM。在测量期间施加+150mV的电压。

图11显示了不同电压下平端siRNA移位事件。A.在+100mV和+150mV下的代表性1型事件。当施加电位增加时，事件停留时间延长。B.在不同电压下1型事件的τ_off。C.在+100mV和+150mV下的代表性2型事件。当施加电位增加时，停留时间增加。D.在不同电压下的2型事件的τ_off。所报告的事件是由纳米孔捕获而非移位引起的。如方法中所述进行所有测量。将平端siRNA添加到cis侧，终浓度为200nM。对每种条件进行三次独立的测量以形成统计数据(B、D)。

图12显示了酵母tRNA^phe的移位。A.酵母tRNA^phe的结构。酵母tRNA^phe的二级结构(在矩形框中示出)由四个结构域组成，包括接纳茎(红色)、D臂(橙色)、T臂(绿色)和反密码子环(蓝色)。它们折叠成L形的三级结构，其中反密码子环和接纳茎位于“L”形的两端。B.代表性tRNA 1型事件(上图)和可能的移位构型图(下图)。1型事件具有单个阻塞水平，%I_b约为0.564(水平1)。C.代表性tRNA 2型事件(上图)和可能的移位构型图(下图)。2型事件有两个阻塞水平。%I_b测量值约为0.448(i，水平1)。由施加的电泳力触发，接纳茎的突出部分试图进入纳米孔缢缩部位，从而产生剧烈的电流波动(ii)。tRNA^phe最终被展开，产生了第二阻塞水平，%I_b约为0.997(iii，水平2)。D.1型事件的％I_b直方图。E.2型事件的％I_b直方图。如方法所述进行纳米孔测量。将tRNA^phe(材料，表1)添加到cis侧，终浓度为200nM。

图13显示了使用不同缓冲液进行tRNA^phe传感。如方法中所述进行纳米孔测量。trans侧电解质缓冲液为1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)或1M CaCl₂缓冲液(1M CaCl₂、10mM HEPES，pH 7.0)。将tRNA^phe添加到cis侧，终浓度是200nM。A.含有tRNA^phe连续移位事件的代表性迹线。在cis和trans侧均使用1.5M KCl缓冲液。大多数移位事件只有一次阶跃(one step)，并且表现得并不一致。B.如A中所述时间延长测量的％I_b事件直方图。在这种情况下，％I_b分布广泛。C.含有tRNA^phe连续移位事件的代表性迹线。在cis侧使用1.5M KCl缓冲液，在trans侧使用1M CaCl₂缓冲液。tRNA事件的停留时间显著延长，经常观察到特征性tRNA移位事件(图7B)。D.如C中所述时间延长测量的事件水平1的％I_b事件直方图(图7B)。从直方图可以清楚地观察到特征性的两个事件群。基于先前文献的报告^94-96和我们的结果，我们推测Ca²⁺的存在有两重意义，一是延迟分析物的移位，二是维持tRNA的结构。尽管未在这项工作中进行测试，但其他二价离子如Mg²⁺可能具有类似稳定tRNA结构的作用。

图14显示了不同电压下的tRNA^phe移位事件。A.在+125mV、+150mV和+175mV下的代表性1型事件。当施加电位增加时，事件停留时间延长。B.不同电压下1型事件的τ_off。C.在+125mV、+150mV和+175mV下的代表性2型事件。当施加电位增加时，停留时间减少。D.不同电压下2型事件的τ_off。如方法中所述进行所有测量。将tRNA^phe添加到cis侧，终浓度为200nM。对每种条件进行三次独立测量以形成统计数据(B、D)。

图15显示了通过从脲-PAGE凝胶电泳中回收RNA片段制备的大肠杆菌5S rRNA。将通过Takara的小RNA提取试剂提取的大肠杆菌低分子量(LMW)RNA(<200nt)(实施例2方法)加载到12％脲-PAGE凝胶上。在施加+180V的电位下连续进行凝胶电泳100分钟。用便携式UV灯(254nm)观察凝胶。可以清楚地观察到三个条带，根据已发表的文献⁹⁷，分别被认定为5SrRNA、tRNA和二甲苯蓝。单独切除与5S rRNA相对应的区域。用ZR small-RNA^TM PAGERecovery Kit(ZYMO Research，USA)处理切除的凝胶片段以回收RNA(实施例2方法)。

图16显示了大肠杆菌5S rRNA的移位情况。A.大肠杆菌5S rRNA(PDB:1C2X)的结构。大肠杆菌5S rRNA的二级结构(上图)由五个螺旋(用罗马数字表示为I-V)、四个环(B-E)和一个铰链(A)组成，它们共同形成Y型三级结构(下图)。环C、环E和螺旋Ⅰ位于“Y”形的三端。B.代表性5S rRNA 1型事件。该1型事件表现为恒定阻塞(％I_b约为0.358(水平1))以下的往复电流振荡。C.该1型事件的对应全点直方图。D.代表性的5S rRNA2型事件。该2型事件以随机电流波动开始。然后，它变成了带有许多向下毛刺的单阶跃阻塞(水平1，％I_b＝0.578)。该2型事件将阻塞纳米孔，直到施加反向电压。E.该2型事件的对应全点直方图。F.代表性的5S rRNA3型事件。更改3型事件有两个阻塞水平。特征性阻塞水平测量值约为0.775(水平1)。G.该3型事件的对应全点直方图。H.t_off与％I_b的热图。％I_b是指三种类型中水平1的阻塞幅度。热图是由定制Python代码生成的。I.含有5S rRNA连续移位事件的代表性迹线。从该迹线中可以清楚地识别出5S rRNA的三种传感事件，分别用红色、蓝色、绿色柱条标记。如方法中所述进行纳米孔测量。将5S rRNA(材料，表1)添加到cis侧，终浓度为10nM。

图17显示了5S rRNA信号的三种类型事件特征。展示了代表性5S rRNA1型事件(A)、2型事件(B)和3型事件(C)的全点直方图。从不同事件类型的直方图中可以看到不同的模式。然而，当评估相同类型的事件时，这种模式是高度保守的。具体地，每个1型事件的全点直方图都显示出3个特征峰。每个2型事件的直方图都显示出单个较窄峰，峰％I_b在～0.58。每个3型事件的直方图都显示出单个较宽峰，峰％I_b在～0.75。

图18显示了5S rRNA传感事件的统计数据。A.三种类型传感事件的％I_b直方图。每种类型的分布都遵循高斯拟合。B.三种类型传感事件的比例。1型事件所占比例最高，其次是2型和3型。这表明5S rRNA在进入MspA时具有的取向更有利，从而产生了1型事件。进行了三次独立测量以形成统计数据。

图19显示了在不同电压下5S rRNA的1型事件。A-E.在+50mV(A)、+100mV(B)、+150mV(C)、+200mV(D)和+250mV(E)下的代表性1型事件。F-J.在+50mV(F)、+100mV(G)、+150mV(H)、+200mV(I)和+250mV(J)下的t_off相应直方图。当施加电位从+50mV增加到+150mV时，τ_off增加。然而，当电位从+150mV进一步增加到+250mV时，τ_off降低。在+250mV时，所有事件都表现出显著的波动，随后出现深度阻塞并自发恢复到开孔状态。这些结果表明，5SrRNA的成功移位需要克服高熵屏障。高施加电位将促进5S rRNA移位。观察到的波动噪声可能是由电泳驱动的其整体结构的展开造成的。因此，当观察到1型事件时，螺旋I-向下构象最有可能发生。1型事件不太可能来自环C-向下或环E-向下构象，因为环结构比螺旋更难通过电泳展开。如方法中所述进行所有测量。将5S rRNA添加到cis侧，终浓度为10nM。

图20显示了RNA移位的代表性迹线。如方法中所述进行纳米孔测量。将miRNA、siRNA或tRNA的模型分析物分别添加到cis侧，终浓度为200nM。将5S rRNA添加到cis侧，终浓度为10nM。A.含有miRNA连续移位事件的代表性迹线。Hsa-miR-21(表1)是唯一的分析物。miRNA的移位表现为快速而深度的电流阻塞。B.含有突出端siRNA连续移位事件的代表性迹线。杂交的siFoxA1(表1)是唯一的分析物。突出端siRNA的移位产生了特征性的两阶跃形事件(图8)。C.含有平端siRNA连续移位事件的代表性迹线。萤光素酶siRNA作为唯一的分析物。D.含有tRNA连续移位事件的代表性迹线。酿酒酵母苯丙氨酸特异性tRNA(Sigma-Aldrich)，也称为tRNA^phe，作为唯一的分析物。具有高度可区分的事件特征的两种类型事件构成了所有获取事件的大部分(图7B)。由于事件的驻留时间极长，9.5s至16s的电流迹线被省略。E.含有5S rRNA连续移位事件的代表性迹线。从聚丙烯酰胺凝胶中回收的大肠杆菌5SrRNA作为唯一的分析物。

图21显示了事件提取的工作流程。所有单通道记录结果都首先记录在.abf文件中。所有.abf文件都是由Neo包首先导入到Python环境中的。事件分割是通过Python编程的定制阈值搜索例程来进行的。它的原理在虚线框中演示。之所以选择70％的I₀为阈值，是因为它远高于本手稿研究的所有事件的最高水平。基于该阈值设置，不会遗漏任何事件。为了进行分割，将电流下降到I_o的70％以下并随后自发恢复到I_o的信号部分认定为事件。为了避免由分析物与纳米孔瞬态碰撞引起事件的干扰，仅保留停留时间超过1ms的事件用于下游分析。提取的事件数据以npz格式保存，每个数据都附带png格式的图形，以便于可视化。

图22展示了“其他”事件。如方法中所述进行纳米孔测量。偶尔观察到可能由RNA以不希望的取向移位或孔阻塞造成的事件。尽管可观察到这些事件，但它们只占所有获取事件的少数，并在机器学习算法中属于“其他”类型(图23A)。请注意，阻塞的孔也可以通过使施加电位反转来手动恢复，以重新启动后续测量。

图23显示了机器学习辅助的RNA类型识别。A.训练过程的流程图。形成了七类事件作为训练数据集，包括突出端siRNA(O)、平端siRNA 1型(B1)、平端siRNA 2型(B2)、tRNA 1型(T1)、tRNA2型(T2)、5S rRNA(R)以及其他。提取了11种特征以形成特征矩阵。然后将训练数据集划分为训练子集和验证子集，其中验证子集用于验证分类器模型的准确度。准确度定义为验证子集中被正确识别的事件的比率。对五个分类器进行了研究以识别性能最好的模型，其中随机森林模型的准确度最高，得分为0.934。B.从随机森林模型中获得的特征重要性。所有特征都在RNA事件识别中发挥作用。C.RNA分类的混淆矩阵。通过随机森林模型获得测试集的准确度。测试集由98个突出端siRNA事件、81个平端siRNA 1型事件、63个平端siRNA 2型事件、75个tRNA 1型事件、76个tRNA 2型事件、68个5S rRNA事件和98个“其他”事件组成。D.训练集样品量不同时的学习曲线。当训练集样品超过148个时，验证的准确度达到0.85。当样品超过418个时，准确度在～0.90处饱和(saturate)。E.预测过程的流程图。混合样品的原始电流迹线被分割成单独的、未分类的事件。提取事件特征并用作预测集，随后使用随机森林模型对其进行识别和分类。F.用随机森林模型确定不同RNA事件的比例。箭头表示新添加RNA的比例。当将突出端siRNA、平端siRNA、tRNA和5S rRNA顺序添加到cis侧时，记录了四组数据。

图24显示了事件特征提取情况。对全点直方图进行多峰高斯拟合，用于提取每个事件的事件特征，例如水平的身份、位置和噪声。展示了突出端siRNA(siFoxA1)(A)、平端siRNA(荧光素酶siRNA)1型(B)、平端siRNA 2型(C)、tRNA(tRNA^phe)1型(D)、tRNA2型(E)、大肠杆菌5S rRNA(F)的代表性移位事件及其相应的全点直方图。当直方图中只有一个可识别的高斯峰(B、C、D)时，该峰的身份被确定为1。根据高斯拟合结果来确定该峰的位置和噪声。当识别出2个以上的高斯峰(B、A、E、F)时，更接近开孔电流的峰被认为是峰1，而另一个峰被认为是峰2、3。根据拟合结果分别确定每个峰的位置和噪声。通过这些提取的事件特征，可以清楚地识别不同类型的RNA移位事件。

图25显示了tRNA移位的MD分析。A-C.进入MspA纳米孔的tRNA的平衡结构。这些构象分别被称为茎向下(A)、环向下(B)或臂向下(C)。每个构象上标记的绿色球体指的是引导核苷酸，在以下模拟结果中用于表征tRNA的位置。D-F.引导核苷酸的z坐标，作为茎向下(D)、环向下(E)和臂向下(F)构象模拟的时间函数。显示了每种情况下的七个轨迹。结果表明，茎向下构象更倾向于移位通过纳米孔，而其他两种构象则无法达到孔缢缩处以启动移位。G.在开孔(绿色)、臂向下(灰色)、茎向下(红色)、环向下(蓝色)和tRNA移位(紫色)状态下，通过孔的模拟累积离子电流(图中相应离子电流曲线的位置是从上到下的)。外部电场为0.09V/10nm，对应于～+150mV的电压偏置。在如此低的电压下，tRNA在模拟时间尺度上沿z轴没有明显的移动。累积电流的斜率表示离子电流值。H.不同传感状态下得出的离子电流。所有值均按比例计算，使得开孔电流报告为1。

图26显示了使用机器学习算法进行RNA类型识别。A.存在突出端siRNA(25nM)时的代表性迹线。在大多数情况下观察到突出端siRNA的特征事件(用蓝色柱条标记)。B.用随机森林模型确定的不同RNA事件的相应比例。95.8％的事件被识别为突出端siRNA的特征事件。C.连续添加平端siRNA(10nM)期间的代表性迹线。除了突出端siRNA事件(用蓝色柱条标记)外，还观察到平端siRNA1型和2型事件(用绿色柱条标记)。D.用随机森林模型确定的不同RNA事件的相应比例。平端siRNA1型和2型事件的比例为0.12和0.08。E.连续添加tRNA(450nM)期间的代表性迹线。TRNA1型和2型事件(用红色柱条标记)出现在电流迹线中。F.用随机森林模型确定的不同RNA事件的相应比例。tRNAsiRNA1型和2型事件的比例为0.26和0.23。F.连续添加5S rRNA(30nM)期间的代表性迹线。从该迹线中可以清楚地识别出四种RNA类型的指纹事件(fingerprint event)，分别用蓝色柱条、绿色柱条、红色柱条或紫色柱条标记。H.用随机森林模型确定的不同RNA事件的相应比例。在添加后，5S rRNA事件的比例从0增加到0.09。如方法中所述进行纳米孔测量。每种情况都记录了20分钟的迹线。

图27显示了茎向下位姿的模拟tRNA移位。A.对于茎向下位姿的代表性MD轨迹，tRNA的碱基对氢键(H-键)数量、相对于晶体结构的均方根偏差(RMSD)以及z坐标(Z)随时间的变化。沿Z轴线施加4.0V/10nm的外部电场以驱动tRNA移位。B.平板图A中标记的四个时间点(红色虚线)相应结构的快照。

图28显示了分子动力学模拟结果。A-C.在外部电场分别为0.09V/10nm(A)、0.2V/10nm(B)和0.6V/10nm(C)下，模拟捕获状态期间开孔状态(绿色)、臂向下(灰色)、茎向下(红色)、环向下(蓝色)构象以及当tRNA移位通过孔(紫色)时的累积离子电流(各图中相应离子电流曲线的位置从上至下)。D-F.在外部电场分别为0.09V/10nm(D)、0.2V/10nm(E)和0.6V/10nm(F)下，不同tRNA取向的相对离子电流。

图29显示了模拟的5S rRNA移位通过MspA。A.对于螺旋I-向下位姿的代表性MD迹线，5S rRNA的碱基对氢键(H-键)数量、相对于晶体结构的均方根偏差(RMSD)以及z坐标(Z)随时间的变化。沿Z轴线施加4.0V/10nm的外部电场以驱动5S rRNA移位。B.平板图A中标记的四个时间点(红色虚线)的相应结构快照。5S rRNA的移位表现出的行为与tRNA移位相似。在初始阶段，5S rRNA在不破坏碱基对氢键的情况下发生了剧烈变形，这表现在RMSD的增加和所形成氢键数量值相对稳定上。在到达MspA的更深位置后，5S rRNA通过螺旋结构域的解链而展开，随后引导核苷酸成功移位通过孔缢缩部位，然后整个结构进一步展开。

图30显示了商业来源tRNA的凝胶电泳。对商业来源的各种tRNA样品进行12％脲-PAGE凝胶电泳，包括酵母tRNA^phe、酵母总tRNA和大肠杆菌总tRNA(Sigma-Aldrich)。L1：低范围RNAladder；L2：酵母tRNA^phe；L3：酵母tRNA，L4：大肠杆菌tRNA。在施加+180V的电位下连续进行凝胶电泳60分钟。从凝胶结果来看，酵母tRNA^phe和酵母tRNA具有所需的纯度。然而，大肠杆菌总tRNA含有来自5S rRNA(120nt)和一些其他分子量较高RNA的可识别的污染物。这些污染物的身份根据文献⁹⁷结果确定。

图31显示了商业性大肠杆菌tRNA的进一步纯化过程。A.将大肠杆菌总tRNA(Sigma-Aldrich)加载到12％脲-PAGE凝胶上。在施加+180mV的电位下连续进行凝胶电泳100分钟。L1-L5:大肠杆菌总tRNA。用便携式UV灯(254nm)观察凝胶。可以清楚地观察到三个条带，根据已发表的文献⁹⁷，分别被认定为5S rRNA、tRNA和二甲苯蓝。单独切除虚线框标记的区域。用ZR small-RNA^TM PAGE Recovery Kit处理所切除凝胶片段以回收RNA(实施例2方法)。B.使用12％脲-PAGE凝胶电泳对回收的RNA片段进行表征。在施加+180mV的电位下连续进行凝胶电泳100分钟。L1：低范围RNA ladder；L2：商业性大肠杆菌总tRNA；L3：所切除的大肠杆菌tRNA；L4：所切除的大肠杆菌5S rRNA。所回收的大肠杆菌5S rRNA和tRNA彼此分离，并且可以在下游纳米孔测量中单独研究。

图32显示了来自不同物种的总tRNA的单分子传感。如方法中所述进行所有测量。将酵母tRNA添加到cis侧，终浓度为20ng/μL。将大肠杆菌tRNA添加到cis侧，终浓度为2ng/μL。使用定制机器学习算法进行迹线分割和事件识别(图23A)。A.含有酵母tRNA连续移位通过MspA的代表性迹线。观察到两种类型的事件，称为1型(蓝色三角形)和2型(红色三角形)，构成了所记录所有事件的大部分。虚线框：代表性1型和2型事件的放大视图，它们在迹线上分别用i和ii标记。1型事件具有单个阻塞水平(水平1)。2型事件含有两个阻塞水平(水平1和水平2)。B.含有大肠杆菌tRNA连续移位通过MspA的代表性迹线。还观察到两种类型的事件，称为1型(蓝色三角形)和2型(红色三角形)事件，构成了所记录所有事件的大部分。虚线框：代表性1型和2型事件的放大视图，它们在迹线上分别用i和ii标记。C.1型和2型事件阻塞幅度的事件直方图。请注意，水平1和水平2之间的电流波动显示出事件之间的细微变化。与tRNA^phe的测量结果相比，总tRNA的测量结果中更容易观察到这种波动变化(图12)。然而，2型事件水平1和水平2的％I_b保守得多。D.比较从不同tRNA样品中获得的1型和2型事件的阻塞百分比(I_p)(每个记录中的三个柱条从左到右分别代表酵母tRNA^phe、酵母总tRNA和大肠杆菌总tRNA)。E.不同tRNA来源的特征性tRNA事件的比例。C-E中的统计数据是由对每种条件进行三次独立测量形成的。

图33显示了从大肠杆菌LMW RNA提取物中直接识别tRNA。A.从大肠杆菌中分离LMWRNA。(I)在RNAiso缓冲液(Takara)中裂解大肠杆菌颗粒(pellet)。(II)用氯仿提取LMW RNA并将其保留在上清液中。(III)离心后，收集上清液并加入异丙醇以沉淀所有LMW RNA。(IV)收集沉淀物并用75％乙醇洗涤。(V)将LMW RNA溶解在不含核糖核酸酶(RNase)的水中。B.对如A中所述提取的大肠杆菌LMW RNA进行变性脲-聚丙烯酰胺凝胶电泳(脲-PAGE)分析。L1：低范围RNA ladder。L2-L4：大肠杆菌LMW RNA。与tRNA相对应的条带标记在凝胶上。C.含有大肠杆菌LMW RNA连续移位通过MspA的代表性迹线。特征性tRNA1型和2型事件分别用蓝色三角形和红色三角形标记。D.(C)中代表性移位事件的放大视图，这些事件在迹线上用i和ii标记。E.tRNA移位事件的比例。所有获得事件的48％被认定为tRNA1型或tRNA 2型事件。如方法中所述进行(C-E)中的测量。将大肠杆菌LMW RNA添加到cis侧，终浓度为40ng/μL。使用定制机器学习算法进行迹线分割和事件识别(图23A)。

图34显示了对大肠杆菌HMW RNA提取进行表征。使用MiniBEST Universal RNAExtraction Kit(Takara)制备大肠杆菌HMW RNA，该试剂盒特异性提取分子量大于200个核苷酸的RNA⁹⁸。A.对大肠杆菌HMW RNA进行1％琼脂糖凝胶电泳表征。凝胶电泳在4℃、+180V施加电位下连续运行35分钟。L1：RNAMarker RL1000；L2：RNAMarker RL6000；L3：来自sigma的酿酒酵母tRNA^phe；L4：大肠杆菌RNA提取。从凝胶结果来看，提取样品的主要级分是23S rRNA(2904nt)和16S rRNA(1542nt)⁹⁹。没有观察到tRNA的迹线。B.对大肠杆菌HMW RNA进行12％脲-PAGE凝胶电泳表征。在施加+180mV的电位下连续运行凝胶电泳100分钟。L1：低范围RNA标记物；L2：大肠杆菌HMW；L3：大肠杆菌LMW。进行12％脲-PAGE凝胶电泳以解析分子量较小的RNA¹⁰⁰。凝胶结果进一步证实，从大肠杆菌HMW RNA提取中未观察到tRNA的迹线。

图35显示了大肠杆菌HMW RNA传感。如方法中所述进行测量。将大肠杆菌HMW RNA添加到cis室中，终浓度为50ng/μL。A.大肠杆菌HMW RNA移位的代表性迹线。大多数事件表现出的驻留时间极长。有时HMW RNA甚至可能导致孔阻塞。

B.tRNA和5S rRNA移位事件的比例。没有任何事件被识别为tRNA2型事件。只有3.7％的信号被识别为tRNA1型事件。所展示的结果表明，tRNA 2型的事件特征在识别tRNA方面更为可靠。通过该事件特征可以有效地排除HMW RNA引起的事件。

图36显示了RNA分类(RNA-Classification)的工作流程图。本研究中开发和使用的基于机器学习的算法RNA分类(RNA-Classification)已分享(https://drive.google.com/file/d/17JoqS2JUY-Q0Y4e5Ib0HE4PsexYtEIKq/view？usp＝sharing)，用于验证和进一步开发。简言之，输入含有五个文件，包括特征表、训练集和测试集的标记，以及预测数据集的分割数据。这里，训练集和测试集是类型不同但先前已知身份的RNA的模型事件。提供了四组从纳米孔测量(依次添加突出端siRNA、平端siRNA、tRNA和5S rRNA)获得的数据，作为演示预测集。整个工作流程由以下七个步骤组成。步骤1：特征提取。提取数据集分割数据中单个事件的11个参数，形成每个事件的特征矩阵。步骤2：模型建立。通过10倍交叉验证生成训练集的特征矩阵和标记，用于建立模型和微调参数。并且将性能最好的经过训练的模型保存到本地。步骤3：模型保存：将经过训练的模型保存到本地，以便下次快速加载。步骤4：模型测试：通过经过训练的模型对测试集的特征矩阵和标记进行测试，并验证模型的性能。步骤5：模型输出。生成了性能最佳分类器的特征重要性、混淆矩阵和学习曲线的图像。步骤6：模型预测。将预测集的特征表加载到所建立的机器学习模型中进行事件识别。步骤7：分类输出。生成五个文件夹，具有已分类的突出端siRNA、平端siRNA、tRNA、5SrRNA和其他事件。

图37显示了基于MspA的纳米孔捕获/移位对Let-7家族miRNA的直接区分。当与相关DNA探针杂交时，Hsa-let-7a和Hsa-let-7c可以通过基于MspA的纳米孔捕获/移位直接区分。我们认为这是本手稿公布后的后续工作，而本手稿描述了一种更通用的方法。请注意，MspA对区分进入孔的分析物的不同取向非常灵敏，因此即使对于相同的双链核酸，它通常也会在事件分布中报告两个峰。然而，对于不同杂交的miRNA，比如单碱基错配的miRNA来说，它在纳米孔捕获期间被直接区分。

图38显示了通过MspA纳米孔阱对钙调蛋白(CaM)的变构转换的随机传感。(a)CaM在与Ca²⁺和M13肽顺序结合时的变构行为示意图。更详细的机制概述如图39所示。在结合Ca² ⁺(橙色球体)时，CaM的中心α-螺旋被限制在结构上为刚性的激活状态，准备结合M13肽。在进一步结合M13肽时，结构折拢(工作状态)。注释apo-wtCaM、Ca-wtCaM或M13-Ca-wtCaM分别表示wtCaM不与任何配体结合，与Ca²⁺离子或与M13肽结合时的状态。使用蛋白质数据库(PDB)的结构文件生成apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM的晶体结构。PDB ID分别为1CFC(apo-wtCaM)、1CLL(Ca-wtCaM)和2BBN(M13-Ca-wtCaM)。apo-wtCaM的结构表现出高度柔性的状态，产生可能的变体结构(透明结构图)。上述变构转变导致CaM显著的结构变化，可通过合适的纳米孔传感器检测。(b)前庭中捕获有CaM(紫色)的MspA(黄色)横截面图。所捕获的CaM的形式可以是apo-wtCaM(左图)、Ca-wtCaM(中间图)或M13-Ca-wtCaM(右图)。MspA的锥形前庭直径测量值为4.8nm，可以很容易地容纳任何形式的CaM。直径测量值为1.2nm的较窄孔缢缩部位阻止CaM移位。然而，当被锥形的孔前庭容纳时，不同形式的CaM表现出高度可区分的捕获状态。这里所展示的状态是通过分子动力学(MD)模拟预测的，平衡时间超过100ns(实施例5方法5，图48)。

图39显示了变构蛋白wtCaM的构象。此处结果是wtCaM构象体在变构转变前后的晶体结构。所呈现的所有结构都从PDB文件1CFC(apo-wtCaM)、1CLL(Ca-wtCaM)和2BBN(M13-Ca-wtCaM)得出，这些文件在1990年代初就有报道^190,191。CaM由两个相似的结构域(N-叶(N-lobe)和C-叶(C-lobe))组成，每个结构域含有两个Ca²⁺结合位点(EF-手(EF-hand))。为了比较不同wtCaM构象体之间的结构差异，通过PyMOL对CaM构象物的N-叶(氨基酸1-70)或C-叶(氨基酸90-146)进行比对。得到的比对图分别显示在a和f中。(a)apo-wtCaM(黄色)和Ca-wtCaM(绿色)的N-叶比对图。在没有Ca²⁺结合的情况下，wtCaM的N-和C-叶通过高度柔性的接头(残基77-80，红色)连接。⁹在Ca²⁺结合后，这种高度柔性的接头与相邻的ɑ-螺旋重组(红色)，从而形成Ca-wtCaM的整体哑铃形结构。(b-e)EF-手的详细展示图，其中Ca²⁺与CaM的相关氨基酸残基配位。疾病相关突变(D129G)是EF-手4(e)结构域中与Ca²⁺结合的关键氨基酸之一。(f)Ca-wtCaM(绿色)和M13肽(橙色)结合的Ca-wtCaM(M13-Ca-wtCaM，浅灰色)的C-叶对比图。在结合M13肽时，Ca-wtCaM的主要构象变化涉及中心螺旋重新解体为通过长柔性环连接的两个螺旋，从而实现显著的结构折拢(用灰色箭头标记)，因此使N-叶和C-叶结合在一起抓住M13肽(橙色)。¹⁰该复合物主要通过大量疏水相互作用而稳定，特别是M13肽的两个大体积疏水残基Trp4(g)和Phe17(h)与Ca-wtCaM之间在CaM两个结构域上深层疏水袋处的广泛接触。

图40显示了wtCaM的纯化和表征。wtCaM的制备在实施例5方法1中有详细说明。通过阴离子交换色谱法纯化表达的wtCaM，并通过凝胶电泳对其进行表征。(a)阴离子交换色谱法期间的UV吸收光谱。将含有wtCaM的裂解物应用于色谱柱。用不同比率的缓冲液B1(Conc B)洗脱缓冲液洗脱色谱柱，并报告了不同的洗脱峰。wtCaM是一种典型的酸性蛋白质，当应用更高比率的Conc B时，与含有wtCaM的洗脱液相对应的峰预计将出现得较晚。蓝色箭头标记的峰预计含有所需的wtCaM。(b)凝胶电泳结果。泳道M：precision plus蛋白质标准品；泳道1：含有未经IPTG诱导的wtCaM质粒的细菌裂解物；泳道2：含有经IPTG诱导的wtCaM质粒的细菌裂解物；泳道3：裂解物加载后立即从阴离子交换柱收集的级分；泳道4：对应于(a)中蓝色箭头标记的峰的洗脱液。当将泳道1中的结果与泳道2中的结果进行比较时，泳道4中蓝色箭头标记的条带被识别为过表达的蛋白质。该条带的迁移距离在15kDa和20kDa之间，与wtCaM的迁移距离(16.8kDa)一致，进一步证实了该条带对应于所需的wtCaM。将相应的洗脱液直接用于所有下游纳米孔测量，无须任何进一步纯化。

图41显示了CaM-D129G的纯化和表征。CaM-D129G的制备在实施例5方法1有详细说明。表达的CaM-D129G通过阴离子交换色谱法纯化，并通过凝胶电泳对其进行表征。(a)阴离子交换色谱法期间的UV吸收光谱。将含有CaM-D129G的裂解物应用于色谱柱。用不同比率的缓冲液B1(Conc B)洗脱缓冲液洗脱色谱柱，并报告了不同的洗脱峰。根据wtCaM纯化的结果(图40a)，与含有CaM-D129G的洗脱液相对应的峰预计将在色谱柱洗脱期间出现得较晚。蓝色箭头标记的峰预计含有所需的CaM-D129G。(b)凝胶电泳结果。泳道M：precision plus蛋白质标准品；泳道1：含有未经IPTG诱导的CaM-D129G质粒的细菌裂解物；泳道2：含有经IPTG诱导的CaM-D129G质粒的细菌裂解物；泳道3：对应于(a)中蓝色箭头标记的峰的洗脱液。当比较泳道1中的结果与泳道2中的结果时，泳道3中蓝色箭头标记的条带被识别为过表达的蛋白质。它的迁移距离在15kDa和20kDa之间，与CaM-D129G的迁移距离(16.8kDa)一致，进一步证实了该条带对应于所需的CaM-D129G。将相应的洗脱液用于所有下游纳米孔测量，无须任何进一步纯化。

图42显示了M13肽的制备。M13肽的制备在实施例5方法2中有详细说明。(a)构建编码GST-M13融合蛋白的质粒。将编码该融合蛋白的基因克隆到pGEX-6P-1质粒中。编码M13肽的基因(在序列端有终止子，蓝色)被插入BamHⅠ和XhoⅠ的识别序列之间，紧接在PreScission位点(粉色)之后。当用相应的蛋白酶处理时，所表达蛋白质的PreScission位点是可裂解的。(b)M13分离示意图。首先将所表达融合蛋白GST-M13应用于GSTrap^TM色谱柱。色谱柱进一步应用了在其N-末端上也具有GST标签的PreScission蛋白酶(GST-Prot)。在4℃孵育8h后，M13与GST-M13融合蛋白完全分离，用裂解缓冲液将其洗脱并收集。然而GST部分和PreScission蛋白酶保留在色谱柱上。通过用含有谷胱甘肽(GSH)的溶液(洗脱缓冲液B2)洗脱对色谱柱进行再生，并且丢弃洗脱的GST和GST-Prot。(c)凝胶电泳结果。泳道M₁：precision plus蛋白质标准品；泳道M₂：预染色的低范围蛋白质标记物；泳道1-2：含有不经或经IPTG诱导的GST-M13质粒的细菌裂解物；泳道3：融合蛋白的洗脱GST部分和GST-PreScission蛋白酶；泳道4：洗脱的M13肽(3.2kDa)。相对于泳道1中的结果，泳道2中的过量条带代表过表达的GST-M13。与对应于GST-M13的条带(标记为绿色)相比，泳道3中的下部条带(标记为紫罗兰色)报告的位置在凝胶上略低。这是符合预期的，因为GST(26kDa)具有的分子量比GST-M13更低。泳道3中的上部条带(标记为棕色)被识别为GST蛋白酶(46kDa)。如泳道4中所表征的M13肽直接用于所有下游纳米孔测量，无须任何进一步纯化。

图43显示了apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM捕获的单分子特征。(a-c)含有由apo-wtCaM(a)、Ca-wtCaM(b)或M13-Ca-wtCaM(c)捕获所引起事件的代表性迹线。不同状态CaM的相应结构图位于每条迹线的左侧。为了便于观察，CaM、Ca²⁺和M13肽分别呈紫色、橙色和彩虹色。用MspA获得所展示的迹线(实施例5方法4)。将wtCaM添加到cis侧，终浓度为0.6μM。Ca²⁺/M13肽在cis中的终浓度为0mM/0μM(a)、4mM/0μM(b)和4mM/0.8μM(c)。I₀是开孔水平，I_b1、I_b2或I_b3分别表示由apo-wtCaM、Ca-wtCaM或M13-Ca-wtCaM捕获引起的阻塞水平。(d)apo-wtCaM(左侧)、Ca-wtCaM(中间)或M13-Ca-wtCaM(右侧)捕获的代表性事件。该事件取自a-c中如相应箭头所示的迹线。为了便于展示，apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM的阻塞水平相应地进行了颜色编码。这些事件类型彼此在停留时间、阻塞深度和阻塞水平波动方面具有高度的可区分性。(e)事件停留时间(t_off)的对数与阻塞百分比(ΔI/I₀)的散点图。在散点图的右侧和顶部绘制t_off和ΔI/I₀的相应直方图。(f)由apo-wtCaM、Ca-wtCaM或M13-Ca-wtCaM捕获引起的阻塞事件的标准差值(STD)。捕获Ca-wtCaM报告了水平波动最大的事件。apo-wtCaM捕获报告了噪声最少的事件。

图44显示了从Ca-wtCaM到M13-Ca-wtCaM的事件类型转换。如实施例5方法1中所述用M2 MspA进行单通道记录。将Apo-wtCaM与4mM Ca²⁺一起添加到cis侧，终浓度为0.6μM。将M13肽添加到cis侧，如每条迹线顶部所标记的，终浓度为0-0.8μM。(a-e)左图：显示因M13结合的Ca-wtCaM的捕获引起事件发生的代表性迹线。蓝色(较低)和红色(较高)背景分别表示由Ca-wtCaM或M13-Ca-wtCaM捕获引起事件的阻塞深度。右图：相应ΔI/I₀直方图。左上角的数字分别表示由M13-Ca-wtCaM(红色数字，左侧)或Ca-wtCaM(蓝色数字，右侧)捕获引起阻塞事件的比率。峰是高斯拟合的。ΔI/I₀的平均值从拟合结果得出。根据上述结果，由Ca-wtCaM和M13-Ca-wtCaM引起的捕获事件是高度可区分的，分别显示为93.0％和83.9％。

图45显示了M13肽对照实验。显示(a)M13(0.8μM)、(b)apo-wtCaM(0.6μM)、(c)apo-wtCaM(0.6μM)和M13(0.8μM)、(d)Ca-wtCaM(0.6μM)、(e)Ca-wtCaM(0.6μM)和M13(0.8μM)阻塞事件的代表性迹线。所有展示的结果都是用M2 MspA进行的。所报告的所有浓度都是添加到cis侧的分析物的终浓度。将代表性事件(如每条迹线上蓝色虚线矩形标记的)放置在每条迹线的右侧，作为放大展示图。具体来说，当由纳米孔传感时，M13能报告事件。基于分子大小，该事件很可能是纳米孔移位而非纳米孔捕获的结果，因此报告的幅度几乎检测不到。在不添加Ca²⁺的情况下，分别报告了由apo-wtCaM和M13肽引起的事件(c)，表明apo-wtCaM和M13肽没有结合在一起。然而，在添加Ca²⁺的情况下，不断地报告了由apo-wtCaM和M13肽之间结合形式引起的新型事件，从而证实了形成结合复合物需要Ca²⁺的存在。

图46显示了事件参数的定义。(a)含有分析物捕获事件的代表性电生理学迹线。为展示起见，将Ca-wtCaM视为模型分析物。I₀是开孔电流，I_b是由分析物捕获引起的剩余电流。ΔI从ΔI＝I₀-I_b得出。ΔI/I₀定义为阻塞率。t_off表示事件的停留时间。t_on表示事件间间隔。STD是阻塞水平的标准差值。(b-c)从连续记录迹线获取的t_on(b)和t_off(c)的直方图。根据方程y＝a*exp(-x/τ)，直方图分别拟合至单一指数曲线，从中分别得出平均事件间间隔(τ_on)(b)和平均事件停留时间(τ_off)(c)。(d)从连续记录迹线中获取的ΔI/I₀的直方图。所述直方图中的峰是高斯拟合的。拟合结果的中间表示ΔI/I₀的平均值如果没有另行说明，本手稿中的所有结果都由上述定义的事件参数描述。

图47显示了蛋白质分析物的捕获频率(k_on)。如方程1/τ_on＝k_on·c定义的捕获频率(k_on)用于评估当应用不同分析物时纳米孔捕获的能力。绘制apo-wtCaM(a)、Ca-wtCaM(b)、M13-Ca-wtCaM(c)和apo-CaM-D129G(d)事件间间隔的倒数(1/τ_on)与分析物终浓度的关系图。一般来说，1/τ_on值与所添加分析物的浓度呈正相关，进一步证实了阻塞事件是由所添加的分析物产生的。所有结果都是线性拟合的，平均捕获频率作为拟合结果的斜率得出。(a-d)中的误差棒表示独立测量(N＝3)之间的标准差(SD)。以上讨论的所有结果详见表7。

图48显示了wtCaM构象体的分子动力学(MD)模拟。如实施例5方法5中所述建立分子动力学模拟。分别展示了apo-wtCaM(a)、Ca-wtCaM(b)、M13-Ca-wtCaM(c)和MspA的平衡MD结构。在视频S5-S7中示出了100ns的模拟轨迹。(d)apo-wtCaM(橄榄色，最高)、Ca-wtCaM(橙色，最低)和M13-Ca-wtCaM(蓝色，中间)在被捕获后的均方根偏差(RMSD)变化。RMSD值表明了所有三种wtCaM构象体在滞留在MspA纳米孔阱中时的构象波动。结果表明，所有三种构象体都被稳定地捕获在的范围内。(e)RMSD的平均值(直方图)与平均事件持续时间的倒数(红色线图)之间的相关性分析。RMSD的平均值从由如d所示的50ns模拟的结果得出。apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM的平均RMSD分别为和与电生理测量的值(0.20±0.012ms^-1、(2.8±0.46)*10^-4ms^-1和(7.8±0.96)*10^-3ms^-1)高度相关。上述比较可以表明，当被MspA纳米孔阱捕获时，三种构象体的构象波动可能对分析物的逃逸能力有很大影响。

图49显示了不同电压下wtCaM的捕获。所有的测量都是用M2 MspA进行的(实施例5方法4)。展示了当用+60mV、+70mV、+80mV或+90mV的施加电位测量时，apo-wtCaM(a)、Ca-wtCaM(c)和M13-Ca-wtCaM(e)的代表性捕获事件。总结了在不同施加电位下测量的apo-wtCaM(b)、Ca-wtCaM(d)和M13-Ca-wtCaM(f)的平均事件停留时间(τ_off)。一般来说，在更高的施加电位下，事件停留时间延长，表明任何形式的wtCaM(apo-wtCaM、Ca-wtCaM或M13-Ca-wtCaM)都不会移位通过纳米孔。(a)在不同施加电位下apo-wtCaM的代表性事件。具体而言，当施加电压高于+80mV时，偶尔会观察到其他二级阻塞类型，这表明更强的电泳力可以机械拉伸apo-wtCaM，从而使它可以更深地到达纳米孔缢缩处。(b)在(a)中相应的捕获事件的τ_off。将在高于+80mV的电压下产生两阶跃(two-step)阻塞事件的停留时间定义为两阶跃的总持续时间。(c)在不同施加电位下Ca-wtCaM的代表性捕获事件。(d)在(b)中相应的捕获事件的τ_off。(e)在不同施加电位下M13结合Ca-wtCaM的代表性捕获事件。(f)在(e)中相应的捕获事件的τ_off。(b)、(d)或(f)中的误差棒表示独立测量(N＝3)之间的标准差。分析物在cis侧的终浓度为(a)0.6μM apo-wtCaM，(c)0.6μM apo-wtCaM和4mM Ca²⁺，(e)0.6μM apo-wtCaM、4mM Ca²⁺和1.0μM M13肽。以上讨论的所有结果详见表8。

图50显示了CaM-D129G的单分子性质。(a)未结合任何Ca²⁺的wtCaM(紫色，apo-wtCaM)及其D129G突变体(红色，apo-CaM D129G)的比对图。apo-CaM D129G的Gly(129)用粗棒突出显示，并且在C-叶中观察到显著的结构差异。(b)apo-wtCaM和apo-CaM-D129G(每种分析物在cis侧的浓度为0.6μM)的随机传感。紫色菱形标记的是apo-wtCaM的事件。红色或绿色圈分别标记apo-CaM-D129G的两种事件类型(图51)。放大一段迹线(灰色虚线框)以展示事件类型之间的差异。(c)apo-wtCaM和apo-CaM-D129G事件的ΔI/I₀与log(t_off)散点图。所有事件均来自如b所示30分钟连续记录的迹线。将ΔI/I₀和log(t_off)相应直方图位于散点图的顶部和右边距。在散点图中清楚地区分由捕获apo-wtCaM或apo-CaM D129G引起的事件，如由相应标记和拟合结果通过颜色所标示的。具体而言，绿色拟合结果对应于apo-CaMD129G捕获引起的少量事件群，如b中用绿色圈所标记的。(d)CaM-D129G(橙色)和wtCaM(紫色)的Ca²⁺结合结构的比对图。Gly 129用粗棒突出显示。观察到C-叶内EF-手结构域完全分离的病理构象。(e)在Ca²⁺存在下用CaM-D129G获得的代表性迹线。在cis侧添加4mM Ca²⁺和0.6μM apo-CaM-D129G进行测量。在迹线中展示了新型事件，如橙色星形所标记，只有添加Ca²⁺时才能观察到。(f)含Ca-wtCaM事件的代表性迹线。将Apo-wtCaM和Ca²⁺添加到cis侧，终浓度为0.6μM和4mM。(g)计算Ca-CaM D129G(橙色)和Ca-wtCaM(紫色)产率的100％堆叠柱状图。结果来自分别用如e和f所示的wtCaM或CaM D129G测量的30分钟连续记录的迹线。Ca-CaM D129G事件(e中的橙色星形)仅占事件总数(n＝1333)的13％，Ca-wtCaM事件(f中的紫色星形)占事件总数(n＝552)的97％。(h、i)区分事件特征。Ca-wtCaM事件和Ca-CaM D129G的多数事件显示出相似的阻塞深度，但是仍然可以根据它们的水平波动来区分。图的左上角和右上角分别展示了代表性事件和事件水平波动的放大展示图。从阻塞事件中提取的阻塞水平部分(彩色箭头之间)的全点直方图。将组距(bin)大小设置为0.6pA。直方图中的误差棒表示不同事件(n＝15，图52和图54)之间的标准差值。所有上述结果均如实施例5方法4中所述用MspA进行测量。蛋白质结构是基于其晶体结构文件通过MD模拟生成的。CaM-D129G的初始结构是通过PyMOL的突变模块中获得的。

图51显示了apo-CaM D129G和Ca-CaM D129 G的随机传感。如实施例5方法4中所述用M2 MspA进行所有测量。在cis和trans室中应用的缓冲液均为1.5M KCl和10mM HEPES(pH＝7.0)。施加电位为+60mV。(a)含有apo-CaM D129G捕获事件的代表性迹线。将apo-CaM-D129G添加到cis侧，终浓度为0.6μM。观察到两种类型的事件，分别达到由红色(较高)和绿色(较低)背景标记的阻塞深度。大多数事件报告的阻塞深度为～69pA，如红色背景所标记的。(b)apo-CaM-D129G捕获的ΔI/I₀直方图。(c)含有Ca-CaM D129G捕获事件的代表性迹线。按照(a)中所展示的进行测量。将Ca²⁺进一步添加到cis侧，终浓度为4mM。除了(a)中观察到的事件外，还不断地观察到新事件类型，达到如橙色(最低)背景所标记的～20pA的阻塞深度。这种新事件类型表示Ca-CaM-D129G(钙结合形式的CaM-D129G)的事件。(d)Ca-CaM-D129G捕获的ΔI/I₀相应直方图。将(b)和(d)灰色虚线框中的直方图放大并显示在右上角。对(b)和(d)中的所有峰分别进行高斯拟合并相应地用颜色标出。

图52显示了Ca-CaM D129G的事件特征。如图50中所示进行所有测量。提取Ca-CaMD129G的捕获事件以分析其事件特征。通过全点直方图(图50h)进一步分析了阻塞部分(即(a-e)中橙色箭头之间的部分)，这些直方图是从(a-e)中展示的阻塞部分随机提取的1秒迹线部分生成的。将阻塞部分的放大展示图放置在代表性事件的右侧。(f-j)(a-e)中所示部分的相应全点直方图。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的绿色(下部)箭头和蓝色(上部)箭头分别表示两种高度一致的事件特征，这些特征促成了全点直方图中的峰，如(f-j)中的绿色(左侧)箭头和蓝色(右侧)箭头所标记的。

图53显示了不同二价离子存在下的wtCaM。(a-e)Ca²⁺(a)、Mg²⁺(b)、Ba²⁺(c)、Sr²⁺(d)或Pb²⁺(e)结合wtCaM捕获事件的ΔI/I₀的直方图。所有事件都来自如图55a-55e所示的30分钟连续记录迹线。对直方图中的峰进行高斯拟合。将灰色虚线框(b-d)中的直方图放大并呈现出来。与绿色拟合曲线重叠的峰(左侧)对应于apo-wtCa的事件。与蓝色拟合曲线重叠的峰(中间)对应于EF-手结构域未被二价离子完全占据的瞬态事件。与红色拟合曲线重叠的峰(右侧)来自wtCaM在所有四个EF-手结构域都填充了相应的离子时的事件。所有拟合结果详见表9。

图54显示了Ca-wtCaM的事件特征。如图55所示，使用M2 MspA进行测量。提取捕获事件以分析事件特征。通过全点直方图(图50i和图55f)进一步分析阻塞部分，即(a-e)中橙色箭头之间的部分。将阻塞部分的放大展示图放置在代表性事件的右侧。(f-j)(a-e)中所展示部分的相应全点直方图。全点直方图是从(a-e)所展示的阻塞部分中随机提取的1秒迹线部分生成的。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的绿色(下部)箭头和蓝色(上部)箭头分别表示两种高度一致的事件特征，这些特征导致了全点直方图中的峰，如(f-j)中的绿色(左侧)箭头和蓝色(右侧)箭头所标记的。

图55显示了在不同二价离子存在下纳米孔捕获wtCaM。(a-e)左图：在Ca²⁺(a)、Mg²⁺(b)、Ba²⁺(c)、Sr²⁺(d)或Pb²⁺(e)存在下，含有wtCaM(0.6μM)捕获事件的代表性迹线。为了进行定量比较，cis侧每种类型二价离子的终浓度相同地设定为2mM。右图：由不同状态CaM引起事件的100％堆叠柱状图。不同的配位状态通过每个事件的阻塞深度(如迹线上绿色、蓝色和红色背景(从上到下)所示)来识别。在100％堆叠柱状图中，红色(最低)柱对应于wtCaM在所有四个EF-手结构域都填充了离子(holo-wtCaM)时的事件。绿色柱(最高，e中不存在)对应于apo-wtCaM的事件。蓝色柱(中间，在b和c中不存在)对应于wtCaM在EF-手结构域部分填充有离子(瞬态)时的事件。将holo-wtCaM(红色)比例应用于评估二价离子与wtCaM的结合能力。(f-j)如a-e所示的holo-wtCaM事件阻塞水平的全点直方图。将组距(bin)大小设置为0.6pA。由不同二价离子结合引起的holo-wtCaM捕获事件具有相似的阻塞深度。然而，当与Ca²⁺(f)、Mg²⁺(g)、Ba²⁺(h)、Sr²⁺(i)或Pb²⁺(j)结合时，它们的holo-wtCaM事件是高度可区分的。对应于不同二价离子的迹线放大图显示在直方图的左上角。(f-j)中的误差棒表示独立事件(n＝15，图54-59)之间的标准差。如实施例5方法4中所述，用MspA进行上文所述所有测量。

图56显示了Mg-wtCaM的事件特征。如图55所述，使用M2 MspA进行测量。提取捕获事件以分析事件特征。通过全点直方图(图55g)进一步分析所述阻塞部分，即(a-e)中橙色箭头之间的部分。阻塞部分的放大展示图呈现在代表性事件的右侧。(f-j)(a-e)中所展示部分的相应全点直方图。全点直方图都是从(a-e)中所展示阻塞部分中随机提取的0.2秒迹线部分生成的。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的绿色(下部)箭头和蓝色(上部)箭头分别表示两种高度一致的事件特征，这些特征导致了全点直方图中的峰，如(f-j)中的绿色(左侧)箭头和蓝色(右侧)箭头所标记的。

图57显示了Ba-wtCaM的事件特征。如图55所述，使用M2 MspA进行测量。提取捕获事件以分析事件特征。通过全点直方图(图55h)进一步分析阻塞部分，即(a-e)中橙色箭头之间的部分。阻塞部分的放大展示图呈现在代表性事件的右侧。(f-j)(a-e)中所示部分的相应全点直方图。全点直方图都是从(a-e)中所示阻塞部分中随机提取的0.2秒迹线部分中生成的。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的蓝色箭头表明高度一致的事件特征，这些特征导致了全点直方图中的峰，如(f-j)中的蓝色箭头所标记的。

图58显示了Sr-wtCaM的事件特征。如图55所述，使用M2 MspA进行测量。提取捕获事件以分析事件特征。通过全点直方图(图55i)进一步分析阻塞部分，即(a-e)中橙色箭头之间的部分。阻塞部分的放大展示图呈现在代表性事件的右侧。(f-j)(a-e)中所示部分的相应全点直方图。全点直方图都是从(a-e)中所示阻塞部分中随机提取的0.2秒迹线部分中生成的。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的绿色(下部)箭头和蓝色(上部)箭头分别表示两种高度一致的事件特征，这些特征促成了全点直方图中的峰，如(f-j)中绿色(左侧)箭头和蓝色(右侧)箭头所标记的。

图59显示了Pb-wtCaM的事件特征。如图55所述，使用M2 MspA进行测量。提取捕获事件以分析事件特征。通过全点直方图(图55j)进一步分析阻塞部分，即(a-e)中橙色箭头之间的部分。阻塞部分的放大展示图呈现在代表性事件的右侧。(f-j)(a-e)中所示部分的相应全点直方图。全点直方图都是从(a-e)中所示阻塞部分中随机提取的1秒迹线部分生成的。将组距(bin)大小设置为0.6pA。迹线(a-e)上标记的绿色(下部)箭头和蓝色(上部)箭头分别表示两种高度一致的事件特征，这些特征促成了全点直方图中的峰，如(f-j)中绿色(左侧)箭头和蓝色(右侧)箭头所标记的。

图60显示了Tb³⁺诱导的wtCaM激活和聚集。(a)由Tb³⁺(深灰色球体)结合引起的CaM聚集的方案。低浓度的Tb³⁺激活wtCaM变构，而高浓度的Tb³⁺诱导CaM聚集。(b-e)显示当cis侧Tb³⁺的终浓度依次滴定至0μM(b)、5μM(c)、150μM(d)和500μM(e)时CaM状态变化的代表性迹线。因此，观察到事件类型逐渐变化，这是由不同浓度Tb³⁺诱导的wtCaM变构引起的。在5μM的Tb³⁺下，观察到了由捕获Tb-wtCaM引起的具有高水平波动的深度阻塞事件。将Tb³⁺添加到150μM会产生新型事件，这种事件的驻留时间要短得多，并且具有不同的事件特征。将Tb³⁺进一步添加到500μM会造成事件完全消失。(f)当通过纳米孔捕获检测时wtCaM的代表性变构状态。具体而言，当Tb³⁺处于低浓度(0.05-120μM)或高浓度(15-200μM)状态时，观察到Tb-wtCaM或预聚集状况的事件(图61)。预聚集状态出现短暂驻留，在阻塞水平上方有正向尖峰，与Tb-wtCaM状态高度可区分。(g-h)Tb³⁺(g)或Ca²⁺(h)结合wtCaM诱导捕获事件1/τ_on与cis侧Tb³⁺或Ca²⁺浓度的关系图。在Ca²⁺的情况下，没有观察到由添加Tb³⁺引起的wtCaM聚集。cis侧wtCaM的终浓度为0.3μM。所有以上展示结果都是在如实施例5方法4中所述使用MspA测量期间获得的。

图61显示了Tb³⁺诱导wtCaM的变构转变。为了显示由Tb³⁺结合引起wtCaM结构逐渐变化的更多细节，展示了测量不同浓度Tb³⁺的代表性迹线。如图60所述进行所有测量。cis室中Tb³⁺的终浓度为0μM(a)、0.05μM(b)、5μM(c)、15μM(d)、120μM(e)、150μM(f)、200μM(g)或500μM(h)，如每条迹线顶部所标记的。apo-wtCaM的终浓度为0.3μM。彩色背景上的迹线是迹线上箭头标记的代表性事件的放大展示图。背景和箭头的颜色对应于wtCaM在apo-wtCaM(红色)、Tb-wtCaM(紫色)或预聚集状态(绿色)时的代表性事件。当添加500μM Tb³⁺时，wtCaM聚集，不再观察到后续事件。0.05μM、15μM和500μM的浓度是wtCaM结构开始转变时Tb³⁺的临界浓度。

图62显示了Tb³⁺或Ca²⁺诱导wtCaM的状态变化。利用凝胶电泳对整体状态变化进行了表征。在实验中，将apo-wtCaM与不同浓度的Tb³⁺或Ca²⁺电生理测试缓冲液(1.5M KCl和10mM HEPES，pH＝7.0)混合5分钟，然后加载到凝胶中。根据图60g和60h中的结果选择Tb³⁺、Ca²⁺和apo-wtCaM的终浓度，并按比例增加了25倍以获得清晰的电泳结果。(a)对Tb³⁺诱导wtCaM(7.5μM)激活和聚集过程进行15％天然PAGE表征。泳道1：apo-wtCaM；泳道2-6：与5μM、25μM、1.5mM、12.5mM或25mM Tb³⁺混合的wtCaM。当[Tb³⁺]增加到12.5mM(泳道5)时，Tb-wtCaM电泳迁移显著改变，表明聚集已经开始发生。(b)对Ca²⁺诱导wtCaM(7.5μM)激活过程进行天然PAGE表征。泳道1：apo-wtCaM；泳道2-6：与50μM、125μM、1.5mM、2.5mM、25mM、50mM Ca²⁺混合的wtCaM。在泳道4和泳道5中观察到电泳迁移距离略有缩短，这可能是由于与Ca²⁺结合时形成哑铃形结构引起的。除(a)中的泳道4外，所有结果均与图60中电生理实验一致。在存在1.5mM Tb³⁺(相当于图60g中的60μM)的情况下，Tb³⁺结合wtCaM的电泳迁移与apo-wtCaM的电泳迁移相同，但电流阻塞状态显著不同。这可能表明，本文所展示的单分子方法可以解析Tb³⁺结合wtCaM的预聚集态，而这种状态在整体上是不可区分的。

图63显示了不同纳米孔和CaM构象体之间的几何比较。同时呈现了不同纳米孔和CaM构象体的几何尺寸。(a)MspA(PDB ID:1UUN)，(b)α-HL(PDB ID:7AHL)，(c)ClyA(PDB ID:2WCD)，(d)CaM构象体，包括apo-wtCaM(PDB:1CFC)、Ca-wtCaM(PDB:1CLL)和M13-Ca-wtCaM(PDB:2BBN)。在探测大型蛋白质分析物时，MspA或ClyA的大内腔用作纳米孔阱是理想的选择，而α-HL开口狭窄且内腔大小有限，就会受到限制。

图64显示了不同纳米孔之间的稳定性比较。进行4-20％ SDS-PAGE凝胶电泳以比较纳米孔的结构稳定性。对于所有三种类型的纳米孔(MspA、ɑ-HL WT和ClyA-RR)，将新制备的纳米孔(泳道1)与在85℃下热处理15分钟的纳米孔(泳道2)或在-20℃下储存3个月后的纳米孔(泳道3)进行比较。凝胶结果上的彩色线分别标记了不同寡聚形式的纳米孔。在所有表征的纳米孔中，MspA在热处理或长期储存方面表现出的稳定性最佳。其寡聚状态保持不变，这使得测量高度一致。在热处理或长期储存后，WTɑ-HL表现为解聚成单体。还观察到WTɑ-HL聚集，表现为较高分子量的条带。ClyA-RR在SDS-PAGE条件下完全解聚，表明其结构组装是目前测试纳米孔中最弱的。正如我们所报告¹⁹²和观察到的，组装的ClyA及其突变体只能储存很短的时间，这意味着必须重复进行耗时的ClyA制备工作。

图65显示了空载MspA纳米孔的结果。使用M2 MspA进行测量(实施例5方法4)。施加电压从+40mV升至+120mV，以评估MspA的稳定性。施加不同电位时的特定部分由绿色箭头和相应的标记表示。(a)空载MspA纳米孔阱的示意图。(b)当施加电压梯度时，空载MspA纳米孔的电流迹线。MspA在连续18分钟测量期间保持稳定。未观察到自发门控。

图66显示了作为纳米孔阱应用的WTɑ-HL。如实施例5方法4中所述进行所有测量，但使用WTɑ-HL代替M2 MspA作为纳米孔阱。(a)空载ɑ-HL纳米孔阱的示意图。(b、c)当将apo-wtCaM(b)或Ca-wtCaM(c)做为分析物时ɑ-HL纳米孔阱的示意图。由PDB文件1CFC(apo-wtCaM)、1CLL(Ca-wtCaM)和7AHL(ɑ-HL)生成ɑ-HL和wtCaM的结构。所捕获的分析物的对接通过PyMOL进行。基于目测，ɑ-HL狭窄的前庭在几何上对于捕获apo-wtCaM或Ca-wtCaM是受限的。(d)当施加从+60mV到+150mV的电压梯度时，空载ɑ-HL纳米孔的电流迹线。在30分钟的测量期间没有观察到自发门控。(e、f)当将apo-wtCaM(e)或Ca-wtCaM(f)做为分析物时，进行ɑ-HL纳米孔捕获的代表性迹线。施加电压从+60mV上升至+140mV。施加不同电位时的特定部分由绿色箭头和相应的标记清楚地表示。在不同的测量组中，将apo-wtCaM或Ca-wtCaM分别添加到cis侧，终浓度为0.9μM。即使施加+140mV的电位，也没有观察到apo-wtCaM的阻塞事件。当施加超过+130mV的捕获电位时，观察到Ca-wtCaM的捕获事件。上述展示清楚地证明了WTɑ-HL是一种稳定的纳米孔传感器，在长时间的测量期间，它保持开孔而不会出现门控。然而，ɑ-HL的小前庭与大型蛋白质(例如apo-wtCaM)不相容。结构更窄的Ca-wtCaM可以深入到ɑ-HL前庭深处，从而产生可检测的捕获事件。然而，必须施加大电位来观察该现象，表明存在阻止捕获大型分析物的熵屏障。相反，捕获Apo-wtCaM或Ca-wtCaM可以通过M2 MspA容易地实现(图67)，证实了当用作纳米孔阱时，MspA的宽开口具有优势。

图67显示了MspA的最低捕获电位。所有测量都是用M2 MspA进行的(实施例5方法4)。施加不同电位来探测观察捕获事件所需的最低捕获电位。(a-b)MspA纳米孔阱在捕获apo-wtCaM(a)或Ca-wtCaM(b)时的示意图。MspA和wtCaM的结构是根据PDB文件1CFC(apo-wtCaM)、1CLL(Ca-wtCaM)和1UUN(MspA)生成的。通过PyMOL对捕获分析物进行对接。(c-d)当分别将apo-wtCaM(c)或Ca-wtCaM(d)应用为分析物时进行MspA纳米孔捕获的代表性迹线。在实验中，在独立测量中，将apo-wtCaM或Ca-wtCaM分别添加到cis侧，终浓度为0.9μM。施加不同电位时的部分用绿色箭头和相应的标记标示。以上结果表明，MspA是一种适合检测CaM的纳米孔阱传感器。鉴于其锥形结构，需要+40mV或+45mV的最低捕获电位才能检测到apo-wtCaM或Ca-wtCaM的捕获。

图68显示了空载ClyA-RR纳米孔的代表性迹线。如实施例5方法4中所述进行测量。相反将ClyA突变体(ClyA-RR)做为纳米孔阱。(a)在不添加任何分析物的情况下通过ClyA-RR测量的代表性迹线。当施加+70mV或更高的电位时，经常观察到如蓝色箭头所示的ClyA-RR自发门控事件。先前也有报道，ClyA及其突变体在高施加电压下的自发门控。¹⁹²(b)代表性门控事件。这是a中红色虚线矩形标记门控事件的放大展示图。尽管孔门控(用蓝色箭头标记)可以通过电压反转恢复，但当必须施加高电位时，频繁出现孔门控会严重干扰测量。

图69显示了ClyA作为纳米孔阱应用。如实施例5方法4中所述用ClyA-RR进行所有测量。(a-b)当将apo-wtCaM(a)或Ca-wtCaM(b)作为分析物应用时的代表性迹线。将apo-wtCaM或Ca-wtCaM添加到cis侧，终浓度为0.9μM。为了消除自发门控的干扰，根据图68中的结果，将施加电位设置为+60mV电位。然而，没有观察到apo-wtCaM或Ca-wtCaM的捕获事件，表明ClyA-RR不能有效地捕获wtCaM。

图70显示了在钙通量存在的情况下优化的MspA纳米孔阱。(a)MspA随机传感蛋白质分析物的示意图。溶菌酶在这里作为一种代表性蛋白质。根据蛋白质数据库中的结构文件，通过PyMOL手动生成MspA与溶菌酶的对接图。PDB ID：1UUN(MspA)和1DPX(溶菌酶)。将单个MspA插入隔开cis室和trans室的脂质膜中。cis室填充1.5M KCl缓冲液，trans室填充1.5M KCl或1M CaCl₂缓冲液(pH＝7.0)。将溶菌酶添加到cis侧，终浓度为0.42μM。连续施加+100mV的跨膜电位。(b)含有溶菌酶捕获事件的代表性迹线。在cis和trans侧均为1.5M KCl缓冲液的情况下进行测量。蓝色箭头标记开孔电流。(c-d)如b中所示的20分钟连续记录迹线的事件停留时间(t_off)(c)和事件间间隔(t_on)(d)的直方图。(e)含有在trans侧缓冲液从1.5M KCl变为1M CaCl₂时优化的溶菌酶捕获事件的连续迹线。蓝色箭头标记开孔电流。(f-g)如e中所示的15分钟连续记录迹线的事件停留时间(t_off)(f)和事件间间隔(t_on)(g)的直方图。在c和d的统计期间，忽略停留时间<1ms的事件，对于f和g，将忽略的停留时间设置为2ms。平均事件停留时间(τ_off)和平均事件间间隔(τ_on)都是根据方程y＝a*exp(-x/τ)通过指数拟合得出的。在钙通量存在的情况下，溶菌酶的捕获事件出现得更频繁，溶菌酶的逃逸时间显著延长。(h-i)电渗流(EOF)通过MspA纳米孔阱的实验证据。左图：在从膜的cis侧添加的三甲基-β-CD存在情况下，在1.5M KCl/1.5M KCl缓冲液(h)或1.5M KCl/1M CaCl₂缓冲液(i)中通过MspA的电流-电压(I-V)曲线。在每种情况下，电压在20s内从-150mV上升至+150mV。cis侧的中性三甲基-β-CD可以在正电位下被纳米孔阱捕获，这提供了确定EOF方向的基础。右图：在正电位或负电位下记录配置的示意图。EOF的方向用绿色箭头标记。

图71显示了溶菌酶捕获的单分子特征。(a)MspA随机传感典型碱性蛋白质溶菌酶(蓝色)的示意图。根据蛋白质数据库中的结构文件，通过PyMOL手动生成MspA与溶菌酶的对接图。PDB ID：1UUN(MspA)和1DPX(溶菌酶)。cis/trans室中的缓冲液分别为1.5M KCl/1MCaCl₂(pH＝7.0)。将溶菌酶添加到cis室中。连续施加+100mV的跨膜电位。(b)显示由溶菌酶捕获引起阻塞事件的代表性迹线。溶菌酶的终浓度为0.42μM。在右侧对典型事件(灰色虚线框)进行了放大以展示事件类型。(c)对应于如b所示的15分钟连续记录迹线的阻塞百分比(ΔI/I₀)直方图。ΔI/I₀平均值从高斯拟合结果得出。(d)从如b所示的15分钟持续记录迹线获得的t_off直方图。用单指数曲线拟合直方图，由此得出平均事件停留时间(τ_off)。统计期间忽略了停留时间<2ms的事件。(e)溶菌酶捕获事件的平均事件间间隔(τ_on)的倒数与cis侧溶菌酶终浓度的关系图。随着溶菌酶终浓度的增加，捕获事件出现得越来越频繁。

图72显示了肌红蛋白捕获的单分子特征。(a)MspA随机传感典型中性蛋白质肌红蛋白(红色)的示意图。根据蛋白质数据库中的结构文件，通过PyMOL手动生成MspA与肌红蛋白的对接图。PDB ID：1UUN(MspA)和1WLA(肌红蛋白)。cis/trans室中的缓冲液分别为1.5MKCl/1M CaCl₂(pH＝7.0)。将肌红蛋白加入cis室。连续施加+100mV的跨膜电位。(b)显示由肌红蛋白捕获引起阻塞事件的代表性迹线。肌红蛋白的终浓度为0.35μM。在右侧对典型事件(灰色虚线框)进行放大以展示事件类型。(c)对应于如b所示的25分钟连续记录迹线的百分比ΔI/I₀直方图。ΔI/I₀平均值从高斯拟合结果得出。(d)从如b所示的25分钟连续记录迹线获取的t_off直方图。使用单指数曲线拟合直方图，由此得出τ_off。统计期间忽略了停留时间<2ms的事件。

(e)肌红蛋白捕获事件τ_on的倒数与cis侧肌红蛋白终浓度的关系图。随着肌红蛋白终浓度的增加，捕获事件出现得越来越频繁。

图73显示了用MspA纳米孔阱区分脱辅基肌红蛋白和肌红蛋白。(a)从肌红蛋白(红色)中提取血红素后，无血红素肌红蛋白的结构示意图。基于肌红蛋白的PDB文件(1WLA)，通过PyMOL手动生成无血红素肌红蛋白的结构。(b)脱辅基肌红蛋白(金色)、肌红蛋白(红色)和MspA纳米孔阱(灰色)的结构示意图。在1.5M KCl/1 M CaCl₂(pH＝7.0)的缓冲液中，在+100 mV的连续跨膜电位下进行测量。 (c)显示脱辅基肌红蛋白捕获引起阻塞事件的代表性迹线。将脱辅基肌红蛋白添加到cis室中，终浓度为0.42μM。在右侧对两种典型事件(用灰色虚线框中的彩色箭头标记)，进行放大以展示两种事件类型，这两种事件类型都不同于图50b中肌红蛋白的阻塞事件。(d)同时传感肌红蛋白和脱辅基肌红蛋白，终浓度分别为0.35μM和0.12μM。上图：同时传感期间的代表性迹线。下图：通过Clampfit用50Hz高通贝塞尔滤波器(8极)滤波后的相应电流迹线。根据电流波动范围，可以从迹线中清楚地识别出肌红蛋白和脱辅基肌红蛋白的事件，分别用红色柱条或金色柱条标记。(e)对应于如d所示的30分钟连续记录迹线的阻塞电流标准差(幅度标准差)直方图。统计期间忽略停留时间<3ms的事件。幅度标准差的平均值从高斯拟合结果得出，脱辅基肌红蛋白的幅度标准差为13.5pA，显著大于肌红蛋白的幅度标准差(5.9pA)。

图74显示了ATCR/NCBD复合物捕获的单分子特征。(a)缔合前的p160类固醇受体共激活因子(ACTR，橙色)和CREB结合蛋白的核共激活因子结合结构域(NCBD，绿色)，以及两种固有非结构化蛋白质(IUP)结构域的折叠良好的二元复合物的示意图。本文概念性地展示完全展开的ATCR和熔球态NCBD的结构，ATCR/NCBD复合物的结构来自PDB文件1KBH。(b)MspA随机传感ATCR/NCBD复合物(橙色和绿色)的示意图。通过PyMOL手动生成MspA和肌红蛋白的对接图。cis/trans室中的缓冲液分别为1.5M KCl/1M CaCl₂(pH＝7.0)。将ATCR、NCBD或复合物添加cis室中并在测量期间连续施加+100mV的跨膜电位。(c-e)含有ATCR(c)、NCBD(d)或ATCR/NCBD复合物(e)捕获引起事件的代表性迹线。在钙通量存在的情况下，电学性质相反的两种固有非结构化蛋白质结构域ATCR和NCBD都可以分别阻塞MspA纳米孔阱，移位或逃逸速度快。当两种IUP以相等比例混合时，在e中生成了新型信号，这代表了生成了带负电荷的ATCR/NCBD复合物。在测量期间，ATCR、NCBD和ATCR/NCBD的终浓度相同(1μM)。(f)ATCR(左侧)、NCBD(中间)或ATCR/NCBD复合体(右侧)捕获的代表性事件。这些事件取自c-e中如相应箭头所标记的迹线。(g-h)对应于如e所示的30分钟连续记录ATCR/NCBD复合物捕获迹线ΔI/I₀(g)和t_off(h)直方图。ΔI/I₀平均值从高斯拟合结果得出。通过对直方图进行相应指数拟合得出τ_off。统计期间忽略停留时间<2ms的事件。(i)ATCR/NCBD复合物捕获事件τ_on的倒数与cis侧ATCR/NCBD复合物终浓度的关系图。随着ATCR/NCBD复合物终浓度增加，捕获事件出现得越来越频繁。

图75显示了用MspA纳米孔阱对蛋白质分析物进行区分。在1.5M KCl/1M CaCl₂(pH＝7.0)的缓冲液中，在+100mV的连续跨膜电位下进行测量。将溶菌酶、肌红蛋白或ATCR/NCBD复合物加入cis室，终浓度分别为0.42μM、0.7μM和2μM。(a)在pH7下电荷不同的三种典型蛋白质分析物的结构示意图。(b)同时传感溶菌酶、肌红蛋白和ATCR/NCBD复合物期间的代表性迹线。不同蛋白质分析物事件可以从所述迹线中清楚地识别出来，这些事件分别用蓝色、绿色或红色柱条标记。(c)对应于30分钟连续记录的同时传感迹线(n＝1178)的事件停留时间(t_off)与阻塞百分比(ΔI/I₀)的散点图，忽略<2ms的停留时间。三种蛋白质的事件可以清楚区分。(d)溶菌酶(32.9％)、肌红蛋白(46.6％)和ATCR/NCBD复合物(68.9％)捕获事件的ΔI/I₀对应直方图。ΔI/I₀平均值从高斯拟合结果得出。

图76显示了α-乳白蛋白捕获的单分子特征。(a)MspA随机传感典型酸性蛋白质α-乳白蛋白(紫色)的示意图。根据蛋白质数据库中的结构文件，通过PyMOL手动生成MspA与α-乳白蛋白的对接图。PDB ID：1UUN(MspA)和1F6S(α-乳白蛋白)。cis/trans室中的缓冲液分别为1.5M KCl/1M CaCl₂(pH＝7.0)。将α-乳白蛋白添加到cis室中。连续施加+20mV的跨膜电位。(b)显示α-乳白蛋白捕获引起阻塞事件的代表性迹线。α-乳白蛋白的终浓度为0.38μM。在右侧对典型事件(灰色虚线框)进行了放大，以展示事件类型。(c)对应于如b所示的15分钟连续记录迹线的阻塞百分比(ΔI/I₀)直方图。ΔI/I₀平均值从高斯拟合结果得出。(d)从如b所述的20分钟连续记录迹线获得的t_off直方图。用单指数曲线拟合直方图，由此得出平均事件停留时间(τ_off)。统计期间忽略了停留时间<2ms的事件。(e)α-乳白蛋白捕获事件的平均事件间间隔(τ_on)的倒数与cis侧α-乳白蛋白终浓度的关系图。随着α-乳白蛋白终浓度增加，所述捕获事件出现得越来越频繁。

图77显示了在钙通量存在下MspA纳米孔阱。(a)MspA随机传感蛋白质的示意图。将溶菌酶作为代表性分析物应用。根据蛋白质数据库(PDB)的晶体结构，通过PyMOL生成MspA(黑色)和溶菌酶(蓝色)的图。PDB ID：1UUN(MspA)和1DPX(溶菌酶)。简言之，在隔开cis和trans室的脂质膜中插入单个MspA。cis室填充1.5M KCl缓冲液，trans室填充1.5M KCl或1.0M CaCl₂缓冲液(pH＝7.0)。将溶菌酶添加到cis侧，终浓度为0.42μM。连续施加+100mV的跨膜电位。(b)含有溶菌酶捕获引起纳米孔事件的代表性迹线。在cis和trans侧均为1.5MKCl缓冲液的情况下进行测量。开孔电流(I_o)、剩余电流(I_b)、停留时间(t_off)和事件间持续时间(t_on)分别标记在迹线上。ΔI由ΔI＝I₀-I_b得出。(c-d)从如b所示的20分钟连续记录迹线(n＝503个事件)获得结果的t_off(c)和t_on(d)直方图。将忽略的持续时间设置为1ms，以排除分析物与孔瞬态碰撞引起的事件。(e)含有在trans侧缓冲液为1.0M CaCl₂时溶菌酶捕获事件的代表性迹线。(f-g)从如(e)所示的15分钟连续记录迹线(n＝2066个事件)获得结果的t_off(f)和t_on(g)直方图。平均事件停留时间(τ_off)和平均事件间间隔(τ_on)是根据方程y＝a*exp(-x/τ)从指数拟合结果分别得出的，并且和从三次独立测量(N＝3)结果得出。表11中列出了所有详细的拟合结果。一般情况下，在钙通量存在的情况下，溶菌酶捕获事件出现得更频繁，并且溶菌酶捕获事件的停留时间显著延长。(h-i)使用电中性分析物在MspA中产生电渗流(EOF)的实验证据。左图：用MspA在1.5M KCl/1.5M KCl缓冲液(h)或1.5MKCl/1.0M CaCl₂缓冲液(i)的情况下获得的电流-电压(I-V)曲线。将三甲基-β-CD添加在cis侧。电压从-150mV增加到+150mV。当施加正电位时，特别是在trans侧存在CaCl₂的情况下，可以检测到cis侧的中性分析物三甲基-β-CD，这证实了当施加不对称缓冲液环境时会产生更大的EOF。当电压增加时，捕获频率增加，这表明EOF的方向在正电压下是从cis侧到trans侧。右图：测量配置的示意图。EOF的方向用绿色箭头标记。

图78显示了用MspA纳米孔捕获区分脱辅基肌红蛋白与全肌红蛋白。(a)不含血红素的肌红蛋白(脱辅基肌红蛋白，紫色)和结合血红素的肌红蛋白(全肌红蛋白，红色)的结构示意图。通过PyMOL根据全肌红蛋白(PDB ID:1WLA)的晶体结构生成脱辅基肌红蛋白的结构。(b)脱辅基肌红蛋白(紫色)或全肌红蛋白的捕获示意图。在相应分析物的右侧展示了代表性阻塞事件。使用1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液组合在连续施加的+100mV跨膜电位下进行测量。绿色和蓝色箭头分别标记脱辅基肌红蛋白的阻塞步骤1和2。(c-f)左图：显示了在依次将cis侧血红素终浓度滴定至如每条迹线上方所示的0μM(c)、0.05μM(d)、0.10μM(e)和0.15μM(f)时，脱辅基肌红蛋白状态变化的代表性迹线。右图：阻塞电流标准差(幅度标准差)与阻塞百分比(ΔI/I₀)的对应事件散点图。每个散点图由20分钟连续记录迹线(n＝376(c)、382(d)、497(e)和334(f))的结果生成。将ΔI/I₀相应直方图放置于每个散点图的右侧。观察到事件类型逐渐变化，这是由血红素结合诱导脱辅基肌红蛋白的结构变化引起的。在0.05μM的血红素(d)的情况下，观察到无显著水平波动的事件(用红色三角形标记)。根据肌红蛋白或血红素的传感结果(图86和87)，可以得出结论，这种新型阻塞事件是由全肌红蛋白捕获引起的。在ΔI/I₀的散点图和直方图中，可高度区分由脱辅基肌红蛋白或全肌红蛋白捕获引起的事件，如每个图中以颜色所标记的。进一步添加血红素到0.15μM，使得事件类型从脱辅基肌红蛋白完全转化为全肌红蛋白(f)。

图79显示了ACTR/NCBD复合物捕获的单分子特征。(a)ACTR(橙色)、NCBD(绿色)和由这两种固有非结构化蛋白质(IUP)结构域形成的折叠良好的二元复合物(ACTR/NCBD复合物，橙色和绿色)的示意图。展示了完全展开的ACTR和熔球态NCBD的结构。ACTR/NCBD复合物的结构源于晶体结构(PDB ID:1KBH)。(b)通过MspA捕获随机传感ACTR/NCBD复合物(橙色和绿色)的示意图。通过PyMOL生成MspA和肌红蛋白的图。cis/trans室中的缓冲液分别为1.5MKCl/1.0M CaCl₂(pH＝7.0)。将ACTR、NCBD或复合物添加到cis室中，并在测量期间连续施加+100mV的跨膜电位。(c-e)含有由ACTR(c)、NCBD(d)或ACTR/NCBD复合物(e)捕获引起事件的代表性迹线。固有非结构化蛋白质结构域ACTR或NCBD都可以被MspA独立捕获，从而产生短暂的驻留事件。(e)当两种IUP以等摩尔比混合时，产生了一种新型事件，是由生成带负电荷的ACTR/NCBD复合物所致。在测量期间，ACTR、NCBD和ACTR/NCBD的终浓度为1.28μM。(f)ACTR(左侧)、NCBD(中间)或ACTR/NCBD复合物(右侧)捕获的代表性事件。该事件取自c-e中如相应迹线上箭头所示的迹线。(g-h)ΔI/I₀(g)和τ_off(h)的直方图。该直方图数据从如e所示的相应30分钟连续记录迹线(n＝769个事件)得出。ΔI/I₀平均值从相应的高斯拟合结果得出。τ_off是对直方图进行相应指数拟合得出。统计期间忽略了停留时间<1ms的事件。表11和表12中列出了独立测量(N＝3)的所有详细拟合结果。(i)ACTR/NCBD复合物捕获事件的τ_on倒数与cis侧ACTR/NCBD复合物终浓度的关系图。随着ACTR/NCBD复合物终浓度增加，捕获事件出现得更频繁。误差棒表示独立测量(N＝3)之间的标准差(SD)，结果列于表13中。

图80显示了混合物中pI值不同的四种蛋白质分析物的同时传感。使用1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液组合，连续施加+100mV跨膜电位进行测量。(a)pI值不同的四种代表性蛋白质分析物的结构示意图。还标记了每种蛋白质类型的大小。(b)溶菌酶、全肌红蛋白、ACTR/NCBD复合物或脱辅基肌红蛋白捕获的代表性事件。该事件取自于如图77-79所示的独立测量结果。(c、e、g、i)在将溶菌酶、全肌红蛋白、ACTR/NCBD复合物和脱辅基肌红蛋白顺序添加到cis侧(终浓度分别为0.16、0.35、1.28和0.18μM)时获得的代表性迹线。相应的纳米孔事件在每个相应迹线下方用蓝色(溶菌酶)、红色(全肌红蛋白)、绿色(ACTR/NCBD复合物)和紫色(脱辅基肌红蛋白)柱条标记。不同蛋白质分析物的事件可以清楚地彼此区分。(d、f、h、j)左图：由每种条件(d，n＝511；f，n＝575；h，n＝573；j，n＝542)30分钟连续记录迹线中的事件产生的阻塞百分比(ΔI/I₀)与事件停留时间(t_off)散点图，分别对应于c、e、g、i的情况。中间图：阻塞百分比(ΔI/I₀)与阻塞电流标准差(幅度标准差)的散点图。右图：溶菌酶(蓝色，d)中34.2％、f)中34.5％、h)中34.5％、j)中33.9％)、全肌红蛋白(红色，f)中47.8％、h)中47.9％、j)中47.4％)、ACTR/NCBD复合物(绿色，h)中68.9％、j)中68.8％)和脱辅基肌红蛋白(紫色，j)中51.5％)捕获事件ΔI/I₀的对应直方图。d、f、h、j中如每个拟合峰上标记的ΔI/I₀平均值是从相应的高斯拟合结果得出的。

图81显示了对蛋白质进行机器学习辅助的同时结构分析。(a)训练过程的流程图。收集溶菌酶(n＝785)、全肌红蛋白(holoMB，n＝763)、ACTR/NCBD复合物(ACTR_NABD，n＝673)和脱辅基肌红蛋白(apoMB，n＝701)的阻塞事件以形成训练数据集。从电流阻塞中提取七种事件特征，形成特征矩阵。使用MATLAB的分类学习器工具箱来训练用于分类的监督机器学习模型。评估了一组分类器，包括决策树分类器、判别分析分类器、支持向量机(SVM)分类器、K近邻算法(KNN)分类器、朴素贝叶斯分类器、集成分类器和神经网络分类器。通过10倍交叉验证来评估验证的准确度。袋装树模型是优化模型之一。(b)使用经过训练的袋装树模型进行蛋白质分类的混淆矩阵图。在右侧显示了真阳性率(TPR)和假阴性率(FNR)。(c)平行坐标图。正确分类的点被标记为实线，而错误分类的点则被标记为虚线。所有特征都在事件分类中发挥作用。(d)具有不同训练数据集样品量的学习曲线。当训练数据集中的样品超过860个时，验证准确度达到0.998，验证准确度和训练集的再代入准确度几乎没有变化。学习曲线显示了四次独立测试的平均准确度。(e)预测过程的流程图。当测量混合物中不同的蛋白质分析物时，从原始电流迹线中提取未分类的阻塞事件。将经过训练的袋装树模型应用于预测。(f)用袋装树模型确定不同蛋白质事件的比例。所有事件的获取方式与图80中描述的类似。每次添加新的蛋白质分析物时，预测结果都会报告出现相应蛋白质类型。

图82显示了机器学习辅助识别商业性乳清蛋白粉中的α-乳白蛋白和β-乳球蛋白。(a)训练和预测过程的流程图。将乳清蛋白粉配制成溶液，并添加到cis侧，终浓度为25μg/ml。收集了1000个纳米孔事件，其中109个事件被认定为“其他”事件，因为它们是低含量成分的异常纳米孔事件。分别收集α-乳白蛋白标准品(PDB ID:1F6S，n＝301个事件)、β-乳球蛋白标准品(PDB ID:3BLG，n＝253个事件)和“其他”事件(n＝109个事件)的阻塞事件作为训练数据集。MATLAB的分类学习器工具箱中袋装树模型的验证准确度最高(98.3％)，并且成本最低(11)，用于识别预测样品中的α-乳白蛋白和β-乳球蛋白阻塞事件。其他模型的参数设置和预测结果在图100中列出。(b-d)将α-乳白蛋白添加到cis侧且终浓度为0.21μM时获得的代表性迹线(b)，以及40分钟连续记录迹线(c，n＝644)中事件产生的阻塞百分比(ΔI/I₀)与阻塞电流标准差(幅度标准差)的对应散点图。在d中放大展示了b中棕色和紫色箭头标记的ɑ-乳白蛋白的两种类型代表性阻塞事件。(e-g)将β-乳球蛋白添加到cis侧且终浓度为0.21μM时获得的代表性迹线(e)，以及30分钟连续记录迹线(f，n＝253)中的事件产生的阻塞百分比(ΔI/I₀)与阻塞电流标准差(幅度标准差)的对应散点图。在g中放大展示了e中用红色、粉色和酒红色箭头标记的β-乳球蛋白的两种代表性阻塞事件。(h)乳清蛋白的代表性迹线。(i-j)用袋装树模型确定的乳清蛋白移位事件的散点图(i)和比例(j)(蓝色：ɑ-乳白蛋白。红色：β-乳球蛋白。绿色：其他，n＝333)。51.4％所有获得的事件被认定为β-乳球蛋白事件，39.6％被认定为α-乳白蛋白事件。

图83显示了不同缓冲液组合时MspA中的EOF。(a-c)比较在cis/trans室中缓冲液组合为1.5M KCl/1.0M CaCl₂(a)、1.0M CaCl₂/1.0M CaCl₂(b)或1.5M KCl/1.0M CaCl₂(c)时用MspA获得的电流-电压(I-V)曲线。将三甲基-β-CD作为电中性分析物添加到cis侧，以反映EOF的方向和强度。当ΔV>0时，在KCl/CaCl₂或CaCl₂/CaCl₂缓冲液组合的测量环境中，MspA可以捕获三甲基-β-CD。在KCl/CaCl₂缓冲液组合的情况下观察到的捕获效率最佳。(d-f)在1.5M KCl/1.0M CaCl₂(d)、1.0M CaCl₂/1.0M CaCl₂(e)或1.5M KCl/1.0M CaCl₂(f)缓冲液组合的情况下进行溶菌酶传感的代表性迹线。将溶菌酶添加到cis侧，终浓度为0.42μM。连续施加+100mV的跨膜电位。显然，1.5M KCl/1.0M CaCl₂的缓冲液组合显示出的事件出现率最高。(g)不同电解质组合获得的溶菌酶捕获事件的1/τ_on和τ_off。在1.5M KCl/1.0MCaCl₂的缓冲液组合的情况下，观察到溶菌酶捕获效率最佳，阻塞时间最长。

图84显示MspA内腔内EOF增强情况。(a)八聚体M2 MspA孔内腔内的电荷分布。M2MspA纳米孔结构通过PyMOL软件的突变模块(R96A、D93N、D91N、D90N、D118R、D134R和E139K)从蛋白质数据库(PDB)(1UUN)调整而来。M2 MspA的真空静电情况是通过PyMOL的APBS模块产生的。MspA结构以表面模式呈现，并根据计算的真空静电结果着色(红色表示负电区域，蓝色表示正电区域)。其内腔中与测试缓冲液阳离子具有潜在静电相互作用的典型酸性氨基酸(D32、E39、D56、E57、E59、E63、E127)以球棒模式显示。(b)MspA的正电荷积累和EOF增强示意图。左图：施加正电位时，1.5M KCl/1.5M KCl缓冲液组合中测量配置的示意图。右图：施加正电位时，1.5M KCl/1.0M CaCl₂缓冲液组合中测量配置的示意图。EOF的方向用绿色箭头标记，箭头长度定性地表示EOF的相对强度。在1.5M KCl/1M CaCl₂缓冲液组合的情况下，二价阳离子和MspA之间的强配位相互作用使得正电荷富集在孔内腔内表面上，这进一步增强了EOF。

图85显示了溶菌酶捕获的单分子特征。如实施例8方法1中所述进行所有测量。cis/trans室中的缓冲液分别为1.5M KCl/1.0M CaCl₂(pH＝7.0)。连续施加+100mV的跨膜电位。(a)随机传感典型碱性蛋白质溶菌酶(蓝色)的示意图。该图通过PyMOL根据PDB文件生成。PDB ID：1UUN(MspA)和1DPX(溶菌酶)。将溶菌酶添加到cis室中。(b)含有溶菌酶捕获引起的纳米孔事件的代表性迹线。溶菌酶的终浓度为0.42μM。(c)对应于如b所示的15分钟连续记录迹线的阻塞百分比(ΔI/I₀)直方图。ΔI/I₀平均值从高斯拟合结果得出。(d)溶菌酶捕获事件平均事件间间隔的倒数(1/τ_on)与cis侧溶菌酶终浓度的关系图。随着溶菌酶终浓度增加，捕获事件出现得越来越频繁。(e)在+60mV、+80mV、+100mV或+120mV的施加电压下测量时溶菌酶的代表性捕获事件。(f)τ_off和(e)中捕获事件相对应的施加电压的关系图。d和f中的误差棒表示独立测量(N＝3)之间的标准差。详细结果列于表14中。在施加电压变化的情况下，随着电压不断增加，平均事件停留时间先延长后缩短。这种现象可能是由电泳力(EPF)和电渗流(EOF)在带正电荷的溶菌酶(pI＝11)上竞争引起的。

图86显示了脱辅基肌红蛋白或全肌红蛋白捕获的单分子特征。如实施例8方法1中所述进行所有测量。cis/trans室中的缓冲液为1.5M KCl/1.0M CaCl₂(pH＝7.0)。连续施加+100mV的跨膜电位。(a、b)随机传感脱辅基肌红蛋白(a，紫色)和全肌红蛋白(b，红色)这两种电荷中性蛋白质的示意图。通过PyMOL根据PDB文件生成了MspA和肌红蛋白的结构图。PDBID：1UUN(MspA)和1WLA(全肌红蛋白和脱辅基肌红蛋白)。在如图2d-f所示的相同条件下测量全肌红蛋白。将全肌红蛋白或脱辅基肌红蛋白添加到cis室中。(c、d)含有由脱辅基肌红蛋白(c)或全肌红蛋白(d)捕获引起的纳米孔事件的代表性迹线。全肌红蛋白和脱辅基肌红蛋白的终浓度分别为0.26μM和0.14μM。迹线顶部的蓝色和绿色线分别标记两个剩余电流水平，对应于两个阻塞步骤。步骤2(绿色线)可能与脱辅基肌红蛋白的拉伸状态有关，从而到达孔的更深位置。在所有后续分析中，步骤1(蓝色线)的特征被视为脱辅基肌红蛋白的识别特征。(e、f)对应于如c和d中所示的20分钟连续记录迹线的阻塞百分比(ΔI/I₀)直方图。ΔI/I₀平均值从三次独立测量(N＝3)的高斯拟合结果得出。脱辅基肌红蛋白的值分别为51.3±0.2％和89.1±0.3％；全肌红蛋白的值为47.4±0.2％。所有拟合结果详见表12。(g、h)脱辅基肌红蛋白(g)或全肌红蛋白(h)事件的平均事件间间隔的倒数(1/τ_on)与cis侧分析物终浓度的关系图。g和h中的误差棒表示独立测量(N＝3)之间的标准差。相关结果详见表13。一般来说，随着蛋白质分析物终浓度增加，捕获事件出现得更频繁。

图87显示了血红素作为唯一分析物的测量。(a)测量配置的示意图。如实施例8方法1中所述进行测量。cis/trans室中缓冲液分别为1.5M KCl/1.0M CaCl₂(pH＝7.0)。连续施加+100mV的跨膜电位。血红素示出在虚线框中。(b)在将血红素添加到cis侧且终浓度为0.2μM时的代表性迹线。没有观察到纳米孔事件，证实了血红素单独不会产生任何事件。

图88显示了脱辅基肌红蛋白-血红素复合物(蓝色)、脱辅基肌红蛋白标准品(橙色)和全肌红蛋白标准品(红色)的UV-Vis吸收光谱。将所有组的蛋白质浓度均设定为6μM。通过将脱辅基肌红蛋白和血红素以14:15的摩尔比(与图79中的电生理实验一致)预混合10分钟，然后使用3kDa截止的超滤管纯化获得脱辅基肌红蛋白/血红素复合物。室温下在1.5MKCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)的情况下记录所有溶液光谱。与脱辅基肌红蛋白相比，apo-MB/血红素在410nm处的吸收明显更高，这证实了全肌红蛋白的产生。在相同浓度下，脱辅基肌红蛋白-血红素复合物和全肌红蛋白标准品的吸光度相同，这证实了脱辅基肌红蛋白和全肌红蛋白的有效转化率接近100％。

图89显示了用MspA同时传感脱辅基肌红蛋白和全肌红蛋白。如实施例8方法1中所述进行所有测量。在连续施加+100mV的跨膜电位时，在1.5M KCl/1.0M CaCl₂(pH＝7.0)缓冲液中进行测量。(a)MspA捕获脱辅基肌红蛋白(紫色)或全肌红蛋白(红色)的示意图。(b)同时传感脱辅基肌红蛋白和全肌红蛋白。每种分析物的终浓度分别为0.18μM和0.35μM。上图：同时传感脱辅基肌红蛋白或全肌红蛋白期间的代表性迹线。下图：使用50Hz高通贝塞尔滤波器(8极)进行数字滤波时的相应迹线。根据高频波动的显著差异，可以清楚地彼此区分全肌红蛋白和脱辅基肌红蛋白的事件，分别用红色柱条和紫色柱条标记。(c)如b所示的全息肌红蛋白(左侧)和脱辅基肌红蛋白(中间、右侧)三种代表性事件的放大视图。置于右侧的事件是如图78b所示的代表性2阶跃(2step)事件。(d)从如b所示的20分钟连续记录迹线中的事件(n＝857)产生的阻塞电流标准差(幅度标准差)与阻塞百分比(ΔI/I₀)的散点图。将ΔI/I₀相应直方图置于散点图的顶部和右边距(脱辅基肌红蛋白的ΔI/I₀为50.9％，全肌红蛋白的ΔI/I₀则为47.5％)。

图90显示了不同电压下捕获全肌红蛋白或脱辅基肌红蛋白。在1.5M KCl(cis)/1.0M CaCl₂(trans)，pH＝7.0缓冲液组合的情况下，如实施例8方法1中所述进行所有测量。将全肌红蛋白或脱辅基肌红蛋白添加到cis室中。(a)左图：全肌红蛋白(PDB ID:1WLA)的结构示意图。右图：当施加电压为+60mV、+80mV、+100mV或+120mV时，全肌红蛋白的代表性捕获事件。全肌红蛋白的终浓度为0.26μM。(b)τ_off与施加电压的关系图。b中的误差棒表示独立测量(N＝3)之间的标准差。结果详见表14。一般情况下，在更高的施加电位下，事件停留时间会延长，这表明随着电压增加，在测试溶液(pH＝7)中EPF和EOF对全肌红蛋白的组合作用增强。(c)左图：脱辅基肌红蛋白(PDB ID:1WLA，去除血红素)结构示意图。右图：当施加电压为+60、+80、+100或+120mV时，脱辅基肌红蛋白的代表性捕获事件。脱辅基肌红蛋白的终浓度为0.14μM。(d)τ_off与施加电压的关系图。d中的误差棒表示三次独立测量(N＝3)得出的标准差。详细结果在表14中列出。随着电压增加，阻塞事件的持续时间先延长后缩短。随着施加电压从+100mV增加到120mV时，电泳力(EPF)和电渗流(EOF)在相对带正电荷的脱辅基肌红蛋白(pI＝8.5)上的竞争可能会发生变化。对于溶菌酶(pI＝11)，也观察到τ_off与施加电压类似的现象(图85)。

图91显示了在对称KCl缓冲液中捕获全肌红蛋白或脱辅基肌红蛋白。如实施例方法1中所述进行所有测量。具体地，cis和trans室都填充1.5M KCl缓冲液，pH＝7.0。将蛋白质分析物分别添加到cis侧。连续施加+100mV的跨膜电位。(a)左图：MspA随机传感全肌红蛋白的示意图。PDB ID：1UUN(MspA)和1WLA(全肌红蛋白)。右图：含有全肌红蛋白捕获引起事件的代表性迹线。全肌红蛋白的终浓度为0.26μM。(b-c)t_off(b)和t_on(c)的直方图。t_off和t_on的结果分别从如a所示的20分钟连续记录迹线得出。(d)左图：MspA随机传感脱辅基肌红蛋白的示意图。PDB ID：1UUN(MspA)和1WLA(脱辅基肌红蛋白，去除血红素)。右图：含有脱辅基肌红蛋白捕获引起事件的代表性迹线。脱辅基肌红蛋白的终浓度为0.14μM。(e-f)t_off(e)和t_on(f)的直方图。t_off和t_on的结果分别从如d所示的30分钟连续记录迹线中得出。在b、c、e和f的统计期间，忽略了停留时间<1ms的事件。平均事件停留时间(τ_off)和平均事件间间隔(τ_on)均根据方程y＝a*exp(-x/τ)从指数拟合结果得出，和从三次独立测量(N＝3)得出。表11中列出了详细的拟合结果。与不对称电解质测试环境中获得的相应结果相比，蛋白质分析物的捕获效率显著降低，并且事件停留时间显著缩短。这进一步证明了单价离子和二价离子的结合提高了MspA纳米孔捕获的性能。

图92显示了ACTR肽的制备。制备ACTR肽详见实施例8方法3。(a)构建编码GST-ACTR融合蛋白的质粒。将编码该融合蛋白的基因克隆到pGEX-6P-1质粒中。编码ACTR肽的基因(在序列端具有终止子，蓝色)插入BamHⅠ和XhoⅠ的识别序列之间，紧接在PreScission位点(粉色)之后。当用相应的蛋白酶处理时，所表达蛋白质的PreScission位点是可裂解的。(b)ACTR分离示意图。首先将所表达的融合蛋白GST-ACTR应用于GSTrap^TM色谱柱。该色谱柱进一步应用了在其N-末端上也具有GST标签的PreScission蛋白酶(GST-Prot)。在4℃孵育8h后，ACTR从GST-ACTR融合蛋白中完全分离，用裂解缓冲液洗脱并收集。然而GST部分和PreScission蛋白酶保留在所述色谱柱上。通过用含有谷胱甘肽(GSH)的溶液(洗脱缓冲液B2)洗脱对色谱柱进行再生。丢弃洗脱的GST和GST-Prot。(c)凝胶电泳结果。泳道M：precision plus蛋白质标准品；泳道1-2：含有不经或经IPTG诱导的GST-ACTR质粒的细菌裂解物。相比于泳道1中结果，泳道2中过量条带表示过表达的GST-ACTR；泳道3：细菌裂解物的上清液；泳道4：提取缓冲液A2(PBS)洗涤后的洗脱液；泳道5：所洗脱的ACTR肽(5.5kDa)；泳道6：融合蛋白的所洗脱GST部分和GST-PreScission蛋白酶。与对应于GST-ACTR的条带(标记为绿色)相比，泳道6中下部条带(标记为紫罗兰色)报告的位置在凝胶上略低。这是意料之中的，因为GST(26kDa)的分子量比GST-ACTR的分子量更低。泳道6中的上部条带(标记为棕色)被认定为GST蛋白酶(46kDa)。如泳道5中所表征的ACTR肽直接用于所有下游测量，无须任何进一步纯化。

图93显示了NCBD肽的制备。制备所述NCBD肽在实施例8方法3中详细说明。(a)构建编码所述GST-NCBD融合蛋白的质粒。将编码该融合蛋白的基因克隆到pGEX-6P-1质粒中。将编码NCBD肽的基因(在序列端有蓝色终止子)插入BamHⅠ和XhoⅠ的识别序列之间，紧接在粉色PreScission位点之后。当用相应的蛋白酶处理时，所表达蛋白质的PreScission位点是可裂解的。(b)NCBD分离示意图。首先将所表达的融合蛋白GST-NCBD应用于GSTrap^TM色谱柱。该色谱柱进一步应用了在其N-末端上也具有GST标签的PreScission蛋白酶(GST-Prot)。在4℃孵育8h后，NCBD从GST-NCBD融合蛋白中完全分离，用裂解缓冲液洗脱并收集。然而，GST部分和PreScission蛋白酶保留在色谱柱上。通过用含有谷胱甘肽(GSH)的溶液(洗脱缓冲液B2)洗脱对色谱柱进行再生。丢弃洗脱的GST和GST-Prot。(c)凝胶电泳结果。泳道M：precision plus蛋白质标准品；泳道1-2：含有不经或经IPTG诱导的GST-NCBD质粒的细菌裂解物。相比于泳道1中结果，泳道2中过量条带表示过表达的GST-NCBD；泳道3：所洗脱的NCBD肽(6.9kDa)；泳道4：融合蛋白的所洗脱GST部分和GST-PreScission蛋白酶。与对应GST-NCBD的条带(标记为绿色)相比，泳道4中下部条带(标记为紫色)报告在凝胶上的位置略低。这是意料之中的，因为GST(26kDa)的分子量比GST-NCBD的分子量更低。泳道4中的上部条带(标记为棕色)被认定为GST蛋白酶(46kDa)。如泳道3中所表征的NCBD肽直接用于所有下游测量，无须任何进一步纯化。

图94显示了ACTR或NCBD肽的单分子特征。如实施例8方法1中所述进行所有测量。应用1.5M KCl(cis)/1.0M CaCl₂(trans)，pH＝7.0的缓冲液组合。在钙通量存在的情况下，非结构化ACTR和NCBD都可以分别阻塞MspA纳米孔阱。(a、b)用(a)ACTR或(b)NCBD获得20分钟连续记录迹线(分别如图79c和79d所示)中的事件得出的ΔI/I₀直方图。a和b中ΔI/I₀平均值从相应的高斯拟合结果得出。(c、d)用ACTR(c)或NCBD(d)获得20分钟连续记录迹线(分别如图3c和3d所示)中的事件得出的t_off直方图。从该直方图的相应指数拟合结果得出τ_off。统计期间忽略停留时间＜0.5ms的事件。独立测量(N＝3)的所有拟合结果详见表11和表12。(e、f)捕获事件平均事件间间隔的倒数(1/τ_on)与cis侧ACTR(e)或NCBD(f)终浓度的关系图。e和f中的误差棒表示从三次独立测量(N＝3)得出的标准差。详细结果在表13中列出。一般来说，随着肽终浓度增加，捕获事件出现得更频繁。

图95显示了捕获频率和施加电压之间的相关性。如实施例8方法1中所述进行所有测量。cis/trans室中的缓冲液分别为1.5M KCl/1.0M CaCl₂(pH＝7.0)。将蛋白质分析物分别添加到cis室中。溶菌酶、脱辅基肌红蛋白、全肌红蛋白或ACTR/NCBD复合物的终浓度分别为0.42、0.26、0.14和1.28μM。(a-d)分别对应于溶菌酶(a)、脱辅基肌红蛋白(b)、全肌红蛋白(c)或ACTR/NCBD复合物(d)测量的1/τ_on与施加电压(+60mV、+80mV、+100mV或+120mV)的关系图。a-d中的误差棒表示独立测量(N＝3)之间的标准差。结果详见表14。一般来说，b-d中事件间持续时间的倒数在更高的施加电位下会变大。这表明，随着施加电压增加，脱辅基肌红蛋白/全肌红蛋白和ACTR/NCBD复合物的捕获频率增加。对于溶菌酶，随着电压不断增加，1/τ_on值先增加后略有下降。这可能是由于测试溶液(pH＝7)中溶菌酶带正电荷所致。

图96显示了在对称KCl电解质中捕获ACTR/NCBD复合物。如实施例8方法1中所述进行所有测量。具体地，cis室和trans室都填充1.5M KCl缓冲液，pH＝7.0。将ACTR和NCBD 1:1预混5分钟并添加到cis侧。连续施加+100mV的跨膜电位。(a)左图：MspA随机传感ACTR/NCBD复合物的示意图。PDB ID:1UUN(MspA)和1KBH(ACTR/NCBD复合物)。右图：含有ACTR/NCBD复合物捕获引起的事件的代表性迹线。ACTR/NCBD复合物的终浓度为1.28μM。(b-c)如a所示的20分钟连续记录迹线的t_off(b)和t_on(c)的直方图。在b和c中统计期间，忽略了停留时间<1ms的事件。平均事件停留时间(τ_off)和平均事件间间隔(τ_on)都根据方程y＝a*exp(-x/τ)从指数拟合结果得出，并且和是通过三次独立测量(N＝3)得出的。表11中列出了所有详细的拟合结果。与不对称电解质的相应结果相比，蛋白质分析物的捕获效率显著降低，停留时间也系统性地缩短。这进一步证明了单价离子和二价离子的组合提高了MspA纳米孔捕获的性能。

图97显示了事件特征提取的工作流程。所有纳米孔传感事件首先通过Clampfit10.7中的“单通道研究”功能自动检测。每个事件的事件开始时间(t_start)和事件结束时间(t_end)作为每个事件的时间戳记录在txt文件中。所忽略的持续时间设置为1ms，以排除由分析物与孔瞬时碰撞引起的事件。将Axon abf文件和txt文件导入MATLAB，以提取阻塞电流的特征(实施例8方法1)。使用MATLAB提取包括平均值(mean)、峰度(kurt)、偏度(skew)、停留时间(time)、分布中心值(峰，peak)和噪声(FWHM)在内的七种事件特征，形成特征矩阵。特征矩阵导出为xlsx文件，并应用于使用MATLAB进行机器学习。

图98显示了不同模型的信息。展示了每个模型的验证准确度最佳且成本最低的参数设置。还总结了相应的验证混淆矩阵。使用MATLAB中的分类学习器工具箱对所有模型进行训练，训练数据集含有溶菌酶、脱辅基肌红蛋白、全肌红蛋白和ACTR/NCBD复合物捕获事件的特征矩阵。准确度从10倍交叉验证结果得出。

图99显示了对乳清蛋白进行机器学习分析。使用袋装树模型。(a)训练数据集的散点图。(b)使用经过训练的袋装树模型进行蛋白质分类的混淆矩阵。在右侧显示真阳性率(TPR)和假阴性率(FNR)。(c)袋装树模型的平行坐标图。正确分类的点被标记为实线，而错误分类的点则被标记为虚线。所有特征都在事件分类中发挥作用。(d)具有不同训练数据集样品量的学习曲线。它显示了四次独立测试的平均准确度。当训练数据集中的样品超过375个时，验证准确度和训练集再代入准确度几乎没有变化，这证明用超过375个训练样品训练的分类模型不会出现过拟合。

图100显示了用乳清蛋白评估的机器学习信息。展示了每个分类器的验证准确度最佳且成本最低的模型参数设置。还总结了相应的验证混淆矩阵。使用MATLAB中的分类学习器工具箱对所有模型进行训练，该训练数据集含有α-乳白蛋白、β-乳球蛋白和“其他”事件的特征矩阵。准确度从10倍交叉验证结果得出。

图101显示了纳米孔测量期间乳清蛋白的浓度依赖性。如实施例8方法1中所述进行所有测量。简言之，测量是在1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液中并持续施加+30mV跨膜电位的情况下进行的。(a-d)含有终浓度为0.4μg/ml(a)、2μg/ml(b)、4μg/ml(c)和8μg/ml(d)乳清蛋白引起纳米孔事件的代表性迹线。通过将检测限(LOD)暂定为在5分钟内检测10个有效捕获事件所需的浓度，MspA对乳清蛋白的LOD为～0.4μg/ml。(e)在5分钟测量期间，α-乳白蛋白和β-乳球蛋白捕获事件与cis侧乳清蛋白终浓度的关系图。e中的误差棒表示三次独立测量之间的标准差，每次测量持续时间为5分钟。对于α-乳白蛋白和β-乳球蛋白，捕获事件的计数与乳清蛋白粉终浓度线性相关(R方分别为0.996或0.987)。

图102显示了使用MspA电渗阱随机传感溶菌酶-底物复合物。所有测量都是在1.5MKCl/1.0M CaCl₂(pH＝5.5)缓冲液组合以及连续施加+100mV跨膜电位的情况下进行的。(a)溶菌酶底物n-乙酰壳六糖的结构式。(b)含有溶菌酶捕获引起纳米孔事件的代表性迹线。溶菌酶终浓度为0.21μM。(c)阻塞百分比(ΔI/I₀)与阻塞电流标准差(幅度标准差)的对应事件散点图。该散点图由5分钟连续记录迹线(n＝450)的结果生成。平均阻塞百分比为34.3％。(d)显示在cis侧n-乙酰壳六糖终浓度为0.24μM时溶菌酶状态变化的代表性迹线。观察到事件类型变化，由底物结合诱导溶菌酶结构变化而引起。(e)阻塞百分比(ΔI/I₀)与阻塞电流标准差(幅度标准差)的对应事件散点图。该散点图由5分钟连续记录迹线(n＝557)的结果生成。观察到新的事件群，为42.5％。

具体实施方式

应当理解，本发明不限于所描述的具体实施方案。还应当理解，本文使用的术语仅用于描述具体实施方案，而不具有限制性，因为本发明的范围将仅由所附权利要求书限制。

除非另有定义，否则本文使用的所有技术术语和科学术语的含义与本发明所属领域的普通技术人员通常理解的含义相同。尽管类似于或等同于本文所述方法与材料的任何方法和材料也可用于本发明的实践或测试，但现在描述优选的方法和材料。本文提及的所有出版物都公开并描述了与引用这些出版物相关的方法和/或材料。

在提供数值范围的情况下，除非上下文另有明确规定，否则应当理解下限单位十分之一以内的每个中间值以及该范围上限和下限之间的中间范围都涵盖在本发明内。当所述范围包括一个或两个限值时，本发明也包括排除其中一个或两个限值的范围。

必须注意的是，除非上下文另有明确规定，在本文和所附权利要求书中使用的单数形式“a”、“an”()和“the”包括复数指称。因此，例如，提及“an analyte”包括一种分析物和多种不同的分析物，提及“the molecule”包括提及一种或更多种分子。还应当指出，权利要求书可以撰写成排除任何可选要素。因此，本声明旨在作为在与陈述权利要求要素有关时使用“单独”、“仅”等排他性术语或使用“否定”限制的先行依据。

术语“包含”(comprise)、“包括(include)”、“含有(contain)”和这些术语的变体，例如“comprising”、“comprises”和“comprised”，并不旨在排除进一步的添加物、组分、整数或步骤。这些术语还涵盖“由……组成”(consist of)或“由……组成”(consisting of)的含义。

术语“约”是指等于特定值正负百分之二十(+/-20％)的范围。

术语“和/或”是指由该术语连接的任何一个、任何几个或所有要素。

应当理解，本发明所述的方法可以以体内、体外或离体的方式进行。本发明所述的方法可以不以疾病治疗为目的，和/或不以疾病诊断为目的。

应当理解，为了清楚起见，本发明的某些特征在单独实施方案的情况下进行了描述，但也可以在单个实施方案中以组合的方式提供。相反，为了简洁起见在单个实施方案的语境中描述的本发明的不同特征，也可以单独提供或以任何合适子组合的方式提供。与本发明有关的实施方案的所有组合都具体涵盖在本发明中，并在本文公开，就好像每个组合都是单独和明确公开的一样。此外，各种实施方案及其要素的所有子组合也具体涵盖在本发明中，并在本文进行了公开，就如同每个此类子组合都在本文单独和明确公开的一样。

耻垢分枝杆菌孔蛋白A(Mycobacterium smegmatis porin A，MspA)是一种锥形的生物纳米孔，由刚性的β-桶状结构组成²⁸。先前的报告表明，八聚体形式的纳米孔在极端条件下具有令人难以置信的稳定性和一致性²⁹。其狭窄的缢缩处直径测量值为～1.2nm，在纳米孔测序³⁰或纳米孔力谱³¹的应用方面具有优势。另一方面，本发明人发现，其直径测量值为～4.8nm的大前庭将能够通过纳米孔捕获(nanopore trapping)瞬时容纳原生形式的大型分析物。令人惊讶的是，这一几何优势自最初的报道就被忽略了。

我们在这里提出了一种新的MspA传感模式，称为纳米孔捕获/移位，并报告了通过这种模式可以直接区分结构不同的低分子量(LMW)RNA，例如miRNA、突出端siRNA、平端siRNA、tRNA或5s rRNA。在捕获期间，RNA结构以其折叠形式进行分析。严格来说，不需要移位，也不需要变性剂或样品连接。作为对现有大通道蛋白开发成果的补充，该模式还获得了孔制备效率高、孔自发插入容易、孔组装一致性高、存储时间极长和空间分辨率高等优势(图1和图2)。

耻垢分枝杆菌孔蛋白A(MspA)是一种锥形的生物纳米孔，其开口直径为～4.8nm，缢缩处为～1.2nm。β-桶状缢缩区具有理想的机械刚性，¹⁵⁹可用于在极端pH、温度或洗涤剂环境中保持持续的孔装配的稳定。更重要的是，这种缢缩对于最大限度地减少由孔结构波动引起的测量噪声至关重要。¹⁶⁰鉴于MspA锥形几何形状提供了高空间分辨率，因此它是第一种用于纳米孔测序¹⁶¹以及纳米孔镊应用(采用类似方案)¹⁶²的纳米孔。它的通道电导率大，测量噪声低，因此还能在纳米孔内腔内对单分子化学进行研究。^163,164这些应用的设计得益于其刚性和狭窄的缢缩区，但遗憾的是，自最初报告以来，其大前庭的使用一直被忽视。

在这项工作中，我们描述了一种以前未报道过的传感模式，称为MspA纳米孔捕获(nanopore trapping)，在这种模式中，诸如蛋白质等大型分析物可能会滞留在所述纳米孔前庭中，从那里可以报告传感信息。狭窄的孔缢缩部位不允许蛋白质直接通过所述纳米孔，但可以通过探测自发捕获和随后从所述孔中逃逸来实现对单个分析物的随机传感，从而在单通道记录期间产生随机事件。特征捕获事件可能反映了所述蛋白质的总体大小、电荷、极性和构象变化，对其进行分析可以高分辨率地研究蛋白质构象变化或配体结合的动力学。据我们所知，以前从未报告过MspA对蛋白质进行直接传感。在这种传感场景中，MspA的优势包括由于具有锐变(sharp)而刚性的孔结构，传感分辨率得到了提高；易于制备孔；在极端的测量或储存条件下具有结构稳定性。

钙调蛋白(CaM)是一种结合钙的17kDa信使蛋白，作为概念验证进行了研究。在真核细胞中，野生型CaM(wtCaM)作为Ca²⁺和靶蛋白之间信号转导途径中的关键环节。先前通过小角度X射线散射(SAXS)和3D/4D异核NMR波谱进行的研究已经提供了CaM的精确结构，^165,166并揭示了信号转导途径是通过wtCaM的两步变构实现的。无Ca²⁺的CaM(apo-wtCaM)首先与Ca²⁺配位，形成Ca²⁺结合形式的CaM(Ca-wtCaM)，整体结构从松散柔性形状转变为刚性哑铃形状(图38a和39a)。随后，Ca-wtCaM和靶蛋白(例如M13肽)的结合结构域，形成由疏水相互作用驱动的功能蛋白复合物(M13-Ca-wtCaM)。然后Ca-wtCaM的N-叶(N-lobe)和C-叶(C-lobe)折拢在一起以抓住所述M13肽(图38a和39f)。MspA纳米孔捕获很好地解析了所有这些变构行为，显示出与之前使用固态纳米孔¹⁶⁷或表面等离子体共振显微镜¹⁶⁸的尝试相比，传感分辨率得到了提高。值得注意的是，该策略不需要蛋白质进行去折叠或化学标记。

总之，本发明人发现在MspA前庭中存在分析物期间的阻塞电流模式足以表征分析物或所述分析物与试剂之间的相互作用。在所述分析物移位通过MspA缢缩区期间，不必测量阻塞电流，但也可以将其与所述分析物在前庭中的阻塞电流相结合，以提供一种电流模式，用于表征所述分析物或所述分析物与试剂之间相互作用。这一发现对于检测分子构象以及与分子构象相关的事件或特征(例如，可导致所述分子构象发生变化的事件或特征)尤为重要。

纳米孔

本文中使用的术语“纳米孔”通常是指延伸穿过膜的孔、通道(channel)或通路(passage)，其直径非常小，为纳米量级。纳米孔可能具有的特征宽度或直径量级在0.1纳米(nm)到1000nm之间。有些纳米孔是蛋白质。MspA就是蛋白质纳米孔的实例。

本文中使用的术语“MspA”通常指耻垢分枝杆菌孔蛋白A。野生型MspA序列是本领域技术人员已知的。例如，野生型Msp A序列可以在GenBank中找到，网址是https://www.ncbi.nlm.nih.gov/。在一些实施方案中，所述野生型MspA可以具有以下氨基酸序列：

在一些实施方案中，所述野生型MspA可以由SEQ ID NO:1组成。

MspA的同源物(例如直系同源物或旁系同源物)也可以用作本文所述的纳米孔。如本文定义的术语“同源物”是结构和功能与另一基因相似的基因。同源物与其对应物相比可以具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性。术语“同源物”有时用于指因物种形成事件而分离的基因之间的关系(见“直系同源物”)或因基因复制事件而分离的基因之间的关系(见“旁系同源物”)。术语“直系同源物”指的是不同物种中从共同进化起源进化而来的基因。术语“旁系同源物”指的是通过基因组内复制而相关的基因。MspA旁系同源物实例包括MspB、MspC和MspD。MspA直系同源物实例包括MppA、PorM1、PorM2、PorM1和Mmcs4296。

MspA或MspA同源物的变体也可以用作本文的纳米孔。与野生型MspA或MspA同源物相比，变体可能有一个或更多个氨基酸的添加、取代和/或缺失，或者与相应的野生型MspA或MspA同源物相比，变体可能具有至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的序列同一性，并保留通道(tunnel)形成能力。

本领域技术人员容易理解如何确定两种多肽的同一性。例如，可以在比对两个序列之后计算同一性，从而使同一性处于其最高水平。例如，为了确定两个氨基酸序列或两个核酸的“同一性百分比”，对所述序列进行比对，以实现最佳比较的目的(例如，可以在第一氨基酸或核酸序列的序列中引入间隙，以便与第二氨基酸或核酸序列进行最佳比对)。然后比较相应氨基酸位置或核苷酸位置上的氨基酸残基或核苷酸。当第一序列中一个位置与第二序列中相应位置被相同的氨基酸残基或核苷酸占据时，那么这两个分子在该位置是相同的。所述两个序列之间的同一性百分比可以是所述序列共享的相同位置数量的函数(即，同一性百分数＝相同位置数量/位置总数量(例如，重叠位置)×100)。在一个实施方案中，所述两个序列的长度相同。序列同一性可以通过多种不同的方式和多种算法来确定。为了确定序列同一性，可以使用各种方法和计算机程序(例如BLAST、T-COFFEE、MUCLE、MAFFT等)对序列进行比对，这些方法和程序可在万维网的网站上获得，包括ncbi.nlm.nili.gov/BLAST、ebi.ac.uk/Tools/msa/tcoffee/、ebi.ac.uk/Tools/msa/muscle/、mafft.cbrc.jp/alignment/software/。参见例如Altschul et al.(1990),J.Mol.Bioi.215:403-10。

在一些实施方案中，变体是具有突变(例如在野生型MspA或野生型MspA同源物的缢缩区和/或前庭中的一个或更多个氨基酸的添加、取代和/或缺失)的变体。在一些实施方案中，突变可能发生在野生型MspA或野型MspA同源物周质环(periplasmic loops)的边缘或外部。

在一些实施方案中，与野生型MspA或野生型MspA同源物相比，MspA或MspA同源物的变体在前庭和/或缢缩区中可包含至少一个另外的带正电荷的氨基酸、至少一个另外的带负电荷的氨基酸、至少一个带正电荷较少的氨基酸或至少一个带负电荷较少的氨基酸。

在一些实施方案中，野生型MspA或野生型MspA同源物前庭和/或缢缩区中的一个或更多个带正电荷的氨基酸被带负电荷的氨基酸取代，并且每个带负电荷的氨基酸相同或不同；或者野生型MspA或野生型MspA同源物前庭和/或缢缩区中的一个或更多个带负电荷的氨基酸被带正电荷的氨基酸取代，并且每个带正电荷的氨基酸相同或不同。

在一些实施方案中，MspA或MspA同源物的变体的前庭和/或缢缩区比野生型MspA或者野生型MspA同源物包含更多数量的带正电荷的残基，或者所述前庭和/或者缢缩区比野生型MspA或野生型MspA同源物包含更多数量的带负电荷的残基；或野生型MspA或野生型MspA同源物的前庭和/或缢缩区中的至少一个带正电荷的氨基酸缺失或被带负电荷的氨基酸取代；或者野生型MspA或野生型MspA同源物的前庭和/或缢缩区中的至少一个带负电荷的氨基酸缺失或被带正电荷的氨基酸取代。

在一些实施方案中，MspA的变体可以包含(i)突变，使得氨基酸位置90、91和93含有带中性电荷的氨基酸，以及(ii)在以下氨基酸位置的一个或更多个突变：88、105、108、118、126、134、138或139。在一些实施方案中，与野生型MspA相比，变体MspA可包含D90N/D91N/D93N或D93N/D91N/D90N/D118R/D134R/E139K的突变。D90N/D91N/D93N或D93N/D91N/D90N/D118R/D134R/E139K意味着所述突变体同时包含所有列出的六个突变。在一些实施方案中，与所述野生型MspA相比，MspA的变体可能仅具有D90N/D91N/D93N(M1 MspA)或D93N/D91N/D90N/D118R/D134R/E139K(M2 MspA)的突变。本文使用的数字标识定点突变位点的位置，其中紧接在起始密码子之后的第一氨基酸被定义为1。

在本发明中，MspA、MspA同源物或其变体可以是重组蛋白。

优选地，本发明中使用的MspA、MspA同源物或其变体即使在150mV-200mV或更高的电位时也不会自发门控。“门控(to gate或gating”是指蛋白质通道的电导自发变化，这种变化通常是暂时的(例如，持续时间少则1-10毫秒，多则一秒)。对于一些蛋白质纳米孔，门控的概率随着施加更高的电压而增加。通常，所述蛋白质在门控期间不那么导电，因此电导可能永久停止(即所述通道可能永久关闭)，因此该过程是不可逆的。可选地，门控是指蛋白质通道电导自发地改变为小于开孔态电流的75％。

本文讨论的MspA、MspA同源物或其变体可以包含长度为约2至约6nm、直径为约2至约6nm的前庭，以及长度为约0.3至约3nm、直径为0.3至约3nm的缢缩区，其中所述前庭和所述缢缩区一起限定通道。

“前庭”是指MspA、MspA同源物或其变体内部的锥形部分，其直径通常沿着中心轴线从一端到另一端减小，所述前庭的最窄部分连接到所述缢缩区。

当提到所述前庭的直径时，可以理解的是，因为所述前庭的形状是锥形，所以直径沿着中心轴线的路径变化，其中一端的直径大于另一端的直径。直径的范围可以是约2nm至约6nm。当本文提到“直径”时，可以通过测量中心到中心的距离或原子表面到表面的距离来确定直径。

就直径而言，“缢缩区”是指MspA、MspA同源物或其变体的通道中与所述前庭相连的最窄部分。

如本领域技术人员所知，MspA纳米孔可以包含两个或更多个MspA单体(例如，八个单体)，它们彼此结合并形成通道，其中每个单体可以相同或不同。MspA纳米孔可以是八聚体MspA。如本文所用的所述MspA、MspA同源物或其变体应当能够形成纳米孔。形成所述MspA孔蛋白的任何一个MspA单体可以选自由MspA、MspA同源物及其变体组成的组。在一些实施方案中，MspA纳米孔中的所有单体是相同的，例如MspA单体的相同变体。在一些实施方案中，MspA纳米孔可以含有MspA单体的一种或更多种变体。在一些实施方案中，MspA纳米孔中的所有单体是相同或不同的MspA单体变体。

MspA、MspA同源物或其变体的制备方法为本领域技术人员所熟知，例如，它可以通过原核生物表达制备，并易于通过色谱法纯化。

除非另有说明，在以下“纳米孔系统”、“表征分析物或分析物与试剂之间的相互作用”和“分析物和试剂”的详细描述中，“MspA”表示MspA、MspA同源物或其变体。

纳米孔系统

纳米孔系统通常包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的纳米孔。所述纳米孔的通道是所述第一导电液体介质和所述第二导电液体介质连通的唯一路径。一般来说，将分析物添加到所述第一导电液体介质和所述第二导电液体介质的至少一种中。所述膜可以是有机膜(例如脂质双层)，或者合成膜(例如由聚合物材料形成的膜)。所述纳米孔延伸穿过的膜的厚度范围可以是1nm到约10μm。

纳米孔系统的制备方法是众所周知的，例如，当将孔蛋白(例如MspA)放置在由膜(例如脂质双层)隔开的第一导电液体介质和第二导电液体介质的任一种中时，所述蛋白质可以自发地插入所述膜中，从而形成纳米孔。

当在所述第一导电液体介质和所述第二导电液体介质之间施加电位差(即，在所述纳米孔上施加电场或电压)时，产生通过所述纳米孔通道的离子电流，并且所述分析物可以从所述导电液体介质被电泳驱动到所述纳米孔中，并且继续在从所述纳米孔一侧到另一侧的方向上电泳移动。所述电位差可以是不低于50mV、不低于100mV、不低于150mV或不低于200mV；或范围是约50mV至200mV，范围是约100mV至200mV，范围是约150mV至200mV。带正电荷的分析物电泳移动到电位较低的一侧。带负电荷的分析物电泳移动到电位较高的一侧。所述分析物的移动方向可以通过调节电场来控制。在一些情况下，所述分析物的电荷取决于所述介质的pH，例如，当所述分析物是蛋白质时，还可以通过调节所述导电液体介质的pH来控制所述分析物移动方向。所述分析物也可以通过非电泳手段驱动。在一些实施方案中，MspA缢缩区一侧的电位高于MspA前庭一侧的电位。在一些实施方案中，将所述分析物从所述导电液体介质电泳驱动到MspA前庭中，并继续在从所述纳米孔前庭到所述缢缩区的方向上电泳移动。

在一些实施方案中，所述第一导电液体介质和所述第二导电液体介质之间的电位差变化或保持恒定。向纳米孔施加电场的工艺和设备是本领域技术人员已知的。例如，一对电极可以用于向纳米孔施电场。能够理解的是，可使用的电压范围可以取决于纳米孔系统的类型和所使用的分析物。

所述分析物进入所述纳米孔(例如所述前庭或缢缩区中)会导致离子电流阻塞，这种阻塞是可测量的，例如可通过测量所述分析物进入所述纳米孔后的电流并将其与开孔电流进行比较来测量。

一般来说，“离子电流的阻塞”也可以称为“阻塞电流”，这可以通过离子电流的变化得到证实，该变化与噪声波动明显可区分，并且通常与所述纳米孔内存在分析物分子相关联。阻塞强度或电流变化将取决于所述分析物的特征。更具体地说，“阻塞”可以指离子电流下降到比未阻塞电流水平低约5-100％的水平，保持一段时间，并自发恢复到未阻塞水平的间隔。例如，所述阻塞电流水平可以比未阻塞电流水平低约、至少约，或最多约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％。阻塞可以称为阻塞事件或事件。

通过纳米孔的电流的测量在本领域中是众所周知的技术，并且可以通过光学信号或电流信号进行。例如，可以使用一个或更多个测量电极来测量通过所述纳米孔的电流。例如，这些电极可以是膜片钳放大器或数据采集设备。

“液体介质”包括水性、有机-水性和纯有机液体介质。有机介质包括例如甲醇、乙醇、二甲基亚砜及它们的混合物。可用于本文所述方法的液体在本领域中是众所周知的。美国专利号7,189,503中提供了此类介质(包括导电液体介质)描述和实例，该专利全部内容通过引用入本文。盐、去垢剂或缓冲剂可以添加到此类介质中。此类试剂可用于改变所述液体介质的pH或离子强度。由于本发明所述的方法不需要使所述分析物移位通过所述纳米孔，因此所述液体介质不需要包括速度改变剂，例如甘油或各种聚合物(例如，聚乙烯吡咯烷酮、聚乙二醇、聚乙烯醇、纤维素聚合物)及它们的混合物，以增加或降低分析物的速度。例如，在本发明中，所述第一导电液体介质和所述第二导电液体介质可以独立地为包含碱金属离子(例如KCl)的缓冲液。缓冲剂可以是HEPES或Tris等。所述第一导电液体介质和/或所述第二导电液体介质的pH可以是1.0-13.0，优选6.0-8.0，优选7.0-7.5，这可以取决于所述分析物的所需电荷性质。在一些实施方案中，KCl的浓度为1.5M KCl。

在一些实施方案中，所述纳米孔系统包括对称缓冲液组合或不对称缓冲液组合。对称缓冲液组合意味着所述第一导电液体介质和所述第二导电液体介质是相同的。不对称缓冲液组合意味着所述第一导电液体介质和所述第二导电液体介质不同。不对称缓冲液组合可以促进所述分析物进入所述纳米孔。在所述不对称缓冲液组合中，所述第一导电液体介质和所述第二导电液体介质的一种包含单价阳离子，优选碱金属离子，更优选地选自K⁺、Na⁺和Li⁺，另一种包含二价阳离子，优选碱土金属离子，优选地选自Ca²⁺、Mn²⁺、Mg²⁺和Ba²⁺。优选地，包含单价阳离子的所述液体介质不包含二价阳离子。

尽管不希望受到理论的约束，但我们认为，所述不对称缓冲液组合的益处应该来源于由二价阳离子(例如碱土金属离子，例如Ca²⁺、Mn²⁺、Mg²⁺和Ba²⁺)与所述孔内腔中氨基酸残基之间的配位相互作用引起的电渗流增加。

所述不对称缓冲液对于同时分析或顺序分析多种不同分析物特别有用。这些分析物可能具有不同的电荷，并在电泳力的作用下在不同的方向上移动。然而，在所述不对称缓冲液中，由于电渗流的影响，电荷不同的所述分析物都可以在一个方向上移动，从而能够同时或顺序地分析它们。

在一些实施方案中，MspA前庭侧的导电液体介质包含单价阳离子，而MspA缢缩区侧的导电液体介质包含二价阳离子。在一些实施方案中，MspA缢缩区一侧的电位高于MspA前庭一侧的电位，并且电渗流的方向是从MspA前庭到缢缩区。

分析物或分析物与试剂之间的相互作用的表征

对于具有一定构象的分析物，例如具有二级结构、三级结构或三维结构的分析物来说，由于其尺寸，它们通常无法在保持构象的情况下移位通过MspA缢缩区，。在传统的MspA纳米孔检测方法中，这种分析物需要通过另外手段展开或解链，以成为线性单链，从而移位通过所述纳米孔。

本发明人发现，只要所述分析物进入MspA前庭，即使它没有移位通过所述纳米孔的缢缩区，也可以产生足以区分不同分析物的阻塞信息。由于MspA前庭足够大，所述分析物可以以其初始构象进入所述前庭。因此，含有所述分析物处于MspA前庭内期间测量的离子电流的电流模式，可以用于区分不同构象的分析物。本发明所述的方法不需要事先对所述分析物进行化学处理或扩增。所述分析物不需要变性(例如展开或解链)或连接到分子马达。

可以通过在一段时间测量通过纳米孔的离子电流来提供电流模式，在此期间，所述分析物可以进入并停留在MspA前庭中和/或继续展开或解链并移动通过所述缢缩区。如本文使用的“一段时间”足够长，使得所述电流模式含有至少一个完整的事件。

一些分析物，例如具有平端的蛋白质或核酸双链体，很难在电场中展开。它们在电泳力和/或电渗流的作用下进入MspA前庭，并沿着从所述前庭到所述缢缩区的方向移动，但由于其大小而被阻塞在所述缢缩区之外，从而被捕获(或滞留)在所述前庭中。在这种情况下，所述第一导电液体介质和所述第二导电液体介质之间的电位差越大，所述分析物进入所述纳米孔的深度就越深，它甚至可以到达所述前庭和所述缢缩区之间的连接处，并滞留在那里。此时，阻塞幅度最大，阻塞信号最强，分辨率也最高。因此，可以通过增加电位差来提高分辨率，电位差可以等于或大于50mV，等于或大于100mV，等于或大于150mV或等于或大于200mV。在所述前庭中存在所述分析物期间测量的离子电流可以提供关于所述分析物初始构象的信息，该信息可以与所述分析物的多个方面有关，例如身份、序列、类型、与试剂的相互作用等，或它们的任何组合。

测量完成后，可以施加反向电压以驱动所述分析物沿着相反方向(即，从所述缢缩区到所述前庭的方向)上移动并离开所述纳米孔。然后，再次改变电压方向，并且可以进行下一次测量。在下一次测量中，可以测量不同的分析物或不同的相互作用。因此，本发明所述的方法可以重复使用相同的纳米孔系统进行多次检测。

其他一些分析物，例如具有突出端的核酸(例如tRNA、sRNA或具有突出端的核酸双链体)，虽然不能以其初始构象移位通过MspA缢缩区，但可以在电场的作用下展开或解链，形成线性单链，其可以移位通过MspA缢缩区。在这种情况下，仅含有在所述分析物处于MspA前庭内期间测量的离子电流的电流模式，或者含有在所述分析物处于MspA前庭内期间测量的离子电流以及在展开或解链的分析物移位通过所述缢缩区期间测量的离子电流的电流模式，可以用于表征所述分析物或所述分析物与试剂之间的相互作用。在所述分析物处于所述前庭内期间测量的离子电流可以提供的信息，不同于在所展开或解链的分析物移位通过所述缢缩区期间测量的离子电流的信息，例如，在所述分析物存在于所述前庭内期间测量的离子电流可以提供关于所述分析物初始构象的信息，其可以与所述分析物的多个方面相关联，例如身份、序列、类型、与试剂的相互作用等，或它们的任何组合。

至少含有在所述分析物处于MspA前庭内期间测量的离子电流的电流模式可用于表征所述分析物本身以及所述分析物与试剂之间的相互作用。可以理解的是，可用于表征所述分析物本身以及所述分析物与试剂之间的相互作用的电流模式可以是仅含有在所述分析物处于MspA前庭内期间测量的离子电流的电流模式，或者含有在所述分析物处于MspA前庭内期间测量的离子电流以及在其他阶段(例如在所展开或解链的分析物移位通过所述缢缩区期间)测量的离子电流的电流模式。所需的电流模式(例如，仅含有在所述分析物处于MspA前庭内期间测量的离子电流的电流模式)可以在一段时间内从电流记录中提取，例如，根据电流迹线的特征(例如，阻塞幅度等)提取。本领域技术人员知道如何区分在不同阶段(例如在所述分析物处于MspA前庭内期间或在所述分析物移位通过MspA缢缩区期间)测量的离子电流。例如，在所述分析物处于所述前庭内期间离子电流迹线的阻塞幅度通常比在所展开或解链的分析物移位通过所述缢缩区期间离子电流迹线的阻塞幅度浅(这意味着更高的电流水平)。

当要表征所述分析物本身时，可以将所述分析物添加到所述第一导电液体介质和所述第二导电液体介质的任何一个中，优选添加到MspA前庭侧的导电液体介质中，使得所述分析物可以在电泳力和/或电渗流的作用下从所述导电液体介质进入MspA前庭。当要表征所述分析物本身时，优选地，在不存在能够与所述分析物相互作用的任何试剂的情况下测量电流。

当要表征分析物与试剂之间的相互作用时，所述相互作用可以是所述分析物和所述试剂的结合或解离。所述分析物可以是具有构象的任何分子，包括核酸、蛋白质、多糖、聚合物、酶等。所述试剂可以是能够与所述分析物相互作用(例如结合)的任何物质。所述试剂的实例包括离子、小分子、配体、受体、酶的底物等。优选地，所述试剂的大小使其自由通过MspA缢缩区。

当要表征分析物与试剂之间的相互作用时，将所述分析物和所述试剂都添加到所述第一导电液体介质和所述第二导电液体介质的任何一种中，使得所述分析物可以在电泳力和/或电渗流的作用下从所述导电液体介质进入MspA前庭，并且可以接触所述试剂。优选地，将所述分析物添加到MspA前庭侧的导电液体介质中，使得所述分析物可以在电泳力和/或电渗流的作用下从所述导电液体介质进入MspA前庭。可以将所述试剂添加在与所述分析物同一侧的导电液体介质中，或者可以添加在所述分析物相对侧的导电流体介质中，或可以添加在两侧的导电液体介质中。例如，将所述分析物添加到所述第一导电液体介质中，并且将所述试剂添加到所述第一导电液体介质、所述第二导电液体介质或两者中。所述分析物和所述试剂可以同时或顺序地添加到所述导电液体介质中。可以首先使所述分析物与所述试剂在所述导电液体介质中接触，然后可以施加电场以将所述分析物驱动到MspA前庭中，或者可以首先将所述分析物驱动到MspA前庭中，然后添加所述试剂以接触所述分析物。

本文中使用的电流模式和电流迹线可以互换使用，指的是随时间变化的离子电流。电流模式可以含有一种或更多种类型的阻塞事件，并且可以含有一个或更多个相同类型的单个阻塞事件。可以从所述电流模式中得知关于所述阻塞事件的分布、频率、幅度等特征。

本文中使用的“事件”是指分析物阻塞纳米孔(即离子电流下降到比未阻塞电流水平低约5-100％的水平，保持一段时间，并自发恢复到未阻塞水平的间隔)，也指由阻塞引起的电流变化。本领域技术人员知道如何确定事件的发生。

可以从所述电流模式中获得各种特征参数。所述特征参数包括但不限于单个事件的特征，例如单个事件的第一阻塞幅度(第一I_b，也称为第一电流水平位置)、第二阻塞幅度(第二I_b，也称为第二电流水平位置)、停留时间(t_off)、噪声电流水平、最小电流、最大电流、中值电流、平均电流、标准差、峰度和偏度。所述特征参数还可以包括事件频率，事件频率是相同类型事件发生的频率。所述特征参数还可以包括其他特征，例如阻塞率(ΔI/I₀，其中ΔI＝I₀-I_b，或％I_b，定义为(I_o-I_b)/I_o)、捕获频率(k_on，如方程1/τ_on＝k_on·c所定义，用于评估当应用不同分析物时纳米孔捕获的能力)；事件间持续时间(t_on)、阻塞电流分布和开孔电流(I_o)。这些特征参数中的一种或更多种可用于表征分析物或分析物与试剂之间的相互作用。在一些实施方案中，阻塞幅度(例如第一阻塞幅度和第二阻塞幅度)可用于表征分析物或分析物与试剂之间的相互作用，例如所述分析物的身份和/或所述试剂的身份。在一些实施方案中，事件频率可用于表征分析物或分析物与试剂之间的相互作用，例如所述分析物的量(或含量)，其中事件频率越高，所述分析物含量越高。

分析物、试剂或分析物与试剂之间的相互作用的表征可以包括将电流模式与所述分析物、所述试剂的至少一种特征、所述分析物与试剂之间的相互作用相关联，例如，基于电流模式的特征(例如上述特征参数)。因此，所述分析物、所述试剂的至少一种特征或所述分析物与试剂之间的相互作用可以基于所述电流模式来确定。一般来说，所述特征或所述分析物和试剂之间的相互作用赋予所述分析物特定构象，其对应于通过所述纳米孔的特定电流模式。换言之，在所述特征上不同的分析物或试剂，或所述分析物和所述试剂的不同组合将具有不同的构象，其对应于通过所述纳米孔的不同电流模式，使得不同分析物或试剂或分析物与所述试剂的不同组合可以通过它们各自的电流模式来区分。

所述分析物或所述试剂的特征可以是与所述分析物或所述试剂构象有关的任何特征，包括但不限于存在或不存在所述分析物或所述试剂，所述分析物或所述试剂的身份，所述分析物和所述试剂的序列，所述分析物或所述试剂中的突变(例如突变核苷酸或突变氨基酸的数量、位置或身份)，所述分析物或所述试剂的构象，所述分析物和所述试剂的二级结构、三级结构或局部结构(例如核酸的端结构，可以是突出端或平端)，所述分析物和所述试剂的含量，所述分析物或所述试剂的总体大小，所述分析物或所述试剂的电荷，所述分析物和所述试剂的极性。“所述分析物或所述试剂的身份”是指所述分析物或所述试剂的区别特征。所述分析物或所述试剂的身份可以是一组物质的区别特征，这组物质在区别特征方面是相同的，并且可以通过构象与其他组物质区分开来。身份可以是单个物质的区别特征。例如，分析物或所述试剂的身份可以指所述分析物是核酸、蛋白质、多糖、聚合物或酶。RNA分析物的身份可以指所述RNA分析物是tRNA、siRNA、5S rRNA、16S rRNA、18S rRNA或23SrRNA。蛋白质分析物或试剂的身份可以指所述蛋白质是一种特异性蛋白质，可以通过构象与其他特异性蛋白质区分开来。

“将所述电流模式与分析物、试剂的至少一种特征或所述分析物与试剂之间的相互作用相关联”可以通过多种方式实现，这对本领域技术人员来说是已知的。例如，分析物、试剂的至少一种特征或所述分析物与试剂之间的相互作用可以通过测试电流模式的特征，或通过将测试电流模式与参考电流模式进行比较或通过机器学习来确定。

本文所用的测试电流模式是指通过使用所测试分析物和/或所测试试剂获得的电流模式。所测试分析物和所测试试剂是指待表征的分析物或待表征的相互作用涉及的分析物和试剂。

参考电流模式是指用作参考以确定所述分析物的至少一种特征或所述分析物与试剂之间的相互作用的电流模式。根据检测的目的，可以使用不同的参考电流模式。例如，参考电流模式可以是在与测试电流模式相同的条件下使用已知分析物和/或已知试剂获得的电流模式。所述已知分析物和所述已知试剂分别称为参考分析物和参考试剂。可以通过比较来确定所测试分析物是否与参考分析物相同或不同，所测试试剂是否与参考试剂相同或不同以及差异如何。还可以确定所测试分析物和所测试试剂之间的相互作用是否与参考分析物和参考试剂之间的相互作用相同或不同，以及差异如何。在所测试分析物与参考分析物相同的情况下，可以确定所测试试剂与参考试剂是相同还是不同，以及差异如何。在所测试试剂与参考试剂相同的情况下，可以确定所测试分析物与参考分析物是相同还是不相同，以及差异是如何的。

参考模式可以含有一种或更多种类型的阻塞事件，并且可以含有一个或更多个相同类型的单个阻塞事件。当比较所述测试电流模式和参考电流模式时，可以将所述测试电流模式中的一个阻塞事件和参考电流模式中的一个阻塞事件进行比较，或者将测试电流模式中多个阻塞事件与参考电流模式中多个阻塞事件进行比较，并且确定测试电流模式和参考电流模式是相同还是不同。当比较测试电流模式和参考电流模式时，从测试电流模式获得的一个或更多个上述特征参数与从参考电流模式获取的一个或更多个上述特征参数相比较。本领域技术人员知道如何将测试电流模式与参考电流模式进行比较，以及如何确定它们相同还是不同。

所述比较可以反映是否存在参考分析物与所测试分析物的差异和/或参考试剂与所测试试剂的差异，该差异使得分析物构象变化。所述比较还可以反映参考分析物和所测试分析物之间的差异和/或参考试剂和所测试试剂之间的差异是否会引起分析物构象变化。在一些实施方案中，为了表征分析物与试剂之间的相互作用，在没有所述试剂的情况下通过测量通过蛋白质纳米孔的离子电流来获得参考电流模式。

“将所述电流模式与所述分析物的至少一种特征或所述分析物与试剂之间的相互作用相关联”可以通过使用机器学习算法来实现。在一些实施方案中，通过使用机器学习算法执行的步骤包含：将所述测试电流模式分割成单独、未分类的事件；从所述事件中提取事件特征；将所述事件特征输入分类器模型中；基于所述分类器模型中每个所述事件的事件特征来预测每个所述事件的身份；以及输出所述分类器模型的预测结果。所述分析物的特征或所述分析物与所述试剂的相互作用可以通过每个所述事件的特性来确定。

在一些实施方案中，所述分类器模型通过以下方式进行训练：分割已知事件的电流模式以生成离散的纳米孔事件，作为身份已知的训练事件；从所述训练事件中提取事件特征；以及基于所述训练事件的事件特征和所述训练事件的已知身份来建立所述分类器模型。

在一些实施方案中，基于所述训练事件的事件特征和所述训练事件的已知身份来建立所述分类器模型的步骤还包含：将所述训练事件的事件特征输入所述分类器模型中；预测所述分类器模型中每个所述训练事件的身份；以及基于所述训练事件的已知身份调整所述分类器模型的参数，使得预测结果与所述训练事件的已知身份一致。

在一些实施方案中，调整所述分类器模型参数的步骤还包含基于从所述训练事件得出的验证数据集来微调所述分类器模型的参数。

在一些实施方案中，所述分类器模型是从以下分类器之一中选择和建立的：分类与回归树(CART)、Xgboost、随机森林、KNN和梯度提升。

事件特征可以是可以从事件的电流模式中学习的任何特征。优选地，所述事件特征是特异于所述事件的。所述事件特征可以包括可以从事件的电流模式获得的各种特征参数，优选地，所述事件特征可以包括从如上所述的特征参数中选择的一种或更多种特征。例如，所述事件特征可以包括单个事件的第一阻塞幅度(第一I_b，也称为第一电流水平位置)、第二阻塞幅度(第二I_b，也称为第二电流水平位置)、停留时间(t_off)、噪声电流水平、最小电流、最大电流、中值电流、平均电流、标准差、峰度和偏度的一种或更多种或全部。

本文中使用的“事件身份”是指所述事件的独特特征，可能包含所述分析物和/或所述试剂的信息。

本发明所述的方法可用于确定分析物的各种特征和/或各种分析物与各种试剂之间的相互作用，因此可用于各种应用中。本发明所述的方法不仅可以用于表征单个分析物，还可以用于同时表征多种不同的分析物或多种不同的相互作用。可以将多种不同的分析物和/或多种不同的试剂一起添加到所述导电液体介质中，并且可以将通过记录一段时间内离子电流而提供的电流模式与所述多种不同分析物中每一种的特征相关联，与所述多种不同分析物中每种分析物和所述多种不同试剂中每种试剂之间的相互作用相关联。在一些实施方案中，可以将多种不同的分析物和一种试剂一起添加到所述导电液体介质中，并且可以将通过记录一段时间内离子电流而提供的电流模式与所述多种不同分析物中每种分析物与所述一种试剂之间的相互作用相关联。在一些实施方案中，可以将一种分析物和多种不同的试剂一起添加到所述导电液体介质中，并且可以将通过记录一段时间内离子电流而提供的电流模式与多种不同试剂中每种试剂与所述一种分析物之间的相互作用相关联。

在不同的应用中，根据不同的目的，可以选择不同的分析物、不同的试剂、不同的参考分析物和/或参考试剂。当使用机器学习算法时，在不同的应用中，可以选择不同的事件特征来训练所述分类器模型。

本发明人发现不同类型RNA的构象可以通过MspA前庭来区分。因此，在一些实施方案中，例如，所述方法可用于确定分析物是否属于特定的RNA类型，例如tRNA、siRNA、rRNA(例如5S rRNA、16S rRNA、18S rRNA和23S rRNA)。测试电流模式可以至少从所述分析物处于MspA前庭内期间测量的离子电流获得，优选地不添加任何能够与所述分析物相互作用并改变所述分析物构象的试剂。参考电流模式可以通过使用一种或更多种特定RNA类型作为参考分析物来获得。当测试电流模式与参考电流模式相同时，确定所述分析物属于所述参考分析物的特定RNA类型。当测试电流模式与参考电流模式不同时，可以确定所述分析物不属于所述参考分析物的特定RNA类型。

本发明人发现具有突出端的核酸双链体与具有相同双链体序列或双链体长度和平端的核酸双链体的构象可以通过MspA前庭来区分。因此，在一些实施方案中，例如，所述方法用于确定核酸双链体是具有突出端还是平端，其中所述核酸双链可以是由两个RNA序列组成的双链体，由两个DNA序列组成的双链体，或由DNA、RNA和其他核酸类似物的序列中任意两种组成的杂交双链体。所述核酸双链体可以是siRNA。所述测试电流模式可以至少从所述分析物处于MspA前庭内期间测量的离子电流获得，优选地不添加任何能够与所述分析物相互作用并改变所述分析物构象的试剂。所述参考电流模式可以通过使用具有突出端或平端的核酸双链体作为参考分析物来获得。优选地，所述参考分析物具有与所述测试分析物相同的双链体序列或双链体长度。当所述测试电流模式与所述参考电流模式相同时，确定所述分析物具有与所述参考分析物相同端类型。

在一些实施方案中，例如，所述方法可用于在一次测量中识别多种不同的分析物，例如，识别多种不同蛋白质或例如在低分子量(LMW)RNA分析中识别多种不同RNA的类型。可以通过将所述多种不同的分析物添加到所述第一或第二导电液体介质中，并在一段时间(例如20s)内记录通过所述纳米孔的离子电流来获得所述测试电流模式。通过分别将所述测试电流模式与多个参考电流模式进行比较，或者通过使用机器学习算法来确定所述分析物的身份。

在一些实施方案中，所述方法可用于检测样品中的所述分析物。无须从所述样品中纯化所述分析物。可以直接将所述样品添加到所述第一导电液体介质和所述第二导电液体介质中。

在一些实施方案中，所述方法可用于检测样品中是否存在感兴趣的分析物。可以通过将所述样品添加到所述第一或第二导电液体介质中，并在一段时间内记录通过所述纳米孔的离子电流来获得测试电流模式。参考电流模式可以通过使用所述感兴趣的分析物作为参考分析物来获得，并且所述参考电流模式至少包含在所述参考分析物处于MspA前庭内期间测量的离子电流。在所述参考电流模式中出现与由所述参考分析物引起事件相同的事件，表明所述样品中存在所述感兴趣的分析物。在所述参考电流模式中不存在与由所述参考分析物引起事件相同的事件，表明所述样品中不存在所述感兴趣的分析物。

在一些实施方案中，所述方法可用于检测感兴趣的分析物在样品中的含量。可以通过将所述样品添加到所述第一或第二导电液体介质中，并在一段时间内记录通过所述纳米孔的离子电流来获得所述测试电流模式。所述参考电流模式可以通过使用特定含量的所述感兴趣的分析物作为参考分析物获得，并且参考电流模式至少包含在所述参考分析物处于MspA前庭内期间测量的离子电流。比较所述测试电流模式和所述参考电流模式之间的事件频率，表明所述感兴趣的分析物在样品中的含量。事件频率越高表明含量越高，事件频率越低则表明含量越低。所述感兴趣的分析物在样品中的含量也可以例如通过本领域已知的方法进行量化。

在一些实施方案中，靶分子，例如，不具有构象或尺寸太小以致可以容易地通过MspA缢缩区而不解链或展开的靶分子，可以与辅助分子结合以形成测试复合物。所述靶分子可以以不同的方式与其他分子结合，例如共价键、氢键、范德华力等，使得所述测试复合物满足本发明的分析物标准，即具有的构象使得所述分析物容纳在MspA前庭中，但是防止所述分析物进入MspA缢缩区并移位通过所述缢缩区。在本发明所述的方法中使用这种复合物作为测试分析物能够对所述靶分子进行表征。例如，在本发明所述方法中使用这种复合物作为测试分析物能够测定所述靶分子的一种或更多种特征。所述一种或更多种特征使得所述测试复合物具有可由MspA前庭检测到的特定构象。例如，通过使用由参考分子和与参考分析物相同的辅助分子组合形成的参考复合物，可以确定所述靶分子和所述参考分子之间的差异，因此可以表征所述靶分子。所述靶分子和所述参考分子之间的差异导致了所述测试复合物和所述参考复合物之间的差异，这可以通过MspA前庭来区分。所述靶分子可以是肽、单链核酸(例如DNA或RNA，例如miRNA)。所述靶分子的所述一种或更多种特征可以包含序列等。

例如，在miRNA的表征中，所述测试分析物可以是通过miRNA和核酸探针的杂交形成的双链体，其中所述核酸探针可以是DNA、RNA或其他核酸类似物。可以确定待测试的miRNA序列是否与所述探针序列完全互补或错配，这可以进一步确定待测试的miRNA序列是否为预期序列。所述测试电流模式可以至少从所述分析物处于MspA前庭内期间测量的离子电流获得，优选地不添加任何能够与所述分析物相互作用并改变所述分析物构象的试剂。所述参考电流模式可以通过使用由所述探针和与所述探针完全互补的参考miRNA组成的双链体来获得。当所述测试电流模式与所述参考电流模式相同时，确定所述分析物中的miRNA与所述探针完全互补。当所述测试电流模式与所述参考电流模式不同时，可以确定所述测试分析物中的miRNA与所述探针不是完全互补的，即所述miRNA和所述探针之间有错配。根据所述测试电流模式的特征，甚至可以确定所述miRNA和所述探针之间错配碱基的数量和位置。

在一些实施方案中，例如，所述方法可用于确定蛋白质突变是否导致其构象改变。所述分析物可以是突变蛋白，并且所述测试电流模式可以至少从突变蛋白处于MspA前庭期内间测量的离子电流获得，优选地不添加任何能够与所述分析物相互作用并改变所述分析物构象的试剂。所述参考电流模式可以通过使用亲本蛋白质作为参考分析物来获得。当所述测试电流模式与所述参考电流模式不同时，可以确定所述蛋白质突变引起构象变化。

本发明人发现，分析物与试剂之间的相互作用可能导致所述分析物构象的变化，这可以通过MspA前庭检测到。因此，在一些实施方案中，例如，所述方法可以用于确定分析物与试剂之间的相互作用(例如存在相互作用)。所述分析物可以是具有构象的任何分子，包括核酸、蛋白质、多糖、聚合物、酶等。所述试剂可以是能够与所述分析物相互作用(例如结合)的任何物质。所述试剂的实例包括离子、小分子、配体、受体、酶的底物等。优选地，所述试剂的大小能够使其自由通过MspA缢缩区。优选地，分析物与试剂之间的相互作用能够引起所述分析物构象的改变。

在一些实施方案中，例如，所述方法可以用于确定所述测试试剂是否可以与已知分析物相互作用。所述测试电流模式至少可以从已知分析物在所述测试试剂存在的情况下处于MspA前庭内期间测量的离子电流中获得。所述参考电流模式可以至少从已知分析物在不存在能够与所述已知分析物相互作用的试剂的情况下处于MspA前庭内期间测量的离子电流获得。在一些实施方案中，当所述测试电流模式与所述参考电流模式相比具有变化时，可以确定所述测试试剂可以与所述已知分析物相互作用。

所述方法还可以用于确定所述测试分析物是否可以与已知试剂相互作用。所述测试电流模式可以至少从所述测试分析物在所述已知试剂存在的情况下处于MspA前庭期内间测量的离子电流获得。所述参考电流模式可以至少从所述测试分析物在不存在能够与所述测试分析物相互作用的试剂的情况下处于MspA前庭内期间测量的离子电流获得。在一些实施方案中，当所述测试电流模式与所述参考电流模式相比具有变化时，可以确定所述测试分析物可以与所述已知试剂相互作用。

所述方法还可用于确定样品是否包含能够与所述分析物相互作用的试剂。所述测试电流模式可以至少从所述分析物在所述样品存在的情况下处于MspA前庭内期间测量的离子电流获得。所述参考电流模式可以至少从所述分析物在不存在能够与所述分析物相互作用的试剂的情况下处于MspA前庭内期间测量的离子电流获得。在一些实施方案中，当所述测试电流模式与所述参考电流模式相比具有变化时，可以确定所述样品包含能够与所述分析物相互作用的试剂。在一些实施方案中，所述参考电流模式可以至少从所述分析物在存在能与所述分析物相互作用的特定试剂的情况下处于MspA前庭内期间测量的离子电流获得，并且当所述测试电流模式与所述参考电流模式相同时，可以确定所述样品包含所述特定试剂。

所述方法也可用于表征能够与所述分析物相互作用的试剂。所述测试电流模式可以至少从所述分析物在存在能够与所述分析物相互作用的试剂的情况下处于MspA前庭内期间测量的离子电流获得，即，在所述分析物和所述试剂的复合物处于MspA前庭内期间测得的离子电流。所述参考电流模式可以至少从所述分析物在不存在能够与所述分析物相互作用的试剂的情况下处于MspA前庭内期间测量的离子电流获得。在一些实施方案中，当所述测试电流模式与所述参考电流模式相比具有变化时，可以表征能够与所述分析物相互作用的试剂。在一些实施方案中，所述参考电流模式可以至少从所述分析物在存在能够与所述分析物相互作用的特定试剂的情况下处于MspA前庭内期间测量的离子电流获得，并且当所述测试电流模式与所述参考电流模式相同时，可以确定待表征的试剂是所述特定试剂，并且还可以确定待表征的试剂的浓度。

在一些实施方案中，所述分析物可以是蛋白质，例如酶。待表征的试剂能够与所述蛋白质相互作用。所述试剂的实例包括但不限于所述蛋白质的辅因子、配体或受体，或酶的底物。所述试剂包括但不限于离子、小分子化合物、核酸、蛋白质、肽、多糖、聚合物。在一些实施方案中，所述分析物是溶菌酶。在一些实施方案中，所述能够与所述分析物相互作用的试剂可以是溶菌酶的多糖底物，例如肽聚糖、壳聚糖、甲壳素等，例如n-乙酰壳六糖。因此，本发明所述的方法可用于通过多糖与溶菌酶之间的相互作用来表征多糖。

所述方法还可用于确定蛋白质突变体的突变位点是否是亲本蛋白质与特定试剂相互作用的位点。所述测试电流模式可以至少从所述蛋白质突变体在所述试剂存在的情况下处于MspA前庭内期间测量的离子电流获得。所述参考电流模式可以至少从所述亲本蛋白质在所述试剂存在的情况下处于MspA前庭内期间测量的离子电流获得。当所述测试电流模式与所述参考电流模式相比具有变化时，可以确定蛋白质突变体的突变位点是所述亲本蛋白质与所述特定试剂相互作用的位点。

所述方法还可用于检测或区分蛋白质或核酸的野生型和突变体、蛋白质或核酸不同的突变体、蛋白质的不同状态(例如，结合或未结合辅因子、受体、配体或底物(例如，酶等分析物的底物))等，只要将要区分物质的具有不同的构象即可。

分析物和试剂

本文中使用的分析物应该是尺寸小于MspA前庭并且大于MspA缢缩区的分子。所述分析物的尺寸由其构象决定。因此，本文所用的分析物具有构象，使所述分析物容纳在MspA前庭中，但防止所述分析物进入并移位通过MspA缢缩区。也就是说，当所述分析物处于其构象中时，它可以被容纳在MspA前庭中，但不能移位通过MspA缢缩区。

例如在缓冲液中(例如在所述第一导电液体介质和所述第二导电液体介质中)，所述分析物可以是带电荷的或中性的，并且可以是带正电荷或带负电荷的。所述分析物优选可以溶解在所述缓冲液中，或者可以在电场或电渗流的作用下移动。所述构象可以是二级结构、三级结构或三维结构。所述构象可以是所述分析物的自然构象，即其发挥作用时的构象。所述构象可以是当所述分析物在缓冲液中时的构象，例如在所述第一导电液体介质和所述第二导电液体介质中的构象。在一些实施方案中，当所述分析物在缓冲液中时，例如在所述第一导电液体介质和/或所述第二导电液体介质中时，所述分析物具有其天然构象。

当所述分析物的组分改变时，或者当某种试剂与所述分析物相互作用时，可能导致所述分析物的构象改变，这可以通过本发明所述的方法检测，从而表征所述分析物或所述分析物与所述试剂之间的相互作用。

所述分析物可以是具有构象的任何分子，包括核酸、蛋白质、肽、多糖、聚合物、酶等，或者它们中任意两种或更多种的复合物。所述分析物也可以是核酸、蛋白质、肽、多糖、聚合物、酶等和能够与它们相互作用的试剂(例如它们的辅因子、配体、受体、底物等)的复合物。

所述核酸可以是LMW RNA(低分子量RNA，通常＜200nt，例如tRNA、siRNA、rRNA(例如5S rRNA、16S rRNA、18S rRNA和23S rRNA)、miRNA)、适体、核酶、核酸双链体或具有特定结构(例如吻环(kissing loop)、三向接合(three-way junction)、假结(pseudoknot)、扭结转角(kink-turn)或G-四链体(G-quadruplex))的RNA。所述核酸双链体可以具有突出端或平端。所述核酸双链体可以是由两个RNA序列组成的双链体，由两个DNA序列组成的双链体，或由DNA、RNA和其他核酸类似物的序列的任意两个组成的杂交双链体。所述核酸双链体可以由miRNA和核酸探针组成，并且所述核酸探针是RNA、DNA或核酸类似物。

本文所用的“核酸类似物”是指与天然存在的RNA和DNA相似(结构相似)的化合物。核酸是核苷酸链，由三部分组成：磷酸酯主链、戊糖(核糖或脱氧核糖)和四种核碱基之一。类似物可能会改变上述物质的任何一种。核酸类似物可以通过分子主链的变化与天然存在的DNA或RNA区分开来。核酸类似物包括但不限于阿拉伯核酸(ANA)、桥接核酸(BNA)、环己烯基核酸(CeNA)、2’-氟阿拉伯核酸(FANA)、乙二醇核酸(GNA)、己糖核酸(HNA)、锁核酸(LNA)、吗啉基、肽核酸(PNA)、苏糖核酸(TNA)。

本文所用的“蛋白质”可包括单个蛋白质、蛋白质的亚基、不同种类蛋白质的混合物和蛋白质复合物。本文所用的“蛋白质复合物”可指通过两种或更多种单个蛋白质或其亚基之间的相互作用形成的复合物。蛋白质的实例包括钙调蛋白、溶菌酶、肌红蛋白、ACTR/NCBD复合物、乳清蛋白、α-乳白蛋白和β-乳球蛋白。

用作分析物的蛋白质或肽可以具有通过折叠氨基酸序列形成的二级结构、三级结构或四级结构。所述二级结构可包括例如α-螺旋、β-折叠、β-转角等。所述三级结构可包括在所述氨基酸序列二级结构的基础上由氢键、离子键、疏水相互作用、二硫键等形成的三维结构。所述四级结构可以包括例如由两个或更多个亚基形成的结构。

用作分析物的蛋白质或肽可以具有不同的等电点(pI)，例如约7.0的等电点(pI)、pI小于约7.0的蛋白质和pI大于约7.0的蛋白质。约7.0的等电点(pI)可以在约6.5至约7.5的范围内。小于约7.0的pI包括小于约6.5、小于约6.0、小于约5.5、小于约5.0、小于约4.5、小于约4.0等。大于约7.0的pI包括大于约7.5、大于约8.0、大于约8.5、大于约9.0、大于约9.5、大于约10.0等。

所述分析物可以包含两种或更多种不同的分析物。例如，所述分析物包含不同的LMW RNA或不同的蛋白质。在一些实施方案中，所述不同的蛋白质或肽可以独立地选自由以下组成的组：中性蛋白质、带正电的蛋白质和带负电的蛋白质。在一些实施方案中，所述不同的蛋白质或肽可以独立地选自由以下组成的组：pI约为7.0的蛋白质、pI小于约7.0的蛋白质和pI大于约7.0的蛋白质。在一些实施方案中，所述分析物包含中性蛋白质、带正电的蛋白质和带负电的蛋白质的全部。在一些实施方案中，所述分析物包含中性蛋白质、带正电的蛋白质和带负电的蛋白质中的两种或三种。在一些实施方案中，所述分析物包含等电点(pI)为约7.0的蛋白质、pI小于约7.0的蛋白质和pI大于约7.0的蛋白质中的两种或三种。

所述分析物可以是能够与试剂相互作用(例如结合)的分析物。可以与本文中的所述分析物相互作用的试剂的实例包括离子、小分子、配体、受体、辅因子、酶的底物等。优选地，所述试剂的大小使其自由通过MspA缢缩区。所述试剂优选可以溶解在所述缓冲液中，或者可以在电场或电渗流的作用下移动。

本文所用的“小分子”是指低分子量的有机化合物或肽，例如＜900道尔顿，或大小为1nm量级。

在一些实施方案中，所述分析物或所述试剂可以包含在样品中。所述样品可以是源于受试者的血液、血清、血浆、脑脊液、体液，或者所述受试者组织或器官的样品。所述受试者可以是动物或植物，其中所述动物可以是哺乳动物，包括人类。所述样品也可以是源于环境的样品，例如源于水或土壤的样品等。所述分析物可以是生物标志物，例如疾病的生物标志物。

所述样品也可以是包含所述分析物的食品、饮料、保健品，并且所述分析物可以是食品中的营养成分或有害成分、饮料或保健品。所述样品也可以是包含所述分析物作为活性成分或有害成分的药物。在一些实施方案中，所述样品可以是乳品(例如液态乳或乳粉)或蛋白粉，并且本发明所述的方法可以用于检测所述样品中某些蛋白质的浓度。例如，本发明所述的方法可用于检测乳品或蛋白粉中的乳清蛋白，特别是α-乳白蛋白和/或β-乳球蛋白的浓度，可用于评估乳品或蛋白粉的质量。这使得人们可以摒弃通过检测氮来评估乳品或蛋白粉中蛋白质含量的传统方法，直接测定乳品或蛋白粉中的蛋白质含量，从而不会出现误判。

可以不从所述样品中纯化所述分析物或所述试剂。可以直接将所述样品添加到所述第一导电液体介质和/或所述第二导电液体介质中。对于非液体形式的样品，可以将所述样品直接添加到所述第一导电液体介质和/或所述第二导电液体介质中溶解，然后进行测量，或者可以将所述样品首先配制成溶液或悬浮液，然后添加到所述第一导电液体介质和\或所述第二导电液体介质中。

在一些实施方案中，所述分析物是由靶分子和辅助分子组合形成的复合物。所述靶分子可以以不同的方式与所述辅助分子结合，例如共价键、氢键、范德华力等，使得复合物满足本发明的分析物标准，即具有使得所述分析物容纳在MspA前庭中，但是防止所述分析物进入并移位通过MspA缢缩区的构象。在本方法中使用这种分析物可以促进对所述靶分子的表征。在一些实施方案中，所述靶分子是miRNA。

实施例

实施例1：使用耻垢分枝杆菌孔蛋白A(MspA)通过纳米孔捕获/移位对低分子量 (LMW)RNA进行结构分析

1.单分子传感miRNA

如方法中所述使用所述M2 MspA突变体(D93N/D91N/D90N/D118R/D134R/E139K)³²进行电生理学测量(图3A)。如果没有另外说明，该突变体在本文中被称为MspA。根据最近开发的纳米孔传感策略³³，其中所述纳米孔附近存在钙通量延长了核酸移位的停留时间，将1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)置于cis侧，并将1M CaCl₂缓冲液(1MCaCl₂、10mM HEPES，pH7.0)置于trans侧。根据电流-电压特性，当施加正电位时，在trans侧放置1M CaCl₂缓冲液而不是1.5M KCl缓冲液仅略微降低开孔电流(图3B)。

Hsa-miR-21是最早识别的哺乳动物微RNA(miRNA)之一，已作为多种癌症生物标志物进行了充分研究³⁴，它被定制合成并作为模型miRNA来测试所述方法(表1)。在实验中，将hsa-miR-21添加到cis侧(终浓度为200nM)并持续施加+150mV的电位后，在两个实验中均立即出现连续的电阻脉冲。开孔电流(I_o)、阻塞幅度(I_b)、停留时间(t_off)和事件间间隔(t_on)的定义见图3C和3D。阻塞百分比％I_b由(I_o-I_b)/I_o.确定。如图3C所示，使用1.5M KCl(cis)/1.5M KCl的缓冲液组合，hsa-miR-21的移位事件表现为极短的驻留尖峰。然而，在保持所有其他条件相同的情况下，使用1.5M KCl(cis)/1M CaCl₂(trans)的组合，事件出现率显著增加。事件停留时间显著延长，阻塞幅度(I_b)分布更加均匀(图3D)。％I_b与t_off的事件散点图和对应的％I_b直方图中更加量化地展示了这种差异，其中根据高斯(Gaussian)拟合结果确定了平均阻塞幅度I_p(图3E，表2)。图3F和3G展示了这两种情况下t_off和t_on的直方图。直方图是单指数拟合的，从单指数拟合结果得出平均停留时间(τ_off)和平均事件间间隔(τ_on)。图3C-3G中显示的结果清楚地表明，在所有其他条件相同的情况下，trans侧电解质缓冲液改为CaCl₂使得事件出现率和事件停留时间急剧增加。较高的事件出现率应该是由于孔内腔中Ca²⁺和氨基酸残基之间的配位相互作用引起电渗流增加所致(图4)。众所周知，Ca²⁺通过有效的静电电荷筛选或配位结合来稳定RNA结构，这有助于延长停留时间。我们还用其他电解质缓冲液组合(图5)和不同的MspA突变体(图6)进行了hsa-miR-21传感。这些结果进一步证实了不对称缓冲液组合和选择M2 MspA是RNA结构分析的最佳选择。

表1.核酸缩写和序列。

脚注：siFoxA1是通过siFoxA1-a和siFoxA1-b的杂交制备的。萤光素酶siRNA是通过萤光素酶siRNA-a和萤光素酶siRNA-b的杂交制备的。

表2.不同缓冲液中hsa-miR-21传感的统计数据。如方法中所述进行所有测量。将hsa-miR-21添加到cis侧，终浓度为200nM。I_p是从高斯拟合结果得出的。τ_off和τ_on是从单指数拟合结果得出的。所有统计结果均来自每种情况的5分钟连续记录，和分别是三次独立测量的I_p、τ_off和τ_on的平均值。

2.单分子传感siRNA

长度测量值为20-25bp的小干扰RNA(siRNA)表现为具有2-nt 3’-突出端或平端的RNA双链体，在基因沉默中发挥核心作用³⁵。此siRNA双链体在构象上比dsDNA的双链体更受限制，并且主要呈A型³⁶。siRNA双链体的横截面直径为～2.4nm³⁷，大于MspA缢缩区的横截面，表明siRNA直接移位通过MspA在几何上受到限制(图7A)。据我们所知，以前还没有报道过siRNA移位通过MspA的尝试。

siFoxA1抑制叉头蛋白FoxA1的表达，是一种19-bp的siRNA双链体，每个端都有突出的核苷酸³⁸(表1、图7B)。在将siFoxA1添加到cis侧(终浓度为200nM)后，在纳米孔测量期间立即观察到连续出现两阶跃(two-step)阻塞事件(图8)。第一阻塞水平，其测量值为0.600±0.006(n＝3)，平均停留时间为几百毫秒，可能代表所述siFoxA1容纳在所述孔前庭中时的状态。紧接着，第二阻塞水平，其测量值为0.932±0.004(n＝3)，停留时间短得多，为几毫秒，可能代表所述siFoxA1电泳展开时的状态，使得所述分析物的线性化单链部分到达所述孔缢缩处，最终出现完全移位(图8，图7C、D)。通过将施加电位提高到+200mV，水平1的停留时间显著缩短(图9)。这是意料之中的，因为增强的电泳力将缩短siFoxA1在原生折叠状态下的停留时间，从而进一步证实了所提出的移位模型。尽管所述siRNA最终移位通过所述孔，但在捕获阶段获得了测量值为0.600±0.006(n＝3)的最具特征性的事件特征

荧光素酶siRNA³⁹是一种21-bp的双链体和低效沉默结构⁴⁰，用作模型平端siRNA(表1、图7B)。在将萤光素酶siRNA添加到cis侧(终浓度为200nM)后，立即观察到两种类型的事件，称为1型和2型(图10，图7C、D)，这与siFoxA1产生的事件类型明显不同。具体而言，所述1型事件表现的平均阻塞幅度为0.490±0.010(n＝3，表3)。所述2型事件表现出阻塞的平均阻塞幅度为0.533±0.004(n＝3，表3)。由于平端很难解链以达到所述孔缢缩处(图11)，因此与siFoxA1产生的阻塞水平相比，所述事件通常表现出的阻塞水平更浅、驻留时间更长、噪声更小(图10)。因此，这两种类型的事件可能是由MspA以相反方向捕获平端siRNA引起的。考虑到总长度和结构相似，这一比较表明MspA纳米孔捕获/移位可以有效地解析RNA之间的微小结构差异。

表3.MspA传感RNA的I_p。如方法中所述进行所有测量。I_p是从高斯拟合结果得出的。是三次独立测量I_p的平均值。

3.单分子传感tRNA

转移RNA(tRNA)是RNA结构生物学中另一深入研究的著名模型。其二级结构由四个结构域组成：接纳茎、D臂、T臂和反密码子环(图12)。在三维空间中，这些结构域折叠成L形三级结构，其中所述反密码子环和所述接纳茎分别形成L形几何形状的两端(图12)。从三级结构的目测来看，原生形式的tRNA不能直接移位通过MspA。然而，它仍能进入所述孔前庭，并且在进入所述孔时可能具有多个取向，这表明当被MspA探测时，它可能会产生一组移位特征(图7A)。

由于不同类型tRNA的生化相似性，难以纯化特定类型的tRNA⁴¹。据报道，tRNA分离极其耗费人力，涉及离子交换色谱法、溶剂萃取、反流提取、苄基-DEAE-纤维素色谱法和反相色谱法⁴¹。然而，苯丙氨酸特异性tRNA(在此处缩写为tRNA^phe)具有独特性，因为只需在苄基化DEAE-纤维素色谱柱用NaCl梯度洗脱，即可以高纯度获得⁴²。酿酒酵母tRNA^phe是按如上所述提取的⁴²，由Sigma-Aldrich以商业方式提供，并在后续研究中用作代表性tRNA。

在纳米孔测量(方法)期间，将酿酒酵母tRNA^phe添加到cis侧，终浓度为200nM。随后观察到连续的长期驻留和波动移位事件，其中两种类型的事件，暂时称为tRNA1型或2型事件，其事件特征展示出高度再现性(图12，图7C、D)。当在1.5M KCl(cis)/1.5M KCl(trans)的情况下进行测量时，tRNA^phe移位产生不均一特征的事件。以前观察到的1型和2型事件已经完全消失(图13)。这表明存在钙通量可能有助于在纳米孔传感期间稳定tRNA三级结构(图13)⁴³。具体而言，所述tRNA 1型事件表现为单阶跃(single-step)阻塞，平均阻塞幅度为0.567±0.004(n＝3，表3)。所述tRNA 2型事件含有明确限定的上阻塞水平(水平1)，为0.453±0.002(n＝3，表3)。此外，所述事件含有向更深阻塞水平的持续过渡，并最终以测量值为0.997±0.010(n＝3，表3)的极深孔阻塞(水平2)结束，然后恢复到开孔水平。1型或2型的水平1中的浅阻塞幅度(I_p)表明tRNA处于部分移位形式，使所述孔前庭中大量剩余空间未占据，从而产生了大量剩余电流。这两种类型的事件之间的高度可区分的I_p差异可能是由两种不同的tRNA捕获取向造成的。根据三级结构，tRNA的反密码子环或接纳茎在移位期间可能面向所述孔缢缩处。

为了进一步探索这一现象，用tRNA^phe进行了纳米孔测量，施加电压在+125和+225mV之间变化。仍观察到tRNA 1型或2型事件。一般来说，当所述施加电压增加时，所有1型事件的驻留时间都会系统地延长(图14、表4)，这表明1型事件实际上表示捕获tRNA但没有最终通过所述孔。在这种情况下，更高的电泳力将使所捕获的tRNA在逃逸回所述cis室之前更紧密地保持在所述孔前庭中，从而系统性地延长所述事件的停留时间。在任何1型事件中没有观察到出现进一步的孔阻塞，这种取向的完全移位似乎是不可能的。这表明所述tRNA三级结构的反密码子环形成共价闭合的分子圈，在移位期间面向所述孔缢缩处(图12)。然而，2型事件的总体停留时间表现却与之相反(图14、表4)，表明所述2型事件实际上代表了一种移位，在此期间所述tRNA展开，最终导致完全移位。从低于水平1阻塞状态的波动中观察到，tRNA一直试图达到进一步孔阻塞水平，这强化了这一假设。所述接纳茎有磷酸化的5’端和突出的3’端(其中含有用于氨基酸附接的CAA尾)，当面向所述孔缢缩部位时，所述接纳茎可能有助于电泳驱动展开tRNA结构(图12)。这些发现强化了对观察到两种tRNA^phe移位取向的猜测。空间不对称的tRNA能够区分tRNA^phe移位取向，从而产生两种轨迹的传感信息用于tRNA结构分析。

表4.不同电压下测量tRNA^phe的τ_off。如方法中所述进行所有测量。将tRNA^phe添加到所述cis室中，终浓度是200nM。τ_off是从单指数拟合结果得出的。是三次独立测量τ_off的平均值。

4.单通道记录5S rRNA

5S核糖体RNA(5S rRNA)是核糖体不可或缺的组分。其体积小(大约120nt)、结构保守且与核糖体蛋白缔合，使其成为研究RNA结构⁴⁴和RNA-蛋白质相互作用⁴⁵的理想模型RNA。5S rRNA的二级结构由五个螺旋(用罗马数字表示为I-V)、四个环(B-E)和一个铰链(a)组成，它们形成Y形三级结构⁴⁶。所述环C、环E和螺旋Ⅰ位于“Y”形的三端⁴⁶。所述结构显示出比tRNA更高的复杂性，因此当被MspA探测时可能产生不同的事件特征。

采用从大肠杆菌中提取的5S rRNA(图7B、图15)作为模型分析物，将5S rRNA添加到cis侧，终浓度为10nM。观察到三种类型的特征事件，可能分别对应于5S rRNA进入所述孔的三个末端(图16)。具体而言，1型事件表现为低于特征阻塞水平的电流振荡，平均阻塞幅度为0.356±0.003(n＝3，表3)。2型事件以随机电流波动开始。然后，它变成了具有许多负向尖峰的单阶跃(single-step)阻塞(水平1， 3型事件表现为两阶跃(two-step)阻塞，第一阶跃(first step)的平均阻塞幅度为0.737±0.005(n＝3，表3)。根据其全点直方图的结果，不同事件类型彼此可以很好地区分(图17)。在所述三种类型的事件中，1型事件表现出最独特的事件形状和最高的出现概率，被认为是5S rRNA最具特征的事件类型(图18)。通过进行电压依赖性测定，发现1型事件是捕获和移位的组合。更高的施加电压最终会驱动5S rRNA结构展开并移位通过所述孔(图19)。因此，1型事件最有可能是螺旋Ⅰ-向下位姿的结果，而不是任何环向下位姿的结果。2型事件从来没有表现出任何成功通过所述孔移位的迹象，应该是由具有环向下位姿的结构的捕获引起的(图16)。然而，3型事件的驻留时间相对较短，出现频率低得多，通常表现为移位通过所述孔(图16)。考虑到5S rRNA体积大，不易移位通过所述孔，因此3型事件应该是由未折叠或片段化的5SrRNA移位引起的。MspA捕获/移位产生的丰富传感信息为识别单分子中的5S rRNA提供了明确的参考。然而，据我们所知，之前尚未报道过通过纳米孔对5S rRNA进行结构分析。

5.单分子RNA结构分析

Hsa-miR-21、siFoxA1、萤光素酶siRNA、tRNA^phe和5S rRNA在整体结构上具有增加的复杂性。利用孔前庭的大开口和整体锥形孔几何形状，相同的孔MspA可以区分这些结构上的差异(图7A、7B和图20)。不同RNA类型％I_b与t_off的事件散点图如图7E所示(表3)。对于5S rRNA，展示了1型事件，这是5S rRN中最具代表性的事件类型。对于多阶跃(multi-step)阻塞事件，计算第一阶跃(first step)的阻塞幅度。由不同分析物产生的事件特征形成散点图中高度可区分的分布群。相应的事件幅度直方图也如图7F所示，其中5S rRNA引起的阻塞最浅，其次是tRNA^phe、荧光素酶siRNA、siFoxA1和hsa-miR-21。这是意料之中的，因为三级结构较大的RNA更难进入所述孔缢缩处。

还展示了使用MspA同时传感siFoxA1、荧光素酶siRNA、tRNA^phe和5S rRNA(图7G)。不同的RNA类型可以基于其不同的阻塞特征清楚地识别出来。这些结果表明，MspA呈锥形形状，可以有效地区分多种多样的RNA类型，从而进行结构分析。尽管没有展示，但其他经典的RNA结构，包括吻环⁴⁷、三向接合⁴⁸、假结⁴⁹、扭结转角⁵⁰和G-四链体⁵¹，原则上可以通过相同的策略检测到，并且预计会有不同的事件特征。随后的特征提取和分析可能是劳动密集型的，或者可能会因人工监督而产生偏差。复杂度等级更高的RNA结构所引起的事件也可能需要多个参数描述其特征。迫切需要一种高度智能和用户友好的计算机算法来应对这些挑战。

6.机器学习辅助RNA识别

机器学习是人工智能研究的一个分支，其目的是建立计算机化算法，从输入数据中学习，而无须聚焦于编程。这一概念证明了适用于分析纳米孔传感数据的通用性，正如先前报道的那样^{13,52-54 55}。当由MspA探测时，siRNA、tRNA和5S rRNA的事件特征展现出高度一致性，因此这些数据非常适合于构建旨在自动识别不同RNA结构的机器学习算法。首先，一开始对含有纳米孔传感事件的原始时间迹线进行自动分割，以生成离散的纳米孔事件(图21)。为了形成模型训练集，使用了模型事件，包括118个突出端siRNA(siFoxA1)事件、176个平端siRNA(荧光素酶siRNA)1型事件、161个平端siRNA(荧光素酶siRNA)2型事件、143个tRNA(tRNA^phe)1型事件、155个tRNA(tRNA^phe)2型事件、133个5S rRNA(大肠杆菌5S rRNA)事件和134个“其他”事件。所有这些训练事件都具有已知的身份，因为它们是在涉及唯一、已知分析物的测量期间生成的。这里，被定义为“其他”的事件是主要由纳米孔阻塞或自发门控引起的异常纳米孔事件(图22)。这些事件也作为干扰事件包括在所述训练数据集中，从而增强了训练的稳健性。所述1型或2型事件根据其高度可辨别的％I_b值分别标记(图7C、表3)。

训练过程由特征提取和模型建立组成(图23A)。在特征提取期间，分别提取单个事件的水平1位置(pos_水平1)、水平2位置(pos_水平2)、噪声、停留时间(长度,length)、最小值(min)、最大值(max)、中位值(med)、均值、标准差(std)、峰度(kurt)和偏度(skew)，从而形成每个事件的特征矩阵(图23A)。特征提取方法的详细说明如图24所示。然后将所述训练数据集划分为用于模型训练的训练子集和用于模型测试的验证子集。通过10倍交叉验证将所述训练集进一步随机划分为用于模型训练的训练子集和用于模型参数微调和模型验证的验证子集。所述训练过程进行了10次，在此期间对所述训练数据集进行随机划分，因此避免了实施偏倚。为了建立所述模型，评价了五种不同的分类器，包括分类与回归树(CART)、Xgboost、随机森林、KNN和梯度提升。由于事件类型之间的事件长度差异很大，因此没有选择深度学习进行模型建立。超参数，如随机森林中的“n_setimators”、KNN中的“k值”，都经过所述验证子集进行微调。通过对所有模型训练的准确度得分取平均值来计算每种模型准确度分数。在所有五种分类器中，随机森林模型分数最高，成为模型建立者的最佳选择。通过测试数据集对经过训练的模型进行了测试。模型测试阶段输出分类准确度、特征重要性、混淆矩阵和学习曲线。分类准确度是通过正确分类的样品和总样品的商(quotient)来计算的。

特征重要性是在模型测试期间生成的，展示了所有九个特征在事件识别中的相对重要性(图23B)。模型测试的混淆矩阵结果如图23C所示，其中突出端siRNA、平端siRNA 1型和siRNA 2型、tRNA 1型和2型、5S rRNA的准确度分别为0.9694、0.9630、0.9206、0.9600、0.9079和0.9118。为了估算所述模型的效率，在模型测试期间，使用不同数量的输入数据来估算准确度，以形成学习曲线，这表明输入仅从整个训练集中随机选择的148个训练事件就可以实现85％的总体判断准确度(图23D)。

所述模型用于预测身份未知的事件(图23E)。通过依次添加突出端siRNA、平端siRNA、tRNA和5S rRNA进行纳米孔测量。每种情况都记录了20分钟迹线。所记录的数据形成预测数据集，其随后由先前经过训练的模型识别(视频S1)。如事件识别直方图所示(图23F、图25)，每次添加后，相应RNA事件的比例明显上升。这有效地帮助纳米孔自动传感不同的RNA结构，尤其在从混合样品中识别RNA方面更具优势。

视频S1.同时传感siRNA、tRNA和5S rRNA。如方法中所述进行电生理学测量。将1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)置于cis侧，并将1M CaCl₂缓冲液(1MCaCl₂、10mM HEPES，pH7.0)置于trans侧。将突出端siRNA(SiFoxA1，25nM)、平端siRNA(荧光素酶siRNA，10nM)、tRNA(tRNA^phe，400nM)和5S rRNA(30nM)同时添加到cis侧。从迹线中清楚地观察到siRNA、tRNA和5S rRNA的特征事件。在机器学习算法的帮助下，每种事件都被自动识别，并分别用字母O(突出端siRNA)、B1(平端siRNA 1型)、B1(平端siRNA2型)、T1(tRNA1型)，T2(tRNA 2型)或R(5SrRNA1型)标记。

7.tRNA捕获/移位的分子动力学(MD)研究

在所有测试的分析物中，tRNA展现出两种高度特征性的事件类型。在实验中，当通过MspA探测时，这两种事件类型分别显示出tRNA的捕获(1型)和移位(2型)(图12)。由于tRNA的整体结构是多分支的，这两种事件类型的起因可能是由进入所述孔的tRNA取向不同造成的。为了揭示它如何在纳米孔传感期间确定tRNA的阻塞幅度和动力学，进行了全原子MD模拟(实施例2方法)。模拟开始时，将起始取向不同的tRNA直接放置在所述孔前庭上方，而不与所述孔直接接触。表现出这些取向的构象，分别称为茎向下取向、环向下取向或臂向下取向，对它们进行了平衡并在图26A-C展示。为了进一步表征tRNA的移位过程，我们探测了引导核苷酸(图26A-C中的绿色球体)在100-ns的模拟期间的z坐标。这里，Z＝0对应于MspA最窄区域(图26A-C)，是所有八个亚基中N90的C_α原子的质心。因此，Z＜0的结果表明所述引导核苷酸已经成功地移位通过所述孔。在实验中，当通过MspA探测时，tRNA的捕获/移位持续约数秒，这远远超出了传统MD模拟的可及时间尺度。在之前的工作中⁵⁶，为了加快计算速度，去除了MspA整个前庭，这样就在全原子模拟的单个轨迹中实现了～μs的时间尺度。然而，MspA前庭对于容纳大型RNA结构至关重要，并且～μs的时间尺度仍然比纳米孔捕获/移位所需的时间尺度短得多。或者，为了在可行的模拟时间尺度内观察纳米孔捕获/移位的整个过程，施加更高的电压以加快所述过程。然而，通过将施加电压切换到+150mV来得到相应的离子电流。为了避免形成电穿孔，限制了脂质分子的位置。为了进行定性比较，对进入所述孔的tRNA的所有三种不同取向进行了相同的模拟。

图26D-F显示了分别用三种不同构象模拟时七个独立模拟过程的代表性迹线。结果表明，茎向下构象的tRNA比其他构象的tRNA更容易移位通过所述孔缢缩区。在所有茎向下位姿的模拟中，引导核苷酸在100ns内成功地移位通过所述MspA孔蛋白。而在其他两种tRNA位姿的模拟中，在模拟时间尺度内没有观察到成功的移位事件。进一步的模拟表明，茎向下构象的成功移位与tRNA的展开有关(图27、视频S2)。在模拟的早期阶段，tRNA涉及在不破坏碱基对氢键(H-键)的情况下剧烈变形，正如均方根偏差(RMSD)的增大和H-键相对稳定值所表明的(图27)。如反应坐标Z变小、H-键减少和RMSD增大所表明的，由于变形，tRNA可以到达MspA的更深位置，随后tRNA展开，引导核苷酸成功移位通过所述孔缢缩区(图27)。视频S3和S4中也提供了其他两种构象的移位过程。

由不同tRNA构象引起的不同分析物-孔相互作用产生不同的离子电流。为了定量比较系统的不同构象状态下的离子电流，将外部电场切换到0.09V/10nm，这对应于实验中使用的～+150mV电压偏置。根据先前的研究⁵⁷，基于离子的坐标计算瞬时离子电流。由于瞬时离子电流波动大，我们首先计算了累积电流。然后通过线性拟合从累积电流的斜率得出离子电流。除了上述三个模拟系统外，我们还对不含tRNA(开孔)的系统和tRNA移位通过孔(Z<0)的系统进行了离子电流模拟。如图26G和26H所示，对MspA开孔状态的模拟显示了最高的离子电流。在tRNA被捕获到所述孔前庭后，离子电流突然减小，从而产生电流阻塞事件。与茎向下构象相比，环向下报告的电流更高，这与实验观察结果一致，即2型事件的水平1总是高于1型事件的水平1。当tRNA移位通过孔缢缩区时，电流几乎消失，这很好地描述了tRNA2型事件的水平2状态。当电压进一步上调时，同样观察到这些结果(图28)。总之，MD模拟的上述结果很好地解释了两种tRNA事件类型的可能起因，特别是对应于电压驱动的展开所驱动的tRNA移位的2型事件。1型事件作为捕获事件(图14)，可能是由环向下取向而不是臂向下取向引起的。从模拟中可以看出，臂向下取向显示出的捕获深度极浅，在实验测量时这种情况比环向下取向更不可能发生。对5S rRNA也进行了类似的MD模拟(图29、视频S5)，展示了更大RNA结构的分子移位细节。在从螺旋I向下捕获取向开始的模拟中也观察到电压驱动的展开。

视频S2-4.MD模拟生成的tRNA移位动画。如实施例2方法中所述进行MD模拟。沿着垂直于膜平面的方向连续施加4.0V/10nm的外部电场。模拟持续了100ns，时间步长为每帧2fs。在每个动画中，所述tRNA以茎向下(视频S2)、环向下(视频S3)或臂向下(视频S4)的构象进入所述孔。

视频S5.MD模拟生成的5S rRNA移位动画。如实施例2方法中所述进行MD模拟。沿着垂直于膜平面的方向连续施加4.0V/10nm的外部电场。模拟持续了100ns，时间步长为每帧2fs。5S rRNA以螺旋I向下构象进入所述孔。

8.不同来源tRNA的事件特征保守性

先前的晶体学研究表明，除了特定的哺乳动物线粒体tRNA外，系统发育起源差异很大的tRNA表现出高度保守的L形三级构象⁵⁸。有了这些知识，酿酒酵母tRNA^phe的结构诱导纳米孔事件可能能够一般性地应用于更多不同来源的tRNA。为了探索这一推测，我们对酿酒酵母和大肠杆菌的总tRNA(均由Sigma-Aldrich提供的)进行了纳米孔传感。

对两种tRNA样品进行凝胶电泳，其中所述酿酒酵母总tRNA具有所需纯度，但大肠杆菌总tRNA含有明显的污染，包括5S rRNA和其他更高分子量的RNA⁵⁹(图30)。为了避免污染的干扰，在纳米孔测量之前，通过从聚丙烯酰胺凝胶回收RNA来纯化大肠杆菌tRNA(图31)。

在纳米孔测量(方法)期间，将酿酒酵母tRNA或纯化的大肠杆菌tRNA分别添加到cis侧，终浓度为20ng/μl或2ng/μl。图32A和32B分别展示了代表性的迹线。从这两条迹线中都清楚地观察到了先前在研究酿酒酵母tRNA^phe时定义的特征性tRNA 1型和2型事件。图32C显示了由酵母tRNA^phe、酵母tRNA或大肠杆菌tRNA诱导的1型(水平1)和2型(水平1和水平2)事件阻塞特征的事件直方图。一般来说，当由MspA探测时，不同来源或物种tRNA事件的事件统计数据表现出高度相似性。三次独立实验的统计分析还表明，酵母tRNA和大肠杆菌tRNA移位事件的三个特征性水平的I_p接近酵母tRNA^phe移位事件的三个特征性水平的I_p(图32D、表5)。酵母tRNA和大肠杆菌tRNA的特征性tRNA事件比例也相似(图32E、表6)。这些结果表明，对于不同来源或物种的tRNA，tRNA特征事件是高度保守的。尽管之前从晶体学结果中得出了相同的结论^60-64，但这是首次通过单分子观察证明tRNA结构保守，并且是在水性缓冲液环境中的天然样品而不是静态结晶形式样品中获得的。此外，1型水平1和2型水平2的阻塞电流分布似乎比酵母tRNA^phe的阻塞电流分布略宽，这可能表明尽管事件的总体形状似乎相似，但不同的tRNA可能会表现出更多的可区分特征。独特的事件特征以及纳米孔的单分子分辨率能够直接从复杂的生物样品(例如其中存在大量干扰分析物的细胞裂解物的粗提取物)中识别出tRNA。

表5.不同生物来源tRNA事件的I_p。如方法中所述进行所有测量。将tRNA^phe添加到cis侧，终浓度为200nM。将酵母总tRNA添加到cis侧，终浓度为20ng/μL。将大肠杆菌总tRNA(未纯化)添加到cis侧，终浓度为20ng/μL。将大肠杆菌总tRNA(纯化)添加到cis侧，终浓度为2ng/μL。I_p是从高斯拟合结果得出的。是三次独立测量的I_p平均值。

表6.用机器学习算法确定tRNA信号的比例。如方法中所述进行所有测量。将不同的分析物分别添加到cis侧。对每种情况进行三次独立的测量以生成统计数据。

9.从大肠杆菌提取物中直接识别tRNA

为了验证其可行性，对培养的大肠杆菌(BL21)DE3进行裂解。所有低分子量(LMW)RNA(<200nt)都是用Takara的小RNA提取试剂(名称为RNAiso for Small RNA)提取的。提取程序的示意图如图33A所示，并在实施例2方法中进行了详细说明。试剂盒有效地提取裂解物中的所有低分子量RNA，包括tRNA、5S rRNA、miRNA和siRNA⁶⁵。除了tRNA，其他RNA可以用作干扰RNA，用以测试所述机器学习算法的稳健性。

在进行纳米孔测量之前，首先通过12％变性脲-聚丙烯酰胺凝胶电泳(脲-PAGE)分析对提取的样品进行表征(图33B)。根据已发表的报告⁶¹，分子量相当于～80nt的条带对应于tRNA⁶⁵。在cis侧为40ng/μL LMW RNA的情况下进行LMW RNA的纳米孔传感。70s持续时间的代表性迹线如图33C所示。根据定制机器学习算法，特征性1型和2型事件被自动识别，并在图33C中用三角形标记。统计数据显示，已识别的tRNA事件占所有检测到的移位事件的48％(图33D-33E、表6)。考虑到由同时存在于所述裂解物中的5S rRNA、miRNA或siRNA可能造成的干扰，这是意料之中的。

使用MiniBEST Universal RNA Extraction Kit(Takara)提取大肠杆菌(BL21)DE3的高分子量(HMW)RNA(>200nt)作为阴性对照。根据制造商的方案⁶⁶，该试剂盒优先提取分子量>200个核苷酸(nt)的所有RNA。详细的提取程序在实施例2方法中进行了描述。在实验中，从1％琼脂糖凝胶电泳结果来看，清晰的条带分别对应于23S核糖体RNA(rRNA)(2904nt)和16S rRNA(1542nt)，这充分说明HMW RNA提取是成功的(图34)。该Takara试剂盒无法有效提取的5S rRNA(120nt)和tRNA(70-90nt)在凝胶中不清晰可见。

HMW RNA提取物的纳米孔传感是在HMW RNA在cis侧中且终浓度为50ng/μL的条件下进行的。图35显示了代表性的10分钟迹线，从中可以看出，范围为1-60s的超长阻塞事件相继出现在所述迹线中。这些事件可能由23S rRNA或16S rRNA引起，因此显示出的事件特征不太明确。然而，它们明显有别于所有tRNA事件。仅观察到3.7％的tRNA 1型事件，未观察到2型事件(图35)。先前对含有tRNA样品进行的试验都显示出1型和2型事件(图7C)，其中所述2型在识别tRNA方面更具特征性。在这种情况下，在没有同时出现所述tRNA 2型事件时，观察结果可能是由HMW RNA的少数事件引起的，这些事件类似于所述tRNA1型事件。

10.结论：

总之，本文提出了一种纳米孔传感策略，该策略利用MspA纳米孔的大前庭直接区分RNA原生结构。代表性RNA分析物，包括miRNA、siRNA、tRNA或rRNA，在移位期间产生丰富的传感信息，这些信息明确地报告了它们的身份。我们承认，当同时评估结构极其相似的RNA时，通过纳米孔捕获/移位进行的RNA结构分析可能会变得复杂。然而，与现有基于杂交^67,68或逆转录^69,70的RNA检测方法相比，它不需要事先进行化学处理或扩增，并且实现了单分子分辨率。因此，它可以作为快速评估特定RNA表达水平的替代方法，并且适用于评估RNA完整性、应激诱导的tRNA差异表达⁷¹或tRNA裂解衍生的片段⁷²。由于孔的整体刚性和锥形几何形状，MspA捕获也报告了高度一致和可区分的事件特征。为了自动定量地处理传感事件，开发了一种定制机器学习算法(图23A)。尽管机器学习以前只在纳米孔传感的少数实践应用过¹³,53^,54，但人工智能工具在该领域的重要性与日俱增，为高通量传感引领的新时代做好准备⁷³。通过上述传感策略，具有L形三级结构的tRNA报告了高独特性的传感特征。这一独特特征还表明不同物种(图32A)或来源(图32B)的样品之间的高度保守性。

我们的结果证实，MspA前庭可以作为大的缢缩部位使用，与形成诸如ClyA²³、Phi29DNA连接器²⁴、FraC²⁵、PlyA/PlyB²⁶或DNA纳米孔⁷⁴的大孔互补，然而MspA优异的结构稳定性有利于样品储存、长期测量和低测量噪声。尽管在这项研究中尚未披露，但纳米孔捕获策略也已成功用于传感蛋白质或由小分子结合引起的蛋白质变构转变，这将将另行公开。遵循同样的原理，该技术的未来应用还可能包括直接传感核酶、适体或它们与小分子的相互作用。

11.方法

纳米孔测量：测量装置由两个定制的聚甲醛室组成，由一层～20μm厚的Teflon膜隔开，所述Teflon膜上有孔口(直径为～100μm)。在测量之前，首先用0.5％(v/v)十六烷(溶解在戊烷中)处理所述孔口，并静置使戊烷蒸发。然后，分别向两个室中加入500μL电解质缓冲液。将一对与膜片钳放大器电连接的定制Ag/AgCl电极分别放置在两个室中，与所述缓冲液接触。传统上，电接地的室被定义为cis室，而相对的室则被定义为trans室。将100μL的DPhPC戊烷溶液(5mg/mL)添加到两个室中。通过在任一室中上下数次吸取所述电解质缓冲液来形成脂质双层。一旦成功形成所述脂质双层，所获得的电流立即降至0pA，表明连接两个室的孔口已经完全密封。将MspA添加到cis室中以开始自发的孔插入。在插入单个纳米孔后，手动更换cis室中的缓冲液以避免更多的孔插入。

为了避免测量期间外部电磁噪声和振动噪声，所述装置被屏蔽在安装在浮式光学平台(Jiangxi Liansheng Technology)上的定制法拉第笼(34cm×23cm×15cm)中。所有电生理学测量均使用与Digidata 1550B数字化仪(Molecular Devices)配对的Axonpatch200B膜片钳放大器进行。所有单通道记录均以25kHz采样，并以1kHz截止频率进行低通滤波。使用Clampfit 10.7(Molecular Devices)，用500Hz低通贝塞尔滤波器(八极)对获得的迹线进行进一步的数字滤波。

除非另有说明，本文中的所有纳米孔测量都是cis侧为1.5M KCl缓冲液(1.5MKCl、10mM HEPES，pH 7.0)和trans侧为1M CaCl₂缓冲液(1M CaCl₂、10mM HEPES，pH7.0)的情况下进行的，并连续施加+150mV的电位。

数据分析：使用Clampfit 10.7中“单通道研究”选项识别RNA移位事件。所述机器学习算法是通过Python定制编程的。随后的分析，包括直方图绘制和曲线拟合，在Origin9.1(Origin Lab)中进行。

12.数据和代码可用性声明

基于所述机器学习的可执行软件“RNA-分类”及其代码已存放在https://drive.google.com/file/d/17JoqS2JUY-Q0Y4e5Ib0HE4PsexYtEIKq/view？usp＝sharing。图36提供了该软件的工作流程。附带了一组演示事件，用于代码验证。通讯作者可根据合理要求提供这项工作中展示的所有数据。

13.致谢

本项目由中国国家自然科学基金(批准号31972917、91753108、21675083)、江苏省高层次创业创新人才引进计划(个人和团体项目)、江苏省自然科学基金(批准号：BK20200009)、南京大学优秀研究项目(批准号ZYJH004)、生命科学分析化学国家重点实验室(批准号5431ZZXM1902)、南京大学技术创新基金项目和南京大学HPC中心的资助。

实施例2：实施例1的材料和方法

1.材料

十六烷、戊烷、乙二胺四乙酸(EDTA)、Triton X-100、Genapol X-80、氯化钙(CaCl₂)、酿酒酵母tRNA^phe、酿酒酵母总tRNA和大肠杆菌总tRNA购自Sigma-Aldrich。不含二噁烷的异丙基-β-D-硫代半乳糖苷(IPTG)、硫酸卡那霉素、咪唑、N,N,N’,N’-四甲基乙二胺(TEMED)和三(羟甲基)氨基甲烷(Tris)购自Solarbio。DNA Marker DL2000、RNA MarkerRL1000、RNA Marker RL6000、RNAiso for Small RNA、MiniBEST Universal RNAExtraction Kit和不含RNase的水购自Takara。ZR small-RNA^TM PAGE Recovery Kit购自ZYMO Research。低范围ssRNA Ladder购自New England Biolabs。SYBR Gold核酸凝胶染色剂购自Invitrogen。氯化钾(KCl)购自Aladdin。4-(2-羟乙基)-1-哌嗪乙烷磺酸(HEPES)购自Shanghai Yuanye Biotechnology。1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(DPhPC)购自Avanti Polar Lipids。大肠杆菌菌株BL21(DE3)购自Biomed。Luria-Bertani(LB)琼脂和LB肉汤购自Hopebio。氯仿购自Labol。异丙醇和脲购自GHTECH。75％的乙醇(用DEPC处理过的水制备)购自KeyGeN。40％丙烯酰胺/甲叉双丙烯酰胺溶液购自Sangon。高效液相色谱法-纯化的hsa-miR-21、siFoxA1和萤光素酶siRNA由Sangon杂交并以双链形式交付(表1)。

制备1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)和1M CaCl₂缓冲液(1MCaCl₂、10mM HEPES，pH7.0)并在使用前进行膜过滤(0.2μM乙酸纤维素；Nalgene)。使用前将RNA溶解在不含RNase的水中。如前所述¹，用大肠杆菌BL21(DE3)表达M1 MspA(D90N/D91N/D93N)和M2 MspA(D90N/D91N/D93N/D118R/D134R/E139K)并通过镍亲和色谱法纯化。编码M1或M2MspA的质粒DNA由Genescript(新泽西州)定制合成，并通过https://www.molecularcloud.org/s/shuo-huang共享。访问代码为MC_0101207(M1 MspA)和MC_0101191(M2 MspA)。大多数结果是用所述M2 MspA获得的。为了简便起见，如果没有另外说明，M2 MspA在全文中都被称为MspA。

2.方法

分子动力学(MD)模拟

所有分子动力学模拟均通过GROMACS2019⁷⁶使用CHARMM36m力场⁷⁷和TIP3P水模型⁷⁸进行。模拟系统的设置使用CHARMM-GUI网络服务器⁷⁹准备。MspA⁸⁰和tRNA⁸¹的原子坐标取自蛋白质数据库(PDB)，其条目分别为1UUN和1EVV。在实验设置之后，引入突变R96A、D93N、D91N、D90N、D118R、D134R和E139K以模拟M2 MspA的组成。加入大小为12×12nm²的1-棕榈酰基-2-油酰基-甘油-3-磷酸胆碱(POPC)脂质双层。然后在周期性边界条件的矩形水箱中对所得系统进行溶剂化。为了简化模拟，将所述系统建立在对称的KCl缓冲液电解质系统中。在随机位置添加K⁺和Cl^-离子，得到1.5M的盐浓度并中和所述模拟系统。最终系统由～22.5万个原子组成。使用光滑粒子网格Ewald方法⁸²计算长程静电相互作用。将用于计算静电相互作用和范德华相互作用的短程部分的截止值设置为1.2nm。涉及氢原子的共价键采用LINCS算法⁸³进行约束。

为了模拟tRNA移位，首先将每个系统进行1000步最小化，然后使用Berendsen弱耦合恒温器⁸⁴在NVT系综中于298K平衡0.25ns。在NPT系综中于298K和1atm下，使用Berendsen半各向同性恒压器⁸⁴对加热系统进一步平衡另外1.75ns，从而得到大小为～11.6nm×11.6nm×16.5nm的盒。用上述NVT系综从平衡模拟的最终结构开始进行移位模拟。沿着垂直于膜平面的方向施加2.0V/10nm的外部电场0.5ns，然后将所述外部电场切换到4.0V/10nm。采样模拟持续100ns，时间步长为2fs。在模拟期间，对MspA的C_α原子施加谐波位置约束，弹簧常数为500kJ/mol/nm²。在实验中，tRNA的移位通常持续约一秒，这远远超出了传统的全原子MD模拟可及的时间尺度。为了在可行的模拟时间尺度内观察到完整的移位过程，移位模拟中使用的4.0V/10nm的外部电场对应于比实验中施加的高得多的电压偏置。如先前报告的文献^85,86中所讨论的，即使在短时间MD模拟中，高电场也经常导致形成脂质双层的电穿孔，从而可能造成离子泄漏。因此，使用不同的模拟策略来避免形成脂质双层的电穿孔，例如添加位置约束⁸⁷、使用拉伸MD的推压力来驱动移位^86,88，或者使用更复杂的网格拉伸MD⁸⁹。这里，我们应用位置约束来避免形成电穿孔，其中脂质分子的所有重原子都被谐波电势限制在最小化步骤中获得结构中的位置，弹簧常数为1000kJ/mol/nm²。

为了表征模拟的tRNA移位过程，我们使用了三个反应坐标，包括碱基对氢键(H-键)数量、与原生结构的均方根偏差(RMSD)和所述tRNA的z坐标(Z)。H-键表示在原生结构中形成碱基对的核苷酸对之间的氢键数量。因此，H-键的减少对应于tRNA碱基配对的破坏。RMSD表征tRNA的整体结构变化，不仅对结构展开敏感，而且对分子的整体变形敏感。因此，可以应用H-键和RMSD来描述tRNA在移位期间的不同构象性质。反应坐标Z由移位期间引导核苷酸(图26A-C中的绿色球体)的z坐标限定。核苷酸A76、G34或U55分别被指定为用于茎向下、环向下和臂向下取向模拟的引导核苷酸。Z＝0对应于MspA孔中最窄点的z位置(图26A-C)，该位置由所有八个亚基的N90 C_α原子的质心限定。Z<0意味着引导核苷酸已经成功地移位通过所述孔。

为了模拟离子电流，从上述三种不同tRNA取向的平衡结构开始，首先在1.0V/10nm的外部电场下将系统弛豫20ns，使得tRNA与MspA的入口充分接触。采样模拟在0.09V/10nm外部电场下从弛豫结构开始，该外部电场对应于～+150mV的电压偏置，类似于实验中使用的电压偏置。采样模拟持续了100ns。我们还在更高的电场下重复进行模拟，包括0.2V/10nm和0.6V/10nm。由于脂质双层在模拟时间尺度内可以在这些电场下保持稳定，因此位置约束仅应用于MspA的C_α原子，并且脂质分子可以自由移动。根据先前的研究⁹⁰，基于离子的坐标计算瞬时离子电流。由于瞬时离子电流波动大，我们计算了累积电流。离子电流通过线性拟合从累积电流的斜率得出。除了上述三个模拟系统外，我们还对不存在任何tRNA的系统以及所述tRNA移位通过所述孔(Z<0)时的状态进行了离子电流模拟。从上述移位模拟中提取tRNA移位通过所述孔的系统初始结构。PyMOL软件用于结构可视化⁹¹。

对5S rRNA的移位进行了类似的模拟(图29)。POPC脂质双层的大小为13×13nm²。5S rRNA的原子坐标取自PDB，条目为1C2X。5S rRNA移位的最终系统由～27万个原子组成，盒子大小为～12.5nm×12.5nm×17.0nm。

从聚丙烯酰胺凝胶中回收RNA

将30μg商业性大肠杆菌总tRNA(Sigma-Aldrich)加载到12％变性脲聚丙烯酰胺凝胶中。在施加+180V的电位下连续进行凝胶电泳100分钟。用便携式UV灯(254nm)照射凝胶。切除分别含有5S rRNA或tRNA的凝胶片段以便进一步回收。使用ZR small-RNA^TM PAGERecovery Kit(ZYMO research)进行RNA回收。根据手册，将压碎的RNA片段转移到ZymoSpin^TM IV色谱柱。将400μL RNA回收缓冲液添加到所述色谱柱中，并在65℃下孵育15分钟。将所述色谱柱在-80℃冷冻箱中快速冷冻5分钟，然后在65℃下孵育5分钟。然后将所述色谱柱以1500×g离心30秒。将滤液转移到Zymo Spin^TM IIICG色谱柱，以1500×g离心30秒。向所述滤液中加入2体积的RNA MAX缓冲液并充分混合。然后将混合物转移到Zymo Spin^TM IC色谱柱，以12000×g离心30秒，弃去上清液。向所述色谱柱中加入400μL RNA制备缓冲液，以12000×g离心1分钟，并丢弃滤液。向所述色谱柱中加入800μL RNA洗涤缓冲液，并以12000×g离心1分钟，然后丢弃滤液。向所述色谱柱中加入400μL RNA洗涤缓冲液，以12000×g离心1分钟，并丢弃滤液。将所述色谱柱以12000×g离心2分钟，以确保完全除去所述洗涤缓冲液。向所述色谱柱中加入30μL不含RNase的水。静置1分钟后，将所述色谱柱以10000×g离心1分钟以洗脱所述RNA。通过nanodrop(Thermo，USA)测定洗脱的RNA浓度，并使用12％变性脲聚丙烯酰胺凝胶电泳对样品进行进一步表征。最后，将回收的RNA储存在-80℃下，用于随后的电生理学测量。所用的所有吸头和试管均不含RNase。

从大肠杆菌中提取低分子量(LMW)RNA

将大肠杆菌菌株BL21(DE3)在LB肉汤中培养，并在16℃下振荡过夜(230x rpm)。通过在4℃下以12000x g离心20分钟使细胞沉淀，并用1x PBS洗涤以去除残留的LB肉汤。收集沉积物并在1mL RNAiso for Small RNA(Takara)中裂解。剧烈涡旋后，将裂解溶液置于室温(rt)下5分钟。为了提取LMW RNA，向所述裂解溶液中加入200μL氯仿，并通过涡旋充分乳化。静置5分钟后，将混合物在4℃下以12000×g离心15分钟。当小心地从离心机中取出时，所述混合物分为三层：含有LMW RNA的无色上清液、含有蛋白质的白色中间层和含有有机溶剂的有色下层。将所述上清液转移到新的离心管中，并加入600μL异丙醇。充分混合后，将其在15～30℃下放置10分钟。将混合物在4℃下以12000×g离心10分钟以收集沉淀。将所述沉淀用1mL 75％乙醇洗涤，并在4℃下以12000×g离心5分钟，并丢弃上清液。将LMW RNA沉淀在室温下干燥30分钟。然后加入25μL不含RNase的水以溶解所述LMW RNA。通过nanodrop测定样品的浓度。使用12％变性脲聚丙烯酰胺凝胶电泳对该LMW RNA样品进行进一步表征。最后，将LMW RNA储存在-80℃下，用于随后的电生理学测量。所有使用的吸头和试管都不含RNase。

从大肠杆菌中提取高分子量(HMW)RNA

使用MiniBEST Universal RNA Extraction Kit提取大肠杆菌(BL21)DE3的高分子量(HMW)RNA(>200nt)。将大肠杆菌菌株BL21(DE3)在LB肉汤中培养，并在16℃下振荡过夜(230rpm)。通过在4℃下以13800x g离心20分钟将细胞沉淀，并用1x PBS水洗涤以去除残留的LB肉汤。向收集的细胞中加入350μL裂解缓冲液RL。将裂解物转移到gDNA Eraser离心柱中，并在20℃下以13800×g离心1分钟以去除gDNA。将滤液加入等密度70％乙醇并充分混合。将混合物转移到RNA离心柱中，并在20℃下以13800×g离心1分钟。向所述RNA离心柱中加入500μL缓冲液RWA，并在20℃下以13800×g离心30秒。丢弃滤液。向所述RNA离心柱中加入600μL缓冲液RWB，并在20℃下以13800×g离心3分钟。将所述RNA离心柱置于1.5mL不含RNase收集管上，并加入30-200μL不含RNase的水。5分钟后，通过在20℃下以13800×g离心2分钟来洗脱HMW RNA。使用nanodrop测量浓度，并使用1％琼脂糖凝胶电泳测定所需级分。最后，将HMW RNA储存在-80℃下，用于随后的电生理学测量。所用的吸头和试管不含RNase。

实施例3：miRNA传感

微RNA(miRNA)是一种小RNA分子，通过与靶mRNA结合在基因沉默和翻译阻遏中发挥作用，miRNA基本上影响所有的发育过程和疾病。因此，如何快速检测miRNA的类型、突变和修饰是极其重要的。如图37所示，我们设计了一种序列已知的DNA探针，可以与靶miRNA家族形成双链结构。然后我们可以使用MspA的宽前庭来检测杂交DNA-miRNA复合物。由于所述双链结构的两端可以部分进入MspA，因此观察到两种特征性阻塞电流(图37D)。在这种情况下，由于微小的双链体结构差异，miRNA家族之间的单碱基错配可以通过MspA很好地区分开来(图37E)。总之，纳米孔捕获技术可以快速实现超高分辨率miRNA检测。

实施例4：钙调蛋白在耻垢分枝杆菌孔蛋白A(MspA)纳米孔阱中的变构转换

1.wtCaM在Ca²⁺和靶肽结合时的变构。

制备wtCaM及其D129G突变体用于实施例5-方法1和图40-41中所述的测量。通过酶解相应的融合蛋白获得来自骨骼肌肌球蛋白轻链激酶的M13肽(残基577-602)(实施例5-方法2、图42)。所有蛋白质分析物直接用于所有下游纳米孔测量，而无需进一步纯化。使用M2MspA(D90N/D91N/D93N/D118R/D134R/E139K)在1.5M KCl、10mM HEPES(pH＝7.0)缓冲液环境中进行电生理学测量(实施例5-方法3和4)。如果没有另外说明，M2 MspA在这里被称为MspA。在将单个MspA插入膜中的情况下，将CaM的不同构象体添加到所述孔的cis侧。酸性蛋白质CaM被电泳驱动进入所述孔中，当施加连续的正电位时，它会滞留在所述前庭中，并从前庭报告捕获事件(图38b)。

首先将不含Ca²⁺的野生型CaM(apo-wtCaM)添加到cis侧至0.6μM的终浓度来进行纳米孔测量。在施加+60mV电位的情况下，观察到连续的短驻留电阻脉冲(图43a)。然而，在没有分析物的情况下没有观察到这些事件。事件出现率与所添加apo-wtCaM的终浓度成正比，表明所述事件肯定是由添加wtCaM引起的。在进行图43a中所述测量之后，将CaCl₂进一步添加到cis侧，终浓度为4mM。Ca²⁺和apo-wtCaM之间的配位立即形成Ca²⁺结合形式的wtCaM(Ca-wtCaM)。随后观察到的事件因此发生了变化，出现了驻留时间更长和阻塞程度更深的事件，在阻塞水平之上出现明显可观察到的噪声(图43b)。通过将M13肽进一步添加到cis侧来实现对Ca-wtCaM的M13肽结合形式(M13-Ca-wtCaM)的纳米孔测量。M13的终浓度从0增加到0.8μM，从而生成新型的传感事件，不同于apo-wtCaM或Ca-wtCaM(图43c、44)。通过分析物组合进行的一组测量证实，这种新型事件不是由M13肽作为唯一分析物移位产生的(图45a)。在不存在Ca²⁺的情况下，对apo-wtCaM和M13肽的混合物进行的测量也未能报告该事件(图45c)。这些结果证实，所述新的事件类型是由M13-Ca-wtCaM产生的，Ca²⁺的存在对形成该结构至关重要，这与图38a所示的机制一致。apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM的代表性事件如图43d所示，其中可以区分所有三种事件类型的特征。

为了定量描述这些事件以进行深入分析，图46中定义了事件参数，例如开孔电流(I_o)、阻塞孔电流(I_b)、阻塞幅度(ΔI)、阻塞比率(ΔI/I₀)、事件停留时间(t_off)和事件间间隔(t_on)。图43e中示出了由apo-wtCaM(874个事件)、Ca-wtCaM(571个事件)或M13-Ca-wtCaM(608个事件)引起事件的散点图，其中观察到三个完全分离的事件群。

基于每种情况的三次独立测量(N＝3，表6)，apo-wtCaM捕获事件的阻塞比率(ΔI/I₀)为51.9±1.1％，平均事件停留时间(τ_off)为5.1±0.3ms。Ca-wtCaM事件报告的ΔI/I₀为93.0±0.7％，τ_off为3.7±0.6s(N＝3)(表6)，M13-Ca-wtCaM事件报告的ΔI/I₀为83.9±0.3％，并且τ_off为0.18±0.19s(N＝3)(图6)。与apo-wtCaM和M13-Ca-wtCaM相比，Ca-wtCaM事件报告的水平波动最大，表明当限制在所述孔前庭中时，这些结构分别报告了不同的波动(图43f)。平均事件间间隔的倒数与cis侧wtCaM构象体浓度(c)成正比(图47)。由方程1/τ_on＝k_on·c定义的捕获频率作为1/τ_on与c关系图(图47)中线性拟合结果的斜率得出。如表7所概述的，apo-wtCaM的为0.89μM^-1·s^-1，高于Ca-wtCaM的(0.29μM^-1·s^-1)或M13-Ca-wtCaM的差异可能与Ca²⁺和M13肽结合对wtCaM的电中和引起的电泳力降低有关。¹⁶⁹

为了充分理解传感过程的热力学，我们进一步计算了CaM-MspA相互作用的亥姆霍兹自由能(F)，该自由能代表在MspA中保持CaM构象体的熵成本。.¹⁷⁰计算出F_Ca-wtCaM为-0.71kcal/mol，F_apo-wtCaM为-2.18kcal/mol并且F_M13-Ca-wtCaM为-1.73kcal/mol(实施例5方法5)。关于Ca²⁺或M13结合前后CaM的结构变化，Ca²⁺结合时形成CaM中心螺旋降低了Ca-wtCaM的结构柔性，从而大大降低了MspA捕获的熵成本。分子动力学(MD)模拟结果表明，三种构象体在被捕获后的均方根偏差(RMSD)的次序可能与实验测量的事件持续时间倒数的次序相关(apo-wtCaM>M13-Ca-wtCaM>Ca-wtCaM，图48)。这证实了三种构象体的构象柔性可能在事件停留时间中发挥关键作用。

还进行了电压梯度测量(图49)。一般来说，通过施加更大的电位，apo-wtCaM、Ca-wtCaM和M13-Ca-wtCaM事件的τ_off都被进一步延长，进一步证实了观察到的事件来自捕获而不是移位。在施加+80mV以上电位下，观察到apo-wtCaM的两阶跃(two-step)事件类型。这表明在+60mV下观察到的捕获事件是由松散捕获状态引起的。当施加更高的电位时，apo-wtCaM的整体结构可以进一步拉伸，以达到MspA的更深点(图49、表8)。

表6.阻塞事件的统计数据。用M2 MspA如实施例5方法1中所述进行所有测量。在测量期间连续施加+60mV电压。使用apo-wtCaM、Ca-wtCaM、apo-CaM-D129G和M13-Ca-wtCaM作为分析物。所有统计结果均从三次独立实验(N＝3)结果得出。

表7.Ca-wtCaM、apo-wtCaM、apo-CaM-D129G或M13-Ca-wtCaM的平均捕获频率捕获频率(k_on)的定义如方程1/τo_n＝k_on·c中所述，其中τ_on是平均事件间间隔，c是蛋白质分析物在cis侧溶液中的浓度。是从三次独立实验(N＝3)结果得出的平均值。将事件间间隔的倒数(1/τ_on)与所述分析物终浓度作图，平均捕获频率作为拟合结果的斜率得出(图47)。不同分析物之间的值遵循apo-wtCaM＞M13-Ca-wtCaM≈apo-CaMD129G＞Ca-wtCaM的次序。

表8.在不同电压下测得的平均阻塞比率和平均停留时间所有统计结果均从三次独立实验(N＝3)得出。

^a平均停留时间计算为步骤1和2的总持续时间。

2.用单个突变D129G探测CaM变体

最近，发现一些CaM突变体与危及生命的心律失常综合征有关。¹⁷¹这些CaM突变体显示出结构偏差，导致心脏离子通道(如电压门控Ca²⁺通道CaV1.2¹⁷²)的功能受到干扰。在此，应用MspA纳米孔阱研究了与疾病相关的突变体CaM-D129G，该突变体会产生长QT综合征(LQTS)表型。^171,173

根据MD模拟预测的结构，D129G突变可能会诱导apo-wtCaM的C-叶(C-lobe)中EF-手(EF-hand)发生结构偏差(图50a)，这可能通过纳米孔捕获检测到。在实验中，将apo-CaM-D129G添加到cis侧，终浓度为0.6μM，并施加+60 mV的连续电位。观察到了电阻脉冲事件，但在没有apo-CaM-D129G的情况下没有观察到(图51a)，这证实了所述事件肯定与apo-CaM-D129G捕获有关。apo-CaM-D129G捕获事件报告了浅型(1型)和深型(2型)阻塞，所述浅型事件类型占所有事件的大部分。ΔI/I₀平均值从每次独立测量(N＝3)678个事件的高斯拟合结果得出，这两种事件类型报告的ΔI/I₀分别是64.5±0.5％和80.0±1.1％(N＝3，图51b、表7)，它们彼此完全可分辨。然而，从未从apo-wtCaM中观察到apo-CaM-D129G两种类型的事件，这表明在纳米孔测量期间，CaM的单一突变产生了不利但可检测的捕获构象。对平均事件间间隔与apo-CaM-D129G的浓度作图，并进行线性拟合(图47)。得出的apo-CaM-D129G平均捕获效率为0.51μM^-1·s^-1(N＝3，表7)，低于apo-wtCaM的平均捕获效率(0.89μM^-1·s^-1)。为了证实事件区分，同时对apo-wtCaM和apo-CaM-D129G进行了传感(图50b)。尽管只有一个突变，但所述变体可以直观地进行区分，这表明纳米孔捕获的精细分辨率可以区分因单个氨基酸突变而不同的蛋白质。从定量角度看，ΔI/I₀与t_off的散点图与相应直方图一起进行了展示(n＝1440个事件，图50c)，观察到2个主要和1个次要事件分布。由apo-CaM-D129G 2型事件引起的次要事件分布由直方图中的绿色拟合曲线来展示。apo-CaM-D129G的τ_off(0.18±0.19s，N＝3)比apo-wtCaM的τ_off(5.1±0.3ms，N＝3)长得多，这表明所述D129G突变体比apo-wtCaM更适合所述纳米孔阱的有限空间。

最近的一项研究表明，所述突变体D129G由于C-叶内EF-手的分离而失去了结合Ca²⁺的能力，¹⁷⁴与本研究中进行的MD模拟结果一致(图50d)。为了通过实验研究这一点，在cis侧添加0.6μM的CaM-D129G和4mM的Ca²⁺情况下，纳米孔测量报告了一种阻塞更深的新型事件，类似于Ca-wtCaM的事件。在没有添加Ca²⁺的情况下也从未观察到这种新的事件类型，这证实所述事件源自Ca²⁺结合形式的CaM-D129G(Ca-CaM-D129G)。然而，在相同的测量条件下，Ca-CaM-D129G事件在连续20分钟测量中的出现率(图50e)远低于Ca-wtCaM的出现率(图50f)。为了进行定量比较，在CaM D129G的试验中，只有13％的所述事件来自Ca²⁺结合形式。然而，当对wtCaM进行相同操作时，97％的所述事件来自Ca²⁺结合形式(图50g)，这首次提供了所述D129G突变体显著降低其对Ca²⁺亲和力的单分子证据。这些发现还表明Ca²⁺与CaM每个EF结构域的结合是协同的。EF-手4中Ca²⁺结合的丧失显著影响了CaM的总体Ca²⁺结合亲和力。尽管Ca-CaM D129G和Ca-wtCaM的事件具有相似的阻塞深度，但它们仍然可以有效地根据不同的阻塞水平波动区分开来(图50h-50i，图52、54)，这进一步支持了MspA纳米孔捕获的分辨率可以识别单个突变引起的微小结构变化。

3.监测apo-wtCaM与二价离子的结合能力

尽管Ca²⁺是触发wtCaM构象变化和随后信号转导的最主要研究因素，但其他证据表明，其他离子也可以激活wtCaM。¹⁷⁵1983年，Crowell等人证明不同的离子也可以与wtCaM结合¹⁷⁶，Vogel等人通过NMR分析观察到类似的现象。¹⁷⁵随着单个分子的分辨率大大提高，在这项工作中通过MspA纳米孔捕获研究了几种二价离子(Mg²⁺/Ca²⁺/Sr²⁺/Ba²⁺/Pb²⁺)与wtCaM的结合。受Pb²⁺在KCl水溶液中溶解度低的限制，所有二价离子的浓度均设定为2mM。图55a-55e分别显示了apo-wtCaM(0.6μM)与Mg²⁺/Ca²⁺/Sr²⁺/Ba²⁺/Pb²⁺混合时的变构程度。

图43e中ΔI/I₀直方图结果表明，只有两种类型wtCaM事件，即未被Ca²⁺占据或被Ca²⁺完全占据，报告的分别为51.2％和91.7％(表8)。然而，2mM Ca²⁺浓度下的测量报告了3种ΔI/I₀分布(56.8±1.1％、75.0±2.1％和90.4±0.2％，N＝3，图53a、表8)，表明在2mM Ca²⁺存在下，wtCaM的3种状态共存。这是意料之中的，因为单个wtCaM含有4个EF-手结构域，所有这些结构域都可以结合Ca²⁺。因此，较低浓度的Ca²⁺产生瞬态结构，其中并非所有四个EF-手结构域都被Ca²⁺完全占据并且被纳米孔阱检测到。当其他二价离子与CaM结合时，也观察到这种瞬态。尽管结合离子的类型不同，但为了区别于所述瞬态，当所有四个EF-手结构域都被占据时的状态被称为holo-wtCaM。通常，ΔI/I₀高于85％的事件(图55a-55e，红色区域，即最低区域)被认为是holo-wtCaM状态，而ΔI/I₀低于60％的事件(图55a-55e，绿色区域，即最高区域，图55e中不存在)则被认为是apo-wtCaM状态。ΔI/I₀介于60％至85％之间的事件(图55a-55e，蓝色区域，即中间区域，图55b和55c中不存在)被认为是瞬态。对于Ca²⁺，在图55a右侧总结了事件类型的比率，其中54％的所述事件来自holo-wtCaM，表明Ca²⁺对wtCaM具有很强的结合亲和力。

然而，用Mg²⁺或Ba²⁺的测量未能报告与瞬态相对应事件的清晰分布。holo-wtCaM事件的比例也极低，测量值仅为4.0％或4.4％(N＝3，图55b和55c、图53b和53c以及表9)，分别表明Mg²⁺和Ba²⁺与wtCaM的结合能力均较差。对于Sr²⁺，holo-wtCaM事件的比率为14.0±2.4％(N＝3，图55d、图53d和表9)，并且可检测到瞬态事件，表明与Mg²⁺或Ba²⁺相比，Sr²⁺与wtCaM的结合能力略好。Pb²⁺显示出与wtCaM的强结合，holo-wtCaM比率为62.0±3.1％(N＝3，图55e、图53e和表9)，并且没有观察到瞬态，这表明Pb²⁺与wtCaM的整体结合能力甚至比Ca²⁺与wtCaM的整体结合能力更强。由于以前没有这种类型单分子研究的报道，我们初步建议使用holo-wtCaM事件的比率来评估不同二价离子与wtCaM的结合能力，其中总结出Pb²⁺>Ca²⁺>Sr²⁺>Mg²⁺≈Ba²⁺的顺序，这与宏观测量得出的结论一致。¹⁷⁶

无论结合离子的类型如何，所有holo-wtCaM事件都具有高度特征性的水平波动。当限制在MspA纳米孔阱中时，这些波动反映了与不同离子类型结合时holo-wtCaM的微小结构差异，这可能与二价离子的动态配位和解离有关。当相同类型的离子与wtCaM结合时，由这些波动产生的相应全点直方图模式是高度保守的(图S14-S18)。当应用不同的离子时，所述模式也可以完全区分(图55f-55j、图54-59)，再次证实了MspA纳米孔捕获在区分蛋白质与不同二价离子配位时微小结构差异方面的高传感分辨率。

表9.图53中与不同二价离子结合wtCaM的阻塞幅度直方图相对应的平均阻塞比率和各种类型阻塞事件在全部事件中的百分比(比例)。所有统计结果均由三次独立实验(N＝3)得出。

4.探测Tb³⁺结合的wtCaM

CaM的研究涉及了许多镧系元素离子，这承认了它们特征性荧光性质¹⁷⁷。例如，由于Tb³⁺和Ca²⁺具有相似的离子半径，且偏好结合带电的氧基团，因此Tb³⁺是Ca²⁺的一种极好的发光类似物，被用于研究Ca结合蛋白的离子配位和激活。^178,179然而，先前的研究表明，尽管Ca-wtCaM的性质不受高Ca²⁺浓度的影响，但当Tb³⁺([Tb³⁺])的环境浓度显著增加时，结合Tb³⁺的wtCaM往往变得功能失调。¹⁸⁰从理论上推测，Tb³⁺结合的wtCaM中可能形成明显的结构紊乱和假桥接金属配位(图60a)。.¹⁸¹然而，据我们所知，从未报道过相关的单分子观察结果。

在实验中，apo-wtCaM(0.3μM)被5μM Tb³⁺完全激活，从而形成由Tb³⁺结合诱导的激活状态(Tb-wtCaM)，并可通过MspA纳米孔捕获检测(图60b-c)。然而，当[Tb³⁺]进一步增加到150μM时，连续观察到一种新型事件，瞬态性更强，并与小的正向尖峰重叠(图60d)。Tb-wtCaM的事件逐渐消失(图60d和图61)，表明Tb-wtCaM的结构可能经历了向不同状态的转变。将[Tb³⁺]进一步滴定至500μM会导致所有事件完全消失，可能是由于wtCaM聚集所致(图60e)。这种新型事件可能来自CaM完全聚集之前的过渡状态，因此被命名为预聚集状态。图60f更详细地展示了这三种类型的代表性事件。

应用Tb-wtCaM捕获的事件间间隔的倒数(1/τ_on)来评估在不同浓度Tb³⁺的情况存在下Tb³⁺诱导的wtCaM结构变化(图60g)。当[Tb³⁺]略低于10μM时，观察到的Tb-wtCaM事件最多。相反，wtCaM可以被0.6mM Ca²⁺完全激活。随着Ca²⁺浓度进一步增加，1/τ_on保持相对恒定，表明较高浓度的Ca²⁺不会引起CaM进一步结构变化或聚集(图60h)。Tb³⁺报告的响应浓度低于Ca²⁺的响应浓度(图60g-60h)，因此，Tb³⁺与wtCaM的结合能力强于Ca²⁺的结合能力。这种差异可能是由于Tb³⁺与Ca²⁺相比具有额外的正电荷所致。还应用天然-PAGE凝胶电泳来整体表征这些过程(图62)。通过报告分子量远高于apo-wtCaM分子量的条带，我们关于高浓度Tb³⁺将诱导CaM聚集的假设得到了证实，并且通过MspA的高分辨率能够观察到中间预聚集状态，然而这在以前从未报道过。

5.MspA作为纳米孔阱的优点

MspA纳米孔捕获已经成功地在各种CaM构象体中证实了单分子区分。一个直接的问题是，当应用不同的纳米孔时，这种传感方案是如何进行的，以及未来应该如何进行优化。尽管我们无法在本研究中比较所有报道的纳米孔，但使用了另外两种类型的纳米孔进行比较，包括野生型ɑ-溶血素(ɑ-HL WT)和细胞溶素A-RR(ClyA-RR)(图63)。尽管MspA完全由蛋白质组成，但在温度高达85℃和储存时间超过3个月的极端条件下，MspA表现出超乎寻常的稳定性(图64)。这种特性可能很容易被忽视，但当作为商业传感装置的组件应用时，它是非常理想的，因为测量性能的一致性至关重要。当需要长期储存时，这种特性也有助于降低重复制孔的难度和成本(图64)。当与由α螺旋组成的纳米孔(例如细胞溶素A(ClyA)¹⁴⁹已报道它的每种新鲜制剂的储存时间较短)相比时，结构稳定性的优势更加明显。可能部分源于MspA结构稳定性的另一个优势是，在高施加电位下测量时，不会出现自发门控(图65)。

ɑ-HL也具有热稳定性，并具有长期储存的能力。然而，在85℃对ɑ-HL进行热处理或储存3个月会使得所述孔结构明显解体，这比MspA孔结构的性能稍差(图64)。从几何角度来看，ɑ-HL的孔前庭比MspA的孔前庭窄，意味着CaM的一些变构结构可能不会被所述ɑ-HL孔捕获(图63b和图66b、66c)。为了通过实验评估这种可能性，将ɑ-HL WT应用于传感wtCaM。捕获Ca-wtCaM需要的最低捕获电位为+130mV(表10和图66)，并且即使施加了很大的电位，也从未观察到apo-wtCaM的捕获。然而，当施加+45mV的最低施加电位时，用MspA实现了任一种形式wtCaM的捕获(图67)。这是预料之中，因为Ca-wtCaM的变构结构更刚性，更像杆状，因此可以更容易到达所述孔更深的点。然而，由于无法观察apo-wtCaM，限制了ɑ-HL WT对CaM其他变构状态的研究，而MspA的更宽开口能够配置更多种类蛋白质分析物结构。ɑ-HL获得阻塞事件的停留时间较短，阻塞信号的标准差较低，这表明当wtCaM被捕获时空间更加受限。详细结构波动信息的缺失也限制了ɑ-HL类似于MspA地区分CaM与不同二价离子的结合(图55)。

然而，ClyA的前庭比ɑ-HL和MspA的前庭都宽得多，因此可能更适合捕获蛋白质分析物(图63c)。将ClyA的电荷优化突变体ClyA-RR用于该比较。然而，在高施加电位下ClyA单通道记录会生成过于频繁的自发门控，干扰我们的测量(图68)。在+60mV或更低电位下进行测量未能报告任何事件的出现，可能是由于缺少足够的驱动力使CaM进入所述孔(图69)。在大多数的纳米孔传感情形下，通常优选更高的施加电位，因为当涉及电泳或电渗效应时它通过产生更大的事件幅度来提高传感分辨率，并通常提高事件的出现率。然而，更高的施加电位可能会产生一些限制，例如引入噪声或频繁的自发门控，这在大型蛋白质纳米孔中更常见。^152,157根据我们的评估，ClyA相对于去垢剂剂和长期储存的稳定性也不令人满意(图64)。

表10.不同纳米孔的最低捕获电位和稳定性。^a

^a如实施例5方法4中所述进行所有测量，但施加不同的电压。[wtCaM]＝0.9μM。

^b可以观察到捕获事件时的最低施加电位。结果提取自图66、67和69。

^c根据图64、65、66和68中的结果总结得出结论。

^d在这项工作中，在电生理测量期间没有观察到自发门控。

6.结论

我们已经使用MspA的大前庭来研究蛋白质的单分子，并且已经解析了由wtCaM和疾病相关突变体的变构转变引起的不同事件类型。评估了wtCaM与不同二价离子如Mg²⁺、Sr² ⁺、Ba²⁺和Pb²⁺的结合能力，报告的结果与NMR或荧光研究得出的先前结论一致。^175,176通过分析捕获水平的电流波动，还实现直接分辨出与不同离子结合时的CaM，这表明MspA的锥形和刚性结构提供了高分辨率。据我们所知，这是首次证实了使用MspA进行单分子蛋白质传感。我们在连续实时测量中观察到Tb³⁺诱导wtCaM聚集的不同状态。与wtCaM结合Tb³⁺的预聚集状态已被认定，但以前尚未有报道。这种浓度依赖性聚集过程揭示了Tb³⁺用作发光Ca²⁺类似物^179,180时在Ca²⁺结合蛋白研究中的应用范围。所证实的诸如高传感分辨率、无自发门控的稳定传感背景、低测量噪声、机械稳定性、孔组装一致性以及孔制备和工程化简便的优点表明，MspA可能是蛋白质传感中纳米孔的理想选择，是使用固态纳米孔^130,133、α-HL,^129,145、OmpG¹⁴⁴、FhuA¹⁴³、ClyA^134,154、FraC¹⁵²或PlyAB¹⁵¹进行纳米孔蛋白质传感现有方法的补充。

7.数据和代码可用性声明

通讯作者可根据合理要求提供这项工作中展示的所有数据。

8.致谢

作者感谢Hagan Bayley教授(University of Oxford)、Giovanni Maglia教授(University of Groningen)、Zijian Guo教授(Nanjing University)和Congqing Zhu教授(Nanjing University)的启发性讨论和对手稿提交的有益建议。本项目得到中国国家自然科学基金(批准号：31972917、91753108、21675083)、江苏省高层次创业创新人才引进计划(个人和集体项目)、江苏省自然科学基金(批准号：BK20200009)、南京大学优秀科研项目(批准号：ZYJH004)、生命科学分析化学国家重点实验室(批准号：5431ZZXM1902)、南京大学科技创新基金项目的资助。

实施例5：实施例4的材料和方法

1.材料

十六烷、戊烷、乙二胺四乙酸(EDTA)和Genapol X-80购自Sigma-Aldrich。不含二噁烷的异丙基-β-D-硫代半乳糖苷(IPTG)、硫酸卡那霉素、氨苄青霉素钠盐、三(羟甲基)氨基甲烷(Tris)和咪唑购自Solarbio。PreScission蛋白酶和PBS(磷酸盐缓冲盐水)购自Beyotime。预染色的蛋白质标准品和4-20％SDS-聚丙烯酰胺预制凝胶购自Bio-Rad，颜色编码的预染色低范围蛋白质标记物购自Cell Signaling。蛋白质凝胶的Instant Blue染色溶液购自Expedeon。氯化钾(KCl)、氯化钙(CaCl₂)、氯化钠(NaCl)、氯化镁(MgCl₂)、氯化锶(SrCl₂)、氯化钡(BaCl₂)、氯化铅(PbCl₂)，氯化铽(TbCl₃)和氢氧化钾(KOH)购自Aladdin。4-(2-羟乙基)-1-哌嗪乙烷磺酸(HEPES)购自Shanghai Yuanye Biotechnology。乙二胺四乙酸二钠盐(EDTA)购自Sigma-Aldrich。1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(DPhPC)购自Avanti Polar Lipids。大肠杆菌BL21(DE3)购自TransGen Biotech。Luria Bertani(LB)琼脂和LB肉汤购自Hopebio。氯化钾缓冲液(1.5M KCl、10mM HEPES，pH 7.0)用Milli-Q水和膜(0.2μm，Whatman)制备，并在使用前过滤。将金属氯化物溶解在Milli-Q水中作为原液，用于随后的测量。制备PbCl₂原液，浓度为100mM。制备所有其他原液，浓度为1M。

2.方法

制备钙调蛋白(CaM)

由Genescript分别合成编码CaM(包括野生型钙调蛋白(wtCaM)和CaM-D129G突变体)的基因，并将其克隆到不同的pET-20b(+)质粒中。这两种类型CaM的超量生产和纯化是在不同的批次中以相同的方式进行的。简言之，首先将相应的质粒转化到大肠杆菌BL21(DE3)中，在37℃下用100μg/ml氨苄青霉素在LB琼脂平板上培养所述大肠杆菌过夜。然后，将细胞转移到300mL LB培养基中，并以170rpm振荡直到OD₆₀₀＝0.6。向所述培养基中加入1mM IPTG，并在37℃下振荡2小时以诱导蛋白质过表达。收获所述细胞，重悬于提取缓冲液A1(50mM Tris-HCl，pH 8.0)中，并超声裂解。将裂解物在4℃下以15,871g离心30分钟。收集含有CaM的上清液，并将其应用于Hi-Trap^TM(GE Healthcare)阴离子交换柱上进行纯化。所述交换柱依次用2.5％、5％、10％、15％和25％浓度的洗脱缓冲液B1(50mM Tris-HCl、2MNaCl，pH 7.0)洗脱。收集所有洗脱的级分以进行进一步表征。CaM是一种典型的酸性蛋白质(等电点＝4.3，MW:16.8kDa)，与所述裂解物中的其他蛋白质相比，它与阴离子交换树脂具有更强的结合能力。因此，预期其被25％的洗脱缓冲液B1洗脱。图40和41显示了纯化的CaM和CaM-D129G在洗脱期间获得的UV吸收光谱以及4-20％SDS-PAGE表征结果。所述纯化的wtCaM和CaM-D129G要么立即使用，要么在-80℃下长期储存。

制备M13肽

所述M13肽是通过蛋白酶处理GST-M13融合蛋白获得的。由Genescript定制合成编码所述M13肽的基因(在序列端有终止子)，并将其克隆到pGEX-6p-1质粒(用于表达具有PreScission蛋白酶位点的GST融合蛋白的细菌载体)中。用所述质粒转化后，将大肠杆菌BL21(DE3)细胞在含有100μg/ml氨苄青霉素的LB琼脂平板上于37℃培养过夜。将单个菌落转移到300ml LB培养基中。将所述培养基在37℃下以170rpm振荡，直到OD₆₀₀＝0.8。通过添加1mM IPTG诱导超量生产，并将培养物在28℃下再孵育5小时。收获所述细胞，重悬于20mL提取缓冲液A2(PBS：135mM NaCl、4.7mM KCl、10mM Na₂HPO₄、2mM NaH₂PO₄，pH 7.4)中，并通过超声裂解。然后，将溶液在4℃下以15,871g离心30分钟以收集上清液。将所述上清液应用于GSTrap^TM(GE Healthcare)色谱柱。然后用PBS缓冲液洗涤色谱柱。然后，将色谱柱中的缓冲液改为PreScission裂解缓冲液(50mM Tris-HCl、150mM NaCl、1mM EDTA、1mM二硫苏糖醇，pH 7.0)。将PreScission蛋白酶混合物(N-末端具有GST标签)加载到色谱柱中，并在4℃下孵育8小时。M13肽是所需的蛋白质，用15ml PreScission裂解缓冲液洗脱，融合蛋白的GST部分和PreScission蛋白酶保留在色谱柱上。色谱柱最终用洗脱缓冲液B2(50mM Tris-HCl、10mM谷胱甘肽，pH 8.0)洗涤，以除去融合蛋白的结合的GST部分和PreScission蛋白酶，从而重新启动色谱柱以备将来使用。所有洗脱液均通过4-20％SDS-PAGE进行表征(图42)。

纳米孔制备。

这项工作中的大多数测量是用MspA突变体进行的，该突变体先前被命名为M2MspA(D90N/D91N/D93N/D118R/D134R/E139K)¹⁸²。为了简单起见，如果没有另外说明，M2 MspA在本手稿中都被称为MspA。其他生物纳米孔，包括野生型α-HL(WTα-HL)和ClyA-RR(D64R/C87A/L99Q/E103G/S110R/F166Y/I203V/C285S/-K294R/H307Y)也用于这项工作。如前所述^183,184，用大肠杆菌BL21(DE3)表达所有上述纳米孔，并使用镍亲和色谱法纯化。所有编码这些纳米孔的质粒DNA都共享在分子云库中(https://www.molecularcloud.org/s/shuo-huang)。

纳米孔测量和数据分析

纳米孔测量如前所述进行。¹⁸⁵测量装置由两个定制的聚甲醛室组成，由～20μm厚的Teflon膜隔开，其上具有钻开的孔口(直径为～100μm)。在测量之前，首先用0.5％

(v/v)十六烷的戊烷溶液处理所述孔口，并静置让戊烷蒸发。之后，将500μL电解质缓冲液分别添加到两个室中。用于所有电学记录的缓冲液溶液由1.5M KCl和10mM HEPES组成，pH为7.0。将两个与膜片钳放大器电连接的定制Ag/AgCl电极放置在所述室中，与所述缓冲液接触。传统上，电接地的室被定义为所述cis室，而相对的室则被定义为trans室。在向两个室中添加100μL DPhPC的戊烷溶液(5mg/mL)后，通过在任一室中上下数次吸取所述电解质缓冲液来形成脂质双层。在双层形成时，所获得的电流立即下降到0pA，表明连接两个室的孔口已经被密封。将MspA添加到所述cis室中以启动自发的孔插入。在插入单个纳米孔后，手动交换所述cis室中的缓冲液以避免更多的孔插入。

为了避免外部电磁和振动噪声的干扰，所述装置被屏蔽在安装在浮式光学平台(Jiangxi Liansheng Technology)上的定制法拉第笼(34cm×23cm×15cm)中。所有电生理学测量均使用与Digidata 1550B数字化仪(Molecular Devices)配对的Axonpatch200B膜片钳放大器进行。除非另有说明，否则所有测量期间施加的电压为+60mV。所有测量均在室温(rt)(25℃)下进行。所有单通道记录均以25kHz采样，并以1kHz的角频率进行低通滤波。

通过Clampfit 10.7中的“单通道研究”功能检测钙调蛋白(CaM)捕获事件。随后的分析，包括直方图绘制、散点图绘制和曲线拟合，通过Origin 9.2(Origin Lab)进行。

分子动力学(MD)模拟

所有分子动力学模拟均由Amber20在Amber ff14SB力场下进行。MspA纳米孔的晶体结构通过PyMOL的突变模块(R96A、D93N、D91N、D90N、D118R、D134R和E139K)从蛋白质数据库(PDB)文件(1UUN，包含A96R突变)调整而来。Ca-wtCaM、apo-wtCaM或M13-Ca-wtCaM的初始结构分别从PDB文件3CLN、1CFC或2BBN得出。基于wtCaM的晶体结构，通过PyMOL的突变模块引入了CaM的D129G突变，以进一步平衡。wtCaM构象体与MspA的对接是由SwarmDock服务器生成的，以设置Ca-wtCaM和MspA的初始相对位置。¹⁸⁶SwarmDock的预处理阶段涉及使用CHARMM分子力学包修复无序环、建模缺失原子和翻译后修饰，以及最小化输入结构。¹⁸⁷通过CHARMM-GUI服务器添加了1-棕榈酰基-2-油酰基-甘油-3-磷酸胆碱(POPC)脂质双层和1.5MKCl。¹⁸⁸Amber20提供的tleap模块用于填充复合系统中缺失的氢原子，所述系统通过添加K⁺离子来中和。将MspA-wtCaM复合物系统浸入在周期性TIP3P立方水盒中。tleap程序用于生成MD模拟所需的拓扑文件。

为了模拟MspA中wtCaM捕获，首先以2.0fs的时间步长对MspA捕获的apo-wtCaM、Ca-wtCaM或M13-Ca-wtCaM构象体进行10,000步最小化。然后加热过程是在300K和1.0atm下以Langevin动力学进行的，持续5ns。在采样模拟中，将SHAKE算法应用于所有含氢的键，以实现2.0fs的时间步长。Particle Mesh Ewald被用于静电和范德华相互作用学，真实空间截止值为的。此外，对所述MspA纳米孔施加了力常数为的位置约束，以约束孔的形状。蛋白质-孔相互作用的自由能F用于克服将CaM挤压到细窄孔中的熵成本，其估算方程为：

F＝k_BT ln(T_t/T_total) (方程1)¹⁸⁹

其中T_t是可测量的特征时间参数，T_total是总记录时间，T_t/T_total为所述蛋白质在所述孔内所测量的驻留概率(Pr)。因此，根据实验得出的F，沿着垂直于膜平面的方向连续进行弱恒力拉伸模拟以模拟实验中的恒定流。每次采样模拟持续100ns。

为了比较MspA对不同wtCaM构象体的捕获能力，总结了相对于初始结构的均方根偏差(RMSD)，用于定量比较构象波动(图48)。PyMOL和VMD用于平衡结构的可视化和轨迹可视化。

视频S1.随机传感apo-wtCaM。用M2 MspA进行电生理学记录(实施例5方法)。将apo-wtCaM添加到cis侧，终浓度为0.6μM。在+60mV连续施加电位下，观察到由apo-wtCaM捕获引起的高度一致的电阻脉冲。为了便于展示，所述视频以1/5的数据采集速度重放。

视频S2.随机传感Ca-wtCaM。用M2 MspA进行电生理学记录(实施例5方法)。将apo-wtCaM和CaCl₂添加到cis侧，每种组分的终浓度为0.6μM和4mM。apo-wtCaM和Ca²⁺之间的自发结合形成Ca-wtCaM。在+60mV连续施加电位下，观察到由Ca-wtCaM捕获引起一致的电阻脉冲。为了便于展示，所述视频以1/5的数据采集速度重放。

视频S3.随机传感M13-Ca-wtCaM。用M2 MspA进行电生理学记录(实施例5方法)。将Ca-wtCaM和M13肽添加到cis侧，每种组分的终浓度分别为0.6μM和1.0μM。Ca-wtCaM和M13肽之间的自发结合形成复合物M13-Ca-wtCaM。在+60mV连续施加电位下，观察到由M13-Ca-wtCaM捕获引起一致的电阻脉冲。为了便于展示，所述视频以1/5的数据采集速度重放。

视频S4.随机传感Pb-wtCaM。用M2 MspA进行电生理学记录(实施例5方法)。将apo-wtCaM和PbCl₂添加到cis侧，终浓度为0.6μM和2mM。apo-wtCaCM和Pb²⁺之间的自发结合形成Pb-wtCaM。为了便于展示，所述视频以1/5的数据采集速度重放。

视频S5-S7.CaM捕获的模拟轨迹。如实施例3方法中所述进行MD模拟。使用八聚体M2 MspA作为纳米孔阱(灰色高脚杯状孔蛋白)。将apo-wtCaM(视频S5)、Ca-wtCaM(视频S6)或M13-Ca-wtCaM(视频S7)分别用作待捕获的分析物。根据图48d中的结果，任一种CaM构象体类型的捕获都已达到稳定状态。具体而言，apo-wtCaM的捕获表现出的结构波动最高(视频S5)。Ca-wtCaM在MspA内腔中滞留得更深。因此，Ca-wtCaM的捕获报告了最低的结构波动(视频S6)。由于其椭圆形结构，只有一小部分M13-Ca-wtCaM可以滞留在MspA内腔中，从而报告了中等的结构波动(视频S6)。所有结构均由NewCartoon和VDW(范德华)绘制。为了便于展示，所有CaM结构都是蓝色的(视频S5-S7)。所有的钙离子都是黄色的(视频S5-S6)。所述M13肽是橙色的(视频S7)。所有展示的视频都是通过100ns模拟生成的。为了便于展示，所有三个视频都在33s期间内重放。

实施例6：一般蛋白质传感

如图70-76所示，在钙通量存在的情况下，通过优化的MspA纳米孔阱可以有效地捕获pH为7.0的电荷不同的蛋白质。第一，溶菌酶作为典型的碱性蛋白质分析物，证明了钙通量对蛋白质分析效率的优化作用(图70和71)。通过组合使用1.5M KCl(cis)/1M CaCl₂(trans)同时保持所有其他条件相同，捕获频率(1/τ_on)和事件停留时间(τ_off)明显高于1.5MKCl(cis)/1.5M KCl(trans)组的捕获频率(1/τ_on)和事件停留时间(τ_off)。这一结果可能是由于MspA内腔与Ca²⁺偶联后带正电，此时在+100mV下从cis侧到trans侧存在额外电渗流(EOF)所致。第二，肌红蛋白和不含血红素的肌红蛋白(脱辅基肌红蛋白)这两种相对中性的蛋白质，也可以用优化的MspA纳米孔阱来区分，因为脱辅基肌红蛋白阻塞电流的波动范围(用幅度标准差量化)明显大于肌红蛋白阻塞电流的波动范围(图72和73)。第三，固有非结构化蛋白质结构域(IUP)ACTR和NCBD可以相互结合并折叠成二元折叠良好的复合物，这一过程中不同的构象变化被表征(图74)。在相同的实验条件下，所述MspA纳米孔阱表现出强大的辨别能力，在钙通量存在的情况下，上述所有具有不同电荷、尺寸和结构的蛋白质分析物都能够在+100mV下被辨别出来(图75)。阻塞效率(ΔI/I₀)和事件停留时间(t_off)可能是主要的判别标准。最后，已经证明，在钙通量下MspA纳米孔阱更容易捕获酸性蛋白质α-乳白蛋白(图76)。施加的电压甚至可以降低到+20mV或更低，这可能是由于其在pH为7.0时的负电荷所致。

实施例7：在机器学习辅助下对耻垢分枝杆菌孔蛋白A(MspA)电渗阱中不同电荷蛋白质进行同时结构分析

纳米孔正在成为一种单分子蛋白质传感的手段。然而，蛋白质表现出不同的电荷特性，这使得能够实现同时传感不同电荷蛋白质的传感器的设计变得复杂。在本实施例中，我们引入了不对称电解质缓冲液，与耻垢分枝杆菌孔蛋白A(MspA)纳米孔结合以形成电渗流(EOF)阱。脱辅基肌红蛋白和全肌红蛋白仅在单个血红素方面不同，可以通过MspA提供的高分辨率完全区分。所述MspA EOF阱同时实现了对溶菌酶、脱辅基肌红蛋白/全肌红蛋白和ACTR/NCBD蛋白质复合物的直接辨别，这三种蛋白质分别是碱性蛋白质、中性蛋白质和酸性蛋白质。为了自动进行事件分类，提取了多个事件特征来构建机器学习模型，准确度达到99.9％。所证明的方法也被应用于直接从乳清蛋白粉中识别ɑ-乳白蛋白和β-乳球蛋白的单分子。这种蛋白质传感策略可用于从混合物中直接识别蛋白质，表明它有望用于快速灵敏地检测生物标记物或进行实时蛋白质结构分析。

我们将所述不对称电解质组合应用于所述MspA纳米孔阱以进行蛋白质结构分析。积聚的多价阳离子与带负电荷的孔内腔紧密结合，有望在纳米孔中转换有效表面电荷并触发产生EOF。使用等渗不对称电解质缓冲液组合(cis：1.5M KCl/trans：1M CaCl₂)，使得电荷不同蛋白质的捕获效率显著提高，单个蛋白质捕获的持续时间显著延长，从而在机器学习算法的辅助下，为蛋白质识别提供了丰富的信息。

结果和讨论

在钙通量存在下的MspA纳米孔阱。使用M2 MspA突变体

(D90N/D91N/D93N/D118R/D134R/E139K，实施例8-方法2)进行所有电生理学测量(图77a)。为了简便起见，在整个此实施例中将M2 MspA称为MspA。电接地的室被定义为所述cis室，而相对的室则被定义为所述trans室。除非另有说明，否则所有测量都是在不对称电解质中进行的：cis侧为1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)且trans侧为1.0MCaCl₂缓冲液(1.0M CaCl₂、10mM HEPES，pH 7.0)。在将单个MspA插入所述膜中之后，将所述蛋白质分析物添加到所述cis室(实施例8-方法1)。

溶菌酶是一种抗微生物酶，它形成动物先天免疫系统一部分的，使用它作为代表性碱性蛋白质，等电点(pI)为11。²²⁸为了证明不对称电解质组合的作用，用1.5M KCl(cis)/1.5M KCl(trans)的对称电解质组合和1.5M KCl(cis)/1.0M CaCl₂(trans)的不对称电解质组合来评估传感性能。在连续施加+100mV电位并添加溶菌酶至终浓度为0.42μM的情况下，在两种测量条件下都观察到连续出现电阻脉冲(图77b和77e)。为了进行定量比较，图77b和77e中定义了事件参数，例如开孔电流(I_o)、阻塞孔电流(I_b)、阻塞幅度(ΔI)、阻塞比率(ΔI/I₀)、事件停留时间(t_off)和事件间间隔(t_on)。生成了两种条件下t_off和t_on的直方图。平均事件停留时间(τ_off)(图77c、77f)和平均事件间间隔(τ_on)(图77d、77g)分别从单指数拟合结果得出。结果表明，当使用不对称电解质组合进行测量时，通过改变所述电解质溶液同时保持所有其他条件相同，平均事件停留时间(τ_off)显著延长至47.3±3.5ms，N＝3(表11)。这明显比通过对称电解质组合获得的平均事件停留时间(5.4±0.2ms，N＝3，表11)长。同时，在所述不对称电解质组合情况下也观察到事件出现率显著增加。在这种情况下，因此τ_on减少至1/12，从460.7±51.2ms减少到38.0±11.0ms，N＝3(表11)。不对称电解质的组合(1.5M KCl(cis)/1M CaCl₂(trans))提高了纳米孔捕获的效率，并且延长了事件驻留时间，从而在数据采集期间提供了事件特征的更多信息。

最近研究表明，在电生理学测量中使用多价阳离子，例如Mg²⁺和La³⁺，可以在纳米孔中产生局部电荷倒置，^229-232因为积累的多价离子可以改变所述纳米孔表面电荷分布。所述孔内腔中的表面电荷分布与EOF的产生有关，EOF是一种不同于电泳力的潜在驱动力，用于在所述纳米孔中捕获分析物。^209-212因此，不对称电解质组合可以优化MspA的蛋白质传感能力。为了消除电泳力的干扰，将电中性分子^233-234三甲基-β-环糊精(三甲基-β-CD)作为测试分析物应用，以探测MspA中EOF的产生(图77h-77i)。在不同的电解质缓冲液组合中，证实了使用MspA进行三甲基-β-CD传感的电压依赖性。当施加电压从-150mV增加到+150mV时，在两种测试条件下，事件出现的频率都增加了，这证实了当施加正电压时，存在从cis侧到trans侧的EOF。在trans侧存在CaCl₂的情况下，这种现象大大增强了(图77i)，表明产生了更强的EOF。然而，当两个电解质室都填充CaCl₂时，作为分析物的三甲基-β-CD和溶菌酶的事件出现率都显著降低(图83)。尽管二价阳离子将与所述MspA内腔中带负电荷的氨基酸(例如D32、E39、D56、E57、E59、E63和E127)紧密配位，从而产生EOF²³⁵(图84)，但将CaCl₂置于cis侧可能会在分析物进入所述孔之前触发cis侧Ca²⁺与所述分析物结合。这是不利的，因为在所述分析物上添加的正电荷可能诱导方向与所述孔相反的EPF，这导致检测率大幅下降。因此，它证实了不对称缓冲液条件具有优势。

还分析了溶菌酶捕获的结果(图85)。获得的平均阻塞比率为34.4±0.15(N＝3，2580个事件，表12)。如图85d和表13所示，随着溶菌酶终浓度增加，捕获事件出现得更频繁。同时，当施加电压从+60mV增加到+120mV时，溶菌酶的1/τ_on和τ_off都先延长后缩短(表14，图85e-85f、83a)。由于溶菌酶在测试缓冲液环境中带正电荷，电泳力(EPF)与EOF方向相反。当施加电压低于+80mV时，与EPF相比，EOF可能作为更主要的驱动力。²³⁵当电压高于+100mV时，EPF的影响增强，使得溶菌酶的逃逸时间更短并且捕获效率更低。

脱辅基肌红蛋白和全肌红蛋白的区分。肌红蛋白是一种发现于骨骼肌损伤或肾功能不全后的人体血液中电中性蛋白质，是一种灵敏的疾病标记物。^236-237无血红素(apo-)和血红素(holo-)结合形式的肌红蛋白在结构和电荷特性上的细微差异使其成为合适结构方法学研究的模型蛋白质(图78a)。²³⁸因此，将肌红蛋白应用于评估所述MspA阱的传感分辨率。

将脱辅基肌红蛋白添加到cis侧，终浓度为0.14μM，进行纳米孔测量。在+100mV的施加电位下，观察到连续电流阻塞(图78c和78c)。观察到的脱辅基肌红蛋白的阻塞事件显示出阻塞水平之上独特的噪声波动，在某些阻塞情况下，会产生进一步的阻塞水平(步骤2)。阻塞延长可能是由于将脱辅基肌红蛋白进一步拉伸到达孔内腔中更深位置引起的，但为了避免步骤2的干扰，将分别讨论两个步骤的事件特征(图78b)。随着脱辅基肌红蛋白浓度增加，平均事件间间隔逐渐缩短，表明所述事件肯定是由添加脱辅基肌红蛋白引起的(图86g)。对于每种情况，记录三次独立测量的结果，并用于支持深入分析(N＝3，表11和12)。脱辅基肌红蛋白捕获事件的平均事件停留时间为531.0±27.5ms。可观察到噪声的阻塞水平(阶跃1)的平均阻塞比率为51.3±0.2％，阻塞电流的标准差(幅度标准差)为13.6±0.2pA，而观察到的进一步阻塞水平(阶跃2)的平均阻塞比率为89.1±0.3％(图86e)。

将肌红蛋白的辅因子血红素进一步添加到cis侧以与脱辅基肌红蛋白配位。当血红素的终浓度从0增加到0.15μM时，开始出现不同类型的传感事件(图78c-78f)。在cis侧含0.15μM血红素的情况下，肌红蛋白的状态完全改变(图78f)。新型捕获事件的幅度标准差为6.0±0.2pA，平均阻塞比率为47.6±0.3％(表12)。然而，当将血红素作为唯一分析物添加到cis侧且终浓度为0.2μM时，没有观察到可检测的事件，这证实了这种新型事件不是由血红素移位产生的(图87)。用标准全肌红蛋白样品进行的一组测量表明，这种新的事件类型对应于全肌红蛋白，因为将标准全肌红蛋白样品添加到cis侧且终浓度为0.26μM将产生特征相同的事件(图86d)。上述单分子结果表明，从脱辅基肌红蛋白到全肌红蛋白的转化率接近100％。这也在相应的UV-Vis吸收光谱测定中得到了验证(图88)，并得出了相同的结论。全肌红蛋白标准捕获事件的平均事件停留时间(588.1±43.2ms)、平均阻塞比率(47.4±0.2％，表12)和幅度标准差(5.8±0.1pA，表12)与图78f中事件平均事件停留时间、平均阻塞比率和幅度标准差一致。脱辅基肌红蛋白的和幅度标准差都高于全肌红蛋白的和幅度标准差，这证实了在没有血红素的情况下脱辅基肌红蛋白的结构更疏松，并且在MspA内腔中具有更多可相互转换的亚状态。²³⁹此外，对混合物中全肌红蛋白标准品和脱辅基肌红蛋白标准品进行同时传感。图78d-78e中将血红素连续滴定到脱辅基肌红蛋白期间的所有事件特征都可以在标准品混合物的同时传感中重现(图89b、89c)，并在散点图(图89d)中显示出相同的分布。两种形式的肌红蛋白都可以在初始电流迹线或通过Clampfit用50Hz高通贝塞尔滤波器(8极)滤波的电流迹线中直观地分辨出来(图89b)，这表明MspA的精细分辨率可以识别辅因子结合或解离引起的蛋白质构象变化。

通过施加更大的电位，全肌红蛋白事件的τ_off和1/τ_off值增大(图90a-90b、95b-95c和表14)，证实了观察到的事件来自捕获而非移位。然而，当电压增加到+100mV时，脱辅基肌红蛋白的τ_off仅系统性地延长，在更高的电压下没有观察到进一步延长(图90c、90d和表14)。我们推测，当施加电压高于+100mV时，EPF对脱辅基肌红蛋白的影响比对全肌红蛋白的影响更大，因为脱辅基肌红蛋白具有的等电点(pI＝8.5)²²⁸比全肌红蛋白(pI＝7.3)²⁴⁰更高。此外，在所有其他条件相同的情况下，将trans侧的电解质改为1.5M KCl也会显著降低脱辅基肌红蛋白和全肌红蛋白的阻塞事件频率，并缩短逃逸时间 (图91、表11)。

ACTR/NCBD复合物的单分子捕获。接下来，采用p160类固醇受体共激活因子(ACTR，理论pI＝4.1，实施例8-方法3)和CREB结合蛋白的核共激活因子结合结构域(NCBD，理论pI＝11.1，实施例8-方法3)作为代表性固有无序蛋白质(IDP)，以通过纳米孔阱进行探测。这些IDP的相互诱导折叠过程仅通过混合来激活²⁴¹，从而致使形成所述ACTR/NCBD复合物(理论pI＝5.75，实施例8-方法3)(图79a和79b)。预计这些结合和未结合的蛋白质状态将产生由无序蛋白质结构域及其结合复合物之间的构象差异引起的电流变化。

通过酶解相应的GST融合蛋白获得ACTR和NCBD(实施例8-方法3，图92和93)。如图79c和79d所示，在独立添加ACTR或NCBD且终浓度为1.28μM后，分别报告了尖峰样短驻留移位事件。由于ACTR和NCBD移位显示的平均阻塞比率分别为24.6±0.5％和62.6±0.5％(N＝3，图94a、94b和表12)，两种分析物均被所述纳米孔清楚区分出来。此外，随着蛋白质分析物浓度增加，ACTR和NCBD的平均事件间间隔逐渐缩短，表明所述事件确实是由添加蛋白质分析物造成的(图94e和94f)。

将ACTR和NCBD以等摩尔比混合5分钟后，将混合物添加到cis侧。形成折叠的ACTR/NCBD复合物，在随后的纳米孔测量期间表现出新型的单一构象状态，不同于ACTR或NCBD的构象状态(图79e)。ACTR/NCBD复合物的阻塞事件表现为驻留事件(N＝3，图79h和表11)，其比ACTR的驻留事件( N＝3，图94c和表11)或NCBD的驻留事件(N＝3,Figure94d和Table 11)要长。此外，ACTR/NCBD复合物的阻塞水平存在明显的波动噪声(图79f)，幅度标准差为25.0±0.6pA(N＝3，表12)。据推测，电流波动可能是由所述ACTR/NCBD复合物在被捕获在所述内腔中时的动态结构自调节引起的。根据直方图ΔI/I₀拟合的结果(图79g)，阻塞幅度(I_b)显示出比两种固有无序蛋白质(IDP)的阻塞幅度(I_b)更均匀的分布，这证明形成了折叠良好的蛋白质结构。随着所述ACTR/NCBD复合物的终浓度增加，的值与此同时增加(图79i)，表明所述阻塞事件来自所述MspA纳米孔阱中的ACTR/NCBD-复合物。此外，正如考虑到带电性质所预期的那样，当电压增加时，cis侧带负电荷的ACTR/NCBD复合物受到更强的EOF和EPF，从而使得捕获频率增加(图95d)。在对称电解质缓冲环境(1.5M KCl)中进行了类似的实验，但所述ACTR/NCBD复合物的捕获效率和分析持续时间大大降低(图96)，表明不对称电解质组合有助于捕获带负电荷的蛋白质。尽管作用于所述ACTR/NCBD的EOF和EPF在同一方向，而作用于溶菌酶的EOF与EPF方向彼此相反，但与溶菌酶的捕获(图77f)，ACTR/NCBD的捕获展示出更短的τ_on(图79h)。这种现象似乎有悖于直觉。然而，这表明事件停留时间也可能受到蛋白质分析物的整体结构或孔与分析物之间相互作用的影响。

人工智能辅助分析不同电荷的蛋白质。在不对称电解质缓冲液组合的辅助下，具有不同电荷和结构性质的溶菌酶(pI＝11)、全肌红蛋白(pI＝7.3)、脱辅基肌红蛋白(pI＝8.5)和ACTR/NCBD复合物(理论pI＝5.75)都可在相同的测量缓冲液条件下检测到(图80a、80b)。不同的蛋白质类型报告了一致和独特的阻塞特征，这表明使用相同的纳米孔同时区分这些蛋白质分析物的可行性。实验中，在插入单个孔的情况下，将所述蛋白质分析物按溶菌酶(0.16μM)、全肌红蛋白(0.35μM)，ACTR/NCBD复合物(1.28μM)和脱辅基肌红蛋白(0.18μM)的顺序依次添加到cis侧(图80c、80e、80g、80i)。阻塞事件的ΔI/I₀逐渐出现了四种不同的分布(33.9％、47.4％、51.5％和68.8％，图80d、80f、80h、80j)。根据先前独立测量获得的统计结果(表12)，这些分布分别对应于溶菌酶、全肌红蛋白、脱辅基肌红蛋白或ACTR/NCBD复合物的捕获。这里的尺寸排阻并不是影响电流阻塞程度的唯一因素，因为阻塞比率与所述四种蛋白质分析物的分子量和尺寸不是线性相关的。在图80j示出ΔI/I₀与t_off或幅度标准差的事件散点图(n＝542)，其与连续记录的同时传感的迹线相对应。由不同蛋白质生成的事件特征在所述散点图中形成了四种不同的分布群。

我们建立了一种辅助自动蛋白质识别的人工智能(AI)算法(实施例8-方法1)。所述策略是训练AI从训练数据中“学习”，以建立最佳分类模型对未知纳米孔事件进行分类，类似于之前纳米孔研究中所使用的分类。^227,242-244当不同分析物引起的事件只能通过同时分析多个事件特征来区分时，所述策略尤其有用。为了训练所述模型，组合了几个训练数据集。首先从原始时间电流迹线中提取纳米孔事件(图97)，然后使用MATLAB自动提取阻塞电流的七种特征，包括平均值(mean)、峰度(kurt)、偏度(skew)、停留时间(time)、分布中心值(peak)和噪声(FWHM)，以形成特征矩阵(图97)。溶菌酶(n＝785个事件)、全肌红蛋白(holoMB，n＝763)、ACTR/NCBD复合物(ACTR_NCBD，n＝673)和脱辅基肌红蛋白(apoMB，n＝701)的特征矩阵具有已知的身份，因为它们是在用单个已知分析物进行测量期间生成的。然后，该特征矩阵形成训练数据集(图81a)。

使用MATLAB的分类学习器工具箱进行模型训练。评估了一组分类器，包括决策树分类器、判别分析分类器、支持向量机(SVM)分类器、K近邻算法(KNN)分类器、朴素贝叶斯分类器、集成学习分类器和神经网络分类器(图81a)。对每个模型进行10倍交叉验证，以报告交叉验证的准确度(图98)，所述10倍交叉验证将数据集随机划分为用于模型训练的训练子集以及用于针对实施偏倚进行模型参数微调和模型验证的验证子集。总体而言，所有模型都表现出令人满意的验证准确度，集成分类器的袋装树模型表现出的分数最高。如混淆矩阵所示(图81b)，使用袋装树模型的集成分类器在每个类别中都表现良好。对于溶菌酶和全肌红蛋白，每个真实类别(TPR)中正确分类观察结果的比例为100％。673个ACTR/NCBD阻塞事件和673个脱辅基肌红蛋白阻塞事件中只有2个被错误分类(TPR＝99.9％)。袋装树模型特征的平行坐标图显示，所有7种特征都在事件分类中发挥作用。特别是，“均值”和“峰”的特征贡献最大，因为在所述图中显示清晰的事件分界线(图81c)。为了评估训练的效率，使用不同数量的训练数据进行模型训练，并报告交叉验证的准确度。结果被绘制为学习曲线(图81d)，根据所述学习曲线，在仅输入从整个训练数据集所有2922个事件中随机选择的180个训练事件的情况下，总体预测准确度达到0.990。训练数据准确度和交叉验证准确度之间的比较(图81d)也证实了模型中没有出现过拟合，860个的采样数足以达到99.8％的准确度得分。

接下来导出经过训练的模型来预测身份未知的事件，如图80所示。连续添加溶菌酶、全肌红蛋白、ACTR/NCBD复合物和脱辅基肌红蛋白期间的事件特征被提取，形成所述预测数据集，随后通过先前训练过的袋装树模型进行识别(图81e)。图81f总结了每种类型蛋白质的比例，清楚地表明无论何时新添加蛋白质分析物，预测结果都会报告相应事件的出现。

机器学习辅助乳清蛋白识别。

将所述MspA EOF阱和所述机器学习算法进一步应用于识别商业性乳清蛋白粉中蛋白质成分。乳清蛋白约占所有乳蛋白的18％-20％。它被广泛用作蛋白质补充剂，以提高运动成绩。乳清蛋白的主要蛋白质组分包括α-乳白蛋白和β-乳球蛋白，以及少量其他蛋白质和肽。²⁴⁷

在实验中，在每次连续施加+30mV电位测量期间，首先分别将α-乳白蛋白或β-乳球蛋白作为唯一分析物进行分析。收集相应的纳米孔事件以形成训练数据集(图6a)。简言之，α-乳白蛋白的捕获显示出两种类型的事件，阻塞比率不同且幅度标准差低(图82b-82d)。相反，β-乳球蛋白的捕获使得阻塞水平波动，形式为高噪声状态和低噪声状态之间的交替转换(图82e-82g)。然后，将市售纯度为99％的乳清蛋白粉(Swisee^TM)添加到cis侧，终浓度为25μg/ml，并且进行与ɑ-乳白蛋白或β-乳球蛋白纳米孔测量相同的纳米孔测量。收集了1000个纳米孔事件，其中109个事件被识别是“其他”，因为在将ɑ-乳白蛋白或β-乳球蛋白作为唯一分析物的测量中从未观察到这些事件。这些“其他”事件主要源自MspA检测到的其他低丰度乳清蛋白，并用作训练数据集的一部分(图82a)。

从α-乳白蛋白标准品(n＝301个事件)、β-乳球蛋白标准品(n＝253个事件)和“其他”(n＝109个事件)的事件中提取7种事件特征，形成训练数据集(图99a)。训练过程进行的工作流程与图5所示的相同。评估了一组分类器(图100)，其中袋装树模型的验证准确度最高(98.3％)，总成本最低(11)。混淆矩阵显示，α-乳白蛋白、β-乳球蛋白和“其他”的TPR分别为100％、98.4％和93.6％(图99b)。所有事件特征都在事件分类中发挥作用，以根据平行坐标图描述每种分析物的独特阻塞事件(图99c)。此外，通过10倍交叉验证生成的学习曲线(图99d)显示没有出现过拟合，因为对于训练数据集和预测数据集来说，用超过375个训练样品训练的分类模型具有相同的预测能力。

然后使用所述袋装树模型来识别乳清蛋白中的成分(图82h)。从单通道记录迹线来看，对应于α-乳白蛋白、β-乳球蛋白和“其他”的事件(图82i，n＝333个事件)被自动分类。统计数据显示，所有获得的事件的51.4％被识别为β-乳球蛋白事件，39.6％被识别为α-乳白蛋白事件(图82j)。此外，α-乳白蛋白和β-乳球蛋白阻塞事件的计数以及添加的乳清蛋白浓度显示出线性相关性，R平方分别为0.996或0.987(图101)。值得注意的是，终浓度仅为0.4μg/ml的乳清蛋白可以在5分钟内产生10次以上的有效捕获事件(图101a)，这表明MspA-EOF阱的灵敏性。

结论

基于耻垢分枝杆菌孔蛋白A(MspA)的电渗阱已得到证明。应用不对称缓冲液组合对于生成EOF至关重要，将蛋白质捕获效率提高了7～18倍，并可以将事件停留时间延长达159倍(全肌红蛋白)(表11)。我们的结果证实了所述孔内腔中EOF和EPF之间的平衡，这与最近发表的理论模型²³⁵预测的结果定性一致。然而，为了定量描述用特定孔和分析物获得的结果，可能需要全原子分子动力学模拟。

由于锥形内腔的几何形状能够实现高分辨率传感，MspA清楚地区分脱辅基肌红蛋白和全肌红蛋白²³⁹。还清楚地识别了固有无序蛋白质(ACTR和NCBD)及其双分子复合物之间的结构差异。一般来说，MspA EOF阱表现出的结构一致性精确到原子精度，这是任何固态纳米孔都无法实现的。这对于保证不同批次孔之间测量一致性非常重要。与其他生物纳米孔例如ClyA²⁴⁸、FraC²⁰⁹和PlyAB²¹³相比，MspA的优势在于它的组装稳定性和结构刚性大大增强，没有自发门控，而且提供的测量性能噪声低且高度一致。MspA的锥形内腔几何形状也为同时处理更大尺寸范围的蛋白质分析物提供了优势。

所述EOF阱还展示了同时传感代表性酸性蛋白质(例如所述ACTR/NCBD复合物)、碱性蛋白质(溶菌酶)和中性蛋白质(脱辅基肌红蛋白和全肌红蛋白)。这是第一次同时分析具有明显电荷性质差异的蛋白质。先前报道的纳米孔阱例如ClyA²¹⁹和FraC²⁰⁹已被证明更适合于分析带正电荷的蛋白质。带负电的蛋白质的不利信号通常需要通过降低测试缓冲液的pH或向蛋白质分析物引入带电偶极来消除。然而，在pH＝7.0的缓冲液条件下，pI＝5.75、7.3、8.5或11的蛋白质可以同时被MspA纳米孔阱捕获，并且可以可靠地识别所述蛋白质的身份。这些结果表明，cis侧1.5M KCl和trans侧1M CaCl₂的组合可以优化用于蛋白质结构分析的MspA捕获。通过对单个捕获的蛋白质进行实时观察，可以以高分辨率获得诸如配体/蛋白质相互作用动力学或所述蛋白质构象变化的有价值信息，可用于蛋白质科学的基础研究。

还开发了一种基于机器学习的蛋白质分类器以实现数据分析自动化。分类算法基于同时考虑多种事件特征。因此，这有利于区分仅基于阻塞幅度难以区分的事件。在区分溶菌酶、ACTR/NCBD复合物、全肌红蛋白和脱辅基肌红蛋白方面，报告的验证准确度也达到了令人印象深刻的99.9％。所述MspA EOF阱和所述机器学习分类器也应用于直接从乳清蛋白粉中识别ɑ-乳白蛋白和β-乳球蛋白，这表明所开发的方法和所述分类器算法作为分析工具通用于多种蛋白质类型。自动算法还节省了人力，避免了人为主观判断造成的错误。

数据可用性声明

通讯作者可根据合理要求提供这项工作中展示的所有数据。

致谢

本项目得到了中国国家自然科学基金资助(批准号：31972917、91753108、21675083)，中央高校基本科研业务费专项资金(批准号：020514380257、02051480261)、江苏省高层次创业创新人才引进计划(个人和团体项目)、江苏省自然科学基金(批准号：BK20200009)、南京大学优秀研究项目(批准号：ZYJH004)、上海市市级科技重大专项、生命科学分析化学国家重点实验室(批准号：5431ZZXM1902)、南京大学技术创新基金项目、中国博士后科学基金项目(批准号2021M691508)支持。

实施例8：实施例7的材料和方法

材料

十六烷、戊烷、乙二胺四乙酸(EDTA)、谷胱甘肽(GSH)、脱辅基肌红蛋白(源于马骨骼肌)、溶菌酶(源于鸡蛋清)、ɑ-乳白蛋白(源自牛乳)和Genapol X-80购自Sigma-Aldrich。β-乳球蛋白(来自牛乳)购自RHAWN。乳清蛋白粉购自Swisse^TM。亚铁血红素购自CSNpharm。不含二噁烷的异丙基-β-D-硫代半乳糖苷(IPTG)、硫酸卡那霉素、氨苄青霉素钠盐、三(羟甲基)氨基甲烷(Tris)和咪唑购自Solarbio。

PreScission蛋白酶和PBS(磷酸盐缓冲盐水)购自Beyotime。预染色的蛋白质标准品和4-20％SDS-聚丙烯酰胺预制凝胶购自Bio-Rad。Instant Blue染色溶液购自Expedeon。氯化钾(KCl)、氯化钙(CaCl₂)、氯化钠(NaCl)和氯化镁(MgCl₂)购自Aladdin。4-(2-羟乙基)-1-哌嗪乙烷磺酸(HEPES)和全肌红蛋白(源于马骨骼肌)购自Shanghai YuanyeBiotechnology。乙二胺四乙酸二钠盐(EDTA)购自Sigma-Aldrich。1,2-二植烷酰基-sn-甘油-3-磷酸胆碱(DPhPC)购自Avanti Polar Lipids。大肠杆菌BL21(DE3)购自TransGenBiotech。Luria Bertani(LB)琼脂和LB肉汤购自Hopebio。氯化钾缓冲液(1.5M KCl、10mMHEPES，pH 7.0)用Milli-Q水制备，使用前用膜过滤(0.2μm，Whatman)。制备浓度为1mg/mL的溶菌酶、全肌红蛋白和脱辅基肌红蛋白的原液，用于随后的测量。制备浓度为2.5mg/mL的ɑ-乳白蛋白、β-乳球蛋白和乳清蛋白的原液，用于随后测量。

方法

1.纳米孔测量和数据分析

如前文所述进行所有纳米孔测量。²⁴⁹简言之，测量装置由两个定制的聚甲醛室组成，由～20μm厚的Teflon隔开，其上具有钻开的孔口(直径为～100μm)。在测量之前，首先用0.5％(v/v)十六烷的戊烷溶液处理所述孔口，并使其静置以进行戊烷蒸发。传统上，电接地的室被定义为cis室，而相对的室则被定义为trans室。然后，分别向两个室中添加500μL电解质缓冲液。除非另有说明，本文中的所有纳米孔测量都是在cis侧为1.5M KCl缓冲液(1.5M KCl、10mM HEPES，pH 7.0)且trans侧为1.0M CaCl₂缓冲液(1.0M CaCl₂、10mM HEPES，pH7.0)的情况下进行的。两个定制的Ag/AgCl电极与膜片钳放大器电连接，放置在两个室中，与所述缓冲液接触以形成闭合电路。在向两个室中添加100μL DPhPC的戊烷溶液(5mg/mL)后，通过在任一室中上下数次吸取所述电解质缓冲液来形成脂质双层。在双层形成时，获得的电流立即下降到0pA，表明所述孔口已被所述形成的脂质双层密封。然后将MspA添加到所述cis室中以启动自发的孔插入。在插入单个纳米孔后，手动交换所述cis室中的缓冲液以避免更多的孔插入。

为了避免外部电磁和振动噪声的干扰，所述装置被屏蔽在安装在浮式光学平台(Jiangxi Liansheng Technology)上的定制法拉第笼(34cm×23cm×15cm)中。所有电生理学结果均使用与Digidata 1550B数字化仪(Molecular Devices)配对的Axonpatch200B膜片钳放大器获得。除非另有说明，否则所有测量期间施加的电压为+60mV。所有测量均在室温(rt)(25℃)下进行。所有单通道记录均以25kHz采样，并以1kHz的角频率进行低通滤波。

通过Clampfit 10.7中的“单通道研究”功能检测所有蛋白质捕获事件。使用“abfload”算法(Harald Hentschke(2021).abfload(https://www.mathworks.com/matlabcentral/fileexchange/6190-abfload)，MATLAB中心文件交换。检索日期：2021年9月1日)将Axon abf文件导入MATLAB，以读取阻塞电流的特征。使用MATLAB的分类学习器工具箱进行机器学习模型训练过程。预测过程是使用MATLAB中的定制算法进行的。随后的分析，包括直方图绘制、散点图生成和曲线拟合，通过Origin 9.2(Origin Lab)进行。

2.纳米孔制备。

这项工作中的所有测量都是用名为M2 MspA的MspA突变体(D90N/D91N/D93N/D118R/D134R/E139K)进行的。为了简单起见，如果没有另外说明，M2 MspA在本手稿中都被称为MspA。单体MspA用大肠杆菌BL21(DE3)表达，并使用镍亲和色谱法进行纯化。²⁵⁰编码M2MspA的质粒DNA共享在分子云库中(https://www.molecularcloud.org/s/shuo-huang，访问代码：MC_0101191)。

3.制备ACTR和NCBD肽

所述ACTR和NCBD肽都是通过用蛋白酶处理所述GST肽融合蛋白制备的。由Genescript定制合成编码ACTR或NCBD肽的基因(在序列端有终止子)，并将其克隆到pGEX-6p-1质粒(用于表达具有PreScission蛋白酶位点的GST融合蛋白的细菌载体)中。在被所述质粒转化后，将大肠杆菌BL21(DE3)细胞在含有100μg/ml氨苄青霉素的LB琼脂平板上于37℃培养10小时。将单个菌落转移到含有100μg/ml氨苄青霉素的300mL LB培养基中。将所述培养基在37℃下以170rpm振荡，直到OD₆₀₀＝0.8。通过添加1mM IPTG诱导超量生产，并将培养物在28℃下再孵育5小时。收获细胞，重悬于20mL提取缓冲液A1(135mM NaCl、4.7mM KCl、10mM Na₂HPO₄、2mM NaH₂PO₄，pH 7.4)中，并通过超声裂解。然后，将溶液在4℃下以15,871g离心30分钟以收集上清液。将所述上清液应用于GSTrap^TM(GE Healthcare)色谱柱。然后用PBS缓冲液洗涤所述色谱柱。随后，将色谱柱中的缓冲液改为PreScission裂解缓冲液(50mMTris-HCl、150mM NaCl、1mM EDTA、1mM二硫苏糖醇，pH＝7.0)。将N-末端带有GST标签的PreScission蛋白酶混合物加载到色谱柱中，并在4℃下孵育8小时。将靶蛋白ACTR肽(或NCBD肽)用15mL PreScission裂解缓冲液洗脱，同时融合蛋白的GST部分和PreScission蛋白酶保留在色谱柱上。色谱柱最终用洗脱缓冲液B1(50mM Tris-HCl、10mM谷胱甘肽，pH8.0)洗涤，以除去融合蛋白的结合GST部分和PreScission蛋白酶，从而重新启动色谱柱以供将来使用。所有洗脱液均通过4-20％SDS-PAGE进行表征(图92和93)。

ACTR、NCBD及其复合物的等电点(pI)从未被报道过。如本文中引用的，它们理论pI值是基于其氨基酸序列通过Expasy(https://web.expasy.org/protparam/)计算的。

表11.不同电解质组合的蛋白质捕获的平均停留时间(τ_off)和平均事件间持续时间(τ_on)。如实施例8方法1中所述，用M2 MspA进行所有测量。在测量期间连续施加+100mV电压。将溶菌酶、全肌红蛋白、脱辅基肌红蛋白、ACTR肽、NCBD肽和ACTR/NCBD复合物作为所述分析物应用。所有统计结果均从三次独立测量(N＝3)的结果得出。

表12.蛋白质捕获事件的平均电流阻塞比率(％)和幅度标准差(pA)。如实施例8方法1中所述进行所有测量。应用1.5M KCl(cis)/1.0M CaCl₂(trans)，pH＝7.0的缓冲液组合。在测量期间连续施加+100mV电压。所有统计结果均从三次独立测量(N＝3)的结果得出。

^a N.A.：尖峰状阻塞事件的t_off太短，无法获得可信的幅度标准差。

表13.蛋白质分析物的与浓度之间的相关性分析。如实施例8方法1中所述进行所有测量。应用1.5 M KCl(cis)/1.0 M CaCl₂(trans)，pH＝7.0的缓冲液组合。在测量期间连续施加+100mV电压。的值与蛋白质分析物的浓度呈正相关。所有统计结果均从三次独立测量(N＝3)的结果得出。

表14.在不同电压下测得的平均停留时间和如实施例8方法1中所述进行所有测量。应用1.5 M KCl(cis)/1.0 M CaCl₂(trans)，pH＝7.0的缓冲液组合。

所有统计结果均从三次独立测量(N＝3)的结果得出。

视频S8.脱辅基肌红蛋白和全肌红蛋白的随机传感。如实施例8方法1中所述进行电生理学记录。在1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液中进行测量。将脱辅基肌红蛋白和全肌红蛋白添加到cis侧，终浓度分别为0.18μM和0.35μM。连续施加+100mV的跨膜电位，在此期间观察到由脱辅基肌红蛋白或全肌红蛋白捕获引起高度一致的电阻脉冲。事件识别是通过机器学习预测来实现的。已识别的事件分别标记为AM(脱辅基肌红蛋白)和HM(全肌红蛋白)。为了便于展示，所述视频以0.5倍的实际数据采集速度重放。

视频S9.溶菌酶、脱辅基肌红蛋白、全肌红蛋白和ACTR/NCBD复合物的随机传感。如实施例8方法1中所述进行电生理学记录。在1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液中进行测量。将溶菌酶、脱辅基肌红蛋白、全肌红蛋白和ACTR/NCBD添加到cis室中，终浓度分别为0.16、0.18、0.35和1.28μM。连续施加+100mV的跨膜电位，在此期间观察到由不同蛋白质引起高度一致的电阻脉冲。事件识别通过机器学习预测进行(图81e)。已识别的事件分别标记为L(溶菌酶)、AM(脱辅基肌红蛋白)、HM(全肌红蛋白)和AN(ACTR/NCBD复合物)。为了便于展示，所述视频以0.5倍的实际数据采集速度重放。

视频S10.乳清蛋白的随机传感。如实施例8方法1中所述进行电生理学记录。在1.5M KCl/1.0M CaCl₂(pH＝7.0)的缓冲液中进行测量。将乳清蛋白加入cis侧，终浓度为25μg/ml。连续施加+30mV的跨膜电位，在此期间观察到由不同组分引起高度一致的电阻脉冲。事件识别通过机器学习进行(图82a)。已识别的事件分别标记为α(α-乳白蛋白)、β(β-乳球蛋白)和o(其他)。为了便于展示，所述视频以2倍的实际数据采集速度重放。

实施例9：用MspA电渗阱随机传感溶菌酶-底物复合物

在这种不对称电解质缓冲条件下，使用MspA电渗阱可以清楚地区分溶菌酶与n-乙酰壳六糖(溶菌酶的底物)结合后的结构变化(图102)。

参考文献

1.Mortimer,S.A.,Kidwell,M.A.&Doudna,J.A.Insights into RNAstructureand function from genome-wide studies.Nat.Rev.Genet.15,469-479(2014).

2.Batey,R.T.,Rambo,R.P.&Doudna,J.A.Tertiary motifs in RNA structureand folding.Angewandte Chemie-International Edition 38,2327-2343(1999).

3.Zhuang,X.W.et al.A single-molecule study of RNA catalysis andfolding.Science 288,2048-2051(2000).

4.Lee,J.T.Epigenetic Regulation by Long Noncoding RNAs.Science 338,1435-1439(2012).

5.Keel,A.Y.,Rambo,R.P.,Batey,R.T.&Kieft,J.S.A general strategy tosolve the phase problem in RNA crystallography.Structure 15,761-772(2007).

6.Lukavsky,P.J.,Kim,I.,Otto,G.A.&Puglisi,J.D.Structure of HCVIRESdomain II determined by NMR.Nature Structural Biology 10,1033-1038(2003).

7.Varani,G.,Aboulela,F.&Allain,F.H.T.NMR investigation of RNAstructure.Progress in Nuclear Magnetic Resonance Spectroscopy 29,51-127(1996).

8.Zhang,H.&Keane,S.C.Advances that facilitate the study of large RNAstructure and dynamics by nuclear magnetic resonance spectroscopy.WileyInterdisciplinary Reviews-Rna 10,e1541(2019).

9.Zhang,K.et al.Structure of the 30 kDa HIV-1 RNADimerization Signalby a Hybrid Cryo-EM,NMR,and Molecular Dynamics Approach.Structure 26,490-498(2018).

10.Zhang,K.et al.Cryo-EM structure of a 40 kDa SAM-IV riboswitch RNAat 3.7 angstrom resolution.Nature Communications 10,5511(2019).

11.Zhao,R.&Rueda,D.RNA folding dynamics by single-moleculefluorescence resonance energy transfer.Methods 49,112-117(2009).

12.Williams,M.C.&Rouzina,I.Force spectroscopy of single DNA and RNAmolecules.Current Opinion in Structural Biology 12,330-336(2002).

13.Henley,R.Y.et al.Electrophoretic Deformation of IndividualTransfer RNA Molecules Reveals Their Identity.Nano Letters 16,138-144(2016).

14.Rozevsky,Y.et al.Quantification of mRNA expression using single-molecule nanopore sensing.ACS nano 14,13964-13974(2020).

15.Shasha,C.et al.Nanopore-Based Conformational Analysis of a ViralRNA Drug Target.ACS Nano 8,6425-6430(2014).

16.Wanunu,M.et al.Nanopore analysis of individual RNA/antibioticcomplexes.ACS Nano 5,9345-9353(2011).

17.Skinner,G.M.,van den Hout,M.,Broekmans,O.,Dekker,C.&Dekker,N.H.Distinguishing single-and double-stranded nucleic acid molecules usingsolid-state nanopores.Nano Letters 9,2953-2960(2009).

18.Ying,Y.-L.,Cao,C.&Long,Y.-T.Single molecule analysis by biologicalnanopore sensors.Analyst 139,3826-3835(2014).

19.Cao,C.et al.Discrimination of oligonucleotides of differentlengths with a wild-type aerolysin nanopore.Nature Nanotechnology 11,713-718(2016).

20.Thakur,A.K.&Movileanu,L.Real-time measurement of protein–proteininteractions at single-molecule resolution using a biological nanopore.Naturebiotechnology 37,96-101(2019).

21.Ouldali,H.et al.Electrical recognition of the twenty proteinogenicamino acids using an aerolysin nanopore.Nature Biotechnology 38,176-181(2020).

22.Zhang,X.et al.Nanopore electric snapshots of an RNA tertiaryfolding pathway.Nature Communications 8,1458(2017).

23.Lu,B.et al.Protein Motion and Configurations in a Form-FittingNanopore:Avidin in CIyA.Biophysical Journal 115,801-808(2018).

24.Jing,P.,Haque,F.,Vonderheide,A.P.,Montemagno,C.&Guo,P.Robustproperties of membrane-embedded connector channel of bacterial virus phi29DNA packaging motor.Molecular Biosystems 6,1844-1852(2010).

25.Tanaka,K.,Caaveiro,J.M.M.,Morante,K.,Manuel Gonzalez-Manas,J.&Tsumoto,K.Structural basis for self-assembly of a cytolytic pore lined byprotein and lipid.Nature Communications 6,6337(2015).

26.Huang,G.et al.Electro-Osmotic Vortices Promote the Capture ofFolded Proteins by PlyAB Nanopores.Nano Letters 20,3819-3827(2020).

27.Soskine,M.,Biesemans,A.,De Maeyer,M.&Maglia,G.Tuning the Size andProperties of ClyA Nanopores Assisted by Directed Evolution.J Am Chem Soc135,13456-13463(2013).

28.Faller,M.,Niederweis,M.&Schulz,G.E.The structure of amycobacterial outer-membrane channel.Science 303,1189-1192(2004).

29.Heinz,C.,Engelhardt,H.&Niederweis,M.The core of the tetramericmycobacterial porin MspAis an extremely stable beta-sheet domain.Journal ofBiological Chemistry 278,8678-8685(2003).

30.Manrao,E.A.et al.Reading DNAat single-nucleotide resolution with amutant MspA nanopore and phi29 DNA polymerase.Nature Biotechnology 30,349-353(2012).

31.Craig,J.M.et al.Determining the effects of DNA sequence on Hel308helicase translocation along single-stranded DNAusing nanoporetweezers.Nucleic Acids Research 47,2506-2513(2019).

32.Butler,T.Z.,Pavlenok,M.,Derrington,I.M.,Niederweis,M.&Gundlach,J.H.Single-molecule DNA detection with an engineered MspAproteinnanopore.Proceedings of the National Academy of Sciences of the United Statesof America 105,20647-20652(2008).

33.Wang,S.et al.Retarded Translocation of Nucleic Acids throughalpha-hemolysin Nanopore in the Presence of a Calcium Flux.ACS AppliedMaterials&Interfaces 12,26926-26935(2020).

34.Chan,J.A.,Krichevsky,A.M.&Kosik,K.S.MicroRNA-21 is anantiapoptotic factor in human glioblastoma cells.Cancer Research 65,6029-6033(2005).

35.Elbashir,S.M.et al.Duplexes of 21-nucleotide RNAs mediateRNAinterference in cultured mammalian cells.Nature 411,494-498(2001).

36.Pan,Y.P.&MacKerell,A.D.Altered structural fluctuations in duplexRNA versus DNA:a conformational switch involving base pair opening.NucleicAcids Research 31,7131-7140(2003).

37.Perera,R.T.et al.Unzipping of A-Form DNA-RNA,A-Form DNA-PNA,and B-Form DNA-DNA in the alpha-Hemolysin Nanopore.Biophysical Journal 110,306-314(2016).

38.Carroll,J.S.et al.Chromosome-wide mapping of estrogen receptorbinding reveals long-range regulation requiring the forkhead proteinFoxA1.Cell 122,33-43(2005).

39.Sano,M.et al.Effect of asymmetric terminal structures of short RNAduplexes on the RNA interference activity and strand selection.Nucleic AcidsResearch 36,5812-5821(2008).

40.Ghosh,P.et al.Comparing 2-nt 3'overhangs against blunt-endedsiRNAs:a systems biology based study.BMC genomics 10,S17(2009).

41.Sponer,J.et al.RNA Structural Dynamics As Captured by MolecularSimulations:A Comprehensive Overview.Chemical Reviews 118,4177-4338(2018).

42.Wimmer,E.,Maxwell,I.H.&Tener,G.M.A Simple Method for IsolatingHighly Purified Yeast Phenylalanine Transfer Ribonucleic Acid.Biochemistry-Us7,2623-2628(1968).

43.Yatime,L.et al.Structural basis for the targeting of complementanaphylatoxin C5a using a mixed L-RNA/L-DNA aptamer.Nature Communications 6,6481(2015).

44.Correll,C.C.,Freeborn,B.,Moore,P.B.&Steitz,T.A.Metals,motifs,andrecognition in the crystal structure of a 5S rRNA domain.Cell 91,705-712(1997).

45.Steitz,J.A.et al.A 5S rRNA/L5 complex is a precursor to ribosomeassembly in mammalian cells.The Journal of cell biology 106,545-556(1988).

46.Mueller,F.et al.The 3D arrangement of the 23 S and 5 S rRNAin theEscherichia coli 50 S ribosomal subunit based on a cryo-electron microscopicreconstruction atresolution.Journal of molecular biology 298,35-59(2000).

47.Friebe,P.,Boudet,J.,Simorre,J.P.&Bartenschlager,R.Kissing-loopinteraction in the 3'end of the hepatitis C virus genome essential forRNAreplication.Journal of Virology 79,380-392(2005).

48.Shu,D.,Shu,Y.,Haque,F.,Abdelmawla,S.&Guo,P.Thermodynamicallystable RNAthree-way junction for constructing multifunctional nanoparticlesfor delivery of therapeutics.Nature Nanotechnology 6,658-667(2011).

49.Namy,O.,Moran,S.J.,Stuart,D.I.,Gilbert,R.J.C.&Brierley,I.Amechanical explanation of RNA pseudoknot function in programmed ribosomalframeshifting.Nature 441,244-247(2006).

50.Klein,D.J.,Schmeing,T.M.,Moore,P.B.&Steitz,T.A.The kink-turn:a newRNA secondary structure motif.Embo Journal 20,4214-4221(2001).

51.Kumari,S.,Bugaut,A.,Huppert,J.L.&Balasubramanian,S.An RNA G-quadruplex in the 5'UTR of the NRAS proto-oncogene modulatestranslation.Nature Chemical Biology 3,218-221(2007).

52.Schreiber,J.et al.Error rates for nanopore discrimination amongcytosine,methylcytosine,and hydroxymethylcytosine along individual DNAstrands.Proceedings of the National Academy of Sciences of the United Statesof America 110,18910-18915(2013).

53.Smith,A.M.,Abu-Shumays,R.,Akeson,M.&Bernick,D.L.Capture,Unfolding,and Detection of Individual tRNA Molecules Using a Nanopore Device.Frontiersin bioengineering and biotechnology 3,91(2015).

54.Misiunas,K.,Ermann,N.&Keyser,U.F.QuipuNet:Convolutional NeuralNetwork for Single-Molecule Nanopore Sensing.Nano Letters 18,4040-4045(2018).

55.Cardozo,N.et al.Multiplexed direct detection of barcoded proteinreporters on a nanopore array.bioRxiv,837542(2019).

56.Bhattacharya,S.et al.Molecular Dynamics Study of MspA ArginineMutants Predicts Slow DNATranslocations and Ion Current Blockades Indicativeof DNA Sequence.ACS Nano 6,6960-6968(2012).

57.Aksimentiev,A.,Heng,J.B.,Timp,G.&Schulten,K.Microscopic kineticsof DNA translocation through synthetic nanopores.Biophysical journal 87,2086-2097(2004).

58.Leehey,M.A.,Squassoni,C.A.,Friederich,M.W.,Mills,J.B.&Hagerman,P.J.A noncanonical tertiary conformation of a human mitochondrial transferRNA.Biochemistry-Us 34,16235-16239(1995).

59.Farnsworth,R.W.,Keating,J.,McAuley,M.&Smith,R.Optimization of aProtocol for Escherichia coli RNA Extraction and Visualization.Journal ofExperimental Microbiology and Immunology 5,87-94(2004).

60.Hingerty,B.,Brown,R.S.&Jack,A.Further refinement of structure ofyeast transfer-RNA phe.Journal of Molecular Biology 124,523-534(1978).

61.Sussman,J.L.,Holbrook,S.R.,Warrant,R.W.,Church,G.M.&Kim,S.H.Crystal structure of yeast phenylalanine transfer RNA.I.Crystallographicrefinement.Journal of Molecular Biology 123,607-630(1978).

62.Schevitz,R.W.,Podjarny,A.D.,Krishnamachari,N.,Hughes,J.J.&Sigler,P.B.Crystal-structure of a eukaryotic initiator transfer-RNA.Nature 278,188-190(1979).

63.Woo,N.H.,Roe,B.A.&Rich,A.3-dimensional structure of Escherichia-coli initiator transfer RNA-f(met).Nature 286,346-351(1980).

64.Westhof,E.,Dumas,P.&Moras,D.Crystallographic refinement of yeastaspartic-acid transfer-RNA.Journal of Molecular Biology 184,119-145(1985).

65.Huang,Q.,Mao,Z.,Li,S.,Hu,J.&Zhu,Y.A non-radioactive method forsmall RNA detection by northern blotting.Rice 7,26(2014).

66.Guo,C.et al.Silica nanoparticles induce oxidative stress,inflammation,and endothelial dysfunction in vitro via activation of the MAPK/Nrf2 pathway and nuclear factor-kappa B signaling.International Journal ofNanomedicine 10,1463-1477(2015).

67.Grosshans,H.,Hurt,E.&Simos,G.An aminoacylation-dependent nucleartRNA export pathway in yeast.Genes&Development 14,830-840(2000).

68.Dittmar,K.A.,Goodenbour,J.M.&Pan,T.Tissue-specific differences inhuman transfer RNA expression.Plos Genetics 2,2107-2115(2006).

69.Honda,S.,Shigematsu,M.,Morichika,K.,Telonis,A.G.&Kirino,Y.Four-leaf clover qRT-PCR:A convenient method for selective quantification ofmature tRNA.Rna Biology 12,501-508(2015).

70.Zheng,G.et al.Efficient and quantitative high-throughput tRNAsequencing.Nature Methods 12,835-837(2015).

71.Torrent,M.,Chalancon,G.,de Groot,N.S.,Wuster,A.&Babu,M.M.Cellsalter their tRNA abundance to selectively regulate protein synthesis duringstress conditions.Science Signaling 11,eaat6409(2018).

72.Fu,H.et al.Stress induces tRNA cleavage by angiogenin in mammaliancells.Febs Letters 583,437-442(2009).

73.Wang,Y.et al.Electrode-free nanopore sensing byDiffusiOptoPhysiology.Science Advances 5,eaar3309(2019).

74.Krishnan,S.et al.Molecular transport through large-diameter DNAnanopores.Nature Communications 7,12787(2016).

75.Wang,Y.et al.Osmosis-Driven Motion-Type Modulation of BiologicalNanopores for Parallel Optical Nucleic Acid Sensing.ACS applied materials&interfaces 10,7788-7797(2018).

76.Abraham,M.J.et al.GROMACS:High performance molecular simulationsthrough multi-level parallelism from laptops to supercomputers.SoftwareX 1,19-25(2015).

77.Huang,J.et al.CHARMM36m:an improved force field for folded andintrinsically disordered proteins.Nature methods 14,71-73(2017).

78.Jorgensen,W.L.,Chandrasekhar,J.,Madura,J.D.,Impey,R.W.&Klein,M.L.Comparison of simple potential functions for simulating liquid water.TheJournal of chemical physics 79,926-935(1983).

79.Jo,S.,Kim,T.,Iyer,V.G.&Im,W.CHARMM-GUI:a web-based graphical userinterface for CHARMM.Journal of computational chemistry 29,1859-1865(2008).

80.Faller,M.,Niederweis,M.&Schulz,G.E.The structure of amycobacterial outer-membrane channel.Science 303,1189-1192(2004).

81.Jovine,L.,Djordjevic,S.&Rhodes,D.The crystal structure of yeastphenylalanine tRNAat resolution:cleavage by Mg²⁺ in 15-year oldcrystals.Journal of molecular biology 301,401-414(2000).

82.Hess,B.,Bekker,H.,Berendsen,H.J.&Fraaije,J.G.LINCS:a linearconstraint solver for molecular simulations.Journal of computationalchemistry 18,1463-1472(1997).

83.Darden,T.,York,D.&Pedersen,L.Particle mesh Ewald:An N·log(N)method for Ewald sums in large systems.The Journal of chemical physics 98,10089-10092(1993).

84.Berendsen,H.J.,Postma,J.v.,van Gunsteren,W.F.,DiNola,A.&Haak,J.R.Molecular dynamics with coupling to an external bath.The Journal ofchemical physics 81,3684-3690(1984).

85.Tarek,M.Membrane electroporation:a molecular dynamicssimulation.Biophysical journal 88,4045-4053(2005).

86.Aksimentiev,A.Deciphering ionic current signatures of DNAtransportthrough a nanopore.Nanoscale 2,468-483(2010).

87.Bjelkmar,P.,P.S.,Vattulainen,I.&Lindahl,E.Conformationalchanges and slow dynamics through microsecond polarized atomistic molecularsimulation of an integral Kv1.2 ion channel.PLoS Comput Biol 5,e1000289(2009).

88.Isralewitz,B.,Izrailev,S.&Schulten,K.Binding pathway of retinal tobacterio-opsin:a prediction by molecular dynamics simulations.Biophysicaljournal 73,2972(1997).

89.Wells,D.B.,Abramkina,V.&Aksimentiev,A.Exploring transmembranetransport throughα-hemolysin with grid-steered molecular dynamics.The Journalof chemical physics 127,09B619(2007).

90.Aksimentiev,A.,Heng,J.B.,Timp,G.&Schulten,K.Microscopic kineticsof DNAtranslocation through synthetic nanopores.Biophysical journal 87,2086-2097(2004).

91.DeLano,W.L.Pymol:An open-source molecular graphics tool.CCP4Newsletter on protein crystallography 40,82-92(2002).

92.Boukhet,M.et al.Probing driving forces in aerolysin andα-hemolysinbiological nanopores:electrophoresis versus electroosmosis.Nanoscale 8,18352-18359(2016).

93.Piguet,F.et al.Electroosmosis throughα-hemolysin that depends onalkali cation type.The journal of physical chemistry letters 5,4362-4367(2014).

94.Wimmer,E.,Maxwell,I.H.&Tener,G.M.A Simple Method for IsolatingHighly Purified Yeast Phenylalanine Transfer Ribonucleic Acid.Biochemistry-Us7,2623-2628(1968).

95.Celander,D.W.&Cech,T.R.Visualizing the higher order folding of acatalytic RNA molecule.Science 251,401-407(1991).

96.Cate,J.H.,Hanna,R.L.&Doudna,J.A.A magnesium ion core at the heartof a ribozyme domain.Nature structural biology 4,553-558(1997).

97.Farnsworth,R.W.,Keating,J.,McAuley,M.&Smith,R.Optimization of aProtocol for Escherichia coli RNA Extraction and Visualization.Journal ofExperimental Microbiology and Immunology 5,87-94(2004).

98.Guo,C.et al.Silica nanoparticles induce oxidative stress,inflammation,and endothelial dysfunction in vitro via activation of the MAPK/Nrf2 pathway and nuclear factor-kappa B signaling.International Journal ofNanomedicine 10,1463-1477(2015).

99.Di Cello,F.,Xie,Y.,Paul-Satyaseela,M.&Kim,K.S.Approaches bacterialRNA isolation and purification for microarray analysis of Escherichia coli K1interaction with human brain microvascular endothelial cells.Journal ofClinical Microbiology 43,4197-4199(2005).

100.Summer,H.,Gramer,R.&Droge,P.Denaturing urea polyacrylamide gelelectrophoresis(Urea PAGE).Journal of visualized experiments,e1485(2009).

101.Simanshu,D.K.,Nissley,D.V.&McCormick,F.RAS Proteins and TheirRegulators in Human Disease.Cell 170,17-33(2017).

102.Kim,E.et al.A single-molecule dissection of ligand binding to aprotein with intrinsic dynamics.Nature Chemical Biology 9,313-318(2013).

103.de Boer,M.et al.Conformational and dynamic plasticity insubstrate-binding proteins underlies selective transport in ABCimporters.eLife 8,e44652(2019).

104.Boehr,D.D.,Nussinov,R.&Wright,P.E.The role of dynamicconformational ensembles in biomolecular recognition.Nature Chemical Biology5,789-796(2009).

105.Papaleo,E.et al.The Role of Protein Loops and Linkers inConformational Dynamics and Allostery.Chemical Reviews 116,6391-6423(2016).

106.Orellana,L.Large-Scale Conformational Changes and ProteinFunction:Breaking the in silico Barrier.Frontiers in molecular biosciences 6,117-117(2019).

107.Park,S.J.,Borin,B.N.,Martinez-Yamout,M.A.&Dyson,H.J.The clientprotein p53 adopts a molten globule–like state in the presence ofHsp90.Nature Structural&Molecular Biology 18,537-541(2011).

108.Shim,S.-H.,Strasfeld,D.B.,Ling,Y.L.&Zanni,M.T.Automated 2D IRspectroscopy using a mid-IR pulse shaper and application of this technologyto the human islet amyloid polypeptide.Proceedings of the National Academy ofSciences 104,14197-14202(2007).

109.Bertini,I.et al.Accurate Solution Structures of Proteins from X-ray Data and a Minimal Set of NMR Data:Calmodulin-Peptide Complexes AsExamples.Journal of the American Chemical Society 131,5134-5144(2009).

110.Sedlak,S.M.,Schendel,L.C.,Gaub,H.E.&Bernardi,R.C.Streptavidin/biotin:Tethering geometry defines unbinding mechanics.Science Advances 6,eaay5999(2020).

111.Krieg,M.et al.Atomic force microscopy-based mechanobiology.NatureReviews Physics 1,41-57(2019).

112.Rivas-Pardo,J.A.,Alegre-Cebollada,J.,Ramírez-Sarmiento,C.A.,Fernandez,J.M.&Guixé,V.Identifying Sequential Substrate Binding at theSingle-Molecule Level by Enzyme Mechanical Stabilization.ACS Nano 9,3996-4005(2015).

113.Inkpen,M.S.&Albrecht,T.Probing Electron Transport in Proteins atRoom Temperature with Single-Molecule Precision.ACS Nano 6,13-16(2012).

114.Margittai,M.et al.Single-molecule fluorescence resonance energytransfer reveals a dynamic equilibrium between closed and open conformationsof syntaxin 1.Proceedings of the National Academy of Sciences 100,15516-15521(2003).

115.Lerner,E.et al.Toward dynamic structural biology:Two decades ofsingle-molecule resonance energy transfer.Science 359,eaan1133(2018).

116.Yoo,D.et al.Low-Power Optical Trapping of Nanoparticles andProteins with Resonant Coaxial Nanoaperture Using 10 nm Gap.Nano Letters 18,3637-3642(2018).

117.Pang,Y.&Gordon,R.Optical Trapping of a Single Protein.NanoLetters 12,402-406(2012).

118.Hong,C.,Yang,S.&Ndukaife,J.C.Stand-off trapping and manipulationof sub-10nm objects and biomolecules using opto-thermo-electrohydrodynamictweezers.Nature Nanotechnology(2020).

119.Tapia-Rojo,R.,Alonso-Caballero,A.&Fernandez,J.M.Directobservation of a coil-to-helix contraction triggered by vinculin binding totalin.Science Advances 6,eaaz4707(2020).

120.Eckels,E.C.,Tapia-Rojo,R.,Rivas-Pardo,J.A.&Fernández,J.M.The Workof Titin Protein Folding as a Major Driver in Muscle Contraction.AnnualReview of Physiology 80,327-351(2018).

121.Popa,I.et al.AHaloTag Anchored Ruler for Week-Long Studies ofProtein Dynamics.Journal of the American Chemical Society 138,10546-10553(2016).

122.M.et al.Thermophoretic trap for single amyloid fibril andprotein aggregation studies.Nature Methods 16,611-614(2019).

123.Ruggeri,F.et al.Single-molecule electrometry.NatureNanotechnology 12,488-495(2017).

124.Talaga,D.S.&Li,J.Single-Molecule Protein Unfolding in Solid StateNanopores.Journal of the American Chemical Society 131,9287-9297(2009).

125.Stefureac,R.I.&Lee,J.S.Nanopore Analysis of the Folding of ZincFingers.Small 4,1646-1650(2008).

126.Nivala,J.,Marks,D.B.&Akeson,M.Unfoldase-mediated proteintranslocation through anα-hemolysin nanopore.Nature Biotechnology 31,247-250(2013).

127.Pastoriza-Gallego,M.et al.Dynamics of Unfolded Protein Transportthrough an Aerolysin Pore.Journal of the American Chemical Society 133,2923-2931(2011).

128.Hu,Z.-L.,Huo,M.-Z.,Ying,Y.-L.&Long,Y.-T.Biological NanoporeApproach for Single-Molecule Protein Sequencing.Angewandte ChemieInternational Edition n/a.

129.Wang,H.-Y.,Ying,Y.-L.,Li,Y.,Kraatz,H.-B.&Long,Y.-T.NanoporeAnalysis ofβ-Amyloid Peptide Aggregation Transition Induced by SmallMolecules.Analytical Chemistry 83,1746-1752(2011).

130.Yusko,E.C.et al.Real-time shape approximation and fingerprintingof single proteins using a nanopore.Nature Nanotechnology 12,360-367(2017).

131.Fologea,D.,Ledden,B.,McNabb,D.S.&Li,J.Electrical characterizationof protein molecules by a solid-state nanopore.Applied Physics Letters 91,053901(2007).

132.Sha,J.et al.Identification of Spherical and Nonspherical Proteinsby a Solid-State Nanopore.Analytical Chemistry 90,13826-13831(2018).

133.Houghtaling,J.et al.Estimation of Shape,Volume,and Dipole Momentof Individual Proteins Freely Transiting a Synthetic Nanopore.ACS Nano 13,5231-5242(2019).

134.Galenkamp,N.S.,Biesemans,A.&Maglia,G.Directional conformerexchange in dihydrofolate reductase revealed by single-molecule nanoporerecordings.Nature Chemistry(2020).

135.Hu,R.et al.Differential Enzyme Flexibility Probed Using Solid-State Nanopores.ACS Nano 12,4494-4502(2018).

136.Plesa,C.et al.Fast Translocation of Proteins through Solid StateNanopores.Nano Letters 13,658-663(2013).

137.Varongchayakul,N.,Song,J.,Meller,A.&Grinstaff,M.W.Single-moleculeprotein sensing in a nanopore:a tutorial.Chemical Society Reviews 47,8512-8524(2018).

138.Diederichs,T.et al.Synthetic protein-conductive membranenanopores built with DNA.Nature Communications 10,5018(2019).

139.Fragasso,A.,Schmid,S.&Dekker,C.Comparing Current Noise inBiological and Solid-State Nanopores.ACS Nano 14,1338-1349(2020).

140.Varongchayakul,N.,Huttner,D.,Grinstaff,M.W.&Meller,A.SensingNative Protein Solution Structures Using a Solid-state Nanopore:Unravelingthe States of VEGF.Scientific Reports 8,1017(2018).

141.Han,A.et al.Sensing protein molecules using nanofabricatedpores.Applied Physics Letters 88,093901(2006).

142.Schmid,S.&Dekker,C.Nanopores:a versatile tool to study proteindynamics.Essays in Biochemistry(2020).

143.Thakur,A.K.&Movileanu,L.Real-time measurement of protein–proteininteractions at single-molecule resolution using a biological nanopore.NatureBiotechnology 37,96-101(2019).

144.Fahie,M.,Chisholm,C.&Chen,M.Resolved Single-Molecule Detection ofIndividual Species within a Mixture of anti-Biotin Antibodies Using anEngineered Monomeric Nanopore.ACS Nano 9,1089-1098(2015).

145.Rotem,D.,Jayasinghe,L.,Salichou,M.&Bayley,H.Protein Detection byNanopores Equipped with Aptamers.Journal of the American Chemical Society134,2781-2787(2012).

146.Rodriguez-Larrea,D.&Bayley,H.Multistep protein unfolding duringnanopore translocation.Nature Nanotechnology 8,288-295(2013).

147.Zhang,S.et al.Bottom-up fabrication of a multi-component nanoporesensor that unfolds,processes and recognizes single proteins.bioRxiv,2020.12.04.411884(2020).

148.Wang,S.,Haque,F.,Rychahou,P.G.,Evers,B.M.&Guo,P.EngineeredNanopore of Phi29 DNA-Packaging Motor for Real-Time Detection of Single ColonCancer Specific Antibody in Serum.ACS Nano 7,9814-9822(2013).

149.Peng,W.,de Souza Santos,M.,Li,Y.,Tomchick,D.R.&Orth,K.High-resolution cryo-EM structures of the E.coli hemolysin ClyAoligomers.PLOS ONE14,e0213423(2019).

150.Tanaka,K.,Caaveiro,J.M.M.,Morante,K.,González-J.M.&Tsumoto,K.Structural basis for self-assembly of a cytolytic pore lined by protein andlipid.Nature Communications 6,6337(2015).

151.Huang,G.et al.Electro-Osmotic Vortices Promote the Capture ofFolded Proteins by PlyAB Nanopores.Nano Lett(2020).

152.Huang,G.,Willems,K.,Soskine,M.,Wloka,C.&Maglia,G.Electro-osmoticcapture and ionic discrimination of peptide and protein biomarkers with FraCnanopores.Nature Communications 8,935(2017).

153.Galenkamp,N.S.,Soskine,M.,Hermans,J.,Wloka,C.&Maglia,G.Directelectrical quantification of glucose and asparagine from bodily fluids usingnanopores.Nat Commun 9,4085(2018).

154.Zernia,S.,van der Heide,N.J.,Galenkamp,N.S.,Gouridis,G.&Maglia,G.Current Blockades of Proteins inside Nanopores for Real-Time MetabolomeAnalysis.ACS Nano(2020).

155.Soskine,M.,Biesemans,A.&Maglia,G.Single-Molecule AnalyteRecognition with ClyA Nanopores Equipped with Internal ProteinAdaptors.Journal of the American Chemical Society 137,5793-5797(2015).

156.Wloka,C.et al.Label-Free and Real-Time Detection of ProteinUbiquitination with a Biological Nanopore.ACS Nano 11,4387-4394(2017).

157.Soskine,M.,Biesemans,A.,De Maeyer,M.&Maglia,G.Tuning the size andproperties of ClyA nanopores assisted by directed evolution.J Am Chem Soc135,13456-63(2013).

158.Lu,B.et al.Protein Motion and Configurations in a Form-FittingNanopore:Avidin in ClyA.Biophysical Journal 115,801-808(2018).

159.Faller,M.,Niederweis,M.&Schulz,G.E.The Structure of aMycobacterial Outer-Membrane Channel.Science 303,1189(2004).

160.Heinz,C.,Engelhardt,H.&Niederweis,M.The Core of the TetramericMycobacterial Porin MspA Is an Extremely Stableβ-Sheet Domain.Journal ofBiological Chemistry 278,8678-8685(2003).

161.Manrao,E.A.et al.Reading DNAat single-nucleotide resolution witha mutant MspA nanopore and phi29 DNA polymerase.Nat Biotechnol 30,349-53(2012).

162.Craig,J.M.et al.Revealing dynamics of helicase translocation onsingle-stranded DNA using high-resolution nanopore tweezers.Proceedings ofthe National Academy of Sciences 114,11932(2017).

163.Wang,S.et al.Single molecule observation of hard–soft-acid–base(HSAB)interaction in engineered Mycobacterium smegmatis porin A(MspA)nanopores.Chemical Science 11,879-887(2020).

164.Cao,J.et al.Giant single molecule chemistry events observed froma tetrachloroaurate(III)embedded Mycobacterium smegmatis porin Ananopore.Nature Communications 10,5668(2019).

165.Zhang,M.,Tanaka,T.&Ikura,M.Calcium-induced conformationaltransition revealed by the solution structure of apo calmodulin.NatureStructural Biology 2,758-767(1995).

166.Kursula,P.The many structural faces of calmodulin:a multitaskingmolecular jackknife.Amino Acids 46,2295-304(2014).

167.Waduge,P.et al.Nanopore-Based Measurements of Protein Size,Fluctuations,and Conformational Changes.ACS Nano 11,5706-5716(2017).

168.Ma,G.et al.Optical imaging of single-protein size,charge,mobility,and binding.Nature Communications 11,4768(2020).

169.Ikura,M.et al.Solution structure of a calmodulin-target peptidecomplex by multidimensional NMR.Science 256,632-638(1992).

170.Oukhaled,A.,Bacri,L.,Pastoriza-Gallego,M.,Betton,J.-M.&Pelta,J.Sensing Proteins through Nanopores:Fundamental to Applications.ACS ChemicalBiology 7,1935-1949(2012).

171.Crotti,L.et al.Calmodulin mutations and life-threatening cardiacarrhythmias:insights from the International CalmodulinopathyRegistry.European heart journal 40,2964-2975(2019).

172.Pipilas,D.C.et al.Novel calmodulin mutations associated withcongenital long QT syndrome affect calcium current in humancardiomyocytes.Heart Rhythm 13,2012-2019(2016).

173.Wren,L.M.et al.Genetic Mosaicism in Calmodulinopathy.Circulation:Genomic and Precision Medicine 12,e002581(2019).

174.Wang,K.et al.Aarrhythmia mutations in calmodulin can disruptcooperativity of Ca²⁺binding and cause misfolding.The Journal of Physiology598,1169-1186(2020).

175.Ouyang,H.&Vogel,H.J.Metal ion binding to calmodulin:NMR andfluorescence studies.Biometals 11,213-222(1998).

176.Habermann,E.,Crowell,K.&Janicki,P.Lead and Other Metals canSubstitute for Ca 2+in Caimodulin.Archives of Toxicology 54,61(1983).

177.I.&Laitala,V.Progress in Lanthanides as LuminescentProbes.Journal of Fluorescence 15,529-542(2005).

178.Martin,B.&Richardson,F.S.Lanthanides as probes for calcium inbiological systems.Quarterly Reviews of Biophysics 12,181-209(1979).

179.Brittain,H.G.,Richardson,F.S.&Martin,R.B.Terbium(III)emission asa probe of calcium(II)binding sites in proteins.Journal of the AmericanChemical Society 98,8255-8260(1976).

180.Wallace,R.W.,Tallant,E.A.,Dockter,M.E.&Cheung,W.Y.Calcium bindingdomains of calmodulin.Sequence of fill as determined with terbiumluminescence.Journal of Biological Chemistry 257,1845-1854(1982).

181.Edington,S.C.et al.Coordination to lanthanide ions distortsbinding site conformation in calmodulin.Proceedings of the National Academyof Sciences 115,E3126(2018).

182.Butler,T.Z.,Pavlenok,M.,Derrington,I.M.,Niederweis,M.&Gundlach,J.H.Single-molecule DNA detection with an engineered MspA proteinnanopore.Proceedings of the National Academy of Sciences 105,20647-20652(2008).

183.Yan,S.et al.Direct sequencing of 2'-deoxy-2'-fluoroarabinonucleicacid(FANA)using nanopore-induced phase-shift sequencing(NIPSS).ChemicalScience 10,3110-3117(2019).

184.Wang,Y.et al.Electrode-free nanopore sensing byDiffusiOptoPhysiology.Science Advances 5,eaar3309(2019).

185.Wang,Y.et al.Osmosis-Driven Motion-Type Modulation of BiologicalNanopores for Parallel Optical Nucleic Acid Sensing.ACS Applied Materials&Interfaces 10,7788-7797(2018).

186.Torchala,M.,Moal,I.H.,Chaleil,R.A.G.,Fernandez-Recio,J.&Bates,P.A.SwarmDock:a server for flexible protein–protein docking.Bioinformatics29,807-809(2013).

187.Torchala,M.&Bates,P.A.Predicting the Structure of Protein–ProteinComplexes Using the SwarmDock Web Server.in Protein Structure Prediction(ed.Kihara,D.)181-197(Springer New York,New York,NY,2014).188.Jo,S.,Kim,T.,Iyer,V.G.&Im,W.CHARMM-GUI:A web-based graphical user interface forCHARMM.Journal of Computational Chemistry 29,1859-1865(2008).

189.Oukhaled,A.,Bacri,L.,Pastoriza-Gallego,M.,Betton,J.-M.&Pelta,J.Sensing Proteins through Nanopores:Fundamental to Applications.ACS ChemicalBiology 7,1935-1949(2012).

190.Zhang,M.,Tanaka,T.&Ikura,M.Calcium-induced conformationaltransition revealed by the solution structure of apo calmodulin.NatureStructural Biology 2,758-767(1995).

191.Ikura,M.et al.Solution structure of a calmodulin-target peptidecomplex by multidimensional NMR.Science 256,632-638(1992).

192.Soskine,M.,Biesemans,A.,De Maeyer,M.&Maglia,G.Tuning the size andproperties of ClyA nanopores assisted by directed evolution.Journal of theAmerican Chemical Society 135,13456-63(2013).

193.Wang,W.-Q.；Jensen,O.N.；I.M.；Hebelstrup,K.H.；Rogowska-Wrzesinska,A.,Evaluation of sample preparation methods for mass spectrometry-based proteomic analysis of barley leaves.Plant Methods 2018,14(1),72.

194.Timp,W.；Timp,G.,Beyond mass spectrometry,the next step inproteomics.Sci.Adv.2020,6(2),eaax8978.

195.Nakayasu,E.S.；Gritsenko,M.；Piehowski,P.D.；Gao,Y.；Orton,D.J.；Schepmoes,A.A.；Fillmore,T.L.；Frohnert,B.I.；Rewers,M.；Krischer,J.P.；Ansong,C.；Suchy-Dicey,A.M.；Evans-Molina,C.；Qian,W.-J.；Webb-Robertson,B.-J.M.；Metz,T.O.,Tutorial:best practices and considerations for mass-spectrometry-basedprotein biomarker discovery and validation.Nat.Protoc.2021,16(8),3737-3760.

196.Hnasko,R.；Lin,A.；McGarvey,J.A.；Stanker,L.H.,A rapid method toimprove protein detection by indirect ELISA.Biochem.Biophys.Res.Commun.2011,410(4),726-731.

197.de Lannoy,C.V.；Filius,M.；van Wee,R.；Joo,C.；de Ridder,D.,Evaluation of FRET X for single-molecule protein fingerprinting.iScience2021,24(11),103239.

198.Tripathi,P.；Benabbas,A.；Mehrafrooz,B.；Yamazaki,H.；Aksimentiev,A.；Champion,P.M.；Wanunu,M.,Electrical unfolding of cytochrome c duringtranslocation through a nanopore constriction.Proc.Natl.Acad.Sci.U.S.A.2021,118(17),e2016262118.

199.Mitscha-Baude,G.；Stadlbauer,B.；Howorka,S.；Heitzinger,C.,ProteinTransport through Nanopores Illuminated by Long-Time-Scale Simulations.ACSNano 2021,15(6),9900-9912.

200.Gu,L.-Q.；Shim,J.W.,Single molecule sensing by nanopores andnanopore devices.Analyst 2010,135(3),441-451.

201.Alfaro,J.A.；P.；Dai,M.；Filius,M.；Howard,C.J.；van Kooten,X.F.；Ohayon,S.；Pomorski,A.；Schmid,S.；Aksimentiev,A.；Anslyn,E.V.；Bedran,G.；Cao,C.；Chinappi,M.；Coyaud,E.；Dekker,C.；Dittmar,G.；Drachman,N.；Eelkema,R.；Goodlett,D.；Hentz,S.；Kalathiya,U.；Kelleher,N.L.；Kelly,R.T.；Kelman,Z.；Kim,S.H.；Kuster,B.；Rodriguez-Larrea,D.；Lindsay,S.；Maglia,G.；Marcotte,E.M.；Marino,J.P.；Masselon,C.；Mayer,M.；Samaras,P.；Sarthak,K.；Sepiashvili,L.；Stein,D.；Wanunu,M.；Wilhelm,M.；Yin,P.；Meller,A.；Joo,C.,The emerging landscape ofsingle-molecule protein sequencing technologies.Nat.Methods 2021,18(6),604-617.

202.Cao,C.；Cirauqui,N.；Marcaida,M.J.；Buglakova,E.；Duperrex,A.；Radenovic,A.；Dal Peraro,M.,Single-molecule sensing of peptides and nucleicacids by engineered aerolysin nanopores.Nat.Commun.2019,10(1),4918-4918.

203.Quick,J.；Loman,N.J.；Duraffour,S.；Simpson,J.T.；Severi,E.；Cowley,L.；Bore,J.A.；Koundouno,R.；Dudas,G.；Mikhail,A.；Ouédraogo,N.；Afrough,B.；Bah,A.；Baum,J.H.J.；Becker-Ziaja,B.；Boettcher,J.P.；Cabeza-Cabrerizo,M.；Camino-Sánchez,á.；Carter,L.L.；Doerrbecker,J.；Enkirch,T.；Dorival,I.G.；Hetzelt,N.；Hinzmann,J.；Holm,T.；Kafetzopoulou,L.E.；Koropogui,M.；Kosgey,A.；Kuisma,E.；Logue,C.H.；Mazzarelli,A.；Meisel,S.；Mertens,M.；Michel,J.；Ngabo,D.；Nitzsche,K.；Pallasch,E.；Patrono,L.V.；Portmann,J.；Repits,J.G.；Rickett,N.Y.；Sachse,A.；Singethan,K.；Vitoriano,I.；Yemanaberhan,R.L.；Zekeng,E.G.；Racine,T.；Bello,A.；Sall,A.A.；Faye,O.；Faye,O.；Magassouba,N.F.；Williams,C.V.；Amburgey,V.；Winona,L.；Davis,E.；Gerlach,J.；Washington,F.；Monteil,V.；Jourdain,M.；Bererd,M.；Camara,A.；Somlare,H.；Camara,A.；Gerard,M.；Bado,G.；Baillet,B.；Delaune,D.；Nebie,K.Y.；Diarra,A.；Savane,Y.；Pallawo,R.B.；Gutierrez,G.J.；Milhano,N.；Roger,I.；Williams,C.J.；Yattara,F.；Lewandowski,K.；Taylor,J.；Rachwal,P.；J.Turner,D.；Pollakis,G.；Hiscox,J.A.；Matthews,D.A.；Shea,M.K.O.；Johnston,A.M.；Wilson,D.；Hutley,E.；Smit,E.；DiCaro,A.；R.；Stoecker,K.；Fleischmann,E.；Gabriel,M.；Weller,S.A.；Koivogui,L.；Diallo,B.；S.；Rambaut,A.；Formenty,P.；Günther,S.；Carroll,M.W.,Real-time,portable genome sequencing for Ebola surveillance.Nature 2016,530(7589),228-232.

204.Plesa,C.；Kowalczyk,S.W.；Zinsmeester,R.；Grosberg,A.Y.；Rabin,Y.；Dekker,C.,Fast Translocation of Proteins through Solid State Nanopores.NanoLett.2013,13(2),658-663.

205.Cardozo,N.；Zhang,K.；Doroschak,K.；Nguyen,A.；Siddiqui,Z.；Bogard,N.；Strauss,K.；Ceze,L.；Nivala,J.,Multiplexed direct detection of barcoded proteinreporters on a nanopore array.Nat.Biotechnol.2021,DOI:10.1038/s41587-021-01002-6.

206.Palla,M.；Punthambaker,S.；Stranges,B.；Vigneault,F.；Nivala,J.；Wiegand,D.；Ayer,A.；Craig,T.；Gremyachinskiy,D.；Franklin,H.；Sun,S.；Pollard,J.；Trans,A.；Arnold,C.；Schwab,C.；McGaw,C.；Sarvabhowman,P.；Dalal,D.；Thai,E.；Amato,E.；Lederman,I.；Taing,M.；Kelley,S.；Qwan,A.；Fuller,C.W.；Roever,S.；Church,G.M.,Multiplex Single-Molecule Kinetics of Nanopore-Coupled Polymerases.ACS Nano2021,15(1),489-502.

207.Nivala,J.；Mulroney,L.；Li,G.；Schreiber,J.；Akeson,M.,Discriminationamong Protein Variants Using an Unfoldase-Coupled Nanopore.ACS Nano 2014,8(12),12365-12375.

208.Bell,N.A.W.；Keyser,U.F.,Digitally encoded DNA nanostructures formultiplexed,single-molecule protein sensing withnanopores.Nat.Nanotechnol.2016,11(7),645-651.

209.Huang,G.；Willems,K.；Soskine,M.；Wloka,C.；Maglia,G.,Electro-osmoticcapture and ionic discrimination of peptide and protein biomarkers with FraCnanopores.Nat.Commun.2017,8(1),935.

210.Schmid,S.；Dekker,C.,Nanopores:a versatile tool to study proteindynamics.Essays Biochem.2021,65(1),93–107.

211.Boukhet,M.；Piguet,F.；Ouldali,H.；Pastoriza-Gallego,M.；Pelta,J.；Oukhaled,A.,Probing driving forces in aerolysin and alpha-hemolysinbiological nanopores:electrophoresis versus electroosmosis.Nanoscale 2016,8(43),18352-18359.

212.Bhamidimarri,S.P.；Prajapati,J.D.；van den Berg,B.；Winterhalter,M.；U.,Role of Electroosmosis in the Permeation of Neutral Molecules:CymA and Cyclodextrin as an Example.Biophys.J.2016,110(3),600-611.

213.Huang,G.；Willems,K.；Bartelds,M.；van Dorpe,P.；Soskine,M.；Maglia,G.,Electro-Osmotic Vortices Promote the Capture of Folded Proteins by PlyABNanopores.Nano Lett.2020,20(5),3819-3827.

214.Soskine,M.；Biesemans,A.；Maglia,G.,Single-Molecule AnalyteRecognition with ClyA Nanopores Equipped with Internal ProteinAdaptors.J.Am.Chem.Soc.2015,137(17),5793-5797.

215.Li,X.；Lee,K.H.；Shorkey,S.；Chen,J.；Chen,M.,Different AnomericSugar Bound States of MBP Resolved by a Cytolysin A Nanopore Tweezer.ACS Nano2020,14(2),1727-1737.

216.Van Meervelt,V.；Soskine,M.；Maglia,G.,Detection of Two IsomericBinding Configurations in a Protein–Aaptamer Complex with a BiologicalNanopore.ACS Nano 2014,8(12),12826-12835.

217.Galenkamp,N.S.；Biesemans,A.；Maglia,G.,Directional conformerexchange in dihydrofolate reductase revealed by single-molecule nanoporerecordings.Nat.Chem.2020,12(5),481-488.

218.Galenkamp,N.S.；Soskine,M.；Hermans,J.；Wloka,C.；Maglia,G.,Directelectrical quantification of glucose and asparagine from bodily fluids usingnanopores.Nat.Commun.2018,9(1),4085.

219.Zernia,S.；van der Heide,N.J.；Galenkamp,N.S.；Gouridis,G.；Maglia,G.,Current Blockades of Proteins inside Nanopores for Real-Time MetabolomeAnalysis.ACS Nano 2020,14(2),2296-2307.

220.Restrepo-Pérez,L.；Wong,C.H.；Maglia,G.；Dekker,C.；Joo,C.,Label-FreeDetection of Post-translational Modifications with a Nanopore.Nano Lett.2019,19(11),7957-7964.

221.Lucas,F.L.R.；Piso,T.R.C.；van der Heide,N.J.；Galenkamp,N.S.；Hermans,J.；Wloka,C.；Maglia,G.,Automated Electrical Quantification of VitaminB1 in a Bodily Fluid using an Engineered Nanopore-Sensor.Angew.Chem.Int.Ed.2021,60(42),22849-22855.

222.Fragasso,A.；Schmid,S.；Dekker,C.,Comparing Current Noise inBiological and Solid-State Nanopores.ACS Nano 2020,14(2),1338-1349.

223.Soskine,M.；Biesemans,A.；De Maeyer,M.；Maglia,G.,Tuning the sizeand properties of ClyA nanopores assisted by directedevolution.J.Am.Chem.Soc.2013,135(36),13456-13463.

224.Liu,Y.；Pan,T.；Wang,K.；Wang,Y.；Yan,S.；Wang,L.；Zhang,S.；Du,X.；Jia,W.；Zhang,P.；Chen,H.-Y.；Huang,S.,Allosteric Switching of Calmodulin in aMycobacterium smegmatis porin A (MspA)Nanopore-Trap.Angew.Chem.Int.Ed.2021,60(44),23863-23870.

225.Shorkey,S.A.；Du,J.；Pham,R.；Strieter,E.R.；Chen,M.,Real-Time andLabel-Free Measurement of Deubiquitinase Activity with a MspANanopore.ChemBioChem 2021,22(17),2688-2692.

226.Wang,S.；Wang,Y.；Yan,S.；Du,X.；Zhang,P.；Chen,H.-Y.；Huang,S.,Retarded Translocation of Nucleic Acids throughα-Hemolysin Nanopore in thePresence of a Calcium Flux.ACS Appl.Mater.Interfaces 2020,12(24),26926-26935.

227.Wang,Y.；Guan,X.；Zhang,S.；Liu,Y.；Wang,S.；Fan,P.；Du,X.；Yan,S.；Zhang,P.；Chen,H.-Y.；Li,W.；Zhang,D.；Huang,S.,Structural-profiling of lowmolecular weight RNAs by nanopore trapping/translocation using Mycobacteriumsmegmatis porin A.Nat.Commun.2021,12(1),3368.

228.Postnikova,G.B.；Tselikova,S.V.；Shekhovtsova,E.A.,Myoglobin andmitochondria:Oxymyoglobin interacts with mitochondrial membrane duringdeoxygenation.Biochemistry(Moscow)2009,74(11),1211.

229.Fologea,D.；Krueger,E.；Al Faori,R.；Lee,R.；Mazur,Y.I.；Henry,R.；Arnold,M.；Salamo,G.J.,Multivalent ions control the transport through lyseninchannels.Biophys.Chem.2010,152(1),40-45.

230.He,Y.；Gillespie,D.；Boda,D.；Vlassiouk,I.；Eisenberg,R.S.；Siwy,Z.S.,Tuning Transport Properties of Nanofluidic Devices with Local ChargeInversion.J.Am.Chem.Soc.2009,131(14),5194-5202.

231.Ramirez,P.；Manzanares,J.A.；Cervera,J.；Gomez,V.；Ali,M.；Pause,I.；Ensinger,W.；Mafe,S.,Nanopore charge inversion and current-voltage curves inmixtures of asymmetric electrolytes.J.Membr.Sci.2018,563,633-642.

232.Alcaraz,A.；Nestorovich,E.M.；López,M.L.；García-Giménez,E.；Bezrukov,S.M.；Aguilella,V.M.,Diffusion,Exclusion,and Specific Binding in aLarge Channel:A Study of OmpF Selectivity Inversion.Biophys.J.2009,96(1),56-66.

233.Piguet,F.；Discala,F.；Breton,M.-F.；Pelta,J.；Bacri,L.；Oukhaled,A.,Electroosmosis throughα-Hemolysin That Depends on Alkali CationType.J.Phys.Chem.Lett.2014,5(24),4362-4367.

234.Gu,L.-Q.；Cheley,S.；Bayley,H.,Electroosmotic enhancement of thebinding of a neutral molecule to a transmembrane pore.Proc.Natl.Acad.Sci.U.S.A.2003,100(26),15498-15503.

235.Chinappi,M.；Yamaji,M.；Kawano,R.；Cecconi,F.,Analytical Model forParticle Capture in Nanopores Elucidates Competition among Electrophoresis,Electroosmosis,and Dielectrophoresis.ACS Nano 2020,14(11),15816-15828.

236.Sekhon,N.；Peacock,W.F.,Chapter 11-Biomarkers to Assist in theEvaluation of Chest Pain:A Practical Guide.In Biomarkers in CardiovascularDisease,Nambi,V.,Ed.Elsevier:2019；pp 115-128.

237.Chung,M.J.；Brown,D.L.,9-Diagnosis of Acute MyocardialInfarction.In Cardiac Intensive Care (Third Edition),Brown,D.L.,Ed.Elsevier:Philadelphia,2019；pp 91-98.e3.

238.Cammarata,M.B.；Brodbelt,J.S.,Structural characterization of holo-and apo-myoglobin in the gas phase by ultraviolet photodissociation massspectrometry.Chem.Sci.2015,6(2),1324-1333.

239.Lin,L.；Pinker,R.J.；Forde,K.；Rose,G.D.；Kallenbach,N.R.,Moltenglobular characteristics of the native state of apomyoglobin.Nat.Struct.Biol.1994,1(7),447-452.

240.Sankaranarayanan,K.,Studies on pH-Controlled Transition ofMyoglobin Capsules from Hollow to Multilayered Structures.Adsorpt.Sci.Technol.2015,33(9),759-768.

241.Ganguly,D.；Zhang,W.；Chen,J.,Synergistic folding of twointrinsically disordered proteins:searching for conformationalselection.Mol.Biosyst.2012,8(1),198-209.

242.Misiunas,K.；Ermann,N.；Keyser,U.F.,QuipuNet:Convolutional NeuralNetwork for Single-Molecule Nanopore Sensing.Nano Lett.2018,18(6),4040-4045.

243.Henley,R.Y.；Ashcroft,B.A.；Farrell,I.；Cooperman,B.S.；Lindsay,S.M.；Wanunu,M.,Electrophoretic Deformation of Individual Transfer RNA MoleculesReveals Their Identity.Nano Lett.2016,16(1),138-144.

244.Barati Farimani,A.；Heiranian,M.；Aluru,N.R.,Identification ofamino acids with sensitive nanoporous MoS2:towards machine learning-basedprediction.NPJ 2D Mater.Appl.2018,2(1),14.

245.Ohayon,S.；Girsault,A.；Nasser,M.；Shen-Orr,S.；Meller,A.,Simulationof single-protein nanopore sensing shows feasibility for whole-proteomeidentification.PLoS Comput.Biol.2019,15(5),e1007067.

246.Kolmogorov,M.；Kennedy,E.；Dong,Z.；Timp,G.；Pevzner,P.A.,Single-molecule protein identification by sub-nanopore sensors.PLoSComput.Biol.2017,13(5),e1005356.

247.Goulding,D.A.；Fox,P.F.；O’Mahony,J.A.,Chapter 2-Milk proteins:Anoverview.In Milk Proteins (Third Edition),Boland,M.；Singh,H.,Eds.AcademicPress:2020；pp 21-98.

248.Willems,K.；Ruic,D.；Biesemans,A.；Galenkamp,N.S.；Van Dorpe,P.；Maglia,G.,Engineering and Modeling the Electrophoretic Trapping of a SingleProtein Inside a Nanopore.ACS Nano 2019,13(9),9980-9992

249.Wang,Y.；Yan,S.；Zhang,P.；Zeng,Z.；Zhao,D.；Wang,J.；Chen,H.；Huang,S.,Osmosis-Driven Motion-Type Modulation of Biological Nanopores for ParallelOptical Nucleic Acid Sensing.ACS Appl.Mater.Interfaces 2018,10(9),7788-7797.

250.Yan,S.；Li,X.；Zhang,P.；Wang,Y.；Chen,H.Y.；Huang,S.；Yu,H.,Directsequencing of 2'-deoxy-2'-fluoroarabinonucleic acid(FANA)using nanopore-induced phase-shift sequencing(NIPSS).Chem.Sci.2019,10(10),3110-3117.

Claims

1.在纳米孔系统中表征分析物的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

2.根据权利要求1所述的方法，其中所述分析物选自由以下组成的组：核酸，蛋白质，多糖，聚合物，酶，以及核酸、蛋白质、肽、多糖、聚合物、酶和能够与它们相互作用的试剂的复合物。

3.根据权利要求2所述的方法，其中所述核酸选自由以下组成的组：LMW RNA，核酸双链体，适体，核酶或具有吻环、三向接合、假结、扭结转角或G-四链体结构的核酸。

4.根据权利要求3所述的方法，其中所述LMW RNA包含具有突出端或平端的siRNA、tRNA、miRNA和/或rRNA。

5.根据权利要求3所述的方法，其中所述核酸双链体具有突出端或平端。

6.根据权利要求3所述的方法，其中所述核酸双链体由miRNA和核酸探针组成，并且所述核酸探针是RNA、DNA或核酸类似物。

7.根据权利要求2所述的方法，其中所述蛋白质分析物选自由以下组成的组：带正电荷的、中性的或带负电荷的。

8.根据权利要求1-7中任一项所述的方法，其中所述分析物包含两种或更多种不同的分析物，并且这些分析物的表征在一次测量中完成。

9.根据权利要求1-8中任一项所述的方法，其中步骤iii)包含将所述测试电流模式与选自由以下组成的组的至少一种特征相关联：存在或不存在所述分析物、所述分析物的身份、所述分析物的序列、所述分析物中的突变、所述分析物的构象、所述分析物的局部结构、所述分析物的含量、所述分析物的总体尺寸、所述分析物的电荷和极性。

10.根据权利要求1所述的方法，其中所述分析物是通过靶分子和辅助分子的组合形成的复合物。

11.根据权利要求10所述的方法，其中步骤iii)包含将所述测试电流模式与所述靶分子的至少一种特征相关联。

12.用于在纳米孔系统中表征分析物和试剂之间相互作用的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

iii)将所述电流模式与所述分析物和所述试剂之间相互作用相关联。

13.用于在纳米孔系统中表征能够与分析物相互作用的试剂的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、MspA同源物或其变体，其中所述分析物具有构象，并且具有所述构象的分析物可以容纳在所述MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

iii)将所述电流模式与所述试剂相关联。

14.根据权利要求12或13所述的方法，其中所述分析物选自由以下组成的组：核酸、蛋白质、多糖、聚合物和酶。

15.根据权利要求14所述的方法，其中所述核酸是适体或核酶。

16.根据权利要求12或13所述的方法，其中所述分析物可以与离子、小分子、配体、受体或底物相互作用。

17.根据权利要求12-16中任一项所述的方法，其中所述试剂是离子、小分子、配体、受体或底物。

18.根据权利要求12-17中任一项所述的方法，其中所述试剂是多糖，优选肽聚糖、壳聚糖或甲壳素。

19.根据权利要求12-18中任一项所述的方法，其中所述分析物是溶菌酶。

20.根据权利要求1-19中任一项所述的方法，其中，步骤iii)通过将所述测试电流模式与参考电流模式进行比较或者通过使用机器学习算法来进行。

21.用于在纳米孔系统中检测样品中的感兴趣的分析物的方法，其中所述纳米孔系统包含设置在将第一导电液体介质与第二导电液体介质隔开的膜中的蛋白质纳米孔，其中所述蛋白质纳米孔是MspA、所述MspA同源物或其变体，其中所关注的分析物具有构象，并且具有初始构象的所关注的分析物可以容纳在MspA、所述MspA同源物或其变体的前庭中，但不能移位通过所述MspA、所述MspA同源物或其变体，所述方法包含：

i)将所述样品添加到所述第一导电液体介质和第二导电液体介质中的至少一种中，并在所述第一导电液体介质和所述第二导电液体介质之间施加适于将所述感兴趣的分析物驱动到所述纳米孔中的电位差；

iii)将所述测试电流模式与参考电流模式进行比较，所述参考电流模式至少包含在所述感兴趣的分析物处于所述MspA、所述MspA同源物或其变体的前庭中期间测量的离子电流迹线；

iv)通过iii)的比较来确定所述样品中存在或不存在所述感兴趣的分析物和/或所述样品中的感兴趣的分析物含量。

22.根据权利要求18所述的方法，其中所述感兴趣的分析物选自由以下组成的组：核酸、蛋白质、多糖、聚合物和酶。

23.根据权利要求21所述的方法，其中所述分析物是乳清蛋白。

24.根据权利要求21所述的方法，其中所述分析物为α-乳白蛋白和/或β-乳球蛋白。

25.根据权利要求21-23中任一项所述的方法，其中所述样品是乳品或蛋白粉。

26.根据权利要求1-24中任一项所述的方法，其中所述MspA、所述MspA同源物或其变体前庭侧的所述导电液体介质含有单价阳离子，并且所述MspA、所述MspA同源物或其变体缢缩部位侧的所述导电液体介质含有二价阳离子。

27.根据权利要求25所述的方法，其中所述单价阳离子是碱金属离子，优选选自K⁺、Na⁺和Li⁺。

28.根据权利要求25或26所述的方法，其中所述二价阳离子为碱土金属离子，优选选自Ca²⁺、Mn²⁺、Mg²⁺和Ba²⁺。