CN109564185A

CN109564185A - 样品中多核苷酸序列的分数丰度

Info

Publication number: CN109564185A
Application number: CN201780031347.4A
Authority: CN
Inventors: 赵亚南; W·麦肯纳; W·B·邓巴
Original assignee: Double Man Co
Current assignee: Double Man Co; Two Pore Guys Inc
Priority date: 2016-10-24
Filing date: 2017-10-24
Publication date: 2019-04-02
Also published as: IL277676A; RU2018142223A3; AU2017348009A1; JP2019517664A; EP3440456B1; AU2017348009B2; JP7012760B2; EP3800469A1; KR20190003720A; CA3021676A1; JP6664011B2; IL262360B; AU2020200187A1; EP3440456A4; KR102288461B1; MX2018013686A; KR102137178B1; ES2848715T3; RU2018142223A; CN112213372A

Abstract

本文公开了用于使用纳米孔传感器确定样品中的目标分析物(例如，特定多核苷酸序列)的真实分数丰度的改进估计值的方法和组合物，例如，通过校正鉴定电信号和将电信号与样品中的目标分析物或参照分析物的量相关联所固有的误差。

Description

样品中多核苷酸序列的分数丰度

相关申请的交叉引用

本申请要求2016年10月24日提交的美国临时申请No.62/412,221和2017年3月31日提交的国际申请No.PCT/US2017/025585的权益，其内容均通过引用完整并入本文。

技术领域

一种使用固态纳米孔和用于精确和准确定量的数学方法从样品确定特定多核苷酸序列的分数丰度的方法。

背景技术

通过确定样品中存在的组分的相对丰度来表征液体样品可以为许多科学领域和应用提供有价值的信息。例如，循环细胞游离DNA中点突变的相对丰度可用于诊断或监测患者中癌症的进展。作为另一个实例，确定遗传修饰生物(GMO)的转基因序列与基因组DNA(例如从种子集合获得的)内的非GMO参照序列的分数量对于管理和经济原因是重要的。

存在一些用于灵敏检测样品中目标分析物的分数量的方法，然而，这些方法通常是昂贵且耗时的，或具有其他限制。例如，定量实时PCR(qPCR)测定仍然是用于确定靶核酸序列相对于测试样品内的非变体参照序列的相对量的标准方法。然而，qPCR的定量性能受每个样品和每个扩增子的扩增效率的变异性限制。影响扩增效率的因素包括来自样品基质以及提取试剂本身的抑制剂和伴随污染物。这些因素因样品和制备而异，但也在于它们影响一个序列与另一个序列相比的扩增效率的程度。目标相对于参照扩增子的扩增效率的轻微的可变差异限制了qPCR解析>1.5倍的量差异。此外，扩增反应需要专门的试剂组并且必须适当地储存，并且可能是耗时的并且对反应条件敏感。

纳米孔装置的使用已经成为用于单分子鉴定的敏感工具，其中单个分子在施加电压下通过纳米孔移位时鉴定。纳米孔装置适合于现场应用，并且对于日常使用情况、人类健康、农业或其他任何地方而言足够便宜且有效。然而，来自纳米孔的数据的使用可能受到可能影响样品中分析物的定量估计的确定的误差，使得可靠地使用该数据是不可行的。

因此，所需要的是确定目标分析物与样品中的参照分析物相比的分数丰度的改进方法，其是通用的、经济的且易于使用的。

发明内容

根据一些实施方案，本文提供了使用纳米孔装置确定混合的未知样品中目标分析物的真实相对丰度的改进估计值的方法，包括在纳米孔装置中施加跨纳米孔的电压以单独地针对以下各项产生可检测的电子特征和诱导带电分析物通过所述纳米孔移位：对照样品，其包含已知与参照分析物的相对丰度的目标分析物，以及包含所述目标分析物和所述参照分析物的混合未知样品，其中所述样品中所述目标分析物的相对丰度待确定；对于每个样品产生通过所述目标分析物或所述参照分析物通过所述纳米孔的移位产生的多个事件特征；从所述多个事件特征中鉴定与所述目标分析物相关的第一事件特征的量和与所述参照分析物相关的第二事件特征的量，以确定每个样品的第一和第二事件特征的检测相对丰度；和使用所述对照样品中所述第一和第二事件特征的检测相对丰度来调整所述混合未知样品中所述第一和第二事件特征的检测相对丰度，以校正检测相对丰度的误差，从而确定在所述混合未知样品中所述目标分析物的真实相对丰度的改进估计值。在一些实施方案中，样品是液体样品。

在一些实施方案中，对照样品是包含所述目标分析物但不包含所述参照分析物的目标对照样品。在一些实施方案中，对照样品是参照对照样品，其包含所述参照分析物，但不包含所述目标分析物。

在一些实施方案中，使用纳米孔装置确定混合未知样品中的目标分析物的真实相对丰度的改进估计值的方法还包括向纳米孔装置施加电压以对于包含所述目标分析物但不包含所述参照分析物的目标对照样品诱导带电分析物通过纳米孔传感器的移位。

在一些实施方案中，调整所述未知样品中所述第一和第二事件特征的所述检测相对丰度包括使用所述目标对照样品和所述参照对照样品中的所述第一和第二事件特征的检测相对丰度以校正检测相对丰度的所述误差。在一些实施方案中，误差包括所述目标分析物的假阳性或假阴性检测误差。

在一些实施方案中，使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法还包括向纳米孔装置施加电压以对于包含所述目标分析物和所述参照分析物的混合对照样品诱导带电分析物通过纳米孔传感器的移位，其中所述目标分析物和所述参照分析物的相对丰度是已知的。

在一些实施方案中，在所述未知样品中所述第一和第二事件特征的所述检测相对丰度的调整包括使用所述目标对照样品、所述参照对照样品和所述混合对照样品中所述第一和第二事件特征的检测相对丰度以校正检测相对丰度的所述误差。

在一些实施方案中，误差包括假阳性目标分析物检测误差、假阴性目标分析物检测误差、所述目标分析物和所述参照分析物之间的捕获率常数差异或其任何组合。

在一些实施方案中，对照样品是包含所述目标分析物和所述参照分析物的混合对照样品，其中所述目标分析物和所述参照分析物的相对丰度是已知的。在一些实施方案中，误差包括所述目标分析物和所述参照分析物之间的捕获率常数差异。

在一些实施方案中，混合对照样品的所述目标分析物与所述参照分析物的相对丰度相对于所述混合的未知样品相差不超过1.2倍，1.5倍，2倍，5倍或10倍。

在一些实施方案中，真实相对丰度的估计值是所述混合未知样品中所述目标分析物与所述参照分析物的真实比率的估计值。在一些实施例中，真实比率的估计值通过确定，其中参数ρ是可以补偿假阳性检测误差、假阴性检测误差或者两者的比率的估计值，并且其中参数α可用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。在一些实施方案中，参数α是参照分析物捕获率除以目标分析物捕获率的比率的估计值。

在一些实施方案中，真实相对丰度的估计值是所述混合未知样品中所述参照分析物和所述目标分析物的群体中的所述目标分析物的真实分数的估计值。在一些实施方案中，真实分数的估计值通过确定，其中参数ρ是可以补偿假阳性检测误差、假阴性检测误差或两者的比率的估计值，并且其中参数α可用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。在一些实施方案中，参数α是参照分析物捕获率除以目标分析物捕获率的比率的估计值。

在一些实施方案中，参数并且在一些实施方案中，如果使用所述对照样品，则参数Q_targ是在所述目标对照样品中观察到的所述第一事件特征的分数，或者如果没有使用目标对照样品，则Q_targ＝1。在一些实施方案中，如果使用所述参照对照样品，则参数Q_ref是在所述参照对照样品中观察到的所述第一事件特征的分数，或者如果不使用参照对照样品，则参数Q_ref＝0。在一些实施方案中，参数Q_X:Y是在所述混合对照样品中观察到的所述第一事件特征的分数，并且其中是混合对照样品中目标分析物(X)与参照分析物(Y)的已知比率(如果使用所述对照样品)，或者如果不使用混合对照样品，则α＝1。在一些实施方案中，参数Q_mix是在所述混合未知样品中观察到的所述第一事件特征的分数。

在一些实施方案中，通过核酸扩增制备未知或对照样品。在一些实施方案中，未知或对照样品不通过核酸扩增制备。在一些实施方案中，样品纯化以基本上由参照和目标分子组成。在一些实施方案中，样品未经纯化。

在一些实施方案中，所述混合未知样品中所述参照分析物的量或浓度是已知的。在一些实施方案中，使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法还包括使用所述混合未知样品中所述目标分析物与所述参照分析物的真实相对丰度的所述估计值和所述混合未知样品中所述参照分析物的所述已知量或浓度来确定所述混合未知样品中所述目标分析物的绝对量或浓度的估计值。

在一些实施方案中，根据定义的阈值鉴定与所述目标分析物相关的第一事件特征的量和与所述参照分析物相关的所述第二事件特征的量。在一些实施方案中，使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法还包括使用Q检验、支持向量机或期望最大化算法优化所述阈值以提高所述参照分析物和/或所述目标分析物的检测准确度。在一些实施方案中，使用来自包含已知量的目标分析物和参照分析物的对照样品的电子特征来训练支持向量机。

在一些实施方案中，所定义的阈值是选自以下各项的事件特征的一个或多个特征的函数：事件持续时间、最大δG、中值δG、平均δG、事件特征的标准偏差、低于50Hz的事件的噪声功率的平均值或中值、所述事件特征中的独特模式、事件的面积或其任何组合。

在一些实施例中，使用Q检验、支持向量机或期望最大化算法来执行所述混合未知样品中所述第一和第二事件特征的所述检测相对丰度的调整以校正所述检测相对丰度的误差。

在一些实施方案中，目标分析物和所述参照分析物各自包含多核苷酸。在一些实施方案中，目标分析物多核苷酸和所述参照分析物多核苷酸具有不同的长度。在一些实施方案中，长度相差至少10个核苷酸，至少20个核苷酸，至少50个核苷酸，至少100个核苷酸，至少150个核苷酸或至少200个核苷酸。

在一些实施方案中，使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法还包括使所述对照或未知样品与结合第一有效负载的第一探针接触，其中所述第一探针配置成与所述第一分析物特异性结合。在一些实施方案中，使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法还包括使所述对照或未知样品与结合第二有效负载的第二探针接触，其中所述第二探针配置成特异性结合所述第二分析物。

在一些实施方案中，目标分析物与遗传修饰的生物体相关。在一些实施方案中，目标分析物包含与患者中癌症的存在或不存在相关的标志物。

本文还提供一种确定样品中目标分析物的相对量的方法，包括在纳米孔系统中单独地运行以下各项：包含参照分析物且不含目标分析物的第一对照样品，包含目标分析物并且不含参照分析物的第二对照样品，包含已知相对丰度的所述目标分析物和所述参照分析物的第三对照样品，以及包含未知相对丰度的所述目标分析物和所述参照分析物的实验样品；对于每个样品检测与参照分析物相关的第一事件特征的量和与目标分析物相关的第二事件特征的量；并且比较来自所述实验样品的所述第一和第二事件特征的量的相对丰度与来自所述第一对照样品、所述第二对照样品和所述第三对照样品中每一个的所述第一和第二事件特征的量的相对丰度以确定所述实验样品中所述参照分析物和所述目标分析物的真实相对丰度的估计值。

在一些实施方案中，事件特征包括由所述参照分析物通过所述纳米孔移位诱导的电信号。

在一些实施方案中，目标分析物和所述参照分析物各自包含多核苷酸。在一些实施方案中，参照分析物和所述目标分析物通过长度区分。

在一些实施方案中，参照分析物和所述目标分析物各自与包含有效负载的序列特异性探针结合，以促进所述参照分析物与所述目标分析物在所述纳米孔装置中的区分。

在一些实施方案中，相对丰度是所述目标分析物与所述样品中目标分析物和参照分析物的总群体相比的分数量。

本文还提供了确定未知样品中目标分析物的相对丰度的方法，包括提供包含多个参照分析物和多个目标分析物的未知样品；将所述未知样品加载到纳米孔装置的第一室中，所述纳米孔装置包括设置在所述第一室和第二室之间的纳米孔；跨所述纳米孔施加电压以使所述参照分析物和所述目标分析物通过所述纳米孔从所述第一室移动到所述第二室；检测各自与所述参照分析物通过纳米孔的移位相关的第一电信号的数量；检测各自与所述目标分析物通过纳米孔的移位相关的第二电信号的数量；和使用考虑至少一个与所述电信号相对丰度相关的误差的参照值将检测的第一电信号的数量和检测的第二电信号的数量的相对丰度转换为所述未知样品中所述目标分析物的真实相对丰度的估计值。

在一些实施方案中，参照值由包含已知量的目标分析物和参照分析物的混合对照样品确定的所述第一电信号的分数丰度确定。在一些实施方案中，参照值由包含已知量的目标分析物和参照分析物的混合对照样品确定的所述第一电信号的分数丰度确定。在一些实施方案中，参照值由包含已知量的目标分析物和参照分析物的混合对照样品确定的所述第一电信号的分数丰度确定。

在一些实施方案中，混合对照样品、所述目标对照样品或所述参照对照样品与来自所述未知样品的所述第一和第二电信号的所述检测期间所述纳米孔装置中的条件基本相同的条件下，在所述纳米孔装置中运行。

在一些实施方案中，纳米孔装置包括将装置的内部空间分隔成第一室和第二室的膜，其中所述膜包含所述纳米孔，其中所述第一室和所述第二室通过所述纳米孔流体连通，并且其中所述装置包括在每个腔室中用于施加跨所述纳米孔的电压的电极。在一些实施方案中，电极配置成监测通过所述纳米孔的电流。在一些实施例中，电极连接到电源。

在一些实施方案中，本文提供的方法通过考虑假阳性或假阴性检测误差或所述目标分析物和参照分析物之间的捕获率常数差异提高了混合未知样品中目标分析物的分数丰度的估计的准确度。在一些实施方案中，运行一系列对照以提高分数丰度估计的准确度，包括仅参照对照以考虑假阳性目标分析物检测误差、仅靶标对照以考虑假阴性目标分析物检测误差和一个或多个混合对照样品以考虑目标分析物和参照分析物之间的捕获率常数差异。

在一些实施方案中，混合未知样品中目标分析物与参照分析物之间的捕获率是相对一致的，使得不需要使用混合对照来改进相对丰度的估计。在一些实施方案中，混合样品中目标分析物与参照分析物之间的相对捕获率是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿该差异从而改进分数丰度的估计而无需运行混合对照样品。在一些实施方案中，使用与混合未知样品中相同的目标分析物和参照分析物种类在基本相同的纳米孔条件下运行的来自混合对照样品的数据用于改进分数丰度的估计而不实际运行混合对照样品作为方法的部分。

在一些实施方案中，确定阈值使得来自混合未知样品的假阳性值是可忽略的，并且不需要使用仅参照对照来改进相对丰度的估计。在一些实施方案中，来自混合样品的假阳性值是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿假阳性误差从而改进分数丰度的估计而不运行仅参照对照样品。在一些实施方案中，使用与混合未知样品中相同的参照分析物种类在基本上相同的纳米孔条件下运行的来自仅参照对照样品的数据用于改进分数丰度的估计而不实际运行仅参照对照作为方法的部分。

在一些实施方案中，确定阈值使得来自混合未知样品的假阴性值是可忽略的，并且不需要使用仅目标对照来改进相对丰度的估计。在一些实施方案中，来自混合样品的假阴性值是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿假阴性误差人体人体从而改进分数丰度的估计而不运行仅目标对照样品。在一些实施方案中，使用与混合未知样品中相同的目标分析物种类在基本上相同的纳米孔条件下运行的来自仅目标对照样品的数据用于改进分数丰度的估计而不实际运行仅目标对照作为方法的部分。

在一些实施方案中，本文提供了一种确定混合样品中目标分析物相对于参照分析物的相对丰度的估计值的方法，包括单独地对于以下各项向纳米孔装置施加电压以诱导带电分析物通过纳米孔传感器：混合对照样品，其包含已知与参照分析物的相对丰度的目标分析物，以及包含所述目标分析物和所述参照分析物的混合未知样品，其中所述目标分析物与所述参照分析物的相对丰度是未知的；对于每个样品检测与所述参照分析物相关的第一事件特征的量和与目标分析物相关的第二事件特征的量；和通过使用所述混合未知样品中所述第一和第二事件特征的检测相对丰度和所述混合对照样品中所述目标分析物与所述参照分析物的真实相对丰度调整来自所述混合未知样品的所述第一和第二事件特征的检测相对丰度，确定所述混合未知样品中所述目标分析物相对于所述参照分析物的真实相对丰度的估计值。

在一些实施方案中，本文提供了确定混合样品中目标分析物相对于参照分析物的相对丰度的估计值的方法，包括分别对于以下各项向纳米孔装置施加电压以诱导带电分析物通过纳米孔传感器：包含目标分析物但不包含参照分析物的目标对照样品，包含参照分析物但不包含目标分析物的参照对照样品，以及包含所述目标分析物和所述参照分析物的混合未知样品，其中所述目标分析物与所述参照分析物的相对丰度是未知的；对于每个样品检测与所述参照分析物相关的第一事件特征的量和与目标分析物相关的第二事件特征的量；通过使用所述目标对照样品和所述参照对照样品中所述第一和第二事件特征的检测相对丰度调整所述混合未知样品中所述第一和第二事件特征的检测相对丰度，确定所述混合未知样品中所述目标分析物对所述参照分析物的真实相对丰度的估计值。在一些实施方案中，目标对照样品提供用于来自所述混合未知样品的目标分析物的假阴性检测的校正项。在一些实施方案中，参照对照样品提供用于所述混合未知样品中目标分析物的假阳性检测的校正项。

在一些实施方案中，本文提供了确定混合样品中目标分析物相对于参照分析物的相对丰度的估计值的方法，包括别对于以下各项向纳米孔装置施加电压以诱导带电分析物通过纳米孔传感器：包含已知与参照分析物的相对丰度的目标分析物的混合对照样品，包含目标分析物但不包含参照分析物的目标对照样品，包含参照分析物但不包含目标分析物的参照对照样品，和包含所述目标分析物和所述参照分析物的混合未知样品，其中所述目标分析物与所述参照分析物的相对丰度是未知的；对于每个样品检测与所述参照分析物相关的第一事件特征的量和与目标分析物相关的第二事件特征的量；通过使用所述目标对照样品和所述参照对照样品中所述第一和第二丰度的检测相对丰度，以及所述混合对照样品中所述第一和第二事件特征的检测相对丰度和所述混合对照样品中所述目标分析物对所述参照分析物的真实相对丰度来调整来自所述混合未知样品的所述第一和第二事件特征的检测相对丰度，确定所述混合未知样品中所述目标分析物对所述参照分析物的真实相对丰度的估计值。

在一些实施方案中，确定混合样品中目标分析物相对于参照分析物的相对丰度的估计值的方法还包括对于包含所述目标分析物但不包含所述参照分析物的目标对照样品向纳米孔装置施加电压以诱导带电分析物通过纳米孔传感器的移位。

在一些实施方案中，确定混合样品中目标分析物相对于参照分析物的相对丰度的估计值的方法还包括对于包含所述参照分析物但不包含所述目标分析物的参照对照样品向纳米孔装置施加电压以诱导带电分析物通过纳米孔传感器的移位。确定所述混合未知样品中所述目标分析物相对于所述参照分析物的所述真实相对丰度的估计值的方法包括使用所述目标对照样品、所述参照对照样品和所述混合对照样品中所述第一和第二事件特征的检测相对丰度及所述混合对照样品中所述目标分析物与所述参照分析物的真实相对丰度调整所述混合未知样品中所述第一和第二事件特征的检测相对丰度。

在一些实施方案中，混合对照样品包含所述目标分析物与所述参照分析物的相对丰度，其相对于所述混合未知样品相差不超过1.2倍，1.5倍，2倍，5倍或10倍。

在一些实施方案中，相对丰度包括目标分析物:参照分析物的比率。在一些实施方案中，所述混合未知样品中目标分析物与所述参照分析物的真实比率的估计值通过确定，其中参数ρ为可补偿假阳性检测误差、假阴性检测误差或两者的比率的估计值，和其中参数α可用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。在一些实施方案中，参数α是参照分析物捕获率除以目标分析物捕获率的比率的估计值。

在一些实施方案中，相对丰度包括所述目标分析物和所述参照分析物的群体中所述目标分析物的分数。在一些实施方案中，所述混合未知样品的所述参照分析物和所述目标分析物的群体中所述目标分析物的真实分数的估计值通过来确定，其中参数ρ是可以补偿假阳性检测误差、假阴性检测误差或两者的比率的估计值，并且其中参数α可以用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。在一些实施方案中，参数α是参照分析物捕获率除以目标分析物捕获率的比率的估计值。

在一些实施方案中，本文提供了试剂盒，其包括包含已知相对丰度的目标分析物和参照分析物的对照样品；和用于在纳米孔装置中运行所述对照样品及包含所述参照分析物和所述目标分析物的未知样品以确定所述未知样品中所述参照分析物和所述目标分析物的相对丰度的说明书。

在一些实施方案中，本文提供了试剂盒，其包括包含目标分析物的第一对照样品，其中所述第一对照样品不含参照分析物；包含所述参照分析物的第二对照样品，其中所述第二对照样品不含所述目标分析物；包含已知相对丰度的所述目标分析物和所述参照分析物的第三对照样品；和用于在纳米孔装置中分别运行所述第一对照样品、所述第二对照样品、所述第三对照样品和包含所述参照分析物和所述目标分析物的未知样品以确定所述未知样品中所述参照分析物和所述目标分析物的相对丰度的说明书。

在一些实施方案中，本文提供了一种计算机执行的确定样品中目标分析物的真实分数丰度的估计值的方法，包括：从纳米孔传感器获得来自参照分析物对照或目标分析物对照至少一个的数据，其中所述数据包括来自移位通过所述纳米孔的目标分析物或参照分析物的多个事件特征；鉴定事件特征的一个或多个特性以区分与目标分析物相关的那些事件特征和与参照分析物相关的那些事件特征；训练所述支持向量机以鉴定优化的阈值而区分所述第一事件与所述第二事件并且生成样品中所述参照分析物和所述目标分析物的真实相对丰度的估计值，其中所述训练包括使用选自参照对照样品、目标对照样品和混合对照样品的对照，并且其中训练包括使用已知混合样品的验证；并且使用所述训练的支持向量来从来自混合样品的在纳米孔装置上记录的事件确定样品中目标分析物的分数丰度。

在一些实施方案中，本文提供了一种计算机执行确定样品中目标分析物的真实分数丰度的估计值的方法，包括：从纳米孔装置获得一组数据，所述数据包括来自至少一个对照样品和至少一个未知样品的事件特征；鉴定用于产生阈值以区分与所述目标分析物相关的第一事件特征和与所述参照分析物相关的第二事件特征的一组特性；并使用训练的支持向量机估计所述未知样品中分数丰度的真实值。

附图说明

如从附图中所示的本发明的特定实施例的以下描述，前述和其他目的、特征和优点将是显而易见的，其中相同的附图标记在不同视图中指代相同的部分。附图不一定按比例绘制，而是将重点放在说明本发明的各种实施例的原理上。

图1A显示了由穿过纳米孔的dsDNA引起的单分子事件的典型电子特征，其具有移位的特征持续时间和移位期间电流的减少。

图1B显示了在22nm直径的纳米孔中记录的5.6kb dsDNA的最大δG对持续时间的全事件散点图。

图2A显示当727bp DNA在1M LiCl中100mV下通过25nm直径固态纳米孔时的典型事件。事件区域有阴影。

图2B示出了事件持续时间随dsDNA长度的增加而增加，而事件深度是保守的。

图2C显示了在所示的每个长度上对于dsDNA记录的所有事件的面积的log10的分布图。

图3A描绘了在来自类型1分析物(正方形)和类型2分析物(圆形)的事件之间产生的阈值的实例。

图3B示出了输入特征向较高维空间的转化的结果的示例，以增加来自类型1分析物(正方形)和类型2分析物(圆形)的事件之间的线性阈值的准确度。

图4A显示了来自参照分析物样品、目标分析物样品和根据事件面积的混合样品的所有事件的概率直方图。

图4B描绘了来自仅参照分析物(Qref)、仅目标分析物(Qtarg)以及目标分析物和参照分析物的混合样品(Qmix)的低于面积阈值的事件百分比的图。

图4C示出了分数量参数ρ(q)如何在q值处图形表现。q＝5pA*ms阈值(垂直虚线)对应于0.05的假阳性(即，Q_ref＝0.05)和0.1的假阴性(即，Q_targ＝0.9)。

图5A显示了目标基因相对丰度(GMO(％))与目标基因的真实相对丰度(GMO(％))的估计值确定的结果。显示高于或低于零误差线(斜率＝1)的10％的误差容限用于比较。

图5B显示使用两个分离的对照和六个已知混合物测定样品中遗传修饰生物体的真实相对丰度的估计值的结果。将预测的目标丰度百分比的值相对于真实的目标丰度百分比作图。为了比较，显示了高于和低于零误差线(斜率＝1)的10％误差容限。

图6显示了在阈值范围上目标分析物丰度(GMO(％))的估计值的结果，用于根据事件面积区分目标分析物与参照分析物。

图7显示了来自训练的支持向量机的一组测试数据的准确度预测，其具有用于区分来自目标和参照分析物的事件特征的最佳参数。

图8显示了两种分子类型(与探针/有效负载结合的94bp靶dsDNA和与探针/有效负载结合的74bp参照dsDNA)的事件图，其在相同孔上顺序地作为分离的对照运行。

图9A显示了重叠的100％目标分析物对照样品(实心圆)和100％参照分析物对照样品(空心方块)的平均δG相对于持续时间的代表性事件图。目标分析物是89bp DNA，其中G12D结合的探针与3分支PEG连接(表示为G12D-3bPEG)。参照分析物是89bp DNA，其中野生型(c.35G)-结合的探针与8臂PEG连接(表示为WT-8armPEG)。用于确定事件特征来自穿过纳米孔的目标分析物的阈值(q₁＝1毫秒，q₂＝0.4和q₃＝0.65nS)建立目标标记框(虚线)。

图9B显示了来自图9A的图，其中来自未知样品A(三角形)和包含目标分析物和参照分析物的样品B(星形)的数据覆盖在该图上。

图10显示了重叠的100％目标分析物对照样品(实心圆)和100％参照分析物对照样品(空心方块)的平均δG对持续时间的代表性事件图。还绘制了用于区分目标分析物与参照分析物的支持向量机鉴定的决策边界(即阈值)。

图11显示了在最大δG对持续时间的全事件散点图上绘制的50％目标/50％参照混合物样品的事件。目标域的框包含与探针结合的突变体目标相关的事件。

图12显示了使用3-高斯混合物模型对高斯混合物期望最大化算法(EMGM)应用于来自图11中所示的50％目标/50％参照混合物样品的数据的结果，用于鉴定目标(突变体)和参照(野生型)群体。

图13显示了使用3-高斯混合物模型将EMGM应用于来自仅参照对照样品的数据以建立假阳性分数的结果。

图14显示了使用3-高斯混合物模型将EMGM应用于来自混合未知样品的数据以鉴定未知样品中突变体(目标)分子的相对丰度的结果。

具体实施方式

在下面的描述中阐述了本发明的各种实施方案的细节。根据说明书和附图以及权利要求，本发明的其他特征、目的和优点将显而易见。

定义

在整个本申请中，该文本涉及本发明营养素、组合物和方法的各种实施方案。所描述的各种实施方案旨在提供各种说明性实施例，而不应解释为对替代种类的描述。相反应该注意，这里提供的各种实施方案的描述可以是重叠的范围。这里讨论的实施方案仅仅是说明性的，并不意味着限制本发明的范围。

而且在整个本公开中，各种出版物、专利和公开的专利说明书通过标识引用来参考。这些出版物、专利和公开的专利说明书的公开内容通过引用结合到本公开中以更全面地描述本发明所属领域的状态。

如说明书和权利要求书中所用，单数形式“一”、“一个”和“该”包括复数指代，除非上下文另有明确说明。例如，术语“一电极”包括多个电极，包括其混合物。

如本文所使用的，术语“包含”旨在表示所述装置和方法包括所述及的组件或步骤，但不排除其他组件或步骤。当用于定义装置和方法时，“基本上由......组成”意味着排除对组合具有任何必要意义的其他组件或步骤。“由......组成”是指排除其他组件或步骤。由这些过渡术语中的每一个定义的实施方案都在本发明的范围内。

所有数字指示，例如距离、尺寸、温度、时间、电压和浓度，包括范围，是旨在包括参数测量中的普通实验变异的近似值，并且该变异旨在所描述的实施方案的范围内。应理解，尽管并非总是明确指出所有数字指示前面都有术语“约”。还应理解，尽管并非总是明确说明，但本文描述的组件仅仅是示例性的，并且这些组件的等同物在本领域中是已知的。

如本文所用，术语“分析物”是指任何分子、化合物、复合物或其他实体，其存在可以使用纳米孔传感器检测以便于确定孔中分析物的相对丰度。当提及目标分析物或参照分析物时，术语目标分子或参照分子可互换使用。

如本文所用，术语“目标分析物”是指样品中感兴趣的分子或复合物。在一些实施方案中，目标分析物包含具有目标核酸的序列的多核苷酸的部分。如本文所述，目标分析物可以特异性地靶向于通过探针结合以促进纳米孔传感器中目标分析物的检测。

如本文所用，术语“参照分析物”是指样品中感兴趣的分子或复合物，其丰度用作目标分析物的定量的相对量度。在一些实施方案中，参照分析物包含具有目标核酸的序列的多核苷酸的部分。如本文所述，参照分析物可以特异性地靶向通过探针结合以促进纳米孔传感器中目标分析物的检测。

如本文所用，术语“特异性结合”或“特异性地结合”是指探针与目标分析物或参照分析物的靶向结合。

如本文所用，术语“探针”是指与目标分析物或其片段特异性结合的分子。在一些实施方案中，探针包含配置成影响在复合物移位时产生的电子特征有效负载分子，所述复合物包含与探针-有效负载分子或复合物结合的目标或参照分析物。在一些实施方案中，探针包含适于结合有效负载分子的有效负载分子结合部分。

如本文所用，术语“有效负载分子”是指具有在捕获于在相关的尺寸范围内的纳米孔中时有助于产生独特的电信号物理尺寸的分子。有效负载分子可以与目标分析物或参照分析物结合以促进纳米孔装置中目标分析物或参照分析物的检测。在一些实施方案中，有效负载分子也可带电以充当驱动分子。在一些实施方案中，有效负载分子包含能够特异性结合探针分子的探针结合部分，该探针特异性结合目标分析物或参照分析物。

如本文所用的术语“纳米孔”(或仅“孔”)是指分隔两个体积的膜中的单个纳米级开口。孔可以是例如插入脂质双层膜中的蛋白质通道，或者可以通过钻孔或蚀刻或使用电压脉冲方法通过薄的固态基底(例如氮化硅或二氧化硅或石墨烯)或这些或其他材料的组合层建造。几何上，孔的直径不小于0.1nm，且直径不大于1微米；孔的长度由膜厚度决定，膜厚度可以是亚纳米厚度，或厚度高达1微米或更大。对于厚度大于几百纳米的膜，纳米孔可称为“纳米通道”。

如本文所用，术语“纳米孔仪器”或“纳米孔装置”是指将一个或多个纳米孔(并联或串联)与用于感测单分子事件的电路组合的装置。纳米孔装置内的每个纳米孔，包括其用于促进用该纳米孔的感测的腔室和电极，在本文中称为纳米孔传感器。具体而言，纳米孔仪器使用敏感的电压钳放大器以施加跨一个或多个孔的指定电压而同时测量通过孔的离子电流。当单个带电分子如双链DNA(dsDNA)被捕获并通过电泳驱动通过孔时，测量的电流发生偏移，表明捕获事件(即分子通过纳米孔的移位，或分子捕获在纳米孔中)，并且事件的(电流幅度的)偏移量和持续时间用于表征纳米孔中捕获的分子。在实验期间记录许多事件之后，分析事件的分布以根据其偏移量(即，其电流特征)来表征相应的分子。通过这种方式，纳米孔为生物分子感测提供了简单、无标记、纯电子的单分子方法。

如本文所使用的，术语“电信号”包括根据电子电路的配置随时间收集的关于电流、阻抗/电阻或电压的一系列数据。常规地，电流以“电压钳”配置测量；电压以“电流钳”配置测量，并且电阻测量可以使用欧姆定律V＝IR在任一配置中导出。还可以通过从纳米孔装置收集的电流或电压数据测量来产生阻抗。这里所称的电信号的类型包括电流特征和电流阻抗特征，尽管可以使用各种其他电信号来检测纳米孔中的颗粒。

如本文所用，术语“事件”是指可检测分子或分子复合物通过纳米孔的移位及其通过电信号的相关测量，例如，通过纳米孔的电流随时间的变化。它可以通过纳米孔中其电流、相对基线开放通道的电流变化、持续时间和/或分子检测的其他特征来定义。具有相似特征的多个事件指示相同或具有相似特征(例如，体积、电荷)的分子或复合物的群体。

如本文所使用的，事件的“面积”是指事件的持续时间的绝对值(即，电流偏离开放通道电流信号的持续时间)乘以事件持续时间内相对开放通道的电流平均变化(即pA*ms)。

如本文所使用的，术语“相对丰度”是指项目相对于组中相关项目总数的量。例如，在样品中的目标分析物的情况中，目标分析物的相对丰度是指与参照分析物相比样品中存在的目标分析物的量。这可以表示为分数丰度，例如，与目标分析物和参照分析物的总群体相比，样品中目标分析物的百分比。相对丰度也可以表示为例如目标分析物：参照分析物的比例。关于电子特征，一组电子特征的相对丰度可以指相比于与参照分析物相关的第二电子特征的量，与目标分析物相关的第一电子特征的量。为了区分样品中目标分析物的实际相对丰度(即，先前测量或制备为具有已知的相对丰度的)和根据本文提供的方法测定的相对丰度，我们经常将实际相对丰度称为“真实相对丰度”，以及通过本文描述的方法测定的相对丰度作为“真实相对丰度的估计值”。

如本文所用，术语“对照样品”是指含有已知与参照分析物的相对丰度的目标分析物的样品。本文使用对照样品，例如参照对照样品、目标对照样品和混合对照样品，以提高未知样品中分数丰度的估计值的准确度。在一些实施方案中，对照样品包含目标分析物、参照分析物或两者。

如本文所用，术语“未知样品”或“未知混合样品”或“混合未知样品”是指含有未知的相对丰度的参照分析物的样品。如果要通过本文提供的方法确定相对丰度，则参照分析物的相对丰度被认为是未知的，即使已经知道估计值的一些值。对于一些未知样品，样品中参照分析物的量或浓度是已知的。

如本文所用，术语“已知样品”是指含有已知与参照分析物的相对丰度的目标分析物的样品，并且用于训练、验证或提供精确的估计值、分数丰度估计模型或模型的特性，例如阈值。

引言/综述

在一些实施方案中，本文提供的发明是用于确定目标分析物相对于样品中存在的参照分析物的真实相对丰度(例如，分数量或比率)的估计值的方法。该方法利用纳米孔单分子计数器(即，纳米孔装置)来检测和区分样品中的目标分析物和参照分析物。

使用与目标分析物和参照分析物相关的原始电子事件特征来确定样品中目标分析物的相对丰度的估计值可能是不准确的，原因有多种，包括假阳性检测错误、假阴性检测错误以及与混合样品中目标分析物和参照分析物之间的捕获率常数差异相关的误差。在本文中，根据一些实施方案，我们提供了提高估计样品中参照和目标分析物的真实分数丰度的准确度的方法。在一些实施方案中，这些方法需要使用专门设计来校正与混合样品中的电子信号检测相关的一个或多个误差的对照样品。当混合样品包含已知量或浓度的参照分析物时，相对丰度的改进估计值可用于提供样品中目标分析物的真实量或浓度的改进估计。

在一些实施方案中，本文提供的方法通过考虑假阳性或假阴性检测错误或所述目标分析物与所述参照分析物之间的捕获率常数差异来提高混合未知样品中目标分析物的分数丰度的估计的准确度。在一些实施方案中，运行一系列对照以提高分数丰度估计的准确度，包括以考虑假阳性目标分析物检测误差的仅参照的对照、考虑假阴性目标分析物检测误差的仅目标的对照及考虑目标分析物和参照分析物之间的捕获率常数差异的一个或多个混合对照样品。

在一些实施方案中，混合未知样品中目标分析物和参照分析物之间的捕获率是相对一致的，使得不需要使用混合对照来改进相对丰度的估计值。在一些实施方案中，混合样品中目标分析物与参照分析物之间的相对捕获率是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿该差异而改进分数丰度的估计而无需运行混合对照样品。在一些实施方案中，使用与混合的未知样品中相同的目标和参照分析物种类在基本相同的纳米孔条件下运行的来自混合对照样品的数据用于改善分数丰度的估计而不实际运行作为方法的部分的混合对照样品。

在一些实施方案中，确定阈值使得来自混合未知样品的假阳性值是可忽略的，并且不需要使用仅参照对照来改进相对丰度的估计。在一些实施方案中，来自混合样品的假阳性值是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿假阳性误差而改进分数丰度的估计而不运行仅参照对照样品。在一些实施方案中，来自在基本上相同的纳米孔条件下使用与混合未知样品中相同的参照分析物种类运行的仅参照对照样品的数据用于改进分数丰度的估计而不实际运行作为方法部分的仅参照对照。

在一些实施方案中，确定阈值使得来自混合未知样品的假阴性值是可忽略的，并且不需要使用仅目标对照来改进相对丰度的估计。在一些实施方案中，来自混合样品的假阴性值是已知的，使得校正项可以应用于来自混合未知样品的数据以补偿假阴性误差而改进分数丰度的估计而不运行仅目标对照样品。在一些实施方案中，在基本上相同的纳米孔条件下使用与混合未知样品中相同的目标分析物种类运行的来自仅目标对照样品的数据用于改善分数丰度的估计而不实际运行作为方法部分的仅目标对照。

样品使用

与参照核酸分子相比，确定核酸片段内靶序列的分数量具有许多应用。

在一个示例用途情况中，我们使用本文的方法来确定遗传修饰生物体(GMO)的转基因序列与基因组DNA(例如从种子集合获得的)内的非GMO参照序列的分数量。出于监管和经济原因，这种测定很重要。具有期望性状的种子的买方和卖方需要精确和准确地了解包含期望性状的种子的分数以使定价和交易公平。

因此，在一些实施方案中，本文提供的方法提供来自推测含有1-100％GMO含量的集合种子、谷粒、面粉和饲料的％GMO含量测定。种子开发商、种植者和监管机构需要精确的措施和能力以解析GMO含量中的10％差异(1.1倍)。％GMO定义为100x(GMO事件拷贝数)/(分类群特异性基因组基准拷贝数)。

作为另一个示例用途情况，我们使用本文所述的方法来监测来自血液或尿液样品的无细胞循环DNA内包含点突变的多核苷酸序列与非突变(野生型)序列的相对丰度。特定基因组位点的点突变的相对丰度与癌症类型和治疗结果相关。确定对于非突变体序列的突变体相对丰度可用于指导诊断、治疗和疾病进展监测。尽管肿瘤成像结果可能需要数周才能显示出收缩/生长的团块，但本文所述的方法允许通过使用易于获得的样品类型快速鉴定突变标志物的相对丰度，从而允许有效且频繁的测试(例如，每天)。关键的是，这种技术可以通过提供疾病动态的更多时间点来更有效地揭示治疗反应，同时还允许早期检测复发。

在一些实施方案中，本文提供的方法在遗传性癌症筛选测定中提供拷贝数变异(CNV)测定。用于遗传性癌症倾向的拷贝数变异(CNV)测试。目标是检测基因调控元件与参照的小于1.5倍差异的缺失或重复。例如，BRCA1基因拷贝数的10％差异(1.1倍)可能需要临床行动。

纳米孔隙检测

在固态硅基衬底中形成纳米孔，并且通过在缓冲电解溶液中跨孔施加电压来执行单分子实验。

图1A显示由dsDNA穿过纳米孔引起的典型单分子事件。通过持续时间宽度和最大电导深度，maxδG来定量事件。MaxδG是电流衰减δI除以施加的电压V。图1B显示了在5分钟内用22nm直径纳米孔(V＝100mV，1nM DNA，1M LiCl，10mM Tris，1mM EDTA，pH＝8.8)记录的1072个5.6kb dsDNA事件的maxδG对持续时间的全事件散点图。

除了maxδG和持续时间之外，可以定量的事件分布的其他特性是：平均δG、中值δG、事件信号的标准偏差以及其他更高阶特性。另一个有用的特性是事件的积分面积的绝对值，其可以计算为平均δG乘以持续时间(Storm，AJ，JH Chen，H W Zandbergen和C Dekker.“Translocation of Double-Strand DNA Through a Silicon Oxide Nanopore“.Physical Review E 71，no.5(2005年5月)：051903，doi:10.1103/PhysRevE.71.051903)。积分面积，或仅“面积”，也被称为电荷缺陷(Fologea，Daniel，MarcGershow，Bradley Ledden，David S McNabb，Jene A Golovchenko和Jiali Li.“DetectingSingle Stranded DNA with a Solid State Nanopore“.Nano Letters 5，no.10(2005年10月)：1905-9.doi:10.1021/nl051199m)。

对于足够长以在折叠状态(>700bp)下穿过纳米孔的dsDNA，事件可以显示多于一个幅度。图1B是这样的实例，其中完全折叠的事件显示更大的maxδG值和更短的持续时间，并且展开的事件显示更长的持续时间和更浅的maxδG值。部分折叠的事件在事件内显示两个振幅水平，从较深的水平开始并以较浅的水平结束，并且具有在展开的和完全折叠的事件之间的总持续时间宽度。虽然δG和持续时间分布对于可以折叠的dsDNA显示模式的混合，但事件面积对于dsDNA具有单一模式分布，无论DNA是否足够长以在通过纳米孔时折叠。

使用纳米孔对目标分析物和参照分析物的区分是基于在各自通过纳米孔移位时检测到足够不同的事件特征，以实现可靠和灵敏的检测。平均事件特征的差异可以基于特征持续时间、电流的变化、事件特征内的特性或其他可区分的特性及其组合。所使用的特性是确定阈值的基础，该阈值用作鉴定与用于本文所述的分数丰度测定的参照分析物和目标分析物相关的事件特征的方法。

在一些实施方案中，目标和参照片段是具有足够不同长度的dsDNA分子以产生不同的纳米孔事件持续时间。

在一些实施方案中，目标分析物和参照分析物都是dsDNA，并且产生不同事件类型的特性可以是目标分析物和参照分析物的长度差异。在这样的实施方案中，由目标和参照分析物的长度差异产生的目标和参照事件面积的差异用于区分目标和参照事件特征(即，事件分布)。

dsDNA的事件面积分布具有单一模式。当目标和参照分析物是具有足够不同的长度的dsDNA时，这使得面积成为将事件分类为目标类型或参照类型的有用的事件的特性。为了产生足够不同的面积分布，对于直径大于20nm的纳米孔，长度应该相差至少100bp。对于直径为1-20nm的较小纳米孔，例如，通过受控的介电击穿形成的(Yanagi，Itaru，RenaAkahori，Toshiyuki Hatano和Ken-ichi Takeda.“Fabricating Nanopore withDiameters of Sub 1Nm to 3Nm Using Multilevel Pulse-Voltage Injection.“Scientific Reports 4(2014)：5000doi:10.1038/srep05000)，目标和参照的dsDNA长度应相差至少20bp。

对于目标分子和参照分子，dsDNA长度如何不同没有明显的上限。

图2A显示当727bp DNA在1M LiCl中100mV下通过25nm直径的固态纳米孔时的典型事件。事件面积显示为阴影区域。图2B显示事件面积如何随dsDNA长度增加。主要地，是事件持续时间增加而事件深度保持保守，且事件面积(平均深度乘持续时间)捕获这个长度相关的增加，因为它与持续时间成比例。图2C显示了对于在相同的纳米孔上顺序运行的所示的每个DNA长度记录的所有事件的面积(pA*ms)的以10为底的log的分布。事件面积的以10为底的log的分布近似正态(高斯)。随着DNA长度的增加，分布的平均值增加。

为了产生包含dsDNA的目标序列和包含dsDNA的参照序列，其中两个dsDNA长度为至少300bp，长度为至多100,000bp。在一些实施方案中，目标和参照dsDNA分析物的长度差异为至少10bp，20bp，30bp，40bp，50bp，60bp，70bp，80bp，90bp，100bp，150bp，200bp或300bp。通常，当通过大小区分时，目标和参照dsDNA分析物之间的长度差异增加有助于与目标和参照分析物相关的事件特征测定的更高灵敏度和特异性，这改进了样品中相对丰度的估计。

在一些实施方案中，指明从基因组DNA(gDNA)切除的多核苷酸片段的性质是用于分数丰度测定的工作流程的一部分。这些片段规格可包括例如它们的序列、长度和二级结构。在一些实施方案中，片段规格增强纳米孔装置对特定序列的捕获和检测。

在一些实施方案中，目标和参照片段与不同的有效负载分子结合，使得目标/有效负载和参照有效负载分子产生足够不同的纳米孔事件特征。在一些实施例中，不同事件特征是事件持续时间、事件最大深度、事件平均深度和/或其他事件性质的组合。

在一些实施方案中，通过序列特异性有效负载区分目标和参照分析物，当每个分子或复合物类型(目标-有效负载，参照-有效负载)通过孔时，其产生独特的纳米孔事件特征。在国际公开号WO/2015/171169，“Target Detection with a Nanopore”，国际公开号WO/2014/182634，“A Method of Biological Target Detection Using a Nanopore anda Fusion Protein Binding Agent”,“国际公开号WO/2016/049657，”Target SequenceDetection by Nanopore Sensing of Synthetic probes“，国际公开号WO/2016/126746，”Nanopore Detection of Target Polynucleotides from Sample Background“和国际公开号WO/2017/173392，“Nanopore Discrimination of Target Polynucleotides fromSample Background by Fragmentation and Polyload Binding”中描述了使用与结合于每种分子类型的有效负载结合的探针以促进区分的方法，其各自通过引用整体并入本文。

在一些实施方案中，目标分析物和/或参照分析物是dsDNA，其中独特的有效负载结合的PNA侵入每种dsDNA类型(靶标和参照)以产生待用纳米孔检测的两种大分子类型。在一些实施方案中，目标分析物和/或参照分析物是单链核酸(ssNA)，包括DNA或RNA。有效负载结合的互补核酸(例如，LNA)与ssNA上的区域杂交，并且一个或多个侧翼引物与ssNA的其他区域杂交，以产生具有结合的有效负载的双链分子，并且有效负载是对于目标和参照独特的，以建立独特的目标和参照事件分布。

分数丰度框架

在一些实施方案中，分数丰度框架涉及：1)对于目标分析物和参照类型设计和应用生物化学方法以将样品材料转化为纳米孔感测形式；2)应用特定的纳米孔实验方案；和3)应用分析方法以产生目标与参照分析物的相对丰度的定量估计值。本节重点在于框架的部分1。

用于纳米孔隙检测的样品制备

包含靶序列的分子(称为“目标分析物”或“目标分子”)和包含参照序列的分子(称为“参照分析物”或“参照分子”)可以在物理上相似：例如目标和参照分子可以具有相似的分子量或多核苷酸长度，并且可以仅相差单个核苷酸。生物化学方法的目标是在没有偏差的情况下使目标和参照分子产生不同的在通过纳米孔移位时的“目标”或“参照”事件分布。以这种方式，在纳米孔上测量的目标：参照混合物代表样品中目标：参照浓度比率。

在一些使用情况中，将多核苷酸序列添加至目标分子、参照分子或两者以产生不同的事件分布可能是有利的。例如，从血液或尿液的无细胞循环DNA部分获得的大多数DNA片段的长度均匀地短至150-200bp。通过常规方法(包括PCR、连接和直接寡核苷酸杂交)添加多核苷酸序列允许最大化纳米孔事件的区别的灵活性。在其他情况下，携带共价结合的聚合物有效负载的化学修饰寡核苷酸探针的杂交用于改变目标或参照分析物电荷和分子量而不影响多核苷酸长度。在所有情况下，目的是每个目标和参照分子组的不同事件分布。

存在着其中有足够的起始材料(其可以在纳米孔感测之前使用富集策略而无需PCR)的使用情况，包括GMO实例(含有GMO靶序列的大豆种子的分数量)。还存在着其中需要PCR作为富集的部分的其他情况，包括液体活组织检查，因为血液或尿液样品可含有每毫升液体<10个靶序列。所提出的方法与样品制备要求不相干，包括样品收集、纯化及目标和参照的浓缩。纳米孔测量和随后的分数丰度定量可以实现，只要目标和参照与背景(<1pM)相比充分富集(>10pM)，且目标和参照分析物产生可以彼此区分和区别于背景(在存在的情况下)的电事件特征。

在一些实施方案中，目标或参照分析物包括长度为20nt-100,000nt的多核苷酸序列(包括双链和单链DNA、RNA和合成多核苷酸)。在一些实施方案中，包含靶序列的多核苷酸源自有机体gDNA，包括来自植物、人、动物、昆虫、细菌或病毒。在一些实施方案中，目标多核苷酸序列源自外源的非基因组序列，包括来自包括质粒、BAC、线性序列验证的基因块、表达盒的来源的双链或单链RNA或DNA。

在一些实施方案中，我们提供特异于通过纳米孔装置的分数丰度(例如拷贝数变异)检测的富集。在一些实施方案中，我们使用定点片段化方法来制备用于纳米孔检测的样品。在一些实施方案中，本文提供的检测方法包括核酸样品的多核苷酸片段化的上游片段化，例如，长度为20-100,000nt或碱基对大小的gDNA。在一些实施方案中，核酸是片段化序列-特别地使用限制性酶或通过使用包括Cas9/sgRNA、TALENS、锌指蛋白/核酸酶的定点核酸酶或本领域已知的另一种片段化方法。

在一些实施方案中，使用阳性和阴性尺寸选择进行目标或参照分析物富集以保留、丢弃和洗脱目标片段大小。例如，低比例的SPRI珠：DNA(0.6)在PEG存在下保留并丢弃高分子量多核苷酸各类(例如>8,000bp DNA)，然后是SPRI珠子：DNA(1.5：1)结合、洗涤和洗脱片段大小(例如2000-8000bp)。在一些实施方案中，目标或参照核酸可经历核酸扩增以促进纳米孔中的检测。

纳米孔检测

分数丰度框架涉及：1)对于目标分析物和参照类型设计和应用生物化学方法以将样品材料转化为纳米孔感测形式；2)应用特定的纳米孔实验方案；和3)应用数学方法以生成对于目标-参照(目标：参照)分析物的分数量的定量估计值。本节重点在于部分2，实验方案。

本文描述了样品在纳米孔中运行的重复以提供混合未知样品中目标分析物的真实相对丰度的改进估计值。在一些实施方案中，制备目标分析物和参照分析物以确保使用纳米孔传感器在各个种类之间可靠的区分。在一些实施方案中，选择包含目标序列(即“目标片段”)的片段的特征和包含参照序列(即“参照片段”)的片段的特征，使得这两个片段产生可以通过一个或多个信号性质区分的纳米孔事件特征。

在一些实施方案中，使用一种或多种对照混合物(即对照样品)来校准未知混合物中目标与参照的分数量的估计值。在一些实施方案中，该校准补偿目标和参照分子类型之间纳米孔捕获效率的差异。

在一些实施方案中，在纳米孔上测量目标和参照分析物的未知混合物，并且在数学上量化目标与参照的分数丰度。在一些实施方案中，在相同纳米孔上顺序测量源自相同样品的目标和参照分子类型的一个以上未知混合物。在一些实施方案中，在不同纳米孔上平行测量源自相同样品的目标和参照分子类型的一个以上未知混合物。

在一些实施方案中，在未知混合物之前和/或之后，在纳米孔上测量一种或多种对照(包括单独的100％靶、单独的100％参照以及目标和参照分子的已知混合物)。

在一些实施方案中，实验方案包括在纳米孔上运行未知混合物之前或之后，或者在此之前和之后，在纳米孔上顺序运行一个或多个对照。对照可以由100％目标分析物或100％参照分析物制成，且这些被称为“分离的对照”。对照也可以是目标和参照分析物的任何已知的混合物，称为“混合物对照”或“对照混合物”。对照混合物可以是1：1比率的目标：参照分析物，或0.01：1到100：1的任何其他比率的目标：参照分析物，或任何小于0.01：1(例如，0.001：1)的比率或任何大于100：1(例如，1000：1)的比率的目标：参照分析物。一个或多个对照可以运行超过一次。对照(分离的和混合物)和未知混合物可以在相同的纳米孔上以任何顺序依次运行。在对照和未知样品之间，冲洗纳米孔捕获分子的流体通道(即腔室)。

在一些实施方案中，不运行对照，而仅运行未知混合物，并与通过在单独的先前实验(即，对照不在使用点运行)中运行对照建立的参照表进行比较。

在一些实施方案中，一个或多个流体隔离通道和纳米孔传感器与测量未知物的一个或多个流体隔离通道和纳米孔传感器平行地测量对照。超过一个纳米孔可以达到每个流体通道。在平行实施方式中，可能不需要冲洗，因为每个孔仅看到一个试剂组，即对照(分离的或混合的)或未知的(来自1个或多个未知物的组)。

在一些实施方案中，在对照混合物浓度中对照分析物与对照分析物的比率接近未知样品中参照分析物与目标分析物的预期比率，尽管这可能不是事前知道的。

可以在相同的纳米孔上顺序地运行多种未知混合物，在添加每个新的未知物用于测量之前冲洗掉先前的未知物。这要求未知混合物由相同的目标和参照分析物类型组成，尽管它们的比例在不同的未知物中可能相同或不同的。

每个记录时间段应该足够长以检测每种试剂类型的至少100个事件，并且随着记录更多事件而性能改善，其中当记录超过500个事件时改善是显著的，并且当记录超过1000个事件时非常显著。每个试剂组的记录时间段可以相同或不同。适应性方案可以当检测到目标分子数时动态地停止记录。我们之前已经建立了用于确定达到所需置信水平(例如，95％，98％，99％，99.9％等)所需的分子数量的方法，其可应用于所提出的工作流程中的任何试剂组(对照或未知)(SI Section 10.2，Morin，Trevor J，Tyler Shropshire，Xu Liu，Kyle Briggs，Cindy Huynh，Vincent Tabard-Cossa，Hongyun Wang和William B Dunbar。“Nanopore-Based Target Sequence Detection”.编辑Meni Wanunu.PloS One 11，no.5(2016年5月5日)：e0154426-21.Doi:10.1371/journal.pone.0154426)。

在一些实施方案中，具有单个纳米孔的实验方案是运行1)100％目标记录时间段T，2)冲洗纳米孔室，3)100％参照记录时间段T，4)冲洗纳米孔室，5)50:50目标：参照混合物记录时间段T，6)冲洗纳米孔室，7)未知混合物记录时间段T。记录时间段T可以是15秒，30秒，45秒，1分钟，5分钟，10分钟，或在1-15秒之间或10-60分钟之间的任何持续时间。

另一种常见的实验方案是运行(1)-(7)，然后是8)冲洗纳米孔腔室，9)重复100％目标记录时间段T，10)冲洗纳米孔腔室，11)重复100％参照记录时间段T，12)冲洗纳米孔室，13)重复50:50目标：参照混合物记录时间段T。

另一种常见的实验方案是运行(1)-(7)，然后是8)冲洗纳米孔腔室，9)重复50:50目标：参照混合物记录时间段T，10)冲洗纳米孔腔室，11)重复100％参照记录时间段T，12)冲洗纳米孔室，13)重复100％目标记录时间段T。

再另一个常见的实验方案是运行1)怀疑大约接近未知混合物中的目标：参照比率的目标：参照对照混合物比率，记录时间段T，2)冲洗纳米孔室，3)未知混合物，记录时间段T。

再另一个常见的实验方案是运行1)1：1目标：参照对照混合物比率，记录时间段T，2)冲洗纳米孔室，3)未知混合物，记录时间段T。

在一些实施方案中，具有单个纳米孔的实验方案是运行1)100％目标，记录时间段T，2)冲洗纳米孔腔室，3)100％参照，记录时间段T，4)冲洗纳米孔腔室，5)未知混合物，记录时间段T。

在一些实施方案中，具有单个纳米孔的实验方案是运行1)100％目标，记录时间段T，3)冲洗纳米孔室，4)未知混合物，记录时间段T。

在一些实施方案中，具有单个纳米孔的实验方案是运行1)100％参照，记录时间段T，2)冲洗纳米孔室，3)未知混合物，记录时间段T。

在一些实施方案中，具有单个纳米孔的实验方案是仅运行未知混合物记录时间段T，并使用来自查找表或先前数据的数据，其包含从100％参照对照样品、100％目标对照样品、已知目标：参照对照混合物或其任何组合得到的误差校正信息，各自在与未知混合物的实验方案基本相似的条件下运行，以对由记录时间段T产生的数据提供至少一个校正项而改进未知混合物中目标分析物的分数丰度的估计值。

在完成实验方案后，对来自对照(如果运行)的记录事件和来自未知物的记录事件进行数学分析以预测一个或多个未知物中目标与参照的分数量。

分数丰度估计和阈值确定

分数丰度框架涉及：1)对于目标分析物和参照类型设计和应用生物化学方法以将样品材料转化为纳米孔感应形式；2)应用特定的纳米孔实验方案；和3)应用数学方法生成对目标-参照(目标：参照)分析物的分数量的定量估计。本节重点在于框架的部分3。

在一些情况下，定量目标序列“t”与参照序列“r”的估计浓度比率R＝[t]/[r]。转基因百分比或GMO％是转换为百分比的比率R。在一些情况下，定量目标序列与总(目标加参照序列)的估计分数量F＝[t]/([t]+[r])。存在着比率R和分数F之间的简单转换，即F＝R/(R+1)或等同地，R＝F/(1-F)。

分数丰度方法预测目标与参照或目标与总量(目标和参照的总和)的相对量。在一些实施方案中，可以添加校准分子以确定目标或参照分子的绝对浓度。在一些实施方案中，在目标分析物和参照分析物类型之间比较单个纳米孔事件的特性以计算分数丰度。在一些实施方案中，在目标分析物和参照分析物类型之间比较多于一个纳米孔事件的特性以计算分数丰度。

我们在此描述了三种方法来改进阈值确定以区分与目标分析物和参照分析物相关的事件特征，并校正来自纳米孔的事件特征的使用的误差以确定分数丰度：1)Q-检验方法，2)支持向量机(SVM)，以及3)高斯混合的期望最大化算法(EMGM)方法。

以下一般概念应用于这些方法。首先，目标分析物“t”与参照分析物“r”的真实比率表示为R＝[t]/[r]。目标分析物与总(目标加参照)分析物的真实分数表示为F＝[t]/([t]+[r])。比率R和分数F之间的简单转换是F＝R/(R+1)或等同地，R＝F/(1-F)。未知混合物的真实比率表示为R_mix，且混合物的真实分数表示为F_mix。数学方法生成F_mix和R_mix的估计值，其表示为和设计和建立目标分子和参照分子构建体以提供不同的纳米孔事件特征。

Q-检验方法

数学方法首先设计用于将所有记录的事件分箱成一个或两个类别的标准，即，目标阳性(等同地，参照阴性)或目标阴性(等同地，参照阳性)。事件标准使用一个或多个事件的特性。在一些实施例中，单个特性用于创建用于分箱事件的标准。根据该标准，每个事件被标记为目标事件或参照事件。这些被称为“目标标记的”或“参照标记的”。

目标标记事件的分数表示为Q，等于目标标记事件的数量除以事件总数。参照标记事件的分数是1-Q。标记的分数Q是纳米孔上浓度分数F的函数，写为Q(F)。

混合物中目标标记事件的分数Q(F_mix)表示为Q_mix；100％目标对照中的目标标记事件的分数Q(1)表示为Q_targ；100％参照对照中的目标标记事件的分数Q(0)表示为Q_ref；目标：参照对照混合物中目标标记事件的分数表示为Q_X:Y，其中X:Y是对照混合物中目标-参照的混合物的比率。对于分数z＝X/(X+Y)，我们得到Q(z)＝Q_X:Y。在一些实施方案中，优选1：1比率对照混合物，其中z＝0.5，并且标记的分数写为Q_1:1或Q_50:50。

通常，Q_targ接近1，其中1-Q_targ表示假阴性分数。通常，Q_ref接近0，其中Q_ref表示假阳性分数。对照满足Q_targ>Q_X:_Y>Q_ref。混合物满足Q_targ>Q_mix>Q_ref。

在一些实施方案中，来自对照的目标标记分数(Q_targ，Q_ref，Q_X:Y)单独运行，并且查找表用于参考测量Q_mix的任何新测定的值。在一些实施方案中，(Q_targ，Q_ref，Q_X:Y)在使用点作为测定的部分建立。在一些实施方案中，(Q_targ，Q_ref)单独运行并且查找表用于参考它们的值，而(Q_X:Y)值在使用点建立作为测量Q_mix的测定的部分。

在一些实施方案中，来自对照的目标标记分数(Q_targ，Q_ref，Q_X:Y)在使用点运行超过一次，并且它们的值被平均用于下面的公式中的后续使用。

用于真实分数量F_mix的估计值的公式通过下式给出：

其中且

用于真实比率R_mix的估计的公式通过下式给出：

在用于预测转基因(GMO)的分数量的实例中，GMO(％)等于

参数ρ是可以补偿假阳性检测误差、假阴性检测误差或两者的比率的估计值。在一些实施例中，Q_ref的值可用于补偿假阳性误差。如果不使用假阳性误差的补偿，则可以将Q_ref设置为0。在一些实施方案中，Q_targ的值可以用于补偿假阴性误差。如果不使用假阴性误差补偿，则Q_targ可以设置为0。

参数α是比率补偿乘数。分析上，参数α是两个捕获率常数的比率。捕获率常数是纳米孔事件速率除以给定分子类型的浓度。具体地，参数α是参照分子捕获率常数除以目标分析物捕获率常数。因此，乘数α补偿目标和参照分子类型之间纳米孔捕获和检测的差异。

当对照混合物为1：1比率时，

当不使用目标分析物和参照分析物之间的捕获率常数差异的补偿时，在等式(1)和(2)中将α设置为等于1，以分别提供对和的估计值。

应用等式(1)和(2)分别提供对和的估计值。还可以计算和的不确定性估计值或误差条。对于分离的和混合物对照以及对于未知混合物的每个Q具有与其相关的标准误差，其中N是事件的总数。在数值上，可以多次绘制来自每个Q分布的随机样品，以通过应用等式(1)和(2)来生成和的值的分布。然后可以使用和的分布来计算不确定性边界，从而得到和

在一些实施方案中，匹配或超过事件特性标准的事件的比率或分数用于估计未知混合物中目标与参照的分数量。在一些实施方案中，标准是阈值。

我们之前的工作描述了如何使用单一标记标准来计算Q及其误差棒(Morin，Trevor J，Tyler Shropshire，Xu Liu，Kyle Briggs，Cindy Huynh，Vincent Tabard-Cossa，Hongyun Wang和William B Dunbar.“Nanopore-Based Target SequenceDetection.”Meni Wanunu编辑.PloS One 11，no.5(2016年5月5日)：e0154426-21.doi:10.1371/journal.pone.0154426)。如该工作中详述的，通过应用该标准，每个事件j具有分配给它的变量Z_j。如果事件j被标记，则Z_j＝1；否则，Z_j＝0。对于每个试剂组(对照和未知物)，Q＝(∑_jZ_j)/N，其中N是事件总数。将相同的标准应用于所有对照、分离和混合物以及所有未知物，以计算在上面的公式中使用的所有Q值(等式(1)-(2))。

该标准涉及一个或多于一个不等式方程，并且可以是一个或多个事件的特性的线性或非线性函数。每个不等式方程具有与之相关的阈值或阈值范围。因此，标准由不等式集和相应的阈值集完全指定。

在一些实施方案中，针对一类目标和参照分子类型建立标准，并且使用该类别的分子类型的新测定将利用已经建立的标准。

在一些实施方案中，从针对任何新测定收集的对照数据鉴定标准。也就是说，该标准在运行时作为分数丰度实验方案的部分建立。

在一些实施方案中，使用相当的目标和参照分子类型从先前实验的集合中先验地建立用于标准的不等式集，而使用对照数据在运行时建立一个或多个标准不等式的阈值集。

在一些实施方案中，单一的事件的特性用于建立标准。

标记为“q”的阈值是基于不等式将目标标记事件与非目标标记(即，参照标记)事件分开的标量值。当在标准中使用多于一个不等式时，q可以表示用于该不等式集的阈值的向量。

考虑对于目标和参照使用两个不同长度的dsDNA的示例。通常，使用事件面积的单个不等式是可行的标准。当目标是比参照dsDNA长的dsDNA时，如果面积超过阈值，则事件被标记。当目标是比参照dsDNA短的dsDNA时，如果面积小于阈值，则事件被标记。

可以利用不同的方法来自动选择一个或多个q-阈值，其中一个q值用标准中的各个不等式鉴定。

在一些实施方案中，q-阈值被发现为产生Q_ref的期望假阳性的值。例如，q-阈值可以设置为Q_ref的95百分位以产生5％的假阳性。在这种情况下，95％的参照分子事件具有小于q的面积。或者，SFT q-阈值发现为产生Q_targ的期望假阴性的值，即，q-阈值可以设置在Q_targ的第5百分位以产生5％的假阴性。

在一些实施方案中，发现SFT q-阈值为min_q{Q_targ(q)-Q_ref(q)}的解。该阈值将是对应于Q_targ和Q_ref之间的最大距离的值。

在一些实施方案中，q-阈值范围被计算为产生Q_ref的期望假阳性范围的值。例如，q-阈值范围可以跨Q_ref的95百分位数到99百分位数。

在其中利用q阈值范围的一些实施方案中，等式(1)和(2)产生和值的范围，并且计算这些范围的平均值和报告为预测的和值。

考虑使用与目标DNA和参照DNA结合的两种不同有效负载的实例。通常，使用事件的平均电导和事件持续时间的三个不等式是可行的标准。具体而言，对于特定的有效负载-目标DNA分子构建体，目标事件在平均δG对持续时间的2D事件图上创建独特子空间，并且当持续时间大于阈值时，和当平均δG高于一个阈值且低于另一个阈值时事件被标记。在这种情况下，标记标准使用两个事件的特性(平均δG，持续时间)由三个线性不等式和三个阈值表示。

SVM方法

在一些实施方案中，机器学习用于鉴定用于将每个事件标记为目标分析物事件或参照分析物事件的特性集和特性标准。在一些实施方案中，支持向量机用于将事件分类为目标或参照分析物。

在一些实施方案中，开发支持向量机工作流程具有以下步骤：1)加载纳米孔数据，2)选择纳米孔事件的特性以区分事件，3)使用对照进行模型训练和测试，4)使用对照进行数据校准，5)预测未知目标:参照混合物。在一些实施方案中，实施已经开发和减化的支持向量机工作流程以用于自动分数丰度预测。

在一些实施方案中，应用机器学习工具来使标准选择自动化，包括事件的特性、不等式的形式(线性和/或非线性)和不等式中使用的阈值q的选择。在一些实施方案中，实施支持向量机(SVM)，即解决分类问题的监督机器学习方法，以生成标记标准。关于SVM的参照文献包括：Cortes，C.&Vapnik，V.Machine Learning(1995)20：273和Boser，B.E.，Guyon，I.M.和Vapnik，V.N.(1992)“A training algorithm for optimal margin classifiers,”Proceedings of the fifth annual workshop on Computational learning theory，其各自通过引用整体并入。

下面提供了SVM方法应用于我们的分数丰度框架的示例：

对于可线性分离的数据，使{x₁，...，x_n}为数据集和使y_i∈{1，-1}为x_i的类标签，决策边界应按以下方式对所有点进行分类：

为了最大化对所有点进行分类的边际，分类问题成为以下优化问题：

最小化

从属于

接近于决策边界的数据点称为支持向量。

对于真实世界(real-word)的问题，由于某些异常值或噪声，数据通常不能线性分离。为了优化分类，调整边际以允许一些错误分类的点。与此同时，错误分类的情况受到高代价的惩罚。这一边际变为软边际。通过在成本函数中添加“松弛”变量，可以使用软边际分类(图3A)：

最小化

从属于：y_i(w^Tx_i+b)≥1-ε_i,ε_i≥0

处理不可线性分离数据的第二种方式是核方法(Boser，B.E.等人，上面引用)。它将输入特征空间转换为更高维度的空间。通过这样做，数据可以是可线性分离的(图3B)。将映射函数表示为则核函数K可写为：

存在可用的内核函数类型集。这里列出了最常见的类型：

线性内核

K(x_i,x_j)＝x_i ^Tx_j+c

多项式内核

K(x_i,x_j)＝(αx_i ^Tx_j+c)^d

高斯(RBF)内核

K(x_i,x_j)＝exp(-γ||x_i-x_j||)

通常，核技巧和软边际一起用于产生分类问题的更好解决方案。

将SVM应用于纳米孔数据以获得分数丰度具有以下步骤：1)加载对照和未知数据集，包括每个集的所有事件；2)特性选择；3)模型训练和测试；4)数据校准；5)预测和在所提供的实例中，更详细地说明了这5个步骤的应用。等式(3)和(4)，包括内核类型、软边际常数和核函数可能依赖的任何参数的超参数网格搜索，作为应用该方法的部分被解决。基于从SVM生成的广义模型(包括共同决策边界和共同校准比率)的测定可以应用于未知混合物而不需要对照数据集。

基于从SVM生成的广义模型(包括共同决策边界和共同校准比率)的测定可以应用于未知混合物而不需要对照数据集。其他数据挖掘方法，包括决策树、神经网络、NativeBayer、逻辑回归、K-最近邻和增强，也被称为纳米孔数据的适用方法。

EMGM方法(高斯混合的期望最大化算法)

在一些实施方案中，应用聚类方法以创建用于标记目标事件和参照事件的标准。每个事件标记为目标事件或参照事件。在一些实施方案中，分数丰度是目标事件相对于目标和参照事件的总和的比例。运行提供补偿信息的对照允许进行调整以改进分数丰度的估计值。

在一些实施方案中，聚类方法是应用于一个或多个事件参数的分布的参数化模型的最大似然方法。最大似然估计对对照集的迭代应用导致拟合的模型参数，其中一个分布集与目标分析物类型相关和另一个分布集与参照分析物类型相关。随后，将参数化模型应用于未知混合物导致将事件分配给目标煌参照分布，以及分配给目标分布的事件与分配给目标加参照分布的事件总数的比率用于生成分数量估计。

对数似然函数用作算法迭代中跟踪进度的度量，其递归地更新对照数据中每个事件的成员身份分配，并改善分布对数据的拟合。在一些实施方案中，使用参数化高斯分布的混合来对数据建模。使用有限混合模型(包括高斯混合模型)来表征数值数据的方法在统计学和应用数学中得到了很好的表征(Hand，David J.，Heikki Mannila和Padhraic Smyth，Principles of data mining.MIT press，2001)。

在一些实施方案中，给定高斯混合(GM)模型，该方法相对于包括分量的均值和协方差以及混合系数的参数使似然函数最大化。由于对于对数似然没有封闭形式的解决方案，因此使用期望最大化(EM)技术(C.M.Bishop，Pattern Recognition and MachineLearning，Springer，2006)迭代地计算用于将数据分配给模式的模式参数和权重。

为了产生分数丰度估计值的目的，将EM算法应用于GM模型的应用于纳米孔数据的方法被称为EMGM。与Q检验方法类似，EMGM方法使用关于一个或多个纳米孔事件特征的先验知识，其可用于将目标事件与参照事件区分开。

如上所述，目标群体可以由单一分布或多于一个分布表示。同样，参照群体可以由单一分布或多于一个分布表示。通过将算法应用于一个或多个分离的对照和一个或多个对照混合物来建立目标和参照分布。

随后，在建立目标分布之后，如果未知混合物中的事件与建模的目标分布相关，则将该事件标记为目标事件。

举例来说，总共三个高斯分布可以拟合1：1对照混合物中的整个数据集，其中一个模式与目标类型相关和两个模式与参照类型相关。

对于EMGM的应用该算法仅需要一个对照混合物。随后，所得模型可应用于未知混合物。在一些实施方案中，使用另外的分离的参照对照来抵消假阳性的影响。具体而言，将EMGM模型应用于100％参照对照建立了假阳性分数，其从通过将EMGM模型应用于未知混合物而产生的预测分数中减去。这一减去可以称为假阳性补偿(或“FP”补偿)。

纳米孔装置

所提供的纳米孔装置包括在将其内部空间分为两个容积的结构中形成开口的至少一个孔，以及至少一个配置为识别通过孔的物体(例如通过检测指示物体的参数的变化)的传感器。用于本文所描述的方法的纳米孔装置也在WO/2013/012881号PCT公开中公开，其通过引用整体并入。

纳米孔装置中的孔是纳米级或微米级的。在一个方面，每个细孔的大小允许小或大分子或者微生物通过。在一个方面，每个孔直径至少约1纳米。可选地，每个细孔直径至少约2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、11nm、12nm、13nm、14nm、15nm、16nm、17nm、18nm、19nm、20nm、25nm、30nm、35nm、40nm、45nm、50nm、60nm、70nm、80nm、90nm或100nm。

在一个方面，孔直径不超过约100nm。可选地，细孔直径不超过约95nm、90nm、85nm、80nm、75nm、70nm、65nm、60nm、55nm、50nm、45nm、40nm、35nm、30nm、25nm、20nm、15nm或10nm。

在一个方面，孔的直径在约1nm至约100nm之间，或者在约2nm至约80nm之间，或约3nm至约70nm之间，或约4nm至约60nm之间，或约5nm至约50nm之间，或约10nm至约40nm之间，或约15nm至约30nm之间。

在一些方面，纳米孔装置进一步包括用于将聚合物骨架移动跨过孔的手段和/或用来识别通过孔的物体的手段。进一步的细节在下面提供，以双孔装置为背景描述。

与单孔纳米孔装置相比，双孔装置可以更容易配置从而提供聚合物骨架跨孔运动的速度和方向的良好控制。

在一个实施方案中，纳米孔装置包括多个腔室，各腔室通过至少一个孔与相邻的腔室连通。在这些孔中，两个孔，即第一孔和第二孔，被布置为使得允许至少一部分靶多核苷酸移出第一孔并进入第二孔。此外，所述装置在每个孔处包括能够在运动过程中识别靶多核苷酸的传感器。在一个方面，该识别需要确定靶多核苷酸的单个成分。在另一个方面，该识别需要确定与靶多核苷酸结合的有效负载分子。当采用单一传感器时，该单一传感器可包含两个放置在孔两端的用于测量跨孔的离子电流的电极。在另一个实施方案中，单一传感器包含电极以外的部件。

在一个方面，所述装置包括通过两个孔连接的三个腔室。具有三个以上腔室的装置可以很容易地设计以在三腔室装置任一侧或在三个腔室中任何两个腔室之间包括一个或多个额外的腔室。同样地，装置中可以包括连接腔室的超过两个孔。

在一个方面，两个相邻腔室之间可以有两个或更多个孔，以允许多个聚合物骨架同时从一个腔室移动到下一个腔室。这样的多孔设计可以提高装置中靶多核苷酸分析的通量。对于多路复用，一个腔室可以具有一种类型的靶多核苷酸，且另一个腔室可以具有另一种靶多核苷酸类型。

在一些方面，所述装置进一步包括用于将靶多核苷酸从一个腔室移动到另一个腔室的手段。在一个方面，该移动导致同时跨第一孔和第二孔两者加载靶多核苷酸(例如，包含靶序列的扩增产物或扩增子)。在另一个方面，所述手段进一步使靶多核苷酸能够在相同方向上通过两个孔移动。

例如，在三腔室两孔装置(“两孔”装置)中，每个腔室可以包含用于连接到电源的电极，从而可以在腔室之间跨各个孔施加单独的电压。

根据本发明的一个实施方案，提供了包括上腔室、中腔室和下腔室的装置，其中上腔室通过第一孔与中腔室连通，且中腔室通过第二孔与下腔室连通。这种装置可以具有此前在名称为双重孔装置(Dual-Pore Device)的美国公开No.2013-0233709中公开的任何尺寸或其他特征，该文献在此通过引用整体并入本文。

在一个方面，每个孔的直径为至少约1nm。或者，每个孔的直径为至少约2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、11nm、12nm、13nm、14nm、15nm、16nm、17nm、18nm、19nm、20nm、25nm、30nm、35nm、40nm、45nm、50nm、60nm、70nm、80nm、90nm或者100nm。

在一个方面，每个孔的直径不超过约100nm。或者，孔的直径不超过约95nm、90nm、85nm、80nm、75nm、70nm、65nm、60nm、55nm、50nm、45nm、40nm、35nm、30nm、25nm、20nm、15nm或10nm。

在一个方面，孔的直径在约1nm至约100nm之间，或者约2nm至约80nm之间，或约3nm至约70nm之间，或约4nm至约60nm之间，或约5nm至约50nm之间，或约10nm至约40nm之间，或约15nm至约30nm之间。

在一些方面，孔基本上呈圆形。本文所用的“基本上圆形”是指至少约80或90％为圆柱体形式的形状。在一些实施方案中，孔形状为方形、矩形、三角形、椭圆形或六角形。

在一个方面，孔的深度介于约1nm至约10,000nm之间，或者在约2nm至约9,000nm之间，或在约3nm至约8,000nm之间，等。

在一些方面，纳米孔穿过膜延伸。例如，孔可以是插入脂质双层膜中的蛋白质通道，或者其也可以通过钻孔、刻蚀或以其他方式通过固态基质(如，二氧化硅、氮化硅、石墨烯或由这些或其他材料的组合形成的层)形成孔来工程化。纳米孔的大小设计为允许骨架：融合体：有效负载，或该分子在酶活性之后的产物通过孔。在其它实施方案中，孔的临时阻塞对于鉴别分子类型可能是有利的。

在一些方面，纳米孔的长度或深度足够大，从而形成连接两个在其它方面分隔的容积的通道。在一些此类方面，每个孔的深度大于100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm或900nm。在一些方面，每个孔的深度不超过2000nm或1000nm。

在一个方面，孔以约10nm至约1000nm之间的距离分隔开。在一些方面，孔之间的距离大于1000nm、2000nm、3000nm、4000nm、5000nm、6000nm、7000nm、8000nm或9000nm。在一些方面，孔间隔不超过30000nm、20000nm或10000nm。在一个方面，距离为至少约10nm，或者至少约20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、150nm、200nm、250nm或300nm。另一方面，该距离不超过约1000nm、900nm、800nm、700nm、600nm、500nm、400nm、300nm、250nm、200nm、150nm或100nm。

而在另一方面，孔之间的距离为约20nm至约800nm之间，约30nm至约700nm之间，约40nm至约500nm之间，或约50nm至约300nm之间。

两个孔可以以任何位置排列，只要它们允许腔室之间的流体连通并具有规定的大小和间距。在一个方面，孔布置为使得它们之间没有直接阻碍。仍然在一个方面，孔基本上是同轴的。

在一个方面，该装置在腔室中具有连接到一个或多个电源的电极。在一些方面，电源包含电压钳或膜片钳，其可以提供跨各孔的电压并独立地测量通过各孔的电流。在这个方面，电源和电极配置可以将中腔室设置成两个电源的共同地线。在一个方面，一个或多个电源配置为在上腔室(腔室A)和中腔室(腔室B)之间施加第一电压V₁，和在中腔室和下腔室(腔室C)之间施加第二电压V₂。

在一些方面，第一电压V₁和第二电压V₂是独立可调的。在一个方面，中腔室被调节为相对于两个电压的地电压。在一个方面，中腔室包含用于在各个孔和中腔室中的电极之间提供电导的介质。在一个方面，中腔室包含用于在各个孔和中腔室中的电极之间提供电阻的介质。保持相对于纳米孔电阻足够小的这种电阻有利于对跨孔的两个电压和电流解耦，这有助于电压的独立调节。

电压的调节可用于控制腔室内带电颗粒的运动。例如，当两个电压设置为极性相同时，适当带电的颗粒可以从上腔室顺序地移动到中腔室和到下腔室，或者反过来。在一些方面，当两个电压被设置成相反极性时，带电颗粒可以从上腔室或下腔室移动到中腔室并停留在那里。

装置中电压的调节可以特别地用于大分子如带电聚合物骨架的运动的控制，该大分子足够长以同时跨两个孔。在这个方面，分子移动的方向和速度可以通过电压的相对幅度和极性来控制，如下所述。

所述装置可以包含适合容纳液体样品(特别是生物样品)的材料和/或适合于纳米加工的材料。在一个方面，此类材料包括介电材料，例如但不限于硅、氮化硅、二氧化硅、石墨烯、碳纳米管、TiO₂、HfO₂、Al₂O₃或其它金属层，或这些材料的任何组合。在一些方面，例如，约0.3纳米厚的单片石墨烯膜可用作孔承载膜。

作为微流体装置且容纳双孔微流体芯片设施的装置可以通过多种手段和方法来制造。对于由两个平行的膜构成的微流体芯片，两个膜可以同时通过单波束钻孔以形成两个同心孔，尽管与任何适合的校准技术协同在膜的两侧使用不同的波束也是可能的。概括地说，外壳确保腔室A-C的密封分离。

在一个方面，所述装置包含微流体芯片(标记为“双孔芯片”)，其由通过间隔体连接的两个平行的膜构成。每个膜包含通过膜中心用单波束钻孔形成的孔。进一步，所述装置优选具有用于芯片的外壳或聚碳酸酯外壳。外壳确保腔室A-C的密封分离，并为电极提供最小接入电阻以确保每个电压主要跨各孔施加。

更具体地，孔承载膜可以用具有5-100纳米厚的硅、氮化硅或二氧化硅窗口的透射电子显微(TEM)格栅制造。间隔体可采用绝缘体(如SU-8、光刻胶、PECVD氧化物、ALD氧化物、ALD氧化铝)或蒸镀的金属材料(如银、金或铂)，且占据在膜之间的腔室B的其它为水性的部分中的小空间而用于分隔膜。支持器置于由腔室B的最大体积部分构成的水性浴中。腔室A和C可以通过较大直径的通道(对于低接入电阻)达到，这导致膜密封。

聚焦的电子或离子束可以用来通过膜钻孔，从而使其自然对准。孔也可以通过对每层施加适当束聚焦来雕刻(收缩)达到较小尺寸。任何单一纳米孔钻孔方法也可以用来在两个膜中钻出孔对，考虑对于给定方法可能的钻孔深度和膜的厚度。预钻出微孔到规定的深度和然后通过膜的剩余部分钻出纳米孔对于进一步优化膜的厚度也是可能的。

通过在装置的孔处存在的电压，带电分子可以通过腔室之间的孔移动。移动的速度和方向可以通过电压的大小和极性控制。此外，由于两个电压可以各自独立地调节，所以带电分子的运动方向和速度可以在各腔室中精细地控制。

一个实例涉及靶多核苷酸，其长度大于包括两个孔的深度加两个孔之间的距离的综合距离。例如1000bp的dsDNA长度约为340纳米，且显著大于间隔20纳米的两个10纳米深孔跨越的40纳米距离。第一步中，将多核苷酸加载到上腔室或下腔室中。由于其在pH约7.4的生理条件下带负电荷，多核苷酸可以跨被施加电压的孔移动。因此，第二步中，相同极性且大小相同或相近的两个电压施加于孔以顺序地跨两个孔移动多核苷酸。

大致在多核苷酸到达第二孔的时候，可以改变一个或两个电压。由于两个孔之间的距离选择为比多核苷酸的长度短，当多核苷酸到达第二孔时，它也在第一孔中。因此，在第一孔处的电压极性的迅速改变将产生将多核苷酸拉离第二孔的力。

假设所述两个孔具有相同的电压-力影响，且|V₁|＝|V₂|+δV，则值δV＞0(或＜0)可以进行调节以在V₁(或V₂)方向上获得可调的运动。在实践中，虽然各个孔处电压诱导的力不会由于V₁＝V₂而相同，校准实验可以确定对于给定的双孔芯片产生相等的拉力的适当偏置电压；且围绕该偏置电压的变化然后可以用于定向控制。

如果，在此时，第一孔处电压诱导力的大小小于第二孔处电压诱导力的大小，则多核苷酸会继续穿越两个孔移向第二孔，但速度较低。在这个方面，很容易理解，多核苷酸运动的速度和方向可以通过两个电压的极性和大小来控制。正如下面将进一步描述的，运动的这种精细控制有着广泛的应用。为了定量靶多核苷酸，双孔装置实施方式的效用是，在受控的递送和探测期间，可以重复地测量靶多核苷酸或有效负载结合的靶多核苷酸以增加检测结果的置信度。

因此，在一个方面，提供了用于控制带电聚合物骨架通过纳米孔装置的运动的方法。所述方法包括(a)将包含靶多核苷酸(例如，靶多核苷酸扩增子)的样品加载到上述任一实施方式的装置的上腔室、中腔室或下腔室之一中，其中该装置被连接到用于在上腔室与中腔室之间提供第一电压和在中腔室与下腔室之间提供第二电压的一个或多个电源；(b)设置初始第一电压和初始第二电压以使靶多核苷酸在腔室之间移动，从而使聚合物骨架跨第一和第二孔两者定位；且(c)调节第一电压和第二电压以使两个电压都产生将带电靶多核苷酸拉离中腔室的力(电压竞争模式)，其中两个电压在受控条件下大小不同，以使得靶多核苷酸骨架沿任一方向且以受控的方式跨两个孔移动。

在一个方面，将含靶多核苷酸的样品加载到上腔室中，且将初始第一电压设置为将靶多核苷酸从上腔室拉到中腔室，且将初始第二电压设置为将靶多核苷酸从中腔室拉到下腔室。同样地，样品可以被初始加载到下腔室中，且靶多核苷酸可以被拉到中腔室和上腔室。

在另一方面，将含有靶多核苷酸的样品加载到中腔室中；将初始第一电压设置成将带电聚合物骨架从中腔室拉到上腔室；且将初始第二电压设置成将靶多核苷酸从中腔室拉到下腔室。

在一个方面，在步骤(c)中第一电压和第二电压的实时或在线调节是采用专用的硬件和软件以高达数百兆赫的时钟频率通过主动控制或反馈控制进行的。第一电压或第二电压或两者的自动控制是基于第一或第二或两个离子电流测量值的反馈。

传感器

如上所述，在各个方面，纳米孔装置还包括一个或多个传感器用于完成靶多核苷酸的检测。

所述装置中使用的传感器可以是任何适合用于识别与有效负载分子结合或未结合的靶多核苷酸扩增子的传感器。例如，传感器可以配置为通过测量与聚合物相关的电流、电压、pH值、光学特征或停留时间来识别靶多核苷酸。在其他方面，传感器可以被配置为识别靶多核苷酸的一个或多个单个组分或者与靶多核苷酸结合或连接的一种或多种组分。传感器可以由配置为检测可测量参数的变化的任何组件形成，其中此变化指示靶多核苷酸、靶多核苷酸的组分或优选与靶多核苷酸结合或连接的组分。在一个方面，传感器包括放置在孔两侧的一对电极以测量分子或其他实体(特别是靶多核苷酸)移动通过孔时的跨孔离子电流。在某些方面，在通过孔的靶多核苷酸片段结合于有效负载分子时，跨孔离子电流发生可测量的变化。此类电流变化对应于，例如，存在的靶多核苷酸分子的存在、不存在和/或大小以可预测的、可测量的方式发生改变。

在优选的实施例中，传感器包括施加电压并用于测量跨纳米孔的电流的电极。分子转位通过纳米孔提供了电阻抗(Z)，其根据欧姆定律，V＝IZ，影响通过纳米孔的电流，其中V是施加的电压，I是通过纳米孔的电流，Z是阻抗。相反，监测电导G＝1/Z以示意和定量纳米孔事件。当分子在电场中(例如，在施加的电压下)转位通过纳米孔时的结果是，当进一步分析电流信号时可能与通过纳米孔的分子相关的电流特征。

当使用来自电流特征的停留时间量度时，可以基于通过探测设备所需的时间长度，将组分的大小与特定组分相关联。

在一个实施方案中，在纳米孔装置中提供的传感器测量聚合物、聚合物的组分(或单元)或者结合或连接到聚合物的组分的光学特征。这种测量的一个实例包括通过红外(或紫外)光谱鉴定特定单元特有的吸收带。

在一些实施方案中，传感器是电传感器。在一些实施方案中，传感器检测荧光特征。孔出口处的辐射源可用于检测该特征。

等同和范围

本领域技术人员将认识到或能够使用不超过常规的实验确定根据本文所述的本发明的具体实施方案的许多等同物。本发明的范围不限于以上描述，而是如所附权利要求中所述。

在权利要求中，诸如“一”、“一个”和“该”的冠词可以表示一个或多于一个，除非相反地指出或者从上下文中显而易见。如果组中的一个、多于一个或所有组成员存在于、用于或以其他方式与给定产品或过程相关，则认为包括组中一个或多个成员之间的“或”的权利要求或描述是满足的，除非另有相反说明或从上下文中显而易见。本发明包括其中该组的恰好一个成员存在于给定产品或过程中、在其中使用或以其他方式与给定产品或过程相关的实施方案。本发明包括其中多于一个或所有组成员存在于、用于或与给定产品或过程相关的实施方案。

还应注意，术语“包含”旨在是开放的并且允许但不要求包括额外的元件或步骤。当在本文中使用术语“包含”时，因此也包括和公开了术语“由......组成”。

在给出范围的情况下，包括端点。此外，应理解，除非另外指出或从本领域普通技术人员的上下文和理解中另外显而易见，否则表示为范围的值可以在所述范围内的所述范围内呈现任何特定值或子范围，达到范围下限为的十分之一单位，除非上下文另有明确规定。

所有引用的来源，例如，本文引用的参照文献、出版物、数据库、数据库条目和技术，通过引用并入本申请中，即使未在引文中明确说明。如果引用来源和本申请的陈述相互矛盾，则应以本申请中的陈述为准。

章节和表格标题不旨在是限制性的。

实施例

以下是用于实施本发明的具体实施方案的实例。提供这些实施例仅用于说明目的，并不意图以任何方式限制本发明的范围。已经努力确保关于所使用的数字(例如，量、温度等)的准确性，但是当然应该允许一些实验误差和偏差。

除非另有说明，否则本发明的实践将采用本领域技术范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。这些技术在文献中有充分说明。参见，例如T.E.Creighton，Proteins：Structures and Molecular Properties(W.H.Freeman andCompany，1993)；A.L.Lehninger，Biochemistry(Worth Publishers，Inc.，当前版本)；Sambrook等，Molecular Cloning：A Laboratory Manual(第2版，1989)；Methods InEnzymology(S.Colowick和N.Kaplan编辑，Academic Press，Inc.)；Remington'sPharmaceutical Sciences，18th Edition(Easton，Pennsylvania：Mack PublishingCompany，1990)；Carey and Sundberg Advanced Organic Chemistry第3版。(PlenumPress)Vols A和B(1992)。

实施例1–对于目标和参照使用不同长度dsDNA的基于Q-检验的FA

该实施例提供了将分数丰度(FA)框架应用于其中转基因(GMO)目标序列在788bp目标dsDNA(即，目标分析物)内和参照序列(凝集素管家基因)在466bp的参照dsDNA(即参照分析物)内的数据的结果。下面实现了样品中转基因目标的分数量的定量，首先通过应用具有基于事件面积的单特征标准应用Q-检验方法并且使用等式(1)和(2)，及然后应用SVM方法和使用等式(3)和(4)。

使用序列特异性寡核苷酸引物通过PCR从含有常规和含转基因的基因组DNA样品的混合物产生466bp参照DNA和788bp目标转基因DNA片段。使用标准二氧化硅膜柱纯化和浓缩PCR产物。从大量单独产生的扩增子制备两种扩增子的精确分数混合物，并将等分的分数混合物和单扩增子用作所有测定的标准参照材料。

首先，在纳米孔装置中测量含有466bp参照DNA的参照对照样品。接下来，制备含有788bp转基因DNA的目标对照样品并在纳米孔装置中测量。目标分析物(788bp)和参照分析物(466bp)之间的长度差异在通过纳米孔移位时产生独特的事件特征，其可以基于事件特征的面积来区分。

图4A显示了两个分离的对照运行的所有事件面积直方图，一个用于466bp参照DNA，一个用于788bp目标转基因DNA。还显示了来自3:10目标:参照对照混合物的面积直方图。图4B显示作为面积标准阈值q的函数的对照混合物(Q_targ，Q_ref)和已知混合物(Q_mix)趋势，其中Q_mix＝Q_3:10。图4C示出了分数量参数ρ(q)如何在q值处以图形方式显现。q＝5pA*ms阈值(垂直虚线)对应于0.05的假阳性(即，Q_ref＝0.05)和0.1的假阴性(即，Q_targ＝0.9)。

使用对照混合物在这里应用等式(2)来生成作为预测的GMO(％)，以测试使用仅参照和仅目标对照来生成分数丰度的估计值的方法的准确度和精确度。等式(2)首先应用于已知混合物。由于没有使用对照混合物样品来生成Q_X:Y，因此在不使用目标分析物和参照分析物之间的捕获率常数差异的补偿(即，设定α＝1)的情况下生成估计值以验证模型。图5A示出了预测的GMO(％)vs.真实GMO(％)的曲线图，并且用于比较的零误差线(斜率＝1)之上和之下10％误差容限。这些结果通过在单个纳米孔上连续运行100％目标和100％参照(分离的)对照，然后是五种已知混合物来建立。表1报告了图5A中绘制的预测值和误差棒，以及对于每种混合物检测的事件总数。

表1.对于图5A数据的GMO预测结果

真实GMO％	预测GMO％	百分误差(预测-真实)	总事件
				10％	12.0±1.07％	2.0±1.0％	5,225
15％	16.3±1.1％	1.3±1.1％	4,267
				20％	20.8±1.1％	0.75±1.1％	6,605
25％	29.3±1.2％	4.3±1.2％	6,647
				30％	34.5±1.4％	4.4±1.4％	5,605

按照类似方案(两个分离的对照和六种已知混合物)进行单独的纳米孔实验，并产生图5B和表2中所示的结果。

表2.对于图5B数据的GMO预测结果

真实GMO％	预测GMO％	百分误差(预测-真实)	总事件
				5％	2.87±0.7％	-2.1±0.7％	4,783
10％	11.1±0.93％	1.1±0.9％	4,884
				15％	16±1.1％	1.0±1.1％	4,326
20％	20.4±1.1％	0.35±1.1％	5,895
				25％	27.1±1.2％	2.1±1.2％	6,587
33.33％	36.2±1.3％	2.8±1.3％	7,862

图5A和图5B以及表1和2的结果表明，对于使用单个纳米孔区分两个DNA长度，5％的GMO％预测准确度是可能的。这些结果在不使用目标分析物和参照分析物之间的捕获率常数差异的补偿的情况下(在等式(2)中设定α＝1)实现。预计捕获率常数差异的补偿将进一步改善结果。

图6中示出了当使用q阈值范围而不是单个值时的示例。具体地，q阈值范围选择为跨越Q_ref的75百分位数到99百分位数。在q范围内绘制得到的趋势，并且平均值平均与已知的15％GMO相比较。这表明，本文提供的分析框架可以在阈值范围内补偿假阳性和假阴性误差(即使在阈值未被优化时)，以提供样品中目标分析物的相对丰度的改进估计。

在该实施例中对于定量群体中目标序列的丰度说明的工作流程不需要任何扩增、纯化、浓缩或缓冲液交换步骤。该工作流程与廉价的一次性样品制备盒相容，以允许在小型化(手持式或桌面式)装置中进行样品入-结果出(sample-in answer-out)的工作流程。

在另一组实验中，将不同的GMO％样品作为未知样品测试。在每个纳米孔上遵循的方案是：a)100％466bp参照，5分钟，然后冲洗；b)100％788bp目标，5分钟，然后冲洗；c)运行1到4个未知数，每个5分钟，中间冲洗；d)运行对照混合物。使用面积标准并且实施跨Q_ref的75百分位数到99百分位数的q-阈值范围，将平均报告为预测的GMO％。在等式(2)中，对照混合物用于补偿目标分析物和参照分析物之间的捕获率常数差异。实验使用1：1、0.75：1或0.35：1的目标：参照对照混合物。

表3报告了使用0.35：1(35％GMO)的对照混合物进行补偿的来自四个“未知”混合样品(S1-S4)的一个纳米孔测定的预测结果。在每个纳米孔测定中未知是不知情的，因此表格中未报告百分误差。该表还报告了每5分钟时间内记录的事件总数。

表3.对于盲法样品S1-S4的GMO预测结果

真实GMO％	预测GMO％	总事件
			*35％	35.1±3.0％	1,175
样品S1	32.0±2.2％	2,039
			样品S2	10.2±1.4％	1,767
样品S3	20.9±2.4％	1,031
			样品S4	6.2±1.4％	1,125

按照上述方案进行总共12个纳米孔实验，并且每个混合样品测试2-5次(总是在不同的纳米孔上，并且由不同的实验者或在不同的日期测试)。纳米孔尺寸范围为直径25-35nm。测定总共11个混合样品(S1-S11)。表4报告了从最小到最大的预测GMO％值排序的综合估计值。报告的平均GMO％值通过对单纳米孔预测进行平均来计算。每个平均估计值的不确定性从单个估计值分布的重复随机抽样计算(蒙特卡罗方法)。报告的是数字生成的95百分位置信区间。还报告了每个样品的测试次数和每个样品的真实GMO％。

表4.对于样品S1-S11的综合GMO％预测(平均值±2δ)

表4的结果显示我们的方法可以高精度地预测目标分析物的分数丰度(例如GMO％)。在10-90％GMO的范围内，通过组合单纳米孔估计值，准确度在2％以内。在5-10％之间和100％的GMO下，其中预测误差可以增加接近饱和极限，将两个纳米孔估计值组合导致<5％的误差。通常，与无捕获率常数差异的补偿(表1-2)相比，使用目标分析物和参照分析物之间的捕获率常数差异的补偿提高了准确度。对于整个GMO％预测范围，更多纳米孔估计值将更大地提高准确度和精确度。阵列纳米孔(各自从公共池中测量)还可以通过消除作为本研究的部分存在的人与人之间以及日与日之间以及试剂组之间的变异来进一步降低不确定性。

实施例2–对于目标和参照使用不同长度dsDNA的基于SVM的FA

在此使用先前呈现的SVM方法(等式(3)-(4))重新分析在实施例1中记录和分析的相同纳米孔数据。

分离的对照集首先用于初始特征的选择。初始选择旨在取消高度相关的特征，这可能对某些分类方法导致多重共线性问题。七种确定的特征是：(i)LOG₁₀(停留)，或者仅“停留”，事件持续时间的10为底的对数；(ii)maxAmp：maxδG；(iii)sdAmpSub：事件信号的标准偏差，取消上升和下降时间；(iv)medAmp：中位δG；(v)LFNmean：低于50赫兹的事件的噪声功率的平均值；(vi)LFNmedian：低于50赫兹事件的噪声功率的中位数；(vii)面积：实施例1中使用的相同事件面积。

进行进一步的特征提取以减少数据维度。此步骤的目的是平衡计算时间和分类准确性。已经实施了两种算法：1)单变量特征选择方法。ANOVA F-值在事件的每个特征和标记之间计算。阈值人工设置以选择具有最高F评分的一部分特征。2)递归特征消除(RFE)。估计器(例如SVM)在初始特征集上训练，并且获得每个特征的重要性。最低重要性的特征从当前特征集排除。递归地重复该过程直到达到所需的特征集数量。

对于实施例1数据，采用单变量特征选择方法。特征的百分比的阈值人工设置为60％。算法选择的四种最佳特征是：(i)停留，(ii)sdAmpSub，(iii)medAmp，(iv)面积。

该方法的下一步是模型训练和测试。将分离对照中的所有事件总体地使用7：3分割随机分类到训练数据集和测试数据集中。SVM使用超参数搜索算法基于训练数据集训练以找到执行分类的最佳参数。在网格算法中测试的超参数是：核类型(线性，rbf)、正则化参数(C)和核系数(γ)。ROC曲线的曲线下面积(roc_auc)用于评估每个超参数组合的性能。具有最高roc_auc分数的模型用于下游数据处理。对于最佳参数组合，计算来自测试数据的每个类的平均精度和召回率。然后具有最佳参数的模型通过训练数据集训练并在测试数据集上进行测试。生成测试数据集的准确性预测，并如图7所示。整个集合的准确度保持在97.5％以上。

该方法的下一步是数据校准。通过将步骤3中的模型应用于对照混合物数据可以实现校准，其产生校正比率。然后将校正比率乘以未知混合物的每个预测量。这相当于乘以等式(1)和(2)中的参数α。通过在SVM方法中将模型应用于对照混合物来生成参数α的值，而(1)和(2)涉及从对照数据集Q值直接计算α。

表5显示了Q-检验方法和基于SVM的方法之间GMO％预测的比较。

表5.比较单纳米孔GMO％预测，Q-检验vs.SVM

样品分为：a)SVM预测更准确(1,5,6,8,9,16,19,20,21)，b)Q-检验预测更准确(3,4,7,10,11,12,14,15,17)，和c)这些方法的准确度相同(2,3,18,22)。对于这22个样品，两种方法的整体表现大致相当，各自在9/22的情况中表现都优于另一种。

SVM方法的价值是可以自动地应用于数据集，该数据集先验地可能没有可以应用的明确标准，而这是Q-检验方法的要求。另一方面，Q-检验方法在计算上更简单，并且对于可以在Q-检验形式中利用充分表征的标准的分数丰度应用可能是优选的。

实施例3–使用具有独特有效负载的短DNA(74bp参照，94bp目标转基因)的基于Q- 检验的FA

在GMO％预测应用的背景下，该实施例显示两种相当的长度可用于目标和参照dsDNA，其中通过使用两种不同的序列特异性有效负载实现纳米孔事件特征的区分。

方法：使用经验证的qPCR引物组(可从European Union Reference Laboratoryfor GM Food and Feed公开获得)，我们从含常规和含转基因的基因组DNA样品的混合物扩增94bp转基因特异性和74bp分类群特异性片段。在纳米孔检测之前，将这些扩增子与序列特异性寡核苷酸探针杂交(Data Storage专利#5520281-v2-29517，2016年5月16日中描述的方法)，序列特异性寡核苷酸探针与PEG聚合物探针共价连接(参见国际公开号WO/2016/187159，“Methods and Compositions for Target Detection in a Nanopore Using aLabelled Polymer Scaffold”)，其通过引用整体并入本文。具体地，转基因靶向探针与4臂40kDa PEG连接和参照靶向探针与8臂40kDa PEG连接。

作为全事件散点图的代表性实例，图8显示了在相同孔上顺序地作为分离的对照运行的两种分子类型的事件图。首先，制备含有96bp DNA/探针-有效负载复合物的样品，并在纳米孔装置中测量。该复合物是包含目标序列并与探针有效负载结合的片段的模型。探针-有效负载是具有4臂PEG结构的PNA-PEG。接下来，设计包含参照序列的片段以在通过纳米孔移位时产生独特的事件特征，利用该特征可以实现分数丰度计算。参照分子是结合有PNA-PEG的74bp DNA，其中PEG具有8臂结构。关键是参照/探针-有效负载分子产生独特的事件亚群(其不同于靶/探针-有效负载分子)，并且两者都不同于任何背景事件(存在时)。

每个纳米孔遵循的方案是：a)100％74bp/有效负载-2参照，5分钟，然后冲洗；b)100％p4bp/有效负载-1目标，5分钟，然后冲洗；c)运行1到4个未知，每个5分钟，中间冲洗；d)运行对照混合物。使用面积标准并且实施跨Q_ref的75百分位数到99百分位数的q-阈值范围，将平均报告为预测的GMO％。在等式(2)中，1：1对照混合物用于补偿目标分析物和参照分析物之间的捕获率常数差异。

按照上述方案进行一组纳米孔实验，并且每个混合样品测试2-4次(总是在不同的纳米孔上，并且由不同的实验者或在不同的日期)。纳米孔尺寸范围为直径25-35nm。测定总共6个混合样品(Sp1-Sp6)。表6报告了从最小到最大预测GMO％值排序的综合估计值。报告的平均GMO％值通过对单纳米孔预测进行平均来计算。计算每个平均估计值的不确定性并报告为95百分位置信区间。还报告了每个样品的测试次数和每个样品的真实GMO％。

表6.使用不同有效负载区分目标/参照的综合GMO％预测

具有两个有效负载的预测性能似乎不如使用dsDNA长度区分时(实施例1,2)那么好。在任何情况下，准确度在所有例中优于6％，并且可以通过使更多纳米孔平行测量分子池并且组合所得估计值来进一步改善。

实施例4–使用短DNA(89bp)和两个独特有效负载的用于KRAS G12D SNP与野生型相比的FA的Q-检测和SVM方法

我们设计引物以从高度片段化的、无细胞的循环DNA扩增人KRAS基因的短(58bp，70bp或89bp)片段。(cfDNA引物序列设计为在KRAS G12D SNP序列(CosmicID 521)的任一侧上退火)。扩增子从血浆获得的无细胞循环DNA部分产生，并经历与靶向野生型和突变体KRAS等位基因两者的寡核苷酸探针的杂交，且与PEG聚合物有效负载共价连接。靶向KRASwt等位基因(c.35G)的探针与40kDa 8臂或80kDa 2分支PEG聚合物连接，和靶向G12D(c.35G->A)等位基因的探针与40kDa 3分支PEG聚合物连接。

图9A显示了100％目标分析物对照样品(蓝色闭合圆圈)和100％参照分子对照样品(黑色空心方块)重叠的平均δG对持续时间的代表性事件图。目标分析物是89bp DNA，其中G12D结合的探针与3分支PEG连接(表示为G12D-3bPEG)。参照分子是89bp DNA，其中野生型(c.35G)-结合的探针与8臂PEG连接(表示为WT-8armPEG)。使用35nm直径的纳米孔在215mV(1.0M LiCl 10mM tris 1mM EDTA)下依次运行两个对照。在视觉上，该图提出用于标记目标事件的基于三个不等式的标准：

持续时间≥q₁

平均

阈值q₁＝1msec,q₂＝0.4nS和q₃＝0.65nS建立了也在图9A中示出的目标标记框(虚线)。使用具有所述阈值的三个不等式的标准，分离的对照产生Q_ref＝0.006和Q_targ＝0.795。等摩尔浓度的目标-有效负载和参照-有效负载分子导致Q_1:1＝0.274，其用作对照混合物。随后的两个未知样品A和B，登记Q_A＝0.066和Q_B＝0.041。在事件图中将两个样品覆盖在两个分离的对照上，如图9B所示。在视觉上，样品A显示比样品B更高的G12D含量，尽管两者与100％WT对照的0.6％假阳性率相比都是阳性的。在应用等式(1)并使用对照混合物进行补偿后，对于样品A和B，G12D突变体相对野生型的预测分数分别为和

表7在第1行和第2行中显示了样品A和B的结果。还显示了所有测试患者样品的结果。测定总共5种不同的患者样品。样品C和C2是来自相同患者样品的子样品；同样对于样品D、D2和E、E2。在考虑的所有三种情况下，从相同患者样品取得的不同子样品在彼此的2％内。尽管不同的人在不同的纳米孔上运行每个纳米孔实验，并且在两种情况中是在不同的天运行。这表明可重复的工作流程和定量分数丰度方法。

表7.使用Q-检验方法在血液样品中预测的G12D突变体分数

纳米孔ID,直径	样品标签	估计的G12D分数％	总事件
				NP1,35nm	A	11±0.89％	1,494
NP1,35nm	B	6.9±0.75	1,508
				NP2,30nm	C	7±0.9％	1,488
NP3,33nm	D	5.9±0.5％	2,503
				NP4,33nm	C2	5.3±0.9％	1,188
NP5,38nm	D2	6.5±1.0％	1,741
				NP6,23nm	E	30±0.9％	2,455
NP7,32nm	E2	28±0.9％	3,299

这些样品的G12D真实量未知。在癌症治疗(化疗)开始几周后从患者收集样品，并且在每个患者之后，DNA测序并且发现G12D突变是阳性的。还测定了来自对照患者的非阳性对照样品，并且预测的G12D分数为2％或更低，表明2％的总工作流程假阳性。工作流程中的进一步优化可以进一步降低检测限。

应用SVM方法进行比较。使用一个代表性实验(表1中的纳米孔NP4)，数据使用针对应用SVM方法描述的步骤处理。对于100％参照对照和100％目标对照重叠的图10中显示了中位δG对log10(持续时间)的事件散点图。还绘制了SVM鉴定的决策边界。对于Q-检验和SVM方法，样品C2中的预测G12D分数在表8中报告。这两种方法在彼此的5％以内。

表8.使用Q-检验和SVM确定优化的阈值(q)的预测G12D分数

实施例5:使用短DNA(89bp)和两个独特有效负载的用于KRAS G12D SNP与野生型相比的FA的EMGM

描述了高斯混合的期望最大化算法(EMGM)应用于代表性数据集。目标和参照是有效负载结合的dsDNA片段内的突变体KRASG12D SNP和野生型序列，如实施例4中所述。在代表性工作流程中，仅测量1：1对照混合物并且仅测量一个100％参照对照，然后是未知混合物。

步骤1：50％目标&50％参照混合物样品的停留时间对照(log(停留))和中值幅度(medAmp)用作EMGM算法的输入数据(图11)。使用先前建立的关于该测定的知识，将最初鉴定的预期目标(即突变体KRASG12D SNP)区域标记为图中的矩形区域。通过在单独的实验中在相当的条件(相同缓冲液)中测试100％目标对照来建立先验知识。该框不用于标记。相反，在将EMGM应用于对照混合物之后，将与框内的高斯混合物相关的任何事件标记为目标事件。

步骤2：基于群体，使用3-高斯混合模型来训练模型。该模型预测了一个簇(菱形)中的突变体(目标)区域。其他2个星团(星形和方形)对应于野生型(图12)。我们观察到初始目标域框(图11)内的一些事件通过EMGM算法与参照模式相关联。这与Q检验方法(其中框本身限定了标记为目标vs参照的事件群体)不同。

步骤3：将模型应用于100％野生型(参照)样品。突变体(目标)区域中事件数量相对于事件总数的比率建立了假阳性分数(图13)，其可用于改进分数丰度估计。

步骤4：该模型用于预测未知混合物。突变体区域中的事件数相对于事件总数的比率被用作未知混合物中突变体分子百分比的预测子(图14)。

作为通过假阳性补偿的性能增强的测试，从步骤4中的计算分数中减去来自步骤3的假阳性分数作为校正。在一组纳米孔实验中将EMGM应用于多种混合物的结果在表9中报告。混合物是不知情的直到组合EMGM结果，然后将该结果与真实的G12D分数丰度值进行比较。

表9.比较有或没有假阳性(FP)补偿的情况下的EMGM的预测G12D分数

在NP-a的情况下，通过使用假阳性补偿仅在20％的情况下增强了性能。对于NP-b，在所有情况下都增强了性能。没有对NP-c进行假阳性补偿测试，尽管表现已经很好，特别是对于50％和20％的估计值。

总之，在将EMGM模型应用于未知混合物以进行分数丰度估计之前，仅需要对照混合物来应用EMGM方法。

其它实施方案

应当理解，已经使用的词语是描述性词语而不是限制性词语，并且可以在所附权利要求的范围内进行改变而不脱离本发明的更广泛方面的真实范围和精神。

虽然已经相对于所描述的若干实施例以一定长度和某些特定性描述了本发明，但是并不意图将本发明限制于任何这样的细节或实施方案或任何特定实施方案，而是应该是参照所附权利要求进行解释，以便鉴于现有技术提供对这些权利要求的尽可能广泛的解释，并因此有效地包含本发明的预期范围。

本文提及的所有出版物，专利申请，专利和其他参照文献都通过引用整体并入。如果发生冲突，将以本说明书(包括定义)为准。另外，章节标题、材料、方法和实施例仅是说明性的而不是限制性的。

Claims

1.一种使用纳米孔装置确定混合未知样品中目标分析物的真实相对丰度的改进估计值的方法，包括

跨纳米孔装置中的纳米孔施加电压以产生可检测的电子特征并且单独地针对以下各项诱导带电分析物通过所述纳米孔的移位：

对照样品，其包含已知与参照分析物的相对丰度的目标分析物，和

包含所述目标分析物和所述参照分析物的混合未知样品，其中所述样品中所述目标分析物的相对丰度待测定；

对每个样品产生通过所述目标分析物或所述参照分析物通过所述纳米孔的移位产生的多个事件特征；

从所述多个事件特征中鉴定与所述目标分析物相关的第一事件特征的量和与所述参照分析物相关的第二事件特征的量以确定每个样品的第一和第二事件特征的检测相对丰度；和

使用所述对照样品中所述第一和第二事件特征的检测相对丰度来调整所述混合未知样品中所述第一和第二事件特征的检测相对丰度以校正检测相对丰度中的误差，从而确定所述混合未知样品中所述目标分析物的真实相对丰度的改进估计值。

2.根据权利要求1所述的方法，其中所述对照样品是目标对照样品，其包含所述目标分析物但不包含所述参照分析物。

3.根据权利要求1所述的方法，其中所述对照样品是参照对照样品，其包含所述参照分析物但不包含所述目标分析物。

4.根据权利要求3所述的方法，其进一步包括向纳米孔装置施加电压以对于包含所述目标分析物但不包含所述参照分析物的目标对照样品诱导带电分析物通过纳米孔传感器的移位。

5.根据权利要求1-4中任一项所述的方法，其中所述未知样品中所述第一和第二事件特征的所述检测相对丰度的所述调整包括使用所述目标对照样品中和所述参照对照样品中所述第一和第二事件特征的所述检测相对丰度校正所述检测相对丰度中的所述误差。

6.根据权利要求1-5中任一项所述的方法，其中所述误差包括所述目标分析物的假阳性或假阴性检测误差。

7.根据权利要求1-6中任一项所述的方法，还包括向纳米孔装置施加电压以对于包含所述目标分析物和所述参照分析物的混合对照样品诱导带电分析物通过纳米孔传感器的移位，其中所述目标分析物和所述参照分析物的相对丰度是已知的。

8.根据权利要求7所述的方法，其中所述未知样品中所述第一和第二事件特征的所述检测相对丰度的所述调整包括使用所述目标对照样品、所述参照对照样品和所述混合对照样品中所述第一和第二事件特征的所述检测相对丰度校正所述检测相对丰度中的所述误差。

9.根据权利要求1-8中任一项所述的方法，其中所述误差包括假阳性目标分析物检测误差、假阴性目标分析物检测误差、所述目标分析物和所述参照分析物之间的捕获率常数差异或其任何组合。

10.根据权利要求1所述的方法，其中所述对照样品是包含所述目标分析物和所述参照分析物的混合对照样品，其中所述目标分析物和所述参照分析物的相对丰度是已知的。

11.根据权利要求10所述的方法，其中所述误差包括所述目标分析物和所述参照分析物之间的捕获率常数差异。

12.根据权利要求7-11中任一项所述的方法，其中所述混合对照样品包含所述目标分析物与所述参照分析物的相对丰度，其相对于所述混合的未知样品相差不超过1.2倍、1.5倍、2倍、5倍或10倍。

13.根据权利要求1-12中任一项所述的方法，其中所述真实相对丰度的估计值是所述混合未知样品中所述目标分析物与所述参照分析物的真实比率的估计值。

14.根据权利要求13所述的方法，其中所述真实比率的估计值由确定，其中所述参数ρ是可以补偿假阳性检测误差、假阴性检测误差或两者的比率的估计值，并且其中所述参数α可用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。

15.根据权利要求14所述的方法，其中α是所述参照分析物捕获率除以所述目标分析物捕获率的比率的估计值。

16.根据权利要求1-12中任一项所述的方法，其中所述真实相对丰度的估计值是所述混合未知样品中所述参照分析物和所述目标分析物的群体中所述目标分析物的真实分数的估计值。

17.根据权利要求16所述的方法，其中所述真实分数的估计由确定，其中所述参数ρ是可以补偿假阴性检测误差、假阴性检测误差或两者的比率的估计值，并且其中所述参数α可用于补偿所述目标分析物和所述参照分析物之间的捕获率常数差异。

18.根据权利要求17所述的方法，其中α是参照分析物捕获率除以目标分析物捕获率的比率的估计值。

19.根据权利要求14或17所述的方法，其中和

20.根据权利要求19所述的方法，其中如果使用所述对照样品，则Q_targ是在所述目标对照样品中观察到的所述第一事件特征的分数，或者如果没有使用目标对照样品，则Q_targ＝1。

21.根据权利要求19或20所述的方法，其中如果使用所述参照对照样品，则Q_ref是在所述参照对照样品中观察到的所述第一事件特征的分数，或者如果不使用参照对照样品，则Q_ref＝0。

22.根据权利要求19-21中任一项所述的方法，其中Q_X∶Y是在所述混合对照样品中观察到的所述第一事件特征的分数，并且其中如果使用所述对照样品，则是在混合对照样品中目标分析物(X)与参照分析物(Y)的已知比率，或者如果没有使用混合对照样品，则α＝1。

23.根据权利要求19-22中任一项所述的方法，其中Q_mix是在所述混合未知样品中观察到的所述第一事件特征的分数。

24.根据上述权利要求中任一项所述的方法，其中所述未知或对照样品通过核酸扩增制备。

25.根据权利要求1-23中任一项所述的方法，其中所述未知或对照样品不是通过核酸扩增制备。

26.根据上述权利要求中任一项所述的方法，其中所述样品被纯化以基本上由参照和目标分子组成。

27.根据权利要求1-25中任一项所述的方法，其中所述样品未纯化。

28.根据上述权利要求中任一项所述的方法，其中所述混合未知样品中所述参照分析物的量或浓度是已知的。

29.根据权利要求28所述的方法，还包括使用所述混合未知样品中所述目标分析物与所述参照分析物的所述真实相对丰度的所述估计值和所述混合未知样品中所述参照分析物的所述已知量或浓度来确定所述混合未知样品中所述目标分析物的绝对量或浓度的估计值。

30.根据上述权利要求中任一项所述的方法，其中与所述目标分析物相关的第一事件特征的所述量和与所述参照分析物相关的第二事件特征的所述量根据定义的阈值鉴定。

31.根据权利要求30所述的方法，还包括使用Q-检验、支持向量机或期望最大化算法优化所述阈值以提高所述参照分析物和/或所述目标分析物的检测精度。

32.根据权利要求31所述的方法，其中所述支持向量机使用来自包含已知量的目标分析物和参照分析物的对照样品的电子特征来训练。

33.根据权利要求30所述的方法，其中所述定义的阈值是选自以下的事件特征的一个或多个特性的函数：事件持续时间、最大δ大、中值δ值、平均δ均、事件特征的标准偏差、低于50Hz的事件的噪声功率的平均值或中值、所述事件特征中的独特模式、事件的面积或其任何组合。

34.根据前述权利要求中任一项所述的方法，其中，使用Q检验，支持向量机或期望最大化算法来执行所述混合未知样品中所述第一和第二事件特征的所述检测相对丰度的所述调整以校正所述检测相对丰度中的所述误差。

35.根据上述权利要求中任一项所述的方法，其中所述目标分析物和所述参照分析物各自包含多核苷酸。

36.根据权利要求35所述的方法，其中所述目标分析物多核苷酸和所述参照分析物多核苷酸具有不同的长度。

37.根据权利要求36所述的方法，其中所述长度相差至少10个核苷酸，至少20个核苷酸，至少50个核苷酸，至少100个核苷酸，至少150个核苷酸或至少200个核苷酸。

38.根据上述权利要求中任一项所述的方法，还包括使所述对照或未知样品与结合第一有效负载的第一探针接触，其中所述第一探针配置成与所述第一分析物特异性结合。

39.根据上述权利要求中任一项所述的方法，还包括使所述对照或未知样品与结合第二有效负载的第二探针接触，其中所述第二探针配置成与所述第二分析物特异性结合。

40.根据上述权利要求中任一项所述的方法，其中所述目标分析物与遗传修饰的生物体相关。

41.根据上述权利要求中任一项所述的方法，其中所述目标分析物包括与患者中癌症的存在或不存在相关的标志物。

42.一种确定样品中目标分析物的相对量的方法，包括：

在纳米孔系统中单独地运行以下各项：

包含参照分析物而无目标分析物的第一对照样品，

包含目标分析物而无参照分析物的第二对照样品，

包含已知相对丰度的所述目标分析物和所述参照分析物的第三对照样品，和

包含未知相对丰度的所述目标分析物和所述参照分析物的实验样品；

对于每个样品检测与参照分析物相关的第一事件特征的量和与目标分析物相关的第二事件特征的量；和

比较来自所述实验样品的所述第一和第二事件特征的量的相对丰度与来自所述第一对照样品、所述第二对照样品和所述第三对照样品中每一个的所述第一和第二事件特征的量的相对丰度以确定所述实验样品中所述参照分析物和所述目标分析物的真实相对丰度的估计值。

43.根据权利要求42所述的方法，其中所述事件特征包括由所述参照分析物通过所述纳米孔的移位诱导的电信号。

44.根据权利要求42所述的方法，其中所述目标分析物和所述参照分析物各自包含多核苷酸。

45.根据权利要求44所述的方法，其中所述参照分析物和所述目标分析物通过长度区分。

46.根据权利要求42所述的方法，其中所述参照分析物和所述目标分析物各自与包含有效负载的序列特异性探针结合，以促进在所述纳米孔装置中所述参照分析物与所述目标分析物之间的区分。

47.根据权利要求42所述的方法，其中所述相对丰度是所述目标分析物与所述样品中所述目标分析物和所述参照分析物的总群体相比的分数量。

48.一种确定未知样品中目标分析物的相对丰度的方法，包括：

提供包含多个参照分析物和多个目标分析物的未知样品；

将所述未知样品加载到纳米孔装置的第一室中，所述纳米孔装置包括设置在所述第一室与第二室之间的纳米孔；

跨所述纳米孔施加电压以使所述参照分析物和所述目标分析物通过所述纳米孔从所述第一室移动到所述第二室；

检测各自与所述参照分析物通过纳米孔的移位相关的第一电信号的数量；

检测各自与所述目标分析物通过纳米孔的移位相关的第二电信号的数量；和

使用参照值将检测到的所述第一电信号的数量和检测到的所述第二电信号的数量的相对丰度转换为所述未知样品中所述目标分析物的真实相对丰度的估计值，所述参照值考虑与所述电信号相对丰度相关的至少一个误差。

49.根据权利要求48所述的方法，其中所述参照值是由从混合对照样品确定的所述第一电信号的分数丰度确定的，该混合对照样品包含已知量的目标分析物和参照分析物。

50.根据权利要求48所述的方法，其中所述参照值是由从混合对照样品确定的所述第一电信号的分数丰度确定的，该混合对照样品包含已知量的目标分析物和参照分析物。

51.根据权利要求48所述的方法，其中所述参照值是由从混合对照样品确定的所述第一电信号的分数丰度确定的，该混合对照样品包含已知量的目标分析物和参照分析物的。

52.根据权利要求49-51中任一项所述的方法，其中所述混合对照样品、所述靶对照样品或所述参照对照样品在与所述纳米孔装置中来自所述未知样品的所述第一和第二电信号的所述检测过程中的条件基本相同的条件下在所述纳米孔装置中运行。

53.根据权利要求48-52中任一项所述的方法，其中所述纳米孔装置包括将所述装置的内部空间分隔成第一室和第二室的膜，其中所述膜包含所述纳米孔，其中所述第一室和所述第二室通过所述纳米孔流体连通，并且其中所述装置包括每个室中用于跨所述纳米孔施加电压的电极。

54.根据权利要求53所述的方法，其中所述电极配置成监测通过所述纳米孔的电流。

55.根据权利要求53或54所述的方法，其中所述电极连接到电源。