CN111512155B - 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 - Google Patents

测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 Download PDF

Info

Publication number
CN111512155B
CN111512155B CN201880083810.4A CN201880083810A CN111512155B CN 111512155 B CN111512155 B CN 111512155B CN 201880083810 A CN201880083810 A CN 201880083810A CN 111512155 B CN111512155 B CN 111512155B
Authority
CN
China
Prior art keywords
data
nanopore
voltage
signal
cycle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880083810.4A
Other languages
English (en)
Other versions
CN111512155A (zh
Inventor
K.M.S.巴贾杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN111512155A publication Critical patent/CN111512155A/zh
Application granted granted Critical
Publication of CN111512155B publication Critical patent/CN111512155B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48728Investigating individual cells, e.g. by patch clamp, voltage clamp
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/40Semi-permeable membranes or partitions

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Nanotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

一种使用测序单元(200、300)的方法包括跨测序单元的纳米孔(216、316)来施加(1310)交流信号(228、328)。该方法进一步包括:在交流信号的多个周期的第一部分(520)期间获取(1320)第一电压数据集合。该方法进一步包括:从所述第一电压数据集合来确定(1330)时移的电压数据集合;通过计算所述第一电压数据集合(710)的数据点与所述时移的电压数据集合(720)的对应数据点之间的差(730)来计算(1340)差数据值;将多个噪声数据点(1401、1403、1405)标识(1350)为具有大于第一阈值的差数据值的数据点;以及从所述第一电压数据集合中去除(1360)所述多个噪声数据点。

Description

测量和去除来自交流信号驱动的纳米孔DNA测序系统的随机 信号中的噪声
背景技术
具有大约一纳米内径的孔大小的纳米孔膜设备已经在快速核苷酸测序方面示出了希望。当跨浸没在导电流体中的纳米孔来施加电压信号时,电场可以使导电流体中的离子移动通过纳米孔。导电流体中的离子通过纳米孔的移动可能引起小的离子电流。所施加的电压还可以使待测序的分子移入、移动通过或移出纳米孔。离子电流(或对应电压)的水平取决于纳米孔的大小和化学结构、以及已经被移入纳米孔中的特定分子。
作为对移动通过纳米孔的DNA分子(或待测序的其他核酸分子)的替代方案,分子(例如,被添加至DNA链的核苷酸)可以包括具有特定大小和/或结构的特定标签。可以测量包括纳米孔的电路中的离子电流或电压(例如,在积分电容器处),作为一种测量对应于该分子的纳米孔的电阻的方式,从而允许检测纳米孔中的特定分子、以及核酸的特定位置处的特定核苷酸。
基于纳米孔的测序芯片可以被用于DNA测序。基于纳米孔的测序芯片可以并入被配置为阵列的大量传感器单元。例如,具有一百万个单元的阵列可以包括1000行乘以1000列的单元。
由于制造易变性,所测量的电压可能会因芯片以及因同一芯片的单元而变化。因此,可能难以确定正确的分子,该分子可以是或对应于单元中的特定核酸或其他聚合物中的正确核苷酸。
因此,期望用于测序的改进技术。
发明内容
各种实施例提供了与来自基于多单元纳米孔的测序芯片的单元的输出信号的处理有关的技术和系统。可以通过采用本文中公开的各种实施例来构建经改进的基于多单元纳米孔的测序芯片。例如,实施例可以包括用于执行可以补偿测序信号中的非理想性的测序信号处理的系统和方法。非理想性可能是由于标签-纳米孔系统的除了穿越(threaded)或开放通道状态之外的一个或多个状态的出现所引起的。例如,可以补偿由标签-纳米孔系统的一个或多个中间状态所引起的噪声。
根据一些实施例,可以通过使用经改进的信号处理技术来去除测序信号中的噪声,该经改进的信号处理技术可以在例如由中间状态引起的噪声信号与例如由开放通道和/或穿越状态引起的纯信号之间进行区分。该经改进的信号处理技术采用了周期至周期(period-to-period)差分方案,接着是阈值化过程以标识噪声点并且将它们从测序信号中去除。在一个实施例中,通过使所获取的测序信号以AC驱动信号的一个AC周期来时移、并且然后从所获取的信号中减去该时移的测序信号,来确定周期至周期差信号(differencesignal)。差信号将包括具有高幅度和/或方差的部分、以及具有低幅度和/或方差的部分。然后可以如下那样将阈值应用于该周期至周期差信号。大于阈值的每个点被确定为噪声,并且然后将与该周期至周期差信号中经由阈值标识的噪声点相对应的所获取的测序信号数据点从所获取的测序信号中去除。
在一些实施例中,可以使用多于一个的阈值,使得仅落入阈值范围内的那些点被标识为噪声点并且被去除。
在一些实施例中,可以在与一个或多个阈值进行比较以标识噪声点之前,对差数据进行过滤、平滑或以其他方式去噪。例如,可以将基于小波的去噪技术应用于该周期至周期信号,以生成经去噪的周期至周期信号。然后,将一个或多个阈值应用于该经去噪的周期至周期信号,以标识噪声峰的集合。在一些实施例中,基于小波的去噪技术可以依赖于哈尔(Haar)小波。
其他实施例涉及与本文中描述的方法相关联的系统、便携式消费设备和计算机可读介质。
可以参考下面的具体实施方式和附图来得到对本发明的实施例的性质和优点的更好理解。
附图说明
图1是具有纳米孔单元阵列的纳米孔传感器芯片的实施例的顶视图。
图2图示了可以用于表征多核苷酸或多肽的纳米孔传感器芯片中的纳米孔单元的实施例。
图3图示了使用基于纳米孔的合成测序(Nano-SBS)技术来执行核苷酸测序的纳米孔单元的实施例。
图4图示了纳米孔单元中的电路的实施例。
图5示出了根据本公开的某些方面的在AC循环(cycle)的亮周期和暗周期期间从纳米孔单元捕获的示例数据点。
图6示出了根据本公开的某些方面的图示了电压数据的周期性的样本数据。
图7图示了根据本公开的某些方面的用于确定差数据(difference data)的电压数据的移位(shift),其中电压数据具有一个穿越事件(threading event)。
图8图示了根据本公开的某些方面的用于确定差数据的电压数据的移位,其中电压数据具有三个穿越事件。
图9图示了根据本公开的某些方面的在本文中被称为伪穿越背景噪声(PTBN)的噪声源的影响下的样本原始测序信号。
图10图示了根据本公开的某些方面的这次是在被称为快速捕获噪声(FCN)的噪声源的影响下的样本原始测序信号。
图11图示了根据本公开的某些方面的可以如何使用阈值化技术来对原始测序信号进行去噪。
图12A和图12B图示了根据本公开的某些方面的原始周期至周期差信号与经哈尔小波去噪的周期至周期差信号之间的比较的一个示例。
图13是图示了根据某些实施例的使用测序单元的示例方法的流程图。
图14A-14D图示了根据本公开的某些方面的使用去噪技术来处理的样本数据。
图15A-15D图示了根据本公开的某些方面的使用去噪技术来处理的样本数据。
图16A-16D图示了根据本公开的某些方面的使用去噪技术来处理的样本数据。
图17图示了根据本公开的某些方面的计算机系统。
术语
除非另行定义,否则本文中使用的技术和科学术语具有与本领域普通技术人员一般理解的相同的含义。与本文中描述的那些类似或等同的方法、设备和材料可以用于所公开技术的实践中。提供以下术语以便于对经常使用的某些术语的理解,并且以下术语不意味着限制本公开的范围。本文中使用的缩写在化学和生物学领域内具有其常规含义。
“核酸”可以指代单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。该术语可以涵盖:含有已知核苷酸类似物或经修饰的骨干残基(backbone residue)或链结(linkage)的核酸,这些核酸是合成的、天然存在的和非天然存在的,它们具有与参考核酸类似的键合性质,并且以类似于参考核苷酸的方式被代谢。这种类似物的示例可以包括但不限于:硫代磷酸酯、亚磷酰胺、甲基膦酸酯、手性甲基膦酸酯、2-O-甲基核糖核苷酸、肽核酸(PNA)。除非另行指示,否则特定核酸序列也隐含地涵盖了其经保守修饰的变体(例如,简并密码子取代(degenerate codon substitution))和互补序列、以及明确指示的序列。具体地,简并密码子取代可以通过生成如下序列来实现:在该序列中,一个或多个所选(或全部)密码子的第三位置被混合碱基和/或脱氧肌苷残基所取代(Batzer等人,Nucleic Acid Res. 19:5081(1991);Ohtsuka等人, J. Biol. Chem. 260:2605-2608(1985);Rossolini等人, Mol. Cell. Probes 8:91-98(1994))。术语核酸可以与基因、cDNA,mRNA、寡核苷酸和多核苷酸互换地使用。
术语“模板”可以指代被复制到DNA核苷酸的互补链中以用于DNA合成的单链核酸分子。在某些情况下,模板可以指代在mRNA合成期间复制的DNA序列。
术语“引物”可以指代为DNA合成提供起始点的短核酸序列。催化DNA合成的酶(诸如DNA聚合酶)可以向引物添加新的核苷酸以用于DNA复制。
“聚合酶”指代执行模板指导的多核苷酸合成的酶。该术语涵盖了全长多肽和具有聚合酶活性的结构域(domain)两者。DNA聚合酶对于本领域技术人员是众所周知的,并且包括但不限于:从激烈热球菌、滨海热球菌和海生热球菌中衍生或分离出的DNA聚合酶或其经修饰的版本。它们包括依赖DNA的聚合酶和依赖RNA的聚合酶(诸如逆转录酶)两者。依赖DNA的DNA聚合酶的至少五个族是已知的,尽管它们大多数属于A、B和C族。各个族当中没有或几乎没有序列相似性。大多数A族聚合酶是单链蛋白质,该单链蛋白质可以包含多种酶功能,包括聚合酶、3'至5'核酸外切酶活性、以及5'至3'核酸外切酶活性。B族聚合酶通常具有单个催化结构域,该单个催化结构域具有聚合酶以及3'至5'核酸外切酶活性、以及辅助因子。C族聚合酶通常是多亚基蛋白质,该多亚基蛋白质具有聚合以及3'至5'核酸外切酶活性。在大肠杆菌中,已经发现了三种类型的DNA聚合酶,即DNA聚合酶I(A族)、II(B族)和III(C族)。在真核细胞中,三种不同的B族聚合酶——DNA聚合酶α、δ和ε——在核复制中被涉及,并且A族聚合酶——聚合酶γ——用于线粒体DNA复制。其他类型的DNA聚合酶包括噬菌体聚合酶。类似地,RNA聚合酶通常包括:真核RNA聚合酶I、II和III、以及细菌RNA聚合酶、以及噬菌体和病毒聚合酶。RNA聚合酶可以是依赖DNA的和依赖RNA的。
“纳米孔”指代在膜中形成或以其他方式提供的孔、通道或小通道(passage)。膜可以是有机膜、诸如脂质双分子层,或者可以是合成膜、诸如由聚合材料形成的膜。可以将纳米孔设置成邻近或接近于传感电路或耦合到传感电路的电极,传感电路诸如例如互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路。在一些示例中,纳米孔具有大约0.1纳米(nm)至约1000nm的特性宽度或直径。一些纳米孔是蛋白质。
除了指代天然存在的核糖核苷酸或脱氧核糖核苷酸单体外,“核苷酸”还可以被理解为指代其相关结构变体,包括衍生物和类似物,这些结构变体关于其中使用了核苷酸(例如,与互补碱基进行杂化(hybridization))的特定上下文在功能上是等同的,除非上下文另行明确指示。
“标签”指代可以是原子或分子、或者原子或分子的集合的可检测部分。标签可以提供光学的、电化学的、磁性的或静电的(例如,电感的、电容的)标记(signature),可以借助于纳米孔来检测该标记。通常,当核苷酸附着到标签时,它被称为“带标签的核苷酸”。标签可以经由磷酸部分而附着到核苷酸。
如本文中所使用的,术语“亮周期”通常可以指代:当带标签的核苷酸的标签由通过AC信号施加的电场而被迫使(force)进入纳米孔中时的时间段。术语“暗周期”通常可以指代:带标签的核苷酸的标签由通过AC信号施加的电场而被从纳米孔中推出时的时间段。AC循环可以包括亮周期和暗周期。在不同的实施例中,被施加到纳米孔单元以将纳米孔单元置于亮周期(或暗周期)中的电压信号的极性可能是不同的。
具体实施方式
在基本模型中,测序单元的纳米孔标签系统可以处于以下五个状态中的一个:开放通道状态、或针对与C、G、A和T核苷酸相对应的标签的四个穿越状态中的一个。然而,实际上,纳米孔标签系统的动态性(dynamics)可能比该基本模型更加复杂,并且除了四个穿越状态之外,若干个其他中间状态也可能导致附加的噪声被添加到测序信号。
通常,一个或多个实施例可以用于从测序信号中去除噪声,包括由一个或多个中间状态引起的噪声。例如,本文中公开的信号处理技术可以利用真实信号(其中本文中的术语“真实信号”指代由开放通道和穿越状态引起的测序信号)与除了开放或穿越通道之外的状态(诸如,上述中间状态)引起的噪声信号之间的一个或多个差。更具体地,实施例可以采用周期至周期差分技术,该技术可以用于基于如下观察来将噪声信号与真实信号进行区分:在周期至周期差信号中,噪声信号拥有比真实信号显著更高的幅度/方差。换句话说,周期至周期差信号的开放通道和穿越通道部分两者都拥有比该周期至周期信号的中间状态部分更低的幅度。
因此,本文中公开的技术提供了一种方法,该方法用于通过将阈值应用于周期至周期差信号,并且然后将大于或等于该阈值的周期至周期差值的集合标识为噪声,从而将真实信号与噪声分离。一旦标识了该周期至周期差信号中的噪声点的集合,就可以通过去除与该周期至周期噪声点相关联的点来对原始测序信号进行去噪。然后,如有必要,可以对该经去噪的测序信号进行进一步处理,并且最终可以将其用作去往碱基测定(basecalling)过程的输入,该碱基测定过程产生更准确的基于纳米孔的DNA序列。如本文中所使用的,术语“经去噪的信号”旨在包括具有比原始信号更少噪声的信号。由此,在不脱离本公开的范围的情况下,经去噪的信号仍可以包括残余噪声。
I. 基于纳米孔的测序芯片
图1是具有纳米孔单元150的阵列140的纳米孔传感器芯片100的实施例的顶视图。每个纳米孔单元150包括集成在纳米孔传感器芯片100的硅衬底上的控制电路。在一些实施例中,侧壁136可以被包括在阵列140中以将纳米孔单元150的群组分离,使得每一个群组可以接收不同的样本以用于表征。每个纳米孔单元可以用于对核酸进行测序。在一些实施例中,纳米孔传感器芯片100可以包括盖板130。在一些实施例中,纳米孔传感器芯片100还可以包括多个引脚110,该多个引脚110用于与诸如计算机处理器之类的其他电路进行对接。
在一些实施例中,纳米孔传感器芯片100可以在相同封装中包括多个芯片,该相同封装诸如例如多芯片模块(MCM)或系统级封装(SiP)。芯片可以包括例如存储器、处理器、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、数据转换器、高速I/O接口等。
在一些实施例中,纳米孔传感器芯片100可以耦合到(例如,对接到)纳米芯片工作站120,该纳米芯片工作站120可以包括用于执行(例如,自动执行)本文中公开的过程的各种实施例的各种组件,包括例如:分析物递送机构、诸如用于递送脂质悬浮液或其他膜结构悬浮液、分析物溶液和/或其他液体、悬浮液或固体的移液管、机器人臂、计算机处理器和/或存储器。可以在纳米孔单元150的阵列140上检测多个多核苷酸。在一些实施例中,每个纳米孔单元150可以是单独可定位的(addressable)。
II. 纳米孔测序单元
纳米孔传感器芯片100中的纳米孔单元150可以以许多不同的方式来实现。例如,在一些实施例中,具有不同大小和/或化学结构的标签可以附着到待测序的核酸分子中的不同核苷酸。在一些实施例中,可以通过使不同地经聚合物加标签的核苷酸与模板进行杂化,来合成与待测序的核酸分子的模板的互补链。在一些实现方式中,核酸分子和所附着的标签两者都可以移动通过纳米孔,并且由于附着到核苷酸的标签的特定大小和/或结构,通过纳米孔的离子电流可以指示纳米孔中的核苷酸。在一些实现方式中,仅标签可以被移动到纳米孔中。可能还有许多不同的方式来检测纳米孔中的不同标签。
A. 纳米孔测序单元结构
图2图示了纳米孔传感器芯片中的示例纳米孔单元200(诸如,图1的纳米孔传感器芯片100中的纳米孔单元150)的实施例,该纳米孔单元200可以用于表征多核苷酸或多肽。纳米孔单元200可以包括:阱(well)205,其由介电层201和204所形成;膜,诸如在阱205上形成的脂质双分子层214;以及样本腔215,其处于脂质双分子层214上,并且通过脂质双分子层214与阱205分离。阱205可以包含一定体积(a volume of)的电解质206,并且样本腔215可以容纳体电解质(bulk electrolyte)208,该体电解质208包含纳米孔(例如,可溶性蛋白质纳米孔跨膜分子复合物(PNTMC))和感兴趣的分析物(例如,待测序的核酸分子)。
纳米孔单元200可以包括处于阱205的底部处的工作电极202、以及设置在样本腔215中的反电极210。信号源228可以在工作电极202与反电极210之间施加电压信号。可以通过由电压信号引起的电穿孔过程来将单个纳米孔(例如,PNTMC)插入到脂质双分子层214中,从而在脂质双分子层214中形成纳米孔216。阵列中的个体膜(例如,脂质双分子层214或其他膜结构)可以既不彼此化学连接也不彼此电连接。因此,阵列中的每个纳米孔单元可以是独立的测序机器,从而产生对于与纳米孔相关联的单个聚合物分子独特的数据,该纳米孔对感兴趣的分析物进行操作,并且调节通过原本不可渗透的脂质双分子层的离子电流。
如图2中所示,可以在诸如硅衬底之类的衬底230上形成纳米孔单元200。可以在衬底230上形成介电层201。用于形成介电层201的介电材料可以包括例如玻璃、氧化物、氮化物等。可以在衬底230上和/或在介电层201内形成用于控制电刺激并且用于处理从纳米孔单元200检测到的数据的电路222。例如,可以在介电层201中形成多个图案化金属层(例如,金属1至金属6),并且可以在衬底230上制造多个有源器件(例如,晶体管)。在一些实施例中,信号源228作为电路222的一部分而被包括。电路222可以包括例如放大器、积分器、模数转换器、噪声过滤器、反馈控制逻辑和/或各种其他组件。电路222可以进一步耦合到处理器224,处理器224耦合到存储器226,其中处理器224可以分析测序数据以确定已经在阵列中被测序的聚合物分子的序列,并且还可以向电路222提供一个或多个命令。
工作电极202可以被形成在介电层201上,并且可以形成阱205的底部的至少一部分。在一些实施例中,工作电极202是金属电极。对于非法拉第传导而言,工作电极202可以由抗腐蚀和抗氧化的金属或其他材料制成,诸如例如铂、金、氮化钛和石墨。例如,工作电极202可以是具有电镀铂的铂电极。在另一个示例中,工作电极202可以是氮化钛(TiN)工作电极。工作电极202可以是多孔的,从而增加其表面积以及与工作电极202相关联的最终电容。因为纳米孔单元的工作电极可以独立于另一个纳米孔单元的工作电极,所以在本公开中,工作电极可以被称为单元电极。
可以在介电层201上方形成介电层204。介电层204形成围绕阱205的壁。用于形成介电层204的介电材料可以包括例如:玻璃、氧化物、单氮化硅(SiN)、聚酰亚胺、或其他合适的疏水绝缘材料。可以对电介质层204的顶表面进行硅烷化(silanize)。硅烷化可以在介电层204的顶表面上方形成疏水层220。在一些实施例中,疏水层220具有约1.5纳米(nm)的厚度。
由介电层204的壁形成的阱205包括工作电极202上方的一定体积的电解质206。一定体积的电解质206可以被缓冲,并且可以包括以下各项中的一个或多个:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、乙酸锂、乙酸钠、乙酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)和氯化镁(MgCl2)。在一些实施例中,一定体积的电解质206具有约三微米(μm)的厚度。
还如图2中所示,可以在介电层204的顶部上形成膜,该膜跨过了阱205。在一些实施例中,该膜可以包括在疏水层220的顶部上形成的脂质单分子层218。当该膜到达阱205的开口时,脂质单分子层218可以转变成跨过了阱205的开口的脂质双分子层214。脂质双分子层可以包括磷脂或由磷脂组成,该磷脂例如选自如下各项:二植烷酰基磷脂酰胆碱(DPhPC)、1,2-二植烷酰基-sn-甘油-3-磷酸胆碱、1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱(DoPhPC)、棕榈酰-油酰基-磷脂酰胆碱(POPC)、二油酰基-磷脂酰-甲酯(DOPME)、二棕榈酰磷脂酰胆碱(DPPC)、磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酸、磷脂酰肌醇、磷脂酰甘油、鞘磷脂、1,2-二-O-植烷酰基-sn-甘油;1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-350];1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-550];1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-750];1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-1000];1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-乳糖苷;GM1神经节苷脂、溶血磷脂酰胆碱(LPC)或其任何组合。
如所示出的,脂质双分子层214被嵌入有例如由单个PNNTC形成的单个纳米孔216。如上所描述,可以通过电穿孔将单个PNNTC插入到脂质双分子层214中来形成纳米孔216。纳米孔216可以足够大以用于使感兴趣的分析物和/或小离子(例如,Na+、K+、Ca2+、CI-)的至少一部分在脂质双分子层214的两侧之间传递。
样本腔215在脂质双分子层214上方,并且可以容纳感兴趣的分析物的溶液以用于表征。该溶液可以是含有体电解质208的水溶液,并且被缓冲至最佳离子浓度并维持在最佳pH处,以保持纳米孔216打开。纳米孔216穿过脂质双分子层214,并且提供了用于从体电解质208到工作电极202的离子流动的唯一路径。除了纳米孔(例如,PNTMC)和感兴趣的分析物之外,体电解质208可以进一步包括以下各项中的一个或多个:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、乙酸锂、乙酸钠、乙酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)和氯化镁(MgCl2)。
反电极(CE)210可以是电化学电势传感器。在一些实施例中,反电极210可以在多个纳米孔单元之间被共享,并且因此可以被称为公共电极。在某些情况下,公共电势和公共电极对于所有纳米孔单元、或至少特定分组内的所有纳米孔单元来说可以是公共的。公共电极可以被配置成向与纳米孔216接触的体电解质208施加公共电势。反电极210和工作电极202可以耦合到用于跨脂质双分子层214来提供电刺激(例如,电压偏置)的信号源228,并且可以用于感测脂质双分子层214的电特性(例如,电阻、电容和离子电流流动)。在一些实施例中,纳米孔单元200还可以包括参考电极212。
在一些实施例中,可以在创建纳米孔单元期间进行各种检查,作为校准的一部分。一旦创建了纳米孔单元,就可以执行进一步的校准步骤,例如以标识如期望那样执行的纳米孔单元(例如,该单元中的一个纳米孔)。这种校准检查可以包括物理检查、电压校准、开放通道校准、以及对具有单个纳米孔的单元的标识。
B. 纳米孔测序单元的检测信号
纳米孔传感器芯片中的纳米孔单元(诸如,纳米孔传感器芯片100中的纳米孔单元150)可以使得能够使用基于单分子纳米孔的合成测序(Nano-SBS)技术来进行并行测序。
图3图示了使用Nano-SBS技术来执行核苷酸测序的纳米孔单元300的实施例。在Nano-SBS技术中,可以将待测序的模板332(例如,核苷酸分子或另一种感兴趣的分析物)和引物引入到纳米孔单元300的样本腔中的体电解质308中。作为示例,模板332可以是圆形或线状的。核酸引物可以与模板332的一部分杂化,可以向模板332的该部分添加四个不同地经聚合物加标签的核苷酸338。
在一些实施例中,酶(例如,聚合酶334,诸如DNA聚合酶)可以与纳米孔316相关联,以用于在合成与模板332的互补链中使用。例如,聚合酶334可以共价地附着到纳米孔316。聚合酶334可以使用单链核酸分子作为模板来催化核苷酸338到引物上的并入。核苷酸338可以包括标签种类(“标签”),其中核苷酸是如下四种不同类型中的一个:A、T、G或C。当带标签的核苷酸与聚合酶334正确地复合时,该标签可以通过电场力(electrical force)而被拉入(加载)到纳米孔中,该电场力诸如在跨脂质双分子层314和/或纳米孔316而施加的电压所生成的电场的存在下生成的力。标签的尾部首先经由孔腔313而进入纳米孔316,并且然后可以被拉入纳米孔316的桶状体(barrel)317中。然后,可以将标签保持在纳米孔316的桶状体317中,并且由于标签的不同化学结构和/或大小而生成独特的离子阻断信号340,从而电子地标识该标签所附着到的所添加的碱基。
如本文中所使用的,“加载的”或“穿越的”标签可以是被定位在纳米孔中和/或保持在纳米孔中或附近达可观测时间量的标签,该可观测时间量例如0.1毫秒(ms)到10000ms。在一些情况下,标签在从核苷酸释放之前被加载在纳米孔中。在一些实例中,所加载的标签在核苷酸并入事件下被释放之后通过纳米孔(和/或被纳米孔检测到)的概率合适地高,例如90%至99%。
在一些实施例中,在聚合酶334连接到纳米孔316之前,纳米孔316的电导可以是高的,诸如例如约300皮西门子(picosiemens)(300pS)。当标签被加载在纳米孔中时,由于标签的不同化学结构和/或大小而生成了独特的电导信号(例如,信号340)。例如,纳米孔的电导可以是约60 pS、80 pS、100 pS或120 pS,它们均对应于带标签的核苷酸的四个类型之一。聚合酶然后可能经受异构化和转磷酸反应,以将核苷酸并入到生长的核酸分子中,并且释放标签分子。
在某些情况下,带标签的核苷酸中的一些可能不与核酸分子(模板)的当前位置相匹配(互补碱基)。不与核酸分子碱基配对的带标签的核苷酸也可以通过纳米孔。这些未配对的核苷酸可能在一时间尺度内被聚合酶拒绝,该时间尺度比正确配对的核苷酸保持与聚合酶相关联所持续的时间尺度更短。键合到未配对的核苷酸的标签可以快速地通过纳米孔并且在短时间段(例如,小于10ms)内被检测到,而键合到经配对的核苷酸的标签可以被加载到纳米孔中并且在长时间段(例如,至少10ms)内被检测到。因此,下游处理器可以至少部分地基于在纳米孔中检测到核苷酸所花费的时间来标识未配对的核苷酸。
可以经由通过纳米孔的电流来测量包括所加载的(穿越的)标签的纳米孔的电导(或等效地,电阻),从而提供对标签种类的标识,并且因此提供对当前位置处的核苷酸的标识。在一些实施例中,可以将直流(DC)信号施加到纳米孔单元(例如,使得标签以其移动通过纳米孔的方向不被反向)。然而,使用直流电在长时间段内来操作纳米孔传感器可能会改变电极的组成,使跨纳米孔的离子浓度不平衡,并且具有可能影响纳米孔单元的寿命的其他不期望的影响。施加交流(AC)波形可以减少电迁移,以避免这些不期望的影响,并且具有如下所描述的某些优点。本文中所描述的利用带标签的核苷酸的核酸测序方法与所施加的AC电压完全兼容,并且因此可以使用AC波形来实现这些优点。
当使用了牺牲电极、即在载流反应中改变分子特性的电极(例如,包含银的电极)、或在载流反应中改变分子特性的电极时,在AC检测循环期间向反电极重新充电的能力可能是有利的。当使用直流信号时,电极可能在检测循环期间耗尽。重新充电可以防止电极达到耗尽极限、诸如变得完全耗尽,这在电极很小时(例如,当电极足够小以提供每平方毫米具有至少500个电极的电极阵列时)可能是个问题。在某些情况下,电极寿命与电极的宽度成比例,并且至少部分地取决于电极的宽度。
用于测量通过纳米孔的离子电流的合适条件是本领域中已知的,并且本文中提供了示例。可以利用跨膜和孔而施加的电压来执行测量。在一些实施例中,所使用的电压可以在从-400mV至+400mV的范围内。所使用的电压优选地在如下范围内:该范围具有选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0mV的下限、以及独立地选自+10mV、+20 mV、+50 mV、+100 mV、+150 mV、+200 mV、+300 mV和+400 mV的上限。所使用的电压可以更优选地在100mV至240mV的范围内,并且最优选地在160mV至240mV的范围内。通过使用增加的所施加电势的纳米孔来增加不同核苷酸之间的区别是可能的。在于2013年11月6日提交的题为“Nucleic Acid Sequencing Using Tags”的美国专利公开No. US 2014/0134616中描述了使用AC波形和带标签的核苷酸来对核酸进行测序,该专利通过引用整体地并入本文中。除了US 2014/0134616中描述的带标签的核苷酸之外,还可以使用缺少糖或无环部分的核苷酸类似物(例如,五个常见核碱基:腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和胸腺嘧啶的(S)-甘油三磷酸核苷(gNTPs))来执行测序(Horhota等人,Organic Letters,8:5345-5347 [2006])。
C. 纳米孔测序单元的电路
图4图示了纳米孔单元(诸如,纳米孔单元200)中的电路400(其可以包括图2中的电路222的部分)的实施例。如上所描述,在一些实施例中,电路400包括反电极210,该反电极210可以在纳米孔传感器芯片中的多个纳米孔单元或所有纳米孔单元之间被共享,并且因此也可以被称为公共电极。该公共电极可以被配置成:通过连接到交流电压源420(VLIQ)来将公共电势施加到与纳米孔单元中的脂质双分子层(例如,脂质双分子层214)接触的体电解质(例如,体电解质208)。在一些实施例中,可以利用AC非法拉第模式以用AC信号(例如,方波)来调节电压VLIQ,并且将其施加到与纳米孔单元中的脂质双分子层接触的体电解质。在一些实施例中,VLIQ是幅度为±200-250mV并且频率在例如25至400Hz之间的方波。可以通过诸如例如100μF或更大的大电容器(未示出)来对反电极210与脂质双分子层(例如,脂质双分子层214)之间的体电解质进行建模。
图4还示出了表示工作电极(例如,工作电极202)和脂质双分子层(例如,脂质双分子层214)的电气性质的电气模型422。电气模型422包括:电容器426(C双分子层),其对与脂质双分子层相关联的电容进行建模;以及电阻器428(R),其对与纳米孔相关联的可变电阻进行建模,该可变电阻可以基于纳米孔中的特定标签的存在而改变。电气模型422还包括电容器424,该电容器424具有双层电容(C双层),并且表示工作电极202和阱205的电气性质。工作电极202可以被配置成独立于其他纳米孔单元中的工作电极来施加不同的电势。
通过器件(Pass device)406是可以用于将脂质双分子层和工作电极与电路400连接或断开连接的开关。通过器件406可以由控制线407来控制,以启用或禁用将跨纳米孔单元中的脂质双分子层而施加的电压刺激。在脂质被沉积以形成脂质双分子层之前,两个电极之间的阻抗可能非常低,这是因为纳米孔单元的阱未被密封,并且因此可以保持通过器件406断开以避免短路状况。在脂质溶剂已经沉积到纳米孔单元以密封纳米孔单元的阱之后,可以闭合通过器件406。
电路400可以进一步包括片上积分电容器408(ncap)。可以通过使用复位信号403来闭合开关401从而对积分电容器408进行预充电,使得积分电容器408连接到电压源VPRE405。在一些实施例中,电压源VPRE 405提供了幅度为例如900mV的恒定参考电压。当开关401闭合时,可以将积分电容器408预充电至电压源VPRE 405的参考电压水平。
在对积分电容器408进行预充电之后,可以使用复位信号403来断开开关401,以使得积分电容器408与电压源VPRE 405断开连接。此时,取决于电压源VLIQ的水平,反电极210的电势可以处于高于工作电极202(和积分电容器408)的电势的水平处,或者反之亦然。例如,在来自电压源VLIQ的方波的正相位(例如,AC电压源信号循环的亮或暗周期)期间,反电极210的电势处于高于工作电极202的电势的水平处。在来自电压源VLIQ的方波的负相位(例如,AC电压源信号循环的暗或亮周期)期间,反电极210的电势处于低于工作电极202的电势的水平处。因此,在一些实施例中,由于反电极210与工作电极202之间的电势差,因此积分电容器408可以在亮周期期间从电压源VPRE 405的预充电电压水平进一步被充电至较高水平,并且在暗周期期间被放电至较低水平。在其他实施例中,充电和放电可以分别在暗周期和亮周期中发生。
取决于模数转换器(ADC)410的采样率,可以在固定的时间段内对积分电容器408进行充电或放电,该采样率可以高于1kHz、5kHz、10kHz、100kHz或更多。例如,以1kHz的采样率,可以在约1ms的时段内对积分电容器408进行充电/放电,并且然后可以由ADC 410在积分时段结束时对电压水平进行采样和转换。特定电压水平将对应于纳米孔中的特定标签种类,并且因此对应于模板上的当前位置处的核苷酸。
在由ADC 410采样之后,可以通过使用复位信号403来闭合开关401以再次对积分电容器408进行预充电,使得积分电容器408再次连接到电压源VPRE 405。可以在遍及测序过程的循环中重复以下步骤:对积分电容器408进行预充电;在固定时间段内等待积分电容器408充电或放电;以及由ADC 410对积分电容器的电压水平进行采样和转换。
数字处理器430可以处理ADC输出数据,例如用于标准化、数据缓冲、数据过滤、数据压缩、数据缩减、事件提取、或者将来自纳米孔单元阵列的ADC输出数据组装成各种数据帧。在一些实施例中,数字处理器430可以执行进一步的下游处理,诸如基准确定。数字处理器430可以被实现为硬件(例如,在GPU、FPGA、ASIC等中),或被实现为硬件和软件的组合。
因此,跨纳米孔而施加的电压信号可以用于检测纳米孔的特定状态。纳米孔的可能状态之一是:当附着有标签的聚磷酸盐不存在于纳米孔的桶状体时的开放通道状态,在本文中也被称为纳米孔的无穿越状态。纳米孔的其他四个可能状态各自与四种不同类型的附着有标签的聚磷酸盐核苷酸(A、T、G或C)之一被保持在纳米孔的桶状体中时的状态相对应。纳米孔的又一可能状态是当脂质双分子层破裂时。
当在固定时间段之后测量积分电容器408上的电压水平时,纳米孔的不同状态可以导致不同电压水平的测量结果。这是因为积分电容器408上的电压衰减(通过放电而减小,或通过充电而增加)的速率(即,积分电容器408上的电压对比时间的标绘图的斜坡的陡度)取决于纳米孔电阻(例如,电阻器RPORE 428的电阻)。更特别地,因为与处于不同状态下的纳米孔相关联的电阻由于分子/标签的不同化学结构而不同,所以电压衰减的不同对应速率可以被观察到,并且可以用来标识纳米孔的不同状态。电压衰减曲线可以是具有RC时间常数τ=RC的指数曲线,其中R是与纳米孔相关联的电阻(即RPORE 428),并且C是关联于与R并联的膜(即电容器426(C双分子层))的电容。纳米孔单元的时间常数可以是例如约200-500ms。由于双分子层的详细实现方式,衰减曲线可能不确切地与指数曲线拟合,但是衰减曲线可以类似于指数曲线并且是单调的,因此允许对标签的检测。
在一些实施例中,与处于开放通道状态下的纳米孔相关联的电阻可以在100MOhm至20GOhm的范围内。在一些实施例中,与处于其中标签在纳米孔的桶状体内部的状态下的纳米孔相关联的电阻可以在200MOhm至40GOhm的范围内。在其他实施例中,可以省略积分电容器408,这是因为通向ADC 410的电压仍将由于电气模型422中的电压衰减而变化。
积分电容器408上的电压的衰减速率可以以不同方式来确定。如上所解释的,可以通过测量固定时间间隔期间的电压衰减来确定电压衰减的速率。例如,可以首先由ADC 410在时间t1处测量积分电容器408上的电压,并且然后再次由ADC 410在时间t2处测量该电压。当积分电容器408上的电压对比时间曲线的斜坡较陡峭时,电压差较大,并且当电压曲线的斜坡较不陡峭时,电压差较小。因此,该电压差可以用作用于确定积分电容器408上的电压的衰减速率、以及因此确定纳米孔单元的状态的量度。
在一些实施例中,可以通过测量针对所选的电压衰减量所需要的持续时间来确定电压衰减的速率。例如,可以测量电压从第一电压水平V1下降或增加到第二电压水平V2所需的时间。当电压对比时间的曲线的斜坡较陡峭时,所需的时间较小,并且当电压对比时间的曲线的斜坡较不陡峭时,所需的时间较大。因此,所测量的所需时间可以用作用于确定积分电容器ncap 408上的电压的衰减速率、以及因此确定纳米孔单元的状态的量度。本领域技术人员将领会可以用于测量纳米孔的电阻的各种电路,例如包括电流测量技术。
在一些实施例中,电路400可以不包括在片上制造的通过器件(例如,通过器件406)和额外的电容器(例如,积分电容器408(ncap)),从而便于减小基于纳米孔的测序芯片的大小。由于膜(脂质双分子层)的薄性质,单独的与膜相关联的电容(例如,电容器426(C双分子层))就可能足以产生所需的RC时间常数,而无需附加的片上电容。因此,电容器426可以用作积分电容器,并且可以由电压信号VPRE来预充电,并且随后由电压信号VLIQ来放电或充电。对该电路中原本在片上制造的额外电容器和通过器件的排除可以显著减小纳米孔测序芯片中的单个纳米孔单元的占用空间,从而便于对纳米孔测序芯片进行缩放以包括越来越多的单元(例如,在纳米孔测序芯片中具有数百万个单元)。
D. 纳米孔单元中的数据采样
为了执行对核酸的测序,当带标签的核苷酸被添加到核酸时,可以由ADC(例如,ADC 410)对积分电容器(例如,积分电容器408(ncap)或电容器426(C双分子层))的电压水平进行采样和转换。例如,当所施加的电压使得VLIQ低于VPRE时,可以由跨纳米孔的电场将核苷酸的标签推入纳米孔的桶状体中,该电场是通过反电极和工作电极而施加的。
1. 穿越
穿越事件是当带标签的核苷酸附着到模板(例如核酸片段),并且该标签进入和离开纳米孔的桶状体时的事件。在穿越事件期间,这可能会发生多次。当标签处于纳米孔的桶状体中时,纳米孔的电阻可能较高,并且较低的电流可以流经该纳米孔。
在测序期间,标签在某些AC循环内可能不处于纳米孔中(被称为开放通道状态),其中由于纳米孔的较低电阻,电流是最高的。当标签被吸引到纳米孔的桶状体中时,纳米孔处于亮模式中。当标签被从纳米孔的桶状体中推出时,纳米孔处于暗模式中。
2. 亮周期和暗周期
在AC循环期间,可以由ADC对积分电容器上的电压进行多次采样。例如,在一个实施例中,以例如大约100Hz跨该系统来施加AC电压信号,并且ADC的采集速率可以是每单元大约2000Hz。因此,可以存在每AC循环(AC波形的循环)捕获的大约20个数据点(电压测量结果)。与AC波形的一个循环相对应的数据点可以被称为集合。在针对AC循环的数据点的集合中,可以存在当例如VLIQ低于VPRE时捕获到的子集,该子集可以对应于亮模式(周期),其中标签被迫使进入纳米孔的桶状体中。另一个子集可以对应于暗模式(周期),其中当例如VLIQ高于VPRE时,标签通过所施加的电场而被从纳米孔的桶状体中推出。
3. 所测量的电压
针对每个数据点,当开关401断开时,积分电容器(例如,积分电容器408(ncap)或电容器426(C双分子层))处的电压将由于通过VLIQ进行的充电/放电而以衰减的方式改变,例如当VLIQ高于VPRE时,作为从VPRE到VLIQ的增加;或者当VLIQ低于VPRE时,作为从VPRE到VLIQ的减小。随着工作电极进行充电,最终电压值可能会偏离VLIQ。积分电容器上的电压水平的改变速率可以由双分子层的电阻值来控制,该双分子层可以包括纳米孔,纳米孔进而可以包括纳米孔中的分子(例如,带标签的核苷酸的标签)。可以在开关401断开之后的预定时间处测量电压水平。
开关401可以以数据采集的速率来操作。开关401可以在两次数据采集之间的相对短的时间段内闭合,通常在由ADC进行测量之后立即闭合。该开关允许在VLIQ的每个AC循环的每个子周期(亮或暗)期间收集多个数据点。如果开关401保持断开,则积分电容器上的电压水平、以及因此ADC的输出值将完全衰减并保持在那里。取而代之,当开关401闭合时,积分电容器被再次预充电(至VPRE),并且变得准备好进行另一次测量。因此,开关401允许在每个AC循环的每个子周期(亮或暗)内收集多个数据点。这种多次测量可以允许用固定的ADC来实现更高的分辨率(例如,8位至14位,这是由于可以被求平均的测量结果的更大数量)。多次测量还可以提供关于穿越到纳米孔中的分子的动力学信息。定时信息可以允许确定穿越发生了多长时间。这也可以用于帮助确定添加至核酸链的多个核苷酸是否正在被测序。
图5示出了在AC循环的亮周期和暗周期期间从纳米孔单元捕获的示例数据点。在图5中,出于说明目的,夸大了数据点中的改变。施加到工作电极或积分电容器的电压(VPRE)处于恒定水平,诸如例如900mV。施加到纳米孔单元的反电极的电压信号510(VLIQ)是AC信号,其被示出为矩形波,其中占空比可以是任何合适的值,诸如小于或等于50%,例如约40%
在亮周期520期间,施加到反电极的电压信号510(VLIQ)低于施加到工作电极的电压VPRE,使得标签可以通过在工作电极和反电极处施加的不同电压水平引起的电场(例如,由于标签上的电荷和/或离子的流动)而被迫使进入纳米孔的桶状体中。当开关401断开时,ADC之前的节点处(例如,积分电容器处)的电压将减小。在捕获了电压数据点之后(例如,在指定时间段之后),可以闭合开关401,并且测量节点处的电压将再次增加回到VPRE。该过程可以重复以测量多个电压数据点。以这种方式,可以在亮周期期间捕获多个数据点。
如图5中所示,在VLIQ信号的符号改变之后的亮周期中的第一数据点522(也被称为第一点增量(delta)(FPD))可能低于随后数据点524。这可能是因为纳米孔中没有标签(开放通道),并且因此它具有低电阻和高放电速率。在一些实例中,第一数据点522可以超过VLIQ水平,如图5中所示。这可能是由于将信号耦合到片上电容器的双分子层的电容所引起的。可以在已经发生了穿越事件、即标签被迫使进入纳米孔的桶状体中之后来捕获数据点524,其中纳米孔的电阻、以及因此积分电容器的放电速率取决于被迫使进入纳米孔的桶状体中的标签的特定类型。如下所提及,由于在C双层424处累积的电荷,因此针对每次测量,数据点524可能会略微地减小。
在暗周期530期间,施加到反电极的电压信号510(VLIQ)高于施加到工作电极的电压(VPRE),使得任何标签将被从纳米孔的桶状体中推出。当开关401断开时,由于电压信号510的电压水平(VLIQ)高于VPRE,因此测量节点处的电压增加。在捕获了电压数据点之后(例如,在指定时间段之后),可以闭合开关401,并且测量节点处的电压将再次减小回到VPRE。该过程可以重复以测量多个电压数据点。因此,可以在暗周期期间捕获多个数据点,包括第一点增量532和随后数据点534。如上所描述,在暗周期期间,任何核苷酸标签被从纳米孔中推出,并且因此除了用于在归一化中使用之外,获得了关于任何核苷酸标签的最少信息。
图5还示出的是:在亮周期540期间,即使施加到反电极的电压信号510(VLIQ)低于施加到工作电极的电压(VPRE),也没有发生穿越事件(开放通道)。因此,纳米孔的电阻是低的,并且积分电容器的放电速率是高的。作为结果,所捕获的数据点(包括第一数据点542和随后数据点544)示出了低电压水平。
针对纳米孔的恒定电阻的每次测量,可以预期在亮或暗周期期间测量的电压大致相同(例如,在当一个标签处于纳米孔中时的给定AC循环的亮模式期间做出),但是当电荷在双层电容器424(C双层)处累积时,可能并非是这种情况。这种电荷累积会导致纳米孔单元的时间常数变得更长。作为结果,电压水平可能会移位,从而导致测量值针对一循环中的每个数据点而减小。因此,在一循环内,这些数据点可能从一数据点到另一数据点而稍微改变,如图5中所示。
4. 确定碱基
针对纳米孔传感器芯片的每个可用的纳米孔单元,可以运行生产模式以对核酸进行测序。可以对测序期间捕获的ADC输出数据进行归一化以提供更高的准确度。归一化可以计及偏移效应,诸如循环形状和基线偏移。在归一化之后,实施例可以确定针对穿越通道的电压集群,其中每个集群对应于不同的标签种类,并且因此对应于不同的核苷酸。集群可以用于确定与给定核苷酸相对应的给定电压的概率。作为另一示例,集群可以用于确定用于区分不同核苷酸(碱基)的截止电压。
关于测序操作的进一步详细信息可以在以下各项中找到:例如,题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的美国专利公开No.2016/0178577、题为“Nanopore-Based Sequencing With Varying Voltage Stimulus”的美国专利公开No.2016/0178554、题为“Non-Destructive Bilayer Monitoring Using Measurement OfBilayer Response To Electrical Stimulus”的美国专利申请No.15/085,700、以及题为“Electrical Enhancement Of Bilayer Formation”的美国专利申请No.15/085,713,这些专利的公开内容出于所有目的通过引用被整体地并入。
5. 电压值的周期性
图6示出了根据一些实施例的用于测试测序运行的样本亮周期和暗周期数据。在该图的顶部部分601上示出了亮周期数据,并且在该图的底部部分603上示出了暗周期数据。电压数据的周期性是由交流(AC)电压源(例如,AC电压源420)提供的交流信号引起的,如上面参考图4所描述的那样。在关于通过器件406的断开的某时间段之后,通过纳米孔单元电路的节点上(例如,图4中的ncap处)的电压的ADC测量来获得图6中所示的每个数据点。对于每个测量,ncap处的电压在VPRE(VPRE被示出为虚线612)处开始,并且然后衰减,从而取决于AC循环内的周期(亮或暗)而接近+/-VLIQ。在某时间延迟之后,ADC测量电压值。图6示出了这些测量电压值的集合,即每个数据点都是从VPRE到VLIQ的RC衰减曲线的单点样本。对于图6中所示的示例,数据采集速率约为1,976 Hz。在每个周期内,点到点之间的电压中的变化部分地是由于该单元中的电荷累积所引起的,从而导致了针对积分电容器(例如,电容器408或426,这取决于所使用的电路)的充电/放电的基础电压衰减曲线中的整体移位。
图6示出了来自亮模式的开放通道状态的数据,例如,在第7个AC循环的亮周期开始之后不久出现的穿越事件610之前的亮模式数据620。随着时间的推移,其他AC循环中的随后开放通道值和穿越事件也将被示出。在一些实施例中,如此处所示,对于穿越状态和开放通道状态而言,亮周期中的所测量的ADC值实际上在循环与循环之间是相当可重复的。这开辟了如下可能性:即可以使用相邻(或甚至随后的非相邻)亮周期数据、而无需使用暗通道数据来补偿一个亮周期数据中的系统性移位和噪声。以下部分详述了利用电压数据的周期性的一个或多个实施例。
III. 使用周期至周期差信号来标识并表征噪声
在理想化的场景下,测序单元的纳米孔-DNA-标签系统可以处于以下五个状态之一中:开放通道状态、或针对与C、G、A和T相对应的标签的四个穿越状态之一。如上面参考图3所讨论的,在穿越事件期间,标签的尾部可以首先经由孔腔313而进入纳米孔316,并且然后该尾部可以被拉入纳米孔316的桶状体317中。当标签被保持在纳米孔316的桶状体317内时,生成独特的离子阻断信号,从而电子地标识该标签所附着到的所添加的碱基。
然而,实际上,纳米孔-DNA-标签系统的动态性可能比上述的理想穿越动态性更加复杂,并且这些非理想性可能导致附加的噪声被添加到离子阻断信号。例如,标签可能非常快地通过了纳米孔而没有被保持在桶状体中,F,或者可能在再次经由孔腔离开之前仅仅短暂地进入桶状体。另外,标签可能进入孔腔中并且以折叠构造存留在那里,该折叠构造不允许该标签被有效地拉入桶状体中。在这种情况下,折叠的标签在再次经由孔腔离开纳米孔之前可以在孔腔中保持一时间段。纳米孔-DNA-标签的许多可能的中间状态是可能的,并且均可能促成测序信号上的噪声。在某些情况下,这些所谓的“中间状态”甚至可能拥有等于或几乎等于预期穿越通道值的信号值,并且因此可能会被无意地标识为导致下游测序错误的穿越碱基。在Maglia等人的“Enhanced Translocation of Single DNA Molecules Through α-Hemolysin Nanopores by Manipulation of Internal Charge”(Proc NatlAcad Sci U.S.A. 2008 Dec 16; 105(50):19720–19725)中描述了相关系统的其他可能的中间状态。虽然这些状态在本文中被称为中间状态,但是应当理解的是,任何非穿越或非开放通道状态都可能促成测序信号上的噪声,并且由此,本公开的实施例不限于具有本文中描述的特定物理源的噪声源。
在某些情况下,针对中间状态的物理动态性的时间尺度可能与关联于真正的(bona-fide)穿越事件的时间尺度不同。另外,并且在某种程度上相关地,在中间状态期间测序信号的幅度中随时间的方差可以不同于在开放通道状态和/或四个穿越通道状态两者期间随时间的方差。有利地,本文中公开的信号处理技术可以利用真实信号(开放通道和/或穿越信号)与噪声信号(由包括上述中间状态的其他状态所引起)之间的例如时间尺度和方差中的差异,以及可以使用这些技术来对测序信号进行去噪。更具体地,根据某些实施例,可以使用周期至周期差分技术来标识测序信号中包括噪声的部分,使得这些点可以被去除,从而留下经去噪的信号,该经去噪的信号包括较高比重的属于开放通道或穿越状态的点。
A. 对周期至周期差分方法的介绍
根据某些实施例,可以使用在本文中被称为周期至周期差分的技术来标识和分析噪声信号。在共同待决的美国专利申请No.15/628,353中描述了一种形式的周期至周期差分,该专利的公开内容出于所有目的通过引用整体地并入本文。根据某些实施例,为了确定周期至周期差信号(在本文中也被称为“差数据”),可以从一个数据循环中减去另一个数据循环。例如,可以将源自于相邻循环(例如,最近的相邻者(neighbor)、第二相邻者等)的对应数据点彼此相减,以获得差数据,如下面进一步详细描述的。
图7示出了多个循环1-4的数据点集合,其中每个循环具有相应的亮和暗周期,该亮和暗周期由位于图7中的每个标绘图的顶部处的B和D标号所表示。可以从原始测序数据生成两个移位的数据集,并且每个数据集可以被存储在存储器中。信号710是向左移位二分之一周期的原始数据(本文中被称为left_adc),并且数据720是向右移位二分之一周期的原始数据(本文中被称为right_adc)。尽管该实施例示出了净一个周期移位的示例,但是在不脱离本公开的范围的情况下,其他移位也是可能的,例如,二个周期的移位、三个周期的移位等。此外,可以使用原始数据、以及移位一个完整周期的移位数据,而不是以半个周期移位两次。然后,可以通过将这两个移位的adc信号相减来创建经处理的差数据730(本文中被称为p2p_diff),在这种情况下:
p2p_diff = left_adc - right_adc (1)。
在一些实施例中,通过从原始循环1中减去原始循环2来获得经处理的差数据730(p2p_diff)的第一循环。通过从原始循环2中减去原始循环3来获得经处理的差数据730(p2p_diff)的第二循环。通过从原始循环4中减去原始循环3来获得经处理的差数据730(p2p_diff)的第三循环,以此类推。在经处理的差数据730中,来自原始数据的单个穿越事件770被复制,其首先作为正峰(事件峰750)而出现,并且随后作为负峰(事件峰760)而出现。
本领域普通技术人员将领会的是,事件峰750和760通常具有相反的符号,并且因此,正和负限定符在本文中仅被用作一个示例。针对该单个穿越事件的正峰和负峰在时间上分开一个量:该量等于两个移位数据集之间的净时移(在该示例中为一个完整周期)。然而,对于保持了多个循环的穿越事件而言,净时移可能会更长。
虽然图7示出了逐点的周期至周期差分方法来计算经处理的差数据730,但是可以在不脱离本公开的范围的情况下使用任何差分方案,例如移位可以以单个或多个周期在任一方向上(从右到左或从左到右)进行。图7示出了通过从左到右(净)移位单个周期的最近相邻者的差。然而,可以通过移位多个周期来获取该差,这可以提供关于基础信号的更粗略的尺度信息。
可能无法确定第一循环和/或最后一个循环的差,这是因为针对经移位的循环之一,可能不存在第一循环的数据或最后一个循环的数据。因此,这些区域在本文中被称为“无效区域”。图7中示出了第一无效区域740的示例。
图8图示了差分技术的实施例,该技术使用与上面在图7中描述的移位方法相同的移位方法,但是这次具有性质略微不同的原始数据。如此处所示,在一些实施例中,穿越事件可以持续多于一个AC循环。例如,在图8的数据中,穿越事件持续三个循环,这三个循环由穿越事件810、820和830示出,它们各自分别在循环2、3和4期间发生。然而,由于原始数据中针对这些穿越事件中的每一个的重复性,仅第一穿越事件810和最后一个穿越事件830可以在经处理的差数据中分别作为正峰840和负峰850而出现。
B. 使用周期至周期差分来表征噪声信号
为了说明可以如何使用上述周期至周期差分技术来将噪声信号与测序信号进行区分,考虑了无噪声条件下的开放通道孔的情况。在这种条件下,来自AC信号的随后周期的亮模式值将相等(假设没有增益漂移并且没有偏移漂移)。用更数学的方式来讲,考虑将由
Figure 574662DEST_PATH_IMAGE001
给出的在时间t处获取的开放通道信号、以及将由
Figure 183497DEST_PATH_IMAGE002
给出的在随后周期(t=t+nT)期间获取的无噪声信号,其中T是AC信号的周期并且n是整数。然后,周期至周期差信号可以写为:
Figure 356990DEST_PATH_IMAGE003
在其中开放通道水平不会从周期到周期而漂移的理想情况下,
Figure 39775DEST_PATH_IMAGE004
,并且因此对于所有i而言
Figure 7731DEST_PATH_IMAGE005
。换句话说,在这种理想情况下,来自AC信号的不同周期的亮模式信号之间的周期至周期的差在所有时间内都应当为零。
如果现在将随机噪声添加到亮模式信号,则不能保证添加到第一周期中的一个点的噪声与添加到第二周期中的对应点的噪声相同。用更数学的方式来讲,时间t处的噪声信号由
Figure 103863DEST_PATH_IMAGE006
给出,并且任何随后循环处的噪声信号由
Figure 815467DEST_PATH_IMAGE007
给出,其中
Figure 618338DEST_PATH_IMAGE008
Figure 757195DEST_PATH_IMAGE009
表示在时间t处以及在n个周期后的时间t+nT处的信号上的噪声。在这种情况下,差信号将不再为零,而是将由噪声项之间的差来给出:
Figure 340623DEST_PATH_IMAGE010
在噪声信号的情况下,量值
Figure 590339DEST_PATH_IMAGE011
的精确值将通常取决于噪声的动态性的时间尺度(与AC信号的周期T相比)、噪声的幅度、以及描述噪声源的概率分布的形式。
穿越情况类似于上述开放通道情况,这是因为穿越事件通常将针对AC信号的若干个循环而重复。因此,在无噪声的系统中,差信号将具有一个正峰,接着是零的若干个循环,并且然后是负峰(或者反之亦然,这取决于两个信号之间的移位)。然而,在添加了噪声之后,在正峰与负峰之间的中间区域内将存在非零的周期至周期差信号。上面的图8中示出了这种情况,其中穿越事件在AC信号的三个循环(循环2-4)内保持,并且周期至周期差信号示出了正峰840、接着是负峰850,正峰840标记了穿越事件的开始,负峰850标记了穿越事件的结束。正峰840与负峰850之间的中间点以零为中心,但是拥有在零周围的波动,该波动对应于穿越事件期间的测序信号上的噪声。
鉴于等式(3),周期至周期差信号
Figure 513296DEST_PATH_IMAGE012
的幅度可以取决于噪声的幅度,并且由此可以用作该信号上的噪声的度量。该信号
Figure 823054DEST_PATH_IMAGE013
中拥有高幅度的那些部分更有可能是噪声,而该信号
Figure 893779DEST_PATH_IMAGE014
中具有低幅度的那些部分很可能是真实信号(开放通道或穿越事件)。图9-11示出了测试数据的样本,以进一步说明以上的点。
图9A-9B示出了在本文中被称为伪穿越背景噪声(PTBN)的噪声源的影响下的样本原始测序信号。图9A中的标绘图示出了在其中尚未发生任何穿越事件的情况下的亮模式数据901和暗模式数据902两者。因此,整个亮模式数据901仅包括开放通道信号值。然而,在亮模式数据901的最后500ms中,PTBN开始出现,如由帧903内示出的亮模式数据所突出显示的那样。即使该系统仍处于开放通道状态下,PTBN也会导致非常接近或甚至等于表示有效穿越事件的水平的信号值。因此,如果在碱基测定之前没有去除PTBN,则可能导致测序错误。
图9B示出了从亮模式信号数据901计算出的周期至周期差信号。图9B清楚地示出:在正在出现PTBN的时间段期间(在从大约3.1s到3.3s的时间段期间),周期至周期差信号中的大多数点的幅度显著较高。在另一方面,在正常的开放通道状态期间(在从大约0s到3.1s的时间段期间),周期至周期信号中的大多数点的幅度较低。因此,通过标识周期至周期差信号中具有高于阈值水平的幅度的点,可以将测序信号中的一个或多个点标识为高概率PTBN噪声点。一旦标识了这些点,就可以将它们从原始信号中去除以产生经去噪的信号,如下面参考图11-13进一步详细描述的那样。
图10A-10B示出了在本文中被称为快速捕获噪声(FCN)的噪声源的影响下的样本原始测序信号。在某些情况下,作为标签与孔的快速动力学碰撞的结果,可能会导致一类型的FCN。例如,如果标签重复地进入纳米孔的孔腔,但是然后在该标签完全穿越之前,该标签再次经由孔腔快速地离开纳米孔,则可能发生FCN。如果该标签在离开之后仍然接近于纳米孔,则该相同过程可能会随时间反复发生,从而导致测序信号上的噪声。图10A中的标绘图示出了在其中尚未发生任何穿越事件的情况下的亮模式数据1001和暗模式数据1002两者。因此,整个亮模式数据1001仅包括开放通道信号值。然而,除了在最初125ms中之外,亮模式数据1001都在经受FCN。与针对PTBN的情况一样,即使该系统仍处于开放通道状态下,FCN也可能导致非常接近或甚至等于表示有效穿越事件的水平的信号值。因此,如果在碱基测定之前没有去除FCN,则可能导致测序错误。
图10B示出了从亮模式信号数据1001计算出的周期至周期差信号。图10B清楚地示出:在正在发生FCN的时间段期间(在从大约0.125s至3.7s的时间段期间),周期至周期差信号中的大多数点的幅度显著较高。在另一方面,在正常的开放通道状态期间(在从大约0s到0.125s的时间段期间),周期至周期信号中的大多数点的幅度较低。因此,通过标识周期至周期差信号中具有高于阈值水平的幅度的点,可以将测序信号中的一个或多个点标识为高概率FCN噪声点。一旦标识了这些点,就可以将它们从原始信号中去除以产生经去噪的信号,如下面参考图11-13进一步详细描述的那样。
IV. 使用差数据来进行去噪
如上面参考图10-11所介绍的,在某些情况下,某些类型的噪声可能表现出如下周期至周期差信号:该周期至周期差信号显著大于针对不受噪声影响的干净开放通道状态的差信号。因此,通过标识促成了具有大于某个阈值的值的周期至周期信号的点,可以从差信号中标识一个或多个噪声点。相反地,可以将出现在阈值以下的所有点标识为真实信号(开放通道或穿越通道数据)。尽管对于基于周期至周期的差来对信号进行去噪而言存在许多不同的可能性,但是出于说明的目的而在下面描述了两种技术。
第一种技术在“原始”周期至周期差信号上使用一个或多个阈值。第二种技术使用了中间步骤,该中间步骤为:首先对周期至周期差信号进行去噪/平滑,并且然后以与第一种方法相同的方式使用一个或多个阈值来标识经去噪的周期至周期信号中的噪声点。在第二种方法中,可以采用任何方法来对周期至周期差信号进行去噪,但是由于周期至周期信号中的穿越事件的特定形式(成对的锐利的负和正的方形峰),使用哈尔母小波进行去噪是特别有利的,如下面进一步详细描述的。
A. 在原始差数据上使用阈值来进行去噪
图11示出了可以如何使用如应用于原始周期至周期差数据的阈值化技术来对原始测序信号进行去噪。图11的顶部面板1119示出了具有亮模式数据1103和暗模式数据1105两者的原始测序信号。就在大约255.9秒之前的亮模式数据1103中还示出了穿越事件1107。如通过1107a和1107b处的信号中的两次下降可以看到的,该穿越事件1107在两个AC周期内存留。在亮模式数据1103中还示出了若干个潜在噪声数据点,例如潜在噪声点1109和1111。
图11的底部面板1125示出了根据在顶部面板1119中示出的原始测序信号上的一个周期的移位而计算出的所得的原始周期至周期差信号。底部面板1125中还示出了两个阈值1113和1117,它们分别被设置为+/-5.0的周期至周期差值。为了对原始信号进行去噪,可以将与周期至周期差值相关联的大于+/-5.0阈值的所有点标识为噪声点。根据某些实施例,然后可以将原始信号中用于计算周期至周期的差的两个点标识为噪声点。可替代地,可以将点中的仅一个(例如,用于计算该差的第一点或第二点)标识为噪声点。
图11中的第二面板1121示出了噪声点的集合(示出为空心圆圈),该噪声点是通过选择导致了大于+/-3的周期至周期差值的所有点而确定的。应当注意的是,实际穿越事件的正和负峰也将在该过程中被去除,但是这并不一定从测序数据中消除所有的穿越信号。如上面参考图8所讨论的,在大多数时间下,穿越事件在许多AC循环内存留,并且因此,将使用阈值技术来仅去除与穿越事件的最末端(very end)和穿越事件的最开始(verybeginning)相关联的数据,这是因为它们是在周期至周期差信号中表现出较大值的仅有的点。在这些开始的峰和结束的峰之间的中间区域中,数据将在零周围波动,但实际上仍然与有用信号相对应,这是因为它包括穿越数据点,如在图8中所示的周期至周期数据中可以最好地看到的那样。
有利地,在正峰与负峰之间的穿越状态数据中的差数据幅度与开放通道中的差数据幅度相当,但是显著小于受一个或多个噪声源(如PTBN和FCN)影响的其他区域中的差数据幅度,如上面参考图9-10所描述的那样。因此,应用于差数据的阈值化过程可以在测序“真”信号值(穿越和开放通道点)与可能由一个或多个噪声源引起的假信号值(差数据中的其他较大幅度点)之间进行区分。一旦使用周期至周期阈值而标识了噪声点(第二面板中的空心圆圈),就可以将它们从原始信号中去除,从而得到如图11的第三面板1123中所示的经去噪的测序信号。可以看到的是,经去噪的信号比面板1119中所示的原始信号显著地更加干净,但是仍然包含位于就在大约255.9秒之前的清晰穿越信号1127。
尽管这里示出的示例仅应用了单组阈值,但是可以应用多组阈值以去除仅落入一个或多个阈值范围内的数据点。可替代地,可以应用自适应阈值,该自适应阈值在不同时间处使用不同的阈值,例如取决于数据本身的性质、以及是否存在某些噪声源。
如其他地方所描述,例如在题为“Formation and Calibration of NanoporeSequencing Cells”的美国专利申请No.15/632,190、题为“Normalization and BaselineShift Removal by Rotation in Added Data Dimensions”的美国临时专利申请No.62/591,099、以及题为“Period-to-Period Analysis of AC Signals from NanoporeSequencing”的美国专利申请No.15/628,353(它们的公开内容出于所有目的通过引用整体地并入本文)中,测序信号(在这种情况下是经去噪的测序信号)可以被馈送到下游以用于进一步处理(例如,经由卡尔曼滤波器等进行进一步过滤、或经由二维变换来进行进一步处理),并且可以在碱基测定处理中对该测序信号进行分析,以根据经去噪的测序信号的信号值来标识DNA序列。
B. 在经小波去噪的差数据上使用阈值来进行去噪
根据某些实施例,可以在其本身先前已经通过一些其他手段被去噪、过滤或平滑的周期至周期差信号上采用上面描述的阈值化过程。任何去噪/过滤/平滑过程都可以用于以这种方式来对差信号进行预处理。根据某些实施例,由于周期至周期差信号中的穿越事件的形状,采用哈尔母小波的小波去噪过程可以用于有效地对信号进行去噪。图12C示出了前六个哈尔小波的示例,并且还图示出这种形式的小波与周期至周期差信号内的穿越事件非常相似(即,小波的基本形状包括正和负的方形脉冲,类似于周期至周期差信号中的穿越事件)。
小波去噪的过程可以包括三个步骤。首先,执行对噪声信号的多级离散小波分解,以针对分解的每个级别j而获得小波细节系数集合。例如,5级分解将具有5个细节系数集合。更具体地,离散小波分解可以被解释为针对给定母小波
Figure 947185DEST_PATH_IMAGE015
来计算子小波的离散集合的小波系数,其中子小波是通过对母小波以2的幂进行尺度缩放以及进行移位来生成的。因此,针对每个级别j,子小波集合为:
Figure 724648DEST_PATH_IMAGE016
其中j被称为尺度或级别参数且k是移位参数,并且两者为整数。使用由等式(4)定义的子小波集合,可以通过将具有长度2N的信号
Figure 205308DEST_PATH_IMAGE017
投影到根据以下积分而固定的子小波集合j上来找到针对该信号
Figure 497749DEST_PATH_IMAGE017
的细节系数
Figure 354847DEST_PATH_IMAGE018
(针对级别j):
Figure 252396DEST_PATH_IMAGE019
其中k的范围从0到2N-1。因此,取到级别L的多级离散小波分解的输出为L个细节系数集合
Figure 903957DEST_PATH_IMAGE020
。换句话说,针对每个级别j,通过将噪声信号
Figure 949273DEST_PATH_IMAGE017
与在点1、2j、22j...2N处采样的母小波的经扩张(dilate)、反射和归一化的版本进行卷积,来计算细节系数。因此,针对每个级别,如果噪声信号包括100,000个数据点,则将存在100,000个细节系数。
在确定了细节系数之后,根据一些阈值化规则来应用阈值化处理以修改每个级别的系数集合。小波去噪方案中使用的阈值化函数的特定形式可以变化,但是通常使用所谓的“硬”和“软”阈值化技术。两种阈值化方案将具有小于阈值的量值的所有细节系数设置为零。然而,硬和软阈值化在它们如何处理具有大于或等于阈值的量值的其余细节系数方面有所不同。在软阈值化处理中,通过从细节系数值中减去阈值来减小其余细节系数的量值。在硬阈值化中,其余细节系数保持不变。
因为经阈值化的细节系数最终被用作利用其来重构经过滤的信号的小波系数,所以阈值化过程的作用是有效地增加了与噪声数据信号非常相似的小波函数的重构信号方面的相对重要性,但是丢弃或不重视与该数据点处的噪声信号不相似的小波函数。
一旦计算出经阈值化的细节系数,就使用该经阈值化的系数通过反向小波变换来重构经去噪的信号。该重构的信号提供了经过滤的数据信号,该经过滤的数据信号具有较少的噪声,但是仍保留了信号高频内容。
许多基于小波的信号处理库包括小波去噪函数,该小波去噪函数可以通过实现采用噪声信号和一组参数作为输入并且输出经小波去噪的信号的函数,来简化多步骤的去噪过程。一个这种示例是在Matlab科学计算平台内可用的函数“wden”。该函数采用若干个参数作为输入,其中该函数采取形式wden(X,TPTR,SORH,SCAL,N,'wname')。X是噪声信号,TPTR是包含阈值选择规则(例如,SURE阈值化、通用阈值化、最小阈值化等)的字符向量,SORH是设置将被应用的阈值化类型(软或硬阈值化)的参数,SCAL是针对是否使用乘法阈值重新缩放的选项,参数“N”定义了多级离散小波分解的级别,并且最后,'wname’是将用于分解和重组的小波的名称(例如,各种Daubechies小波、哈尔小波、Coiflets、Symlets等)。可以使用其他类似的小波包,诸如在Python“pywt”库中找到的小波包等。仅仅为了说明的目的而在本文中提供了以上内容,并且在不脱离本公开的范围的情况下可以采用任何小波去噪过程。
图12A-12B示出了根据某些实施例的在利用“硬”阈值化的情况下使用所谓的“通用阈值”来进行5级哈尔小波去噪的结果。所谓的“通用阈值”
Figure 16587DEST_PATH_IMAGE021
是针对每个级别L而定义的,并且由以下等式给出:
Figure 565380DEST_PATH_IMAGE022
其中
Figure 591104DEST_PATH_IMAGE023
是针对给定级别的噪声的标准偏差,并且n是样本大小。
使用作为分解的结果而提供的小波系数来估计标准偏差通常是有用的,而不是直接计算标准偏差。更具体地,对于小波分解而言,可以根据小波系数的绝对值的中位数(MAD)来估计噪声的标准偏差
Figure 858138DEST_PATH_IMAGE023
,如下所示:
Figure 57038DEST_PATH_IMAGE024
使用“通用阈值”的理由是,它去除了小于样本大小n的假定独立且均匀分布(i.i.d)的正态噪声序列的预期最大值的所有小波系数,并且因此从信号与噪声(signal-to-noise)的角度来看是最佳的。
图12A示出了原始周期至周期差信号1203和经哈尔小波去噪的周期至周期差信号1205之间的比较的一个示例。如从该比较可以看出的,哈尔小波去噪有效地去除了原始周期至周期差信号的低幅度部分,并且保留了高幅度部分中的非平凡的(nontrivial)一小部分,从而提供了基本的周期至周期信号,该基本的周期至周期信号可以使用上面参考图11所描述的阈值化过程来提供改进的噪声点标识。例如,如图12B中所示,在使用小波方法对周期至周期差信号本身进行去噪之后,可以通过以与上面参考图11描述的方式相同的方式应用一个或多个阈值1209和1211,来从该经小波去噪的周期至周期信号中确定噪声点集合。
图13是图示了根据某些实施例的使用测序单元的示例方法的流程图。更具体地,图13图示了根据一些实施例的使用来自纳米孔测序的AC信号的周期至周期分析来对测序信号进行去噪的方法。
在步骤1310中,跨测序单元的纳米孔来施加交流信号(在本文中也被称为“AC信号”)。这种AC信号可以是由AC信号发生器提供的方波,该AC信号发生器类似于上面参考图4描述的AC电压源420(在本文中也被称为AC“信号发生器”)。在一些实施例中,AC信号可以具有多个循环的长度,其中交流信号的每个循环包括:第一部分(在本文中也被称为“亮模式”或“亮周期”)和第二部分(在本文中也称被为“暗模式”或“暗周期”)。第二部分的电压水平与第一部分的电压水平相比是参考电压的相对面(opposite)(在图5中所示的实施例中,VLIQ高于或低于VPRE)。如上面参考图1-2所描述的,在一些实施例中,纳米孔被配置成接收连接到核苷酸的标签,从而产生穿越事件。
在步骤1320中,如上面参考图4所描述的,例如由ADC 410来获取第一电压数据集合(在本文中也被称为“未移位的电压数据”或“原始电压数据”)。在一些实施例中,在交流信号的多个循环的第一部分(例如,亮周期)期间获取第一电压数据集合。第一电压数据集合的示例包括图5的亮周期520中所示的数据点、以及还有如图7-8中所示的被表征为在“B”周期内的所有点。如图7-8中所示,第一电压数据集合可以包括在AC信号的多个循环上获取的电压数据点。如上所描述,电压数据对应于(即,取决于)纳米孔在不同时间处的电阻值,其中当标签被接收在纳米孔内时,纳米孔的电阻改变。
在步骤1330中,例如由上面在图4中所示的数字处理器430来从所获取的原始电压数据中确定时移的电压数据集合。如上所讨论,移位数据的示例在图7-8中示出。在一些实施例中,原始的电压数据集合和移位的电压数据集合的数据点的每个循环包括指定数量的数据点,原始的未移位数据可以在亮周期内包括15个数据点,并且移位数据可以在亮周期内包括对应的15个数据点。因为移位数据相对于未移位数据是时移的,所以移位数据的数据点和未移位数据的数据点来自AC信号的不同循环,如上所讨论的那样,例如参考上面的图7-8。
在步骤1340中,例如由上面在图4中所示的数字处理器430、通过计算未移位的电压数据集合的数据点与移位的电压数据集合的对应数据点之间的差来计算差数据。在一些示例中,对应数据点在相应的循环中具有相同的位置,但是可能存在于不同的循环中。例如,针对源自于未移位数据的循环1的未移位的数据点和源自于未移位数据的循环2的移位的数据点,可以按以下方式来计算差数据:可以通过从循环2的第一点中减去来自循环1的第一点来计算第一差数据点,可以通过从循环2的第二点中减去来自循环1的第二点来计算第二差数据点,并且以此类推。受益于本公开的本领域普通技术人员将领会的是,存在许多不同的方式来执行该差,并且上述单点方法仅仅意味着许多示例当中的一个示例。例如,在不脱离本公开的范围的情况下,可以在相减之前对来自每个循环的多个数据点进行平均或过滤,或者可以基于最近相邻者相减、次最近(next nearest)相邻者相减等等来计算该差。
可选地,可以例如通过过滤、平滑和/或去噪来进一步处理差数据。如上所描述,一旦在步骤1340中计算出差数据,就可以使用小波去噪技术来生成经去噪的差数据。该经去噪的差数据可以被馈送到下面的步骤1350,但是,还可选地,可以对经去噪的差信号进行倒转(invert)以恢复对应的经过滤、平滑或去噪的电压数据集合,而无需如下面参考步骤1350所描述的那样将附加阈值应用于该数据。为了根据经去噪的差数据来重新计算经去噪的电压数据集合,可能有必要在原始电压数据与时移电压数据之间使用和(sum)信号。例如,如果A是原始电压数据,而B是时移电压数据,则和信号S可以写为:
Figure 460337DEST_PATH_IMAGE025
并且差信号D可以写为:
Figure 609295DEST_PATH_IMAGE026
然后,可以分别通过计算S+D或S-D来恢复A或B。因此,在一些实施例中,和信号以及差信号两者可以被存储在存储器中,并且稍后被用于根据经去噪的差数据来重建经去噪的电压数据集合。
在步骤1350中,标识多个噪声点(使用原始差数据或使用经去噪的差数据)。该标识可以由数字处理器(例如,由数字处理器430)来实现,该数字处理器被编程为标识大于一个或多个阈值的差数据点集合。例如,在图11中,面板1121将所标识的噪声点集合示为空心圆圈。这些噪声点被确定为是与大于+/-5的差数据点相关联的数据点。
在步骤1360中,通过从第一电压数据集合中去除噪声点来生成经去噪的电压数据。例如,在其中根据第10个与第20个电压数据点的差而计算出大于5的差数据点的情况下,可以在最终经去噪的数据中去除第10个和第20个数据点两者。可替代地,仅去除第10个点或第20个点。
根据某些实施例,经去噪的数据可以用于许多不同的目的。例如,可以对数据进行进一步处理以去除基线偏移和/或增益漂移,并且可以对其进行归一化,并且然后将其用于碱基测定,如美国专利申请No.15/632,190、美国临时专利申请No.62/591,099、以及美国专利申请No.15/669,207中所描述的那样,这些专利申请出于所有目的通过引用被整体地并入本文。在一些实施例中,可以由信号处理系统使用经去噪数据中的一个或多个数据点来标识一个或多个穿越事件,并且基于它们的水平,该系统可以确定在测序单元中被并入到核酸中的(一个或多个)核苷酸。
另外,经去噪的数据可以用于计算另一个循环的周期至周期差信号。在这种情况下,进行数据插补过程,其中,在计算第二个周期至周期的差之前,用一个或多个替代值来代替已经被去除的噪声数据。例如,可以用在两个相邻值之间中间的内插值来代替丢失的数据,或者可以用零来代替丢失的数据。如本领域普通技术人员在受益于本公开的情况下将领会的,可以采用许多不同的数据插补方法。在某些情况下,可以选择不会使用于碱基测定的测序信号直方图中的峰值显著地移位的插补方法。
V. 结果
图14A-16D示出了使用本文中描述的去噪技术的样本数据。更具体地,图14A-16D示出了可以如何通过在原始周期至周期差数据上使用阈值来确定噪声点从而对测序信号进行去噪(在该示例中没有采用小波去噪的预处理步骤)。
每个图示出了一组三个不同的标绘图。顶部标绘图示出了原始测序信号,中间标绘图示出了经去噪的信号,并且底部标绘图示出了被去除的噪声点,这是因为这些点具有比阈值更大的周期至周期差信号。图14A以最大阈值而开始,并且该阈值随着每个随后的图而减小。每个图以相同的信号值集合而开始,并且从标绘图到标绘图的唯一差异是阈值选择中的改变,该阈值用于根据周期至周期差信号来确定噪声点。
图14A示出了使用+/-31 ADC计数的相对大的阈值来进行去噪的效果。如从图14的底部标绘图可以推断的,很少的点具有大于31的周期至周期的差。仅仅去除了出现在t=3.75s附近的噪声点1401,其表示总数据的仅0.006%。因此,可以认为阈值31太高以致于无法有效地对信号进行去噪。
图14B示出了使用+/-25 ADC计数的略微较低的阈值来进行去噪的效果。如从图14B的底部标绘图可以看出的,有两个不同的噪声点群组。有利地,这些噪声点不在ADC计数中随机分布,而是群组1403仅仅在约160的ADC值以下居中,并且群组1405仅仅在100 ADC计数以上居中。这些数据点在这两个ADC值周围群集,这是因为它们是由公共噪声源PTBN引起的。PTBM噪声信号的一部分可以在每个图的顶部标绘图中看到,作为模糊的点线(例如,线1407),这些线延伸穿过了似乎该采集的整个长度。在图14B的底部标绘图中所示的、以及从中间标绘图中所示的经去噪的信号中去除的噪声数据点的数量表示总数据的仅0.197%。
图14C示出了使用+/-21 ADC计数的稍微较低的阈值来进行去噪的效果。如从图14C的底部标绘图可以看出的,存在于图14B中的两个不同的噪声点群组仍然存在,并且似乎拥有甚至更多的点。在图14C的底部标绘图中所示的、以及从中间标绘图中所示的经去噪的信号中去除的噪声数据点的数量表示总数据的仅0.795%。该阈值似乎仍然不足够低以完全去除PTBN,这是因为PTBN集群1409在示出了经去噪数据的中间标绘图中仍然可见。
图14D示出了使用+/-15 ADC计数的甚至更低的阈值来进行去噪的效果。在图14C的底部标绘图中所示的、以及从中间标绘图中所示的经去噪的信号中去除的噪声数据点的数量现在表示总数据的仅2.263%。在这种情况下,似乎从图14D的中间标绘图中所示的经去噪的信号中完全去除了PTBN集群。
图15A-15D示出了+/-11、+/-9、+/-7和+/-5的逐渐更低的阈值的效果,这些阈值分别去除了数据的2.964%、3.292%、3.695%和4.291%。即使在+/-7的相对低的阈值下,去噪似乎也未使开放通道或穿越通道数据降级,即使在经去噪的信号中也是如此。
图16A-16D示出了+/-4、+/-3、+/-2和+/-1的逐渐更低的阈值的效果,这些阈值分别去除了数据的4.735%、5.53%、9.792%和38.722%。值得注意的是,仅2的阈值仍保留了大约90%的数据,这意味着90%的差数据点具有小于或等于2的值。直到将阈值设置为最小值1,该方法才开始去除大量数据,并且即使这样,图16D中所示的数据也证明了:针对该示例,超过60%的差数据具有+/-1和0的值(针对如此低的阈值的仅有的可能ADC点)。这种发现意味着:该技术可以有效地去除噪声点,而不会显著影响开放通道和穿越通道数据。实际上,即使针对图16D中所示的+/-1情况,示出了清洁信号的中间标绘图也似乎具有相对无噪声的测序信号,其中穿越事件的群集(例如,群集1603)在开放通道基线下方清晰可见。
VI. 计算机系统
本文中提到的任何计算机系统都可以利用任何合适数量的子系统。这种子系统的示例在图17中的计算机系统1710中示出。在一些实施例中,计算机系统包括单个计算机装置,其中子系统可以是计算机装置的组件。在其他实施例中,计算机系统可以包括多个计算机装置,每个计算机装置是具有内部组件的子系统。计算机系统可以包括台式计算机和膝上型计算机、平板电脑、移动电话和其他移动设备。
图17中所示的子系统经由系统总线1775而互连。示出了附加的子系统,诸如打印机1774、键盘1778、(一个或多个)存储设备1779、耦合到显示适配器1782的监视器1776、以及其他。耦合到I/O控制器1771的外围设备和输入/输出(I/O)设备可以通过本领域中已知的任何数量的部件(诸如,输入/输出(I/O)端口1777(例如,USB、FireWire ®))而连接到计算机系统。例如,I/O端口1777或外部接口81(例如,以太网、Wi-Fi等)可以用于将计算机系统1710连接到诸如互联网之类的广域网、鼠标输入设备或扫描仪。经由系统总线1775的互连件允许中央处理器1773与每个子系统进行通信,并控制来自系统存储器1772或(一个或多个)存储设备1779(例如,诸如硬盘之类的固定盘、或光盘)的多个指令的执行、以及子系统之间的信息交换。系统存储器1772和/或(一个或多个)存储设备1779可以体现计算机可读介质。另一个子系统是数据收集设备1785,诸如相机、麦克风、加速度计等。本文中提到的任何数据都可以从一个组件输出到另一组件,并且可以输出给用户。
计算机系统可以包括多个相同的组件或子系统,它们例如通过外部接口1781或通过内部接口而连接在一起。在一些实施例中,计算机系统、子系统或装置可以通过网络进行通信。在这种实例中,一个计算机可以被视为客户端,并且另一个计算机可以被视为服务器,其中它们各自可以是相同计算机系统的一部分。客户端和服务器可以各自包含多个系统、子系统或组件。
可以以模块化或集成方式利用一般可编程的处理器使用计算机软件、和/或使用硬件(例如,专用集成电路或现场可编程门阵列)以控制逻辑的形式来实现实施例的各方面。如本文中所使用的,处理器包括单核处理器、在同一集成芯片上的多核处理器、或在单个电路板上或联网的多个处理单元。基于本文中提供的公开和教导,本领域普通技术人员将知道并领会使用硬件以及硬件和软件的组合来实现本发明的实施例的其他方式和/或方法。
本申请中描述的任何软件组件或功能可以被实现为软件代码,该软件代码将由处理器使用任何合适的计算机语言(诸如例如Java、C、C++、C#、Objective-C、Swift)或使用例如常规或面向对象的技术的脚本语言(诸如Perl或Python)来执行。可以将软件代码作为一系列指令或命令存储在计算机可读介质上,以用于存储和/或传输。合适的非暂时性计算机可读介质可以包括:随机存取存储器(RAM)、只读存储器(ROM)、诸如硬盘驱动器或软盘之类的磁性介质、或者诸如光盘(CD)或DVD(数字通用盘)之类的光学介质、闪存等。计算机可读介质可以是这种存储或传输设备的任何组合。
还可以使用载波信号对这种程序进行编码和传输,该载波信号被适配成用于经由符合各种协议(包括互联网)的有线、光学和/或无线网络进行传输。由此,可以使用利用这种程序编码的数据信号来创建计算机可读介质。可以将利用程序代码编码的计算机可读介质与兼容设备封装在一起,或者与其他设备分离地提供(例如,经由互联网下载)。任何这种计算机可读介质可以驻留在单个计算机产品(例如,硬盘驱动器、CD或整个计算机系统)上或单个计算机产品内,并且可以存在于系统或网络内的不同计算机产品上或该不同计算机产品内。计算机系统可以包括监视器、打印机或其他合适的显示器,以用于向用户提供本文中提到的任何结果。
可以利用包括一个或多个处理器的计算机系统来完全或部分地执行本文中描述的任何方法,该处理器可以被配置成执行步骤。因此,实施例可以涉及如下计算机系统:该计算机系统被配置成潜在地利用执行相应步骤或相应步骤群组的不同组件来执行本文中描述的任何方法的步骤。尽管作为经编号的步骤而呈现,但是本文中的方法步骤可以同时或以不同的次序来执行。附加地,这些步骤的一部分可以与来自其他方法的其他步骤的一部分一起使用。而且,步骤的全部或部分可以是可选的。附加地,可以利用用于执行这些步骤的模块、单元、电路或其他部件来执行任何方法的任何步骤。
在不脱离本发明实施例的精神和范围的情况下,可以以任何合适的方式来组合特定实施例的具体细节。然而,本发明的其他实施例可以涉及与每个单独方面有关的具体实施例、或者这些单独方面的具体组合。
除非相反地具体指示,否则对“一”、“一个”或“该”的引用旨在意指“一个或多个”。除非相反地具体指示,否则对“或”的使用旨在意指“包括性的或”,而不是“排他性的或”。对“第一”组件的参考不一定要求提供第二组件。此外,除非明确指出,否则对“第一”或“第二”组件的参考不会将所参考的组件限制到特定位置。

Claims (11)

1.一种用于信号处理的系统或仪器,包括:
测序单元,其包括纳米孔,纳米孔被配置成接收连接到核苷酸的标签,从而创建穿越事件;
信号发生器,其跨测序单元的纳米孔来施加交流信号,交流信号的每个循环包括第一部分和第二部分,其中第二部分的电压水平与第一部分的电压水平相比是参考电压的相对面;
模数转换器,其在交流信号的多个循环的第一部分期间获取第一电压数据集合,其中所述第一电压数据集合的每个数据点对应于纳米孔在不同时间处的电阻值,其中当标签被接收在纳米孔内时,纳米孔的电阻改变;以及
数字处理器,其被配置成:
从所述第一电压数据集合来确定移位的电压数据集合,其中所述第一电压数据集合和所述移位的电压数据集合的数据点的每个循环包括指定数量的数据点;
通过计算所述第一电压数据集合的数据点与所述移位的电压数据集合的对应数据点之间的差来计算差数据值;
将多个噪声数据点标识为所述差数据中具有大于第一阈值的值的数据点;
将多个噪声数据点标识为具有大于第一阈值的差数据值的数据点;
以及
通过从所述第一电压数据集合中去除所述多个噪声数据点来确定经去噪的第一电压数据集合。
2.一种使用测序单元的方法,所述方法包括:
跨测序单元的纳米孔来施加交流信号,纳米孔被配置成接收连接到核苷酸的标签,从而创建穿越事件,交流信号的每个循环包括第一部分和第二部分,其中第二部分的电压水平与第一部分的电压水平相比是参考电压的相对面;
在交流信号的多个循环的第一部分期间获取第一电压数据集合,其中所述第一电压数据集合的每个数据点对应于纳米孔在不同时间处的电阻值,其中当标签被接收在纳米孔内时,纳米孔的电阻改变;
从所述第一电压数据集合来确定移位的电压数据集合,其中所述第一电压数据集合和所述移位的电压数据集合的数据点的每个循环包括指定数量的数据点;
通过计算所述第一电压数据集合的数据点与所述移位的电压数据集合的对应数据点之间的差来计算差数据值;
将多个噪声数据点标识为具有大于第一阈值的差数据值的数据点;
以及
通过从所述第一电压数据集合中去除所述多个噪声数据点来确定经去噪的第一电压数据集合。
3.根据权利要求2所述的方法,进一步包括:
使用所述经去噪的第一电压数据集合中的一个或多个数据点来标识穿越事件;
确定穿越事件的水平;以及
使用所述水平来确定在测序单元中被并入到核酸中的核苷酸。
4.根据权利要求2所述的方法,其中标识所述多个噪声数据点进一步包括:标识具有小于第二阈值的差数据值的数据点。
5.根据权利要求2所述的方法,进一步包括:在标识所述多个噪声数据点之前过滤所述差数据。
6.根据权利要求5所述的方法,其中过滤所述差数据包括:计算经小波去噪的差数据。
7.根据权利要求6所述的方法,其中用于过滤所述差数据的小波是哈尔小波。
8.根据权利要求7所述的方法,其中标识所述多个噪声数据点包括:将所述多个噪声数据点标识为具有大于第一阈值的经小波去噪的差数据值的数据点。
9.一种计算机产品,其包括存储多个指令的计算机可读介质,所述多个指令用于控制计算机系统来执行上面的任何方法的操作。
10.一种用于信号处理的系统或仪器,包括:
根据权利要求9所述的计算机产品;以及
一个或多个处理器,其用于执行存储在计算机可读介质上的指令。
11.一种用于信号处理的系统或仪器,包括:
测序芯片,其包括多个测序单元,其中第一测序单元包括纳米孔,纳米孔被配置成接收连接到核苷酸的标签,从而创建穿越事件;
信号发生器,其跨第一测序单元的纳米孔来施加交流信号,交流信号的每个循环包括第一部分和第二部分,其中第二部分的电压水平与第一部分的电压水平相比是参考电压的相对面;
模数转换器,其在交流信号的多个循环的第一部分期间获取第一信号值数据集合,其中所述第一信号值数据集合的每个数据点对应于纳米孔在不同时间处的电阻值,其中当标签被接收在纳米孔内时,纳米孔的电阻改变;以及
一个或多个处理器,其被配置成执行上面的任何方法的操作。
CN201880083810.4A 2017-12-28 2018-12-19 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声 Active CN111512155B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762610932P 2017-12-28 2017-12-28
US62/610932 2017-12-28
PCT/EP2018/085734 WO2019129555A1 (en) 2017-12-28 2018-12-19 Measuring and removing noise in stochastic signals from a nanopore dna sequencing system driven by an alternating signal

Publications (2)

Publication Number Publication Date
CN111512155A CN111512155A (zh) 2020-08-07
CN111512155B true CN111512155B (zh) 2022-07-05

Family

ID=64899326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880083810.4A Active CN111512155B (zh) 2017-12-28 2018-12-19 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声

Country Status (5)

Country Link
US (2) US11531021B2 (zh)
EP (1) EP3732484B1 (zh)
JP (1) JP7038215B2 (zh)
CN (1) CN111512155B (zh)
WO (1) WO2019129555A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3146453A1 (en) * 2019-07-31 2021-02-04 Igor Constantin Ivanov Systems and methods for assessing a target molecule
CN111662971A (zh) * 2020-06-04 2020-09-15 成都万众壹芯生物科技有限公司 一种基因测序芯片的校正方法、装置
CN114111657B (zh) * 2021-11-11 2024-06-04 国网辽宁省电力有限公司检修分公司 一种均压电极结垢厚度检测系统及操作方法
CN116127288B (zh) * 2023-04-14 2023-09-15 南京邮电大学 基于独立成分分析的纳米孔传感信号噪声去除方法及装置
CN116881634B (zh) * 2023-09-06 2023-12-26 北京齐碳科技有限公司 用于清洗纳米孔信号数据的方法、设备和存储介质

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58223927A (ja) 1982-06-22 1983-12-26 Nec Corp デ−タ圧縮処理装置
US5853979A (en) 1995-06-30 1998-12-29 Visible Genetics Inc. Method and system for DNA sequence determination and mutation detection with reference to a standard
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
US6413792B1 (en) 2000-04-24 2002-07-02 Eagle Research Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US7039238B2 (en) 2000-12-01 2006-05-02 Sri International Data relationship model
CA2554741A1 (en) 2004-01-30 2005-08-11 National Institute Of Advanced Industrial Science And Technology Event sequencer
US7617054B2 (en) 2004-07-20 2009-11-10 Conexio 4 Pty Ltd Method and apparatus for analysing nucleic acid sequence
US7876250B2 (en) * 2006-03-31 2011-01-25 Nxp B.V. Calibration circuit and method for A/D converter
EP2049983A2 (en) 2006-08-07 2009-04-22 Yeda Research And Development Co. Ltd. Data similarity and importance using local and global evidence scores
US7731826B2 (en) 2006-08-17 2010-06-08 Electronic Bio Sciences, Llc Controlled translocation of a polymer in an electrolytic sensing system
CN101680873B (zh) 2007-04-04 2015-11-25 加利福尼亚大学董事会 使用纳米孔的组合物、设备、系统和方法
EP2155855B1 (en) 2007-06-06 2016-10-12 Pacific Biosciences of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US8703422B2 (en) 2007-06-06 2014-04-22 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US8126235B2 (en) 2008-04-04 2012-02-28 Massachusetts Institute Of Technology Methods and apparatus for automated base-calling on multiple DNA strands
US20100122907A1 (en) 2008-05-06 2010-05-20 Government of the United States of America, Single molecule mass or size spectrometry in solution using a solitary nanopore
WO2010024894A1 (en) 2008-08-26 2010-03-04 23Andme, Inc. Processing data from genotyping chips
US9218451B2 (en) 2008-08-26 2015-12-22 23Andme, Inc. Processing data from genotyping chips
JP2010066012A (ja) * 2008-09-08 2010-03-25 Nikka Densoku Kk 密封容器のリーク検査方法及びその装置
WO2010059235A2 (en) 2008-11-20 2010-05-27 Pacific Biosciences Of California, Inc. Algorithms for sequence determination
US8986928B2 (en) 2009-04-10 2015-03-24 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
JP2010256268A (ja) * 2009-04-28 2010-11-11 Yazaki Corp ガス分析装置
CA2995178C (en) 2010-02-08 2023-09-12 Genia Technologies, Inc. Method and system for forming a nanopore in a lipid bilayer
EP4268944A3 (en) 2010-02-23 2024-03-20 University of Washington Analyte sequencing with nanopores
US9165109B2 (en) 2010-02-24 2015-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
WO2011108540A1 (ja) 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置
WO2012009578A2 (en) 2010-07-14 2012-01-19 The Curators Of The University Of Missouri Nanopore-facilitated single molecule detection of nucleic acids
US20140051068A1 (en) 2010-09-07 2014-02-20 The Regents Of The University Of California Control of dna movement in a nanopore at one nucleotide precision by a processive enzyme
US20130060482A1 (en) 2010-12-30 2013-03-07 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
WO2012092515A2 (en) 2010-12-30 2012-07-05 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
US20130090860A1 (en) 2010-12-30 2013-04-11 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
WO2013041878A1 (en) 2011-09-23 2013-03-28 Oxford Nanopore Technologies Limited Analysis of a polymer comprising polymer units
CN102621214B (zh) 2012-03-13 2014-10-29 美国哈佛大学 一种基于固态纳米孔对核酸分子进行减速及单分子捕获的方法
WO2013154999A2 (en) 2012-04-09 2013-10-17 The Trustees Of Columbia University In The City Of New York Method of preparation of nanopore and uses thereof
US20130274148A1 (en) 2012-04-11 2013-10-17 Illumina, Inc. Portable genetic detection and analysis system and method
US20150119259A1 (en) * 2012-06-20 2015-04-30 Jingyue Ju Nucleic acid sequencing by nanopore detection of tag molecules
CN102899243B (zh) 2012-09-21 2014-08-20 清华大学 基于石墨烯纳米孔-微腔-固态纳米孔结构的dna测序装置及方法
US9605309B2 (en) 2012-11-09 2017-03-28 Genia Technologies, Inc. Nucleic acid sequencing using tags
JP6120437B2 (ja) 2013-03-08 2017-04-26 国立大学法人大阪大学 物質の識別方法
WO2014165286A1 (en) 2013-03-12 2014-10-09 Iowa State University Research Foundation, Inc. Systems and methods for recognizing, classifying, recalling and analyzing information utilizing ssm sequence models
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
EP3084002A4 (en) 2013-12-16 2017-08-23 Complete Genomics, Inc. Basecaller for dna sequencing using machine learning
EP3120277A1 (en) 2014-03-21 2017-01-25 Oxford Nanopore Technologies Limited Analysis of a polymer from multi-dimensional measurements
GB201408652D0 (en) 2014-05-15 2014-07-02 Oxford Nanopore Tech Ltd Model adjustment during analysis of a polymer from nanopore measurements
US9708655B2 (en) 2014-06-03 2017-07-18 Illumina, Inc. Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
KR20220165282A (ko) 2014-08-08 2022-12-14 퀀텀-에스아이 인코포레이티드 분자들을 프로빙, 검출 및 분석하기 위한 광학계 및 검정 칩
US20160110499A1 (en) 2014-10-21 2016-04-21 Life Technologies Corporation Methods, systems, and computer-readable media for blind deconvolution dephasing of nucleic acid sequencing data
US10060903B2 (en) * 2014-11-05 2018-08-28 Genia Technologies, Inc. Exporting measurements of nanopore arrays
US9863904B2 (en) * 2014-12-19 2018-01-09 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US9557294B2 (en) 2014-12-19 2017-01-31 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US10935512B2 (en) * 2015-09-24 2021-03-02 Roche Sequencing Solutions, Inc. Encoding state change of nanopore to reduce data size

Also Published As

Publication number Publication date
JP2021508822A (ja) 2021-03-11
EP3732484B1 (en) 2023-06-07
EP3732484A1 (en) 2020-11-04
US11531021B2 (en) 2022-12-20
US20230133346A1 (en) 2023-05-04
WO2019129555A1 (en) 2019-07-04
CN111512155A (zh) 2020-08-07
US20210018486A1 (en) 2021-01-21
JP7038215B2 (ja) 2022-03-17

Similar Documents

Publication Publication Date Title
CN111512155B (zh) 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声
US11788132B2 (en) Basecalling for stochastic sequencing processes
US11892444B2 (en) Formation and calibration of nanopore sequencing cells
CN109313177B (zh) 来自纳米孔测序的交流信号的周期至周期分析
CN112292462A (zh) 生化传感器阵列中的多路复用模拟部件
US20230279488A1 (en) Normalization and baseline shift removal by rotation in added data dimensions
EP3700670A1 (en) Removing and reinserting protein nanopores in a membrane using osmotic imbalance
CN113260449A (zh) 用于膜中自限性蛋白质孔插入的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant