CN109313177B - 来自纳米孔测序的交流信号的周期至周期分析 - Google Patents

来自纳米孔测序的交流信号的周期至周期分析 Download PDF

Info

Publication number
CN109313177B
CN109313177B CN201780039601.5A CN201780039601A CN109313177B CN 109313177 B CN109313177 B CN 109313177B CN 201780039601 A CN201780039601 A CN 201780039601A CN 109313177 B CN109313177 B CN 109313177B
Authority
CN
China
Prior art keywords
data
voltage
nanopore
voltage data
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780039601.5A
Other languages
English (en)
Other versions
CN109313177A (zh
Inventor
K.巴贾杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN109313177A publication Critical patent/CN109313177A/zh
Application granted granted Critical
Publication of CN109313177B publication Critical patent/CN109313177B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • G01N33/487Physical analysis of biological material of liquid biological material
    • G01N33/48707Physical analysis of biological material of liquid biological material by electrical means
    • G01N33/48721Investigating individual macromolecules, e.g. by translocation through nanopores
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/26Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
    • G01N27/28Electrolytic cell components
    • G01N27/30Electrodes, e.g. test electrodes; Half-cells
    • G01N27/327Biochemical electrodes, e.g. electrical or mechanical details for in vitro measurements
    • G01N27/3275Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction
    • G01N27/3278Sensing specific biomolecules, e.g. nucleic acid strands, based on an electrode surface reaction involving nanosized elements, e.g. nanogaps or nanoparticles

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Nanotechnology (AREA)
  • Zoology (AREA)
  • General Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Electrochemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

跨越测序单元的纳米孔施加交流信号,所述纳米孔被配置为接收与核苷酸连接的标记,从而产生穿越事件。在交流信号的多个循环的第一部分期间获取第一组电压数据。第一组电压数据的每个数据点对应于纳米孔在不同时间的电阻值,其中当纳米孔内接收到标记时,纳米孔的电阻发生变化。从第一组电压数据确定移位组电压数据,并且通过计算第一组电压数据的数据点与移位组电压数据的相应数据点之间的差异来计算差异数据。可以基于差异数据来识别穿越事件。

Description

来自纳米孔测序的交流信号的周期至周期分析
背景
具有内径在1纳米级别的孔大小的纳米孔膜设备已显示了在快速核苷酸测序中的前景。当在浸没在导电流体中的纳米孔上施加电压信号时,电场可以使导电流体中的离子移动通过纳米孔。导电流体中的离子通过纳米孔的运动可以导致小的离子电流。施加的电压还可以将待测序的分子移入纳米孔中、通过纳米孔或从纳米孔中移出。离子电流(或相应的电压)的水平取决于纳米孔的尺寸和化学结构以及已经移动到纳米孔中的特定分子。
作为移动通过纳米孔的DNA分子(或待测序的其它核酸分子)的替代,分子(例如,添加到DNA链的核苷酸)可包括特定大小和/或结构的特定标记。可以测量包括纳米孔的电路(例如,在积分电容器处)中的离子电流或电压作为测量对应于分子的纳米孔的电阻的方式,从而允许检测纳米孔中的特定分子,和特定核苷酸在核酸的特定位置。
基于纳米孔的测序芯片可以用于DNA测序。基于纳米孔的测序芯片可以包含配置为阵列的大量传感器单元。例如,100万个单元的阵列可以包括1000行乘以1000列的单元。
由于制造的可变性,测量的电压可以在芯片之间以及同一芯片的单元之间变化。因此,可能难以确定正确的分子,其可能是或对应于单元中的特定核酸或其它聚合物中的正确的核苷酸。
因此,需要用于测序的改进的技术。
概述
实施方案可以提供用于信号处理和碱基识别(calling)的系统、方法、仪器和装置,用于使用施加到纳米孔的AC波形进行纳米孔测序的初步分析。可以使用差分技术。
在一些实施方案中,差分格式(differencing scheme)可以是基于1个周期或基于n个周期。还可以制作多种差分格式以及时定位事件,其中事件可以对应于添加到核酸中的核苷酸,如可以用附着于移动到纳米孔中的核苷酸的标记检测。可以获得诸如穿越时间(time-to-thread,TTT)、停留时间等不同的度量。
其它实施方案涉及与本文描述的方法相关联的系统、便携式消费者设备和计算机可读介质。
参考以下详细描述和附图,可以更好地理解本发明实施方案的性质和优点。
附图简述
图1是具有纳米孔单元阵列的纳米孔传感器芯片的实施方案的顶视图。
图2示出了可用于表征多核苷酸或多肽的纳米孔传感器芯片中的纳米孔单元的实施方案。
图3示出了使用基于纳米孔的合成测序(Nano-SBS)技术进行核苷酸测序的纳米孔单元的实施方案。
图4示出了纳米孔单元中的电路的实施方案。
图5示出了根据本发明的某些方面,在 AC循环的亮周期和暗周期期间从纳米孔单元捕获的示例数据点。
图6示出了根据本发明的某些方面的示出电压数据的周期性的样本数据。
图7示出了根据本发明的某些方面的用于确定差异数据的电压数据的移位,其中电压数据具有一个穿越事件。
图8示出了根据本发明的某些方面的用于确定差异数据的电压数据的移位,其中电压数据具有三个穿越事件。
图9示出了根据本发明的某些方面的示出电压数据的时移的示例的示意图。
图10示出了根据本发明的某些方面的可以根据差异数据计算的参数的示例。
图11是根据本发明的某些方面的说明来自纳米孔测序的AC信号的周期至周期分析的实例方法的流程图。
图12A和12B示出了根据本发明的某些方面的示出了处理的差异数据和原始ADC数据(示出事件)的比较的样本数据。
图13A和13 B示出了根据本发明的某些方面的样本数据,其示出了来自所提出的方法的处理信号与示出穿越事件的原始ADC信号的比较。
图14A和14B示出了根据本发明的某些方面的样本数据,其示出了来自所提出的方法的处理信号与示出穿越事件的原始ADC信号的比较。
图15示出了根据本发明的某些方面的可与系统和方法一起使用的示例计算机系统的框图。
术语
除非另有定义,否则本文使用的技术和科学术语具有如由本领域普通技术人员通常理解相同的含义。与本文描述的那些类似或等同的方法、装置和材料可用于所公开技术的实践中。提供以下术语是为了便于理解经常使用的某些术语,并不意味着限制本发明的范围。本文使用的缩写在化学和生物学领域中具有其常规含义。
“核酸”可以指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及其聚合物。该术语可以包括含有已知核苷酸类似物或修饰的骨架残基或键合的核酸,其是合成的、天然存在的和非天然存在的,其具有与参考核酸相似的结合特性,并且其以类似于参考核苷酸的方式代谢。此类类似物的实例可包括但不限于硫代磷酸酯、亚磷酰胺、甲基膦酸酯、手性-甲基膦酸酯、2-O-甲基核糖核苷酸、肽-核酸(PNA)。除非另有说明,否则特定核酸序列也隐含地包括其保守修饰的变体(例如,简并密码子取代)和互补序列,以及明确指出的序列。具体地,简并密码子取代可以通过产生其中一个或多个选定(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(BatzerNucleic Acid Res.19:5081(1991);OhtsukaJ.Biol.Chem.260:2605-2608(1985);RossoliniMol. Cell. Probes 8:91-98(1994))。术语核酸可与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换使用。
术语“模板”可以指单链核酸分子,其被复制到用于DNA合成的DNA核苷酸的互补链中。在一些情况下,模板可以指在mRNA合成期间复制的DNA序列。
术语“引物”可以指提供DNA合成起点的短核酸序列。催化DNA合成的酶,例如DNA聚合酶,可以在引物中添加新的核苷酸用于DNA复制。
聚合酶”是指进行多核苷酸的模板指导合成的酶。该术语包括全长多肽和具有聚合酶活性的结构域。DNA聚合酶是本领域技术人员公知的,包括但不限于从激烈火球菌(Pyrococcus furiosus)、海滨嗜热球菌(Thermococcus litoralis)和海栖热袍菌(Thermotoga maritime)分离或衍生的DNA聚合酶,或其修饰形式。它们包括DNA依赖性聚合酶和RNA依赖性聚合酶,例如逆转录酶。已知至少五个DNA依赖性DNA聚合酶家族,尽管大多数属于A、B和C家族。各家族之间几乎没有或没有序列相似性。大多数家族A聚合酶是单链蛋白,其可以包含多种酶功能,包括聚合酶、3'至5'核酸外切酶活性和5'至3'核酸外切酶活性。家族B聚合酶通常具有单个催化结构域(其具有聚合酶和3'至5'核酸外切酶活性)以及辅助因子。家族C聚合酶通常是具有聚合和3'至5'核酸外切酶活性的多亚基蛋白质。在大肠杆菌(E. coli)中,已发现三种类型的DNA聚合酶,DNA聚合酶I(家族A)、II(家族B)和III(家族C)。在真核细胞中,三种不同的家族B聚合酶——DNA聚合酶α、δ和ε与核复制有关,且家族A聚合酶——聚合酶γ用于线粒体DNA复制。其它类型的DNA聚合酶包括噬菌体聚合酶。类似地,RNA聚合酶通常包括真核RNA聚合酶I、II和III,以及细菌RNA聚合酶以及噬菌体和病毒聚合酶。RNA聚合酶可以是DNA依赖性的和RNA依赖性的。
纳米孔”是指在膜中形成或以其它方式在膜中提供的孔、通道或通路。膜可以是有机膜,例如脂双层,或合成膜,例如由聚合物材料形成的膜。所述纳米孔可以被设置为邻近或接近感知电路或与感知电路偶联的电极(例如,互补金属氧化物半导体(CMOS)或场效应晶体管(FET)电路)。在某些实例中,纳米孔具有在0.1纳米(nm)至约1000nm的级别的特征宽度或直径。一些纳米孔是蛋白质。
除了表示天然存在的核糖核苷酸或脱氧核糖核苷酸单体以外,"核苷酸"还可以被理解为表示其有关的结构变体,包括衍生物和类似物,它们就在其中使用所述核苷酸的特定背景(例如,与互补碱基杂交)而言在功能上等同,除非上下文另外清楚地指出。
标记”是指可检测的部分,其可以是原子或分子,或原子或分子的集合。标记可以提供光学、电化学、磁性或静电(例如,电感、电容)特征(signature),该特征可以借助纳米孔检测。通常,当核苷酸与标记连接时,它被称为“标记的核苷酸”。标记可以通过磷酸酯部分与核苷酸连接。
如本文所用,术语“亮周期”通常可以指通过AC信号施加的电场将标记的核苷酸的标记强制进入纳米孔的时间段。术语“暗周期”通常可以指通过AC信号施加的电场将标记的核苷酸的标记推出纳米孔的时间段。AC循环可以包括亮周期和暗周期。在不同的实施方案中,施加到纳米孔单元以使纳米孔单元进入亮周期(或暗周期)的电压信号的极性可以是不同的。
详述
某些初步分析方法使用大量参数,其用于AC数据的信号处理(由施加交流电压产生)以及使用碱基识别,以用于通过纳米孔测序产生的处理数据,其中将AC信号施加到纳米孔。使用大量参数可能是缓慢的、有噪音的和非稳健的,这是因为具有大量参数,特别是当首次应用于新系统时。这种滤波还可以引入其自身的伪像(artifact)(取决于所使用的滤波器及其参数),可以放大噪音并将误差传播到碱基识别和比对。初步分析的性能(速度、灵敏度、准确度等)很重要。
在一些实施方案中,确定AC数据的循环的相应电压测量值之间的差异,并且分析差异数据以鉴定纳米孔中标记的穿越事件,其中标记对应于特定核苷酸。一些优点可以包括:它是简单的、快速的、稳健的(不需要很多或任何外部参数),不需要任何滤波,也可以在FPGA和GPU中容易地实施,并且可以成功消除大多数噪音(非ADC-噪音)。此外,随后的碱基识别可以在集成数据上完成,使其对噪音不太敏感。由于实施方案可以使用来自相邻或附近的周期(在本文中也称为局部邻域)的对应点的差分,所以实施方案可以适应于原始数据中的局部系统变化,例如,校正增益漂移基线偏移等。
I. 基于纳米孔的测序芯片
图1是具有纳米孔单元150的阵列140的纳米孔传感器芯片100的实施方案的顶视图。每个纳米孔单元150包括集成在纳米孔传感器芯片100的硅衬底上的控制电路。在一些实施方案中,侧壁136可以包括在阵列140中以分离多组纳米孔单元150,使得每个组可以接收不同的样品用于表征。每个纳米孔单元可用于测序核酸。在一些实施方案中,纳米孔传感器芯片100可包括盖板130。在一些实施方案中,纳米孔传感器芯片100还可以包括多个引脚110,用于与其它电路(例如计算机处理器)接口连接。
在一些实施方案中,纳米孔传感器芯片100可以包括在同一封装中的多个芯片,例如,多芯片模块(MCM)或系统级封装(SiP)。芯片可以包括例如存储器、处理器、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、数据转换器、高速I/O接口等。
在一些实施方案中,纳米孔传感器芯片100可以偶联到(例如,对接到)纳米芯片工作站120,其可以包括用于执行(例如,自动执行)本文公开的处理的各种实施方案的各种组件,包括例如分析物递送机构,例如用于递送脂质悬浮液或其它膜结构悬浮液、分析物溶液和/或其它液体、悬浮液或固体的吸量管、机器人臂、计算机处理器和/或存储器。可以在纳米孔单元150的阵列140上检测多个多核苷酸。在一些实施方案中,每个纳米孔单元150可以是可单独定位的(addressable)。
II. 纳米孔测序单元
纳米孔传感器芯片100中的纳米孔单元150可以以许多不同方式实施。例如,在一些实施方案中,不同大小和/或化学结构的标记可以连接到待测序的核酸分子中的不同核苷酸。在一些实施方案中,可以通过使不同聚合物标记的核苷酸与模板杂交来合成待测序核酸分子的模板的互补链。在一些实施方案中,核酸分子和附着的标记可以都穿过纳米孔,并且(因为附着至核苷酸的标记的特定大小和/或结构)穿过纳米孔的离子电流可以指示纳米孔中的核苷酸。在一些实施方案中,仅可将标记移动到纳米孔中。还可以有许多不同的方法来检测纳米孔中的不同标记。
A. 纳米孔测序单元结构
图2示出了可用于表征多核苷酸或多肽的纳米孔传感器芯片中的示例性纳米孔单元200(例如图1的纳米孔传感器芯片100中的纳米孔单元150)的实施方案。纳米孔单元200可包括由介电层201和204形成的孔205;膜,例如在孔205上形成的脂质双层214;和在脂质双层214上并通过脂质双层214与孔205分离的样品室215。孔205可以包含一定体积的电解质206,并且样品室215可以容纳包含纳米孔的本体电解质208,例如可溶性蛋白质纳米孔跨膜分子复合物(PNTMC)和感兴趣的分析物(例如,待测序的核酸分子)。
纳米孔单元200可包括位于孔205底部的工作电极202和设置在样品室215中的对电极210。信号源228可以在工作电极202和对电极210之间施加电压信号。可以通过由电压信号引起的电穿孔过程将单个纳米孔(例如,PNTMC)插入脂质双层214中,从而在脂质双层214中形成纳米孔216。阵列中的各个膜(例如,脂质双层214或其它膜结构)可以彼此既不化学连接也不电连接。因此,阵列中的每个纳米孔单元可以是独立的测序机,产生对与操作目标分析物起作用并调节通过其它不可渗透的脂质双层的离子电流的纳米孔相关的单个聚合物分子而言独特的数据。
如图2所示,纳米孔单元200可以形成在衬底230,例如硅衬底上。介电层201可以形成在衬底230上。用于形成介电层201的介电材料可包括例如玻璃、氧化物、氮化物等。用于控制电刺激和处理从纳米孔单元200检测的数据的电路222可以形成在衬底230上和/或介电层201内。例如,可以在介电层201中形成多个图案化金属层(例如,金属1至金属6),并且可以在衬底230上制造多个有源器件(例如,晶体管)。在一些实施方案中,将信号源228包括为电路222的一部分。电路222可以包括例如放大器、积分器、模拟-数字转换器、噪音滤波器、反馈控制逻辑和/或各种其它组件。电路222可以进一步偶联到偶联到存储器226的处理器224,其中处理器224可以分析测序数据以确定已经在阵列中测序的聚合物分子的序列。
工作电极202可以形成在介电层201上,并且可以形成孔205的底部的至少一部分。在一些实施方案中,工作电极202是金属电极。对于非法拉第传导,工作电极202可以由金属或其它耐腐蚀和氧化的材料制成,例如铂、金、氮化钛和石墨。例如,工作电极202可以是具有电镀铂的铂电极。在另一实例中,工作电极202可以是氮化钛(TiN)工作电极。工作电极202可以是多孔的,从而增加其表面积和与工作电极202相关的最终电容。因为纳米孔单元的工作电极可以独立于另一纳米孔单元的工作电极,所以在本发明中工作电极可以称为单元电极。
介电层204可以形成在介电层201上方。介电层204形成围绕孔205的壁。用于形成介电层204的介电材料可包括例如玻璃、氧化物、一氮化硅(SiN)、聚酰亚胺或其它合适的疏水性绝缘材料。介电层204的顶表面可以硅烷化。硅烷化可以在介电层204的顶表面上方形成疏水层220。在一些实施方案中,疏水层220的厚度为约1.5纳米(nm)。
由介电层204的壁形成的孔205包括在工作电极202上方的电解质体积206。电解质体积206可以是缓冲的、并且可以包括以下中的一种或多种:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、乙酸锂、乙酸钠、乙酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)和氯化镁(MgCl2)。在一些实施方案中,电解质体积206具有约3微米(μm)的厚度。
还如图2所示,膜可以形成在介电层204的顶部上并跨越孔205铺展。在一些实施方案中,膜可包括形成在疏水层220顶部的脂质单层218。当膜到达孔205的开口时,脂质单层218可以转变为跨越孔205的开口铺展的脂质双层214。脂质双层可包含磷脂或由磷脂组成,所述磷脂例如选自二植烷酰基-磷脂酰胆碱(DPhPC)、1,2-二植烷酰基-sn-甘油-3-磷酸胆碱、1,2-二-O-植烷基-sn-甘油-3-磷酸胆碱(DoPhPC)、棕榈酰-油酰-磷脂酰胆碱(POPC)、二油酰-磷脂酰-甲酯(DOPME)、二棕榈酰磷脂酰胆碱(DPPC)、磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酸、磷脂酰肌醇、磷脂酰甘油、鞘磷脂、1,2-二-O-植烷基-sn-甘油; 1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-350]; 1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-550]; 1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-750]; 1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-1000]; 1,2-二棕榈酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000];1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-N-乳糖基; GM1神经节苷脂、溶血磷脂酰胆碱(LPC)或其任何组合。
如所示的那样,脂质双层214嵌入有单个纳米孔216,例如,由单个 PNTMC 形成的。如上所述,纳米孔216可以通过电穿孔将单个PNTMC插入脂质双层214中而形成。纳米孔216可以足够大以使脂质双层214的两侧之间传递至少一部分目标分析物和/或小离子(例如,Na+、K+、Ca2+、Cl-)。
样品室215位于脂质双层214上方,并且可以容纳目标分析物的溶液用于表征。所述溶液可以是含有本体电解质208的水溶液并且被缓冲至最适离子浓度和维持在最适pH以保持纳米孔216开放。纳米孔216横跨脂质双层214,并且提供了离子流从本体电解质208到工作电极202的唯一通路。除了纳米孔(例如,PNTMC)和感兴趣的分析物之外,本体电解质208还可以包括以下中的一种或多种:氯化锂(LiCl)、氯化钠(NaCl)、氯化钾(KCl)、谷氨酸锂、谷氨酸钠、谷氨酸钾、乙酸锂、乙酸钠、乙酸钾、氯化钙(CaCl2)、氯化锶(SrCl2)、氯化锰(MnCl2)和氯化镁(MgCl2)。
对电极(CE)210可以是电化学电位传感器。在一些实施方案中,对电极210可以在多个纳米孔单元之间共享,因此可以称为公共电极。在一些情况下,公共电位和公共电极可以是所有纳米孔单元或特定分组内的至少所有纳米孔单元共有的。公共电极可以被配置为向与纳米孔216接触的本体电解质208施加公共电位。对电极210和工作电极202可以偶联到信号源228,用于跨脂双层214提供电刺激(例如,偏压),并且可以用于感测脂质双层214的电特性(例如,电阻、电容和离子电流量)。在一些实施方案中,纳米孔单元200还可包括参比电极212。
在一些实施方案中,可以在创建纳米孔单元期间进行各种检查作为校准的一部分。一旦产生纳米孔单元,可以进行进一步的校准步骤,例如,以鉴定根据需要进行的纳米孔单元(例如,单元中的一个纳米孔)。这种校准检查可以包括物理检查、电压校准、开放通道校准和具有单个纳米孔的单元的识别。
B. 纳米孔测序单元的检测信号
纳米孔传感器芯片中的纳米孔单元,例如纳米孔传感器芯片100中的纳米孔单元150,可以通过合成(Nano-SBS)技术使用基于单分子纳米孔的测序实现平行测序。
图3示出了使用Nano-SBS技术进行核苷酸测序的纳米孔单元300的实施方案。在Nano-SBS技术中,可以将待测序的模板332(例如,核苷酸分子或另一种感兴趣的分析物)和引物引入纳米孔单元300的样品室中的本体电解质308中。作为示例,模板332可以是环状或线性的。核酸引物可以与模板332(可以向其添加四种不同的聚合物标记的核苷酸338)的一部分杂交。
在一些实施方案中,酶(例如,聚合酶334,例如DNA聚合酶)可以与纳米孔316结合,用于合成与模板332的互补链。例如,聚合酶334可以共价连接至纳米孔316。聚合酶334可以使用单链核酸分子作为模板催化核苷酸338掺入到引物上。核苷酸338可包含标记物质(“标记”),其中核苷酸是四种不同类型之一:A、T、G或C。当标记的核苷酸与聚合酶334正确复合时,可以通过电力将标记拉伸(加载)到纳米孔中,所述电力例如在由跨越脂质双层314和/或纳米孔316施加的电压产生的电场存在下产生的力。标记的尾部可以定位在纳米孔316的桶中。由于标记的不同化学结构和/或尺寸,保持在纳米孔316的桶中的标记可以产生独特的离子阻挡信号340,从而以电子方式识别标记所附着的添加的碱基。
如本文所用,“加载的”或“穿越的”标记可以是位于纳米孔中和/或保持在纳米孔中或附近,持续可观量的时间例如0.1毫秒(ms)至10000ms的的标记。在一些情况下,在从核苷酸释放之前将标记加载到纳米孔中。在一些情况下,加载的标记在核苷酸掺入事件后释放之后通过纳米孔(和/或被纳米孔检测)的概率合适地高,例如90%至99%。
在一些实施方案中,在聚合酶334与纳米孔316连接之前,纳米孔316的电导可以是高的,例如约300皮西门子(300pS )。当标记加载在纳米孔中时,由于标记的不同化学结构和/或尺寸,产生独特的电导信号(例如,信号340)。例如,纳米孔的电导可以是约60pS、80pS、100pS或120pS,各自对应于四种类型的标记核苷酸中的一种。聚合酶可以然后经过异构化和转磷酸化反应,将核苷酸掺入生长中的核酸分子,并释放标记分子。
在一些情况下,一些标记的核苷酸可能与核酸分子(模板)的当前位置不匹配(互补碱基)。未与核酸分子碱基配对的标记的核苷酸也可以通过纳米孔。这些非配对的核苷酸可以在一定时间尺度内被聚合酶排斥,所述时间尺度比正确配对的核苷酸保持与聚合酶结合的时间尺度更短。与非配对的核苷酸结合的标记可以快速通过纳米孔,并且可以在短时间内(例如,小于10ms)被检测到,而与配对的核苷酸结合的标记可以被加载到纳米孔中并且被检测很长一段时间(例如,至少10ms)。因此,可以至少部分地基于在纳米孔中检测核苷酸的时间通过下游处理器来鉴定非配对的核苷酸。
可以通过穿过纳米孔的电流测量包括加载的(穿越的)标记的纳米孔的电导(或者等同地,电阻),从而提供标记物质的鉴定,并由此提供当前位置的核苷酸。在一些实施方案中,可以将直流(DC)信号施加到纳米孔单元(例如,使得标记移动通过纳米孔的方向不反转)。然而,使用直流电操作纳米孔传感器长时间可改变电极的组成,使跨越纳米孔的离子浓度失衡,并且具有可影响纳米孔单元寿命的其它不期望的效果。施加交流(AC)波形可以减少电迁移以避免这些不期望的效果并且具有如下所述的某些优点。本文描述的利用标记的核苷酸的核酸测序方法与施加的AC电压完全兼容,因此可以使用AC波形来实现这些优点。
当使用消耗电极,即在载流反应中改变分子特征的电极(例如,包含银的电极)或在载流反应中改变分子特征的电极时,在AC检测循环期间对电极再充电的能力可能是有利的。当使用直流信号时,电极可能在检测周期期间耗尽。再充电可以防止电极达到耗尽极限,例如变得完全耗尽,这在电极很小时可能是个问题(例如,当电极足够小以提供每平方毫米具有至少500个电极的电极阵列时)。在某些情况下,电极寿命与电极的宽度成比例,并且至少部分地取决于电极的宽度。
用于测量通过纳米孔的离子电流的合适条件是本领域已知的,并且本文提供了实例。可以在跨膜和孔施加电压的情况下进行测量。在一些实施方案中,使用的电压可以为-400mV至+400mV。使用的电压优选地是在具有选自-400mV、-300mV、-200mV、-150mV、-100mV、-50mV、-20mV和0 mV的下限和独立地选自+10mV、+20mV、+50mV、+100mV、+150mV、+200mV、+300mV和+400mV的上限的范围内。使用的电压可以更优选地是在100mV至240mV范围内,且最优选地是在160mV至240mV的范围内。使用增加的施加的电位可以通过纳米孔增加不同核苷酸之间的区分。使用AC波形和标记的核苷酸对核酸进行测序描述于2013年11月6日提交的名称为"使用标记的核酸测序(Nucleic Acid Sequencing Using Tags)"的美国专利公开号US2014/0134616中,其整体通过引用并入本文。除了在US2014/0134616中描述的带标记的核苷酸以外,使用缺乏糖或无环部分的核苷酸类似物,例如,五种常见核碱基腺嘌呤、胞嘧啶、鸟嘌呤、尿嘧啶和胸苷的(S)-甘油核苷三磷酸酯(gNTP)可以执行测序(Horhota等人. Organic Letters, 8:5345-5347 [2006])。
C. 纳米孔测序单元的电路
图4示出了纳米孔单元(例如纳米孔单元200)中的电路400(其可以包括图2中的电路222的部分)的实施方案。如上所述,在一些实施方案中,电路400包括对电极210,其可以在纳米孔传感器芯片中的多个纳米孔单元或所有纳米孔单元之间共享,因此也可以称为公共电极。公共电极可以被配置为通过连接到交流电压源420(Vliq)将公共电位施加到与纳米孔单元中的脂质双层(例如,脂质双层214)接触的本体电解质(例如,本体电解质208)。在一些实施方案中, AC非法拉第模式可用于利用AC信号(例如,方波)调制电压V liq并将其施加到与纳米孔单元中的脂质双层接触的本体电解质。在一些实施方案中,Vliq是方波,其幅度为±200-250mV,并且频率在例如25和400Hz之间。对电极210和脂质双层(例如,脂质双层214)之间的本体电解质可以通过大电容器(未示出)(例如100 μ F或更大)模造。
图4还示出了代表工作电极(例如,工作电极202)和脂质双层(例如,脂质双层214)的电特性的电学模型422。电模型422包括模拟与脂质双层相关联的电容的电容器426(C双层)和模拟与纳米孔相关联的可变电阻的电阻器428(R),其可以基于纳米孔中特定标记的存在而改变。电气模型422还包括具有双层电容(C双层)并且代表工作电极202和孔205的电特性的电容器424。工作电极202可以配置成独立于其它纳米孔单元中的工作电极施加不同的电位。
通过装置406是可用于将脂质双层和工作电极与电路400连接或断开的开关。通过装置406可以由控制线407控制,以启用或禁用跨越纳米孔单元中的脂质双层而施加的电压刺激。在沉积脂质以形成脂质双层之前,两个电极之间的阻抗可能非常低,因为纳米孔单元的孔未被密封,因此传递装置406可以保持打开以避免短路状况。在将脂质溶剂沉积到纳米孔单元以密封纳米孔单元的孔之后,可以关闭通过装置406。
电路400还可以包括芯片上积分电容器408(ncap)。可以通过使用复位信号403来预充电积分电容器408以闭合开关401,使得积分电容器408连接到电压源VPRE405。在一些实施方案中,电压源VPRE405提供具有例如900mV幅度的恒定参考电压。当开关401闭合时,可以将积分电容器408预充电到电压源VPRE405的参考电压水平。
在积分电容器408被预充电之后,复位信号403可用于打开开关401,使得积分电容器408与电压源VPRE405断开。此时,取决于电压源Vliq的水平,对电极210的电位可以处于高于工作电极202(和积分电容器408)的电位的水平,反之亦然。例如,在来自电压源 Vliq的方波的正相位(例如,AC电压源信号周期的亮或暗周期)期间,对电极210的电位处于高于工作电极202的电位的水平。在来自电压源 Vliq的方波的负相位(例如,AC电压源信号周期的暗或亮周期)期间,对电极210的电位处于低于工作电极202的电位的水平。因此,在一些实施方案中,可以在从电压源VPRE405 的预充电电压水平到较高水平的亮周期期间进一步对积分电容器408充电,并且在暗周期期间放电到较低水平(由于对电极210和工作电极202之间的电位差)。在其它实施方案中,充电和放电可分别在暗周期和亮周期中发生。
积分电容器408可以在固定的时间段内充电或放电,这取决于模拟-数字转换器(ADC)410的采样速率,其可以高于1kHz、5kHz、10kHz、100kHz,或者更多。例如,在采样速率为1kHz的情况下,积分电容器408可以充电/放电约1ms的时段,然后可以在积分时段结束时由ADC410对电压水平进行采样和转换。特定电压水平将对应于纳米孔中的特定标记物质,因此对应于模板上当前位置处的核苷酸。
在通过ADC 410采样之后,可以通过使用复位信号403来关闭开关401来再次对积分电容器408进行预充电,使得积分电容器408再次连接到电压源VPRE405。对积分电容器408进行预充电,等待用于积分电容器408充电或放电的固定时间段,以及通过ADC 410对积分电容器的电压水平进行采样和转换的步骤可以在整个测序过程的循环中重复。
数字处理器430可处理ADC输出数据,例如,用于归一化、数据缓冲、数据滤波、数据压缩、数据减少、事件提取,或将来自纳米孔单元阵列的ADC输出数据组装成各种数据帧。在一些实施方案中,数字处理器430可以执行进一步的下游处理,例如碱基确定。数字处理器430可以实现为硬件(例如,在GPU、FPGA、ASIC等中)或者实现为硬件和软件的组合。
因此,跨纳米孔施加的电压信号可用于检测纳米孔的特定状态。当纳米孔的桶中不存在附着有标记的多磷酸酯时,纳米孔的可能状态之一是开放通道状态,在本文中也称为纳米孔的无穿越状态。纳米孔的另外四种可能状态各自对应于四种不同类型的附着标记的多磷酸核苷酸(A、T、G或C)中的一种保持在纳米孔的桶中时的状态。纳米孔的另一种可能状态是脂质双层破裂时。
当在固定的时间段之后测量积分电容器408 上的电压水平时,纳米孔的不同状态可导致不同电压水平的测量值。这是因为积分电容器408上的电压衰减(通过放电而减小或通过充电而增加)的速率(即,积分电容器408上的电压的斜率相对于时间的曲线的陡度)取决于纳米孔电阻(例如,电阻器R 428的电阻)。更具体地,由于不同状态下与纳米孔相关的电阻由于分子(标记)的不同的化学结构而不同,可以观察到不同的相应电压衰减速率并且可以用于识别纳米孔的不同状态。电压衰减曲线可以是具有RC时间常数τ= RC的指数曲线,其中R是与纳米孔相关的电阻(即,R428),C是与和R平行的膜相关的电容(即,电容器426(C双层))。纳米孔单元的时间常数可以是例如约200-500ms。由于双层的详细实施,衰减曲线可能不完全拟合指数曲线,但衰减曲线可能类似于指数曲线并且是单调的,因此允许检测标记。
在一些实施方案中,在开放通道状态下与纳米孔相关的电阻可以在100MOhm至20GOhm的范围内。在一些实施方案中,在标记位于纳米孔的桶内的状态下与纳米孔相关的电阻可以在200MOhm至40GOhm的范围内。在其它实施方案中,可以省略积分电容器408,因为通向ADC 410的电压仍将由于电气模型422中的电压衰减而变化。
积分电容器408上的电压衰减速率可以以不同方式确定。如上所解释的,可以通过测量固定时间间隔期间的电压衰减来确定电压衰减的速率。例如,积分电容器408上的电压可以在时间t1由ADC 410首先测量,然后在时间t2由ADC 410再次测量电压。当积分电容器408上的电压随时间变化的曲线的斜率更陡时,电压差更大,并且当电压曲线的斜率较不陡时,电压差更小。因此,电压差可以用作用于确定积分电容器408上的电压衰减速率的度量,并因此确定纳米孔单元的状态。
在其它实施方案中,可以通过测量选定量的电压衰减所需的持续时间来确定电压衰减的速率。例如,可以测量电压从第一电压水平V1下降或增加到第二电压水平V2所需的时间。当电压-时间曲线的斜率更陡时,所需时间更短,并且当电压-时间曲线的斜率较不陡时,所需时间更长。因此,测量的所需的时间可以用作用于确定积分电容器ncap408上的电压衰减速率的度量,并因此确定纳米孔单元的状态。本领域技术人员将理解可用于测量纳米孔的电阻的各种电路,例如,包括电流测量技术。
在一些实施方案中,电路400可以不包括在芯片上制造的传递装置(例如,传递装置406)和额外电容器(例如,积分电容器408(ncap)),从而有助于减小基于纳米孔的测序芯片的尺寸。由于膜(脂质双层)的薄性质,单独与膜(例如,电容器426(C双层))相关联的电容可能足以产生所需的RC时间常数而无需额外的芯片上电容。因此,电容器426可以用作积分电容器,并且可以通过电压信号VPRE预充电,并且随后通过电压信号VLIQ放电或充电。消除否则在电路中芯片上制造的额外电容器和传递装置可以显著减少纳米孔测序芯片中单个纳米孔单元的范围,从而促进纳米孔测序芯片的缩放以包括更多的单元(例如,在纳米孔测序芯片中具有数百万个单元)。
D. 纳米孔单元中的数据采样
为了进行核酸的测序,可以通过ADC(例如,ADC 410)对积分电容器(例如,积分电容器408(ncap)或电容器426(C双层))的电压水平进行采样和转换,同时标记的核苷酸被添加到核酸中。核苷酸的标记可以通过跨越纳米孔的电场被推入纳米孔的桶中,所述电场通过对电极和工作电极施加,例如,当施加的电压使得Vliq低于VPRE时。
1. 穿越
穿越事件是当标记的核苷酸附着于模板(例如,核酸片段),并且标记进出纳米孔的桶时。这可能在穿越事件期间多次发生。当标记位于纳米孔的桶中时,纳米孔的电阻可以更高,并且更低的电流可以流过纳米孔。
在测序期间,标记可能在一些AC循环中不在纳米孔中(称为开放通道状态),其中电流是最高的,因为纳米孔的电阻较低。当标记被吸引到纳米孔的桶中时,纳米孔处于亮模式。当标记被推出纳米孔的桶时,纳米孔处于暗模式。
2. 亮和暗周期
在AC循环期间,ADC可以对积分电容器上的电压进行多次采样。例如,在一个实施方案中,AC电压信号以例如约100Hz跨越系统施加,并且ADC的采集速率可以是每个单元约2000Hz。因此,每个AC循环(AC波形的循环)可以捕获大约20个数据点(电压测量值)。对应于AC波形的一个循环的数据点可以称为一组。在AC循环的一组数据点中,可能存在当例如Vliq低于VPRE时捕获的子集,其可以对应于标记被强制进入纳米孔的桶的亮模式(周期)。另一个子集可以对应于暗模式(周期),其中当例如Vliq高于VPRE时,通过施加的电场将标记推出纳米孔的桶。
3. 测量的电压
对于每个数据点,当开关401开放时,积分电容器(例如,积分电容器408(ncap)或电容器426(C双层))处的电压将由于通过VLIQ的充电/放电而以衰减方式改变,例如,当VLIQ高于VPRE时从V PRE增加到VLIQ或者当VLIQ低于VPRE时从VPRE降低至VLIQ。当工作电极充电时,最终电压值可能偏离Vliq。积分电容器上的电压水平的变化速率可以由双层电阻的值控制,双层电阻可以包括纳米孔,纳米孔又可以包括纳米孔中的分子(例如,标记的核苷酸的标记)。可以在开关401打开之后的预定时间测量电压水平。
开关401可以以数据获取的速率操作。开关401可以在两次数据采集之间关闭相对短的时间段,通常恰好在ADC测量之后。该开关允许在VLIQ的每个AC循环的每个子周期(亮或暗)期间收集多个数据点。如果开关401保持开放,则积分电容器上的电压水平以及由此导致的 ADC的输出值将完全衰减并保持在那里。相反,当开关401闭合时,积分电容器再次预充电(至VPRE)并准备好进行另一次测量。因此,开关401允许针对每个AC循环的每个子周期(亮或暗)收集多个数据点。这样的多次测量可以允许具有固定ADC的更高分辨率(例如,由于更多次数的测量,8-bit到14-bit,其可以被平均化)。多次测量还可以提供关于穿入纳米孔的分子的动力学信息。定时信息可以允许确定穿越发生多长时间。这也可用于帮助确定添加到核酸链的多个核苷酸是否正在测序。
图5示出了在AC循环的亮周期和暗周期期间从纳米孔单元捕获的示例数据点。在图5中,为了说明的目的,夸大了数据点的变化。施加到工作电极或积分电容器的电压(VPRE)处于恒定水平,例如900mV。施加到纳米孔单元的对电极的电压信号510(VLIQ)是显示为矩形波的AC信号,其中工作循环可以是任何合适的值,例如小于或等于50%,例如,大约40%。
在亮周期520期间,施加到对电极的电压信号510(VLIQ)低于施加到工作电极的电压VPRE,使得标记可以通过电场而被强制进入纳米孔的桶中,所述电场由在工作电极和对电极处施加的不同电压水平(例如,由于标记上的电荷和/或离子的流动)引起。当开关401开放时,ADC之前的节点处的电压(例如,在积分电容器处)将减小。在捕获电压数据点之后(例如,在指定的时间段之后),可以闭合开关401并且测量节点处的电压将再次增加回到VPRE。该过程可以重复以测量多个电压数据点。以这种方式,可以在亮周期期间捕获多个数据点。
如图5所示,在VLIQ信号的指示改变之后的亮周期中的第一数据点522(也称为第一点德尔塔(FPD))可以低于后续数据点524。这可能是因为纳米孔(开放通道)中没有标记,因此它具有低电阻和高放电率。在一些情况下,第一数据点522可以超过V LIQ水平,如图5所示。这可能是由将信号偶联到芯片上电容器的双层的电容引起的。可以在穿越事件发生之后捕获数据点524,即,标记被迫进入纳米孔的桶中,其中纳米孔的电阻以及因此积分电容器的放电速率取决于被迫进入纳米孔的桶中的标记的特定类型。由于在C双层424处建立的电荷,数据点524可以针对每次测量略微减小,如下所述。
在暗周期530期间,施加到对电极的电压信号510(VLIQ)高于施加到工作电极的电压(VPRE),使得任何标记将被推出纳米孔的桶。当开关401开放时,测量节点处的电压增加,因为电压信号510(VLIQ)的电压水平高于VPRE。在捕获电压数据点之后(例如,在指定的时间段之后),可以闭合开关401并且测量节点处的电压将再次减小回到VPRE。该过程可以重复以测量多个电压数据点。因此,可以在暗周期期间捕获多个数据点,包括第一点δ532和后续数据点534。如上所述,在暗周期期间,任何核苷酸标记被推出纳米孔,因此除了用于归一化之外,还获得关于任何核苷酸标记的最小信息。
图5还示出了在亮周期540期间,即使施加到对电极的电压信号510(VLIQ)低于施加到工作电极的电压(VPRE),也不会发生穿越事件(开放通道)。因此,纳米孔的电阻低,并且积分电容器的放电率高。结果,捕获的数据点(包括第一数据点542和后续数据点544)显示低电压水平。
对于纳米孔的恒定电阻的每次测量,可以预期在亮或暗周期期间测量的电压大致相同(例如,在给定AC循环的亮模式期间做出,而一个标记在纳米孔中),但是当电荷在双层电容器424(C双层)处累积时可能不是这种情况。该电荷积聚可导致纳米孔单元的时间常数变得更长。结果,可以移动电压水平,从而使得测量值在一个循环中对于每个数据点减小。因此,在一个循环内,数据点可以从数据点稍微改变到另一个数据点,如图5所示。
4. 确定碱基
对于纳米孔传感器芯片的每个可用的纳米孔单元,可以运行生产模式以对核酸进行测序。可以对在测序期间捕获的ADC输出数据进行归一化以提供更高的准确度。归一化可以解决偏移效应,例如循环形状和基线偏移。在归一化之后,实施方案可确定穿越通道的电压簇,其中每个簇对应于不同的标记物质,因此对应于不同的核苷酸。簇可用于确定对应于给定核苷酸的给定电压的概率。作为另一个例子,簇可以用于确定用于区分不同核苷酸(碱基)的截止电压。
关于测序操作的更多细节可以在例如,题为“具有变化电压刺激的基于纳米孔的测序(Nanopore-Based Sequencing With Varying Voltage Stimulus)”的美国专利公开号2016/0178577,题为“具有变化电压刺激的基于纳米孔的测序(Nanopore-BasedSequencing With Varying Voltage Stimulus)”的美国专利公开号2016/0178554,题为“使用对电刺激的双层响应的测量的非破坏性双层监测(“Non-Destructive BilayerMonitoring Using Measurement Of Bilayer Response To Electrical Stimulus)”的美国专利申请号15/085,700,和题为“双层形成的电增强(Electrical Enhancement OfBilayer Formation)”的美国专利申请号15/085,713中找到,其公开内容出于所有目的通过引用整体并入。
5. 电压值的周期性
图6显示了根据一些实施方案的测试测序运行的样品亮和暗周期数据。亮周期数据显示在图的顶部601上,暗周期数据显示在图的底部603上。电压数据的周期性由交流(AC)电压源(例如,AC电压源420)提供的交流信号引起,如上面参考图4所述。图6中所示的每个数据点通过ADC测量在相对于通过装置406的开放的一段时间之后纳米孔单元电路的节点上(例如,在图4中的ncap处)的电压而获得。对于每次测量,ncap处的电压开始于VPRE(VPRE显示为虚线612)并且然后衰减,接近+/- VLIQ(取决于AC循环内的周期(亮或暗))。在一段时间延迟之后,ADC测量电压值。图6示出了这些测量电压值的集合,即,每个数据点是从VPRE到VLIQ的RC衰减曲线的单点样本。对于图6中所示的示例,数据采集速率为约1,976Hz。在每个周期内,点对点电压的变化部分是由单元中的电荷累积引起的,而该电荷积累导致积分电容器(例如,电容器408或电容器426,取决于所使用的电路)的充电/放电的基础电压衰减曲线的整体偏移。
图6示出了来自亮模式的开放通道状态的数据,例如,在第7个AC循环的亮周期开始之后不久出现的穿越事件610之前的亮模式数据620。其它AC循环中的后续开放通道值和穿越事件也随时间进展而显示。在一些实施方案中,如这里所示,对于穿越和开放通道状态,亮周期中的测量的ADC值实际上在循环与循环之间是相当可重复的。这开启了一个亮周期数据中的系统偏移和噪音可以使用相邻(或甚至随后的非相邻)亮周期数据(而不需要使用暗通道数据)来补偿的可能性。以下部分详述了利用电压数据的周期性的一个或多个实施方案。
III. 周期至周期分析
实施方案利用数据中的周期性,例如,如以上图6中所示。实施方案可以使用很少的假设或参数,因此更稳健。以这种方式,实施方案可以与具有新纳米孔、脂质双层等的新系统一起使用,其中已经进行了新单元的最小表征。因此,实施方案可以广泛应用,而无需具备所使用的测序单元的许多先前知识。
A. 确定差异信号
为了确定差异信号,可以从另一个循环的数据中减去一个循环的数据。在一些实施方案中,对应的数据点源自相邻的循环(例如,最近的相邻、第二相邻等)。
图7示出了多个循环1-4的数据点集合,其中每个循环具有由B和D标记表示的各自的亮周期和暗周期。如下根据一些程序确定差异数据。原始ADC数据(未示出)用于创建两个移位数据集,每个移位数据集可以存储在存储器中。信号710是向左移动半个周期的原始数据(这里称为left_adc)且数据720是向右移动半个周期的原始数据(这里称为right_adc)。尽管该实施方案示出了净一个周期移位的示例,但是在不脱离本发明的范围的情况下其它移位是可能的,例如,两个周期移位、三个周期移位等。此外,可以使用原始数据,以及在一个完整周期内移位的移位数据,而不是在半周期移位两次。然后可以通过减去两个移位的adc信号来创建处理后的差异数据730(这里称为p2p_diff),在这种情况下:
p2p_diff = left_adc-right_adc。
在一些实施方案中,通过从原始循环1中减去原始循环2来获得处理后的差异数据730(p2p_diff)的第一循环。处理后的差异数据730(p2p_diff)的第二循环是通过从原始循环2中减去原始循环3而获得的。处理后的差异数据730(p2p_diff)的第三循环是通过从原始循环4中减去原始循环3来获得的,等等。在处理后的差异数据730中,来自原始数据的单穿越事件770被复制,首先出现为正峰(事件峰750)并且随后再次出现为负峰(事件峰760)。
普通技术人员将理解,事件峰750和760通常具有相反的符号,因此,正和负限定符在本文中仅用作一个示例。该单穿越事件的正峰和负峰在时间上分开一个量,该量等于两个移位数据集之间的净时移(在该示例中为一个完整周期)。但是,对于持续多个循环的穿越事件,净时移可能会更长。
尽管图7示出了用于计算处理后的差异数据730的逐点周期至周期差分方法,可以使用任何差分方案而不脱离本发明的范围,例如,移位可以在任一方向上(从右到左或从左到右)一个或多个周期。图7示出了通过从左向右(净)移位一个周期的最近邻差。然而,可以通过移位多个周期来取得差异,这可以提供关于基础信号的更粗略的度量信息。
可能无法确定第一循环和/或最后循环的差异,因为对于一个移位的循环可能没有第一循环数据或最后循环数据。因此,这些区域在本文中称为“无效区域”。图7中示出了第一无效区域740的示例。
图8示出了使用以上图7中描述的相同移位方法的差分技术的实施方案,但这次具有略微不同性质的原始数据。如此处所示,在一些实施方案中,穿越事件可持续多于一个AC循环。例如,在图8的数据中,穿越事件持续三个循环,由分别在循环2、3和4期间发生的穿越事件810、820和830各自示出。然而,由于这些穿越事件中的每一个的原始数据的可重复性,仅第一穿越事件810和最后的穿越事件830可以分别作为正峰840和负峰850出现在处理的差异数据中。普通技术人员将理解,峰840和850通常具有相反的符号,因此,正和负限定符在本文中仅用作一个示例。此外,正峰和负峰之间的时间间隔不再仅仅是应用于原始数据的净时移(再次,在此示例中为1个周期),而是净时移和在第一穿越事件810和最后一个穿越事件830之间的持续时间的总和。
图9示出了根据一些实施方案的示出用于确定差异数据的移位原始数据点的方法的示意图。第一行显示原始数据集,每个正数通道标有数字。在此示例中不使用负通道,因此使用对角线阴影显示为灰色。第二行显示数据的一个循环右移。第三行显示数据的一个循环左移。第四行示出示例差异信号,其中所述差异是原始数据减去右移位信号,使得从较晚循环中减去较早循环。
第五行显示原始数据减去左移信号的差异数据。在该示例中,从较早循环中减去较晚循环。因此,穿越事件将以正脉冲开始。
最后一行显示右移数据和左移数据之间的差异。在一些实施方案中,可以使用最近相邻差异(例如,1-2)和第二最近相邻差异(例如,1-3)来确定差异是由于具有穿越事件者还是具有穿越事件的两者。在一些实施方案中,这可以帮助确认两个芯片提供相同的结果。
B. 差异数据
图10示出了根据一些实施方案的穿越事件的差异数据的示例。具体而言,图10示出了例如通过在序列分析仪的操作期间由数字处理器430产生的随时间测量的差异数据1010。因此,该实施方案可能无法访问基础原始AC信号(例如,图6中所示的信号)。然而,可以仅从差异数据1010中提取确定碱基识别所需的信息。
如上面已经所述的那样,正脉冲1020代表在时间t1开始的穿越事件。在一些实施方案中,在亮模式在时间t0开始之后,可以稍微发生穿越事件。例如,如上面参考图5所述,t0表示当VLIQ由比VPRE更小切换到比VPRE更大(或反之亦然,取决于单元的体系结构)的时刻,因此表示跨越孔的电场的方向切换的精确的时间。时差(t1-t0)提供了有用的信息,并且在一些实施方案中,可以解释为穿越时间(TTT),即,在暗模式之后将标记插入纳米孔所花费的时间。TTT可以有助于系统的设计,例如,在创建纳米孔分子中。例如,当为新应用选择孔和/或突变孔时,TTT是有用的设计参数,例如,以创建具有增强(更快)TTT的新孔。
在一些实施方案中,穿越脉冲的幅度L事件(这里也称为“电压水平”或“水平”)对应于穿越事件中涉及的特定标记,其中对于开放通道(无穿越穿越通道)和4个碱基(A、G、C和T)发生4个不同(和可区分的)幅度。脉冲的宽度dt循环内对应于穿越事件发生的持续时间,即所谓的“停留时间”(假设持续时间在单个亮循环内)。然而,一旦在第一循环中进行了穿越,标记通常可以在(例如,100)之后进行多次循环的穿越,因此停留时间可以延伸跨越许多循环。因此,停留时间可以更适当地解释为循环内停留时间dt循环内。如图10所示,循环内停留时间是dt循环内并且可以通过给定穿越事件的差异数据中的第一峰的宽度来测量。
循环间停留时间显示为dt循环间并且可以从差异数据测量,所述差异数据为起始正脉冲和结束负脉冲的时间差,例如,第一脉冲的第一(最早的时间)边缘和和最后脉冲的最后边缘(最新的时间)之间的时间差。在不脱离本发明的范围的情况下,其它边缘可以用作端点。
上面的图8讨论了多循环穿越事件,其中标记在三个连续循环上进行了穿越。如图8中所讨论的,在多循环穿越事件中,中间循环中的电压点之间的差异通常可以为零。然而,减法可能不是完美的,例如,每个穿越事件的TTT可能略微不同,导致具有接近L事件的水平的正脉冲和负脉冲之间的几个点。在下面图12的样本差异数据点1201中示出了这种现象的一个示例。可以基于持续时间将这种变化与新的穿越事件区分开,因为这些穿越内事件变化可能仅在一个或两个ADC循环中出现在数据中。以这种方式,可以假设偶然的离群点是由第一大正脉冲发出信号的相同穿越事件的一部分。
可以将数据中看到的任何峰的峰值(例如,噪音峰1030)与较大的穿越事件脉冲的峰值进行比较,以确定峰是噪音还是真实的穿越事件。如上面已经所述,对信号的缓慢移动变化(例如,从一个循环到另一个循环的增益漂移)可能在一个循环与另一个循环之间是一致的(基本上表现为DC偏移)并且可以在该差分过程期间被移除和/或最小化。因此,本文描述的周期至周期差分方法可以提供穿越事件检测器,其通常对在长时间尺度上发生的变化和/或数据的变化不敏感,所述变化可以在循环之间重复。另外,差异数据的基线不需要精确地为零,或者甚至不需要预先知道,因为可以从差异数据本身的统计分析中识别基线,如下所述。
在一些实施方案中,与采样速率(例如,2kHz)相比,穿越事件的发生速率较慢(每秒一次或两次)。因此,零值可以被确定为差异信号的最常见值(模式)或平均值。还可以基于例如没有穿越事件(开放信道数据)的数据的方差来测量噪音(例如,1.8 ADC水平)。对差异信号有贡献的单元越多,噪音就可以变得越小,例如,1.0 ADC水平。基于测量的噪音水平,可以选择用于识别穿越事件的阈值(图10中所示的+/- T 噪音),例如,可以基于噪音的标准偏差来选择阈值,例如,仅在噪音外面超过6个标准偏差的数据可以被注册为穿越事件。此外,可以要求宽度dt循环内至少为一定数量的点,例如,3、4、5或6。因此,可能需要在一个循环中至少看到一定次数的穿越电压,这可以降低由于假电压测量引起的噪音。
C. 计算差异数据
图11 是说明根据某些实施方案的使用测序单元的实例方法的流程图。更具体地,图11示出了根据一些实施方案的来自纳米孔测序的AC信号的周期至周期分析的方法。
在步骤1110中,跨越测序单元的纳米孔施加交流信号(本文中也称为“AC信号”)。这样的AC信号可以是由类似于上面参考图4描述的AC电压源420(在本文中也称为AC“信号发生器”)的AC信号发生器提供的方波。在一些实施方案中,AC信号可以是多个循环长,交流信号的每个循环包括第一部分(在本文中也称为“亮模式”或“亮周期”)和第二部分(在本文中也称为“暗模式”或“暗周期”)。第二部分的电压水平与参考电压相反,而不是第一部分的电压水平(在图5所示的实施方案中,VLIQ高于或低于VPRE)。如上面参考图1-2所示,在一些实施方案中,纳米孔配置成接收与核苷酸连接的标记,从而产生穿越事件。
在步骤1120中,例如通过ADC 410获取第一组电压数据(在本文中也称为“未移位的电压数据”或“原始电压数据”),如上面参考图4所述。在一些实施方案中,在交流信号的多个循环的第一部分(例如,亮周期)期间获取第一组电压数据。第一组电压数据的示例包括图5的亮周期520中所示的数据点和在图7-8中所示的被表征为在“B”周期内的所有点。如图7-8所示,第一组电压数据可包括在AC信号的多个循环中获取的电压数据点。如上所述,电压数据对应于(取决于)不同时间纳米孔的电阻值,其中纳米孔的电阻在纳米孔内接收标记时改变。
在步骤1130中,例如通过上面图4中所示的数字处理器430所获取的原始电压数据确定一组时移的电压数据。移位数据的示例在如上所述的图7-9中示出。在一些实施方案中,原始电压数据组和移位电压数据组的数据点的每个循环包括特定数量的数据点,原始未移位数据可包括亮周期内的15个数据点,并且移位数据可包括在亮周期内相应的15个数据点。如上面所讨论的,例如参考上面图7-9,因为移位数据相对于未移位数据是时移的,所以移位数据的数据点和未移位数据的数据点来自AC信号的不同循环。例如,简要地转向图9所示,未移位数据点可以源自未移位数据的循环1,并且移位数据点可以源自未移位循环2,如标记为Org-LShift的示例中所示。
在步骤1140中,例如通过上面图4中所示的数字处理器430,通过计算未移位组电压数据的数据点与移位组电压数据的相应数据点之间的差异计算差异数据。在一些示例中,对应的数据点在各自的循环中具有相同的位置,但是可以存在于不同的循环中。例如,对于源自未移位数据的循环1的未移位数据点和源自未移位数据的循环2的移位数据点,可以以下列方式计算差异数据:第一差异数据点可以通过从循环2的第一点减去来自循环1的第一点计算,第二差异数据点可以通过从循环2的第二点减去来自循环1的第二点计算,依此类推。受益于本发明的普通技术人员将理解,存在许多不同的方式来执行差异,并且上述单点方法仅仅意味着其中的一个示例。例如,可以在减去之前对来自每个循环的多个数据点进行平均或滤波,或者可以基于最近的相邻减法,下一个最近的相邻减法等来计算差异,而不脱离本发明的范围。
在步骤1150中,基于差异数据中的一个或多个数据点检测穿越事件(即,已在纳米孔内接收到标记)。例如,如上面参考图10所述,可以通过差异数据中的脉冲的存在来识别穿越事件。在一些实施方案中,通过将开放通道水平鉴别为差异数据的模式来确定穿越事件。可以通过确定差异数据的起始脉冲超过阈值,确定起始脉冲后并且与起始脉冲的符号具有相反符号的差异数据中的结束脉冲和确定起始脉冲和结束脉冲之间的时间差异来识别穿越事件。在一些实施方案中,可以根据差异数据的模式确定阈值,如上面参考图10所述。
在一些实施方案中,对于给定单元,可以有效地复制未移位数据(即原始数据)并将副本存储在存储器中。然后使用存储的未移位数据和未移位数据的存储副本或未移位数据的时移副本来计算相邻循环的相应电压点之间的差异。等效地,可以使用未移位数据的单个副本,其中当前一对循环的点由处理器读取(两者之间取差异)。
在数据处理器高速缓存中,可以存在存储的位置,给定循环存储在一个位置并用于每两个循环。对于一个计算,循环数据点将对应于用于确定差异的初始循环。对于下一次计算,循环数据点将对应于用于确定差异的结束循环。以这种方式,相对于具有整个阵列的两个副本并且为每个差异计算读取两组循环数据点可以减少操作的数量。
例如,第一组数据点可以存储在第一存储器位置,第二组数据点可以存储在第二存储器位置。可以用第一存储器位置处的数据点集合减去第二存储器位置处的数据点集合取差异。然后,为了下一次计算,可以从存储器中移除第一组数据点,可以将第三组数据点存储在第一存储器位置中。所取的下一个差异将是第二存储器位置处的第二组数据点减去第一存储器位置处的第三组数据点,依此类推。
虽然在数字信号处理技术的上下文中描述了上述差分方法,但是本发明不限于此。例如,在不脱离本发明的范围的情况下,可以采用模拟技术代替数字技术或与数字技术结合使用。例如,时移和差分计算可以由一个或多个模拟电路元件,例如移相器,运算放大器,模拟滤波器等执行。
D. 数据压缩和性能
计算脉冲的若干属性可以允许压缩数据,因为可以从脉冲的一小组属性中提取碱基识别所需的物理信息,这组属性被存储为存储器中的一些参数。芯片可以是大的,例如数十万个单元甚至数百万,采样速率为2kHz。因此,在存储每个电压点的情况下,可以产生数TB的数据并且相关的存储成本可以很高。在一些实施方案中,通过基于差异数据计算穿越事件参数的数据压缩可以使每个穿越事件仅使用少量待存储参数,从而大大降低存储要求和成本。
为穿越事件存储的参数的示例可以包括一个或多个水平的L事件、穿越时间TTT以及各种时间差异,例如,起始脉冲和结束脉冲之间的时间差。如上面参考图10所述,可以计算循环内停留时间和循环间停留时间并将其存储为压缩数据。
在一些实施方案中,通过本文公开的方法处理的差异数据包括一些其它有益特征。首先,所有非穿越(即,开放通道)数据具有低幅度,差异数据的开放通道值聚集在零附近(或围绕一些抵消)。另一方面,穿越事件表现为其幅度升至高于背景噪音水平的突然步骤(在本文中也称为脉冲和/或峰),例如图7中所示的事件峰750。这导致了数据压缩的可能性。在一些实施方案中,并且如上面参考图10-11进一步详细讨论的那样,为了压缩数据,只能存储表征峰所需的最小数据,而丢弃所有其它数据。其次,因为数据中的长期系统漂移(例如增益漂移和/或补偿偏移)在两个时间上相对接近的循环中以相似的幅度发生,所以在这里完成的减去来自不同循环的数据,通过消除这些类型的系统影响校正数据。更一般地,处理的数据可以相对不受1)在与AC周期相比较长的时间尺度上发生;和/或2)从循环到循环以可重复的方式发生的数据中的任何系统偏移的影响。
本文公开的方法的另一个益处涉及改进的处理速度。由于所提出的方法是基于ADC值(1字节数据)的差异,因此如果对数据适当地进行存储器对齐则速度很快。此外,它可以容易地针对每个单元进行矢量化并且可以并行多个单元。对于对ubf文件进行分析的单个处理器,可以预期100MB/s级别的处理量。原则上,可以通过使数据可直接访问(例如,在环形缓冲器中)进行处理来跳过ubf文件。因此,该方法和系统的一些实施方案可以用于实时处理,例如,使用FPGA。采用本文公开的方法还可以避免使用诸如hdf5的中间格式进行处理的需要。另外,由于该方法是自然自适应的并且基于局部邻域,因此可能不需要大量的背景处理。
IV. 结果
图12A -14B 示出了根据一些实施方案的原始测序数据和处理的差异数据。
图12A示出了原始ADC测试数据的相对短的时间尺度(1s总持续时间)曲线图,其示出了各个AC循环以及足够的分辨率以示出每个AC循环内的各个亮周期和暗周期。几个亮周期显示穿越事件,例如穿越事件1203。每个穿越事件具有大致相同的ADC水平,大约110,表明在每个事件中相同的标记被穿越连接到纳米孔中。有可能发生这种情况的原因有几个,例如,可能需要几个循环来催化与标记相关的碱基,或者相同类型的多个标记的碱基可能在被测序的核酸中重复。
图12B示出了根据一些实施方案的从图12A中所示的原始(未移位的)ADC数据计算的差异数据(p2p_diff)。如上面参考图6-9所述,在差异数据中,每个穿越事件由具有相反符号的一对事件脉冲表示。另外,对于多循环穿越事件,差分过程可能不是完美的,例如,如果TTT在循环之间略微变化(如上面参考图10所讨论的)。在这种情况下,正脉冲和负脉冲之间的一些样本差异数据点1201具有与穿越幅度相当的水平。但是,这些离群数据点可以根据所涉及的时间尺度与穿越事件区分开来,即它们比实际穿越事件快得多。
图13A和13B示出了根据一些实施方案的周期至周期差异方法的结果。图13A和13B示出了在大约150s的持续时间内的原始ADC数据和处理的差异数据,并且因此与图12A和12B相比可以看到多得多的穿越事件。此外,图13A所示的原始ADC数据还证明了亮模式和暗模式数据中的时变增益漂移。这种漂移导致未处理的数据容易出错。但是,如图13B中所示,因为漂移在循环之间相对稳定(单个循环太快而不能在这里看到),所以在差异数据中有效地消除了漂移。此外,低于阈值的图13B中的差异数据被认为是噪音并被移除。因此,图13B表明该数据对于检测穿越事件不是必需的,并且可以被移除以减少总体数据存储要求。
图14A和14B示出了另一组样本数据,其是与图13A-13B中所示的数据类似的数据。在图14A所示的原始ADC数据中,观察到称为基线移位的现象。在一些实施方案中,这种现象可能是由于每次发生穿越事件时单元的电荷平衡突然失去平衡所致。结果,在穿越事件期间,亮模式和暗模式数据都向上趋势,然后随着时间的推移开始趋向于向下趋势,因为单元中的电容元件上的电荷重新分布以达到平衡状态。图14B示出了本文公开的差分方法能够有效地校正该偏移移位。如图13A-13B所示,去除低于特定阈值的差异数据以减少总体数据存储要求。
在一些实施方案中,差异数据可用于进行数据的初步分析以识别穿越事件。稍后的处理可以涉及将事件分类为特定的碱基识别然后比对。因此,实施方案可以从一个或多个测序单元获得信号,检测事件,将事件分类以形成碱基识别,将碱基置于序列中,并与参考基因组比对。
该系统的一些实验参数可以是盐的量、盐的类型、孔处的电压量、纳米孔的类型、亮和暗模式的工作循环,以及AC信号的频率和数据采集速率。实施方案可以与这些不同的实验参数无关。其它益处是操作速度、编程到简单硬件(例如,FPGA而不是GPU,或基本CPU)的能力和数据减少(更少的存储器)。
V. 计算机系统
本文提及的任何计算机系统可以利用任何合适数目的子系统。此类子系统的实例显示于图15的计算机系统10中。在一些实施方案中,计算机系统包括单一计算机装置,其中子系统可以是计算机装置的部件。在其它实施方案中,计算机系统可以在内部部件中包括多个计算机装置,其各自为子系统。计算机系统可以包括台式计算机和便携式计算机、平板电脑、移动电话和其它移动设备。
图15中显示的子系统经系统总线1575相互连接。显示了另外的子系统诸如打印机1574、键盘1578、存储设备1579、监视器1576(其连接至显示适配器1582)及其它。偶联到I/O控制器1571的外围设备和输入/输出(I/O)设备可以通过本领域已知的任何数量的装置,例如输入/输出(I/O)端口1577(例如,USB,FireWire®)连接到计算机系统。例如,I/O 端口1577或外部界面81(例如以太网、Wi-Fi等)可以用于将计算机系统1510连接至广域网诸如互联网、鼠标输入装置或扫描仪。经由系统总线1575的相互连接允许中央处理器1573与每个子系统通信并控制来自系统存储器1572或存储设备1579(例如,固定磁盘,例如硬盘驱动器,或光盘)的多个指令的执行,以及子系统之间的信息交换。系统存储器1572和/或存储装置1579可以体现计算机可读介质。另一子系统是数据收集设备1585,例如相机、麦克风、加速度计等。任何本文提及的数据可以从一个部件输出至另一部件且可以输出给用户。
计算机系统可以包括多个相同的部件或子系统,例如通过外部界面1581或通过内部界面连接在一起。在一些实施方案中,计算机系统、子系统或装置可以经网络通信。在此类情况下,一台计算机可以认为是客户端且另一计算机为服务器,其中每一个可以是相同计算机系统的部分。客户端和服务器可以各自包括多个系统、子系统或部件。
实施方案的各方面可以使用硬件(例如,专用集成电路或现场可编程门阵列)的控制逻辑的形式和/或以模块化或集成方式使用具有通常可编程处理器的计算机软件来实现。如本文所用,处理器包括单核处理器、同一集成芯片上的多核处理器或单一电路板或网络上的多处理单元。基于本文提供的公开和教导,本领域普通技术人员将知晓和理解使用硬件和硬件和软件的组合实现本发明的实施方案的其它方式和/或方法。
本申请中所述的任何软件部件或函数可以作为软件代码由处理器使用任何合适的计算机语言诸如例如Java、C、C++、C#、Objective-C、Swift或脚本语言诸如Perl或Python使用例如常规或面向对象的技术执行来实现。软件代码可以作为一系列指令或命令存储在计算机可读介质上用于存储和/或传输。合适的非瞬时计算机可读介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、磁性介质诸如硬盘驱动器或软盘、或光学介质诸如光盘(CD)或DVD(数字通用光盘)、闪存等等。计算机可读介质可以是此类存储或传输装置的任何组合。
此类程序还可以使用符合多种协议,包括互联网的适配于经有线、光学和/或无线网络传输载波信号来编码和传输。这样,可以使用用这样的程序编码的数据信号来创建计算机可读介质。用程序代码编码的计算机可读介质可以用兼容设备包装或者与其它装置分开提供(例如经互联网下载)。任何此类计算机可读介质可以存在于单一计算机产品(例如硬盘驱动器、CD或整个计算机系统)之上或之内,并且可以呈现在系统或网络内的不同计算机产品之上或之内。计算机系统可以包括用于给用户提供本文提及的任何结果的监视器、打印机或其它合适的显示器。
本文所述的任何方法可以总体地或部分地用包括一个或多个处理器的计算机系统来进行,所述处理器可以配置以执行步骤。因此,实施方案可以涉及配置用于执行本文所述的任何方法的步骤的计算机系统(潜在地具有执行各个步骤或各组步骤的不同组件)。尽管作为经编号的步骤呈现,但本文方法的步骤可以同时或者以不同次序来进行。另外,这些步骤的部分可以与来自其它方法的其它步骤的部分一起使用。而且,步骤的全部或部分可以是任选的。另外,任何方法的任何步骤可以用模块、单元、电路或用于进行这些步骤的其它装置来进行。
具体实施方案的特定细节可以在不背离本发明的实施方案的精神和范围的情况下以任何合适方式来组合。然而,本发明的其它实施方案可以涉及关于每一单独方面、或这些单独方面的特定组合的特定实施方案。
本发明的示例实施方案的以上描述已呈现用于说明和描述的目的。其不旨在详尽描述或将本发明限制至与所述内容完全相同,并且在以上教导下许多修改和改变都是可能的。
"一个/种(a或an)"或"所述/该(the)"的记载旨在意指"一个/种或多个/种",除非明确地表示与其相反。除非另有明确说明,否则“或”的使用旨在表示“包含性的或”,而不是“排他性的或”。对“第一”组件的引用不一定要求提供第二组件。此外,除非明确说明,否则对“第一”或“第二”组件的引用不将所引用的组件限制到特定位置。
出于所有目的,本文提及的所有专利、专利申请、出版物和描述均通过引用整体并入。没有任何内容被承认是现有技术。

Claims (18)

1.一种用于信号处理和碱基识别的系统或仪器,包括:
包括纳米孔的测序单元,所述纳米孔被配置为接收与核苷酸连接的标记,从而产生穿越事件;
- 信号发生器,其施加跨越测序单元的纳米孔的交流信号,交流信号的每个循环包含第一部分和第二部分,其中与第一部分的电压水平相比,第二部分的电压水平与参考电压的电压水平相反;
- 模拟-数字转换器,其在交流信号的多个循环的第一部分期间获取第一组电压数据,其中第一组电压数据的每个数据点对应于不同时间纳米孔的电阻值,当纳米孔内接收到标记时,纳米孔的电阻发生变化;和
- 数字处理器,其被配置为:
○确定来自第一组电压数据的时移组电压数据,其中第一组电压数据和时移组电压数据的数据点的每个循环包括特定数量的数据点;
○通过计算第一组电压数据的数据点与时移组电压数据的相应数据点之间的差异来计算差异数据;和
○基于差异数据中的一个或多个数据点识别穿越事件。
2.如权利要求1所述的系统或仪器,还包括
开关,其选择性地跨越纳米孔施加电压,其中开关被配置为在AC信号的第一部分期间多次打开和关闭。
3.如权利要求1所述的系统或仪器,其中所述时移组电压数据包含从代表所述第一组电压数据的存储数据中选择的数据点。
4.如权利要求3所述的系统或仪器,其中所述时移组电压数据包含从所述第一组电压数据的时移副本中选择的数据点;并且计算差异数据还包含计算第一组电压数据与第一组电压数据的时移副本的对应数据点之间的差异。
5.如权利要求1所述的系统或仪器,其中所述数字处理器还被配置为通过以下方式确定时移组电压数据:
- 选择第一组电压数据的第一子集;和
- 选择第一组电压数据的第二子集,其中第一组电压数据的第二子集的循环是与第一组电压数据的第一子集的循环不同的循环。
6.如权利要求5所述的系统或仪器,其中所述对应数据点是从所述第一组电压数据的第一子集中选择的数据点和从所述第一组电压数据的第二子集中选择的数据点。
7.如权利要求1所述的系统或仪器,其中所述数字处理器还被配置为通过以下方式确定时移组电压数据:
- 生成第一组电压数据的副本;
- 通过对第一组电压数据的副本施加时移来产生时移组电压数据;和
- 将第一组电压数据和时移组电压数据存储在存储器中。
8.如权利要求1所述的系统或仪器,其中,所述数字处理器还被配置为:
- 识别差异数据的模式;
- 确定超过阈值的差异数据的起始脉冲,其中从模式确定阈值;
- 确定在起始脉冲之后并且符号相反的差异数据中的结束脉冲;
- 确定起始脉冲和结束脉冲之间的时间差;和
- 将时间差和起始脉冲和/或结束脉冲的幅度存储在存储器中。
9.如权利要求1所述的系统或仪器,还包括:
包括多个测序单元的测序芯片,其中所述数字处理器还被配置为分析多组差异数据,其中所述多组差异数据中的每一组来自所述多个测序单元中的相应的一个。
10.如权利要求9所述的系统或仪器,其中所述数字处理器还被配置为对所述多组差异数据的值进行聚类,以基于所述差异数据中的脉冲水平来确定用于确定碱基识别的截止值。
11.一种使用测序单元的方法,该方法包括:
- 跨越测序单元的纳米孔施加交流信号,所述纳米孔被配置为接收与核苷酸连接的标记,从而产生穿越事件,交流信号的每个循环包含第一部分和第二部分,其中与第一部分的电压水平相比,第二部分的电压水平与参考电压的电压水平相反;
- 在交流信号的多个循环的第一部分期间获取第一组电压数据,其中第一组电压数据的每个数据点对应于纳米孔在不同时间的电阻值,其中当纳米孔内接收到标记时,纳米孔的电阻发生变化;
- 确定来自第一组电压数据的时移组电压数据,其中第一组电压数据和时移组电压数据的数据点的每个循环包括特定数量的数据点;
- 通过计算第一组电压数据的数据点与时移组电压数据的相应数据点之间的差异来计算差异数据;和
- 基于差异数据中的一个或多个数据点识别穿越事件。
12.如权利要求11所述的方法,其中相应的数据点在不同的循环中具有相同的位置。
13.如权利要求11所述的方法,其中通过从第一组电压数据中选择数据点来确定时移组电压数据的相应数据点,其中时移数据的数据点选自与指定数目的数据点的循环不同的循环。
14.如权利要求11所述的方法,其中所述时移组电压数据包含从所述第一组电压数据的时移副本中选择的数据点,并且其中计算差异数据包含计算第一组电压数据与第一组电压数据的时移副本的对应数据点之间的差异。
15.如权利要求11所述的方法,其中确定时移组电压数据还包括:
- 选择第一组电压数据的第一子集;和
- 选择第一组电压数据的第二子集;
其中第一组电压数据的第二子集的循环是与第一组电压数据的第一子集的循环不同的循环。
16.如权利要求11所述的方法,其中确定时移组电压数据还包括:
- 生成第一组电压数据的副本;
- 通过对第一组电压数据的副本施加时移来产生时移组电压数据;和
- 将第一组电压数据和时移组电压数据存储在存储器中。
17.如权利要求11所述的方法,还包括:
- 识别差异数据的模式;和
- 确定超过阈值的差异数据的起始脉冲,其中从模式确定阈值。
18.如权利要求11所述的方法,还包括
- 分析多组差异数据,其中多组差异数据中的每一组来自测序芯片的多个测序单元中的相应的一个;和
- 对所述多组差异数据的多个值进行聚类,以基于所述差异数据中的脉冲水平来确定用于确定碱基识别的截止值。
CN201780039601.5A 2016-06-23 2017-06-22 来自纳米孔测序的交流信号的周期至周期分析 Active CN109313177B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662354106P 2016-06-23 2016-06-23
US62/354106 2016-06-23
PCT/EP2017/065423 WO2017220732A1 (en) 2016-06-23 2017-06-22 Period-to-period analysis of ac signals from nanopore sequencing

Publications (2)

Publication Number Publication Date
CN109313177A CN109313177A (zh) 2019-02-05
CN109313177B true CN109313177B (zh) 2020-09-22

Family

ID=59295165

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780039601.5A Active CN109313177B (zh) 2016-06-23 2017-06-22 来自纳米孔测序的交流信号的周期至周期分析

Country Status (5)

Country Link
US (2) US11124827B2 (zh)
EP (1) EP3475695B1 (zh)
JP (1) JP6726316B2 (zh)
CN (1) CN109313177B (zh)
WO (1) WO2017220732A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018029108A1 (en) 2016-08-08 2018-02-15 F. Hoffmann-La Roche Ag Basecalling for stochastic sequencing processes
CN109963949A (zh) * 2016-09-15 2019-07-02 豪夫迈·罗氏有限公司 使用具有杂合模式刺激的电压模式的基于纳米孔的测序
CN116515973A (zh) 2016-12-15 2023-08-01 豪夫迈·罗氏有限公司 自适应纳米孔信号压缩
JP2021513962A (ja) 2018-02-15 2021-06-03 エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft 分析物の検出および分析のためのナノポアタンパク質コンジュゲート
WO2020002516A1 (en) * 2018-06-27 2020-01-02 F. Hoffmann-La Roche Ag Multiplexing analog component in biochemical sensor arrays
EP3894056A2 (en) * 2018-12-11 2021-10-20 F. Hoffmann-La Roche AG Systems and methods for self-limiting protein pore insertion in a membrane
CN111662971A (zh) * 2020-06-04 2020-09-15 成都万众壹芯生物科技有限公司 一种基因测序芯片的校正方法、装置
CN113030548A (zh) * 2021-03-09 2021-06-25 南京邮电大学 基于局域阈值的纳米孔检测电流信号特征信息提取方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102621214A (zh) * 2012-03-13 2012-08-01 北京大学 一种基于固态纳米孔对核酸分子进行减速及单分子捕获的方法
CN102834527A (zh) * 2010-02-23 2012-12-19 华盛顿大学 用纳米孔的分析物测序
CN102899243A (zh) * 2012-09-21 2013-01-30 清华大学 基于石墨烯纳米孔-微腔-固态纳米孔结构的dna测序装置及方法
CN103392008A (zh) * 2010-09-07 2013-11-13 加利福尼亚大学董事会 通过持续性酶以一个核苷酸的精度控制dna在纳米孔中的移动
CN104066850A (zh) * 2011-09-23 2014-09-24 牛津楠路珀尔科技有限公司 包含聚合物单元的聚合物的分析
CN104955958A (zh) * 2012-11-09 2015-09-30 吉尼亚科技公司 使用标记的核酸测序

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58223927A (ja) 1982-06-22 1983-12-26 Nec Corp デ−タ圧縮処理装置
US5853979A (en) 1995-06-30 1998-12-29 Visible Genetics Inc. Method and system for DNA sequence determination and mutation detection with reference to a standard
US5733729A (en) 1995-09-14 1998-03-31 Affymetrix, Inc. Computer-aided probability base calling for arrays of nucleic acid probes on chips
AU2001259128A1 (en) * 2000-04-24 2001-11-07 Eagle Research And Development, Llc An ultra-fast nucleic acid sequencing device and a method for making and using the same
US6413792B1 (en) 2000-04-24 2002-07-02 Eagle Research Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
US7039238B2 (en) 2000-12-01 2006-05-02 Sri International Data relationship model
EP1727065A4 (en) 2004-01-30 2010-05-05 Nat Inst Of Advanced Ind Scien SEQUENCER OF EVENTS
AU2005263186B2 (en) 2004-07-20 2012-01-19 Conexio 4 Pty Ltd Method and apparatus for analysing nucleic acid sequence
WO2008018064A2 (en) 2006-08-07 2008-02-14 Yeda Research And Development Co. Ltd. Data similarity and importance using local and global evidence scores
US7731826B2 (en) 2006-08-17 2010-06-08 Electronic Bio Sciences, Llc Controlled translocation of a polymer in an electrolytic sensing system
US20110005918A1 (en) 2007-04-04 2011-01-13 Akeson Mark A Compositions, devices, systems, and methods for using a nanopore
US8703422B2 (en) 2007-06-06 2014-04-22 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
CA2689626C (en) 2007-06-06 2016-10-25 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
US8126235B2 (en) 2008-04-04 2012-02-28 Massachusetts Institute Of Technology Methods and apparatus for automated base-calling on multiple DNA strands
US20100122907A1 (en) 2008-05-06 2010-05-20 Government of the United States of America, Single molecule mass or size spectrometry in solution using a solitary nanopore
US8428886B2 (en) 2008-08-26 2013-04-23 23Andme, Inc. Genotype calling
US9218451B2 (en) 2008-08-26 2015-12-22 23Andme, Inc. Processing data from genotyping chips
US8370079B2 (en) 2008-11-20 2013-02-05 Pacific Biosciences Of California, Inc. Algorithms for sequence determination
WO2010117470A2 (en) 2009-04-10 2010-10-14 Pacific Biosciences Of California, Inc. Nanopore sequencing devices and methods
WO2011097028A1 (en) 2010-02-08 2011-08-11 Genia Technologies, Inc. Systems and methods for manipulating a molecule in a nanopore
US9165109B2 (en) 2010-02-24 2015-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
WO2011108540A1 (ja) 2010-03-03 2011-09-09 国立大学法人大阪大学 ヌクレオチドを識別する方法および装置、ならびにポリヌクレオチドのヌクレオチド配列を決定する方法および装置
WO2012009578A2 (en) 2010-07-14 2012-01-19 The Curators Of The University Of Missouri Nanopore-facilitated single molecule detection of nucleic acids
WO2012092515A2 (en) 2010-12-30 2012-07-05 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
US20130060482A1 (en) 2010-12-30 2013-03-07 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
US20130090860A1 (en) 2010-12-30 2013-04-11 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
WO2013154999A2 (en) 2012-04-09 2013-10-17 The Trustees Of Columbia University In The City Of New York Method of preparation of nanopore and uses thereof
US20130274148A1 (en) 2012-04-11 2013-10-17 Illumina, Inc. Portable genetic detection and analysis system and method
EP2864502B1 (en) 2012-06-20 2019-10-23 The Trustees of Columbia University in the City of New York Nucleic acid sequencing by nanopore detection of tag molecules
JP6120437B2 (ja) 2013-03-08 2017-04-26 国立大学法人大阪大学 物質の識別方法
WO2014165286A1 (en) 2013-03-12 2014-10-09 Iowa State University Research Foundation, Inc. Systems and methods for recognizing, classifying, recalling and analyzing information utilizing ssm sequence models
US9551697B2 (en) 2013-10-17 2017-01-24 Genia Technologies, Inc. Non-faradaic, capacitively coupled measurement in a nanopore cell array
CN105980578B (zh) 2013-12-16 2020-02-14 深圳华大智造科技有限公司 用于使用机器学习进行dna测序的碱基判定器
US20170096703A1 (en) 2014-03-21 2017-04-06 Oxford Nanopore Technologies Ltd. Analysis of a polymer from multi-dimensional measurements
GB201408652D0 (en) 2014-05-15 2014-07-02 Oxford Nanopore Tech Ltd Model adjustment during analysis of a polymer from nanopore measurements
WO2015187670A2 (en) 2014-06-03 2015-12-10 Illumina, Inc. Compositions, systems, and methods for detecting events using tethers anchored to or adjacent to nanopores
JP6812341B2 (ja) 2014-08-08 2021-01-13 クアンタム−エスアイ インコーポレイテッドQuantum−Si Incorporated 分子の探索、検出及び解析のための光学システム及びアッセイチップ
US20160110499A1 (en) 2014-10-21 2016-04-21 Life Technologies Corporation Methods, systems, and computer-readable media for blind deconvolution dephasing of nucleic acid sequencing data
US9863904B2 (en) 2014-12-19 2018-01-09 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US9557294B2 (en) 2014-12-19 2017-01-31 Genia Technologies, Inc. Nanopore-based sequencing with varying voltage stimulus
US10935512B2 (en) 2015-09-24 2021-03-02 Roche Sequencing Solutions, Inc. Encoding state change of nanopore to reduce data size

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102834527A (zh) * 2010-02-23 2012-12-19 华盛顿大学 用纳米孔的分析物测序
CN103392008A (zh) * 2010-09-07 2013-11-13 加利福尼亚大学董事会 通过持续性酶以一个核苷酸的精度控制dna在纳米孔中的移动
CN104066850A (zh) * 2011-09-23 2014-09-24 牛津楠路珀尔科技有限公司 包含聚合物单元的聚合物的分析
CN102621214A (zh) * 2012-03-13 2012-08-01 北京大学 一种基于固态纳米孔对核酸分子进行减速及单分子捕获的方法
CN102899243A (zh) * 2012-09-21 2013-01-30 清华大学 基于石墨烯纳米孔-微腔-固态纳米孔结构的dna测序装置及方法
CN104955958A (zh) * 2012-11-09 2015-09-30 吉尼亚科技公司 使用标记的核酸测序

Also Published As

Publication number Publication date
EP3475695A1 (en) 2019-05-01
US20210395815A1 (en) 2021-12-23
WO2017220732A1 (en) 2017-12-28
JP2019527819A (ja) 2019-10-03
US11124827B2 (en) 2021-09-21
JP6726316B2 (ja) 2020-07-22
EP3475695B1 (en) 2020-07-01
US20170370902A1 (en) 2017-12-28
CN109313177A (zh) 2019-02-05

Similar Documents

Publication Publication Date Title
CN109313177B (zh) 来自纳米孔测序的交流信号的周期至周期分析
CN109952382B (zh) 随机测序方法的碱基识别
US11892444B2 (en) Formation and calibration of nanopore sequencing cells
CN111512155B (zh) 测量和去除来自交流信号驱动的纳米孔dna测序系统的随机信号中的噪声
CN109791138B (zh) 纳米孔电压方法
US20200246791A1 (en) Removing and reinserting protein nanopores in a membrane using osmotic imbalance
CN112292462A (zh) 生化传感器阵列中的多路复用模拟部件
US20210302409A1 (en) Systems and methods for self-limiting protein pore insertion in a membrane
CN111615629A (zh) 纳米孔sbs信号的标准化和基线移位移除
CN115667542A (zh) 用于膜中自限性蛋白质孔插入的法拉第系统和方法
US20230087757A1 (en) Systems and methods for using trapped charge for bilayer formation and pore insertion in a nanopore array

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant