CN103764845B - 用于合成测序中的相保护试剂流排序 - Google Patents

用于合成测序中的相保护试剂流排序 Download PDF

Info

Publication number
CN103764845B
CN103764845B CN201280027883.4A CN201280027883A CN103764845B CN 103764845 B CN103764845 B CN 103764845B CN 201280027883 A CN201280027883 A CN 201280027883A CN 103764845 B CN103764845 B CN 103764845B
Authority
CN
China
Prior art keywords
stream
sequence
polynucleotide material
polynucleotide
nucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280027883.4A
Other languages
English (en)
Other versions
CN103764845A (zh
Inventor
E·胡贝尔
J·舒尔茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Corp
Original Assignee
Life Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Corp filed Critical Life Technologies Corp
Priority to CN201610091056.1A priority Critical patent/CN105861645B/zh
Publication of CN103764845A publication Critical patent/CN103764845A/zh
Application granted granted Critical
Publication of CN103764845B publication Critical patent/CN103764845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Chemical Kinetics & Catalysis (AREA)

Abstract

一种用于核酸测序的方法,其包括:将多个模板多核苷酸链设置在多个确定的空间中,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;使具有与其可操作地结合的测序引物和聚合酶的模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流;和针对核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与模板多核苷酸链相对应的预测核苷酸序列,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序。

Description

用于合成测序中的相保护试剂流排序
相关申请的交叉引用
本申请要求2011年4月8日提交的美国临时专利申请号61/473,721、2011年10月7日提交的美国临时专利申请号61/544,924、2011年10月20日提交的美国临时专利申请号61/549,407和2012年3月29日提交的美国临时专利申请号61/617,231的权益,它们都通过引用整体并入本文。
技术领域
本申请一般地涉及核酸测序方法、系统、仪器和计算机可读介质,且更具体地,涉及包含用于合成测序中的多种相保护试剂流排序的方法、系统、仪器和计算机可读介质。
背景技术
多种用于核酸测序的仪器、装置和/或系统使用合成测序来进行核酸测序。这样的仪器、装置和/或系统可包括,例如,GenomeAnalyzer/HiSeq/MiSeq平台(Illumina,Inc.;参见,例如,美国专利号6,833,246和5,750,341);GSFLX、GSFLXTitanium和GSJunior平台(Roche/454LifeSciences;参见,例如,Ronaghi等人,SCIENCE,281:363-365(1998),和Margulies等人,NATURE,437:376-380(2005));以及IonPersonalGenomeMachine(PGMTM)和IonProtonTM(LifeTechnologiesCorp./IonTorrent;参见,例如,美国专利号7,948,015和美国专利申请公开号2010/0137143、2009/0026082和2010/0282617,它们都通过引用整体并入本文)。为了增加测序效率和/或准确度,需要新的方法、系统、仪器和计算机可读介质,其执行合成测序,并同时减少测序误差或使其最小化,所述测序误差与可能伴随合成测序发生的不同相损失效应有关。
附图说明
并入说明书中并形成说明书的一部分的附图解释了一个或多个示例性实施方案,并用于解释不同示例性实施方案的原理。所述附图仅仅是示例性的和解释性的,不应以任何方式解释为限制性的或约束性的。
图1解释了用于核酸测序的一个示例性系统的部件。
图2A解释了用于核酸测序的一个示例性流动池的横截图和放大视图。
图2B解释了跨一个示例性微孔阵列的部分移动的连续试剂之间的一个示例性均匀流锋线。
图3A解释了穿过一个示例性流动室的示例性流动路径,所述流动室具有在对角相对的入口和出口。
图3B解释了一个示例性流动室,其具有通过参考试剂流动路径的范围而限定的一个示例性传感器阵列区域。
图4A和4B示意地解释了无标签的、基于pH的测序的一个示例性过程。
图4C-4P示意地解释了使用合成测序来对靶标测序的示例性的基于流的步骤。
图4Q解释了示例性的基于pH的原始测序数据,其对应于与多个核苷酸流有关的计数。
图4R解释了示例性的流-并-流(flow-by-flow)数值,其对应于可以进行同聚物长度预测的基于pH的原始测序数据。
图5解释了示例性的不完全延伸(IE)和推进(CF)事件,所述事件可以在合成测序过程中发生和导致相同步的损失。
图6A解释了用于获得、处理和/或分析核酸测序数据的一个示例性系统。
图6B解释了用于获得、处理和/或分析核酸测序数据的一个示例性方法。
图7A解释了一个示例性的“GATCGATC...”循环重复流排序的、与信号响应曲线相对应的示例性模拟数据。
图7B解释了与模板群体进化相对应的示例性模拟数据作为图7A的循环重复流排序的测序进展。
图8A解释了一个示例性的“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”流排序的、与信号响应曲线相对应的示例性模拟数据。
图8B解释了与模板群体进化相对应的示例性模拟数据作为图8A的流排序的测序进展。
图9A解释了一个示例性的“TACGTACGTCTGAGCA”流排序的、与信号响应曲线相对应的示例性模拟数据。
图9B解释了与模板群体进化相对应的示例性模拟数据作为图9A的流排序的测序进展。
图10A解释了一个示例性的“TACGTACG...”循环重复流排序的一个示例性邻接矩阵表示。
图10B解释了图9A的流排序的一个示例性邻接矩阵表示。
图10C解释了图8A的流排序的一个示例性邻接矩阵表示。
图11解释了一个示例性图,其显示了8个示例性流排序的延伸效率和相移益处之间的权衡。
图12A解释了一个示例性的“TACGTACG...”循环重复流排序的、与信号响应曲线相对应的示例性模拟数据。
图12B解释了与模板群体进化相对应的示例性模拟数据作为图12A的循环重复流排序的测序进展。
图13A解释了一个示例性的“TACGTACGTAGCTTGACGTACGTCATGCATCGATCAGCTAAGCTGACGTAGCTAGCATCGATCCAGTCATGACTGACGTAGCTGACTGGATCAGTCATGCATCG”流排序的、与信号响应曲线相对应的示例性模拟数据。
图13B解释了与模板群体进化相对应的示例性模拟数据作为图13A的流排序的测序进展。
图14A解释了一个示例性的“TACGTACGTAGCTGACGTACGTCATGCATCGATCAGCTAGCTGACGTAGCTAGCATCGATCAGTCATGACTGACGTAGCTGACTGATCAGTCATGCATCG”流排序的、与信号响应曲线相对应的示例性模拟数据。
图14B解释了与模板群体进化相对应的示例性模拟数据作为图14A的流排序的测序进展。
图15A解释了一个示例性的“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”流排序的、与信号响应曲线相对应的示例性模拟数据。
图15B解释了与模板群体进化相对应的示例性模拟数据作为图15A的流排序的测序进展。
图16A解释了一个示例性的“TACGTACGTCTGAGCATCGATCGATGTACAGC”流排序的、与信号响应曲线相对应的示例性模拟数据。
图16B解释了与模板群体进化相对应的示例性模拟数据作为图16A的流排序的测序进展。
图17A解释了一个示例性的“TACGTACGTCTGAGCATCGATCGATGTACAGCTGACTGACTATCGCAGAGCTAGCTACATGTCGACTGACTGATAGCGTCATGCATGCAGACTCGTCGTACGTACTCAGATGCTAGCTAGCACGTGATCAGTCAGTCGCTATGAGTCAGTCAGCGATACTGCATGCATGAGTCTACGATCGATCGTGCACTA”流排序的、与信号响应曲线相对应的示例性模拟数据。
图17B解释了与模板群体进化相对应的示例性模拟数据作为图17A的流排序的测序进展。
图18A解释了一个示例性的“CTTGCTTACAACTCTCATATCGGTATCCTGTGGAAACTCCGTTATCAGCATCCTCTCATGTTAG”随机流排序的、与信号响应曲线相对应的示例性模拟数据。
图18B解释了与模板群体进化相对应的示例性模拟数据作为图18A的随机流排序的测序进展。
图19A解释了一个示例性的“TACACTCTAGTATAGAGTCGTGTCTCGACGCGAGAC”流排序的、与信号响应曲线相对应的示例性模拟数据。
图19B解释了与模板群体进化相对应的示例性模拟数据作为图19A的流排序的测序进展。
图20解释了使用相保护流进行核酸测序的一个示例性方法。
图21解释了用于核酸测序的一个示例性系统。
示例性实施方案
下述描述和本文中描述的多个实施方案仅仅是示例性的和解释性的,不应以任何方式解释为限制性的或约束性的。其它实施方案中,本发明教导的特征、目的、和优点将在所述描述和附图和从权利要求书中是显而易见的。
根据在本申请中体现的教导和原理,提供了新的方法、系统、仪器和计算机可读介质,其执行合成测序,并同时减少测序误差或使其最小化,所述测序误差与可能伴随合成测序发生的不同相损失效应有关。
除非在本文中明确指出,在本文中使用的生物化学、细胞生物学、遗传学、分子生物学、核酸化学和有机化学的术语、技术和符号(包括,例如,聚合物颗粒的化学和物理分析、核酸测序和分析、聚合技术、合成多核苷酸的制备、重组技术等)遵循相关领域中的标准论文和教科书的那些。参见,例如,Kornberg和Baker,DNAREPLICATION(《DNA复制》),第2版(纽约的W.H.弗里曼公司(W.H.Freeman),1992);Lehninger,BIOCHEMISTRY(《生物化学》),第2版(纽约的沃斯出版社(WorthPublishers),1975);Strachan和Read,HUMANMOLECULARGENETICS(《人分子遗传学》),第2版(纽约的威利斯公司(Wiley-Liss),1999);Birren等人(编),GENOMEANALYSIS:ALABORATORYMANUALSERIES(《基因组分析:实验室手册丛书》)(第I-IV卷),Dieffenbach和Dveksler(编),PCRPRIMER:ALABORATORYMANUAL(《PCR引物:实验室手册》),以及Green和Sambrook(编),MOLECULARCLONING:ALABORATORYMANUAL(《分子克隆:实验室手册》)(都得自冷泉港实验室出版社(ColdSpringHarborLaboratoryPress));和Hermanson,BIOCONJUGATETECHNIQUES(《生物共轭技术》),第2版(学术出版社(AcademicPress),2008)。
在本申请中,“扩增”通常表示执行扩增反应。
在本申请中,“扩增子”通常表示多核苷酸扩增反应的产物,其包括多核苷酸的克隆群,其可以是单链的或双链的,且其可以从一个或多个起始序列复制。所述一个或多个起始序列可以是相同序列的一个或多个拷贝,或它们可以是含有被扩增的共同区域的不同序列的混合物,所述共同区域是例如在从样品提取的DNA片段的混合物中存在的特定外显子序列。优选地,可以通过扩增单个起始序列来形成扩增子。扩增子可以通过多种扩增反应来生成,所述扩增反应的产物包括一个或多个起始核酸或靶核酸的复制物。生成扩增子的扩增反应可以是“模板-驱动的”,因为反应物(核苷酸或寡核苷酸)的碱基配对具有在模板多核苷酸中的补体,所述补体是建立反应产物所必需的。模板-驱动的反应可以是使用核酸聚合酶的引物延伸或使用核酸连接酶的寡核苷酸连接。这样的反应包括、例如,聚合酶链式反应(PCR)、线性聚合酶反应、基于核酸序列的扩增(NASBA)、滚环扩增,例如,包括在下述文献中的一篇或多篇中公开的这类反应:Gelfand等人,美国专利号5,210,015;Kacian等人,美国专利号5,399,491;Mullis,美国专利号4,683,202;Mullis等人,美国专利号4,683,195;4,965,188;和4,800,159;Lizardi,美国专利号5,854,033;和Wittwer等人,美国专利号6,174,670,它们都通过引用整体并入本文。在一个实施方案中,可以通过PCR来生产扩增子。还可以如下制备扩增子:使用滚环扩增,以形成可以排它地占据微孔的单一主体,如在Drmanac等人的美国专利申请公开号2009/0137404(其通过引用整体并入本文)中所公开的。
在本申请中,“固相扩增子”通常表示固相支持物(诸如颗粒或珠子),其具有连接的核酸序列克隆群,其可以已经通过诸如乳液PCR方法或类似技术来生产。
在本申请中,“分析物”通常表示这样的分子或生物细胞,其可以直接地影响在特定区域(诸如确定的空间或反应限制区域或微孔等)中的电子传感器,或可以通过反应的副产物间接地影响这样的电子传感器,所述反应涉及位于这样的区域中的这样的分子或生物细胞。在一个实施方案中,分析物可以是进行测序反应的样品或模板核酸,所述测序反应又可以产生影响电子传感器的反应副产物,诸如一个或多个氢离子。例如,术语“分析物”也包括连接到固体支持物(诸如珠子或颗粒)上的分析物(诸如蛋白、肽、核酸等)的多个拷贝。在一个实施方案中,分析物可以是核酸扩增子或固相扩增子。样品核酸模板可以通过共价键合或特异性结合或偶联反应与表面结合,且可以源自例如鸟枪片段化的DNA或扩增子文库(它们是在本文中进一步讨论的文库片段的例子)或样品乳液PCR过程,所述乳液PCR过程产生在颗粒(诸如IonSphereTM颗粒)上克隆扩增的样品核酸模板。分析物可以包括这样的颗粒:其具有与其连接的DNA片段(例如,基因组DNA片段、cDNA片段等)的克隆群体。
在本申请中,“引物”通常表示天然的或合成的寡核苷酸,其在与多核苷酸模板形成双链体以后,能够充当核酸合成的起点,且能够从它的3’末端沿着模板延伸,从而可以形成延伸的双链体。引物的延伸可以用核酸聚合酶(诸如DNA或RNA聚合酶)进行。在延伸过程中添加的核苷酸的序列可以由模板多核苷酸的序列确定。引物可以具有下述长度:在14-40个核苷酸的范围内,或在18-36个核苷酸的范围内,例如,或从N至M个核苷酸,其中N是大于18的整数,且M是大于N且小于36的整数等。其它长度当然是可能的。引物可以用于多种扩增反应中,包括使用单一引物的线性扩增反应,或采用2种或更多种引物的聚合酶链式反应等。关于为特定应用选择引物的长度和序列的指南,可以参见Dieffenbach和Dveksler(编),PCRPRIMER:ALABORATORYMANUAL(《PCR引物:实验室手册》),第2版(纽约的冷泉港实验室出版社(ColdSpringHarborLaboratoryPress),2003)。
在本申请中,“多核苷酸”或“寡核苷酸”通常表示核苷酸单体的线性聚合物,且可以是DNA或RNA。构成多核苷酸的单体能够通过单体-至-单体相互作用(诸如沃森-克里克型碱基配对、碱基堆积、Hoogsteen或反向Hoogsteen型碱基配对等)的常规模式特异性地结合天然多核苷酸。这样的单体和它们的核苷间键可以是天然存在的,或可以是其类似物,例如,天然存在的或非天然存在的类似物。非天然存在的类似物可以包括PNA、硫代磷酸酯核苷间键、含有允许连接标记(诸如荧光团或半抗原)的连接基团的碱基等。在一个实施方案中,寡核苷酸可以表示更小的多核苷酸,例如,具有5-40个单体单元。多核苷酸可以包括通过磷酸二酯键连接的天然脱氧核糖核苷(例如,脱氧腺苷、脱氧胞苷、脱氧鸟苷和脱氧胸苷(对于DNA)或它们的核糖相应物(对于RNA))。但是,它们还可以包括非天然的核苷酸类似物,例如,包括经修饰的碱基、糖或核苷间键。在一个实施方案中,多核苷酸可以由字母(大写或小写)的序列(诸如“ATGCCTG”)来表示,且应该理解,核苷酸从左至右是5’→3’次序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,和“T”表示脱氧胸苷,和“I”表示脱氧肌苷,和“U”表示脱氧尿苷,除非另外指出或从上下文显而易见。每当寡核苷酸或多核苷酸的使用需要酶促加工(诸如聚合酶的延伸、连接酶的连接等)时,普通技术人员会理解,在那些情况下的寡核苷酸或多核苷酸在任意或一些位置处不含有核苷间键、糖部分或碱基的某些类似物。除非另外指出,术语和原子编号惯例将遵循在Strachan和Read,HUMANMOLECULARGENETICS(《人分子遗传学》),第2版(纽约的威利斯公司 Wiley-Liss),1999)中公开的那些。多核苷酸的大小范围可以从几个单体单元(例如,5-40个)至几千单体单元等。
在本申请中,“确定的空间”(或“反应空间”,其可以与“确定的空间”互换使用)通常表示这样的任意空间(其可以是一维、二维或三维),其中可以限制、保留和/或定位至少一些分子、流体和/或固体。所述空间可以是预定的区域(其可以是平坦区域)或体积,且可以由例如在微孔板、微孔滴定板、微量培养板或芯片中或与其有关的凹坑或微型机器加工孔限定。所述区域或体积也可以基于流体或固体(例如,放置在区域上或放置在以其它方式限定空间的体积中)的量来确定。例如,在通常疏水的表面上的分离的疏水区域可以提供确定的空间。在一个实施方案中,确定的空间可以是反应室(诸如孔或微孔),其可以是在芯片中。在一个实施方案中,确定的空间可以是在没有孔的衬底上的基本上平坦的区域等。确定的空间可以含有或暴露于在核苷酸掺入中使用的酶和试剂。
在本申请中,“反应限制区域”通常表示,在其中可以限制反应的任何区域,且包括,例如,“反应室”、“孔”和“微孔”(它们中的每一个可以互换使用)。反应限制区域可以包括这样的区域:其中固体衬底的物理或化学属性可以允许目标反应的局部化,和衬底表面上的可以特异性地结合目标分析物的不连续区域(诸如具有与这样的表面共价连接的寡核苷酸或抗体的不连续区域)等。反应限制区域可以是中空的,或者具有界限清楚的形状和体积,所述形状和体积可以生产在衬底中。这些后述类型的反应限制区域在本文中被称作微孔或反应室,可以使用任意合适的微型制造技术来制造,且可以具有可根据特定用途选择的体积、形状、高径比(例如,基底宽度与孔深度之比)和其它尺寸特征,所述特定用途包括发生的反应的性质以及采用的试剂、副产物和标记技术(如果有的话)。反应限制区域也可以是在没有孔的衬底上的基本上平坦的区域等。在不同的实施方案中,可以如在一篇或多篇下述文献中所述来制造微孔:Doering和Nishi(编),HANDBOOKOFSEMICONDUCTORMANUFACTURINGTECHNOLOGY(《半导体生产技术手册》),第2版(CRC出版社(CRCPress),2007);Saliterman,FUNDAMENTALSOFBIOMEMSANDMEDICALMICRODEVICES(《BIOMEMS和医药微型装置》)(SPIE出版社(SPIEPressBook),2006);Elwenspoek等人,SILICONMICROMACHINING(《硅微加工技术》)(剑桥大学出版社(CambridgeUniversityPress),2004);等。在Rothberg等人,美国专利公开号2009/0127589和2009/0026082;Rothberg等人,英国专利申请公开号GB2461127;和Kim等人,美国专利号7,785,862(它们都通过引用整体并入)中公开了微孔或反应室的多种示例性构型(例如,间距、形状和体积)。
确定的空间或反应限制区域可以排列为阵列,所述阵列可以是元件(诸如传感器或孔)的基本上平面的一维或二维排列。二维阵列的列(或行)的数目可以相同或不同。优选地,所述阵列包含至少100,000个室。优选地,每个反应室的水平宽度和垂直深度具有约1:1或更低的高径比。优选地,反应室之间的间距是不超过约10微米。优选地,每个反应室具有不大于10μm3(即,1pL)的体积,或不大于0.34pL的体积,且更优选地不大于0.096pL或甚至0.012pL的体积。反应室可以具有例如22、32、42、52、62、72、82、92或102平方微米的顶部横截面面积。优选地,所述阵列可以具有例如至少102、103、104、105、106、107、108、109或更多个反应室。所述反应室可以电容式偶联至chemFET。微孔可以具有任意多角形横截面,包括正方形、矩形或八角形横截面等,且可以在表面上排列为直线阵列。微孔可以具有六角形横截面,且排列为六角形阵列,这允许与直线阵列相比更高的单位面积内的微孔密度。确定的空间或反应限制区域的阵列可以是在没有孔的基本上平坦的衬底上的不连续区域的阵列。
确定的空间或反应限制区域(无论是否排列为阵列或某些其它构型)可以与至少一个传感器发生电通信,以允许检测或测量一个或多个可检测的或可测量的参数或特征。所述传感器可以将反应副产物的存在、浓度或量的变化(或反应物的离子特性的变化)转化成输出信号,所述输出信号可以被电子地记录为例如电压水平或电流水平的变化,后者又可以被处理以提取关于化学反应或期望的结合事件(例如,核苷酸掺入事件)的信息。所述传感器可以包括至少一个化学敏感的场效应晶体管(“chemFET”),后者可以被构造成产生至少一个与在其附近的目标化学反应或靶分析物的性质有关的输出信号。这样的性质可以包括:反应物、产物或副产物的浓度(或浓度的变化),或物理性质的值(或这样的值的变化),诸如离子浓度。例如,对确定的空间或反应限制区域的pH的初步测量或询问可以被表示为电信号或电压,其可以被数字化(例如,转化成电信号或电压的数字表示)。这些测量和表示中的任一种可以是考虑的原始数据或原始信号。与本发明的教导一起使用的传感器的结构和/或设计可以宽泛地变化,且可以包括下述参考文献(它们都通过引用整体并入本文)的一个或多个特征:倒钩aro等人,美国专利号7,535,232;Esfandyarpour等人,美国专利申请公开号2008/0166727;Kamahori等人,美国专利申请公开号2007/0059741;Miyahara等人,美国专利申请公开号2008/0286767和2008/0286762;O’uchi,美国专利申请公开号2006/0147983;Osaka等人,美国专利申请公开号2007/0207471;Rothberg等人,美国专利申请公开号2009/0127589;Rothberg等人,英国专利申请公开号GB2461127;和Sawada等人,美国专利号7,049,645。
在本申请中,“反应混合物”通常表示“含有反应进行所必需的任何反应物的溶液,所述反应物可以包括、例如:在反应过程中维持pH在选择的水平的缓冲剂、盐、酶、辅因子、清除剂等。
在本申请中,“微流控装置”通常表示一个或多个互连的且流体连通的室、孔和通道的集成系统,并设计成单独地或与其它设备或仪器协同地实现分析反应或过程,所述其它设备或仪器会提供支持功能,诸如样品引入、流体和/或试剂驱动装置、温度控制、检测系统、数据收集和/或集成系统等。微流控装置可以进一步包括阀门、泵和在内壁上的专门的功能涂层,例如以防止样品组分或反应物的吸附、促进试剂的电渗移动等。这样的装置可以使用微型机械加工技术或精确模塑制造,例如制造在固体衬底中或制造为固体衬底,所述固体衬底可以是玻璃、塑料或其它固体聚合材料,且可以具有平面形式,以便于检测和监测样品和试剂运动,特别是通过光学或电化学方法。微流控装置的部件可以具有例如小于几百平方微米的横截面尺寸,且通道可以具有毛细管尺寸,例如具有约500μm至约0.1μm的最大横截面尺寸等。微流控装置可以具有例如在1μL至几nL范围内的容积容量,例如,10-100nL。
在不同的实施方案中,本文中描述的方法、系统、仪器和计算机可读介质可以有利地用于使用合成测序来确定一个或多个核酸样品的序列和/或身份。在合成测序中,可以如下确定靶核酸的序列:在充当合成反应的模板的靶核酸(其序列和/或身份有待确定)上逐步合成互补核酸链(例如,通过聚合酶延伸反应,其通常包括形成复合物,所述复合物包含模板(或靶多核苷酸)、与其对合的引物和聚合酶,所述聚合酶与引物-模板杂合物可操作地偶联或结合,从而能够将核苷酸物质(例如,核苷三磷酸、核苷酸三磷酸、前体核苷或核苷酸)掺入引物中)。在合成测序过程中,可以将核苷酸在与模板多核苷酸分子或链互补的位置顺序地加给增长中的多核苷酸分子或链。核苷酸向增长中的互补链的添加可以用于鉴别模板核酸的序列组成,所述添加可以使用多种方法(例如,焦磷酸测序、荧光检测和无标签的电子检测)来检测。可以迭代该过程,直到已经合成了与模板互补的完全的或选择的序列长度。
在不同的实施方案中,本文中描述的方法、系统、仪器和计算机可读介质可以有利地用于产生、处理和/或分析使用电子的或基于电荷的核酸测序所得到的数据和信号。在电子的或基于电荷的测序(例如,基于pH的测序)中,可以通过检测作为聚合酶催化的核苷酸延伸反应的天然副产物而产生的离子(例如,氢离子)来确定核苷酸掺入事件。这可以用于对样品或模板核酸测序,所述核酸可以是例如目标核酸序列的片段,且其可以作为克隆群体直接地或间接地连接至固体支持物,诸如颗粒、微粒、珠子等。所述样品或模板核酸可以与引物和聚合酶可操作地结合,且可以进行脱氧核苷三磷酸(“dNTP”)添加(其在本文中可以被称作“核苷酸流”,从其可产生核苷酸掺入)和洗涤的重复循环或“流”。所述引物可以与样品或模板对合,使得每当加入与模板中的下一个碱基互补的dNTP时,引物的3’末端可以被聚合酶延伸。然后,基于核苷酸流的已知序列和测得的指示在每个核苷酸流中的离子浓度的信号,可以确定与存在于反应室中的样品核酸结合的核苷酸的类型、序列和数目的鉴别。
图1解释了用于核酸测序的一个示例性系统的部件。所述部件包括流动池和传感器阵列100、参比电极108、多个试剂114、阀组116、洗涤溶液110、阀112、流控控制器118、管线120/122/126、通道104/109/111、废物容器106、阵列控制器124和用户界面128。所述流动池和传感器阵列100包括入口102、出口103、微孔阵列107和流动室105,所述流动室105限定试剂在微孔阵列107上的流动路径。参比电极108可以具有任意合适的类型或形状,包括同心圆柱体,其具有插入通道111的内腔中的流体通道或丝。试剂114可以通过流体途径、阀和流动池(通过泵)、气压或其它合适的方法来驱动,并且可以在离开流动池和传感器阵列100以后排入废物容器106中。试剂114可以例如含有要穿过通道130和穿过阀组116流动的dNTP,所述阀组116可以控制试剂114经由通道109向流动室105(在本文中也被称作反应室)的流动。所述系统可以包括用于容纳洗涤溶液的蓄池110,所述洗涤溶液可以用于洗掉例如以前可能流过的dNTP。微孔阵列107可以包括确定的空间或反应限制区域(诸如微孔)的阵列,例如,后者与传感器阵列可操作地结合,使得例如每个微孔具有适合用于检测目标分析物或反应性质的传感器。微孔阵列107可以优选地与传感器阵列一起集成为单个装置或芯片。所述流动池可以具有多种用于控制试剂在微孔阵列107上的路径和流速的设计,且可以是微流控装置。阵列控制器124可以给传感器提供偏置电压以及定时和控制信号,并收集和/或处理输出信号。用户界面128可以显示来自流动池和传感器阵列100的信息以及仪器设置和控制,并允许用户输入或设定仪器设置和控制。所述系统可以被构造成,在整个多步反应中使单一流体或试剂与参比电极108接触。所述阀112可以被关闭,以在试剂流动时防止任何洗涤溶液110流入通道109中。尽管洗涤溶液的流动可以被停止,仍然可能存在未断的流体以及参比电极108、通道109和传感器阵列107之间的电通信。可以选择在参比电极108与通道109和111的连接部之间的距离,使得几乎没有或没有流入通道109中和可能扩散进通道111中到达参比电极108的试剂的量。在一个实施方案中,可以将洗涤溶液110选择为与参比电极108连续接触,这对于使用频繁洗涤步骤的多步反应而言可以是特别有用的。
在不同的实施方案中,可以将流控控制器118程序化,以控制流动试剂114的驱动力和任意合适的仪器控制软件诸如LabView(德克萨斯州奥斯汀国家设备(NationalInstruments))对阀112和阀组116的操作,从而根据预定的试剂流排序将试剂递送至流动池和传感器阵列100。可以在预定的流速递送试剂预定的持续时间,且可以测量物理和/或化学参数,所述参数会提供关于在确定的空间或反应限制区域(例如,微孔)中发生的一个或多个反应的状态的信息。所述预定排序可以基于由较短的预定试剂流排序的连续重复(例如,4种核苷酸试剂的预定序列的连续重复例如“ACTGACTGACTG...”)组成的循环重复模式,可以完全地或部分地基于一些其它的试剂流模式(例如,本文中讨论的多种相保护试剂流排序中的任一种),且也可以基于它们的某种组合。
图2A解释了用于核酸测序的一个示例性流动池200的横截和放大视图。流动池200包括微孔阵列202、传感器阵列205和流动室206,其中试剂流208可以跨微孔阵列202的表面在微孔阵列202的微孔的开放末端上面移动。可以以任意合适的方式提供试剂(例如,核苷酸物质)的流动,所述方式包括:用移液器递送,或穿过连接至流动室的管或通道。对于每个试剂流而言,持续时间、浓度和/或其它流动参数可以相同或不同。同样地,每个洗涤流的持续时间、组成和/或浓度可以相同或不同。微孔阵列202中的微孔201可以具有任意合适的体积、形状和高径比,它们可以根据任意试剂、副产物和使用的标记技术中的一种或多种进行选择,且微孔201可以形成在层210中,例如,使用任意合适的微型制造技术。传感器阵列205中的传感器214可以是具有浮动栅218的离子敏感的(ISFET)或化学敏感的(chemFET)传感器,所述浮动栅218具有与微孔内部被钝化层216隔开的传感器板220,且所述传感器214可以主要对存在于钝化层216(其与传感器板220相对)上的电荷224的量做出响应(和产生与其有关的输出信号)。电荷224的量的变化会造成传感器214的源221和排液装置222之间的电流的变化,后者可以直接地用于提供基于电流的输出信号,或者间接地与额外电路一起提供电压输出信号。反应物、洗涤溶液和其它试剂可以主要通过扩散240而移动进微孔中。可以在微孔阵列202的一个或多个微孔中进行一种或多种分析反应,以鉴别或确定目标分析物的特征或性能。这样的反应可以直接地或间接地产生副产物,所述副产物会影响邻近传感器板220的电荷224的量。在一个实施方案中,参比电极204可以经由流动通道203与流动室206流体连接。在一个实施方案中,所述微孔阵列202和所述传感器阵列205可以一起形成集成单元,所述集成单元形成流动池200的底壁或底板。在一个实施方案中,可以将分析物的一个或多个拷贝附接到固相支持物212,后者可以包括微米颗粒、纳米颗粒、珠子、凝胶,且可以是固体的和多孔的,等。所述分析物可以包括核酸分析物(包括单个拷贝和多个拷贝),且可以例如在不需要固体支持物的情况下通过滚环扩增(RCA)、指数RCA或其它合适的技术来制备以产生扩增子。
图2B解释了跨一个示例性微孔阵列的部分234移动的连续试剂之间的一个示例性均匀流锋线。在第一试剂232和第二试剂230之间的“均匀流锋线”通常表示这样的试剂:其随着其移动几乎没有或没有混合,由此保持它们之间的边界236是狭窄的。所述边界可以是直线的(对于具有在它们的流动室的相对末端处的入口和出口的流动池),或者它可以是曲线的(对于具有中央入口(或出口)和周围出口(或入口)的流动池)。在一个实施方案中,可以选择流动池设计和试剂流速,使得在从一种试剂转换成另一种试剂的过程中,每个新试剂流在经过流动室时具有均匀流锋线。
图3A解释了穿过流动室的示例性流动路径,所述流动室具有在对角相对的入口和出口。试剂在沿着流动室的对角线轴线在入口302和出口304之间移动时,可以遵循流动路径300,该路径可以在沿路没有到达例如角301。
在一个实施方案中,流动池可以将试剂流引导至微孔阵列,使得当将试剂递送至该阵列时,在微孔阵列中的每个微孔例如基本上同时暴露于基本上相同的流动条件,诸如流速和浓度(如本文中关于这样的暴露所使用的,“基本上同时”通常表示,与微孔暴露于任一种试剂的时间长度相比,两种连续试剂之间的边界穿过流动室的渡越时间较小)。在一个实施方案中,流动池可以具有位于流动室(限于直线空间)的对角处的入口和出口,且在这样的构型中,在每个微孔处达到相同的流速是不可能的。尽管如此,然后可以优选地通过流动室和它限定的流动路径使由不同微孔经历的流动条件(诸如流速)的任何差异最小化。
图3B解释了一个示例性流动室308,其具有通过参考试剂流动路径的范围而限定的一个示例性传感器阵列区域。所述流动室可以包括试剂在从入口302移至出口304时所覆盖的区域(不包括在边界307以外的区域306,所述边界307限定了试剂流在流动室中到达的范围),该区域可以用于定位微孔。
图4A和4B示意地解释了无标签的、基于pH的测序的一个示例性过程。将具有序列685和引物结合位点681的模板682附接到固相支持物680。所述模板682可以作为克隆群体附接至固体支持物,诸如微粒或珠子等,且可以如在Leamon等人的美国专利号7,323,305(其通过引用整体并入本文)中所公开地进行制备。在一个实施方案中,所述模板可以与衬底表面结合,或者在联接到或不联接到支持物的情况下存在于液相中。引物684和DNA聚合酶686可操作地结合至模板682。本文中使用的“可操作地结合”通常表示,引物与模板对合,使得引物的3’末端可以被聚合酶延伸,并且聚合酶与这样的引物-模板双链体结合(或与其紧密靠近),使得当加入dNTP时可以发生结合和/或延伸。在步骤688中,加入dNTP(显示为dATP),DNA聚合酶686掺入核苷酸“A”(因为“T”是模板682中的下一个核苷酸,且与流动的dATP核苷酸互补)。在步骤690中,进行洗涤。在步骤692中,加入下一个dNTP(显示为dCTP),DNA聚合酶686掺入核苷酸“C”(因为“G”是模板682中的下一个核苷酸)。至少部分地使用下述文献的一个或多个特征,可以执行基于pH的核酸测序,其中可以通过测量作为聚合酶催化的延伸反应的天然副产物而产生的氢离子来确定碱基掺入:Anderson等人,ASYSTEMFORMULTIPLEXEDDIRECTELECTRICALDETECTIONOFDNASYNTHESIS(《DNA合成的多重引导电子检测系统》),SensorsandActuatorsB:Chem.,129:79-86(2008);Rothberg等人,美国专利申请公开号2009/0026082;和Pourmand等人,DIRECTELECTRICALDETECTIONOFDNASYNTHESIS(《DNA合成的引导电子检测》),Proc.Natl.Acad.Sci.,103:6466-6470(2006),它们都通过引用整体并入本文。在一个实施方案中,在每次加入dNTP以后,可以执行一个额外步骤,其中用dNTP-破坏剂(诸如腺苷三磷酸双磷酸酶)处理反应室,以消除保留在室中的任何残余的dNTP,其可能在后续循环中导致假延伸。图4B进一步解释了该方法的不同方面,同时提供了关于第一核苷酸掺入(左)和第二掺入(右)的额外细节,所述第一核苷酸掺入导致蛋白单个A掺入的示意信号,所述第二掺入导致代表一对T掺入的示意信号。
在一个实施方案中,可以以预定的次序或排序对引物-模板-聚合酶复合物进行一系列不同核苷酸的暴露。如果掺入了一个或多个核苷酸,那么可以检测到由所述掺入引起的信号,并且在核苷酸添加、引物延伸和信号获取的重复循环以后,可以确定模板链的核苷酸序列。在该过程中测得的输出信号取决于核苷酸掺入的数目。具体地,在每个添加步骤中,只有模板中的下一个碱基与添加的dNTP互补时,聚合酶才通过掺入添加的dNTP来延伸引物。如果存在一个互补碱基,那么存在一个掺入;如果存在两个互补碱基,那么存在两个掺入;如果存在三个互补碱基,那么存在三个掺入;以此类推。对于每个掺入,会释放出一个氢离子,并且一群释放的氢离子共同地改变反应室的局部pH。氢离子的产生可以与模板中的连续互补碱基的数目(以及参与延伸反应的、具有引物和聚合酶的模板分子的总数)线性相关。因而,当在模板中存在许多连续的相同互补碱基(其可以代表同聚物区域)时,产生的氢离子的数目和因此局部pH变化的量级与连续的相同互补碱基的数目成比例(且对应的输出信号则有时被称作“1-聚体”、“2-聚体”、“3-聚体”输出信号等)。如果模板中的下一个碱基不与添加的dNTP互补,那么不会发生掺入,也不会释放氢离子(且输出信号则有时被称作“0-聚体”输出信号)。在所述循环的每个洗涤步骤中,可以使用在预定pH的未缓冲的洗涤溶液来除去前一步骤的dNTP,以便防止在以后的循环中的错误掺入。在一个实施方案中,将4类不同的dNTP顺序地加入反应室中,使得每个反应暴露于4种不同的dNTP,一次暴露于一种。在一个实施方案中,以下述次序加入4类不同的dNTP:dATP、dCTP、dGTP、dTTP、dATP、dCTP、dGTP、dTTP等,每个暴露、掺入和检测步骤继之以洗涤步骤。继之以洗涤步骤的向核苷酸的每次暴露可以被视作“核苷酸流”。4个连续核苷酸流可以被视作“循环”。例如,2个循环核苷酸流次序可以表示为:dATP、dCTP、dGTP、dTTP、dATP、dCTP、dGTP、dTTP,每个暴露继之以洗涤步骤。不同的流次序当然是可能的。
图4C-4P示意地解释了使用合成测序对靶标测序的示例性的基于流的步骤。这里解释的靶标的例子包括,例如,A连接器、测序码或代码(在该实施例中“AGTC”)、目标序列(在该实施例中“ATTAC...”)和与颗粒(例如)附接或结合的P1连接器。图4C解释了T核苷酸物质的第一流,其导致单个掺入(T“1-聚体”),因为第一个可利用的碱基是A,它是互补的。图4D解释了A核苷酸物质的第二流,其没有导致掺入(A“0-聚体”),因为下一个可利用的碱基是G,它不是互补的。图4E解释了C核苷酸物质的第三流,其导致单个掺入(C“1-聚体”),因为下一个可利用的碱基是G,它是互补的。图4F解释了G核苷酸物质的第四流,其没有导致掺入(G“0-聚体”),因为下一个可利用的碱基是T,它不是互补的。图4G解释了T核苷酸物质的第五流,其没有导致掺入(T“0-聚体”),因为下一个可利用的碱基是T,它不是互补的。图4H解释了A核苷酸物质的第六流,其导致单个掺入(A“1-聚体”),因为下一个可利用的碱基是T,它是互补的。图4I解释了C核苷酸物质的第七流,其没有导致掺入(C“0-聚体”),因为下一个可利用的碱基是C,它不是互补的。图4J解释了G核苷酸物质的第八流,其导致单个掺入(G“1-聚体”),因为下一个可利用的碱基是C,它是互补的。图4K解释了T核苷酸物质的第九流,其导致单个掺入(T“1-聚体”),因为下一个可利用的碱基是A,它是互补的。图4L解释了A核苷酸物质的第十流,其导致双重掺入(A“2-聚体”),因为接下来的2个可利用的碱基是T,它们是互补的。图4M解释了C核苷酸物质的第十一流和G核苷酸物质的第十二流,其没有导致掺入(C和G“0-聚体”),因为下一个可利用的碱基是A,它不是互补的。图4N解释了T核苷酸物质的第十三流,其导致单个掺入(T“1-聚体”),因为下一个可利用的碱基是A,它是互补的。图4O解释了A核苷酸物质的第十四流和C核苷酸物质的第十五流,其没有导致掺入(A和C“0-聚体”),因为下一个可利用的碱基是C,它不是互补的。最后,图4P解释了G核苷酸物质的第十六流,其导致单个掺入(G“1-聚体”),因为下一个可利用的碱基是C,它是互补的。在每种情况下,也解释了与同聚物长度(例如,0、1、2、...)成比例的信号。尽管图4C-4P的实施例的流排序是根据“TACGTACG...”,也可以使用其它流,诸如本文中讨论的多种相保护试剂流排序中的任一种。
图4Q解释了示例性的基于pH的原始测序数据,其对应于与多个核苷酸流有关的计数。在该实施例中,试剂流排序是“TACGTACGTCTGAGCATCGATCGATGTACAGC”(整体一次性流入,然后继之以它的前8个流)。在y-轴上的计数是标度尺,其可以被视作电压输出信号的代表,所述电压输出信号的量级通常与响应于多个核苷酸流中的每一个可能已经产生的核苷酸掺入的数目成比例。换而言之,所述信号应当保持接近于基线(对于0-聚体),应当达到大约1(对于1-聚体),应当达到大约2(对于2-聚体),应当达到大约3(对于3-聚体),以此类推。X-轴代表时间。
图4R解释了示例性的流-并-流数值,其对应于可以进行同聚物长度预测的基于pH的原始测序数据。对于每个特定流(其类型如下表示:圆圈代表A,正方形代表C,菱形代表G,且三角形代表T),它们对应于可以从其确定同聚物长度的数值。在该实施例中,T的第一流显示了约为1的值,从而提示T的单个掺入;A的第二流显示了约为0的值,从而提示A的零掺入,以此类推。基于从所述预定流排序中的每个流已经产生的这样的预测同聚物长度的知识,可以推断出可能的靶标序列。
在不同的实施方案中,可以以不同的方式处理由核苷酸掺入引起的输出信号以提高它们的质量和/或信噪比,所述方式可以包括,执行或实现在下述文献中公开的一种或多种教导:Rearick等人,2011年12月29日提交的美国专利申请号13/339,846,其基于2010年12月30日提交的美国临时专利申请号61/428,743,和2011年1月3日提交的美国专利申请号61/429,328,和Hubbell,2011年12月29日提交的美国专利申请号13/339,753,其基于2010年12月29日提交的美国临时专利申请号61/428,097,它们都通过引用整体并入本文。
在不同的实施方案中,考虑到流入何种核苷酸物质和以何种次序得到这样的信号的知识,可以进一步处理由核苷酸掺入引起的输出信号,以做出所述流的碱基调用和将与样品核酸模板有关的连续碱基调用编译成读数。碱基调用表示特定核苷酸鉴别(例如,dATP(“A”)、dCTP(“C”)、dGTP(“G”)或dTTP(“T”))。碱基调用可以包括,执行一个或多个信号标准化、信号相和信号偏差(例如,酶效率损失)估测、和信号校正,且可以鉴别或估测每个确定的空间的每个流的碱基调用。碱基调用可以包括,执行或实现在下述文献中公开的一个或多个教导:Davey等人,2011年10月27日提交的美国专利申请号13/283,320,其基于2010年10月27日提交的美国临时专利申请号61/407,377,它们二者通过引用整体并入本文。信号处理和碱基调用的其它方面可以包括,执行或实现在下述文献中公开的一个或多个教导:Davey等人,2011年12月29日提交的美国专利申请号13/340,490,其基于2010年12月30日提交的美国临时专利申请号61/428,733,它们都通过引用整体并入本文。
在使用合成测序时可能产生的几类测序误差可以影响可以实现的测序准确度和测序效率。这些误差中的一些与同步问题有关。具体地,可以在给定的测序反应中基本上同时地分析基本上相同的模板链的较大群体(例如,103至107个分子),以得到足够不同的和可分辨的信号用于合成测序中的可靠检测,并且合乎需要的是,链的合成逐步进行,或彼此相同步地进行。当存在与群体中的模板分子结合的互补链的均匀和/或同时延伸时,可以提高信噪比。当它们在给定的反应步骤中在结合的模板分子的相同序列位置处执行相同掺入步骤时,与模板分子群体有关的每个延伸反应可以被描述为通常彼此“同相”或“相同步”。但是,已经观察到,每个群体中相对小部分的模板分子可以与所述群体的大部分模板分子丢失或失去相同步(例如,可以变成“异相”)。也就是说,与特定比例的模板分子有关的掺入事件可以在测序运行中发生在其它类似的模板分子的前面或后面。在Ronaghi,GENOMERESEARCH(《基因组研究》),11:3-11(2001);Leamon等人,CHEMICALREVIEWS(《化学综述》),107:3367-3376(2007);Chen等人,国际公开号WO2007/098049中描述了这样的相损失效应。
一种这样的相损失效应涉及“不完全延伸”(IE)事件或误差。IE事件可以由于测序反应失败而发生,以将一个或多个核苷酸物质掺入给定的循序延伸循环的一个或多个新生分子中,例如,这可以导致后续反应在这样的序列位置处:所述序列位置与所述群体的大部分序列位置异相(例如,某些模板延伸落在主要模板群体的后面)。例如,IE事件可以由于下述原因而发生:由于群体的一部分模板/聚合酶复合物缺乏核苷酸可用性,或由于一部分聚合酶分子因为缺乏聚合酶活性而不能在适当的时间将核苷酸掺入互补链中,或由于一些其它的有关的原因或因素。
另一种这样的相损失效应涉及“推进”(CF)事件或误差。CF事件可以由于新生分子的不适当延伸而发生,所述不适当延伸将一个或多个核苷酸物质掺入这样的序列或链位置:其在安置所述群体的序列或链位置的前面且与其异相。CF事件可以由于下述原因而产生:例如,由于核苷酸物质的错误掺入,或在某些情况下,由于前一循环剩余的污染或多余的核苷酸(例如,其可以源自反应室的不充分或不完全洗涤)。例如,小部分的“T”核苷酸循环可能存在或推进至“C”核苷酸循环。两种核苷酸的存在可能导致一部分增长中的链的不希望的延伸,其中除了“C”核苷酸以外还掺入“T”核苷酸,使得仅在通常会预见到单一类型的核苷酸掺入的情况下,发生多个不同的核苷酸掺入事件。CF事件也可能由于聚合酶误差而发生(例如,可能存在核苷酸物质向新生分子中的不适当掺入,所述新生分子不与模板分子上的核苷酸物质互补)。
图5解释了示例性IE和CF事件,所述事件可以在合成测序过程中发生和导致相同步的损失。它显示了3个DNA双链体。对于每个双链体,下一行框代表模板多核苷酸链32,且上一行框代表被聚合酶延伸的互补延伸链30。所述延伸链包括引物部分,如横条所示。(·)-填充的框指示互补核苷酸的掺入。上面的DNA双链体(标有“同相”)代表群体中处于正确相的成员。中间的DNA双链体(标有“IE”)代表群体中已经经历在C核苷酸处的省略的部分(IE误差)。下面的DNA双链体(标有“CF”)代表群体中已经经历在G核苷酸处的错误掺入的部分(CF误差)。
与IE和CF事件有关的误差或定相问题可能随时间加重(由于这样的事件的积累),这可能造成序列信号或质量随时间的劣化和系统的实际读出长度(例如,对于给定的模板,可以测序的核苷酸的数目)的总体减小。本发明的教导反映了下述发现:向合成测序反应递送的核苷酸的特定组成、性质和序列可能影响测序性能(例如,测序的效率和/或准确度)。
根据不同的实施方案,提供了方法、系统、仪器和计算机可读介质,其用于执行合成测序,并同时减少测序误差或使其最小化,所述测序误差与可能伴随合成测序发生的前述相损失效应有关。所述方法、系统、仪器和计算机可读介质可以包括用于执行合成测序的步骤和/或结构元件,所述合成测序使用根据预定排序流动的试剂。尽管所述预定排序可以基于由较短的预定试剂流排序的连续重复(例如,4种核苷酸试剂的预定序列的连续重复等)组成的循环重复模式,但是所述预定排序可以有利地完全地或部分地包含如本文中所述的相保护试剂流排序。
图6A解释了用于获得、处理和/或分析核酸测序数据的一个示例性系统。所述系统包括测序仪器601、服务器602或其它计算装置或资源、和一个或多个最终用户计算机605或其它计算装置或资源。测序仪器601可以被构造成根据预定排序来递送试剂,所述排序可以基于由较短的预定试剂流排序的连续重复(例如,4种核苷酸试剂的预定序列的连续重复诸如“TACGTACG...”)组成的循环重复模式,或者可以基于完全地或部分地包含如本文中所述的相保护试剂流排序的排序,或它们的某种组合。服务器602可以包括处理器603和存储器和/或数据库604。测序仪器601和服务器602可以包括一个或多个计算机可读介质,用于获得、处理和/或分析核酸测序数据。在一个实施方案中,所述仪器和所述服务器或其它计算装置或资源可以被构造为单个部件。可以使用这些部件中的一个或多个来执行或实现本文中描述的实施方案的一个或多个方面。
图6B解释了获得、处理和/或分析核酸测序数据的一个示例性方法。在步骤611中,用户从仪器获得物理测序数据,所述仪器被构造成至少部分地使用一个或多个相保护试剂流排序。所述物理测序数据可以包括指示氢离子浓度的电压数据等,且可以基于由较短的预定试剂流排序的连续重复(例如,4种核苷酸试剂的预定序列的连续重复诸如“TACGTACG...”)组成的循环重复模式,或可以基于完全地或部分地包含如本文中所述的相保护试剂流排序的排序,或它们的某种组合等。在步骤612中,所述服务器或其它计算装置或资源将所述物理测序数据转换成碱基的序列。在步骤613中,所述服务器或其它计算装置或资源将物理测序数据和/或碱基序列递送至最终用户。可以使用这些步骤和/或部件中的一个或多个来执行或实现本文中描述的实施方案的一个或多个方面。
在一个实施方案中,可以连贯地且总是以相同的次序重复递送(流动)4个不同试剂流的预定排列(例如,A、C、T和G的可能的4-流排列中的任一种,诸如ACTG、CATG、GATC或CTAG等)。例如,递送的第一核苷酸可以是dATP,然后是dCTP,然后是dGTP,然后是dTTP(或它们的变换),此后可以连贯地重复4种核苷酸的该序列(其可以被称作“循环”)任意次数。核苷酸向反应容器或室的递送可以被称作核苷酸三磷酸(或dNTP)的“流”。为了方便,dATP的流有时将被称作“A的流”或“A流”,且流的序列可以被表示为字母的序列,诸如“ATGT”指示“dATP的流,继之以dTTP的流,继之以dGTP的流,继之以dTTP的流”。在每个流中,聚合酶通常可以通过掺入流动的dNTP来延伸引物,其中模板链的下一个碱基是流动的dNTP的补体。但是,当使用这样的循环的、连贯重复流时,不同步模板通常不会获得与同步群体重新同步的机会,这可能导致相相关的测序误差。此外,尽管这样的循环的、连贯重复流在延伸每个流所得到的序列方面通常是有效的,由于要确保在目前流的3个流内辨别下一个未知碱基,这样的方案可能是有问题的,因为这样的流次序不会提供相保护的机会。
根据不同的实施方案,可以使用完全地或部分地包含相保护试剂流排序的流排序来执行合成测序反应,这可以帮助减少和/或校正可能由IE和/或CF事件引起的模板多核苷酸链群体中的相同步的损失。具体地,这样的流排序可以给不同步模板提供与同步群体重新同步(进入相同相或重新同步)的机会,以便改变模板群体的进化途径,这又可以降低不同步模板在群体中的比例和/或抵消积累的模板相移。换而言之,这样的流排序可以至少部分地推迟待测序的主要模板群体的进展,并至少允许一部分异相群体追上。同样地,对于已经前进到主要群体前面的异相序列,这样的流排序可以至少部分地推迟异相群体的进展,并至少允许一部分主要群体追上。在某些实施方案中,这样的流可以用于完全地除去或减少相移,但是作为一种平衡或减少积累的相移效应的机制,同时维持有效的或合乎需要的流数,以实现选择的/预期的处理量(例如,用于对各个模板长度测序的流)。因而,这样的流可能导致:CF和/或IE事件的减少和/或校正,相同步的改善,信噪比、碱基调用准确度、和/或测序运行的总读出长度的增加。
在不同的实施方案中,相保护试剂流排序可以是这样的流排序:其(1)不是4种不同试剂的4-流排列的一系列连续重复(例如,“ACTGACTG...”或“CAGTCAGT...”等),且(2)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的。更具体地,在这样的实施方案中,所述流排序不是4种给定试剂的4!=24种可能的4-流排列中的任一种的一系列连续重复(例如,用于执行合成测序反应的dNTP或任意其它有关试剂),不是为待测序的特定模板多核苷酸链专门定制的,且不是为待使用的特定测序引物专门定制的,所以所述相保护剂试流排序可以广泛适用于任意模板或至少适用于可能共有某些共同性能的模板种类。
在不同的实施方案中,通过向序列中引入一个或多个试剂变化(例如,“ACAGACTG”或“CACTCAGT”,其中相对于“ACTGACTG...”或“CAGTCAGT...”做出用粗体和下划线显示的一个变化),可以从这样的流排序衍生出相保护试剂流排序:其是4种不同试剂的4-流排列的一系列连续重复(例如,“ACTGACTG...”或“CAGTCAGT...”等)。更一般而言,可以从这样的连续系列做出2、3、4、5、10、15、20或更多个变化,且相保护试剂流排序因而可以是试剂的基本上非循环的、非重复的模式。
在不同的实施方案中,相保护试剂流排序可以是“TACTCAGTATGCAGACTGCG”、“TACGTACGTACTCAGCTAGCTAGTATGCATGCATGCAGACTGACTGACTGCG”、“TACGTACGTACTCAGCTAGTATGCATGCAGACTGACTGCG”、“TACGTACGTTACTCAGCTAAGTATGCATGGCAGACTGACCTGCG”、“TACGTACGTCTGAGCATCGATCGATGTACAGC”、“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”、“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”和“TACGTACGTAGCTGACGTACGTCATGCATCGATCAGCTAGCTGACGTAGCTAGCATCGATCAGTCATGACTGACGTAGCTGACTGATCAGTCATGCATCG”等。其它流排序当然是可能的(注:为了促进易读性,有时可以使用被间隔隔开的流组列出过长的流排序(例如,“TACGTACG”,而不是“TACGTACG”);但是,间隔的存在不具有除了促进易读性以外的任何特定含义或重要性)。
在不同的实施方案中,相保护试剂流排序可以从一组k-arydeBruijn序列B(k,n)衍生出,其中k表示字母表的大小(例如,对于包含核苷酸物质A、C、G和T的字母表,可以将k设定为4),且其中n表示字母表中的子序列的长度。序列B(k,n)是这样的:字母表中的长度n的每个可能的子序列刚好出现1次,作为连续字符的序列。用于流次序确定deBruijn方案理想地提供了对所有4种碱基测序的有效方式,同时涵盖了潜在的二聚体,并且通常提供良好的不相关的碱基流特征。作为一个例子,对于字母表A={0,1},存在单个B(2,2)序列“0011”,且存在2个不同的B(2,3)序列“00010111”和“11101000”,它们中的每一个是另一个的反转和/或否定。关于deBruijn序列和有关概念的更多信息,可以参见:Ehrenfest和deBruijn,CIRCUITSANDTREESINORIENTEDLINEARGRAPHS(《定向线路图中的回路和树》),SimonStevin,28:203-217(1951);deBruijn,ACKOWLEDGEMENTOFPRIORITYTOC.FLYESAINTE-MARIEONTHECOUNTINGOFCIRCULARARRANGEMENTSOF2NZEROSANDONESTHATSHOWEACHN-LETTERWORDEXACTLYONCE(《认可C.FLYESAINTE-MARIE在计算能使每个N-字母的字码确切显示一次的2N个0和1的循环排列中的在先成就》),T.H.-报告75-WSK-06,埃因霍芬理工大学(TechnologicalUniversityEindhoven)(1975);和Berstel和Perrin,THEORIGINSOFCOMBINATRONICSONWORDS(《组合学字码来源》),欧洲组合出版社(EuropeanJournalofCombinatronics),28:996-1022(2007),它们都通过引用整体并入本文。在不同的实施方案中,相保护试剂流排序可以是核苷酸物质A、C、G和T的deBruijn序列(具有4个成员的字母表),其中n=2或其中n=3,没有相同核苷酸物质的任何连续重复。在一个实施方案中,相保护试剂流排序可以是包含“TACGTCTGAGCA”的排序。在一个实施方案中,相保护试剂流排序可以是Kautz序列,其为不具有相同字符的任何连续重复的deBruijn序列。
在不同的实施方案中,可以衍生出相保护试剂流排序,从而包含4种试剂的所有可能的不同的二聚体对(例如,核苷酸物质A、C、G和T,其中关于对的“不同”通常表示,构成所述对的核苷酸物质彼此不同)。例如,所述排序可以包括A、C、G和T的12个不同二聚体对(它们是AG、AC、AT、CA、CG、CT、GA、GC、GT、TA、TC和TG)。尽管将12个不同二聚体对中的每一个相继地连接在一起会产生24-流序列,构建含有所有12个不同对的流序列不一定需要24-流序列。通过重叠至少一些二聚体,可以构建更短的流序列。例如,6-流序列AGCATC包括对AG、GC、CA、AT和TC。在一个实施方案中,这样的流排序可以是基于deBruijn序列的流排序,其包含12个碱基的基本上所有的不同对。例如,12-流序列“TACGTCTGAGCA”含有刚好出现1次的所有12个不同对(当重复所述序列时,AT对出现在环绕区),并提供了对所有4种核苷酸测序的能力,同时提供合乎需要的相移性能。所述12个不同对可以被包含在更长的流序列中。例如,32-流序列“TACGTACGTCTGAGCATCGATCGATGTACAGC”含有12个不同二聚体对中的每一个。该改变可以有利地应用于未封端的测序反应的背景中,因为重复的碱基(例如,同聚物)通常不会在单独的连续流中被测序,而是在与同聚核苷酸相对应的相同流内被测序。
在不同的实施方案中,相保护试剂流排序可以包括这样的流排序:其中在排序中以至少2种不同方式(例如,排序包括“TG”、“TC”和“TA”中的至少2个),在至少一个碱基(例如,“T”)之后是不同的碱基(例如,“G”、“C”或“A”)。换而言之,这样的流排序可以包括:N流之后紧跟着X流,其中X和N是代表不同的核苷酸物质的变量,同时进一步包括,在此后紧跟着或者在排序中的别处,另一个N流之后紧跟着Y流,其中Y是代表不同于X和N的核苷酸物质的变量。例如,这样的流排序可以含有下述流序列:“TG...TC...TA”。在另一个实施方案中,这样的流排序可以包括:X流之后紧跟着N流,其中X和N是代表不同的核苷酸物质的变量,同时进一步包括,在此后紧跟着或者在排序中的别处,Y流之后紧跟着N流,其中Y是代表不同于X和N的核苷酸物质的变量。例如,这样的流排序可以是“TACGTACGTACGTACGTACGTACGTACGCACGTGCGTATG”,其中TACG流排序的几个循环之后是包括CG和TG的排序,其中G核苷酸流之前是C和T(应当指出,该排序也包括AC和GC、GT和AT、和CA和TA,它们也遵循该模式)。
在不同的实施方案中,相保护试剂流排序可以包括这样的排序:其中4种核苷酸物质A、C、G和T中的3种在第四核苷酸物质流动之前流动至少2次。例如,流序列“TACTACG”在第四核苷酸物质G流动之前重复T、A和C中的每一个。在另一个实施例中,流序列“TACATACG”在第四种核苷酸G流动之前将T重复2次、将C重复2次和将A重复3次。在该方案中,流排序使模板群体饥饿第四核苷酸物质。第四核苷酸物质的这种饥饿可以导致模板群体的许多或大多数模板等待第四种核苷酸进行掺入,从而提供用第四种核苷酸流使模板群体重新同步的机会。“饥饿”流排序的其它例子包括(饥饿核苷酸标有下划线):具有G-饥饿、然后具有C-饥饿和然后具有T-饥饿的20-流序列(“TACTCAGTATGCAGACTGCG”);40-流序列(“TACGTACGTACTCAGCTAGTATGCATGCAGACTGACTGCG”)和52-流序列(“TACGTACGTACTCAGCTAGCTAGTATGCATGCATGCAGACTGACTGACTGCG”)等。4种核苷酸物质A、C、G和T中的每一种可以交替作为饥饿核苷酸。例如,流序列“TACATACG”可以用于饥饿G的群体,然后流序列“ACGACGT”可以用于饥饿T的群体,然后流序列“TAGTAGC”可以用于饥饿C的群体,然后流序列“CGTCGTA”可以用于饥饿A的群体。该实施方案(其中模板群体被饥饿4种不同核苷酸物质中的每一种)又可以以任意合适数目的流来实现,包括、例如,20-流序列(允许一个流集合与另一个流集合的一些重叠)。在一个实施方案中,这样的流排序可以在连续重复中不包括4种核苷酸中的每一种之一,且可以包括插入流,其中在流序列中递送所有4种核苷酸之前,递送一个或多个核苷酸流多次(例如,这样的流排序可以是“TCTAGACTCGAG”)。
在不同的实施方案中,相保护试剂流排序可以包括第一组流和第二组流,其中第二组流源自第一组流中的核苷酸物质的重新绘图。所述重新绘图可以包括:将第一组流中的一种特定物质的核苷酸(例如,所有的A或所有的C)分配给不同核苷酸物质,以产生第二组流的流排序。该重新绘图可以包括第一组流中的核苷酸物质的全部实例或小于全部实例的重新分配。可能存在第一组流中的2类或更多类核苷酸物质的重新绘图。因为它源自重新绘图,这样的第二组流不同于第一组流。例如,第一组流可以是“TACGTCTGAGCA”,且第二组流可以通过如下重新分配核苷酸物质来建立:对于第一组流中的核苷酸物质的每个实例,G→A、C→G和A→C。通过该重新绘图酶,第二组流变成“TCGATGTACAGC”。在另一个实施例中,“TACGTACGTCTGAGCATCGATCGATGTACAGC”由第一组16个流和随后的第二组16个流组成,所述第二组通过下述重新绘图分配来产生:G→A、C→G和A→C。在不同的实施方案中,这样的流排序可以含有基于其它重新绘图的额外流组。例如,可能存在第三组流,其源自第一组流或第二组流的重新绘图。
当与具有重新同步性能的流排序一起使用时,这样的基于流重新绘图的流排序实施方案可以是特别有用的,因为所述重新同步性能被保留在第二组流中,但是总流排序的多样性增加。例如,如果第一组流是具有重新同步性能的deBruijn序列,那么由重新绘图产生的第二组流也将是具有重新同步性能的deBruijin序列,但是具有不同的流次序。所以,相同流排序的重复减少,且流次序的总多样性增加。增加流排序的多样性可以进一步增强流排序的重新同步性能。例如,在没有通过例如重新绘图来提供额外多样性的情况下,模板群体中的一部分模板可能进入不同步相,后者处于偏离同步相的稳定偏移排列。不同步模板的该稳定群体可以积累在是重复流排序循环的多倍的偏移处。因为是偏离同步群体的稳定偏移排列,该特定不同步群体可能从未获得追上同步群体或变得与同步群体同步的机会。但是增加流排序的多样性(例如,通过重新绘图),可能阻碍不同步模板的稳定群体的进化能力。
根据不同的实施方案,流排序可以包括上述流模式中的一个或多个。例如,这样的流排序可以是“TACATACGCACGTGCGTATG”,其具有上述流模式中的几个。具体地,该排序具有重新绘图特征:第二5-流组是第一5-流组的重新绘图,其中T→A、A→C和C→G;第三5-流组是第二5-流组的重新绘图,其中A→C、C→G和G→T;且第四5-流组是第三5-流组的重新绘图,其中C→G、G→T和T→A。它也包括子序列,其中核苷酸物质N的流之后是不同核苷酸物质X的流,所述X的流之后再次是N的流,所述N流然后继之以Y流,所述Y是不同于X和N的核苷酸物质(具体地,子序列ACAT、CGCA、GTGC和TATG遵循该模式)。并且它也包括这样的模式:其中群体被饥饿G核苷酸,然后被饥饿T核苷酸,然后被饥饿A核苷酸。
在不同的实施方案中,相保护试剂流排序可以使用组合优化方式来构建。例如,可能构建接连地含有核苷酸物质A、C、G和T的所有24种可能的4-流排列的流排序,邻近排列4-流块之间的差异在有些度量是最小的(例如,确保没有核苷酸物质比3个流更靠近或比5个流更远)。这样的样品约束可以如下实现:要求邻近排列块仅相差2个核苷酸物质的单个对换。24个4-流排列中的每一个在图中可以由顶点表示,并且如果对应的排列相差单个对换,可以在任意2个顶点之间插入边缘。含有这些排列块的流排序然后对应于该图中的路径,且精确地含有所有24个排列1次并返回起始排列的流排序则在该图中是Hamiltonian路径或回路。找到Hamiltonian回路(如在该实施例中)允许构建这样的流次序:其在排列中是高度不同的,同时维持延伸序列的良好效率。在本文中提及的CONTRADANZON流排序是使用这样的组合优化方案所构建的排序的一个示例(尽管该特定排序包括允许使用某些键序列的轻微改变)。
在不同的实施方案中,如本文中所述的任何相保护试剂流排序可以具有最小长度(例如,在流数目方面),其可以是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50等,或更一般地,其可以是大于4的任意正整数。在某些实施方案中,可以完全地或部分地重复流排序,以完成测序运行和/或达到期望的最小长度。
在不同的实施方案中,流排序可以包括多个不同的相保护流排序的组合和/或一个或多个相保护流排序与一个或多个其它流排序(例如,4种不同试剂的预定排列的连续重复)的组合,从而形成期望长度的更长流排序和/或平衡不同类型的流排序的性能。这样的流排序可以包括一类的流和随后的不同类的流,且两类流可以具有相同的或不同的长度。这样的流排序可以具有流排序的子序列,所述子序列在运行中重复,以构成期望的总流数。这样的流排序可以包含20-碱基流(例如,“TACTCAGTATGCAGACTGCG”),例如,其可以重复一次或多次,以实现期望的流数,40-碱基流(例如,“TACGTACGTACTCAGCTAGTATGCATGCAGACTGACTGCG”)或52-碱基流(例如,“TACGTACGTACTCAGCTAGCTAGTATGCATGCATGCAGACTGACTGACTGCG”)等。其它流排序可以包括这样的流:其中部分循环的4-碱基流重复1次或多次,继之以不同排序的另一个流序列,诸如“TACGTACGTCTGAGCATCGATCGATGTACAGC”、“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”、和“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”等。这样的混合流可以帮助平衡效率(例如,以对给定长度的模板测序所需的碱基流的总数的方式)和获得的益处(例如,以校正或防止定相问题的方式)。其它流排序可以包括这样的流:其在2个不同类型的排序之间顺序地交替。其它流排序可以包括更长的序列碱基流,诸如96-碱基流“TACGTACGTAGCTGACGTACGTCATGCATCGATCAGCTAGCTGACGTAGCTAGCATCGATCAGTCATGACTGACGTAGCTGACTGATCAGTCATGCATCG”等。在某些实施方案中,各个核苷酸流可以具有相同的持续时间、相对核苷酸浓度,且可以继之以相同的洗涤流。在某些实施方案中,不同的核苷酸流的持续时间可以是不同的,不同的核苷酸流的浓度可以是不同的,且插入洗涤液的持续时间和/或组成可以是不同的。在某些实施方案中,可以响应于CF和/或IE事件的检测(例如,以实时方式,诸如当检测到的CF和/或IE事件的水平或频率已经达到特定阈值时)而触发或增加相保护流排序的应用。在某些实施方案中,这样的应用可以随在序列读出中的位置而变化(例如,相保护流排序的应用可以在特定序列读出长度以后触发或增加,或者通常可以在序列读出的更晚阶段更频繁地使用),这在下述情况下可能是有用的:CF和/或IE事件在读出的更晚阶段或在更长的读出中增加。
在不同的实施方案中,相保护试剂流排序可以结合或附加至键序列,诸如TACG。所述键序列可以附加至deBruijn序列,其中预期所述键序列会表现出良好的信号分辨性能和有效的测序,同时预期所述deBruijn部分会在对模板的相对长部分测序时提供合乎需要的相移性能。键序列使用的额外细节描述于:2010年12月30日提交的美国临时专利申请号61/428,733,2011年12月29日提交的美国专利申请号13/340,490,和2011年2月1日提交的美国临时专利申请号61/438,432,它们都通过引用整体并入本文。
在不同的实施方案中,可以改进相保护试剂流排序,以包括相同试剂的一个或多个连续重复。例如,核苷酸物质可以紧接着连续流动2次,例如,AA、TT等。例如,流序列“TACGTACGTTACTCAGCTAAGTATGCATGGCAGACTGACCTGCG”含有重复TT、AA、GG和CC(它们在本文中可以被称作“双抽头的核苷酸”)。尽管用相同核苷酸流的紧邻重复可能几乎没有或没有核苷酸的实际掺入,但是重复的核苷酸流可以用于建立在没有掺入事件的情况下的基线信号(例如,噪音或背景)。此外,在测序运行中插入这样的重复核苷酸流(例如,每50或100个流)可能进一步提供监测反应条件(例如,缓冲能力或基线的变化、氢离子积累、在没有核苷酸掺入事件的情况下存在于溶液中的“主体”离子的评价等)随时间的变化的能力,和鉴别系统误差或故障的源的能力。但是,这样的“双抽头”排序可能或不可能抵消积累的模板相移。
应当理解,实现或改善相同步在理论上会增强鉴别核苷酸掺入和更有效地和/或准确地鉴别序列模板的能力。尽管在许多测序应用中,相移问题可能在测序运行的早期相对较小,它们的效应可能随着测序进展而积累,并导致更长模板的劣化测序质量。在实践中,应当理解,本文中描述的流排序的校正作用在理论上会通过帮助减少或消除与异相模板有关的假信号而提高测序的效率和/或准确度。本文中描述的流排序的多个实施方案可以通过增加各个读出(其实现期望的测序质量,后者可以表示为在一系列碱基上的实际的或预期的误差的数目)的数目而改善测序运行的总质量。例如,误差报告可以呈现质量评分度量的形式,其指示在50或100个碱基段内实现期望准确度或误差率的读出的预期数目。如本文中所述的流排序也可以用于检查或对比系统性能和用于评价信号处理、碱基调用和其它算法(诸如对于“双抽头”流等)的目的。
图7A解释了一个示例性的“GATCGATC...”循环重复流排序的、与信号响应曲线相对应的示例性模拟数据。它显示了信号响应曲线,其中信号强度在y-轴上,且第n个流数目(时间)在x-轴上,并显示了图线的3个三态集合,所述三态集合中的每一个具有较深色的实线(40,50,60),所述实线在2条较浅色的虚线(42,52,62;44,54,64)的中间。图线的最下面的三态集合(60,62,64)显示了得自0-聚体事件(未掺入)的信号;图线的中间的三态集合(50,52,54)显示了得自1-聚体掺入事件的信号;且图线的最上面的三态集合(40,42,44)显示了得自2-聚体掺入事件的信号。在每个三态集合内,在中间的较深色的实线(40,50,60)代表中位信号,上面的浅色虚线(42,52,62)代表25%信号,且下面的浅色虚线(44,54,64)代表75%信号。如图7A所示,尽管1-聚体和2-聚体掺入事件的信号随着测序读出进展而劣化,由未掺入0-聚体事件产生的信号(例如,背景信号)随着测序读出进展而增加。因而,在测序读出的较晚部分处,信号分辨减少,且更难以将0-聚体、1-聚体和2-聚体事件彼此区分开。如上面所解释的,积累的IE和CF事件的效应会促进信号质量的这种劣化。
图7B解释了与模板群体进化相对应的示例性模拟数据作为图7A的循环重复流排序的测序进展。Y-轴代表群体分数,上面的图线代表最大的群体(同步),且下面的图线代表第二大群体(不同步)。如图7B所示,由于相同步的损失,在不同步模板的相对数目随着测序读出进展而增加的同时,同步模板的相对数目减小。
图8A和8B解释了与图7A和7B相同类型的示例性模拟数据,但是对应于“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”的示例性相保护流排序的信号响应曲线。类似地,图9A和9B解释了与图7A和7B相同类型的示例性模拟数据,但是对应于“TACGTACGTCTGAGCA”的示例性相保护流排序的信号响应曲线。图8A和9A表明,与图7A的流排序相比,使用相保护流排序会改善信号分辨/分离并维持更大流数内的主要群体的信号强度。图8B和9B又表明,与图7B的流排序相比,相保护流排序会减慢异相群体的积累速率。换而言之,所述相保护流排序有助于防止伴随异相群体的增加(由于未减轻的IE和/或CF相关误差的积累效应)的、主要群体和2个更少群体的更快速趋同,并且有助于提供不同群体之间随时间/流的更好信号分离和维持具有更大信号强度的主要群体(同相)随时间/流的更大比例。
图10A解释了“TACGTACG....”的循环重复流排序的一个示例性邻接矩阵表示。所述矩阵具有8行和8列,对应于TACG的2个循环。每行代表可能的流,其中碱基可以在与行对应的流之后掺入。例如,第一行对应于流次序中的第一个T,且3个有颜色的格指示可能的流(ACG),其中在流1中的序列掺入可以继续。第二行对应于第二流“A”,且有颜色的块对应于在流2中掺入A以后可以立即掺入的流。每个列代表这样的流:其中增长中的序列可以继续掺入碱基。存在4种颜色(红色、绿色、蓝色和紫色)或灰色色度,且每个代表与每行对应的碱基(增长中的序列在同聚物运行中刚刚掺入的碱基)。每个垂直箭头代表碱基在对应流处的可能掺入,其然后指向可以继续构建序列的行。例如,在第2列中的第一个垂直箭头代表这样的事实:如果在第二流处掺入碱基“A”,在其中可掺入下一个碱基的可能流是在第二行中;在第3列中的第二个垂直箭头代表这样的事实:如果在第三流处掺入碱基“C”,在其中可发生掺入的下一个可能流是在第三行中的有颜色的块;等。以此方式,块的颜色或灰色色度对应于以前在增长中的序列中掺入的核苷酸,且有颜色的块的列指示在其中可继续序列的潜在其它流。未染色的块不可能作为掺入的后继者来达到:例如,第五流“T”不可能是在第一“T”流以后的第一碱基(第一行)掺入。邻接矩阵的性能与流排序的效率和相校正性能有关。在一个实施方案中,这样的矩阵表示可以被用于解释流排序的效率和相校正性能(或其缺乏)。具体地,良好的效率和相校正性能可能与在矩阵的一个或多个列中重复的至少一种颜色或灰色色度(或对应的碱基类型)的存在有关。处理该性能的流排序可能重新组合异相分子(尽管并非所有的这样的流排序一定重新组合异相分子)。图10A没有表现出该性能(因为每个列具有至多3个不同的碱基)。
图10B解释了图9A的流排序的一个示例性邻接矩阵表示。所述矩阵具有32行和32列,对应于流排序“TACGTACGTCTGAGCA”的2个重复。它显示了具有相对较高频率的重复(参见箭头)且被相对较小间隙隔开的6个列。例如,列13表明,存在2种从前一掺入(其含有其它3种碱基中的每一个)到达该流(“A”)的不同方式;列15表明,存在2种从前面的“G”流到达该流(“C”)的不同方式;等。如果存在具有以“GC”结尾的前缀的序列,2个异相分子的群体(一个在一个流中掺入“G”,一个在另一个流中掺入“G”)可以在“C”流处变得同相,因为两个前面的“G”流以该“C”流作为后继者。对应的流排序因而可能具有良好的效率和相校正性能。
图10C解释了图8A的流排序的一个示例性邻接矩阵表示。所述矩阵具有8行和8列,对应于流排序“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”的2个重复。它显示了具有重复(参见箭头)的8个列,所述重复分布在被20个碱基的间隙隔开的2个组中。例如,列25表明,存在多种在该流中掺入碱基的方式,不论前一个掺入的碱基如何;列28表明,存在2种从“A”到达该流的方式等。对应的流排序因而也可能具有良好的效率和相校正性能。
在不同的实施方案中,提供了对流排序(例如,相保护流排序)进行评价和/或评级以鉴别最合适的流排序的方法。在一个实施方案中,基于不同特征之间的权衡,可以对流排序进行评价和/或评级。用于该目的的有用特征的2个例子是延伸效率(也就是说,同聚物可以如何快速地延伸序列的一些评估)和相移益处(也就是说,特定流排序使定相问题对测序的影响最小化的能力的一些估测)。所述延伸效率可以相对容易地进行评估。例如,它可以根据执行给定的流数以后在序列中延伸的同聚物的预期数目来确定。例如,如果在流100处预期的同聚物数目是50,可以将效率设定为0.5。也可以使用多种其它的线性的和非线性的方案来将效率分配给延伸。更高的效率基本上表示,可以更快地和以更低的成本执行测序。又可以如下估测相移益处:查找在流的已知1-聚体的信号和流的已知0-聚体的信号(它们当然可以发生在不同的序列中)之间实现的分离。如果这些信号是可靠地不同的,重构所述序列的潜力可以认为较高。但是,如果1-聚体和0-聚体的分布重叠,重构所述序列的潜力可以认为较低。总结分布之间的这种关联的一种方式是,查找每个分布的中位信号的差异,通过变异的某种度量(例如,四分位距)来评级。这会提供给定流中的相移效应的图像(注:为了防止不稳定性,当群体四分位距非常小时,可以添加0.1的小稳定噪音估测值,这在绘制的附图中进行)。因为该度量可以是每个流的变量,且因为相同流可能对应于不同的预期序列长度(考虑到不同的延伸效率),可能有利的是,测量许多流和与预期序列长度范围相对应的流的度量益处。最后,在不同的实施方案中,因为这些量/特征可能难以通过分析得到,它们可以通过模拟来评估或检查,以评价哪个流次序可能是最有效的。
在不同的实施方案中,使用与IE和/或CF事件有关的不同模型,可以模拟相保护试剂流排序。例如,这样的模拟可以包括在下述文献中描述的一个或多个方面:2011年10月27日提交的美国专利申请号13/283,320,其基于2010年10月27日提交的美国临时专利申请号61/407,377,它们都通过引用整体并入本文。
图11解释了一个示例性图,其显示了8个示例性流排序的延伸效率和相移益处之间的权衡。它显示了8个特定流排序(在本文中被称作REGULAR、SAMBA、CD_DBTAP、CONTRADANZON、TANGO_HYBRID、SAMBA.GAFIEIRA、SLOWSEQ和RANDOM64)的模拟性能,所述流排序针对从4个碱基的均匀分布绘制的长度300的500个随机序列来使用。在所有情况下,在960个流的跨度内评价了流排序。通过拟合线性模型,评价了在所述序列的第一半内的延伸效率,并在与150-200个同聚物延伸相对应的流内计算相移益处。SAMB流代表相移有效性和延伸效率之间的特别良好的折中。其它相对类似的流是SAMBA.GAFIEIRA、TANGO_HYBRID、CD_DBTAP和CONTRADANZON。一个随机选择的序列(RANDOM64)表明,高度的随机性与优良的相保护有关(尽管代价是相对较低的延伸效率)。被故意设计成以延伸效率为代价来增加相移的序列(SLOWSEQ)显示出非常高的相保护程度。尽管对于给定的延伸效率而言,被故意设计成实现高相移益处的序列可以胜过随机选择的序列,但是通常必须权衡其它序列的一种质量,并且对这些相移益处和延伸效率特征的分析会提供关于它们的适合性对流排序进行评价和/或评级的有用方案。在不同的实施方案中,为了确保相保护流排序在尽可能多的背景和应用中的最佳适用性,流排序的评价和/或评级可以基于多个任意的或随机的测试序列,且具体地,可以不针对待测序的任何特定序列和/或要在这样的测序中使用的引物定制流排序的评价和/或评级。
在不同的实施方案中,所述相移益处和延伸效率特征可以不是唯一标准,可以考虑流排序的其它合乎需要的性能。例如,双抽头流具有允许直接评估给定流中的缓冲的额外益处,因为它们会在没有大量掺入的情况下提供系统的快照。在另一个实施例中,对于有效的变体检测,可能期望使流空间多样性最大化,这在对比多个读出时可能是有用的。在其它实施例中,平衡核苷酸管的使用和使时间最小化,因为前一核苷酸流可以是有帮助的性能(在这点上,例如CONTRADANZON不具有间隔超过5个流发生的重复核苷酸)。最后,在其它实施例中,尽管以最佳广泛适用性的一些损失为代价,可以考虑关于某些序列类别的具体应用和基础生物学原理(例如,包含罕见GC含量或具有不同行为的酶的生物体可能受益于具有不同序列可能性的流排序用于模拟的应用,它们可以成为该流排序选择分析中的因素)。在不同的实施方案中,可以选择相保护试剂流排序以具有尽可能高的流多样性。在不同的实施方案中,可以选择相保护试剂流排序以具有尽可能低的自关联。
图12A解释了一个示例性的“TACGTACG...”循环重复流排序的、与信号响应曲线相对应的示例性模拟数据。图12B解释了与模板群体进化相对应的示例性模拟数据作为图12A的循环重复流排序的测序进展。除了流排序的变化以外,图12A和12B中的曲线和图是与图7A和7B中相同的类型。图12A表明,尽管1-聚体和2-聚体掺入事件的信号随着测序读出进展而劣化,由未掺入0-聚体事件产生的信号(例如,背景信号)随着测序读出进展而增加。因而,在测序读出的较晚部分处,信号分辨减少,且更难以将0-聚体、1-聚体和2-聚体事件彼此区分开。图12B表明,在不同步模板的相对数目随着测序读出的进展而增加的同时(由于相同步的损失),同步模板的相对数目减少。
图13A解释了一个示例性的流排序“TACGTACGTAGCTTGACGTACGTCATGCATCGATCAGCTAAGCTGACGTAGCTAGCATCGATCCAGTCATGACTGACGTAGCTGACTGGATCAGTCATGCATCG”(CD_DBTAP)的、与信号响应曲线相对应的示例性模拟数据。图13B解释了与模板群体进化相对应的示例性模拟数据作为图13A的流排序的测序进展。图14A解释了一个示例性的流排序“TACGTACGTAGCTGACGTACGTCATGCATCGATCAGCTAGCTGACGTAGCTAGCATCGATCAGTCATGACTGACGTAGCTGACTGATCAGTCATGCATCG”(CONTRADANZON)的、与信号响应曲线相对应的示例性模拟数据。图14B解释了与模板群体进化相对应的示例性模拟数据作为图14A的流排序的测序进展。图15A解释了一个示例性的流排序“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”(TANGO_HYBRID)的、与信号响应曲线相对应的示例性模拟数据。图15B解释了与模板群体进化相对应的示例性模拟数据作为图15A的流排序的测序进展。图16A解释了一个示例性的流排序“TACGTACGTCTGAGCATCGATCGATGTACAGC”(SAMBA)的、与信号响应曲线相对应的示例性模拟数据。图16B解释了与模板群体进化相对应的示例性模拟数据作为图16A的流排序的测序进展。图17A解释了一个示例性的流排序“TACGTACGTCTGAGCATCGATCGATGTACAGCTGACTGACTATCGCAGAGCTAGCTACATGTCGACTGACTGATAGCGTCATGCATGCAGACTCGTCGTACGTACTCAGATGCTAGCTAGCACGTGATCAGTCAGTCGCTATGAGTCAGTCAGCGATACTGCATGCATGAGTCTACGATCGATCGTGCACTA”(SAMBA.GAFIEIRA)的、与信号响应曲线相对应的示例性模拟数据。图17B解释了与模板群体进化相对应的示例性模拟数据作为图17A的流排序的测序进展。图18A解释了一个示例性随机流排序“CTTGCTTACAACTCTCATATCGGTATCCTGTGGAAACTCCGTTATCAGCATCCTCTCATGTTAG”(RANDOM64)的、与信号响应曲线相对应的示例性模拟数据。图18B解释了与模板群体进化相对应的示例性模拟数据作为图18A的测序进展的随机流排序。图19A解释了一个示例性的流排序“TACACTCTAGTATAGAGTCGTGTCTCGACGCGAGAC”(SLOWSEQ)的、与信号响应曲线相对应的示例性模拟数据。图19B解释了与模板群体进化相对应的示例性模拟数据作为图19A的流排序的测序进展。除了流排序的变化以外,图13A-19B中的曲线和图是与图7A和7B中相同的类型。当与图12A和12B的循环重复流排序对比考虑时,这些图表明了相保护流排序如何促进信号分辨/分离,并帮助增强测序的准确度,特别是对于增加的流数目。
在不同的实施方案中,相保护流排序可以用于配对末端测序的背景下。例如,可以对模板序列测序2次,例如,一次在正方向,一次在反方向,且可以对流次序中的某些流在正方向进行掺入(例如,碱基13和碱基14可能发生在流25和26中的掺入)。在这样的情况下,不可能将不同的碱基插入在这2个流之间,这可以强力地证实:在序列中不存在这样的插入。在反方向,这2个碱基可以是在隔开的流中(例如,即在流175和179中),在该情况下,可以将反向读出重新构建,以具有在那2个流之间的插入。但是,正向读出可以校正这样的误差,因为它会消除某些类别的误差。因此,有利的是,获得最大数目的机会:其中在正向测序通路中的连续流掺入和在反向测序通路中的连续流掺入是不同的。因为所述序列不可预先知晓,有利的是,选择这样的流排序:其使序列和序列的反向补体之间的流的多样性最大化。这样做的一种途径是,设计具有许多局部不同块的流排序,诸如SAMBA.GAFIEIRA流排序等,以使得在正向和反向读出的序列不可能遇到类似的连续流。
图20解释了根据一个实施方案,使用相保护流进行核酸测序的一个示例性方法。在步骤2001中,将多个模板多核苷酸链设置在多个确定的空间中,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶。在步骤2002中,使具有与其可操作地结合的测序引物和聚合酶的模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序。在步骤2003中,针对核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与模板多核苷酸链相对应的预测核苷酸序列。
图21解释了根据一个示例性实施方案,用于核酸测序的系统2101。所述系统包括反应器阵列2102;读出器板2103;计算机和/或服务器2104,其包括CPU2105和存储器2106;和显示器2107,其可以是在内部和/或在外部。这些部件中的一个或多个可以用于执行或实现本文中描述的示例性实施方案的一个或多个方面。
根据一个实施方案,提供了一种用于核酸测序的方法,所述方法包括:(1)将多个模板多核苷酸链设置在多个确定的空间中,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;(2)使具有与其可操作地结合的测序引物和聚合酶的模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流;和(3)针对核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与模板多核苷酸链相对应的预测核苷酸序列,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序。
在这样的方法中,相保护流排序可以包含4种预定核苷酸物质的deBruijn序列,所述序列的deBruijn子序列长度参数为2或3,且没有相同核苷酸物质的任何连续重复。deBruijn子序列长度参数可以是2。deBruijn子序列长度参数可以是3。所述预定排序可以包含deBruijn序列的部分和非deBruijn序列的部分。所述4种核苷酸物质可以是A、C、G和T,且所述预定排序可以仅由相保护流排序组成。所述deBruijn子序列排序可以是“TACGTCTGAGCA”。所述相保护流排序可以包含这样的流排序:其包括4种核苷酸物质的所有可能的不同二聚体对。所述相保护流排序可以包含N流之后紧跟着X流,其中X和N代表不同的核苷酸物质,且进一步包含,在此后紧跟着或者在排序中的别处,N流之后紧跟着Y流,其中Y代表不同于X和N的核苷酸物质。所述相保护流排序可以包含X流之后紧跟着N流,其中X和N代表不同的核苷酸物质,且进一步包含Y流之后紧跟着N流,其中Y代表不同于X和N的核苷酸物质。所述相保护流排序可以包含第一流排序,其中在第四核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第三核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第二流排序,其中在第一核苷酸物质流动之前,第二核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第三流排序,其中在第二核苷酸物质流动之前,第一核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第四流排序,其中在第三核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以包含第一组流和第二组流,所述第二组流源自在第一组流中流动的4种核苷酸物质中的2种或更多种的重新绘图。所述第二组流可以源自第一组流中的所有4种核苷酸物质的重新绘图。所述相保护流排序可以包含流排序,其中至少一种给定的核苷酸物质连续流动2次或更多次。所述预定排序可以基于相移益处和延伸效率的评估来选择,所述相移益处和延伸效率使用针对多个随机测试序列得到的模拟测序数据关于多个候选流排序进行计算。所述传感器阵列可以被构造成检测通过核苷酸掺入释放出的氢离子。所述传感器阵列可以被构造成检测通过核苷酸掺入释放出的无机焦磷酸盐。
根据一个实施方案,提供了一种用于核酸测序的系统,其包括:机器可读的存储器;和处理器,其被构造成执行机器可读的指令,所述指令当被处理器执行时,会造成所述系统执行步骤,包括:使在多个确定的空间中的多个模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;和针对核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与模板多核苷酸链相对应的预测核苷酸序列,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序。
在这样的系统中,所述相保护流排序可以包含4种预定核苷酸物质的deBruijn序列,所述序列的deBruijn子序列长度参数为2或3,且没有相同核苷酸物质的任何连续重复。所述相保护流排序可以包含这样的流排序:其包括4种核苷酸物质的所有可能的不同二聚体对。所述相保护流排序可以包含N流之后紧跟着X流,其中X和N代表不同的核苷酸物质,且进一步包含,在此后紧跟着或者在排序中的别处,N流之后紧跟着Y流,其中Y代表不同于X和N的核苷酸物质。所述相保护流排序可以包含X流之后紧跟着N流,其中X和N代表不同的核苷酸物质,且进一步包含Y流之后紧跟着N流,其中Y代表不同于X和N的核苷酸物质。所述相保护流排序可以包含第一流排序,其中在第四核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第三核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第二流排序,其中在第一核苷酸物质流动之前,第二核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第三流排序,其中在第二核苷酸物质流动之前,第一核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以进一步包含第四流排序,其中在第三核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第四核苷酸物质流动至少2次。所述相保护流排序可以包含第一组流和第二组流,所述第二组流源自在第一组流中流动的4种核苷酸物质中的2种或更多种的重新绘图。所述相保护流排序可以包含流排序,其中至少一种给定的核苷酸物质连续流动2次或更多次。所述预定排序可以基于相移益处和延伸效率的评估来选择,所述相移益处和延伸效率使用针对多个随机测试序列得到的模拟测序数据关于多个候选流排序进行计算。所述传感器阵列可以被构造成检测通过核苷酸掺入释放出的氢离子。所述传感器阵列可以被构造成检测通过核苷酸掺入释放出的无机焦磷酸盐。
根据一个实施方案,提供了一种包含指令的非暂存的机器可读的存储介质,所述指令当被处理器执行时,会造成所述处理器执行用于核酸测序的方法,所述方法包括:使在多个确定的空间中的多个模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;和针对核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与模板多核苷酸链相对应的预测核苷酸序列,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序。
根据一个实施方案,提供了一种用于执行基于模板的引物延伸的方法,所述方法包括:(a)提供至少一个模板,所述模板具有与其可操作地结合的引物和聚合酶;和(b)将所述模板接连地暴露于多个流中的核苷酸,使得核苷酸不以严格地连续的和相继的4种核苷酸排序(例如,“TACGTACG...”或“GATCGATC...”或“ACTCACTC...”等)流动。
根据一个实施方案,提供了一种用于对多核苷酸链测序的仪器,所述仪器包括:流动室,其被构造成容纳不同核苷酸物质流;多个蓄池,每个蓄池含有不同的核苷酸物质;多个从每个蓄池至流动室的流动路径;和流控控制器,其被构造成控制从蓄池至流动室的流动,从而根据包含相保护流排序的核苷酸物质的预定排序,使核苷酸物质从蓄池流动至流动室。在不同的实施方案中,所述仪器可以包括装载在流动室中的流动池,且所述流动池可以包括微孔阵列,所述微孔阵列含有多核苷酸链的多个拷贝,所述多核苷酸链具有与其对合的引物。所述流动池可以包括chemFET传感器阵列,所述阵列用于检测核苷酸与微孔阵列的内容物的反应。所述多核苷酸链可以附接到微孔内所含的珠子。
根据一个实施方案,提供了一种用于对多核苷酸链测序的方法,所述方法包括:(a)将多个模板核酸设置在多个反应室中,所述反应室设置在传感器阵列上,所述传感器阵列包含多个传感器,且每个反应室设置在至少一个传感器上并与其感知连通,所述传感器被构造成提供至少一个代表在其附近的测序反应副产物的输出信号,且其中每个模板核酸与测序引物杂交和与聚合酶结合;(b)将已知的dNTP引入反应室中,其中这样的已知dNTP选自dNTP流的预定排序;(c)如下检测在一个或多个dNTP的测序引物的3'末端处的掺入:对反应副产物测序,从而检验这样的一个或多个dNTP是否与模板核酸中的对应核苷酸互补;(d)从反应室洗涤未掺入的dNTP;和(e)重复步骤(b)至(d),直到已经对多个模板核酸测序。
根据一个实施方案,提供了一种执行基于模板的引物延伸的方法,所述方法包括:(a)提供至少一个模板,所述模板具有与其可操作地结合的引物和聚合酶;和(b)根据不是连续的和相继的4种核苷酸排序的流排序,将至少一个模板接连地暴露于核苷酸流。所述流排序可以包括“TACGTACGTAGCTGACGTACGTCATGCATCGATCAGCTAGCTGACGTAGCTAGCATCGATCAGTCATGACTGACGTAGCTGACTGATCAGTCATGCATCG”、“TACTCAGTATGCAGACTGCG”、“TACGTACGTACTCAGCTAGCTAGTATGCATGCATGCAGACTGACTGACTGCG”、“TACGTACGTACTCAGCTAGTATGCATGCAGACTGACTGCG”、“TACGTACGTCTGAGCATCGATCGATGTACAGC”、“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”或“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”等。
根据一个实施方案,提供了一种通过基于模板的引物延伸来确定核酸序列的方法,所述方法包括:(a)将已知的核苷三磷酸前体递送至基于模板的引物延伸反应,所述已知的核苷三磷酸前体选自dNTP流的预定排序;(b)检测已知的核苷三磷酸的掺入,从而确定它的补体是否存在于与引物邻近的模板中;和(c)重复步骤(a)和(b),直到已经确定核酸的序列,其中所述dNTP流的预定排序能够改善相同步性。所述dNTP流的预定排序可以进一步能够减轻和/或至少部分地校正与不完全延伸事件有关的定相效应。所述dNTP流的预定排序可以进一步能够减轻和/或至少部分地校正与推进事件有关的定相效应。所述dNTP流的预定排序可以进一步能够减轻和/或至少部分地校正与聚合酶效率有关的定相效应。
根据一个实施方案,提供了一种对核酸测序的方法,所述方法包括:(a)将多个模板设置在多个反应室中,每个反应室包含:具有与其杂交的测序引物的模板,和与其可操作地结合的聚合酶;(b)将已知的核苷三磷酸引入每个反应室,所述反应室选自dNTP流的预定排序;(c)检测在一个或多个核苷三磷酸的测序引物的3'末端处的连续掺入,以检验已知的核苷三磷酸是否与模板核酸中的对应核苷酸互补;(d)从反应室洗涤未掺入的核苷三磷酸;和(e)重复步骤(b)至(d),直到已经对核酸测序,其中所述dNTP流的预定排序由多个流限定,使得核苷酸没有在预定的4种核苷酸排序的一系列连续重复中流动。所述预定排序可以包含“TACTCAGTATGCAGACTGCG”、“TACGTACGTACTCAGCTAGCTAGTATGCATGCATGCAGACTGACTGACTGCG”、“TACGTACGTACTCAGCTAGTATGCATGCAGACTGACTGCG”、“TACGTACGTCTGAGCATCGATCGATGTACAGC”、“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”或“TACGTACGTACGTACGTACGTACATACGCACGTGCGTATG”等。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含4种核苷酸物质A、C、G和T的deBruijn序列排序,其具有2或3的deBruijn子序列长度参数,且没有相同核苷酸物质的任何连续重复。deBruijn子序列长度参数可以是2。deBruijn子序列长度参数可以是3。所述预定排序可以仅由deBruijn序列排序组成,或者它可以包括deBruijn序列排序的部分和非deBruijn序列排序的部分。所述方法可以进一步包括:检测通过核苷酸的掺入而释放出的氢离子。所述方法可以进一步包括:检测通过核苷酸的掺入而释放出的无机焦磷酸盐。通过由无机焦磷酸盐引发的酶级联所发射的光,可以检测所述无机焦磷酸盐。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含这样的流排序:其包括4种核苷酸物质的所有可能的不同二聚体对。可能的不同二聚体对包括AG、AC、AT、CA、CG、CT、GA、GC、GT、TA、TC和TG。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含N流之后紧跟着X流,其中X和N代表不同的核苷酸物质,且进一步包含,在此后紧跟着或者在排序中的别处,N流之后紧跟着Y流,其中Y代表不同于X和N的核苷酸物质。在一个实施方案中,所述N和Y的流可以紧跟着N和X的流。在另一个实施方案中,所述N和Y的流可以不紧跟着N和X的流。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含X流之后紧跟着N流,其中X和N代表不同的核苷酸物质,且进一步包含,Y流之后紧跟着N流,其中Y代表不同于X和N的核苷酸物质。在一个实施方案中,所述Y和N的流可以紧跟着X和N的流。在另一个实施方案中,所述Y和N的流可以不紧跟着X和N的流。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种不同核苷酸物质的流,其中所述预定排序包含这样的流排序,其中在第四核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第三核苷酸物质流动至少2次。在一个实施方案中,所述流排序可以是第一流排序,且所述预定排序可以进一步包含第二流排序,其中在第一核苷酸物质流动之前,第二核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。在一个实施方案中,所述预定排序可以进一步包含第三流排序,其中在第二核苷酸物质流动之前,第一核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。在一个实施方案中,所述预定排序可以进一步包含第四流排序,其中在第三核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第四核苷酸物质流动至少2次。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含第一组流和第二组流,所述第二组流源自第一组流中的2种或更多种核苷酸物质的重新绘图。在一个实施方案中,所述第二组流可以源自第一组流中的所有4种核苷酸物质的重新绘图。所述重新绘图可以包括,第一组流中的2种或更多种核苷酸物质的每个实例的重新分配。
根据一个实施方案,提供了一种对多核苷酸链测序的方法,所述方法包括:提供具有与其对合的引物的多核苷酸链和与所述多核苷酸链可操作地结合的聚合酶;和根据预定排序,将所述多核苷酸链接连地暴露于4种核苷酸物质A、C、G和T的流,其中所述预定排序包含这样的流排序,其中相同的核苷酸物质连续流动2次或更多次。
根据不同的实施方案,使用适当地配置的和/或程序化的硬件和/或软件元件,可以执行或实现上面讨论的教导和/或实施方案中的任意一种或多种的一个或多个特征。基于任意数目的因素,诸如期望的计算速率、功率水平、耐热性、处理循环预算、输入数据速率、输出数据速率、存储器资源、数据总线速度等和其它设计或性能约束,可以确定一个实施方案是否使用硬件和/或软件元件来实现。
硬件元件的例子可以包括处理器、微处理器、通过局部接口电路通信联接的输入和/或输出(I/O)装置(或周围装置)、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑装置(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体器件、芯片、微芯片、芯片组等。所述局部接口可以包括,例如,一个或多个总线或其它有线或无线连接、控制器、缓冲器(高速缓存)、驱动器、中继器和接收器等,以允许硬件部件之间的适当通信。处理器是用于执行软件(特别是存储在存储器中的软件)的硬件装置。所述处理器可以是任意定制的或商购可得的处理器、中央处理单元(CPU)、在与计算机有关的几个处理器中的辅助处理器、基于半导体的微处理器(例如,以微芯片或芯片组的形式)、宏处理器,或一般地是用于执行软件指令的任意装置。处理器还可以代表分布式处理结构。所述I/O装置可以包括输入装置,例如,键盘、鼠标、扫描仪、传声器、触摸屏、各种医疗装置和/或实验室仪器的接口、条形码读出器、输入笔、激光读出器、射频装置读出器等。此外,所述I/O装置也可以包括输出装置,例如,打印机、条形码打印机、显示器等。最后,所述I/O装置进一步可以包括作为输入和输出二者进行通信的装置,例如,调制器/解调器(调制解调器;用于访问其它装置、系统或网络)、射频(RF)或其它收发器、电话接口、网桥、路由器等。
软件的实例可以包括:软件组件、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、过程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字、值、符号或者它们的任意组合。在存储器中的软件可以包括一个或多个单独的程序,其可以包括用于实现逻辑功能的可执行指令的有序列表。在存储器中的软件可以包括用于鉴别根据本发明的教导的数据流的系统和任意合适的定制的或商购可得的操作系统(O/S),它们可以控制其它计算机程序(诸如系统)的执行,并提供调度、输入-输出控制、文件和数据管理、存储器管理、通信控制等。
根据不同的实施方案,使用适当地配置的和/或程序化的非暂存的机器可读介质或产品,可以执行或实现上面讨论的教导和/或实施方案中的任意一种或多种的一个或多个特征,所述机器可读介质或产品可以存储指令或指令集,所述指令或指令集如果被机器执行,会使所述机器执行根据实施方案的方法和/或操作。这样的机器可以包括例如:任何合适的处理平台、计算平台、计算装置、处理装置、计算系统、处理系统、计算机、处理器、科学或实验室仪器等,并且可以使用硬件和/或软件的任何合适组合来实现。所述机器可读介质或产品可以包括例如:任何合适类型的存储器单元、存储器装置、存储器产品、存储器介质、存储装置、存储产品、存储介质和/或存储单元,例如存储器、可移动或不可移动介质、可擦除或不可擦除介质、可写或可重写介质、数字或模拟介质、硬盘、软盘、只读存储器光盘(CD-ROM)、可记录光盘(CD-R)、可重写光盘(CD-RW)、光盘、磁介质、磁光介质、可移动存储卡或盘、各种类型的数字多功能光盘(DVD)、磁带、盒式磁带等,包括适合用于计算机中的任何介质。存储器可以包括易失性存储器元件(例如,随机存取存储器(RAM,诸如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如,ROM、EPROM、EEROM、闪速存储器、硬驱、磁带、CDROM等)中的任一种或组合。此外,存储器可以并入电子的、磁的、光的和/或其它类型的存储介质。存储器可以具有分布式结构,其中各个部件的位置彼此远离,但是仍然可被处理器访问。所述指令可以包括任何合适类型的代码,例如源代码、编译代码、解释代码、可执行代码、静态代码、动态代码、加密代码等,所述代码使用任何合适的高级的、低级的、面向对象的、可视的、编译的和/或解释的编程语言来实现。
根据不同的实施方案,使用分布式、簇集式、远距离或云计算资源,可以至少部分地执行或实现上面讨论的教导和/或实施方案的中的任意一种或多种的一个或多个特征。
根据不同的实施方案,使用源程序、可执行程序(目标代码)、脚本或包含待执行的指令集的任意其它实体,可以执行或实现上面讨论的教导和/或实施方案的中的任意一种或多种的一个或多个特征。当使用源程序时,该程序可以通过编译程序、汇编程序、解释程序等(其可以被包括或未被包括在存储器内)进行翻译,从而适当地与O/S连接地运行。所述指令可以用下述语言来书写:(a)面向对象的编程语言,其具有数据和方法的类别,或(b)具有例程、子例程和/或函数的过程编程语言,其可以包括,例如,C、C++、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada。
根据不同的实施方案,上面讨论的实施方案中的一个或多个可以包括,向用户界面装置、计算机可读的存储介质、局部计算机系统或远程计算机系统传送、显示、存储、打印或输出与这样的实施方案可能已经产生、存取或使用任何信息、信号、数据和/或中间或最终结果有关的信息。这样的传送、显示、存储、打印或输出的信息可以呈运行和报告、图片、表、图表、图、表单、关联、序列和它们的组合等的可检索的和/或可过滤的列表的形式。
通过重复、添加或置换在一个或多个上述实施方案中阐述的、一般地或特别地描述的任何特征和/或部件和/或物质和/或步骤和/或操作条件,可以衍生出各种额外的实施方案。此外,应当理解,步骤的次序或执行某些动作的次序并不重要,只要所述步骤或动作的目的仍可实现即可,除非另外特别说明。此外,可以同时进行2个或更多个步骤或动作,只要所述步骤或动作的目的仍可实现即可,除非另外特别说明。此外,在上面讨论的实施方案之一中提及的任意一个或多个特征、部件、方面、步骤或其它特性可以被视作上面讨论的任意其它实施方案的潜在的任选的特征、部件、方面、步骤或其它特性,只要这样的上面讨论的任意其它实施方案的目的仍可实现即可,除非另外特别说明。
尽管本发明的教导的多个实施方案可以有利地与合成测序方案一起使用,所述合成测序方案如在本文中和在例如下述参考文献中所述:Rothberg等人,美国专利公开号2009/0026082;和erson等人,SENSORSANDACTUATORSBCHEM.,129:79-86(2008);Pourmand等人,PROC.NAT1.ACAD.SCI.,103:6466-6470(2006),它们都通过引用整体并入本文,但是,本发明的教导也可以与其它方案一起使用,诸如合成测序的变体,包括其中将核苷酸或核苷三磷酸前体修饰为可逆的终止子的方法(有时被称作循环可逆终止(CRT)方法)和其中未修饰核苷酸或核苷三磷酸前体的方法(有时被称作循环单碱基递送(CSD)方法)等,或者更一般地,包括递送(或响应于递送而延伸)核苷酸(至聚合酶-引物-模板复合物)和收集信号(或直接地或间接地检测掺入)的重复步骤的方法。
尽管本发明的教导的多个实施方案可以有利地与基于pH的序列检测结合使用,所述基于pH的序列检测如在本文中和在例如下述参考文献中所述:Rothberg等人,美国专利申请公开号2009/0127589和2009/0026082和Rothberg等人,英国专利申请公开号GB2461127,它们都通过引用整体并入本文,但是,本发明的教导也可以与其它检测方案一起使用,包括通过掺入反应释放出的焦磷酸盐(PPi)的检测(参见,例如,美国专利号6,210,891、6,258,568和6,828,100);各种基于荧光的测序方法(参见,例如,美国专利号7,211,390、7,244,559和7,264,929);一些可以检测与核苷酸结合的标记的合成测序技术,所述标记例如质量标记、荧光标记和/或化学发光标记(在该情况下,可以在工作流中在下一个合成和检测循环之前包括灭活步骤(例如,通过化学裂解或光漂白));和更一般地,这样的方法:其中掺入反应会产生或导致具有特定性质的产物或组分,所述性质能够被监测和用于检测掺入事件,包括、例如,量级(例如,热)或浓度(例如,焦磷酸盐和/或氢离子)和信号(例如,荧光、化学发光、光产生)的变化,在该情况下,检测的产物或组分的量可以与掺入事件的数目等线性相关。这样的其它方案同样可以受益于本文中描述的核苷酸流方案的相校正、信号增强、准确度、提高和/或噪音减少特征。
尽管本说明书详细地描述了某些实施方案,但是其它实施方案也是可能的,并且在本发明的范围内。例如,本领域技术人员从本说明书会明白,本发明的教导可以以多种形式实现,并且可以单独地或组合地实现多个实施方案。本领域技术人员考虑到说明书和附图以及在说明书和附图和权利要求书中描述的教导的实践,会明白变异和改变。

Claims (34)

1.一种用于核酸测序的非诊断性方法,所述方法包括:
将多个模板多核苷酸链设置在多个确定的空间中,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;
使具有与其可操作地结合的测序引物和聚合酶的所述模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流;以及
针对所述核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,从而确定与所述模板多核苷酸链相对应的预测核苷酸序列,
其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含相保护流排序,所述相保护流排序包括以下一种或多种:
(a)包含4种预定核苷酸物质的deBruijn序列,其中每种2或3个核苷酸的连续字符序列的可能的子序列刚好出现一次;
(b)所述相保护流排序可以包含这样的流排序:其包括4种核苷酸物质的所有可能的不同二聚体对。
2.根据权利要求1所述的方法,其中所述相保护流排序包含4种预定核苷酸物质的deBruijn序列,其中每种2或3个核苷酸的连续字符序列的可能的子序列刚好出现一次,且没有相同核苷酸物质的任何连续重复。
3.根据权利要求2所述的方法,其中其中每种2个核苷酸的连续字符序列的可能的子序列刚好出现一次。
4.根据权利要求2所述的方法,其中其中每种3个核苷酸的连续字符序列的可能的子序列刚好出现一次。
5.根据权利要求1所述的方法,其中所述预定排序包含deBruijn序列的部分和非deBruijn序列的部分。
6.根据权利要求1所述的方法,其中所述4种核苷酸物质是A、C、G和T,且所述预定排序仅由所述相保护流排序组成。
7.根据权利要求2所述的方法,其中所述deBruijn序列排序是“TACGTCTGAGCA”。
8.根据权利要求1所述的方法,其中所述相保护流排序包含这样的流排序:所述流排序包括4种核苷酸物质的所有可能的不同二聚体对。
9.根据权利要求1所述的方法,其中所述相保护流排序包含N流之后紧跟着X流,其中X和N代表不同的核苷酸物质,且在此后紧跟着或者在所述排序中的别处,进一步包含N流之后紧跟着Y流,其中Y代表不同于X和N的核苷酸物质。
10.根据权利要求1所述的方法,其中所述相保护流排序包含X流之后紧跟着N流,其中X和N代表不同的核苷酸物质,且进一步包含Y流之后紧跟着N流,其中Y代表不同于X和N的核苷酸物质。
11.根据权利要求1所述的方法,其中所述相保护流排序包含第一流排序,其中在第四核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第三核苷酸物质流动至少2次。
12.根据权利要求11所述的方法,其中所述相保护流排序进一步包含第二流排序,其中在第一核苷酸物质流动之前,第二核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。
13.根据权利要求12所述的方法,其中所述相保护流排序进一步包含第三流排序,其中在第二核苷酸物质流动之前,第一核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。
14.根据权利要求13所述的方法,其中所述相保护流排序进一步包含第四流排序,其中在第三核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第四核苷酸物质流动至少2次。
15.根据权利要求1所述的方法,其中所述相保护流排序包含第一组流和第二组流,所述第二组流源自在所述第一组流中流动的4种核苷酸物质中的2种或更多种的重新绘图。
16.根据权利要求15所述的方法,其中所述第二组流源自所述第一组流中的所有4种核苷酸物质的重新绘图。
17.根据权利要求1所述的方法,其中所述相保护流排序包含这样的流排序,在所述流排序中至少一种给定的核苷酸物质连续流动2次或更多次。
18.根据权利要求1所述的方法,其中所述预定排序是基于相移益处和延伸效率的评估来选择的,所述相移益处和延伸效率使用针对多个随机测试序列得到的模拟测序数据对多个候选流排序进行计算。
19.根据权利要求1所述的方法,其中所述传感器阵列被构造成检测通过核苷酸掺入释放出的氢离子。
20.根据权利要求1所述的方法,其中所述传感器阵列被构造成检测通过核苷酸掺入释放出的无机焦磷酸盐。
21.一种用于权利要求1的测序方法的核酸测序的系统,所述包括:
机器可读的存储器;
流控控制器,其配置成根据预定的试剂流排序将试剂递送至传感器阵列上所设置的确定的空间,其中所述预定排序(a)不是4种不同核苷酸物质的4-流排列的一系列连续重复,(b)不是为待测序的特定模板多核苷酸链和待使用的特定测序引物的特定组合专门定制的,且(c)包含以下一种或多种相保护流排序:
(i)包含4种预定核苷酸物质的deBruijn序列,其中每种2或3个核苷酸的连续字符序列的可能的子序列刚好出现一次;
(ii)所述相保护流排序可以包含这样的流排序:其包括4种核苷酸物质的所有可能的不同二聚体对;和
处理器,所述处理器被构造成执行机器可读的指令,当所述处理器执行所述指令时,会使所述系统执行包括以下的步骤:
使在多个确定的空间中的多个模板多核苷酸链暴露于根据预定排序流动的核苷酸物质的一系列流,所述空间设置在传感器阵列上,所述模板多核苷酸链中的至少一些具有与其可操作地结合的测序引物和聚合酶;和
针对所述核苷酸物质的一系列流中的每一个,确定对于该特定流发生了多少核苷酸掺入,以确定与所述模板多核苷酸链相对应的预测核苷酸序列。
22.根据权利要求21所述的系统,其中所述相保护流排序包含4种预定核苷酸物质的deBruijn序列,其中每种2或3个核苷酸的连续字符序列的可能的子序列刚好出现一次,且没有相同核苷酸物质的任何连续重复。
23.根据权利要求21所述的系统,其中所述相保护流排序包含这样的流排序:所述流排序包括4种核苷酸物质的所有可能的不同二聚体对。
24.根据权利要求21所述的系统,其中所述相保护流排序包含N流之后紧跟着X流,其中X和N代表不同的核苷酸物质,且在此后紧跟着或者在所述排序中的别处,进一步包含N流之后紧跟着Y流,其中Y代表不同于X和N的核苷酸物质。
25.根据权利要求21所述的系统,其中所述相保护流排序包含X流之后紧跟着N流,其中X和N代表不同的核苷酸物质,且进一步包含Y流之后紧跟着N流,其中Y代表不同于X和N的核苷酸物质。
26.根据权利要求21所述的系统,其中所述相保护流排序包含第一流排序,其中在第四核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第三核苷酸物质流动至少2次。
27.根据权利要求26所述的系统,其中所述相保护流排序进一步包含第二流排序,其中在第一核苷酸物质流动之前,第二核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。
28.根据权利要求27所述的系统,其中所述相保护流排序进一步包含第三流排序,其中在第二核苷酸物质流动之前,第一核苷酸物质、第三核苷酸物质和第四核苷酸物质流动至少2次。
29.根据权利要求28所述的系统,其中所述相保护流排序进一步包含第四流排序,其中在第三核苷酸物质流动之前,第一核苷酸物质、第二核苷酸物质和第四核苷酸物质流动至少2次。
30.根据权利要求21所述的系统,其中所述相保护流排序包含第一组流和第二组流,所述第二组流源自在所述第一组流中流动的4种核苷酸物质中的2种或更多种的重新绘图。
31.根据权利要求21所述的系统,其中所述相保护流排序包含这样的流排序,其中至少一种给定的核苷酸物质连续流动2次或更多次。
32.根据权利要求21所述的系统,其中所述预定排序是基于相移益处和延伸效率的评估来选择的,所述相移益处和延伸效率使用针对多个随机测试序列得到的模拟测序数据关于多个候选流排序进行计算。
33.根据权利要求21所述的系统,其中所述传感器阵列被构造成检测通过核苷酸掺入释放出的氢离子。
34.根据权利要求21所述的系统,其中所述传感器阵列被构造成检测通过核苷酸掺入释放出的无机焦磷酸盐。
CN201280027883.4A 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序 Active CN103764845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610091056.1A CN105861645B (zh) 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161473721P 2011-04-08 2011-04-08
US61/473,721 2011-04-08
US201161544924P 2011-10-07 2011-10-07
US61/544,924 2011-10-07
US201161549407P 2011-10-20 2011-10-20
US61/549,407 2011-10-20
US201261617231P 2012-03-29 2012-03-29
US61/617,231 2012-03-29
PCT/US2012/032418 WO2012138921A1 (en) 2011-04-08 2012-04-05 Phase-protecting reagent flow orderings for use in sequencing-by-synthesis

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201610091056.1A Division CN105861645B (zh) 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序

Publications (2)

Publication Number Publication Date
CN103764845A CN103764845A (zh) 2014-04-30
CN103764845B true CN103764845B (zh) 2016-02-17

Family

ID=45952664

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201610091056.1A Active CN105861645B (zh) 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序
CN201280027883.4A Active CN103764845B (zh) 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201610091056.1A Active CN105861645B (zh) 2011-04-08 2012-04-05 用于合成测序中的相保护试剂流排序

Country Status (4)

Country Link
US (5) US9428807B2 (zh)
EP (3) EP2694675B1 (zh)
CN (2) CN105861645B (zh)
WO (1) WO2012138921A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011156707A2 (en) 2010-06-11 2011-12-15 Life Technologies Corporation Alternative nucleotide flows in sequencing-by-synthesis methods
US8487790B2 (en) * 2010-06-30 2013-07-16 Life Technologies Corporation Chemical detection circuit including a serializer circuit
EP2694675B1 (en) 2011-04-08 2018-01-24 Life Technologies Corporation Phase-protecting reagent flow orderings for use in sequencing-by-synthesis
US10704164B2 (en) 2011-08-31 2020-07-07 Life Technologies Corporation Methods, systems, computer readable media, and kits for sample identification
US20130288902A1 (en) 2012-04-30 2013-10-31 Life Technologies Corporation Systems and methods for paired end sequencing
US10192024B2 (en) * 2012-05-18 2019-01-29 454 Life Sciences Corporation System and method for generation and use of optimal nucleotide flow orders
US10329608B2 (en) 2012-10-10 2019-06-25 Life Technologies Corporation Methods, systems, and computer readable media for repeat sequencing
US20140296080A1 (en) 2013-03-14 2014-10-02 Life Technologies Corporation Methods, Systems, and Computer Readable Media for Evaluating Variant Likelihood
US9926597B2 (en) 2013-07-26 2018-03-27 Life Technologies Corporation Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same
JP6532456B2 (ja) 2013-10-04 2019-06-19 ライフ テクノロジーズ コーポレーション 終止化学を用いる配列決定における整相効果(phasing effects)をモデル化するための方法及びシステム
CN106460044B (zh) * 2014-04-25 2021-03-19 DNAe集团控股有限公司 测序方法
EP3194945B1 (en) 2014-09-15 2023-07-26 Life Technologies Corporation Apparatus and method for fluid potential artifact correction in reagent delivery systems comprising a sensor array
US10658069B2 (en) 2014-10-10 2020-05-19 International Business Machines Corporation Biological sequence variant characterization
CN107250784B (zh) 2014-12-18 2020-10-23 生命科技公司 具有发送器配置的高数据率集成电路
WO2016100895A1 (en) 2014-12-18 2016-06-23 Life Technologies Corporation Calibration panels and methods for designing the same
EP4220645A3 (en) 2015-05-14 2023-11-08 Life Technologies Corporation Barcode sequences, and related systems and methods
US10619205B2 (en) 2016-05-06 2020-04-14 Life Technologies Corporation Combinatorial barcode sequences, and related systems and methods
EP3519586B1 (en) * 2016-09-28 2024-03-13 Life Technologies Corporation Methods for sequencing nucleic acids using termination chemistry
DE102017218849A1 (de) * 2017-10-23 2019-04-25 Robert Bosch Gmbh Reaktionsträger für eine mikrofluidische Vorrichtung und Verfahren zur Bestimmung einer Nukleotidsequenz
CN114096682A (zh) 2019-05-03 2022-02-25 阿尔缇玛基因组学公司 通过合成方法的快进测序
JP2022531589A (ja) 2019-05-03 2022-07-07 ウルティマ・ゲノミクス・インコーポレーテッド 核酸分子の配列決定方法
CN114286867B (zh) * 2019-08-20 2024-04-16 青岛华大智造科技有限责任公司 一种基于发光标记物光信号动力学及二次发光信号对多核苷酸进行测序的方法
WO2021034711A1 (en) 2019-08-21 2021-02-25 Life Technologies Corporation System and method for sequencing
EP4244388A1 (en) 2020-11-14 2023-09-20 Life Technologies Corporation System and method for automated repeat sequencing
US20220170093A1 (en) 2020-11-16 2022-06-02 Life Technologies Corporation System and method for sequencing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007098049A3 (en) * 2006-02-16 2008-08-07 454 Life Sciences Corp System and method for correcting primer extension errors in nucleic acid sequence data

Family Cites Families (97)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US4800159A (en) 1986-02-07 1989-01-24 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences
CA2020958C (en) 1989-07-11 2005-01-11 Daniel L. Kacian Nucleic acid sequence amplification methods
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5854033A (en) 1995-11-21 1998-12-29 Yale University Rolling circle replication reporter systems
ATE295427T1 (de) 1996-06-04 2005-05-15 Univ Utah Res Found Überwachung der hybridisierung während pcr
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US7348181B2 (en) 1997-10-06 2008-03-25 Trustees Of Tufts College Self-encoding sensor with microspheres
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
EP1082458A1 (en) 1998-05-01 2001-03-14 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and dna molecules
CA2321821A1 (en) 1998-06-26 2000-01-06 Visible Genetics Inc. Method for sequencing nucleic acids with reduced errors
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
AU6241099A (en) 1999-06-25 2001-01-31 Crosby Group Inc., The Wire rope socket
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
WO2001023610A2 (en) 1999-09-29 2001-04-05 Solexa Ltd. Polynucleotide sequencing
US6783934B1 (en) 2000-05-01 2004-08-31 Cepheid, Inc. Methods for quantitative analysis of nucleic acid amplification reaction
GB0016472D0 (en) 2000-07-05 2000-08-23 Amersham Pharm Biotech Uk Ltd Sequencing method and apparatus
AU2001287010A1 (en) 2000-09-01 2002-03-13 Fred Hutchinson Cancer Research Center Statistical modeling to analyze large data arrays
GB0021977D0 (en) 2000-09-07 2000-10-25 Pyrosequencing Ab Method of sequencing DNA
GB0022069D0 (en) 2000-09-08 2000-10-25 Pyrosequencing Ab Method
US6797475B2 (en) 2001-02-08 2004-09-28 Millennium Pharmaceuticals, Inc. Detection of polymorphisms in the human 5-lipoxygenase gene
JP4195859B2 (ja) 2001-11-16 2008-12-17 株式会社バイオエックス Fet型センサと、そのセンサを用いたイオン濃度検出方法及び塩基配列検出方法
CA2474482A1 (en) 2002-01-25 2003-08-07 Applera Corporation Methods for placing, accepting, and filling orders for products and services
US20030215816A1 (en) 2002-05-20 2003-11-20 Narayan Sundararajan Method for sequencing nucleic acids by observing the uptake of nucleotides modified with bulky groups
WO2004001015A2 (en) 2002-06-25 2003-12-31 Pel-Freez Clinical Systems, Llc Method for sequencing nucleic acids
US20040197793A1 (en) 2002-08-30 2004-10-07 Arjang Hassibi Methods and apparatus for biomolecule detection, identification, quantification and/or sequencing
US20040197845A1 (en) 2002-08-30 2004-10-07 Arjang Hassibi Methods and apparatus for pathogen detection, identification and/or quantification
US7655401B2 (en) 2002-09-26 2010-02-02 University Of Washington Methods for identifying subjects susceptible to ataxic neurological disease
EP1579010A4 (en) 2002-10-17 2010-07-21 Decode Genetics Ehf SUSCEPTIBILITY GENE FOR MYOCARDIAL INFARCTION AND METHODS OF TREATMENT
US20050260603A1 (en) 2002-12-31 2005-11-24 Mmi Genomics, Inc. Compositions for inferring bovine traits
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US20060147935A1 (en) 2003-02-12 2006-07-06 Sten Linnarsson Methods and means for nucleic acid sequencing
GB0324456D0 (en) 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
JP3903183B2 (ja) 2004-02-03 2007-04-11 独立行政法人物質・材料研究機構 遺伝子検出電界効果デバイスおよびこれを用いた遺伝子多型解析方法
US20070281300A1 (en) 2004-03-04 2007-12-06 James Russell Thrombomodulin (Thbd) Haplotypes Predict Outcome
ITTO20040386A1 (it) 2004-06-09 2004-09-09 Infm Istituto Naz Per La Fisi Dispositivo ad effetto di campo per la rilevazione di piccole quantita' di carica elettrica, come quelle generate in processi biomolecolari, immobilizzate nelle vicinanze della superficie.
US8454973B2 (en) 2004-08-24 2013-06-04 Tokyo Metropolitan Institute Of Medical Science Modified human hepatitis C virus genomic RNA that can be autonomously replicated
JP4608697B2 (ja) 2004-08-27 2011-01-12 独立行政法人物質・材料研究機構 電界効果デバイスを用いたdna塩基配列解析方法及び塩基配列解析装置
US7170050B2 (en) 2004-09-17 2007-01-30 Pacific Biosciences Of California, Inc. Apparatus and methods for optical analysis of molecules
KR20070045255A (ko) 2004-10-14 2007-05-02 가부시끼가이샤 도시바 Fet-기반의 핵산 검출 센서
US7424371B2 (en) 2004-12-21 2008-09-09 Helicos Biosciences Corporation Nucleic acid analysis
US7785862B2 (en) 2005-04-07 2010-08-31 454 Life Sciences Corporation Thin film coated microwell arrays
DK2463386T3 (en) 2005-06-15 2017-07-31 Complete Genomics Inc Nucleic acid analysis using random mixtures of non-overlapping fragments
JP4353958B2 (ja) 2005-09-15 2009-10-28 株式会社日立製作所 Dna計測装置、及びdna計測方法
US8364417B2 (en) 2007-02-15 2013-01-29 454 Life Sciences Corporation System and method to correct out of phase errors in DNA sequencing data by use of a recursive algorithm
JP4857820B2 (ja) 2006-03-03 2012-01-18 学校法人早稲田大学 Dnaセンシング方法
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
US7932034B2 (en) 2006-12-20 2011-04-26 The Board Of Trustees Of The Leland Stanford Junior University Heat and pH measurement for sequencing of DNA
WO2008092155A2 (en) 2007-01-26 2008-07-31 Illumina, Inc. Image data efficient genetic sequencing method and system
US8612161B2 (en) 2008-03-19 2013-12-17 Intelligent Biosystems Inc. Methods and compositions for base calling nucleic acids
US8481259B2 (en) 2007-02-05 2013-07-09 Intelligent Bio-Systems, Inc. Methods and devices for sequencing nucleic acids in smaller batches
EP2164985A4 (en) 2007-06-01 2014-05-14 454 Life Sciences Corp SYSTEM AND METHOD FOR IDENTIFYING INDIVIDUAL SAMPLES FROM A MULTIPLEX MIXTURE
WO2008154317A1 (en) 2007-06-06 2008-12-18 Pacific Biosciences Of California, Inc. Methods and processes for calling bases in sequence by incorporation methods
CN101802218A (zh) 2007-06-28 2010-08-11 454生命科学公司 在核酸测序中用于自适应试剂控制的系统和方法
US8518640B2 (en) 2007-10-29 2013-08-27 Complete Genomics, Inc. Nucleic acid sequencing and process
CN101434988B (zh) * 2007-11-16 2013-05-01 深圳华因康基因科技有限公司 一种高通量寡核苷酸测序方法
US7767400B2 (en) 2008-02-03 2010-08-03 Helicos Biosciences Corporation Paired-end reads in sequencing by synthesis
BRPI0909212A2 (pt) * 2008-03-28 2015-08-18 Pacific Biosciences California Composições e método para sequeciamento de ácido nucléico
US7782237B2 (en) 2008-06-13 2010-08-24 The Board Of Trustees Of The Leland Stanford Junior University Semiconductor sensor circuit arrangement
GB2461026B (en) * 2008-06-16 2011-03-09 Plc Diagnostics Inc System and method for nucleic acids sequencing by phased synthesis
GB2461127B (en) 2008-06-25 2010-07-14 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale FET arrays
WO2009158006A2 (en) 2008-06-26 2009-12-30 Ion Torrent Systems Incorporated Methods and apparatus for detecting molecular interactions using fet arrays
EP2141250A1 (en) 2008-07-02 2010-01-06 Institut National De La Recherche Agronomique (Inra) Method for diagnosing and predicting cerebellar ataxia
US8407012B2 (en) 2008-07-03 2013-03-26 Cold Spring Harbor Laboratory Methods and systems of DNA sequencing
US20100035252A1 (en) 2008-08-08 2010-02-11 Ion Torrent Systems Incorporated Methods for sequencing individual nucleic acids under tension
WO2010039553A1 (en) 2008-10-03 2010-04-08 Illumina, Inc. Method and system for determining the accuracy of dna base identifications
US8546128B2 (en) * 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
CN103901090B (zh) 2008-10-22 2017-03-22 生命技术公司 用于生物和化学分析的集成式传感器阵列
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
CA2744821A1 (en) 2008-11-26 2010-06-03 Illumina, Inc. Methods and systems for analysis of sequencing data
WO2010077859A2 (en) 2008-12-15 2010-07-08 Advanced Liquid Logic, Inc. Nucleic acid amplification and sequencing on a droplet actuator
EP2379748A4 (en) * 2008-12-23 2012-08-29 Illumina Inc MULTIBASE RELEASE FOR LONG READINGS IN SEQUENCING BY SYNTHESIS PROTOCOLS
US20100323348A1 (en) 2009-01-31 2010-12-23 The Regents Of The University Of Colorado, A Body Corporate Methods and Compositions for Using Error-Detecting and/or Error-Correcting Barcodes in Nucleic Acid Amplification Process
US8407554B2 (en) 2009-02-03 2013-03-26 Complete Genomics, Inc. Method and apparatus for quantification of DNA sequencing quality and construction of a characterizable model system using Reed-Solomon codes
US8772473B2 (en) 2009-03-30 2014-07-08 The Regents Of The University Of California Mostly natural DNA sequencing by synthesis
US8673627B2 (en) * 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
EP2327793A1 (en) 2009-11-25 2011-06-01 Universität Zu Köln Pyrosequencing method for predicting the response of a patient towards anti cancer treatment
US10662474B2 (en) 2010-01-19 2020-05-26 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic DNA by whole genome sequencing
US20110257889A1 (en) 2010-02-24 2011-10-20 Pacific Biosciences Of California, Inc. Sequence assembly and consensus sequence determination
CN101812530A (zh) * 2010-05-04 2010-08-25 杨进 一种核酸测序方法
WO2011156707A2 (en) 2010-06-11 2011-12-15 Life Technologies Corporation Alternative nucleotide flows in sequencing-by-synthesis methods
WO2012058459A2 (en) 2010-10-27 2012-05-03 Life Technologies Corporation Predictive model for use in sequencing-by-synthesis
WO2012118555A1 (en) 2010-12-29 2012-09-07 Life Technologies Corporation Time-warped background signal for sequencing-by-synthesis operations
US10241075B2 (en) 2010-12-30 2019-03-26 Life Technologies Corporation Methods, systems, and computer readable media for nucleic acid sequencing
EP2658999B1 (en) 2010-12-30 2019-03-13 Life Technologies Corporation Models for analyzing data from sequencing-by-synthesis operations
EP2694675B1 (en) 2011-04-08 2018-01-24 Life Technologies Corporation Phase-protecting reagent flow orderings for use in sequencing-by-synthesis

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007098049A3 (en) * 2006-02-16 2008-08-07 454 Life Sciences Corp System and method for correcting primer extension errors in nucleic acid sequence data

Also Published As

Publication number Publication date
EP3366782A1 (en) 2018-08-29
US20170044602A1 (en) 2017-02-16
US20230133734A1 (en) 2023-05-04
EP3878975A1 (en) 2021-09-15
US20120264621A1 (en) 2012-10-18
US20130288904A1 (en) 2013-10-31
CN105861645A (zh) 2016-08-17
US11390920B2 (en) 2022-07-19
US10370708B2 (en) 2019-08-06
EP2694675B1 (en) 2018-01-24
CN105861645B (zh) 2020-02-21
CN103764845A (zh) 2014-04-30
EP3366782B1 (en) 2021-03-10
US10597711B2 (en) 2020-03-24
US9428807B2 (en) 2016-08-30
EP2694675A1 (en) 2014-02-12
WO2012138921A1 (en) 2012-10-11
US20200190571A1 (en) 2020-06-18

Similar Documents

Publication Publication Date Title
CN103764845B (zh) 用于合成测序中的相保护试剂流排序
CN103060924B (zh) 微量核酸样本的文库制备方法及其应用
US20130280702A1 (en) Alternative nucleotide flows in sequencing-by-synthesis methods
US11887699B2 (en) Methods for compression of molecular tagged nucleic acid sequence data
JP7373047B2 (ja) 圧縮分子タグ付き核酸配列データを用いた融合の検出のための方法
US11208692B2 (en) Combinatorial barcode sequences, and related systems and methods
CN110997944A (zh) 用于检测brca1/2中的大片段重排方法和系统
CN107969138A (zh) 条形码序列和有关系统与方法
US20210163926A1 (en) Versatile amplicon single-cell droplet sequencing-based shotgun screening platform to accelerate functional genomics
EP2745108B1 (en) Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
CN106661613B (zh) 用于验证测序结果的系统和方法
CN106047990A (zh) 一种基于两核苷酸合成测序的pcr产物snp分型/突变检测方法
CN113614832A (zh) 用于检测伴侣未知的基因融合的方法
CN108291223A (zh) 液滴测序中的稀疏标识空间
CN105648084A (zh) 一种两核苷酸实时合成测序检测碱基连续突变序列的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant