CN103038365A - 用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法 - Google Patents

用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法 Download PDF

Info

Publication number
CN103038365A
CN103038365A CN2011800252079A CN201180025207A CN103038365A CN 103038365 A CN103038365 A CN 103038365A CN 2011800252079 A CN2011800252079 A CN 2011800252079A CN 201180025207 A CN201180025207 A CN 201180025207A CN 103038365 A CN103038365 A CN 103038365A
Authority
CN
China
Prior art keywords
species
nucleotide species
nucleotide
concentration
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011800252079A
Other languages
English (en)
Inventor
J.M.布鲁内尔
A.d.A.卡普里奥
陈怡儒
S.M.克拉克
X.V.戈梅斯
V.马克希贾尼
黃昭泰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
F Hoffmann La Roche AG
Roche Diagnostics GmbH
Original Assignee
F Hoffmann La Roche AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by F Hoffmann La Roche AG filed Critical F Hoffmann La Roche AG
Publication of CN103038365A publication Critical patent/CN103038365A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

描述了一种用于优化测序性能的方法的一个实施例,其包括以下步骤:对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。

Description

用于在DNA测序技术中针对酶促效率调整核苷酸浓度的系统和方法
技术领域
本发明提供一种用于在测序技术中确定并使用最有利的核苷酸浓度的系统和方法。更具体来说,本发明是基于检测腺苷三磷酸双磷酸酶和DNA聚合酶的特定于物种的酶促效率,以便作为获得通过至少部分地基于酶促效率调节相应的核苷酸物种的浓度而实现的最优测序性能的措施。
背景技术
合成测序(SBS)通常指的是用于确定核酸样本中的一种或更多种核苷酸的身份或序列构成的方法,其中所述方法包括逐步合成与将要确定其核苷酸序列构成的模板核酸分子互补的多核苷酸分子的单链。举例来说,SBS技术通常如下操作:在相应的序列位置处,将单核酸(其也被称作核苷酸)物种添加到与模板分子的核酸物种互补的初生多核苷酸分子。通常利用本领域内已知的各种方法来检测将核酸物种添加到初生分子中,其中包括(但不限于)检测响应于焦磷酸盐分子的释放而发出的光的所谓焦磷酸测序方法、检测响应于氢离子的释放的pH改变的方法或者比如采用可逆终止子的那些的荧光检测方法。添加核苷酸物种的处理通常是迭代性(interative)的,直到合成与模板互补的完整的(即所有序列位置都被表示)或者所期望的序列长度为止。在美国专利号6,274,320、7,211,390、7,244,559、7,264,929和7,335,762中描述了SBS技术的一些例子,其中的每一篇出于所有目的被全文合并在此以作参考。
在SBS的一些实施例中,将寡核苷酸引物(primer)设计成退火到与样本模板分子相关联的预定互补序列。在存在核酸聚合酶的情况下为引物/模板络合物给出核苷酸物种。如果所述核苷酸物种与对应于样本模板分子上的直接邻近寡核苷酸引物的3’末端的序列位置的核酸物种互补,则聚合酶将利用所述核苷酸物种延伸引物。可替换地,在一些实施例中,为引物/模板络合物同时给出多个感兴趣的核苷酸物种(通常是A、G、C和T),并且在样本模板分子上的直接邻近寡核苷酸引物的3’末端的对应序列位置处互补的核苷酸物种被合并。在任一个所描述的实施例中,核苷酸物种可能被化学阻滞(比如在3’-O位置处)以防止进一步延伸,并且需要在下一轮合成之前解除阻滞。如前所述,可以通过本领域内已知的多种方法来检测对于核苷酸物种的合并,例如通过检测焦磷酸盐(PPi)的释放(在美国专利号6,210,891、6,258,568和6,828,100中描述了例子,其中的每一篇出于所有目的被全文合并在此以作参考)、通过检测氢的释放或者通过与核苷酸结合的可检测标签。可检测标签的一些例子包括(但不限于)质量标记以及荧光或化学发光标签。
在典型的实施例中,例如通过酶促降解和清洗去除未被合并的核苷酸。特别在清洗效率低的情况下,可以通过添加腺苷三磷酸双磷酸酶来实现对于自由核苷酸的酶促去除。本领域普通技术人员将认识到,腺苷三磷酸双磷酸酶对于自由核苷酸的工作是通过打断dNTP分子的分子键,从而产生单磷酸核苷酸和无机磷酸盐(Pi)。因此,诸如ATP之类的dNTP被分解成dNMP(或者在ATP的情况下是AMP)和2个Pi分子。在其中使用了可检测标签的实施例中,通常将必须在后面的合成循环之前解除其活性(例如通过化学裂解或光致漂白)。随后可以利用另一个核苷酸物种或者感兴趣的多个核苷酸物种对模板/聚合酶络合物中的下一个序列位置进行查询,正如前面所描述的那样。核苷酸物种添加、引物延伸、信号采集、多余核苷酸分子降解以及清洗的迭代导致确定模板链的核苷酸序列。
在SBS的典型实施例中,在任一次测序反应中同时对大量或众多基本上完全相同的模板分子(例如103、104、105、106或107个分子)进行分析,以便获得强到足以进行可靠检测的信号。对于低信噪比要求与给定反应的群体中的基本上所有模板分子相关联的初生分子的所谓“同质延伸”。这里所使用的术语“同质延伸”通常指的是延伸反应的关系或相位,其中前面所描述的每一个基本上完全相同的模板分子同质地施行反应中的相同步骤。举例来说,与模板分子的群体相关联的每一项延伸反应当其在对于每一个相关联的模板分子的相同序列位置处施行相同的反应步骤时可以被描述为彼此同相或者处于相位同步。
本领域普通技术人员将认识到,聚合酶延伸反应可能导致每一个群体中的一小部分模板分子失去或脱离与所述群体中的其余模板分子的相位同步,(也就是说,与模板分子的所述部分相关联的反应或者提前于或者落后于所述群体上的测序反应游程(run)中的其他模板分子(在Ronaghi, M.的“Pyrosequencing sheds light on DNA sequencing”Genome Res. 11,3-11,(2001年)中描述了一些例子,其出于所有目的被全文合并在此以作参考))。举例来说,聚合酶没有能够将一个或更多核苷酸物种正确地合并到一个或更多初生分子中以便把序列延伸一个位置,将导致每一项后续反应所处的序列位置落后于所述群体的其余部分的序列位置并且与之异相。这种效应在这里被称作“不完整延伸”(IE)。可替换地,通过在提前于群体的其余部分的序列位置并且与之异相的序列位置处合并一个或更多核苷酸物种而导致的初生分子的不正确延伸在这里被称作“前推(carry forward)”(CF)。CF与IE的组合效应在这里被称作CAFIE。在下面的专利申请中描述了用于校正CAFIE错误的系统和方法的例子:2007年2月15日提交的标题为“System and Method For Correcting Primer Extension Errors in Nucleic Acid Sequence Data(用于校正核酸序列数据中的引物延伸错误的系统和方法)”的美国专利申请序列号12/224,065和2001年3月8日提交的标题为“System and Method to Correct Out of Phase Errors in DNA Sequencing Data by Use of Recursive Algorithm(通过使用递归算法来校正DNA测序数据中的异相错误的系统和方法)”的13/043,063;其中的每一项出于所有目的被全文合并在此以作参考。
关于不完整延伸的问题,可能存在促成IE的几种可能的机制,所述机制可能单独发生或者以某种组合发生。促成IE的可能机制的一个例子可以包括:缺少为模板/聚合酶络合物的子集给出的核苷酸物种。促成IE的可能机制的另一个例子可以包括:聚合酶分子的子集没有能够合并被正确地给出以供合并到初生分子中的核苷酸物种。促成IE的可能机制的另一个例子可以包括:在模板/聚合酶络合物处缺乏聚合酶活性。
关于CF的问题,可能存在促成CF的几种可能的机制,所述机制可能单独发生或者以某种组合发生。举例来说,一种可能的机制可以包括:从前一个循环遗留下的多余核苷酸物种。在该例中,其结果可能包括:一小部分“A”核苷酸物种存在于“G”核苷酸物种循环中,从而在模板分子中的对应序列位置处存在互补的“T”核苷酸物种的情况下会导致一小部分初生分子的延伸。导致前推效应的可能机制的另一个例子可以包括聚合酶错误,比如核苷酸物种被错误地合并到不与模板分子上的核苷酸物种互补的初生分子中。
因此应当认识到,为了使得引入CAFIE相位同步错误的可能性最小化,非常希望在流动中给出核苷酸物种的浓度,其被优化成高到足以使得聚合酶可以在短时间段期间高效地将核苷酸物种合并到模板分子群体的所有成员,而与此同时还被优化成低到足以使得诸如腺苷三磷酸双磷酸酶之类的降解酶在合并时段之后与多余核苷酸发生反应并且使其无法被聚合酶合并。还应当认识到,酶的效率可以特定于每一个核苷酸物种,其中一种酶对于一个物种可能更加高效并且对于另一个物种效率较低。
因此,下面的能力将是特别有利的:对于聚合酶和腺苷三磷酸双磷酸酶二者确定特定于物种的酶促效率,并且在通过合成反应进行的测序中采用每一个核苷酸物种的作为对于该物种的合并和降解效率之间的优化平衡的浓度。
发明内容
本发明的实施例涉及分子生物学。更具体来说,本发明的实施例涉及基于特定于物种的酶促效率(特别是腺苷三磷酸双磷酸酶和DNA聚合酶的效率)来调整用在测序方法中的每一个核苷酸物种的浓度的方法和系统,以便达到任何给定SBS游程的最优测序性能。
描述了用于优化测序性能的方法的一个实施例,其包括以下步骤:对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶被引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。
此外描述了用于优化测序性能的方法的一个实施例,其包括以下步骤:将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和某一物种的模板核酸分子的某一类型的反应环境中,以便产生所述物种的模板核酸分子的未经校正的序列构成;根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成对于每一个核苷酸物种确定完成(completion)效率值和前推值;以及利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。
在一些实现方式中,所述方法还包括利用所述类型的反应环境执行测序反应的步骤,其中所述测序反应包括以下步骤:在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到反应环境;以及检测响应于由聚合酶合并核酸物种而生成的多个信号。
此外描述了用于优化测序性能的系统的一个实施例,所述系统包括计算机和测序仪器,所述计算机包括存储在其上的可执行代码,其中所述可执行代码施行包括以下步骤的方法:对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;以及利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;所述测序仪器施行包括以下步骤的方法:在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及检测响应于核苷酸物种的合并的信号。
前面的实施例和实现方式不一定彼此包含或排斥,并且可以按照没有冲突并且另为可能的任意方式相组合,而不管其是与同一个还是不同的实施例或实现方式相关联地给出的。对于一个实施例或实现方式的描述不意图关于其他实施例和/或实现方式进行限制。此外,在本说明书中的其他地方描述的任何一项或更多项功能、步骤、操作或技术在替换的实现方式中可以与在概要中描述的任何一项或更多项功能、步骤、操作或技术相组合。因此,前面的实施例和实现方式是说明性而非限制性的。
因此,本发明的第一方面被限定为一种用于优化测序性能的方法,其包括以下步骤:
a)对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
b)利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;
c)在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及
d)检测响应于核苷酸物种的合并的信号。
确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡。可以利用米氏方程(Michaelis-Menten equation)计算特定于核苷酸物种的降解速率。
所述多个核苷酸物种可以包括dTTP、dCTP、dGTP、dATP和/或α-thio-dATP。可以对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。
对于多个或者甚至每一个核苷酸物种的浓度可以彼此不同。
可以通过在反应环境中把每一个核苷酸物种的浓度保持足够时间从而使得在通过腺苷三磷酸双磷酸酶降解之前发生合并来优化合并效率。
可以基于核苷酸物种与核酸模板物种的互补性来在一个或更多处将核苷酸物种的分子合并到初生分子中。
前面公开的方法还可以包括从检测到的信号生成序列读取的步骤,其中序列读取包括所述物种的模板核酸分子的序列构成。
本发明的第二方面被限定为一种用于优化测序性能的方法,其包括以下步骤:
a)将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和某一物种的模板核酸分子的某一类型的反应环境中,以便产生所述物种的模板核酸分子的未经校正的序列构成;
b)根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成来对于每一个核苷酸物种确定完成效率值和前推值;以及
c)利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。
在一个实施例中,所述方法还包括以下步骤:
d)利用所述类型的反应环境执行测序反应,其中所述测序反应包括以下步骤:
i、在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到反应环境;以及
ii、检测响应于由聚合酶合并核酸物种而生成的多个信号。
如果包括步骤d),则可以在特定于核苷酸物种的浓度下把腺苷三磷酸双磷酸酶递送到反应环境。
反应环境的类型可以包括布置在平面基质(substrate)上的阱(well),其中所述平面基质包括多个阱。
所述相对浓度包括第一百分比的A核苷酸物种浓度和T核苷酸物种浓度相对于第二百分比的G核苷酸物种浓度和C核苷酸物种浓度。如果是这种情况,则可以根据所述物种的模板核酸分子的序列构成来定义第一百分比和第二百分比,其中所述序列构成是AT富集或GC富集。
类似于前面公开的本发明的第一方面,所述多个核苷酸物种可以包括dTTP、dCTP、dGTP、dATP和/或α-thio-dATP。可以对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。
在第三方面,本发明针对一种用于施行前面公开的新方法的系统和仪器。更精确地说,本发明提供一种用于优化测序性能的系统或仪器,其包括:
a)包括存储在其上的可执行代码的计算机,其中所述可执行代码施行包括以下步骤的方法:
i、对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
ii、利用特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;以及
b)施行包括以下步骤的方法的测序仪器:
i、在包括聚合酶和某一物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入反应环境以便降解未被合并的核苷酸物种分子;以及
ii、检测响应于核苷酸物种的合并的信号。
附图说明
通过下面结合附图做出的详细描述将会更加清楚地认识到前述和其他特征。在附图中,相似的附图标记指代相似的结构、元件或方法步骤,并且附图标记的最左一位数字指代所提到的元件第一次出现在其中的附图编号(例如元件160第一次出现在图1中)。但是所有这些惯例意图是典型性或说明性而非限制性的。图1是处于计算机控制下的测序仪器和反应基质的一个实施例的功能方框图。
具体实施方式
正如下面将要更加详细地描述的那样,当前描述的发明的实施例包括一种用于在测序技术中针对特定于物种的酶促效率调整核苷酸物种的浓度的系统和方法。具体来说,本发明的实施例涉及基于SBS系统的酶(即腺苷三磷酸双磷酸酶和DNA聚合酶)的反应速率来优化核苷酸浓度。
a、一般性描述
术语“流图”通常指的是通过SBS方法(特别是基于焦磷酸盐的测序方法,其也被称作“焦磷酸测序”)生成的序列数据的图形表示,并且更加特别地可以被称作“裂解色谱图”。
这里使用的术语“读取”或“序列读取”通常指的是从单个核酸模板分子或者由所述模板核酸分子的多个基本上完全相同的拷贝构成的群体获得的整个序列数据。
这里使用的术语“游程”或“测序游程”通常指的是在对于一个或更多模板核酸分子的测序操作中施行的一系列测序反应。
这里使用的术语“流动”通常指的是典型地作为把流体溶液引入到包括模板核酸分子的反应环境的迭代过程的一部分的单个循环,其中所述溶液可以包括用于添加到初生分子或其他试剂的核苷酸物种,比如可以在测序过程中采用的或者用以减少来自核苷酸物种的先前流动的遗留物或噪声效应的缓冲剂、清洗溶液或酶。
这里使用的术语“流动循环”通常指的是其中在所述循环期间把包括某一核苷酸物种的流体流动一次的顺序的一系列流动(也就是说一个流动循环可以包括按照T、A、C、G核苷酸物种的次序的顺序添加,但是其他序列组合也被视为所述定义的一部分)。通常来说,流动循环是重复循环,其在各个循环之间具有相同的流动序列。
这里使用的术语“读取长度”通常指的是可以对其进行可靠地测序的模板分子的长度上限。存在许多促成系统和/或过程的读取长度的因素,其中包括(但不限于)模板核酸分子中的GC含量的程度。
这里使用的术语“测试片段”或“TF”通常指的是可以出于质量控制、校准或者其他有关目的而被采用的具有已知序列构成的核酸元素。
这里使用的术语“引物”通常指的是在一定条件下充当DNA合成的发起点的寡核苷酸,在所述条件下,在适当的温度下并且在适合的缓冲剂中引发与核酸链互补的引物延伸产物的合成。引物优选地是单链脱氧寡核苷酸。
“初生分子”通常指的是通过合并与模板分子中的对应核苷酸物种互补的核苷酸物种而由与模板相关的DNA聚合酶延伸的DNA链。
术语“模板核酸”、“模板分子”、“目标核酸”或“目标分子”通常指的是作为从中生成序列数据或信息的测序反应的对象的核酸分子。
这里使用的术语“核苷酸物种”通常指的是通常被合并到初生核酸分子中的包括嘌呤(腺嘌呤、鸟嘌呤)和嘧啶(胞嘧啶、尿嘧啶、胸腺嘧啶)的核酸单体的身份。
这里使用的术语“单体重复”或“均聚物”通常指的是包括相同核苷酸物种的两个或更多序列位置(即重复的核苷酸物种)。
这里使用的术语“同质延伸”通常指的是延伸反应的关系或相位,其中由基本上完全相同的模板分子构成的群体的每一个成员正同质地施行反应中的相同延伸步骤。
这里使用的术语“完成效率”通常指的是在给定流动期间被正确地延伸的初生分子的百分比。
这里使用的术语“不完整延伸比率”通常指的是没有被正确地延伸的初生分子的数目与所有初生分子的数目的比值。
这里使用的术语“基因组库”或“散弹枪基因库”通常指的是从有机体或个体的整个基因组(即基因组的所有区段)导出和/或代表所述整个基因组的分子集。
这里使用的术语“扩增子”通常指的是所选择的扩增产物,比如从聚合酶链反应或连接酶链反应技术产生的那些扩增产物。
这里使用的术语“变异体”或“等位基因”通常指的是各自编码类似的序列构成的多个物种当中的一个,但是所述多个物种彼此又有一定程度的区别。所述区别可以包括相关领域普通技术人员所知的任何类型的变化,其中包括(但不限于)例如单核苷酸多态性(SNP)之类的多态性、插入或删除(插入/删除事件的组合也被称作“indels(插入删除)”)、重复序列(其也被称作串联重复)的数目的差异、以及结构变化。
这里使用的术语“等位基因频率”或“等位基因的频率”通常指的是由特定变异体构成的一个群体当中的所有变异体的比例。
这里使用的术语“关键序列”或“关键元素”通常指的是与已知位置处(即通常被包括在所连接的适配子元素中)的模板核酸分子相关联的包括已知序列构成的核酸序列元素(其通常具有大约4个序列位置(即TGAC)或者核苷酸物种的其他组合),其被采用作为针对从模板分子生成的序列数据的质量控制参考。如果序列数据在正确的位置处包括与关键元素相关联的已知序列构成,则其通过质量控制。
这里使用的术语“关键通过(keypass)”或“关键通过阱”通常指的是在反应阱中对于具有已知序列构成的完全长度核酸测试序列(即前面提到的“测试片段”或“TF”)的测序,其中把从TF序列和/或与TF相关联或者处于与目标核酸相关联的适配子中的关键序列导出的序列的精度与TF和/或关键序列的已知序列构成进行比较,并且将其用来测量测序的精度以及用于质量控制。在典型的实施例中,测序游程中的阱的总数的一定比例将是关键通过阱,其在一些实施例中可以是区域性分布的。
这里使用的术语“钝性末端”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是其一端终结于一对互补核苷酸碱基物种的线性双链核酸分子,其中一对钝性末端通常对于彼此连接是相容的。
这里使用的术语“粘性末端”或“突出”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是在分子的一条链的末端具有一个或更多未配对核苷酸物种的线性双链核酸分子,其中所述未配对核苷酸物种可以存在于任一条链上并且包括单个碱基位置或多个碱基位置(其有时也被称作“黏性末端”)。
这里使用的术语“SPRI”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是“固相可逆固定(Solid Phase Reversible Immobilization)”的专利技术,其中在存在微珠的情况下并且在特定的缓冲剂条件下选择性地沉淀目标核酸,其中所述微珠常常被羧化并且是顺磁性的。所沉淀的目标核酸固定到所述微珠上并且保持与之结合,直到根据操作员的需要通过洗脱缓冲剂去除为止(DeAngelis, Margaret M.等人的“Solid-Phase Reversible Immobilization for the Isolation of PCR Products”(Nucleic Acids Res,1995年,Vol. 23:22,4742-4743),其出于所有目的被全文合并在此以作参考)。
这里使用的术语“羧化”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是通过添加至少一个羧基来修改例如微粒子之类的材料。羧基是COOH或COO-。
这里使用的术语“顺磁性”是与相关领域的普通技术人员的理解一致地来解释的,并且通常指的是材料的特性,其中只有在存在外加磁场的情况下所述材料才具有磁性,并且一旦去除了外加磁场之后就不再保留任何磁化。
这里使用的术语“微珠”或“微珠基质”通常指的是具有任何便利的尺寸、具有不规则或规则形状的任何类型的固相颗粒,并且其是从许多已知材料制作的,比如纤维素、纤维素衍生物、丙烯酸树脂、玻璃、硅胶、聚苯乙烯、明胶、聚乙烯基吡咯烷酮、乙烯基与丙烯酰胺的共聚物、与二乙烯基苯等等交联的聚苯乙烯(如在Merrifield,Biochemistry 1964,3,1385-1390中所描述的那样)、聚丙烯酰胺、乳胶、聚苯乙烯、右旋糖苷、橡胶、硅、塑料、硝化纤维、自然海绵、硅胶、可控孔度玻璃、金属、交联的右旋糖苷(例如SephadexTM)琼脂糖凝胶(SepharoseTM)以及本领域技术人员所知的其他固相微珠支持物。
这里使用的术语“反应环境”通常指的是通常可以在其中发生反应的一定体积的空间,反应物被至少暂时性地包含或局限在其中从而允许检测至少一种反应产物。反应环境的例子包括(但不限于)小容器、管、瓶以及平面或非平面基质上的一个或更多凹窝、阱或腔室。
下面将总体上描述与样本准备和处理、序列数据生成以及序列数据分析相关联的系统和方法的一些示例性实施例,其中一部分或全部可经得起检验地用于这里所描述的发明的实施例。具体来说,将描述用于准备模板核酸分子、扩增模板分子、生成特定于目标的扩增子和/或基因组库的系统和方法、测序方法和仪器以及计算机系统的实施例。
在典型的实施例中,应当把从实验或诊断样本导出的核酸分子从其未经处理的形式准备及处理成可经得起检验地用于高吞吐量测序的模板分子。处理方法对于不同应用可以不同,从而得到包括各种特性的模板分子。举例来说,在高吞吐量测序的一些实施例中,优选地生成模板分子,其序列或读取长度至少与特定测序方法可以为之准确地产生序列数据的长度相当。在该例中,所述长度可以包括下述范围:大约25-30个碱基对、大约50-100个碱基对、大约200-300个碱基对、大约350-500个碱基对、大约500-1000个碱基对、多于1000个碱基对或者可经得起检验地用于特定测序应用的其他长度。在一些实施例中,利用本领域普通技术人员所知的若干方法对来自样本(比如基因组样本)的核酸进行分段。在优选实施例中,所述方法对核酸进行随机分段(即不针对特定序列或区段进行选择)并且可以包括被称为雾化或超声降解方法的那些。但是应当认识到,可以采用其他分段方法以用于分段目的,比如利用限制内切核酸酶进行消化。此外在该例中,一些处理方法可以采用本领域内已知的尺寸选择方法来选择性地分离出具有所期望的长度的核酸片段。
此外,在一些实施例中优选地把附加的功能元素与每一个模板核酸分子相关联。可以针对多种功能采用所述元素,其中包括(但不限于)用于扩增和/或测序方法的引物序列、质量控制元素(即,比如关键元素或者其他类型的质量控制元素)、对例如与来源或患者的样本的各种关联进行编码的唯一标识符(其也被称作复用标识符或“MID”)或者其他功能元素。
举例来说,所描述的发明的一些实施例包括把具有已知的并且可识别的序列构成的MID元素的一个或更多实施例与样本相关联,并且把MID元素的实施例与来自相关联的样本的模板核酸分子相耦合。来自若干不同样本的耦合了MID的模板核酸分子被聚集到单个“复用”样本或构成中,其随后可以被高效地处理以便产生对于每一个耦合了MID的模板核酸分子的序列数据。将对于每一种模板核酸的序列数据去卷积,以便识别出耦合了MID元素的序列构成以及与所识别出的来源样本的关联。在该例中,复用的构成可以包括来自大约384个样本、大约96个样本、大约50个样本、大约20个样本、大约16个样本、大约12个样本、大约10个样本或者其他数目的样本的代表。每一个样本可以与研究情境中的不同的实验条件、治疗、物种或个体相关联。类似地,每一个样本可以与诊断情境中的不同的组织、细胞、个体、条件、药物或其他治疗相关联。相关领域的普通技术人员将认识到,前面列出的样本的数目是为了举例的目的,并且因此不应当被视为进行限制。
在优选实施例中,每一个MID元素的序列构成很容易识别,并且对于从测序过程引入的错误具有抗性。MID元素的一些实施例包括与自然出现的序列具有最低序列相似性的核酸物种的唯一序列构成。可替换地,MID元素的实施例可以包括与自然出现的序列的某种程度的序列相似性。
此外,在优选实施例中,每一个MID元素相对于模板核酸分子的某一特征和/或耦合到模板分子的适配子元素的位置是已知的。令每一个MID具有已知的位置对于在序列数据中找到MID元素、以及针对可能的错误解释MID序列构成以及与来源样本的后续关联都是有用的。
举例来说,可以用作针对MID元素的位置关系的锚定的一些特征可以包括(但不限于)模板分子的长度(也就是说已知MID元素与5’或3’末端相距如此多个序列位置)、诸如关键元素之类的可辨识序列标记以及/或者其位置与MID元素邻近的一个或更多引物元素。在该例中,关键和引物元素通常包括已知的序列构成,其在复用构成中的不同样本之间通常不发生变化,并且可以被采用作为搜索MID元素的位置参考。由应用135实施的分析算法可以在计算机130上执行,以便分析对于每一个耦合了MID的模板所生成的序列数据,从而识别出更加容易辨识的关键和/或引物元素,并且从这些位置进行外推从而识别出被推测为包括MID元素的序列的序列区段。应用135随后可以处理所推测出的区段以及可能在侧翼区段中离开一定距离的序列构成,从而确实识别出MID元素及其序列构成。
所描述的其中一些或所有功能元素可以被组合到适配子元素中,其在特定处理步骤中被耦合到核苷酸序列。举例来说,一些实施例可以把包括互补序列构成的引物序列元素或区段关联到被采用于扩增和/或测序的引物序列。此外,相同的元素可以被采用于被称为“链选择”以及把核酸分子固定到固相基质的那些。在一些实施例中,两组引物序列区段(在下文中称作引物序列A和引物序列B)可以被采用于链选择,其中只把具有引物序列A的一份拷贝和引物序列B的一份拷贝的单链选择并且包括作为所准备的样本。在替换的实施例中,适配子元素的设计特性消除了对链选择的需要。在用于扩增和固定的方法中可以采用相同的引物序列,其中例如可以把引物序列B固定在固体基质上,并且从该处延伸扩增产物。
在下面的专利申请中描述了用于分段、链选择以及添加功能元素和适配子的样本处理的附加实例:2004年1月28日提交的标题为“Method for preparing singled-stranded DNA libraries(用于准备单链DNA库的方法)”的美国专利申请序列号10/767,894;2008年5月29日提交的标题为“System and Method for Identification of Individual Samples from a Multiplex Mixture(用于从复用混合物中识别单独样本的系统和方法)”的美国专利申请序列号12/156,242;以及2009年2月23日提交的标题为“System and Method for Improved Processing of Nucleic Acids for Production of Sequencable Libraries(用于改进对于核酸的处理以便产生可测序库的系统和方法)”的美国专利申请序列号12/380,139,其中的每一篇出于所有目的被全文合并在此以作参考。
将描述用于施行模板核酸分子的扩增以便生成由基本上完全相同的拷贝构成的群体的系统和方法的各个实例。本领域普通技术人员将会看到,在SBS的一些实施例中,在把一个或更多核苷酸物种合并到与模板分子的一份拷贝相关联的每一个初生分子中时,希望生成每一个核酸元素的许多拷贝以便生成更强的信号。在本领域内已经知道许多用于生成核酸分子的拷贝的技术,比如例如利用被称为细菌载体的扩增、“滚动圆(Rolling Circle)”扩增(在合并于前文中以作参考的美国专利号6,274,320和7,211,390中做了描述)以及聚合酶链反应(PCR)方法的那些,其中的每一种技术都适于与这里所描述的本发明一起使用。特别可经得起检验地用于高吞吐量应用的一种PCR技术包括被称为乳剂PCR方法(其也被称作emPCRTM方法)的那些。
乳剂PCR方法的典型实施例包括产生两种不相混物质的稳定乳剂,从而产生可以在其中发生反应的水的液滴。具体来说,可经得起检验地用在PCR方法中的乳剂的水的液滴可以包括作为液滴(其也被称作不连续相)悬浮或散布在另一种流体(比如通常包括某种类型的油的疏水流体,其也被称作连续相)中的第一流体(比如基于水的流体)。可以采用的油的例子包括(但不限于)矿物油、基于硅酮的油或者氟化油。
此外,一些乳剂实施例可以采用用来稳定乳剂的表面活性剂,其对于诸如PCR之类的特定处理方法可能特别有用。表面活性剂的一些实施例可以包括硅酮或氟化表面活性剂当中的一种或更多种。举例来说,可以采用一种或更多种非离子表面活性剂,其中包括(但不限于)山梨糖醇酐单油酸酯(其也被称作SpanTM 80)、聚氧乙烯山梨醇酐单油酸酯(其也被称作TweenTM 80),或者在一些优选实施例中包括聚二甲基硅氧烷共聚醇(其也被称作Abil® EM90)、聚硅氧烷、聚烷基聚醚共聚物、聚甘油酯、泊洛沙姆以及PVP/十六烷共聚物(其也被称作单聚物U-151),或者在更加优选的实施例中包括环戊硅氧烷中的高分子量硅聚醚(其也被称作可以从Dow Corning获得的DC 5225C)。
乳剂的液滴还可以被称作隔室、微胶囊、微反应器、微环境或者相关领域内所常用的其他名称。水的液滴的尺寸范围可以取决于乳剂组分或成分的构成、包含在其中的内容以及所采用的形成技术。所描述的乳剂产生可以在其中施行化学反应(比如PCR)的微环境。举例来说,施行所期望的PCR反应所必需的模板核酸和所有试剂都可以被封装并且化学隔离在乳剂的液滴中。在一些实施例中可以采用附加的表面活性剂或其他稳定剂以便促进液滴的附加稳定性,正如前面所描述的那样。可以利用所述液滴执行PCR方法所典型的热循环操作以便扩增所封装的核酸模板,从而导致生成包括模板核酸的许多基本上完全相同的拷贝的群体。在一些实施例中,液滴内的群体可以被称作“克隆隔离”、“隔室化”、“隔绝”、“封装”或“局部化”的群体。此外在该例中,所描述的其中一些或所有液滴还可以封装诸如微珠之类的固体基质,以便附着模板和模板的扩增拷贝、与模板互补的扩增拷贝或其组合。此外,可以允许所述固体基质附着其他类型的核酸、试剂、标签或者其他感兴趣的分子。
在乳剂破裂和微珠恢复之后,在典型的实施例中可能还希望“富集”在其上固定了模板核酸分子的基本上完全相同的拷贝的成功地扩增的群体的微珠。举例来说,用于富集“DNA阳性”的微珠的处理可以包括:把引物物种杂交到通常在适配子序列中找到的已固定的扩增拷贝的自由末端上的区段,利用聚合酶居间促成的延伸反应延伸引物,以及将引物结合到诸如磁性或琼脂糖微珠之类的富集基质。可以对包括微珠的溶液施加选择性条件,比如磁场或离心作用,其中富集磁珠对所述选择性条件做出响应并且与“DNA阴性”的微珠分离(即不具有或者只有很少已固定拷贝)。
可用于当前描述的本发明的乳剂的实施例可以包括非常高密度的液滴或微胶囊,从而允许按照大规模并行的方式施行所描述的化学反应。在美国专利号7,638,276、7,622,280、7,842,457和7,927,797以及美国专利申请序列号11/982,095中描述了对于扩增所采用的乳剂及其在测序应用中的使用的附加实例,其中的每一篇出于所有目的被全文合并在此以作参考。
此外,有时被称作超深测序的实施例生成用于测序的特定于目标的扩增子,其可以与当前描述的本发明一起采用,其包括使用各组特定的核酸引物以扩增来自包括目标核酸的样本的一个或多个所选目标区段。此外,样本可能包括由已知或疑似包含序列变异体的核酸分子构成的群体,其中包括与研究或诊断用途相关联的序列构成,在这种情况下可以采用引物来扩增序列变异体在样本中的分布并且提供对其的理解。举例来说,可以施行一种用于通过对于核酸样本中的多个等位基因的特定扩增和测序来识别序列变异体的方法。首先通过一对PCR引物对核酸进行扩增,所述PCR引物被设计成扩增围绕感兴趣区段或者核酸群体所共有的片段的区段。随后在单独的反应容器(比如前面描述的基于乳剂的容器)中对PCR反应的每一项产物(第一扩增子)进行进一步的单独扩增。对各自从第一扩增子群体当中的一个成员导出的所得到的扩增子(其在这里被称作第二扩增子)进行测序,并且序列集被用来确定所存在的一种或更多种变异体的等位基因频率。很重要的是,所述方法不需要关于所存在的变异体的先前知识,并且可以通常识别出在核酸分子的群体中以<1%的频率存在的变异体。
所描述的特定于目标的扩增和测序方法的一些优点包括高于先前所获得的灵敏度水平。此外,对于采用高吞吐量测序仪器的实施例,比如例如对于采用由454 Life Sciences Corporation提供的被称为PicoTiterPlate®阵列(其有时也被称作PTPTM平板或阵列)阱的那些的实例实施例,可以采用所描述的方法对于每次游程或实验为超过100000个、超过300000个、超过500000个或者超过1000000个核酸区段生成序列构成,并且这可以至少部分地取决于用户优选项,比如通过使用密封垫等而实现的通道配置等等。此外,所描述的方法提供对于可以代表等位基因变异体的1%或更少的低丰度等位基因的灵敏检测。所述方法的另一个优点在于生成包括所分析区段的序列的数据。很重要的是,不需要具有关于所分析的基因座的序列的先验知识。
在下面的专利申请中描述了用于测序的特定于目标的扩增子的附加实例:2005年4月12日提交的标题为“Methods for determining sequence variants using ultra-deep sequencing(利用超深测序来确定序列变异体的方法)”的美国专利申请序列号11/104,781;2008年3月14日提交的标题为“System and Method for Detection of HIV Drug Resistant Variants(用于检测对HIV药物具有抗性的变异体的系统和方法)”的PCT专利申请序列号US 2008/003424;以及2009年6月17日提交的标题为“System and Method for Detection of HIV Tropism Variants(用于检测HIV向性变异体的系统和方法)”的美国专利号7,888,034,其中的每一篇出于所有目的被全文合并在此以作参考。
此外,测序的实施例还可以包括Sanger类型的技术、通常被称作杂交测序(SBH)的技术、连接测序(SBL)或者合并测序(SBI)技术。此外,测序技术可以包括被称为聚合酶克隆测序技术;纳米孔、波导和其他单分子检测技术;或者可逆终止子技术的那些。如前所述,一种优选的技术可以包括合成测序方法。举例来说,一些SBS实施例对由核酸模板的基本上完全相同的拷贝构成的群体进行测序,并且通常采用一种或更多种寡核苷酸引物,所述寡核苷酸引物被设计成退火到样本模板分子或者附着到模板分子的一个或更多适配子的预定互补位置。在存在核酸聚合酶的情况下为引物/模板络合物给出核苷酸物种。如果所述核苷酸物种与对应于样本模板分子上的直接邻近寡核苷酸引物的3’末端的序列位置的核酸物种互补,则聚合酶将利用所述核苷酸物种延伸引物。可替换地,在一些实施例中,为引物/模板络合物同时给出多个感兴趣的核苷酸物种(通常是A、G、C和T),并且在样本模板分子上的直接邻近寡核苷酸引物的3’末端的对应序列位置处互补的核苷酸物种被合并。在任一个所描述的实施例中,核苷酸物种都可能被化学阻滞(比如在3’-O位置处)以防止进一步延伸,并且需要在下一轮合成之前解除阻滞。还应当认识到,向初生分子的末端添加核苷酸物种的处理与前面针对向引物末端进行添加所描述的处理基本上相同。
如前所述,可以通过本领域内已知的多种方法来检测对于核苷酸物种的合并,例如通过使用酶促反应处理产生光来检测焦磷酸盐(PPi)的释放或者通过检测pH改变(在美国专利号6,210,891、6,258,568和6,828,100中描述了例子,其中的每一篇出于所有目的被全文合并在此以作参考),或者通过与核苷酸结合的可检测标签。可检测标签的一些例子包括(但不限于)质量标记以及荧光或化学发光标签。在典型的实施例中,例如通过清洗来去除未被合并的核苷酸。此外,在一些实施例中,可以对未被合并的核苷酸进行酶促降解,比如例如利用腺苷三磷酸双磷酸酶或焦磷酸酶进行降解,正如在2008年6月27日提交的标题为“System and Method for Adaptive Reagent Control in Nucleic Acid Sequencing(用于核酸测序中的自适应试剂控制的系统和方法)”的美国专利申请序列号12/215,455和2009年1月29日提交的标题为“System and Method for Improved Signal Detection in Nucleic Acid Sequencing(用于改进核酸测序中的信号检测的系统和方法)”的12/322,284中所描述的那样,其中的每一篇出于所有目的被全文合并在此以作参考。
在其中使用可检测标签的实施例中,通常将必须在后面的合成循环之前解除其活性(例如通过化学裂解或光致漂白)。随后可以利用另一个核苷酸物种或者感兴趣的多个核苷酸物种对模板/聚合酶络合物中的下一个序列位置进行查询,正如前面所描述的那样。核苷酸添加、延伸、信号采集以及清洗的重复循环导致确定模板链的核苷酸序列。继续该例,通常在任一次测序反应中同时对大量或众多基本上完全相同的模板分子(例如103、104、105、106或107个分子)同时进行分析,以便获得强到足以进行可靠检测的信号。
此外,在一些实施例中可能有利的是改进测序过程的读取长度能力和质量,这是通过采用可以被称作“配对末端”的测序策略而实现的。举例来说,测序方法的一些实施例在可以从中生成高质量且可靠的读取的分子总长度方面受到限制。换句话说,取决于所采用的测序实施例,对于可靠读取长度的序列位置总数不可以超出25、50、100或500个碱基。配对末端测序策略通过对分子的每一个末端(其有时被称作“标记”末端)单独进行测序而扩展了可靠读取长度,其中所述分子在通过中心处的接头序列联结的每一个末端处包括原始模板核酸分子的一个片段。各模板片段的原始位置关系是已知的,并且因此可以把来自各序列读取的数据重组成具有更长的高质量读取长度的单一读取。在标题为“Paired end sequencing(配对末端测序)”的美国专利号7,601,499和2009年1月28日提交的标题为“Paired end sequencing(配对末端测序)”的美国专利申请序列号12/322,119中描述了配对末端测序实施例的其他实例,其中的每一篇出于所有目的被全文合并在此以作参考。
SBS设备的一些实例可以实施前面描述的其中一些或所有方法,并且可以包括诸如以下各项的检测器件中的一项或更多项:用于光学检测的共焦类型体系结构或者电荷耦合器件(即CCD摄影机),用于针对离子或化学品检测的离子敏感场效应晶体管(其也被称作“ISFET”)或化学品敏感场效应晶体管(其也被称作“ChemFET”),微流体腔室或流动单元,反应基质,以及/或者泵浦和流量阀。以基于焦磷酸盐的测序为例,一种设备的实施例可以采用产生固有地低水平背景噪声的化学发光检测策略。
在一些实施例中,用于测序的反应基质可以包括诸如载玻片类型基质的平面基质、ISFET或者在一些实施例中可以包括阱类型结构的波导类型反应基质。此外,反应基质可以包括如前所述的能够从454 Life Sciences Corporation获得的被称为PTPTM阵列的那些,其由光纤面板形成,所述光纤面板被酸蚀刻以便产生成千上万个或更多的非常小的阱,其中使得每一个阱能够容纳一个由基本上完全相同的模板分子构成的群体(也就是说,一些优选实施例在70x75mm的PTPTM阵列上包括大约330万个阱,其中阱间距为35μm)。在一些实施例中,由基本上完全相同的模板分子构成的每一个群体可以被布置在诸如微珠之类的固体基质上,它们中的每一个可以被布置在所述阱的其中一个中。举例来说,一种设备可以包括用于向PTP平板支架提供流体试剂的试剂递送元件,以及允许收集从PTP平板上的每一个阱发出的光的光子的CCD类型检测器件。在2005年8月30日提交的标题为“THIN-FILM COATED MICROWELL ARRAYS AND METHODS OF MAKING SAME(涂覆有薄膜的微阱阵列及其制作方法)”的美国专利号7,682,816中描述了包括用于改进信号辨识的特性的反应基质的一个例子,该专利出于所有目的被全文合并在此以作参考。在美国专利号7,323,305和7,575,865中描述了用于施行SBS类型测序和焦磷酸盐测序的设备和方法的其他实例,二者都被合并于前文中以作参考。
此外,还可以采用使得一项或更多项样本准备处理自动化的系统和方法,比如前面描述的emPCRTM处理。举例来说,可以采用自动化系统来提供针对生成用于emPCR处理的乳剂、施行PCR热循环操作以及对成功准备的核酸分子群体进行富集以供测序的高效解决方案。在2005年1月28日提交的标题为“Nucleic acid amplification with continuous flow emulsion(利用连续流动乳剂的核酸扩增)”的美国专利号7,927,797中描述了自动化样本准备系统的实例,其出于所有目的被全文合并在此以作参考。
此外,本发明的当前描述的实施例的系统和方法可以包括利用为了在计算机系统上执行而存储的计算机可读介质来实施某种设计、分析或其他操作。举例来说,下面详细描述了利用SBS系统和方法处理所检测到的信号和/或分析所生成的数据的几个实施例,其中所述处理和分析实施例是在计算机系统上实施的。
用于当前描述的本发明的计算机系统的一个示例性实施例可以包括任何类型的计算机平台,比如工作站、个人计算机、服务器或者任何其他现有的或未来的计算机。但是本领域的普通技术人员将认识到,这里所描述的前面提到的计算机平台被特别配置成施行所描述的发明的专门操作,而不被视为通用计算机。计算机通常包括已知的组件,比如处理器、操作系统、系统存储器、存储器存储器件、输入-输出控制器、输入-输出器件以及显示器件。相关领域的普通技术人员还将理解的是,计算机可以有许多可能的配置和组件,并且还可以包括高速缓冲存储器、数据备份单元以及许多其他器件。
显示器件可以包括提供视觉信息的显示器件,该信息通常可以在逻辑和/或物理方面被组织成像素阵列。还可以包括一个接口控制器,其可以包括用于提供输入和输出接口的多种已知的或未来的软件程序当中的任一种。举例来说,接口可以包括为用户提供一项或更多项图形表示的通常被称为“图形用户接口”(其常被称作GUI)的那些。通常使得接口能够接受利用相关领域的普通技术人员所知晓的选择或输入装置所给出的输入。
在相同的或替换的实施例中,计算机上的应用可以采用包括被称为“命令行接口”(其常被称作CLI)的那些的接口。CLI通常在应用与用户之间提供基于文本的交互。通常来说,命令行接口通过显示器件作为文本行呈现输出以及接收输入。举例来说,一些实现方式可以包括被称为“外壳”的那些,比如相关领域的普通技术人员所知晓的Unix Shell,或者采用诸如Microsoft.NET框架的面向对象类型的编程体系结构的Microsoft Windows Powershell。
相关领域的普通技术人员将认识到,接口可以包括一个或更多GUI、CLI或其组合。
处理器可以包括商业上能够买到的处理器,比如Intel Corporation制造的Celeron®、CoreTM或Pentium®处理器,Sun Microsystems制造的SPARC®处理器,AMD公司制造的AthlonTM、SempronTM、PhenomTM或OpteronTM处理器,或者其可以是现在或者将来可以获得的其他处理器的其中一款。处理器的一些实施例可以包括被称为多核处理器并且/或者被允许在单核或多核配置中采用并行处理技术的那些。举例来说,多核体系结构通常包括两个或更多处理器“执行核”。在该例中,每一个执行核可以作为一个独立的处理器运作,从而允许对于多个线程的并行执行。此外,相关领域的普通技术人员将认识到,处理器可以被配置在通常被称为32或64位体系结构的那些中,或者现在已知的或未来可能开发出的其他体系结构配置中。
处理器通常会执行操作系统,其例如可以是来自Microsoft Corporation的Windows®类型操作系统(比如Windows® XP、Windows Vista®或者Windows®_7),来自Apple Computer Corp.的Mac OS X操作系统(比如Mac OS X v10.6“Snow Leopard”操作系统),可以从许多销售商处获得或者可以被称作开放源码的Unix®或Linux类型操作系统,其他的或未来的操作系统,或者前述各项的某种组合。操作系统按照众做周知的方式与固件和硬件接合,并且促进处理器协调及执行可以用多种编程语言编写的各种计算机程序的功能。操作系统通常与处理器协作来协调及执行计算机的其他组件的功能。操作系统还全部根据已知的技术来提供调度、输入-输出控制、文件和数据管理、存储器管理以及通信控制和有关服务。
系统存储器可以包括多种已知的或未来的存储器存储器件当中的任一种。实例包括任何通常可以获得的随机存取存储器(RAM)、诸如驻留硬盘或磁带之类的磁性介质、诸如读和写紧致盘之类的光学介质或者其他存储器存储器件。存储器存储器件可以包括多种已知的或未来的器件当中的任一种,其中包括紧致盘驱动器、磁带驱动器、可移除硬盘驱动器、USB或闪存驱动器或者软盘驱动器。这些类型的存储器存储器件通常从程序存储介质(未示出)读取和/写入到程序存储介质(未示出),所述程序存储介质例如分别是紧致盘、磁带、可移除硬盘、USB或闪存驱动器或者软盘。这些程序存储介质或者现在使用中的或后来可能开发出的其他程序存储介质当中的任一项都可以被视为计算机程序产品。应当理解的是,这些程序存储介质通常存储计算机软件程序和/或数据。计算机软件程序(其也被称作计算机控制逻辑)通常被存储在系统存储器中和/或与存储器存储器件相结合地使用的程序存储器件中。
在一些实施例中,计算机程序产品被描述为包括其中存储有控制逻辑(包括程序代码的计算机软件程序)的计算机可用介质。当由处理器执行时,所述控制逻辑使得处理器施行这里所描述的功能。在其他实施例中,一些功能主要是例如利用硬件状态机而在硬件中实施的。相关领域技术人员将很容易认识到实施硬件状态机从而施行这里所描述的功能。
输入-输出控制器可以包括用于接受以及处理来自用户(不管其是人类还是机器、本地的还是远程的)的信息的多种已知器件当中的任一种。这样的器件例如包括调制解调器卡、无线卡、网络接口卡、声卡或者用于多种已知的输入器件当中的任一种的其他类型的控制器。输出控制器可以包括用于向用户(不管其是人类还是机器、本地的还是远程的)呈现信息的多种已知显示器件当中的任一种的控制器。在当前描述的实施例中,计算机的各功能元件通过系统总线彼此进行通信。计算机的一些实施例可以利用网络或者其他类型的远程通信与一些功能元件进行通信。
相关领域技术人员将认识到,仪器控制和/或数据处理应用如果是用软件实施的话则可以被加载到系统存储器和/或存储器存储器件中并且从系统存储器和/或存储器存储器件执行。仪器控制和/或数据处理应用的全部或部分还可以驻留在存储器存储器件的只读存储器或类似器件中,这样的器件不要求首先通过输入-输出控制器加载仪器控制和/或数据处理应用。相关领域技术人员将会理解的是,仪器控制和/或数据处理应用或者其一些部分可以由处理器按照已知的方式加载到系统存储器或高速缓冲存储器或者这二者中以利于执行。
此外,计算机可以包括存储在系统存储器中的一个或更多库文件、实验数据文件以及互联网客户端。举例来说,实验数据可以包括与一项或更多项实验或化验有关的数据,比如所检测到的信号值或者与一项或更多项SBS实验或处理相关联的其他值。此外,互联网客户端可以包括被实现为利用网络访问另一台计算机上的远程服务的应用,并且例如可以包括通常被称为“Web浏览器”的那些。在该例中,一些通常采用的web浏览器包括可以从Microsoft Corporation获得的Microsoft® Internet Explorer 8、从Mozilla Corporation获得的Mozilla Firefox® 3.6、从Apple Computer Corp.获得的Safari 4、从GoogleTM Corporation获得的Google Chrome或者本领域内当前已知的或未来将要开发的其他类型的web浏览器。此外,在相同的或其他实施例中,互联网客户端可以包括被实现为通过网络访问远程信息的专门化软件应用或者可以是所述专门化软件应用的一个元件,比如用于生物应用的数据处理应用。
网络可以包括本领域的普通技术人员所公知的许多种类型的网络当中的一种或更多种。举例来说,网络可以包括局域网或广域网,其采用通常被称为TCP/IP协议套的那些来进行通信。网络可以包括通常被称作因特网的世界范围的互连计算机网络系统,或者还可以包括各种内联网体系结构。相关领域的普通技术人员还将认识到,联网环境中的某些用户可能优选地采用通常被称为“防火墙”(其有时也被称作分组过滤器或边界保护器件)的那些来控制去往以及来自硬件和/或软件系统的信息业务。举例来说,防火墙可以包括硬件或软件元件或者其某种组合,并且通常被设计成实施用户(诸如例如网络管理员等等)所设置的安全性策略。
b、当前描述的本发明的实施例
如前所述,所描述的本发明的实施例针对用于基于在DNA测序技术中采用的一种或更多种酶的特定于物种的效率来优化引入到反应环境中的核苷酸物种的浓度的改进的系统和方法。
在典型的测序实施例中,可以采用使得一个或更多处理步骤自动化的一个或更多仪器元件。举例来说,可以利用仪器化来执行测序方法的实施例,从而自动化并且实施其中一些或所有处理步骤。图1提供了对于需要捕获光学信号的测序过程的测序仪器100的说明性实例,其通常包括光学子系统和流体子系统以用于执行发生在反应基质105上的测序反应和数据捕获。但是应当认识到,对于需要其他数据捕获模式(例如pH、温度、电化学等等)的测序过程来说,可以采用相关领域普通技术人员所知晓的对于所述数据捕获模式的子系统。举例来说,可以由用户101或某种自动化实施例将模板分子的样本加载到反应基质105中,随后利用测序仪器100按照大规模并行方式进行测序,以便产生代表每一个模板分子的序列构成的序列数据。很重要的是,用户101可以包括任何下面这样的用户,其包括(但不限于)独立研究者、技师、临床医师、大学或企业实体。
被采用来执行测序过程的测序仪器100的实施例可以包括流体子系统中的各种流体组件、光学子系统中的各种光学组件或者场效应晶体管类型的检测组件(例如ISFET或ChemFET)和pH检测的情况下的相关联子系统,以及未在图1中示出但是为本领域普通技术人员所知且常用的附加组件,其中可以包括用于对一些功能进行本地控制的微处理器和/或微控制器组件。在一些实施例中,可以可选地利用样本准备仪器180按照自动化或部分自动化的方式准备用于测序的样本,其中样本准备仪器180被配置成施行对于利用仪器100进行测序所必需的一部分或全部准备。此外,如图1中所示,测序仪器100可以操作链接到一个或更多外部计算机组件(比如计算机130),其例如可以执行能够提供对于一项或更多项仪器(比如测序仪器100或样本准备仪器180)的指令控制和/或数据分析功能的系统软件或固件(比如应用135)。计算机130可以附加地通过网络150操作连接到其他计算机或服务器,从而可以允许对仪器系统进行远程操作以及向能够进行存储和处理的系统导出大量数据。在该例中,测序仪器100和/或计算机130可以包括前面总体上描述的实施例的其中一些或所有组成部分和特性。
相关领域的普通技术人员将认识到,采用一种或更多种酶的典型测序系统的性能对于用在相关联的方法中的各种酶的效率是敏感的,比如例如用在一些合成测序方法中的聚合酶和/或腺苷三磷酸双磷酸酶的效率。举例来说,在2008年6月27日提交的标题为“System and Method For Adaptive Reagent Control in Nucleic Acid Sequencing(用于核酸测序中的自适应试剂控制的系统和方法)”的美国专利申请序列号12/215,455中描述了自适应地调节反应环境中的腺苷三磷酸双磷酸酶的浓度以便获得所期望的总体腺苷三磷酸双磷酸酶活性水平的实施例,其出于所有目的被全文合并在此以作参考。
还应当认识到,任何特定酶的效率可以取决于若干因素,其中包括(但不限于)酶的氨基酸序列构成(特别是赋予酶活性特性的区段)以及反应环境中的周围条件。举例来说,聚合酶通常可以包括大约120000单位/mg的特定活性,其中“一个单位”通常指的是将在65℃下在30分钟内把10nmol的dNTP合并到不溶于酸的材料中的聚合酶的数量。此外,用于合并核苷酸的各种聚合酶物种以及用于消化核苷酸的腺苷三磷酸双磷酸酶物种的效率可以根据存在于反应环境中的核苷酸物种而不同。
在一些测序系统实施例中,通常按照循环的方式把核苷酸物种溶液(dTTP、α-thio-dATP或者在一些实施例中是dATP、dCTP和dGTP)引入到反应环境中(即按照前面描述的那样通过“流动”引入),其间则是腺苷三磷酸双磷酸酶溶液的流动。在一些实施例中,通过在测序过程期间进入到反应基质上的各个反应环境(即比如前面描述的PicoTiterPlate类型基质的各阱)中的核苷酸物种流动,建立特定于每一个核苷酸物种的腺苷三磷酸双磷酸酶的稳态浓度。
可以利用被称为米氏(Michaelis-Menten)动力学的那些来计算特定于核苷酸物种的稳态腺苷三磷酸双磷酸酶浓度,以便基于存在简单动力学条件的假设以数学方式近似酶的动力学特性。米氏方程使用随着核苷酸物种而不同的常数值,并且包括米氏常数(Michaelis constant)KM和反应环境中的酶活性的最大速率Vmax。举例来说,在下面的表1中列出了使用在测序系统的一种实现方式中的对于腺苷三磷酸双磷酸酶的常数值。
表1:腺苷三磷酸双磷酸酶对于多种核苷酸的酶动力学
Figure DEST_PATH_IMAGE001
在该例中,由于测序试剂流动的迭代性质,在给定时间腺苷三磷酸双磷酸酶实际上只被暴露于一种类型的核苷酸物种。可以利用下面的公式估计腺苷三磷酸双磷酸酶与每一个核苷酸物种之间的反应速率:
Figure DEST_PATH_IMAGE003
其中,[dNTP]是dTTP、dATP、dCTP或dGTP的浓度。
继续该例,用于dTTP、α-thio-dATP、dCTP和dGTP的计算的核苷酸物种浓度在反应环境中分别是40.3、166.1、16.3和19.7μM。应当认识到,对于α-thio-dATP的浓度值大大高于其他核苷酸物种的浓度,这是由于对聚合酶的合并效率具有抑制效果的修改(即,因此更高的浓度会改进聚合酶合并的可能性)以及腺苷三磷酸双磷酸酶的处理效率得到提高而造成的,正如下面将更加详细地说明的那样。在一些实施例中,可以使用更加“自然”的dATP物种来替代α-thio-dATP,并且可以具有反应出对于该物种的更高酶促处理效率的核苷酸物种浓度的不同值。在下面的表2中示出了针对不同核苷酸物种从Michaelis-Menten计算估计出的腺苷三磷酸双磷酸酶活性。再次应当提到的是,表2中示出的腺苷三磷酸双磷酸酶对于α-thio-dATP的所计算出的效率大大高于对于其他物种所计算的效率,并且因此将预期会以高效的方式处理更高浓度的α-thio-dATP。
表2:对于多种核苷酸估计的腺苷三磷酸双磷酸酶活性
Figure DEST_PATH_IMAGE004
表3以不同的方式提供了对于来自表2的数据的表示,其中基于dCTP的值对每一个核苷酸物种的浓度和腺苷三磷酸双磷酸酶活性的值进行了归一化,这是因为dCTP在各核苷酸物种当中具有最低浓度和活性值(表3中的核苷酸物种A指的是α-thio-dATP)。
表3:核苷酸和腺苷三磷酸双磷酸酶活性(归一化)
在所描述的实施例中,基于每一个核苷酸物种的相对腺苷三磷酸双磷酸酶活性水平来调节使用在测序过程中的该核苷酸物种的浓度。本领域普通技术人员将认识到,由于腺苷三磷酸双磷酸酶在特定于物种的速率下消化核苷酸分子,因此如果在合并可以发生之前通过腺苷三磷酸双磷酸酶大大降低了可用于合并的核苷酸分子的浓度,则对于核苷酸物种的高腺苷三磷酸双磷酸酶活性可能会降低对于该物种的聚合酶的合并效率。因此,对于该物种的核苷酸浓度必须更高以便抵制特定于物种的高腺苷三磷酸双磷酸酶活性的影响。
还应当认识到,利用在测序反应环境外部测量的它们相应的动力学常数对于聚合酶和腺苷三磷酸双磷酸酶活性所做的估计可能不同于实际发生在反应环境(比如所描述的反应基质的反应阱)内的活性水平。但是可以从未经处理(即未应用数据校正计算)的测序数据推断出腺苷三磷酸双磷酸酶降解和聚合酶合并的组合对于每一个核苷酸物种的总体酶促效率。
举例来说,表4示出了可以被用来优化每一个核苷酸物种的浓度以便获得最佳测序性能的各个核苷酸物种的完成效率和前推值。在该例中,对基因组C. jejuni(空肠弯曲菌)DNA散弹枪基因库进行测序,以便计算出针对聚合酶和腺苷三磷酸双磷酸酶效率优化的核苷酸物种浓度。表4的第二列(TA)和第三列(CG)示出了用在测序游程中的T和A对于C和G的核苷酸物种浓度的相对百分比,其中对于100%浓度的值可以基于来自表3的所计算且归一化的物种相对比值。举例来说,利用来自表3的数字,对于给定的浓度比值,G核苷酸物种的100%是C核苷酸物种的100%的1.2倍。本领域普通技术人员将认识到,C. jejuni是AT富集的基因组,这通常意味着A和T核苷酸物种在基因组构成中的发生率要高于C和G核苷酸物种。因此,表4中示出的对于TA和GC浓度的相对百分比反应出了该情况,并且通常对于GC富集的基因组(即基因组T. thermophilus)将是不同的。
利用下面详细描述的方法推断出每一个单独的核苷酸物种的平均完成效率(即估计不完整延伸)和前推值。最后一列给出了所获得的高质量读取的平均读取长度(RL),其中增加的读取长度与在聚合酶的特定于物种的合并效率和腺苷三磷酸双磷酸酶的降解效率之间取得了平衡的每一个核苷酸物种的浓度组合的提高的优化水平相关。
表4:核苷酸浓度对于完成效率/前推值的影响
Figure DEST_PATH_IMAGE006
本领域普通技术人员将认识到,表4示出了通过提高特定核苷酸物种对的浓度会提高对于每一个物种的对应完成效率,但是在大多数情况下也会增大对于该物种的对应前推值(对于G核苷酸物种的前推值并不遵循这一趋势)。所推断出的完成效率值和前推值表示组合酶促效率,其分别与聚合酶和腺苷三磷酸双磷酸酶对每一个核苷酸物种的效率直接相关。最优的核苷酸物种浓度集合使得每一个核苷酸物种的完成效率最大化并且使得每一个核苷酸物种的前推值最小化,从而得到作为测序性能的度量的最长平均读取长度。还应当认识到,随着流动循环的数目增加,特定于物种的差异变得更加显著,其中每一个流动循环会增大某种类型的CAFIE错误的发生概率。
利用特定于核苷酸的CAFIE(前推和不完整延伸)配合推断出各个核苷酸物种的平均完成效率和前推值。举例来说,测序过程产生未经处理的序列读取,其通常由图像和信号处理软件的一个实施例(比如应用135)处理。在该例中,应用135把所生成的未经处理的序列读取映射(其也被本领域普通技术人员称作对准)到与所测序的样本相关联的参考基因组序列,比如C. jejuni的一致参考序列。本领域普通技术人员将认识到,把未经处理并且未经校正的序列读取映射/对准到参考序列的做法可以被采用来确定CAFIE错误在何处发生以及确定特定于核苷酸物种的CAFIE错误的发生率。
在当前描述的实例中,应用135把被表示为流图的200个未经校正的序列读取映射到参考基因组序列,并且考虑核苷酸流动的前100次迭代以便通过推断出完成效率和前推值来确定每一个核苷酸物种的最优浓度。首先利用对于所有核苷酸物种的中位(median)1-mer值对四个核苷酸物种当中的每一个的所检测到的信号强度进行归一化。这里使用的术语“1-mer值”通常指的是反应出所检测到的信号对于单个序列位置处的核苷酸物种的合并的响应程度,其对于每一个核苷酸物种应当是基本上相同的。通常最容易从模板核酸分子的测序游程的开头获得的所检测信号计算该1-mer值,这是因为适配子中的关键元素在已知位置处的关键元素中包括每一个核苷酸物种的单一代表(即TCAG关键元素),并且因此预期在所述四个序列位置当中的每一个序列位置处只合并有每一个物种的单个核苷酸。
可以对于每一个单独的序列读取利用三级最小化处理推断出表4中所示出的完成效率和前推值。在第一级中,可以将下面的表达式最小化以便获得独立于核苷酸物种的完成效率和前推值:
Figure DEST_PATH_IMAGE008
其中,q是未经校正的流图,v是从参考流图导出的合并列表(其是从所述读取的参考序列导出的),λ是独立于核苷酸物种的完成效率参数,ε是独立于核苷酸物种的前推值,M是CAFIE矩阵,并且n是平均噪声。合并列表v是具有所述流图的长度的矢量,其在该例中是400项流动。如果参考流图在流动i处示出一项或更多项合并则v(i)=1,并且如果参考流图没有示出合并则v(i)=0。这一步骤寻找使得负流动与平均噪声的平方偏差最小化(即在该处没有核苷酸物种合并)的参数集合(λ,ε,n)。利用(λ,ε)=(0.998,0.005)的初始猜测值来施行所述最小化,并且n的初始猜测值被设定到前五项负流动(即使得v(i)=0的流动)的平均归一化强度。利用下界(λ,ε,n)=(0.99,0,0)和上界(1,0.05,在v(i)=0的情况下的max(q(i)))施行搜索。
第二级是推断出特定于核苷酸的完成效率和前推值以及平均噪声。将下面的表达式最小化:
搜索开始于初始猜测值(λTACGTACG,n)=(λ11111111,n 1),其中λ1、ε1n 1是从第一级获得的完成效率、前推和平均噪声值。所述搜索的下界和上界是(0.99,0.99,0.99,0.99,0,0,0,0,0)和(1,1,1,1,0.05,0.05,0.05,0.05,在v(i)=0的情况下的max(q(i)))。
第三级以及最终级推断出特定于核苷酸的完成效率和前推值、平均噪声以及相移(即前推的不完整延伸在相位同步方面的改变)。将下面的表达式最小化:
Figure DEST_PATH_IMAGE012
其中,φ是相移(即来自CAFIE效应的相位同步错误)。搜索开始于来自第一级的初始猜测值(λTACGTACG,n,φ)=(λT2A2C2G2T2A2C2G2,n 2,0),其中λT2、λA2、λC2、λG2是在第二级中获得的特定于核苷酸的完成效率值,εT2、εA2、εC2、εG2是在第二级中获得的特定于核苷酸的前推值,并且n 2是在第二级中获得的噪声值。所述搜索的下界和上界分别是(0.99,0.99,0.99,0.99,0,0,0,0,0,0)和(1,1,1,1,0.05,0.05,0.05,0.05,在v(i)=0的情况下的max(q(i)),1)。
在前面的表4中列出的特定于核苷酸的完成效率和前推值是从第三级计算获得的超过200个样本平均的值集合。通过根据完成效率和前推值的改变趋势来调节核苷酸物种浓度,可以获得将完成效率最大化并且将前推最小化到聚合酶和腺苷三磷酸双磷酸酶二者以及测序条件所允许的最优水平的核苷酸物种浓度的最优集合。举例来说,可以绘制出核苷酸物种浓度关于CAFIE效应的滴定曲线,其通过图形方式示出了对于包括特定于物种的酶活性水平在内的反应环境参数的最优核苷酸物种浓度。
前面描述了各个实施例和实现方式,相关领域技术人员应当认识到,前面的描述仅仅是说明性而非限制性的,并且仅仅是通过举例的方式给出的。在所示出的实施例的各个功能元件之间分配功能的许多其他方案也是可能的。在替换实施例中可以按照多种方式实施任何元件的功能。

Claims (15)

1.一种用于优化测序性能的方法,包括以下步骤:
a)对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
b)利用该特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度;
c)在包括聚合酶和物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入所述反应环境以便降解未被合并的核苷酸物种分子;以及
d)检测响应于所述核苷酸物种的合并的信号。
2.权利要求1的方法,其中:
确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡。
3.权利要求1的方法,其中:
利用米氏方程来计算特定于核苷酸物种的降解速率。
4.权利要求1的方法,其中:
对于dCTP物种来归一化对于每一个核苷酸物种的浓度,所述dCTP物种在各核苷酸物种当中包括最低浓度和活性值。
5.权利要求1的方法,其中:
对于多个核苷酸物种的浓度彼此不同。
6.权利要求1的方法,其中:
对于每一个核苷酸物种的浓度彼此不同。
7.权利要求1的方法,其中:
通过在反应环境中把每一个核苷酸物种的浓度保持足够时间从而使得在通过腺苷三磷酸双磷酸酶降解之前发生合并来优化合并效率。
8.权利要求1的方法,其中:
基于核苷酸物种与核酸模板物种的互补性在一个或更多处将核苷酸物种的分子合并到初生分子中。
9.权利要求1的方法,还包括:
e)根据检测到的信号生成序列读取,其中所述序列读取包括所述物种的模板核酸分子的序列构成。
10.一种用于优化测序性能的方法,包括以下步骤:
a)将多个相对浓度的核苷酸物种引入到包括聚合酶、腺苷三磷酸双磷酸酶和物种的模板核酸分子的一种类型的反应环境中,以便产生所述物种的模板核酸分子的未经校正的序列构成;
b)根据所述物种的模板核酸分子的未经校正的序列构成和参考序列构成对于每一个核苷酸物种确定完成效率值和前推值;以及
c)利用特定于核苷酸物种的完成效率值和特定于核苷酸物种的前推值对于多个核酸物种当中的每一个识别出特定于物种的浓度,其中对所述特定于物种的浓度进行优化,以便最小化由所述类型的反应环境中的测序反应所产生的错误。
11.权利要求10的方法,还包括:
d)利用所述类型的反应环境执行测序反应,其中所述测序反应包括以下步骤:
i、在特定于物种的浓度下将每一个核酸物种迭代地递送到包括第二物种模板核酸分子和聚合酶的所述类型的反应环境,其中在递送核酸物种的迭代之间将腺苷三磷酸双磷酸酶递送到所述反应环境;以及
ii、检测响应于由所述聚合酶合并核酸物种而生成的多个信号。
12.权利要求11的方法,其中:
在特定于核苷酸物种的浓度下把腺苷三磷酸双磷酸酶递送到所述反应环境。
13.权利要求10的方法,其中:
所述相对浓度包括第一百分比的A核苷酸物种浓度和T核苷酸物种浓度相对于第二百分比的G核苷酸物种浓度和C核苷酸物种浓度。
14.权利要求13的方法,其中:
根据所述物种的模板核酸分子的序列构成来定义第一百分比和第二百分比,其中所述序列构成是AT富集或GC富集。
15.一种用于优化测序性能的系统,包括:
a)计算机,其包括存储在其上的可执行代码,其中所述可执行代码施行包括以下步骤的方法:
i、对于多个核苷酸物种,计算腺苷三磷酸双磷酸酶的特定于核苷酸物种的降解速率;
ii、利用所述特定于核苷酸物种的降解速率确定对于每一个核苷酸物种的浓度,其中确定对于每一个核苷酸物种的浓度以便提供特定于物种的降解效率相对于聚合酶的合并效率的平衡;以及
b)施行包括以下步骤的方法的测序仪器:
i、在包括聚合酶和物种的模板核酸分子的反应环境中迭代地提供每一个核苷酸物种的所述浓度,其中核苷酸物种的一个或更多分子在测序反应中被合并到初生分子中,并且将腺苷三磷酸双磷酸酶引入所述反应环境以便降解未被合并的核苷酸物种分子;以及
ii、检测响应于核苷酸物种的合并的信号。
CN2011800252079A 2010-05-21 2011-05-19 用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法 Pending CN103038365A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US34704910P 2010-05-21 2010-05-21
US61/347049 2010-05-21
PCT/EP2011/058102 WO2011144682A2 (en) 2010-05-21 2011-05-19 System and method for tailoring nucleotide concentration to enzymatic efficiencies in dna sequencing technologies

Publications (1)

Publication Number Publication Date
CN103038365A true CN103038365A (zh) 2013-04-10

Family

ID=44119120

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011800252079A Pending CN103038365A (zh) 2010-05-21 2011-05-19 用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法

Country Status (6)

Country Link
US (1) US20110287432A1 (zh)
EP (1) EP2571999A2 (zh)
JP (1) JP2013529901A (zh)
CN (1) CN103038365A (zh)
CA (1) CA2796309A1 (zh)
WO (1) WO2011144682A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109312493A (zh) * 2016-04-04 2019-02-05 哈佛学院董事及会员团体 酶促核酸合成

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9187783B2 (en) 2010-10-04 2015-11-17 Genapsys, Inc. Systems and methods for automated reusable parallel biological reactions
US9184099B2 (en) 2010-10-04 2015-11-10 The Board Of Trustees Of The Leland Stanford Junior University Biosensor devices, systems and methods therefor
US9399217B2 (en) 2010-10-04 2016-07-26 Genapsys, Inc. Chamber free nanoreactor system
US9926596B2 (en) 2011-05-27 2018-03-27 Genapsys, Inc. Systems and methods for genetic and biological analysis
US8585973B2 (en) 2011-05-27 2013-11-19 The Board Of Trustees Of The Leland Stanford Junior University Nano-sensor array
JP6193252B2 (ja) 2011-12-01 2017-09-06 ジナプシス インコーポレイテッド 高効率電子配列決定及び検出のためのシステム並びに方法
US9809852B2 (en) 2013-03-15 2017-11-07 Genapsys, Inc. Systems and methods for biological analysis
EP3080300B1 (en) 2013-12-11 2020-09-02 Genapsys Inc. Systems and methods for biological analysis and computation
WO2015161054A2 (en) 2014-04-18 2015-10-22 Genapsys, Inc. Methods and systems for nucleic acid amplification
EP3234178A4 (en) * 2014-12-18 2018-07-11 The Regents of The University of California Detection of nucleic acid polymerase conformational changes using a nanotube
WO2018017884A1 (en) 2016-07-20 2018-01-25 Genapsys, Inc. Systems and methods for nucleic acid sequencing
SG11202002516WA (en) 2017-09-21 2020-04-29 Genapsys Inc Systems and methods for nucleic acid sequencing

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101802218A (zh) * 2007-06-28 2010-08-11 454生命科学公司 在核酸测序中用于自适应试剂控制的系统和方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
DE69826697T2 (de) 1997-07-07 2006-02-16 Medical Research Council In vitro selektionsmethode
GB9901475D0 (en) 1999-01-22 1999-03-17 Pyrosequencing Ab A method of DNA sequencing
US7244559B2 (en) 1999-09-16 2007-07-17 454 Life Sciences Corporation Method of sequencing a nucleic acid
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US7211390B2 (en) 1999-09-16 2007-05-01 454 Life Sciences Corporation Method of sequencing a nucleic acid
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
WO2004069849A2 (en) 2003-01-29 2004-08-19 454 Corporation Bead emulsion nucleic acid amplification
US7575865B2 (en) 2003-01-29 2009-08-18 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
CA2553833C (en) 2004-01-28 2012-10-02 454 Corporation Nucleic acid amplification with continuous flow emulsion
JP2006130685A (ja) 2004-11-02 2006-05-25 Fuji Photo Film Co Ltd 微粒子積層基板及びその製造方法
US7682816B2 (en) 2005-04-07 2010-03-23 454 Life Sciences Corporation Thin film coated microwell arrays and methods of using same
WO2007145612A1 (en) 2005-06-06 2007-12-21 454 Life Sciences Corporation Paired end sequencing
US7888034B2 (en) 2008-07-01 2011-02-15 454 Life Sciences Corporation System and method for detection of HIV tropism variants
CN106999645B (zh) 2014-12-25 2019-12-24 泰尔茂株式会社 体外循环管理装置及具有该体外循环管理装置的体外循环装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101802218A (zh) * 2007-06-28 2010-08-11 454生命科学公司 在核酸测序中用于自适应试剂控制的系统和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ALI AGAH ET AL.: "A multi-enzyme model for pyrosequencing", 《NUCLEIC ACIDS RESEARCH》, 2 December 2004 (2004-12-02) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109312493A (zh) * 2016-04-04 2019-02-05 哈佛学院董事及会员团体 酶促核酸合成

Also Published As

Publication number Publication date
US20110287432A1 (en) 2011-11-24
CA2796309A1 (en) 2011-11-24
EP2571999A2 (en) 2013-03-27
JP2013529901A (ja) 2013-07-25
WO2011144682A2 (en) 2011-11-24
WO2011144682A3 (en) 2012-09-20

Similar Documents

Publication Publication Date Title
CN103038365A (zh) 用于在dna测序技术中针对酶促效率调整核苷酸浓度的系统和方法
US20110003701A1 (en) System and method for improved processing of nucleic acids for production of sequencable libraries
US20100261189A1 (en) System and method for detection of HLA Variants
BR122022007092B1 (pt) Método para construir um perfil de dna, método para construir uma biblioteca de ácido nucléico, biblioteca de ácido nucléico, pluralidade de iniciadores e kit
JP6712606B2 (ja) ヌクレオチドのオルトゴナルな脱ブロッキング
US20130217023A1 (en) System And Method For Generation And Use Of Compact Clonally Amplified Products
CN102712952A (zh) 用于乳状液破碎和回收生物学成分的系统和方法
WO2014200926A2 (en) Analysis of polynucleotides
US20120077716A1 (en) System and method for producing functionally distinct nucleic acid library ends through use of deoxyinosine
US10192024B2 (en) System and method for generation and use of optimal nucleotide flow orders
EP2566959A1 (en) System and method for purification and use of inorganic pyrophosphatase from aquifex aeolicus
CN114555821B (zh) 检测与dna靶区域独特相关的序列
US20140073511A1 (en) System and Method for Operation of Isfet Arrays Using pH Inert Reference Sensors
EP2840148B1 (en) Methods for nucleic acid amplification
Zıplar et al. Genomic and Transcriptomic Sequencing and Analysis Approaches
Wood Mitochondrial Haplogrouping and Short Tandem Repeat Analyses in Anthropological Research using Next-Generation Sequencing Technologies
EP4205122A2 (en) Computational detection of copy number variation at a locus in the absence of direct measurement of the locus

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130410