CN103097547A - 经修饰的蛋白及其制备和使用方法 - Google Patents

经修饰的蛋白及其制备和使用方法 Download PDF

Info

Publication number
CN103097547A
CN103097547A CN2011800189802A CN201180018980A CN103097547A CN 103097547 A CN103097547 A CN 103097547A CN 2011800189802 A CN2011800189802 A CN 2011800189802A CN 201180018980 A CN201180018980 A CN 201180018980A CN 103097547 A CN103097547 A CN 103097547A
Authority
CN
China
Prior art keywords
polysaccharase
amino
acid
modified
albumen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011800189802A
Other languages
English (en)
Other versions
CN103097547B (zh
Inventor
J·F·戴维森
W·欣茨
J·罗思伯格
R·惠特克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Inc
Life Technologies Corp
Original Assignee
Life Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Inc filed Critical Life Technologies Inc
Publication of CN103097547A publication Critical patent/CN103097547A/zh
Application granted granted Critical
Publication of CN103097547B publication Critical patent/CN103097547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供了包含经修饰的蛋白、特别是具有改变的缓冲特性的经修饰的核酸-结合蛋白的方法,组合物,系统,装置和试剂盒。例如,在一些实施方案中,描述了形成经修饰的蛋白的方法,所述经修饰的蛋白包括一个或多个氨基酸修饰以实现所需的pKa值。此外,本发明提供了在产生离子的反应,例如基于离子的核酸测序反应中,使用所述经修饰的蛋白的方法。

Description

经修饰的蛋白及其制备和使用方法
根据35U.S.C.§119,本申请要求2010年2月26日递交的美国临时申请号61/308,863的权益,并且还要求2011年2月25日递交的国际申请号PCT/US2011/026228的优先权,所述国际申请要求2010年2月26日递交的美国临时申请号61/308,863的权益,所有前述申请都在此以其全部通过引用而并入。
背景
直接检测化学部分(例如离子)在简化测定设计和花费方面有巨大的潜力。例如,在某些情况下,此类技术能够减少或消除对于昂贵的标记试剂的需求;类似地,它们也能够消除对于否则可能是必需的复杂检测步骤的要求。此类技术的用处可通过其在DNA序列分析领域中的应用而显示,对于DNA序列分析已描述了数种化学检测方案。这些包括通过检测延伸反应的物理化学副产物(例如焦磷酸,氢离子,电荷转移,热等)而检测聚合酶延伸,如在例如下列中所描述的:Pourmand等人,Proc.Natl.Acad.Sci.,103:6466-6470(2006);Purushothaman等人,IEEE ISCAS,IV-169-172;Rothberg等人,美国专利公开号2009/0026082;Anderson等人,Sensors and Actuators BChem.,129:79-86(2008);Sakata等人,Angew.Chem.118:2283-2286(2006);Esfandyapour等人,美国专利公开号2008/01666727;以及Sakurai等人,Anal.Chem.64:1996-1997(1992)。
基于离子的反应(即涉及产生和检测离子的反应)是广泛进行的。使用直接离子检测方法来监测此类反应的进展能够简化许多现存的生物学测定。例如,可通过检测作为由聚合酶催化的核苷酸掺入的天然副产物而产生的氢离子而监测通过聚合酶进行的模板依赖性核酸合成。基于离子的测序(也称作“基于pH的”核酸测序)利用的是直接检测作为核苷酸掺入的副产物而产生的氢离子。在一个用于基于离子的测序的示例性系统中,在微孔中捕获待测序的核酸,并在核苷酸掺入条件下使核苷酸(每次一个)浮过所述孔。聚合酶将适合的核苷酸掺入生长的链中,而被释放的氢离子改变溶液中的pH,这是通过离子传感器检测的。这种技术不需要核苷酸的标记或者昂贵的光学组件,且允许快得多地完成测序运行。此类基于离子的核酸测序方法的实例包括Ion Torrent PGMTM测序仪(Life Technologies Corporation)。
对于基于离子的反应(包括基于离子的核酸测序),重要的是检测尽可能多的所释放的离子,从而实现尽可能高的信号,和相应地高的信噪比。鉴于离子从反应位点快速扩散以及其它反应组分和容器壁材料的缓冲效应,获得足够的信号可能是有挑战性的。例如,基于离子的测序反应中的蛋白的缓冲效应能够妨碍有效地检测氢离子。
因此需要用于减少蛋白反应组分的缓冲效应的方法和组合物,特别是用于在基于离子的核酸测序方法和系统中使用的。
发明概述
在一些实施方案中,本公开一般性地涉及包含经修饰的蛋白的组分、方法、系统、装置和试剂盒,与未经修饰的其对应物相比,所述经修饰的蛋白具有减少的缓冲能力,还涉及用于制备和在广泛的化学反应中使用所述经修饰的蛋白的方法。在一些实施方案中,本公开一般性地涉及包含经修饰的蛋白(例如,核酸结合蛋白)的方法、组分、系统和试剂盒,其用于基于离子的核酸序列确定。在一些实施方案中,本公开一般性地涉及组分、方法、系统、试剂盒和装置,其用于在大规模的电子传感器阵列(例如场效应晶体管(“FET”))上进行多个无标记的DNA测序反应。
在一些实施方案中,本公开一般性地涉及包含一个或多个修饰的经修饰的蛋白,相对于相应的未经修饰的蛋白,所述修饰减少所述经修饰的蛋白的缓冲能力。任选地,所述一个或多个修饰在约pH 4至约pH 10的范围内减少所述经修饰的蛋白的缓冲能力。在一些实施方案中,相对于相应的未经修饰的蛋白,所述一个或多个修饰在约pH 7至约pH9的范围内减少所述经修饰的蛋白的缓冲能力。在一些实施方案中,所述一个或多个修饰包括一个或多个氨基酸添加、置换、缺失、添加或化学修饰。在一些实施方案中,所述经修饰的蛋白包括一个或多个氨基酸置换,其不被包括在未经修饰的蛋白中。
在一些实施方案中,本公开一般性地涉及分离的蛋白,其包含一个或多个氨基酸置换,相对于相应的野生型蛋白,所述氨基酸置换在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力。在一些实施方案中,相对于相应的野生型蛋白,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内降低所述蛋白的缓冲能力。
在一些实施方案中,所述经修饰的蛋白是核酸结合蛋白。例如,所述蛋白可具有DNA-或RNA-结合活性。在各种实施方案中,所述蛋白选自DNA聚合酶,解旋酶,连接酶,核酸酶,单链DNA结合蛋白和聚合酶辅蛋白。
在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至pH9的范围内实质上降低所述蛋白的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个是保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸,以及酪氨酸至苯丙氨酸。
在一些实施方案中,所述蛋白是DNA聚合酶。在一些实施方案中,本公开一般性地涉及分离的DNA聚合酶,其包含一个或多个保守性氨基酸置换,与相应的野生型蛋白相比,所述氨基酸置换在约pH7至约pH 9的范围内在实质上降低其缓冲能力。在一些实施方案中,所述DNA聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合类型的聚合酶;未分类的DNA聚合酶以及RT家族聚合酶;及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为选自下列的A家族DNA聚合酶:Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂Taq DNA聚合酶系列,T7DNA聚合酶,和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为选自下列的B家族DNA聚合酶:Bst聚合酶,Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,TherminatorTM聚合酶,噬菌体Phi29聚合酶,以及噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为KOD聚合酶。在一些实施方案中,所述聚合酶为TherminatorTM聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中所公开的变体,所述美国专利在此通过引用而并入。
在其它实施方案中,所述DNA聚合酶是选自下列的混合型聚合酶:EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列,以及Hi-Fi聚合酶。在其它的实施方案中,所述DNA聚合酶是选自下列的未分类的DNA聚合酶:Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶是选自下列的RT聚合酶:HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶是HIV逆转录酶或者具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶是包含一个或多个保守性氨基酸置换的Bst DNA聚合酶,所述保守性氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸以及酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表2和表3中所显示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自:H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号与SEQ ID NO:1相一致。
在一些实施方案中,所述Bst DNA聚合酶包含一个或多个保守氨基酸置换,其中所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号与SEQ ID NO:1中的一致。
在一些实施方案中,本公开一般性地涉及分离的Bst DNA聚合酶,其包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4的氨基酸序列,或者具有一个或多个保守氨基酸置换的它们的变体。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:2中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:2至少95%同一的氨基酸序列。
在一些实施方案中,本公开一般性地涉及Bst DNA聚合酶,其包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:3中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:3至少95%同一的氨基酸序列。
在一些实施方案中,本公开涉及Bst DNA聚合酶,其包含SEQ IDNO:4的氨基酸序列。在其它实施方案中,本公开一般性地涉及包含SEQ ID NO:4中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:4至少95%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含一个或多个保守性氨基酸置换,与相应的野生型蛋白相比,所述保守性氨基酸置换在约pH 7至约pH 9的范围内实质上降低其缓冲能力,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸以及酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含一个或多个保守性氨基酸置换,与相应的野生型蛋白相比,所述保守性氨基酸置换在约pH 7至约pH 9的范围内实质上降低其缓冲能力,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸以及酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含一个或多个保守性氨基酸置换,与相应的野生型蛋白相比,所述保守性氨基酸置换在约pH 7至约pH 9的范围内实质上降低其缓冲能力,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸以及酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表7中所示的一个或多个氨基酸残基。
在其它实施方案中,所述包含与相应的野生型蛋白相比在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力的一个或多个氨基酸置换的分离的蛋白是单链DNA结合蛋白(SSB)。
在一些实施方案中,所述SSB包含一个或多个保守性氨基酸置换,所述氨基酸置换在pH 7至pH 9的范围内实质上降低其缓冲能力。在其它的实施方案中,所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸,以及酪氨酸至苯丙氨酸。在一些实施方案中,所述SSB是大肠杆菌SSB。在其它实施方案中,所述一个或多个保守性氨基酸置换是表4中所示的一个或多个氨基酸残基。在一些实施方案中,所述SSB包含氨基酸置换K7R。
在一些实施方案中,本公开一般性地涉及分离的蛋白,其包含一个或多个氨基酸置换,与相应的野生型蛋白相比,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力,其中所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是所述氨基酸残基的溶液pKa。在其它实施方案中,所述氨基酸残基的pKa是在相应野生型蛋白的情境中氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0与约10.0之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,Lys,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少30%溶剂暴露的氨基酸残基。
在一些实施方案中,本公开一般性地涉及分离的蛋白,其包含一个或多个化学氨基酸修饰,相对于相应的野生型蛋白,所述化学氨基酸修饰在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N末端的氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂对包含伯胺基团的氨基酸残基进行化学修饰。在一些实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,本公开一般性地涉及分离的聚合酶蛋白,其包含与相应的野生型蛋白相比在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力的一个或多个氨基酸添加、置换、缺失或化学修饰,其中所述分离的蛋白保留聚合酶活性。
在其它实施方案中,本公开一般性地涉及任何上述实施方案的分离的蛋白,其进一步包括亲和标签,标记物,化学部分,放射性核素,酶,荧光标记,化学发光标记,或其组合。在其它实施方案中,所述分离的蛋白与聚合物,支持物或传感器偶联。
在其它实施方案中,本公开一般性地涉及分离的核酸,其与编码任何上述实施方案的蛋白的核酸至少80%同一。在其它实施方案中,本公开一般性地涉及载体,其包含所述分离的核酸。在其它实施方案中,本公开一般性地涉及宿主细胞,其包含所述载体。在一些实施方案中,所述宿主细胞是细菌细胞。在一些实施方案中,所述细菌细胞相对于相应的野生型细菌细胞具有降低的甲硫氨酸氨基肽酶(MAP)活性。
在其它实施方案中,本公开一般性地涉及试剂盒,其包含任何上述实施方案的分离的蛋白。
在一些实施方案中,本公开一般性地涉及分离的蛋白,其包含与相应的野生型蛋白相比在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力的一个或多个氨基酸添加、置换、缺失或化学修饰,其中相对于从使用相应的野生型蛋白的反应获得的测序错误数目,所述一个或多个氨基酸置换实质上减少使用所述蛋白从基于离子的测序反应获得的测序错误的平均数目。
在一些实施方案中,本公开一般性地涉及权利要求的分离的核酸结合多肽,其包含与相应的野生型蛋白相比在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力的一个或多个氨基酸置换、缺失或化学修饰,其中与从使用相应的野生型蛋白的基于离子的测序反应获得的具有90%准确率的测序读取平均长度相比,所述一个或多个氨基酸置换,缺失或化学修饰增加从使用所述蛋白的基于离子的测序反应获得的具有至少90%准确率的测序读取的平均长度。
在一些实施方案中,本公开一般性地涉及用于将至少一个核苷酸掺入引物中的方法,所述方法包括:在一个或多个核苷酸的存在下使包括模板核酸和引物的核酸双链与包含一个或多个氨基酸置换、缺失或化学修饰的聚合酶相接触,以及使用所述聚合酶以模板依赖性的方式将至少一个核苷酸掺入所述引物中,其中相对于相应的野生型聚合酶,所述一个或多个氨基酸置换、缺失或化学修饰在约pH 4至约pH10的范围内降低所述聚合酶的缓冲能力。
在一些实施方案中,本公开一般性地涉及使用经修饰的蛋白进行核酸测序的方法。在一个示例性的实施方案中,本公开一般性地涉及用于从核酸模板获得序列信息的方法,所述方法包括:
(a)提供与测序引物相杂交且与聚合酶相结合的模板核酸,其中所述聚合酶包含一个或多个氨基酸置换,所述氨基酸置换在约pH 4至约pH 10的范围内实质性降低其缓冲能力;
(b)通过在测序引物的3’端顺次掺入一个或多个核苷酸而合成新的核酸链,其中当所述核苷酸与模板核酸中的相应核苷酸互补时,产生氢离子副产物;和
(c)通过检测氢离子的释放来检测所述一个或多个核苷酸掺入到所述测序引物中。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的其变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,所述SSB中的所述一个或多个保守性氨基酸置换是表4中所示的一个或多个氨基酸残基。
在另一个实施方案中,本公开一般性地涉及用于核酸测序的方法,所述方法包括:(a)将多个模板核酸置于多个反应室中,其中所述反应室中的一个或多个与场效应晶体管(FET)相接触,并且使所述模板核酸中的至少一个与包括在pH 7至pH 9的范围内实质上降低其缓冲能力的一个或多个保守性氨基酸置换的聚合酶相接触;(b)通过将一个或多个核苷酸顺次掺入核酸分子中而合成新的核酸链并产生一个或多个氢离子作为这种核苷酸掺入的副产物;和(c)通过使用所述FET来检测所述一个或多个氢离子的产生而检测所述一个或多个核苷酸的掺入。
在一些实施方案中,所述检测包括检测响应于所述一个或多个氢离子的产生而在阵列内的至少一个FET处的电压和/或电流变化。
在一些实施方案中,所述FET选自:离子敏感性FET(isFET)和化学敏感性FET(chemFET)。
在一些实施方案中,所述聚合酶是Bst DNA聚合酶。在其它实施方案中,所述聚合酶内的所述一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB是大肠杆菌SSB。在其它实施方案中,所述SSB中的所述一个或多个保守性氨基酸置换是表4中所示的一个或多个氨基酸残基。
在另一个实施方案中,本公开一般性地涉及用于核酸测序的方法,所述方法包括:
(a)将多个固体或半固体支持物置于形成于半导体基质中的传感器阵列上的多个反应室中,其中至少一个反应室包括聚合酶、测序引物和与彼此间具有至少80%序列同一性的多个模板核酸相连接的单一固体或半固体支持物,其中所述聚合酶包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换,并且每个反应室与包括FET的传感器相接触或电容性偶联,所述FET被配置为提供代表反应室内一个或多个氢离子的存在的至少一种输出;
(b)将至少一个核苷酸引入至少一个反应室中并且使用所述聚合酶将所述至少一个核苷酸掺入所述引物中,从而产生一个或多个氢离子副产物;
(c)通过检测所述氢离子副产物的存在而检测所述至少一个核苷酸的掺入。
在一些实施方案中,所述方法进一步包括重复步骤(a)至(c)直到所述核酸被测序。
在一些实施方案中,所述方法进一步包括从所述至少一个反应室中清洗未掺入的核苷酸的步骤。
在一些实施方案中,所述方法进一步包括重复步骤(a)至(c)以及所述清洗步骤直至所述核酸被测序。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的所述一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的其变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包括在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB是大肠杆菌SSB。在其它实施方案中,SSB中的所述一个或多个保守性氨基酸置换是表4中所示的一个或多个氨基酸残基。
在其它的实施方案中,本公开一般性地涉及用于减少在DNA测序或扩增反应中所使用的蛋白的缓冲能力的方法,所述方法包括在蛋白序列中制造出在约pH 4至约pH 10的范围内实质上降低所述蛋白的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述氨基酸置换在约pH 7至约pH 9的范围内实质上降低所述蛋白的缓冲能力。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有小于约4或大于约10的pKa的氨基酸残基置换具有约4至约10的范围内的pKa的氨基酸残基。
在一些实施方案中,所述蛋白是DNA或RNA结合蛋白。
在各种实施方案中,所述蛋白是选自下组的DNA聚合酶:在一些实施方案中,所述DNA聚合酶是A家族DNA聚合酶,其选自PolI型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂Taq DNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶;B家族DNA聚合酶,其选自Bst聚合酶,Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶;混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶;未分类的DNA聚合酶,其选自Tbr聚合酶,Tf聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tf聚合酶;以及RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的所述一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的其变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包括在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB是大肠杆菌SSB。在其它实施方案中,所述SSB中的所述一个或多个保守性氨基酸置换是表2中所示的一个或多个氨基酸残基。
在其它的实施方案中,本公开一般性地涉及检测核苷酸掺入的方法,所述方法包括:
(a)使用经修饰的聚合酶进行核苷酸掺入,并且产生一个或多个氢离子作为核苷酸掺入的副产物,其中所述经修饰的聚合酶包括相对于未经修饰的聚合酶降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换;和
(b)检测作为所述核苷酸掺入的副产物产生的一个或多个氢离子的存在,从而检测所述核苷酸掺入。
在一些实施方案中,所述经修饰的聚合酶包括相对于未经修饰的聚合酶,在约4至约10的pH范围内降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述检测包括使用离子敏感性场效应晶体管(ISFET)。在一些实施方案中,所述ISFET在ISFET阵列中。
在一些实施方案中,所述反应是在反应室中进行的,所述反应室包含chemFET或者与chemFET电容性偶联。
在一些实施方案中,所述反应是在下列试剂的存在下:所述试剂将所述经修饰的多肽中的至少一个氨基酸的pKa值由约6至约8的范围改变为少于约6或大于约8。在一些实施方案中,所述试剂为磷脂、磺酸表面活性剂、聚阴离子电解质或其盐,聚阳离子电介质或其盐,四甲基铵或其盐,或者它们的组合。
在一些实施方案中,所述方法进一步包括重复步骤a)-b)。
在其它方面,本公开一般性地涉及检测化学反应过程中离子浓度变化的方法,所述方法包括:
(a)在具有一个或多个氨基酸置换的经修饰的多肽的存在下进行化学反应,其中在所述化学反应的过程中至少一种离子的浓度改变;和
(b)检测指示离子浓度改变的信号,其中相对于从在相同反应条件下进行但存在未经修饰的多肽的化学反应检测到的信号,所述信号被增加。
在一些实施方案中,所述经修饰的多肽包括相对于未经修饰的多肽降低所述经修饰的多肽的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个具有小于约4或大于约10的pKa的氨基酸残基置换具有约4至10的pKa的氨基酸残基。
在一些实施方案中,所述经修饰的多肽是经修饰的聚合酶,且所述化学反应包括核苷酸掺入。
在一些实施方案中,所述检测包括使用chemFET。在一些实施方案中,所述chemFET是ISFET。在一些实施方案中,所述ISFET在ISFET阵列中。
在一些实施方案中,所述化学反应在反应室中进行,所述反应室包含chemFET或者与chemFET电容性偶联。
在一些实施方案中,所述化学反应是在下列试剂的存在下:所述试剂将所述经修饰的多肽中的至少一个氨基酸的pKa值由约6至约8的范围改变为少于约6或大于约8。在一些实施方案中,所述试剂为磷脂,磺酸表面活性剂,聚阴离子电解质或其盐,聚阳离子电介质或其盐,四甲基铵或其盐,或者它们的组合。
在一些实施方案中,所述至少一种离子是氢离子。
在一些实施方案中,所述反应为酶促反应或结合反应。
在一些实施方案中,所述反应为酶促反应。在一些实施方案中,所述酶促反应是核苷酸掺入反应。
在一些实施方案中,所述方法还包括重复步骤a)-b)。
附图说明
图1显示了Bst DNA聚合酶的大片段的氨基酸序列。保守的聚合酶基序被特别标示出并加下划线,并且这些基序中不变的残基以粗体显示。
图2显示了细菌噬菌体B103DNA聚合酶与Phi29DNA聚合酶的氨基酸序列的序列比对。
图3显示了使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“离子”)的测序反应的50Q17vs.Keypass。
图4显示了使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“离子”)的测序反应的100Q17vs.Keypass。
图5显示了使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“离子”)的测序反应的Carryforward vs.50Q17/Keypass。
图6显示了从使用具有SEQ ID NO:2的氨基酸序列的经修饰的聚合酶(“离子”)和具有SEQ ID NO:1的氨基酸序列的参照聚合酶的基于离子的测序反应获得的一些示例性数据。前四次运行(运行编号1-4)是使用具有SEQ ID NO:1的氨基酸序列的经修饰的聚合酶进行的,而最后三次运行(运行编号5-7)是使用具有SEQ ID NO:1的氨基酸序列的参照(未修饰的)Bst聚合酶进行的。
发明详述
本文中所提及的所有专利,专利申请,公开的申请,论文及其它出版物(上文和下文中的)均在此以其全部通过引用而并入。如果定义和/或描述在本文中被明确或隐含地显示且其与本文中通过引用而并入的专利、专利申请、公开的申请及其它出版物中所示的任何定义相反或不一致,那么本文中所示的定义和/或描述胜过通过引用而并入的定义。
除非另有定义,本文中所使用的所有术语、符号和其它科学用语或术语都意在具有本领域技术人员所普遍理解的含义。在一些情形中,为了清楚和/或易于引用,在本文中定义了具有通常所理解的含义的用语,在本文中包括了这种定义不应被必然地解释为代表与本领域中所一般理解的有实质上的区别。
在本公开中,使用氨基酸单字母代码来引述各种氨基酸突变(包括例如氨基酸置换)和指出参照氨基酸序列中的残基位置。在氨基酸置换的情形中,置换基的特征身份也使用氨基酸单字母代码来表示。例如,引述假设的氨基酸置换“D166A,其中编号是相对于SEQ ID NO:7的氨基酸序列”表示这样的氨基酸置换,其中亮氨酸(L)残基置换了通常存在于氨基酸序列SEQ ID NO:7的383位的苯丙氨酸(F)残基。本文中所公开的许多氨基酸序列是以甲硫氨酸残基(“M”)开始的,其通常在希望在细菌宿主细胞中表达的编码肽的核酸序列的开始处被引入。然而,要理解的是,本公开也包括不包括第一个甲硫氨酸残基而从第二个氨基酸残基开始往后的所有氨基酸序列。
如本文中所使用的,术语“氨基酸”及其变体包括且不排除天然存在的和合成的氨基酸,以及以类似于天然存在的氨基酸的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的那些,包括硒代甲硫氨酸,以及掺入肽中之后被修饰的那些氨基酸,例如羟脯氨酸,γ-羧基谷氨酸,O-磷酸丝氨酸和胱氨酸。“氨基酸类似物”是指与天然存在的氨基酸具有相同的基本化学结构(即与氢相连的α-碳)、羧基、氨基和R基团)的化合物,例如高丝氨酸,正亮氨酸,甲硫氨酸亚砜,甲硫氨酸甲基锍。此种类似物具有经修饰的R基团(例如正亮氨酸)或经修饰的肽主链,但是保留与天然存在的氨基酸相同的基本化学结构。“氨基酸模拟物”是指具有与氨基酸的一般化学结构不同的结构的化合物,但是其以与天然存在的氨基酸相似的方式起作用。在本文中可通过通常所知的三字母符号或者通过其单字母符号来引述氨基酸。
如本文中所使用的,当涉及一个或多个多肽序列而使用时,术语“百分比(%)氨基酸序列同一性”及其变体被定义为在序列比对和引入缺口(为了达到最大百分比序列同一性,如果有必要的话)之后,候选序列中与参考多肽序列中的氨基酸残基相同的氨基酸残基的百分比,并且不考虑任何保守性置换作为序列同一性的一部分。为了确定百分比氨基酸序列同一性的目的而进行的比对可以本领域技术内的各种方式实现,例如通过使用公共可得的计算机软件(例如BLAST,BLAST-2,ALIGN或Megalign(DNASTAR)软件)。本领域技术人员能够确定用于比对序列的合适的参数,这包括实现被比较的序列全长中的最大比对所需的任何算法。
如本文中所使用的,术语“多核苷酸”和“寡核苷酸”及其变体(它们可互换地使用)包括核苷酸单体的线性聚合物。构成多核苷酸和寡核苷酸的单体能够通过单体与单体相互作用的惯常模式(例如Watson-Crick型碱基配对,碱基堆积,Hoogsteen或反Hoogsteen型碱基配对,或类似方式)特异性结合天然多核苷酸。此类单体以及它们的核苷间连接可以是天然存在的或者可以是其类似物,例如天然存在的或非天然存在的类似物。非天然存在的类似物可包括PNA,硫代磷酸核苷间连接,含有允许标记物附着的连接基团的碱基,所述标记物为例如荧光团,或抗原等。当使用寡核苷酸或多核苷酸需要酶促过程时(例如通过聚合酶进行的延伸,通过连接酶进行的连接等),本领域技术人员将理解,那些情形中的寡核苷酸或多核苷酸在任何位置或一些位置处将不含有核苷间连接、糖部分或碱基的某些类似物。当多核苷酸或寡核苷酸以字母序列(大写或小写)表示时(例如"ATGCCTG"),将理解,所述核苷酸从左至右是以5'至3'的顺序,并且"A"代表脱氧腺苷,"C"代表脱氧胞苷,"G"代表脱氧鸟苷,且"T"代表胸腺嘧啶,"I”代表脱氧肌苷,"U"代表尿嘧啶,除非另外指明或者从上下文中是显然的。除非另外指出,术语和原子编号约定将按照Strachan和Read,Human Molecular Genetics 2(Wiley-Liss,纽约,1999)中所公开的那些。通常,多核苷酸包含由磷酸二酯连接所连接的四种天然核苷(例如对于DNA为脱氧腺苷,脱氧胞苷,脱氧鸟苷,脱氧胸苷,或者对于RNA为它们的核糖对应物);然而,它们还可包含非天然核苷酸类似物,例如这包括经修饰的碱基,糖,或核苷间连接。本领域技术人员清楚,当酶对于活性具有特异性寡核苷酸或多核苷酸底物要求时(例如单链DNA,RNA/DNA双链等)那么选择适当的寡核苷酸或多核苷酸底物组成在本领域技术人员的知识范畴内,特别是在下述论文的指引下,例如Sambrook等人,Molecular Cloning,第二版(Cold Spring Harbor Laboratory,纽约,1989)以及类似的参考物。
如本文中所使用的,术语“引物”及其变体包括任何天然或合成的多核苷酸,其能够在与多核苷酸模板形成双链后作为核酸合成的引发点起作用并且沿着所述模板从其3'端被延伸从而形成经延伸的双链。所述引物无需显示出与多核苷酸模板100%的互补性,并且可仅仅与所述核酸模板部分杂交以能够引发核酸合成。引物的延伸通常是以核酸聚合酶(例如DNA或RNA聚合酶)进行的。在延伸过程中所添加的核苷酸的顺序通常是由模板多核苷酸的序列决定的。在一些实施方案中,模板-依赖性核苷酸掺入是根据标准的碱基配对模式进行的,例如Watson-Crick模式(其中A核苷酸通常与T或U配对,而G通常与C配对)。在其它实施方案中,核苷酸掺入的顺序可被任何其它的、非传统碱基配对模式控制。
在一些实施方案中,引物可被DNA聚合酶或RNA聚合酶延伸。所述引物可任选地具有14至40核苷酸范围内、或者18至36核苷酸范围内的长度。可在多种核酸扩增反应中采用引物,例如使用单一引物的线性扩增反应,或者采用两种或更多种引物的聚合酶链式反应。对于特定的应用来选择引物长度和序列的指引是本领域技术人员所熟知的,如通过引用而并入的下列文献所表明的:Dieffenbach,编辑,PCR Primer:A Laboratory Manual,2.sup.nd Edition (Cold SpringHarbor Press,纽约,2003)。
在一些实施方案中,本公开一般性地涉及经修饰的蛋白,其具有改变的(例如增加或降低的)缓冲能力。此类经修饰的蛋白在下列中有用:例如,在涉及在所述蛋白的存在下检测和/或定量离子副产物(例如,H+离子或OH-离子副产物)的离子敏感性反应中。所述蛋白的固有缓冲能力可使得此类离子副产物的检测变得复杂,所述固有缓冲能力可由所述蛋白与一个或多个离子副产物相结合从而减少可用于检测和/或定量的离子副产物的数目而引起。使用具有降低的缓冲能力的经修饰的蛋白能够减少或消除这种复杂化,从而增加可用于检测和/或定量的离子的量。
如本文中所使用的,术语“缓冲能力”及其变体特别是指组分结合溶液中特定类型的离子(通常为H+离子或OH-离子)的能力。特定类型的离子能够被、或者被组分结合的程度越高,所述组分的缓冲能力越高。例如,在一些实施方案中,特定组分(例如蛋白)的缓冲能力可定义为在确定的反应条件下,被单位量(例如,摩尔或毫摩)的所述组分(例如蛋白)吸收的H+离子的总量(摩尔或毫摩)。蛋白通常显示出缓冲能力,这可受到蛋白内氨基酸残基中的侧链数目和类型的影响。在其它实施方案中,组分的缓冲能力可被测量为在向溶液中加入酸或碱之后,所述组分对于pH改变的抗性。在这种实施方案中,可通过对已知数量的候选蛋白进行常规的pH滴定并确定目的pH范围内滴定曲线的特征来确定蛋白的缓冲能力。
通常,经修饰的蛋白包括一个或多个氨基酸修饰,而参照蛋白缺少这些修饰中的至少一个。在一些实施方案中,所述一个或多个氨基酸修饰相对于参照蛋白的缓冲能力能够改变(例如,增加或减少)所述经修饰的蛋白的缓冲能力。所述一个或多个修饰可包括一个或多个氨基酸置换,缺失,添加或化学修饰。在一个典型的实施方案中,所述经修饰的蛋白和所述参照蛋白是聚合酶。
参照蛋白可以是其缓冲能力能够被测量并且能够与本公开的经修饰的蛋白的活性进行比较的任何合适的蛋白。在一些实施方案中,所述经修饰的蛋白包括一个或多个氨基酸修饰,所述参照蛋白缺少这些修饰中的至少一个而否则与所述经修饰的蛋白相同。在一些实施方案中,所述参照蛋白可以是所述经修饰的蛋白的未经修饰的对应物;例如,所述参照蛋白可以是所述经修饰的蛋白的野生型对应物。在一些实施方案中,所述参照蛋白是天然存在的蛋白。
在一些实施方案中,本公开的经修饰的蛋白在所需的pH范围内可显示出降低的缓冲能力。例如,在一些实施方案中,在约pH 4至约pH 10,或约pH 5.5至约pH 9.5,或约pH 7至约pH 9的范围内,所述降低的缓冲能力被显示出或可被观察到。
在一些实施方案中,本公开的经修饰的蛋白能够展示出降低的缓冲能力,从而包含所述蛋白的溶液中氢离子浓度相对小的改变将产生所测量的pH的相对大的改变;此类改变通常大于使用所述经修饰的蛋白的未经修饰的对应物时所观察到的测量的pH的改变。
在一些实施方案中,本公开一般性地涉及经修饰的蛋白,其相对于相应的未经修饰的蛋白(例如,野生型蛋白)具有降低的缓冲能力。
在一些实施方案中,所述经修饰的蛋白包含一个或多个氨基酸置换,相对于相应的野生型蛋白,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内降低所述经修饰的蛋白的缓冲能力,其中所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是所述氨基酸残基的溶液pKa。在其它实施方案中,所述氨基酸残基的pKa是相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换相应的野生型蛋白中至少30%溶剂暴露的氨基酸残基。
在所述方法的一些实施方案中,所述聚合酶包含一个或多个化学氨基酸修饰,所述修饰在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N末端氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂对包含伯胺基团的氨基酸残基进行的化学修饰。在一些实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,所述经修饰的蛋白的所述一个或多个氨基酸修饰中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述经修饰的蛋白的所述一个或多个氨基酸修饰中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。所述pKa可以任选地为所述氨基酸残基的溶液pKa或全蛋白pKa。
在一些实施方案中,所述经修饰的蛋白的所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0和约8.0之间的pKa的氨基酸残基。在一些实施方案中,待置换的氨基酸为His,Glu,Asp,Tyr或Lys。
在一些实施方案中,所述经修饰的蛋白包括选自下组的至少一个保守性氨基酸置换:His至Arg,Glu至Gln,Asp至Asn,Lys至Arg,以及Tyr至Phe。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括氨基酸的缺失。在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个包括具有约4.0至约10.0之间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个是具有约6.0至约8.0范围内的pKa的氨基酸残基。在一些实施方案中,所述缺失的氨基酸是His,Glu,Asp,Tyr或Lys。
可以以各种方式测量组分的缓冲能力。在一些实施方案中,可以根据组分对于溶液中一种或多种离子的浓度的影响而测量所述组分的缓冲能力。例如,可通过测量包括蛋白的水性溶液中的H+离子浓度而测量所述蛋白的缓冲能力。所述溶液可任选地包括其它组分,例如盐、核苷酸等,其可以独立地具有或不具有缓冲能力。在其它实施方案中,可以根据改变组分的给定量的pH所需的强酸或碱的量来测量所述组分的缓冲能力。Van Slyke(J.Biol.Chem.52:525-570(1922))提供了对于缓冲能力的广泛应用的常规定量测量,据此,对于溶液而言,缓冲能力被表示为在标准的温度和压力条件下,使1升溶液的pH改变一个pH单位所需的强酸或碱的量。
在一些实施方案中,所述经修饰的蛋白包括一个或多个修饰,所述修饰对于特定的离子(例如,H+离子或OH-离子)增加或降低所述经修饰的蛋白的缓冲能力。例如,所述一个或多个修饰能够针对氢离子(例如,H+离子)降低所述经修饰的蛋白的缓冲能力。任选地,在特定的pH范围内显现出对于H+离子的缓冲能力的降低。在一些实施方案中,所述一个或多个修饰能够增加在H+离子敏感性反应中检测到的信号的强度,其中所述信号指示所述离子敏感性反应中存在的H+离子的量。所述H+离子敏感性反应可以是核酸测序反应,其中所述一个或多个H+离子作为通过聚合酶进行的核苷酸掺入的副产物而被释放。在一些实施方案中,可使用合适的场效应晶体管(FET)(例如chemFET或isFET)来产生指示存在于所述离子敏感性反应中的H+离子的量的信号,如下文中所进一步详细描述的。
在一些实施方案中,所述经修饰的蛋白的缓冲能力的降低是如下确定的:通过测量所述经修饰的蛋白对于特定目的离子(例如,氢离子)的缓冲能力,测量参照蛋白对于相同离子的缓冲能力,以及将所述经修饰的蛋白的缓冲能力与所述参照蛋白的缓冲能力进行比较。例如,可通过测量包括经修饰的蛋白的溶液(“测试溶液”)中H+离子的浓度、并将其与包括参照蛋白的溶液(“参照溶液”)中H+离子的浓度进行比较而确定特定的经修饰的蛋白对于氢离子的缓冲能力的增加或降低。在一些实施方案中,所述经修饰的蛋白是突变体聚合酶,其相对于参照聚合酶(例如,所述突变体聚合酶的相应的野生型形式)显示出对于H+离子的降低的缓冲能力,并且所述缓冲能力的降低是通过如下确定的:测量在包括所述经修饰的蛋白的聚合酶反应溶液中检测到的H+离子的量,然后将其与在包括参照聚合酶(代替所述经修饰的聚合酶)的聚合酶反应溶液中所测量到的H+离子的量进行比较。在一些实施方案中,使用FET(例如chemFET或isFET)来测量测试和/或参照溶液中存在的H+离子的量。
如本文中所使用的,术语“缓冲剂”,“缓冲试剂”以及它们的变体包括在溶液中结合H+离子或OH-离子的任何物质。通常,当将酸或碱加入溶液中时,此类缓冲剂或缓冲试剂防止或减少溶液的酸性的任何改变。例如,水性缓冲剂通常清除水性溶液中的H+或OH-离子。在一些实施方案中,缓冲剂能够包含清除溶液中的H+或OH-离子的缀合物酸-碱对。任何缓冲剂都将具有pKa值,即所述缓冲剂具有其最大缓冲能力的pH。所述缓冲剂的缓冲作用通常在一个pH范围中显现,所述pH范围包括从其pKa以下的至少约一或两个pH单位到其pKa值以上的至少约一或两个pH单位。
如本文中所使用的,当用于指蛋白时,术语“非缓冲性”和“无缓冲”以及它们的变体是指在给定的pH范围内、对于给定类型的离子(例如,H+离子或OH-离子)具有降低的、轻微的或无缓冲能力的蛋白。此类蛋白对于要求在所述蛋白的存在下检测离子类型的、基于离子的反应可以是有用的。例如,离子浓度的小的变化能够增加信号的幅度,所述信号指示相对于包括具有更高缓冲能力的蛋白的反应,包括经修饰的蛋白的反应中的离子浓度。通常,此类非缓冲性蛋白包括相对于其未经修饰的对应物对于给定类型的离子(例如,H+离子,OH-离子)展现出降低的缓冲能力的经修饰的蛋白。
在一些实施方案中,本公开一般性地涉及具有降低的缓冲能力的经修饰的蛋白在核酸测序或扩增反应中的用途。所述经修饰的蛋白可包括DNA和RNA结合蛋白两者。此类蛋白可直接或可不直接参与此类反应中的核酸延伸,并且可包括核酸聚合酶,单链DNA结合蛋白,连接酶,解旋酶,核酸酶以及聚合酶辅蛋白。在一些实施方案中,具有改变的(例如,增加或降低的)缓冲能力的经修饰的蛋白是聚合酶。所述聚合酶可以是DNA聚合酶或RNA聚合酶。如本文中所使用的,术语“聚合酶”及其变体包括能够催化核苷酸(包括其类似物)聚合成为核酸链的任何酶。通常但非必然地,此类核苷酸聚合可以以模板依赖性方式发生。
在一些实施方案中,所述经修饰的聚合酶能够被用于在基于离子的测序反应中进行核酸测序。一个示例性的系统是Ion TorrentPGMTM测序仪(Life Technologies),其是基于离子的测序系统,其通过检测作为核苷酸掺入的副产物而产生的离子来对核酸模板进行测序。通常,氢离子作为在通过聚合酶进行的模板依赖性核酸合成过程中发生的核苷酸掺入的副产物而被释放。所述Ion Torrent PGMTM测序仪通过检测核苷酸掺入的氢离子副产物而检测核苷酸掺入。所述IonTorrent PGMTM测序仪包括多种待测序的核酸模板,每一种模板被置于阵列中各自的测序反应孔内。所述阵列的每个孔都与至少一个离子传感器相偶联,所述离子传感器能够检测作为核苷酸掺入的副产物而产生的H+离子的释放或溶液pH的改变。所述离子传感器包括场效应晶体管(FET),其与能够感应H+离子的存在或溶液pH的改变的离子敏感性检测层相偶联。所述离子传感器提供指示核苷酸掺入的输出信号,其可被表示为电压改变,电压改变的幅度与各孔或反应室中的H+离子浓度相关联。不同的核苷酸类型连续流进反应室中,并且以由模板序列决定的顺序被聚合酶掺入延伸中的引物(或聚合位点)内。每个核苷酸掺入都伴有反应孔中H+离子的释放,以及局部pH的相伴改变。H+离子的释放是通过传感器的FET记录的,其产生指示发生核苷酸掺入的信号。在特定核苷酸流的过程中未被掺入的核苷酸将不产生信号。来自FET的信号的幅度也可与掺入到延伸中的核酸分子内的特定类型的核苷酸的数目相关联,从而允许同聚体区域被解析。因此,在所述测序仪运行的过程中,多个核苷酸流进反应室中,连同监测多个孔或反应室的掺入,允许所述设备同时解析许多核酸模板的序列。关于Ion Torrent PGMTM测序仪的组成、设计以及操作的进一步细节可在下列中找到,例如,美国专利申请系列号12/002781,其现在作为美国专利公开号2009/0026082被公布;美国专利申请系列号12/474897,其现在作为美国专利公开号2010/0137143被公布;以及美国专利申请系列号12/492844,其现在作为美国专利公开号2010/0282617被公布,所有这些申请都在此以其全部通过引用而并入。
在一些实施方案中,本公开一般性地涉及本公开的经修饰的蛋白在基于离子的测序方法中的用途。通常,所述经修饰的蛋白是包括一个或多个氨基酸置换的聚合酶,所述一个或多个氨基酸置换在测序反应条件下相对于未经修饰的(例如,野生型)对应物,降低所述聚合酶对于H+离子的缓冲能力。在基于离子的测序反应中使用此类具有降低的缓冲能力的经修饰的聚合酶是特别有利的,因为所述聚合酶的固有缓冲能力能够减少可用于通过FET传感器进行检测的H+离子的数目并因而降低与核苷酸的掺入相关的信号的幅度,以及降低信噪比。由聚合酶的缓冲特性引起的这种信号干扰能够引起测序错误并减少基于离子的测序系统中的平均无错读取长度。
在一些实施方案中,使用具有降低的缓冲能力的经修饰的聚合酶减少或消除这种效应,从而增加与基于离子的测序系统中特定的核苷酸掺入相关的电压改变的幅度。
在一些实施方案中,对于在基于离子的测序系统中获得的信号,使用对于H+离子具有降低的缓冲能力的经修饰的聚合酶能够增加指示核苷酸掺入的信号的幅度和/或降低信噪比。
在一些实施方案中,使用对于H+离子具有降低的缓冲能力的经修饰的聚合酶增加基于离子的测序系统中无错测序读取的平均长度,所述无错测序读取具有不大于1个错误/100个核苷酸的错误率。
在一些实施方案中,使用对于H+离子具有降低的缓冲能力的经修饰的聚合酶减少基于离子的测序系统中的平均测序错误率。
在一些实施方案中,所述经修饰的聚合酶在约pH 4至约pH 10的pH范围内展现出对于H+离子降低的缓冲能力。测序反应通常是在约pH 6至约pH 8的pH值下进行的。在一些实施方案中,所述经修饰的聚合酶在约pH 6至约pH 8的pH范围内展示出对于H+离子降低的缓冲能力。
在一些实施方案中,本公开的聚合酶可以包括而不限于天然存在的聚合酶以及其任何亚基和截短,突变体聚合酶,变体聚合酶,重组体,融合体或其它经工程化的聚合酶,经化学修饰的聚合酶,合成的分子或组装体,和/或保留催化这种聚合的能力的其任何类似物、衍生物或片段。任选地,所述聚合酶可以是包含一个或多个突变的突变体聚合酶,所述突变涉及用其它氨基酸置换一个或多个氨基酸,在所述聚合酶中插入或缺失一个或多个氨基酸,或者连接两个或更多个聚合酶的部分。通常,所述聚合酶包含一个或多个活性位点,在所述活性位点处可发生核苷酸结合和/或核苷酸聚合的催化。一些示例性的聚合酶包括而不限于DNA聚合酶(例如Phi-29型DNA聚合酶,逆转录酶和大肠杆菌DNA聚合酶)以及RNA聚合酶。在一些实施方案中,所述经修饰的聚合酶可以是包含至少两个彼此连接的部分的融合蛋白,其中第一部分包含能够催化核苷酸聚合为核酸链的第一多肽,其中所述第一部分与第二部分相连,所述第二部分包含第二多肽,例如报告子酶或持续合成性增强型结构域。此类聚合酶的一个示例性实施方案是
Figure BDA00002253041400271
聚合酶(New England Biolabs),其包含与持续合成性增强型结构域相融合的热球菌(Pyrococcus)样聚合酶,如例如在美国专利号6,627,424中所描述的。
在一些实施方案中,所述经修饰的聚合酶衍生自已知的DNA聚合酶。基于氨基酸序列比较和三维结构分析,将DNA聚合酶划分为七个不同的家族。DNA聚合酶I(pol I)或A类聚合酶家族包括修复聚合酶大肠杆菌DNA pol I,水生栖热菌pol I,以及嗜热脂肪芽孢杆菌pol I,来自一些细菌噬菌体(T3,T5和T7)的复制性DNA聚合酶,以及真核线粒体DNA聚合酶。DNA聚合酶α(polα)或B型聚合酶家族包括所有的真核复制性DNA聚合酶以及古细菌DNA聚合酶,病毒DNA聚合酶,在各种真菌和植物的线粒体质粒中编码的DNA聚合酶,以及来自细菌噬菌体T4和RB69的聚合酶。家族C聚合酶是主要的细菌染色体复制性酶。这些有时被认为是家族Y的亚集,所述家族Y含有真核聚合酶pol β,以及其它真核聚合酶,例如polσ,polλ,polμ,和末端脱氧核苷酸转移酶(TdT)。家族D聚合酶全都是在古细菌的广古菌亚域中发现的,并被认为是复制性聚合酶。家族Y聚合酶被称为跨损伤合成(TLS)聚合酶,这是由于其经过经损伤的DNA进行复制的能力。它们也被称作易错聚合酶,因为它们在未损伤的模板上具有低保真性。这个家族包括Pol η,Polζ,Pol ι(iota),Pol κ(kappa)和Rev1,以及来自大肠杆菌的Pol IV和PolV。最后,逆转录酶家族包括来自逆转录病毒和真核聚合酶的逆转录酶,通常限为端粒酶。这些聚合酶使用RNA模板来合成DNA链,并且也被称作RNA依赖性DNA聚合酶。
在一些实施方案中,所述经修饰的聚合酶包括一个或多个位于所述聚合酶的催化结构域之外的氨基酸突变。A家族DNA聚合酶、B家族DNA聚合酶和逆转录酶以及RNA依赖性RNA聚合酶的催化结构域是熟知的;它们都共享共同的总体结构和催化机制。所有这些聚合酶的催化结构域都具有与右手相比较的形状并且由“掌”、“拇指”和“指”结构域组成。所述掌结构域通常含有用于磷酰基转移反应的催化位点。所述拇指被认为在定位双链DNA以及在持续合成性和易位中起作用。所述指与进来的核苷酸以及其所配对的模板碱基相互作用。所述掌结构域在A,B和RT家族中是同源性的,但是指和拇指的排布是不同的。不同聚合酶家族的拇指结构域共享一些共同的特征,含有平行或反平行α-螺旋,其中至少一个α-螺旋与引物-模板复合物的小沟相互作用。所述指结构域还保留位于引物-模板复合物的平端的α-螺旋。此螺旋含有高度保守的侧链(B基序)。
对于A家族聚合酶最初鉴别了三个保守的基序A、B和C。在B家族聚合酶和RT聚合酶中也发现A和C基序是保守的(Delarue等人,Protein Engineering 3:461-467(1990))。
对于A家族聚合酶,A基序包含共有序列:
DXSXXE(SEQ ID NO:10)。
B基序包含共有序列:
KXXXXXXYG(SEQ ID NO:11)
C基序包含共有序列
VHDE(SEQ ID NO:12)
对于B家族聚合酶,A基序包含共有序列:
DXXSLYPS(SEQ ID NO:13)。
B基序包含共有序列:
KXXXNSXYG(SEQ ID NO:14)
C基序包含共有序列
YGDTDS(SEQ ID NO:15)
粗体的残基表示不变的残基。在一些实施方案中,所述经修饰的聚合酶包括位于除所述不变的残基之外的任何位置的氨基酸突变(例如,氨基酸置换,缺失,添加)或化学修饰。
所述A和C基序是掌结构域的一部分,并且每一个都含有严格保守的天冬氨酸残基,其参与所有DNA聚合酶共有的催化机制。DNA合成是通过将磷酰基从进来的核苷酸转移到DNA的3’OH、释放多磷酸酯部分以及形成新的DNA磷酸二酯键而介导的。这一反应是通过涉及两个金属离子(通常为Mg2+)和两个保守的天冬氨酸残基的机制催化的。
A家族DNA聚合酶的基序A中的保守的谷氨酸残基在掺入正确的核苷酸中起重要作用,如B家族成员中相应的保守的酪氨酸一样(Minnick等人,Proc.Natl.Acad.Sci USA 99:1194-1199(2002);Parsell等人,Nucleic Acids Res.35:3076-3086(2002).Mutations atthe conserved Leu of motif A affect replication fidelity(Venkatesan等人,J.Biol.Chem.281:4486-4494(2006))。
B基序含有保守的赖氨酸,酪氨酸和甘氨酸残基。大肠杆菌pol I的B基序被显示结合核苷酸底物并且含有保守的酪氨酸,其被显示在活性位点中。
B家族聚合酶含有6个保守的基序,其中区域I和II相应于A家族的A和C基序。区域III参与核苷酸结合并且与基序B在功能上同源。区域I,II和III从掌(I),指(II)和拇指基底(III)在活性位点的中心会聚,以产生邻接的保守表面。在这些区域中,一组高度保守的残基形成三个化学上不同的簇,其由下列组成:暴露的芳香残基(Y416,Y567和Y391),带负电的残基(D621,D623,D411,D684和E686),以及带正电的簇(K560,R482和K486)。这三个簇包括这样的区域:在所述区域中,引物末端和进来的核苷酸将预期在其中结合(Wang等人,Cell 89:1087-1099(1997))。
RT聚合酶含有四个保守的序列基序(Poch等人,EMBO J.12:3867-3874(1989)),其中基序A和C含有保守的催化性天冬氨酸。基序B的完整性也是逆转录酶的功能所需要的。
基序A的共有序列为DXXXXF/Y(SEQ ID NO:16)
基序B的共有序列为FXGXXXS/A(SEQ ID NO:17)
基序C的共有序列为YXDD(SEQ ID NO:18)
基序D的共有序列为GXXXXXXXK(SEQ ID NO:19)。
YXDD基序(基序C)(这些基序中最高度保守的)中的突变能够破坏聚合酶活性并且改变持续合成性和保真性(Sharma等人,Antiviral Chemistry and Chemotherapy 16:169-182(2005))。此外,基序D(RT聚合酶独有的环)中保守的赖氨酸残基是对于核苷酸结合而言具有重要意义的不变残基(Canard等人,J.Biol.Chem.274:35768-35776(1999))。
在一些实施方案中,除了它们的聚合酶结构域之外,所述经修饰的聚合酶能够包括一个或多个其它的功能性结构域,这包括下列活性所需的结构域:介导新合成的DNA链的校正的3'->5'(反向)外切核酸酶活性;或者介导DNA修复过程中的缺口平移的5'->3'(正向)外切核酸酶活性。在一些实施方案中,所述经修饰的聚合酶具有链置换活性,并且能够通过使核苷酸聚合到双链核酸模板内的缺口的3’端而同时置换位于所述缺口下游的核酸来催化核酸合成。
A和B家族DNA聚合酶的3’至5’外切核酸酶校正结构域均含有三个保守的基序,称作Exo I,Exo II和Exo III,其中的每一个都含有对于金属结合和外切核酸酶功能而言必不可少的不变的天冬氨酸残基。这些保守天冬氨酸残基的改变产生这样的蛋白,其保留聚合酶活性但是在外切核酸酶活性方面有缺陷(Hall等人,J.Gen.Virol.76:2999-3008(1995))。也鉴别了5’至3’外切核酸酶结构域中的保守基序以及影响外切核酸酶活性的氨基酸改变(美国专利号5,466,591)。
A家族酶的代表性实例是大肠杆菌Pol I,或大肠杆菌Pol I的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,T7DNA聚合酶以及Tth DNA聚合酶。A家族酶还包括铂Taq DNA聚合酶系列。此家族中合适的聚合酶的实例包括Phi-29DNA聚合酶,B103DNA聚合酶等。
通常认为A家族酶实现高的DNA延长速率,但是因为缺少3'-5'外切核酸酶活性而具有差的保真性,而B家族酶由于其3'-5'外切核酸酶活性而具有高保真性但是实现低的DNA延长速率。有可能通过混合形成混合型的酶并且通常认为,A家族酶实现高的DNA延长速率但是因为缺少3'-5'外切核酸酶活性而具有差的保真性。
未分类的酶包括,例如Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶,Tfi聚合酶等。RT聚合酶包括HIV逆转录酶,莫洛尼鼠白血病病毒(M-MLV)逆转录酶,禽成髓细胞瘤病毒(AMV)逆转录酶或劳斯肉瘤病毒(RSV)逆转录酶。也可使用它们的变体,经修饰的产物以及衍生物。
在这些酶中,Taq,铂Taq,Tth,Tli,Pfu,Pfutubo,Pyrobest,Pwo和KOD,VENT,DEEPVENT,EX-Taq,LA-Taq,TherminatorTM,Expand系列以及铂Taq Hi-Fi都是商业上可得的。其它的酶可以由本领域普通技术人员从特定的细菌中容易地分离。
一个示例性的聚合酶,大肠杆菌DNA聚合酶I(“Pol I”)具有三种酶促活性:5’至3’DNA聚合酶活性;介导校正的3’至5’外切核酸酶活性;和在DNA修复过程中介导缺口平移的5’至3’外切核酸酶活性。Klenow片段是当大肠杆菌Pol I被枯草杆菌蛋白酶(subtilisin)蛋白水解性切割时产生的大的蛋白片段。其保留聚合酶和校正外切核酸酶活性,但是缺少5’至3’外切核酸酶活性。经突变以去除所述校正外切核酸酶活性的exo-Klenow片段也是可获得的。Klenow片段的结构显示出:与DNA相互作用的高度保守的残基包括N675,N678,K635,R631,E611,T609,R835,D827,S562和N579(Beese等人,Science260:352-355(1993))。
大肠杆菌DNA聚合酶I(pol I)的Klenow片段中的Arg682对于模板依赖性核苷酸结合功能具有重要意义,并且似乎维持DNA聚合酶的高持续合成性(Pandey等人,European Journal of Biochemistry,214:59-65(1993))。
在一些实施方案中,所述经修饰的聚合酶源自嗜热脂肪芽孢杆菌的Bst DNA聚合酶,其为另一个A家族DNA聚合酶。Bst DNA聚合酶的大片段等同于大肠杆菌Pol I的Klenow片段,保留聚合酶和校正外切核酸酶活性而缺乏5’至3’外切核酸酶活性。因此,如本文中所使用的术语“Bst DNA聚合酶”可指全长蛋白或Bst大片段。
在一些实施方案中,所述经修饰的聚合酶源自Taq DNA聚合酶,其为好热性细菌水生栖热菌的A家族DNA聚合酶。其最知名的是在聚合酶链式反应中的应用。Taq聚合酶缺少校正活性,并因此具有相对低的复制保真性(Kim等人,Nature 376:612-616(2002))。
在一些实施方案中,所述经修饰的聚合酶源自细菌噬菌体T7的T7DNA聚合酶,其为A家族DNA聚合酶,且其由病毒T7基因5蛋白(80kDa)和大肠杆菌硫氧还蛋白(12k Da)的1:1复合物组成。其缺乏5'->3'外切核酸酶结构域,但是3'->5'外切核酸酶活性大约比大肠杆菌Klenow片段的此活性高1000倍。外切核酸酶活性似乎负责此酶的高保真性并防止链置换合成。由于其可观的持续合成性,或者对于多于平均数目的碱基对停留在DNA上的能力,这种聚合酶是独特的。
在一些实施方案中,所述经修饰的聚合酶源自KOD DNA聚合酶,其为源自Thermococcus kodakaraensis的B家族DNA聚合酶。KOD聚合酶是具有高保真性和持续合成性的热稳定性DNA聚合酶。
在一些实施方案中,所述经修饰的聚合酶源自TherminatorzTMDNA聚合酶,其也是B家族DNA聚合酶。TherminatorTM是来自热球菌种9oN-7的DNA聚合酶的A485L点突变(Ichida等人,NucleicAcids Res.33:5214-5222(2005))。TherminatorTM聚合酶具有增强的掺入经修饰的底物(例如双脱氧核苷酸,核糖核苷酸,以及acyclonucleotide)的能力。
在一些实施方案中,所述经修饰的聚合酶源自Phi29聚合酶或Phi29型聚合酶,例如源自细菌噬菌体B103的聚合酶。Phi29和B103DNA聚合酶为来自相关细菌噬菌体的B家族聚合酶。除了A,B和C基序之外,DNA聚合酶的Phi29家族包含额外的保守基序,区域Y中的KXY(Blanco等人,J.Biol.Chem.268:16763-16770(1993))。影响聚合酶活性和核苷酸结合亲和性的Phi29和B103聚合酶的突变被描述在美国专利公开号20110014612及其优先权文件美国临时申请号:61/307,356;61/299,917;61/299,919;61/293,616;61/293,618;61/289,388;61/263,974;61/245,457;61/242,771;61/184,770;和61/164,324中,这些在此以其全部通过引用而并入。
在一些实施方案中,所述经修饰的聚合酶源自来自1型人类免疫缺陷病毒(HIV-1)的逆转录酶,其为由一个66-kDa的亚基和一个51-kDa的亚基组成的异二聚体。p66亚基含有聚合酶和RNase H结构域;对p66的蛋白水解性切割去除了RNase H结构域以产生p51亚基(Wang等人,PNAS 91:7242-7246(1994))。HIV-1逆转录酶的结构显示出,RNA模板的2’-OH基团与逆转录酶之间的多重相互作用。p66拇指中螺旋I的残基Ser280和Arg284以及p66掌中模板柄的残基Glu89和Gln91参与RNA-RT相互作用。p51亚基在RNA-DNA双链与RT间的相互作用中也起作用,其中p51亚基的残基Lys395,Glu396,Lys22和Lys390也与DNA:RNA双链相互作用(Kohlstaedt等人,Science 256:1783-1790(1992)。Safarianos等人,The EMBOJournal 20:1449-1461(2001))。
在一些实施方案中,本公开的经修饰的蛋白可以源自这样的蛋白,特别是核酸结合蛋白:其可被用于包括在核苷酸掺入和/或核酸测序应用中。许多DNA聚合酶都与辅助蛋白(例如单链DNA结合蛋白,滑动钳蛋白等)相互作用。所述DNA钳蛋白是完全环绕DNA并且能够显著增加聚合酶持续合成性的多聚体蛋白。所述钳蛋白包括持续合成性因子–滑动钳(对于细菌DNA聚合酶II和III),gp45(对于T4DNA聚合酶),UL44(对于巨细胞病毒DNA聚合酶),UL30(对于单纯疱疹病毒I DNA聚合酶),和增殖细胞核抗原(对于真核DNA聚合酶)(Lee等人,J.Biol.Chem.295:1490-1499(2010))。在基于离子的核苷酸掺入和测序反应中使用这种经修饰的蛋白提供了与使用所述经修饰的聚合酶相同的益处,即对于基于离子的测序信号减小的干扰,增加的信噪比,测序错误率的降低,和平均无错测序读取长度的增加。
在一些实施方案中,所述经修饰的蛋白源自单链DNA结合蛋白。所述单链DNA结合蛋白(SSB)是以核苷酸序列非依赖性的方式优先结合单链DNA(ssDNA)而非双链DNA的蛋白。在几乎所有已知的生物体中都鉴别出了SSB,并且其似乎对于DNA代谢(包括复制、重组和修复)具有重要意义。天然存在的SSB通常含有两个、三个或四个亚基,其可以是相同或不同的。一般地,天然存在的SSB亚基含有至少一个保守的DNA结合结构域,或“OB折叠”(Philipova等人(1996)Genes Dev.10:2222-2233;和Murzin(1993)EMBO J.12:861-867),从而天然存在的SSB具有四个或更多个OB折叠。
被最好地表征的SSB来自大肠杆菌,其以四聚体存在(Raghunathan,Nature Structural & Molecular Biology 7,648-652(2000))。大肠杆菌SSB(EcoSSB)单体包含富含螺旋和片的N末端结构域和结构性较差的C末端结构域。所述N末端结构域含有OB折叠,而C末端结构域含有高度保守的酸性区,所述酸性区减弱EcoSSB与DNA的结合,但是可在体内参与与其它蛋白的相互作用。发现在DNA测序反应中加入单链DNA结合蛋白(SSB)显著增加了测序运行的分辨率(Rapley(1994)Molecular Biotechnology 2:295-298.))。SSB也被用于增加PCR的效率(Kur等人,Acta Biochimica Polonica 52:569-574(2005))。SSB是商业上可得的,并且被用于改善DNA聚合酶的持续合成性和保真性(美国专利公开号20070059713)。
在一些实施方案中,本公开的经修饰的蛋白可以源自DNA连接酶。连接酶是从病毒至人中发现的DNA复制、重组和修复系统中的必不可少的组分,其催化双链DNA上单链断裂处磷酸二酯键的形成(Lehman,I.R.,Science,186:790-797(1974))。基于辅因子依赖性,可将DNA连接酶归类为两个家族。ATP-依赖性连接酶在下列中被发现:细菌噬菌体(Dunn等人,J Mol Biol.,148(4):303-330(1981)和Weiss等人,Proc Natl Acad Sci USA,57(4):1021-1028(1967)),小球藻病毒PBCV-1(Ho等人,J Virol,71(3):1931-19374(1997)),牛痘病毒(Shuman,S.,Biochemistry,34(49):16138-161475(1995)),古细菌(Kletzin,A.,Nucleic Acids Res,20(20):5389-5396(1992)和Bult等人,Science,273(5278):1058-1073(1996)),酵母(Andaluz等人,Yeast,12(9):893-8988(1996),Ramos等人,Nucleic Acids Res,25(8);1485-1492(1997),Schar等人,Genes Dev,11(15):1912-1924(1997)),哺乳动物(Tomkinson等人,Bioessays,19(10):893-901(1997),Tomkinson等人,Mutat Res,407(1):1-9(1998),以及Wang等人,JBiol Chem,269(50):31923-3192811(1994)),和更近期的真细菌(Cheng,等人,Nucleic Acids Res,25(7):1369-1374(1997)以及Deckert等人,Nature,392(6674):353-358(1998))。然而,仅在真细菌中发现了NAD+(即烟酰胺腺嘌呤二核苷酸)依赖性连接酶。虽然一些更高等的真核生物体可使用多种ATP(即三磷酸腺苷)依赖性连接酶以实现多种生物学功能,但一些简单的真细菌基因组可具有NAD+-依赖性连接酶和ATP依赖性连接酶二者(Deckert等人,Nature,392(6674):353-358(1998)和Fleischmann等人,Science,269(5223):496-512(1995))。这些基因组中其它ATP依赖性连接酶的来源仍待被确定。
虽然ATP依赖性连接酶和NAD+依赖性连接酶共享很少的序列同源性,目前为止研究的所有连接酶都使用相同的基序来形成腺苷酸化的酶中间体(Tonikinson等人,Bioessays,19(10):893-901(1997),Shuman等人,Virology,211(1):73-83(1995)和Luo等人,Nucleic AcidsRes,24(15):3079-3085(1996))。此外,它们似乎以相似的结构域和结构性折叠被组织((Doherty等人,Nucleic Acids Res,24(12):2281-2287(1996),Subramanya等人,Cell,85(4):607-615(1996)和Sekiguchi等人,Nucleic Acids Res,25(4):727-734(1997))。
在一些实施方案中,本公开的经修饰的蛋白可以源自解旋酶,其为沿着核酸磷酸二酯主链方向性移动的马达蛋白,其使用来自ATP水解的能量分离两条退火的核酸链(即DNA,RNA或RNA-DNA杂交体)。所有的解旋酶都含有经典的Walker A和B基序,其与ATP结合以及Mg2+结合相关联(在Caruthers and McKay.Curr.Opin.Struct.Biol.12:123-133(2002),Soultanas and Wigley.Trends Biochem.Sci.26:47-54(2001)中进行了综述)。根据解旋酶标志(signature)基序的数目和基序共有序列中的差别将解旋酶分类为七个超家族(Gorbalenyaand Koonin.Curr.Opin.Struct.Biol.3:419-429(1993))。超家族1和2具有七个特征性解旋酶标志基序并且包括来自古细菌、真细菌、真核生物和病毒的解旋酶,其中解旋酶以3'至5'方向或5'至3'方向解开双链DNA或RNA。超家族1解旋酶的实例包括大肠杆菌UvrD解旋酶,嗜热厌氧菌UvrD解旋酶和RecBCD的B亚基。超家族3具有三个基序,且超家族4具有五个基序。超家族4解旋酶的实例包括T7Gp4解旋酶和DnaB解旋酶。
解旋酶可被用于用来进行体外DNA扩增的解旋酶依赖性扩增(HDA)方法。与PCR(其需要热循环来分离两条DNA链)相反,HDA利用DNA解旋酶来产生单链模板用于引物杂交和随后的通过DNA聚合酶的引物延伸。因为使用解旋酶消除了对于热循环的需要,所以HDA能够在单一的温度下进行整个过程(Vincent等人,EMBOReports 5:795-800(2004))。
天然存在的DNA解旋酶的实例(由Kornberg和Baker在他们的书的第11章中描述,DNA Replication,W.H.Freeman and Company(2nd ed.(1992)))包括大肠杆菌解旋酶I,II,III和IV,Rep,DnaB,PriA,PcrA,T4Gp41解旋酶,T4Dda解旋酶,T7Gp4解旋酶,SV40大T抗原,酵母RAD。可被用于所公开的测序方法中的其它解旋酶包括RecQ解旋酶(Harmon and Kowalczykowski,J.Biol.Chem.276:232-243(2001)),来自嗜热厌氧菌(美国专利号7,829,284)和嗜热菌(Collins and McCarthy,Extremophiles.7:35-41.(2003))的热稳定性UvrD解旋酶,来自水生栖热菌的热稳定性DnaB解旋酶(Kaplan andSteitz,J.Biol.Chem.274:6889-6897(1999)),以及来自古细菌和真核生物体的MCM解旋酶((Grainge等人,Nucleic Acids Res.31:4888-4898(2003))。
在一些实施方案中,本公开的经修饰的蛋白可以源自核酸酶。核酸酶是切割核酸的核苷酸亚基之间的磷酸二酯键的酶。内切核酸酶切割多核苷酸链内的磷酸二酯键,而外切核酸酶切割多核苷酸链末端的磷酸二酯键。
在DNA合成过程中,3′和5′外切核酸酶起作用以从DNA中去除不想要的核苷酸。偶尔,DNA聚合酶会向生长中的DNA聚合物添加不正确的核苷酸。3′外切核酸酶去除被不正确地聚合到DNA链中的核苷酸。这些外切核酸酶被称作"校正"外切核酸酶。
在许多情形中,所述外切核酸酶活性与DNA聚合酶活性被包含在相同的蛋白中。例如,大肠杆菌DNA聚合酶I是具有三个分别的结构域或功能区的单一多肽。这三个结构域中的每一个都具有酶促活性。DNA聚合酶活性在一个结构域中,另外两个结构域含有3′和5′外切核酸酶活性。3′外切核酸酶为DNA聚合酶校正,5′外切核酸酶在DNA聚合酶之前去除不想要的核苷酸。
在一些实施方案中,本公开的经修饰的蛋白可以源自拓扑异构酶。DNA拓扑异构酶是特殊类型的核酸酶,其结合单链或双链DNA并且切割DNA的磷酸主链。这种中间的断裂允许DNA被解开或松开,并且在这些过程的最后,DNA被再次重新连接。I型拓扑异构酶切割DNA双螺旋的一条链,而II型拓扑异构酶切割一个DNA双螺旋的两条链,使另一个未受损DNA螺旋通过它,然后将被切割的链再退火。I型拓扑异构酶包括topo I,topo III和topo V。II型拓扑异构酶包括真核topo II,大肠杆菌促旋酶,大肠杆菌topo IV和topo VI(Champoux JJ(2001)Annu.Rev.Biochem.70:369–413)。
被用于DNA测序反应中的DNA拓扑异构酶的实例是来自甲烷嗜热菌的拓扑异构酶V,其作为FidelaseTM(美国专利号5,656,463)是商业可得的。这种热稳定性拓扑异构酶被用于酶促解连接和变性质粒DNA,以帮助DNA聚合酶通过强的二级结构和保护DNA不被热分解。
在一些实施方案中,本公开还一般性地涉及用于形成相对于未经修饰的蛋白具有改变的(例如,增加或减少的)缓冲特性的经修饰的蛋白的方法。例如,在一些实施方案中,本公开一般性地涉及用于形成经修饰的聚合酶的方法,所述经修饰的聚合酶在约pH 4至约pH 10,通常为约pH 6至约pH 9,甚至更通常为约pH 7至约pH 9的pH范围内对于H+离子具有降低的缓冲能力。
在一些实施方案中,本公开的经修饰的蛋白包括这样的蛋白:其被修饰以置换,缺失或化学修饰具有目的pH范围内的pKa的任何化学基团。被靶向以进行置换、缺失或修饰的氨基酸侧链包括具有目的范围内的pKa并且有可能在蛋白表面上的那些。
在一些实施方案中,被选择进行突变的氨基酸残基是基于对蛋白氨基酸的缓冲特性、特别是pKa值的分析。具有相应于所需反应条件的pH范围的pKa值的氨基酸残基有可能在所需的反应条件下具有较强的缓冲能力。例如,本公开的经修饰的蛋白可通过如下获得:鉴别出蛋白中的氨基酸残基,所述氨基酸残基具有或被预测具有落在对于基于靶蛋白的测定所采用的典型反应条件之外的pKa值;用不同的氨基酸残基替代或置换一个或多个所鉴别出的氨基酸残基,所述不同的氨基酸残基具有或被预测具有所欲操作范围之外的pKa值。此种置换应当降低整体蛋白的缓冲能力,因为在使用所述蛋白的应用中所通常采用的反应条件下,将预期新的氨基酸残基仅弱地缓冲(如果缓冲的话)。
在一些实施方案中,能够应用氨基酸选择和突变的这些一般性原则以产生经修饰的核酸结合蛋白(例如,聚合酶、连接酶、解旋酶、SSBP等),所述蛋白在引物延伸测定和核苷酸掺入反应(包括核酸测序反应)中对于H+离子具有降低的缓冲能力。在一些实施方案中,能够预测和评估候选蛋白的氨基酸残基的pKa值以鉴别出所述蛋白中具有落入用于所述蛋白的所欲操作条件的范围内的pKa值的所有氨基酸残基。用于基于蛋白的测定的标准操作条件通常相应于生理条件并且是本领域中熟知的。用于蛋白测定、特别是涉及核酸结合蛋白和酶的测定的标准操作条件通常包括约pH 4至约pH 10的pH范围,更通常为约pH 6至约pH 9,甚至更通常为约pH7至约pH 9。在一些实施方案中,可预测和评估候选蛋白的氨基酸残基的pKa值以鉴别出所述蛋白中具有落入约pH 4至约pH 10、更通常为约pH 6至约pH 9、甚至更通常为约pH 7至约pH 9的范围内的pKa值的所有氨基酸残基,从而鉴别出第一个集合的用于修饰的候选氨基酸残基。
在一些实施方案中,不仅基于pKa值、还基于氨基酸残基的溶剂暴露程度来选择待修饰的氨基酸残基。例如,可基于下列来选择用于修饰的候选氨基酸残基:其预测的pKa值(例如,选择具有、或被预测具有落在涵盖所欲操作条件的所需pH范围内的pKa的所有氨基酸残基)以及其溶剂暴露(例如,选择具有或被预测具有至少30%、通常至少约40%的溶剂暴露,任选地具有至少约50%、60%、70%、80%或90%的溶剂暴露的氨基酸残基)。蛋白中氨基酸的溶剂暴露度量氨基酸可接触围绕所述蛋白的溶剂(通常为水)的程度,此参数也可被不同地称为表面暴露或溶剂化。等同的相反参数是氨基酸残基被包埋在蛋白中的程度(%包埋);被20%包埋的氨基酸残基是80%溶剂暴露的。可通过各种合适的方法确定蛋白结构内氨基酸的溶剂可接触性(或相反地,%包埋),所述方法包括对蛋白结构(例如,晶体结构)的三维显示进行视觉分析,或者通过使用本领域中已知的方法对蛋白结构进行软件分析(Lee and Richards,J.Mol.Biol.55(3):379-400(1971);Shrake and Rupley,J.Mol.Biol.79(2):351-371(1973);Connolly,J.Appl.Cryst.16:548-558(1983))。有多种分子图形程序是可获得的,其允许确定蛋白结构内氨基酸的可接触表面区域,所述程序为例如Rasmol,Charmm,AMBER,Swiss-PDBviewer,PropKa等。在蛋白的三维结构未知的情形中,可通过本领域中已知的分子模拟方法,基于与具有已知结构的蛋白的序列同源性进行模拟。
在一些实施方案中,基于pKa值选择的候选氨基酸的第一集合,可通过鉴别出所述第一集合内具有或被预测具有至少最小阈程度的表面暴露(也称为溶剂暴露或溶剂化)的所有氨基酸残基而被进一步变窄。可鉴别和选择具有或被预测具有等同于或超过此阈值程度的溶剂化的氨基酸残基,以鉴别出用于修饰的候选氨基酸的第二集合。在一些实施方案中,所述候选氨基酸的第二集合包括所述第一集合中具有至少约30%溶剂暴露、通常至少约50%溶剂暴露、甚至更通常至少约60%溶剂暴露、甚至更通常至少约70%溶剂暴露的所有氨基酸残基。
用于形成经修饰的蛋白的方法可任选地包括修饰候选集合中的至少一个氨基酸残基,从而形成相对于未经修饰的蛋白具有改变的(例如,增加的或减少的)缓冲能力的经修饰的蛋白。
在一些实施方案中,候选氨基酸的第一集合或候选氨基酸的第二集合中的一个或多个氨基酸残基可任选地被不同的氨基酸残基置换,所述不同的氨基酸残基具有落在所欲操作范围之外的pKa值,例如具有约pH 4至约pH 10的pH范围之外的pKa值,更通常在约pH 6至约pH 9的范围之外,甚至更通常在约pH 7至约pH 9的范围之外。
在所述方法的一些实施方案中,包括在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸置换,其中所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在一些实施方案中,特别是对于缺乏伯胺或游离羧基的内部氨基酸残基(例如,非末端氨基酸残基),氨基酸残基的pKa与溶液中所述氨基酸残基的侧链的pKa值相近。在其它的实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa(例如,“全蛋白pKa”)。
在一些实施方案中,所述修饰可以包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换至少一个具有约4.0至约10.0之间的pKa的氨基酸残基。例如,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基可选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述修饰包括用另一个氨基酸残基置换至少一个具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述修饰包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换至少一个具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述修饰包括用任何其它不同的氨基酸残基置换至少一个选自下组的氨基酸残基:His,Glu,Asp,Tyr和Lys。
在一些实施方案中,所述修饰包括用丙氨酸残基置换所述蛋白的至少一个氨基酸残基。
在一些实施方案中,所述修饰包括用另一个氨基酸残基置换至少一个在相应的野生型蛋白中为至少30%溶剂暴露的氨基酸残基。
在所述方法的一些实施方案中,所述修饰包括引入至少一个化学氨基酸修饰,所述化学氨基酸修饰在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力。在一些实施方案中,所述至少一个化学氨基酸修饰包括N末端氨基酸的化学修饰。在一些实施方案中,所述至少一个化学氨基酸修饰包括用胺反应活性试剂修饰包含伯胺基团的氨基酸残基的化学修饰。在一些实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,本公开一般性地涉及用来降低用于DNA测序或扩增反应中的蛋白的缓冲能力的方法,所述方法包括在所述蛋白序列中制造一个或多个保守性氨基酸置换,其在pH 7至pH 9的范围内实质上去除蛋白的缓冲能力。
可使用设计和向蛋白中引入修饰的任何合适的方法来设计、工程化和合成本公开的经修饰的蛋白。对编码蛋白的核酸序列进行遗传工程化以选择性地引入突变(任选地以位点特异性的方式)的方法是重组核酸工程化领域中所熟知的,同样,体内或体外克隆、表达和纯化这种序列的方法也是熟知的。本文中进一步详述了克隆、表达和纯化的某些示例性方法。
在一些实施方案中,可通过改变所选氨基酸残基的pKa值或范围来修饰所述蛋白。组分(例如,氨基酸)的pKa是酸解离常数Ka的对数度量。酸解离常数Ka(也称作酸性常数,或酸离子化常数)是溶液中酸强度的定量度量。其为在酸碱反应的情境中,用于被称作解离的化学反应的平衡常数。通过修饰多肽中氨基酸的pKa值,可改变(例如,增加或减少)所述多肽吸附氢离子的能力,和/或其在离子检测和缓冲能力方面的效果。
蛋白的氨基酸侧链的pKa值能够在确定蛋白的pH依赖性特征中起重要作用。酶所展现的活性的pH依赖性以及蛋白稳定性的pH依赖性,例如是通常由氨基酸侧链的pKa值决定的性质。氨基酸残基的pKa值可以是溶液pKa值,基于氨基酸本身的pKa值,但不是基于与蛋白环境中的其它氨基酸相互作用的pKa值。
可使用任何合适的方法推断、估测或确定特定蛋白的氨基酸残基的pKa。用于推断蛋白的特定氨基酸残基的pKa值的各种方法是本领域中已知的。例如,可从与氨基酸侧链相似的模式化合物的pKa值推断出所述氨基酸侧链的pKa值。α-羧酸,α-氨基和溶液中游离氨基酸的可滴定侧链的pKa是本领域中熟知的并且可在标准表格中获得,其实例在表1中提供。
表1:溶液中游离氨基酸的一些典型pKa值
  氨基酸   α-羧酸   α-氨基   侧链
  丙氨酸   2.35   9.87
  精氨酸   2.01   9.04   12.48
  天冬酰胺   2.02   8.80
  天冬氨酸   2.10   9.82   3.86
  半胱氨酸   2.05   10.25   8.00
  谷氨酸   2.10   9.47   4.07
  谷氨酰胺   2.17   9.13
  甘氨酸   2.35   9.78
  组氨酸   1.77   9.18   6.10
  异亮氨酸   2.32   9.76
  亮氨酸   2.33   9.74
  赖氨酸   2.18   8.95   10.53
  甲硫氨酸   2.28   9.21
  苯丙氨酸   2.58   9.24
  脯氨酸   2.00   10.60
  丝氨酸   2.21   9.15
  苏氨酸   2.09   9.10
  色氨酸   2.38   9.39
  酪氨酸   2.20   9.11   10.07
  缬氨酸   2.29   9.72
在一些实施方案中,所述溶液pKa值可以是模式pKa值。例如,可从模式化合物(例如与氨基酸侧链相似的化合物)的pKa值推断出溶液中氨基酸侧链的pKa值。
在一些实施方案中,可通过简单地使其与其侧链残基的值相近似而估测出蛋白氨基酸残基的pKa值,如表1中所示。换言之,氨基酸残基(特别是内部氨基酸残基)的pKa值可被估测为与其侧链的pKa值相等,如表1中所示。可基于其溶液pKa选择待置换、缺失或修饰的氨基酸残基。
在一些实施方案中,可通过使用预测在全蛋白情境中氨基酸残基的pKa值的可获得的工具(例如软件)来估测蛋白的氨基酸残基的pKa值。折叠的蛋白的给定氨基酸残基的pKa值(在本文中称作氨基酸残基的“全蛋白pKa”)可以不同于溶液中游离氨基酸的pKa(在本文中称作氨基酸残基的“溶液pKa”)。在折叠的蛋白中,氨基酸残基(包括其可滴定氨基酸侧链)可被包埋在蛋白的内部并且对于溶剂具有有限的暴露或者没有暴露,并且也可以与所述蛋白中的其它可滴定基团以及所述蛋白中的永久电荷(例如离子)和偶极子相互作用。所有这些效应都可改变氨基酸侧链的pKa值,使之不同于其溶液pKa。也可基于野生型蛋白中氨基酸残基的全蛋白pKa来选自待置换、缺失或修饰的氨基酸残基。可通过各种技术来估测折叠的蛋白中氨基酸残基的全蛋白pKa。某些方法是基于对波森-波兹曼方程的解,常常称作基于FDPB(指“有限差分波森-波兹曼)的方法。使用在其完全溶解的状态中氨基酸侧链的pKa值的知识、结合计算蛋白内部对于pKa值的影响的理论方法,基于FDPB的方法计算当侧链从假设完全溶解的状态被移动到其在蛋白中的位置时,氨基酸侧链的pKa值的改变。使用FDPB方法来计算蛋白中氨基酸侧链的估测pKa值的公共可得的程序包括:H++,其可在弗吉尼亚理工学院的H++服务器处获得(Gordon等人,Nucleic Acids Research 33:W368-W371(2005);Anandakrishnan andOnufriev,Journal of Computational Biology 15:165-184(2008));Karlsberg+(Kieseritzky and Knapp,Proteins:Structure,Function,and Bioinformatics 71:1335-1348(2008));Rabenstein and Knapp,Biophysical Journal 80(3):1141-1150(2001));MCCE(Song andGunner,J.Comp.Chem epub Mar 2009;Georgescu等人,Biophys J.83,1731-1748(2002);以及pKD网络服务器(Tynan-Connolly andNielsen,Nucleic Acid Research 34:W48-W51(2006);Tynan-Connollyand Nielsen,Protein Science 16:239-249(2007))。
PropKa使用备选的方法,PropKa为用于计算全蛋白pKa值的软件程序,其可从哥本哈根大学的PROPKA网络界面获得(Li等人,Proteins 61:704-721(2005);Bas等人,Proteins 73:765-783(2008))。用于快速预测pKa值的PropKa程序是基于一系列将蛋白结构与可离子化残基的pKa值相关连的经验性原则。
计算pKa值的分子动力学方法包括计算测量分子的质子化和去质子化形式之间的自由能差异。与使用波森-波兹曼公式相比,分子动力学通常是在计算上昂贵得多的预测pKa的方式。近年来,基于蛋白的显微描述已经开发了恒定的pH分子动力学方法(Wallace and Shen,Method in Enzymology 466:455-475(2009))。
用于计算氨基酸侧链的pKa的公众可得的程序和网络服务器通常需要PDB(蛋白数据库)形式的待分析蛋白的三维结构。这些结构可从例如PDBsum(Laskowski,Nucleic Acids Res.,37,D355-D359(2009))的站点下载。所述程序将返回对于蛋白的可滴定氨基酸侧链、以及N-末端和C-末端基团所计算的pKa值列表。例如,表2和表3显示了对于Bst DNA聚合酶中的氨基酸所计算的pKa。栏1显示了氨基酸残基,其中编号是基于SEQ ID NO:1的编号;栏2显示了所计算的侧链的pKa。表2中所显示的值是使用PropKa确定的,而表3中的值是使用H++确定的。因为这些程序使用不同的算法,所以对于个体氨基酸残基,它们可能会返回不同的pKa值。在某些情形中,比较来自两个程序的结果可能是有用的,作为对给定氨基酸残基具有目的pH范围内的pKa的确认。
在一些实施方案中,所述修饰可包括用具有更希望的pKa(例如,落在用于所需应用的典型反应条件的范围之外的pKa)氨基酸置换具有不希望的pKa(例如,落在所述典型反应条件的范围之内的pKa)且有可能位于蛋白表面上(例如,为至少30%溶剂暴露的,更通常为至少50%溶剂暴露的)至少一个氨基酸残基。
在一些实施方案中,所述修饰可以包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换至少一个具有约4.0至约10.0之间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述修饰可包括用另一个氨基酸残基置换至少一个具有约6.0至约8.0范围内的pKa的氨基酸残基。所述pKa可任选地为所述氨基酸残基的溶液pKa或全蛋白pKa。
在一些实施方案中,所述修饰可包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换至少一个具有约6.0至约8.0之间的pKa的氨基酸残基。在一些实施方案中,待置换的氨基酸为His,Glu,Asp,Tyr或Lys。
在一些实施方案中,所述蛋白为聚合酶并且所述置换可以包括用另一个残基置换所述聚合酶的不是不变或保守残基的任何氨基酸残基。本文中提供了关于聚合酶间保守或不变的氨基酸残基的进一步描述。
在一些实施方案中,所述修饰可以包括向蛋白中引入至少一个保守性置换,其中保留了至少一个特性(例如氨基酸的大小、形状或电荷)。“保守性氨基酸置换”是指可进行结构和/或功能相似的氨基酸的置换而不实质上改变蛋白的功能。保守性置换的实例是用下列组之一中的氨基酸交换同组中的另一个氨基酸(美国专利号5,767,063;Kyteand Doolittle,J.Mol.Biol.157:105-132(1982)):
(1)疏水性:正亮氨酸,Ile,Val,Leu,Phe,Cys,Met;
(2)中性亲水性:Cys,Ser,Thr;
(3)酸性:Asp;Glu;
(4)碱性:Asn,Gln,His,Lys,Arg;
(5)影响链取向的残基:Gly,Pro;
(6)芳香性:Trp;Tyr;Phe;
(7)小氨基酸:Gly,Ala,Ser。
例如,置换可以是下列,例如将Val变为Leu;将Ser变为Thr;或将Asp变为Glu。其它的置换也可被认为是保守的,这取决于特定氨基酸的环境以及其在蛋白的三维结构中的作用。例如,当希望改变氨基酸侧链的pKa而保留所述侧链的大小和结构时,可用Gln置换Glu,和用Asn置换Asp。
在一些实施方案中,被选择用于修饰(例如,用另一个氨基酸残基置换)的氨基酸残基选自:His,Glu,Asp,Cys,Lys和Tyr。在一些实施方案中,被选择用于修饰的氨基酸残基包括His和Glu残基。这些氨基酸残基通常具有约pH 6至约pH 8之间的pKa值(甚至在全蛋白情境中),并因此在标准生理条件和标准体外蛋白测定条件下具有高的缓冲能力。例如,在标准生理条件下(例如,约pH 6.0至约pH 9.0的pH条件),His通常具有约6.1-6.5的溶液pKa(即侧链pKa),而谷氨酰胺的为约4.1-4.5,半胱氨酸的为约8.0。用在标准蛋白测定条件下通常是非缓冲性的氨基酸残基置换这些残基在其中希望实现低缓冲条件(例如,基于离子的反应)的应用中可以是有利的。
在一些实施方案中,所述至少一个保守性氨基酸置换选自:His至Arg,Glu至Gln,Asp至Asn,Lys至Arg和Tyr至Phe。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸。在其中希望降低蛋白的缓冲能力的应用中,用丙氨酸残基置换或替代具有高缓冲能力的氨基酸残基可以是有利的。引入丙氨酸残基来代替高缓冲性残基可能降低蛋白的总体缓冲能力,因为丙氨酸残基通常是小的、其最少地干扰蛋白结构,并且通常在标准生理条件下(或标准体外蛋白测定条件下)具有低的缓冲能力,因为它们在生理pH下通常是不带电的。因此,丙氨酸残基不太可能在目的操作条件下具有显著的缓冲能力。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括氨基酸的缺失。在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个包括具有约4.0至约10.0之间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个是用另一个氨基酸残基缺失具有约6.0至约8.0范围内的pKa的氨基酸残基。在一些实施方案中,所述缺失的氨基酸是His,Glu,Asp,Tyr或Lys。
具有不希望的pKa的氨基酸残基也可经化学修饰以去除其可滴定基团的缓冲能力。这些修饰可包括,例如半胱氨酸巯基的酰化或烷基化、酪氨酸的酰化,通过使用酰胺键形成剂或通过活性酯或反应活性羰基中间体而衍生天冬氨酸或谷氨酸上的羧酸基团,组氨酸、赖氨酸、精氨酸的胺基或N末端胺基的酰化或烷基化,其中使用常规的试剂,例如Hermanson(Bioconj ugate technologys,Academic Press,London,2008)中公开的那些。可使用N-琥珀酰亚胺衍生的试剂来酰化N末端的胺,以附着醋酸基团、聚乙二醇基团、生物素等。
在一些实施方案中,在候选蛋白以所选择的方式被修饰之后,其可被合成,并就改变的缓冲能力被测试。例如,可通过如下完成对于在希望的范围内(例如pH 7-9)降低或增加的缓冲能力的测试:在已知量的候选蛋白上进行常规的pH滴定,并且确定希望的pH范围中滴定曲线的特征;即,在pH7-9的范围中,少量添加氢氧离子(或氢离子)应相应于所测量的pH的大的改变。
在一些实施方案中,可通过在基于离子的测序反应中比较经修饰的蛋白与参照蛋白(例如,缺少所述经修饰的蛋白的至少一个修饰的参照,或所述经修饰的蛋白的未经修饰的对应物,或所述经修饰的蛋白的野生型形式)的表现而评价所述缓冲能力。在一些实施方案中,可使用Ion Torrent PGMTM测序仪(Life Technologies)来进行基于离子的测序。在一些实施方案中,可根据与PGMTM测序仪一起提供的使用手册来进行测序。实施例7提供了使用Ion Torrent PGMTM测序仪来进行基于离子的测序的一个示例性方案,并且还描述了在测序反应中可被用于评价经修饰的蛋白的缓冲能力的一些测序表现度量。在一些实施方案中,可将50Q17读取的数相对于keypass读取的数进行作图,并且可将使用经修饰的蛋白和参照蛋白所获得的结果进行比较以确定所述经修饰的蛋白相对于参照蛋白是否具有改变的缓冲能力。在一些实施方案中,可将50Q17读取的数相对于keypass读取的数作图,并且可将使用经修饰的蛋白和参照蛋白所获得的结果进行比较以确定所述经修饰的蛋白相对于参照蛋白是否具有改变的缓冲能力。在一些实施方案中,可将carryforward的数相对于keypass读取的数作图,并且可将使用经修饰的蛋白和参照蛋白所获得的结果进行比较以确定所述经修饰的蛋白相对于参照蛋白是否具有改变的缓冲能力。
在一些实施方案中,测量和比较经修饰的蛋白与参照蛋白的表现可为就改变的缓冲能力筛选经修饰的蛋白提供有用的工具。例如,在一些实施方案中,本公开涉及就改变的缓冲能力筛选经修饰的蛋白的方法,所述方法包括:获得待修饰的候选蛋白;向所述候选蛋白中引入一个或多个修饰,从而产生经修饰的蛋白;在基于离子的测序反应中使用所述经修饰的蛋白并且根据第一参数在基于离子的测序系统中测量所述经修饰的蛋白的表现;根据所述第一参数在所述基于离子的测序系统中测量参照蛋白的表现;以及比较所述经修饰的蛋白与所述参照蛋白根据述第一参数在所述基于离子的测序系统中的表现,从而确定所述经修饰的蛋白相对于所述参照蛋白是否具有改变的缓冲能力。在一些实施方案中,所述参照蛋白是缺少所述经修饰的蛋白的至少一个修饰的蛋白。在一些实施方案中,所述参照蛋白是所述经修饰的蛋白的未经修饰的对应物。在一些实施方案中,所述参照蛋白是所述经修饰的蛋白野生型形式。在一些实施方案中,所述第一参数是从单一测序运行中获得的50Q17读取的总数。在一些实施方案中,所述第一参数是从单一测序运行中获得的100Q17读取的总数。在一些实施方案中,可将使用所述经修饰的蛋白和参照蛋白获得的50Q17读取或100Q17读取相对于keypass读取进行作图,并可将结果进行比较。
在一些实施方案中,所述经修饰的蛋白是聚合酶且所述参照蛋白是所述聚合酶的野生型形式,或者是所述聚合酶的未经修饰的对应物。
在一些实施方案中,所述经修饰的蛋白包含一个或多个在约pH 4至约pH 10、约pH 5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的化学氨基酸修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N-末端氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂修饰包含伯胺基团的氨基酸残基的化学修饰。在其它实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,所述一个或多个氨基酸置换、缺失或化学修饰中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述经修饰的蛋白的特征性活性为相应的野生型蛋白的至少约40%,50%,60%,70%,80%或90%。为了保留所述经修饰的蛋白的特征性活性,选择氨基酸置换、缺失或修饰的位点从而避免改变已知对于蛋白功能具有重要意义的残基(例如在蛋白家族的成员中高度保守的残基)或者已知的催化位点残基。
在各种实施方案中,所述经修饰的蛋白具有DNA或RNA结合活性。在各种实施方案中,所述蛋白选自DNA聚合酶,解旋酶,连接酶,核酸酶,单链DNA结合蛋白和聚合酶辅蛋白。这些经修饰的蛋白可包含氨基酸置换、缺失或化学修饰的任何组合。
在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至pH9的范围内实质上降低所述蛋白的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个是保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸,以及酪氨酸至苯丙氨酸。
在一些实施方案中,所述蛋白是DNA聚合酶。在一些实施方案中,本公开一般性地涉及分离的DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述DNA聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶是A家族DNA聚合酶,其选自:A家族DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶,和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶是B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为KOD聚合酶。在一些实施方案中,所述聚合酶为TherminatorTM聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,其包括例如,美国专利公开号20110014612及其优先权文件中所公开的变体。
在其它实施方案中,所述DNA聚合酶是混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列,和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶是未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶是RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶是HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶是Bst DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。如本文中所使用的,“Bst DNA聚合酶”可指全长蛋白或保留聚合酶和校正结构域而缺少5’至3’外切核酸酶结构域的Bst DNA聚合酶大片段。
在一些实施方案中,所述一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。表2和3显示了Bst DNA聚合酶内氨基酸的经计算的pKa。栏1显示了氨基酸残基,其中编号是基于SEQ ID NO:1的编号;栏2显示的是侧链的经计算的pKa;而栏3指示的是氨基酸残基在蛋白的表面上(S)还是被包埋的(B)。表2中显示的值是使用PropKa确定的,而表3中的值是使用H++确定的。在一些实施方案中,所述一个或多个保守性氨基酸置换是具有约4.0至约10.0的pKa的氨基酸残基,如通过所述两种算法所确定的。
在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述Bst DNA聚合酶包含一个或多个保守性氨基酸置换,其中所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸残基。在一些实施方案中,所述Bst DNA聚合酶包括置换H528A。
在一些实施方案中,本公开一般性地涉及分离的Bst DNA聚合酶,其包含选自下列的氨基酸序列:SEQ ID NO:2,SEQ ID NO:3和SEQID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体。这些氨基酸序列的起始的甲硫氨酸残基不是源自天然的Bst聚合酶,而是存在以促进大片段的产生。因此,在一些实施方案中,分离的Bst聚合酶包含下列任一个的氨基酸序列:SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或如本文中所描述的任何变体,其中所述蛋白缺少N末端甲硫氨酸残基。
在一些实施方案中,所述BstDNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ IDNO:2中所示的氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,本公开一般性地涉及Bst DNA聚合酶,其包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:3中所示的氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,本公开一般性地涉及Bst DNA聚合酶,其包含SEQ ID NO:4的氨基酸序列。在其它实施方案中,本公开一般性地涉及包含SEQ ID NO:4中所示的氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含一个或多个如上文所述的氨基酸置换、缺失或突变。在一些实施方案中,所述TherminatorTM DNA聚合酶包含一个或多个保守性氨基酸置换,其在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换是表5中所示的一个或多个氨基酸残基。表5显示了使用PropKa所确定的、TherminatorTM DNA聚合酶中的氨基酸的经计算的pKa。栏1显示了氨基酸残基,其中编号是基于SEQ ID NO:5的编号;而栏2显示了侧链的经计算的pKa。
在一些实施方案中,所述DNA聚合酶是KOD DNA聚合酶,其包含一个或多个如上文所述的氨基酸置换、缺失或突变。在一些实施方案中,所述KOD DNA聚合酶包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表6中所示的一个或多个氨基酸残基。表6显示了如使用PropKa所确定的、KODDNA聚合酶中的氨基酸的经计算的pKa。栏1显示了氨基酸残基,其中编号是基于SEQ ID NO:6的编号;而栏2显示了侧链的经计算的pKa。任选地,所述KOD聚合酶包括降低所述蛋白的外切核酸酶活性(例如,3’->5’外切核酸酶活性)的一个或多个突变。
在一些实施方案中,所述DNA聚合酶是B103DNA聚合酶,其包含一个或多个如上文所述的氨基酸置换、缺失或突变。B103DNA聚合酶可包括任何变体B103聚合酶,或其生物学活性片段,如美国专利公开号20110014612中所公开的,在此将其通过引用而并入。
在一些实施方案中,所述B103聚合酶具有SEQ ID NO:7的氨基酸序列,其进一步包括在位置383和384处的氨基酸置换,其中所述编号是相对于SEQ ID NO:7的氨基酸序列。在一些实施方案中,所述聚合酶包含氨基酸置换F383L和D384N,其中编号是相对于SEQ IDNO:7的氨基酸序列。
在一些实施方案中,所述B103聚合酶具有SEQ ID NO:8的氨基酸序列。
1   mprkmfscdf etttklddcr vwaygymeig nldnykigns ldefmqwvme iqadiyfhnl
61  kfdgafivnw lehhgfkwsn eglpntypti  iskmgqwymi dicfgykgkr klhtviydsl
121 kklpfpvkki akdfglpllk gdidyhaerp vgheitpeey eyikndieii araldigfkg
181 gldnmtagsd slkgfkdils tkkfnkvfpk lslpmdkeir rayrggftwl ndkykekeig
241 egmvfdvnsl ypsqmysrpl pygapivfgg kyekdeqypl yiqrirfefe lkegyiptig
301 ikknpffkgn eylknsgaep velyltnvdl eligenyemy nveyidgfkf rektglfkef
361 idkwtyvkth ekgakkglak imfdslygkf asnpdvtgkv pylkedgslg frvgdeeykd
421 pvytpmgvfi tawarfttit aagacydrii ycdtdsihlt gtevpaiikd ivdpkklgyw
481 ahestfkrsk ylrgktyigd iyakevdgkl iecspdestt tkfevkcagm tdtikkkvtf
541 dnfrvgfsst gkpkpvqvng gvvlvdsvft ik
(SEQ ID NO:8)
在一些实施方案中,所述B103聚合酶包含与SEQ ID NO:8的氨基酸序列或者其任何生物学活性片段至少80%,85%,90%,95%,97%,98%或99%同一的氨基酸序列。通常,相对于具有SEQ ID NO:7的氨基酸序列的聚合酶。具有SEQ ID NO:8的氨基酸序列的聚合酶将显示出增加的聚合酶活性(例如,引物延伸活性)。
在一些实施方案中,B103型聚合酶包含一个或多个修饰,其与参照聚合酶相比,产生改变的外切核酸酶活性(例如3’至5’外切核酸酶活性)。在一些实施方案中,所述修饰包括氨基酸置换,例如氨基酸置换D166A。在一些实施方案中,所述经修饰的B103型聚合酶缺少3’至5’外切核酸酶活性,或缺少5’至3’外切核酸酶活性,或二者均缺少。降低或消除3’至5’外切核酸酶活性的突变已被描述,例如Phi-29聚合酶中各残基处的突变。见例如de Vega等人,EMBO J.,15(5):1182-1192(1996);Soengas等人,EMBO J.,11(11):4227-4237(1992);Blanco等人,美国专利号5,001,050,5,198,543和5,576,204。
在一些实施方案中,所述B103聚合酶包含与氨基酸序列SEQ IDNO:7,SEQ ID NO:8和SEQ ID NO:9中的任一个、或者与它们的任何生物学活性片段至少70%,75%,85%,90%,95%或99%同一的氨基酸序列,并且还在选自下列的一个或多个位置包括一个或多个氨基酸置换、添加或缺失:2,9,11,12,58,59,63,162,166,377和385,其中所述编号是相对于SEQ ID NO:7的编号。在一些实施方案中,此聚合酶相对于未经修饰的对应物可显示出降低的外切核酸酶活性。
在一些实施方案中,所述B103聚合酶包含与氨基酸序列SEQ IDNO:7或SEQ ID NO:8中的任一个或其任何生物学活性片段至少70%,75%,85%,90%,95%或99%同一的氨基酸序列,并且还包括氨基酸突变D166A,其中所述编号是相对于SEQ ID NO:7的编号。在一些实施方案中,此经修饰的聚合酶相对于具有SEQ ID NO:7的氨基酸序列的参照聚合酶可显示出降低的3’至5’外切核酸酶活性。
在一些实施方案中,所述B103DNA聚合酶包含与氨基酸序列SEQ ID NO:7,SEQ ID NO:8和SEQ ID NO:9中的任一个、或者与它们的任何生物学活性片段至少70%,75%,85%,90%,95%或99%同一的氨基酸序列,并且还包括选自下列的一个或多个氨基酸置换:D9A,E11A,E11I,T12I,H58R,N59D,D63A,Y162F,Y162C,D166A,Q377A和S385G,其中所述编号是相对于SEQ ID NO:7的编号。在一些实施方案中,此经修饰的聚合酶相对于未经修饰的对应物可显示出降低的外切核酸酶活性。
在一些实施方案中,所述B103DNA聚合酶包含与氨基酸序列SEQ ID NO:7,SEQ ID NO:8和SEQ ID NO:9中的任一个、或者与它们的任何生物学活性片段至少70%,75%,85%,90%,95%或99%同一的氨基酸序列,并且还包括选自下列的一个或多个氨基酸置换:D9A,E11A,E11I,T12I,H58R,N59D,D63A,Y162F,Y162C,Q377A和S385G,其中所述编号是相对于SEQ ID NO:7的编号。通常,此经修饰的聚合酶相对于未经修饰的对应物可显示出降低的3’至5’外切核酸酶活性。
在一些实施方案中,所述B103DNA聚合酶包含与氨基酸序列SEQ ID NO:7至少85%,90%,95%或99%同一的氨基酸序列,并且还包括氨基酸置换,其中位置9的氨基酸残基被丙氨酸(“A”)残基替代,其中所述编号是相对于SEQ ID NO:7的氨基酸序列的编号。
在一些实施方案中,所述B103DNA聚合酶包含与氨基酸序列SEQ ID NO:7至少85%,90%,95%或99%同一的氨基酸序列,并且还包括一个或多个下列氨基酸置换:D9A,E11A,T12I,H58R,N59D,D63A,D166A,Q377A,S385G,或者它们的任意组合,其中所述编号是相对于SEQ ID NO:7的氨基酸序列的编号。在一些实施方案中,所述B103DNA聚合酶包含这些突变中的任何一个、两个、三个、四个、五个或全部。在一些实施方案中,所述B103DNA聚合酶包含氨基酸置换D9A和D63A。在一些实施方案中,所述B103DNA聚合酶包含氨基酸置换N59D和T12I。通常,相对于未经修饰的对应物,此聚合酶将显示出降低的3’至5’外切核酸酶活性。
在一些实施方案中,所述B103DNA聚合酶包含与SEQ ID NO:8的氨基酸序列至少85%,90%,95%或99%同一的氨基酸序列,并且包含本文所述的突变中的任何一个、两个、三个或更多个。
任选地,所述降低3’至5’外切核酸酶活性的修饰可与其它增加聚合酶活性的修饰相结合。增加聚合酶活性的修饰包括,例如,氨基酸置换F383L和D384N。
在一些实施方案中,所述B103DNA聚合酶包括SEQ ID NO:7的氨基酸序列并且还包括氨基酸置换D166A(其降低3’至5’外切核酸酶活性),其与氨基酸置换F383L和D384N相结合(相对于具有SEQID NO:8的氨基酸序列的未经修饰的蛋白,其增加经置换的聚合酶的聚合酶活性)。此三重突变体聚合酶的氨基酸序列是SEQ ID NO:9的氨基酸序列,如下:
1   mprkmfscdf etttklddcr vwaygymeig nldnykigns ldefmqwvme iqadlyfhpi
61  kfdgafivnw lehhgfkwsn eqlpntvnti iskmgqwymi dicfgykgkr klhtviydsl
121 kklpfpvkki akdfqlpllk gdidyhaerp vgheitpeey eyiknaieii araldigfkq
181 gldrmtagsd slkgfkdils tkkfnkvfpk lslpmdkeir rayrggftwl ndkykekeig
241 eqmvfdvnsl vpsqmysrpl pygapivfgg kyekdeqypl yigrirfefe lkegyiptiq
301 ikknpffkgn eylknsgaep velyltnvdl eligehyemy nveyidgfkf rektglfkef
361 idkwtyvkth ekgakkglak lmlnslygkf asnpdvtgkv pylkedgslg frvgdeeykd
421 pvytpmgvfi tawarfttit aagacydrii ycdtdsihlt gtevpeiikd ivdpkklgyw
481 ahestfkrak ylrgktyiqd iyakevdgkl iecspdeatt tkfsvkcagm tdtikkkvtf
541 dnfrvgfsst gkpkpvgvng gvvlvdsvft ik
(SEQ ID NO:9)
在一些实施方案中,所述经修饰的聚合酶包含与SEQ ID NO:9的氨基酸序列或其任何生物学活性片段至少70%,75%,80%,85%,90%,95%,97%,98%或99%同一的氨基酸序列。通常,相对于包含SEQ ID NO:7或SEQ ID NO:8的氨基酸序列的参照聚合酶,SEQID NO:9的经修饰的聚合酶将显示出降低的外切核酸酶活性。
在一些实施方案中,本公开一般性地涉及B103DNA聚合酶,其包括上文所述的任何变体,其中所述B103DNA聚合酶包括在约pH 7至约pH 9的范围内相对于相应的未经修饰的蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表7中所示的一个或多个氨基酸残基。表7显示了使用PropKa所确定的、TherminatorTM DNA聚合酶中的氨基酸的经计算的pKa。栏1显示了氨基酸残基,其中的编号是基于SEQ ID NO:7的编号;而栏2显示了侧链的经计算的pKa。
在一些实施方案中,所述经修饰的聚合酶保留聚合酶活性。在各种实施方案中,经修饰的DNA聚合酶的聚合酶活性是相应野生型蛋白的活性的至少约40%,50%,60%,70%,80%或90%。如本文中所使用的,当用于指称给定的聚合酶时,术语“聚合酶活性”及其变体包括给定的聚合酶的特征性的任何体内或体外酶促活性,其涉及催化将核苷酸聚合到核酸链中,例如核苷酸掺入活性(通常是在引物延伸测定中作为引物延伸活性测量的)等。通常但非必然地,此种核苷酸聚合以模板依赖性的方式发生。除了这种聚合酶活性之外,所述聚合酶通常可具有其它酶促活性,例如,3’至5’外切核酸酶活性,5’至3’外切核酸酶活性等。
在一些实施方案中,所述聚合酶所显示的核苷酸掺入活性(或引物延伸活性)的量可被定量为在特定的反应条件下,由单位量的聚合酶(以摩尔计)每单位时间(秒)所掺入的核苷酸的总数(如通过,例如放射性测量或其它合适的测定法所测定)。可使用任何合适的测定法来测量所述核苷酸掺入活性(或引物延伸活性),所述任何合适的测定法提供使用限定的反应条件(包括已知浓度的聚合酶)而获得的延伸产物的量的定量指示。无论使用何种测定法,当使用相同的反应条件获得时,可简单地通过比较从每种样品获得的所观察到的核苷酸掺入活性(或引物延伸活性)的水平而评估两种样品间核苷酸掺入活性(或引物延伸活性)的差异。任选地,可如下就聚合酶的量对所观察到的核苷酸掺入活性(或引物延伸活性)进行归一化以允许比较含有不同聚合酶浓度的反应:用所掺入的放射活性的量除以反应混合物中的聚合酶浓度。
在一个示例性的实施方案中,可使用放射性测量测定法来测量聚合酶的核苷酸掺入活性(或引物延伸活性),所述放射性测量测定法测量在聚合酶反应中,经放射活性标记的核苷酸向酸不可溶性材料中的掺入。所掺入的放射活性的量指示所掺入的核苷酸的总数目。见,例如Wu等人,Gene Biotechnology,2nd Ed.,CRC Press;Sambrook,J.,Fritsch,EF,以及Maniatis,T.(1989)Molecular Cloning ALaboratory Manual,2nd ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY。
在另一个示例性实施方案中,可通过监测在经荧光素标记的发夹寡核苷酸的延伸过程中荧光强度随时间的变化来测量样品中的核苷酸掺入活性(或引物延伸活性)的水平。
在另一个示例性实施方案中,可通过在标准耐受测定条件下进行核苷酸掺入(例如,引物延伸)5分钟之后所释放的焦磷酸的量来定量给定聚合酶的核苷酸掺入活性(或引物延伸活性)。
可在例如下列中找到此类聚合酶活性测定法的各种实例,美国申请系列号12/748359,现在作为美国公开号20110014612公布。
为了保留所述经修饰的蛋白的特征活性,选择氨基酸置换、缺失或化学修饰的位点以避免改变已知对于蛋白功能具有重要意义的残基,例如在所述经修饰的蛋白所属的DNA聚合酶特定家族的成员中高度保守的残基,或者参与聚合酶活性的已知催化性位点残基。
在一些实施方案中,保留聚合酶活性的所述经修饰的聚合酶为B103DNA聚合酶。在上文中已详细描述了影响B103DNA聚合酶的聚合酶活性或外切活性的氨基酸残基。
在一些实施方案中,保留聚合酶活性的所述经修饰的聚合酶为BstDNA聚合酶。所述Bst DNA聚合酶蛋白的大片段的氨基酸序列显示在SEQ ID NO:1中:
MAKMAFTLAD RVTEEMLADK AALVVEVVEE NYHDAPIVGI AVVNEHGRFF
LRPETALADP 60
QFVAWLGDET KKKSMFDSKR AAVALKWKGI ELCGVSFDLL LAAYLLDPAQ
GVDDVAAAAK 120
MKQYEAVRPD EAVYGKGAKR AVPDEPVLAE ALVRKAAAIW ELERPFLDFL
RRNEQDRLLV 180
ELEQPLSSIL AEMEFAGVKV DTKRLEQMGK ELAEQLGTVE QRIYELAGQE
FNINSPKQLG 240
VILFEKLQLP VLKKTKTGYS TSADVLEKLA PYHEIVENIL HYRQLGKLQS
TYIEGLLKVV 300
RPDTKKVHTI FNQALTQTGR LSSTEPNLQN IPIRLEEGRK IRQAFVPSES
DWLIFAADYS S360
QIELRVLABI AEDDNLMEAF RRDLDIHTKT AMDIFQVSED EVTPNMRRQA
KAVNFGIVYG 420
ISDYGLAQNL NISRKEAAEF IERYFESFPG VKRYMENIVQ EAKQKGYVTT
LLHRRRYLPD 480
ITSRNFNVRS FAERMAMNTP IQGSAADIIK KAMIDLNARL KEERLQAHLL
LQVBDELILE 540
APKEEMERLC BLVPEVMEQA VTLRVPLKVD YHYGSTWYDA K
SEQ ID NO:1分别在残基358-363,411-420和533-536处含有DNA聚合酶基序A,B和C(Delahue,见上),如图1中所示。所述基序是加下划线的和突出显示的,并且以粗体显示每个基序中不变的残基。因此,为了保留经修饰的Bst聚合酶的聚合酶活性,将对基序A,B或C中不是高度保守的氨基酸残基进行任何置换、缺失或化学修饰,例如聚合酶活性所需的不变的天冬氨酸残基D358和D535。
在一些实施方案中,所述经修饰的Bst DNA聚合酶保留校正外切核酸酶活性。在各种实施方案中,经修饰的Bst DNA聚合酶的所述校正外切核酸酶活性为相应的野生型蛋白的至少约40%,50%,60%,70%,80%或90%。为了保留经修饰的Bst DNA聚合酶的校正外切核酸酶活性,本领域技术人员将理解,任何置换、缺失或化学修饰都应对在Exo I、Exo II和Exo III基序中不是高度保守的氨基酸残基进行。
在一些实施方案中,本公开一般性地涉及包含一个或多个氨基酸置换、缺失或化学修饰的分离的蛋白,所述氨基酸置换、缺失或化学修饰在约pH 4至约pH 10的范围内,相对于相应的野生型蛋白降低所述蛋白的缓冲能力,其中相对于从使用相应的野生型(未修饰的)蛋白的基于离子的测序反应获得的测序错误的数目,所述一个或多个氨基酸置换、缺失或化学修饰实质上减少从使用所述经修饰的蛋白的基于离子的测序反应获得的测序错误的平均数目。
测序错误率将部分地取决于在所述测序反应中所使用的聚合酶的保真性。聚合酶的保真性部分地取决于所述聚合酶掺入不正确的核苷酸的趋势,以及整体3’至5’外切核酸酶活性的存在,所述整体3’至5’外切核酸酶活性可通过切除误掺入的核苷酸而增加保真性。已知DNA聚合酶基序A中的保守性残基(对于家族A成员是E,而对于家族B成员为Y)以及与此保守性残基相互作用的残基在正确核苷酸的掺入中起重要作用(Parsell,见上;Minnick,见上)。参与3’至5’外切核酸酶活性的保守基序也是已知的,如上文所讨论的。本领域中还已知,一些聚合酶相对于其它聚合酶具有改善的保真性。可通过检查聚合酶中的相关基序或与具有改善的保真性的聚合酶进行比较而确定可能在核苷酸掺入或3’至5’外切核酸酶活性中起作用的残基。因此,在一些实施方案中,本公开一般性地涉及经修饰的DNA聚合酶,其中所述聚合酶的一个或多个修饰影响核苷酸掺入或3’至5’外切核酸酶活性。
在一些实施方案中,本公开一般性地涉及分离的蛋白,其包含与相应的野生型蛋白相比在约pH 4至约pH 10的范围内降低所述蛋白的缓冲能力的一个或多个氨基酸置换、缺失或化学修饰,其中相对于从使用相应的野生型(未经修饰的)蛋白的基于离子的测序反应获得的具有90%准确率的测序读取的平均长度,所述一个或多个氨基酸置换、缺失或化学修饰增加从使用所述经修饰的蛋白的基于离子的测序反应获得的具有至少90%准确率的测序读取的平均长度。
测序读取的长度部分地取决于测序反应中所使用的聚合酶的持续合成性。聚合酶的持续合成性是每次与模板附着/分离时由聚合酶加入的核苷酸的平均数目的量度。
本领域中已知,某些聚合酶相对于其它聚合酶具有改善的持续合成性。可通过与具有改善的持续合成性的聚合酶进行比较来确定可能在持续合成性中起作用的残基。因此,在一些实施方案中,本公开一般性地涉及经修饰的DNA聚合酶,其中对于聚合酶进行的一种或多种修饰影响持续合成性。
本领域中还已知,辅助蛋白(包括例如,滑动钳蛋白或单链DNA结合蛋白(SSB))能够改善DNA聚合酶的持续合成性。SSB在本领域中也被用于改善DNA聚合酶的保真性。因此,在一些实施方案中,本公开一般性地涉及经修饰的辅助蛋白或SSB,其中与未经修饰的辅助蛋白或SSB相比,所述经修饰的蛋白对于在测序反应中使用的聚合酶的持续合成性和/或保真性提供增加的改善。
在一些实施方案中,所述包含一个或多个在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的氨基酸置换的分离的蛋白是单链DNA结合蛋白(SSB)。
在一些实施方案中,所述SSB包含在pH 7至pH 9的范围内实质上降低其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述一个或多个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸,以及酪氨酸至苯丙氨酸。在一些实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,所述一个或多个保守性氨基酸置换为表4中所示的一个或多个氨基酸残基。表2和3显示了大肠杆菌SSB中的氨基酸的经计算的pKa。栏1显示了氨基酸残基,其中编号是基于SEQ ID NO:1的编号;栏2显示了侧链的经计算的pKa。在一些实施方案中,所述SSB包含氨基酸置换K7R。
在一些实施方案中,本文中所描述的任意分离的蛋白进一步包括亲和标签,标记物,化学部分,放射性核素,酶,荧光标记,化学发光标记物,或它们的组合。
在一些实施方案中,所述分离的蛋白与下列相偶联:聚合物,支持物或传感器。所述聚合物可包括,例如聚乙二醇,PEA,右旋糖酐,丙烯酰胺或纤维素(例如,甲基纤维素)。所述支持物可包括,例如珠子或其它固体表面,例如反应室、微孔或传感器的表面。所述传感器可包括,例如FET。在一些实施方案中,所述传感器为chemFET。在一些实施方案中,所述传感器为ISFET。
在一些实施方案中,本公开一般性地涉及用于向引物中掺入至少一个核苷酸的方法,所述方法包括:在一个或多个核苷酸的存在下,使包括模板核酸和引物的核酸双链与根据本公开的经修饰的聚合酶相接触,以及使用所述聚合酶,以模板依赖性的方式向所述引物中掺入至少一个核苷酸。所述经修饰的聚合酶可以是具有任何上文所公开的修饰的任何聚合酶,所述修饰包括一个或多个氨基酸置换、缺失和化学修饰。
在所述方法的某些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内,相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9或约pH 6至约pH 8的范围内相对于相应的野生型聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至pH9的范围内实质上降低所述聚合酶的缓冲能力。在实施方案中,所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在所述方法的各种实施方案中,所述DNA聚合酶选自:A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶是A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶以及Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自:Bst聚合酶,Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,TherminatorTM聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为KOD聚合酶。在一些实施方案中,所述聚合酶为TherminatorTM聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶源自噬菌体B103聚合酶,其中包括例如,美国专利公开号20110014612中所公开的变体,将其在此通过引用而并入。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在一些实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在所述方法的某些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表2或表3中所显示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述Bst DNA聚合酶包含一个或多个保守性氨基酸置换,其中所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在所述方法的一些实施方案中,所述聚合酶是Bst DNA聚合酶,其包含选自下列的氨基酸序列:SEQ ID NO:2,SEQ ID NO:3和SEQID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:2中所示的氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ IDNO:2至少95%同一的氨基酸序列。
在所述方法的某些实施方案中,所述聚合酶为Bst DNA聚合酶,其包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:3中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:3至少95%同一的氨基酸序列。
在所述方法的某些实施方案中,所述聚合酶是Bst DNA聚合酶,其包含SEQ ID NO:4的氨基酸序列。在其它实施方案中,本公开一般性地涉及包含SEQ ID NO:4中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:4至少95%同一的氨基酸序列。
在所述方法的其它实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
可以各种方式合成候选经修饰的蛋白,所述方式包括通过分子克隆和表达的方式,或通过化学合成的方式。可通过天然的化学连接来进行此类蛋白的化学合成,如Dawson等人(Science 266:776-779(1994));Hakeng等人(Proc.Natl.Acad.Sci.USA 94:7845-7850(1997));Hakeng等人(Proc.Natl.Acad.Sci.USA 96:10068-10073(1999));和Kent等人,美国专利号6,184,344中所描述的,将它们在此通过引用而并入。
也可通过重组技术产生所述经修饰的蛋白。在一些实施方案中,本公开一般性地涉及编码经修饰的蛋白的重组DNA或RNA分子,这包括但不限于噬菌体,质粒,噬菌粒,粘粒,YAC,BAC,以及本领域中熟知的各种病毒和非病毒载体,以及用这些重组DNA或RNA分子转化或转染的细胞。用于产生此类分子的方法是熟知的(见例如,Sambrook等人,Molecular Cloning:A Laboratory Manual 3rd.edition(2001)Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y)。
在一些实施方案中,本公开一般性地涉及宿主-载体系统,其在合适的原核或真核宿主细胞中包含含有编码经修饰的蛋白的序列的重组DNA分子。合适的真核宿主细胞的实例包括酵母细胞,植物细胞,或动物细胞,例如哺乳动物细胞或昆虫细胞(例如,可被杆状病毒感染的细胞,如Sf9或HighFive细胞)。利用本领域中常规使用且广泛已知的任何数目的宿主-载体系统,包含编码非缓冲性蛋白的序列的多核苷酸可被用于产生经修饰的蛋白。
本公开一般性地涉及分离的核酸,其与编码本文所公开的任何经修饰的蛋白的核酸至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一。
可使用标准重组技术获得编码所述经修饰的蛋白的多核苷酸序列。备选地,可使用核苷酸合成仪或PCR技术来合成多核苷酸。一旦获得,将编码所述经修饰的蛋白的序列插入能够在原核宿主中复制和表达异源多核苷酸的重组载体中。可使用许多本领域中可获得和已知的载体。选择适当的载体将主要取决于待插入载体中的核酸的大小和待用所述载体转化的特定宿主细胞。每个载体含有各种组分,这取决于其功能(扩增或表达异源多核苷酸,或二者皆有)以及与其所在的特定宿主细胞的相容性。载体组分通常包括但不限于:复制起点,选择标记物基因,启动子,核糖体结合位点(RBS),信号序列,异源核酸插入和转录终止序列。
一般地,含有复制子和源自与宿主细胞相容的物种的控制序列的质粒载体与这些宿主一起使用。所述载体一般带有复制位点,以及能够在经转化的细胞中提供表型选择的标记序列。例如,通常使用pBR322转化大肠杆菌,所述pBR322源自大肠杆菌物种。pBR322含有编码氨苄西林(Amp)和四环素(Tet)抗性的基因并因此提供用于鉴别经转化的细胞的容易的工具。pBR322、其衍生物或其它微生物质粒或细菌噬菌体也可含有、或经修饰以含有可被微生物利用来表达内源性蛋白的启动子。用于表达特定抗体的pBR322衍生物的实例被详细描述在Carter等人,美国专利号5,648,237中。
此外,可与宿主一起使用含有与这些宿主微生物相容的复制子和控制序列的噬菌体载体作为转化载体。例如,细菌噬菌体(如λGEM.TM.-11)可用于制造重组载体,所述重组载体可被用于转化易感的宿主细胞,例如大肠杆菌LE392。
表达载体可包含两个或更多个启动子-顺反子对,其编码多肽组分中的每一个。启动子是位于调节其表达的顺反子上游(5')的非翻译调控序列。原核启动子通常落在两类中,可诱导的和组成的。可诱导的启动子是响应于培养条件中的变化(例如,存在或缺少营养物或温度的改变)而引发其控制之下的顺反子的转录水平增加的启动子。
被各种潜在宿主细胞所识别的许多启动子是熟知的。可通过经由限制性酶消化从源DNA中移除启动子和将分离的启动子序列插入载体中而使所选择的启动子与编码轻链或重链的顺反子DNA可操作地相连。可使用天然的启动子序列和许多异源启动子来指导靶基因的复制和/或表达。在一些实施方案中,利用了异源启动子,因为与天然的靶多肽启动子相比,它们通常允许所表达的靶基因的更多的转录和更高的产率。
适于与原核宿主一起使用的启动子包括PhoA启动子,β-半乳聚糖酶和乳糖启动子系统,色氨酸(trp)启动子系统和杂合启动子,例如tac或trc启动子。然而,在细菌中起作用的其它启动子(例如其他已知的细菌或噬菌体启动子)也是适合的。它们的核苷酸序列已被发表,从而允许本领域技术人员将它们与编码靶轻链和重链的顺反子可操作地连接(Siebenlist等人(1980)Cell 20:269),其中使用连接子或适配子来提供任何所需的限制性位点。
在一些实施方案中,所述重组载体中的每个顺反子都包含分泌信号序列组分,其指导经表达的多肽的跨膜易位。一般地,此信号序列可以是所述载体的组分,或者其可以是被插入所述载体中的靶多肽DNA的天然的部分。所选择的信号序列应该是被宿主细胞识别和加工(即被信号肽酶切割的)的序列,对于不识别和加工所述异源多肽的天然信号序列的原核宿主细胞,此信号序列被所选择的原核信号序列置换,例如,所述原核信号序列选自:碱性磷酸酶、青霉素酶、Ipp或热稳定的内毒素II(STII)前导子,LamB,PhoE,PelB,OmpA和MBP。在一些实施方案中,在表达系统的两个顺反子中使用的信号序列是STII信号序列或其变体。
在一些实施方案中,经修饰的蛋白的产生能够在宿主细胞的细胞质中发生,并因此不需要在每个顺反子中存在分泌信号序列。某些宿主株系(例如,大肠杆菌trxB-菌株)提供有利于二硫键形成的细胞质条件,从而允许所表达的蛋白亚基的适当折叠和组装(Proba andPluckthun Gene,159:203(1995))。
适于表达经修饰的蛋白的原核宿主细胞包括古细菌和真细菌,例如革兰氏阴性或革兰氏阳性生物体。有用的细菌的实例包括肠杆菌(例如,大肠杆菌),杆菌(例如,芽孢杆菌),肠细菌,假单胞菌种(例如,铜绿假单胞菌),鼠伤寒沙门氏菌,粘质沙雷氏菌,克雷伯氏菌,变形杆菌,志贺氏菌,根瘤菌,透明颤菌或副球菌。在一些实施方案中,使用了革兰氏阴性细胞。在一些实施方案中,使用大肠杆菌细胞作为宿主。大肠杆菌株的实例包括菌株W3110(Bachmann,Cellular andMolecular Biology,vol.2(Washington,D.C.:American Society forMicrobiology,1987),pp.1190-1219;ATCC保藏号27,325)及其衍生物,这包括:菌株33D3,其具有基因型W3110ΔfhuA(ΔtonA)ptr3lacIq lacL8ΔompTΔ(nmpc-fepE)degP41kanR(美国专利号5,639,635)。其它的菌株及其衍生物(例如大肠杆菌294(ATCC 31,446),大肠杆菌B,大肠杆菌λ1776(ATCC 31,537)和大肠杆菌RV308(ATCC 31,608)也是适合的。这些实例是阐释性的而非限制性的。用于构建具有确定的基因型的任何上述细菌的衍生物的方法是本领域中已知的并且在例如Bass等人,Proteins,8:309-314(1990)中被描述。通常需要选择适当的细菌,其中考虑到复制子在细菌细胞中的可复制性。例如,当使用熟知的质粒(例如pBR322,pBR325,pACYC177或pKN410)来提供复制子时,大肠杆菌,沙雷氏菌或沙门氏菌种可被适合地用作宿主。通常而言,宿主细胞应分泌最小量的蛋白分解性酶,且理想地,细胞培养物中可以掺入额外的蛋白酶抑制剂。
用上述表达载体转化宿主细胞并将其培养在常规的营养介质中,所述营养介质经适当修饰而用于诱导启动子,选择转化体,或扩增编码所需序列的基因。
转化是指将DNA引入原核宿主中,从而DNA是可复制的,其作为染色体外元件或通过染色体整合而复制。取决于所使用的宿主细胞,使用适合此类细胞的标准技术来进行转化。通常使用采用氯化钙的钙处理用于含有大量细胞壁屏障的细菌细胞。转化的另一种方法采用聚乙二醇/DMSO。而所使用的另一种技术是电穿孔。
用于产生根据本公开的多肽的原核细胞能够在任何合适的介质中生长,这包括本领域中已知且适于培养所选择的宿主细胞的介质。合适的介质的实例包括加上了所需营养补充的luria肉汤培养基(LB)。在一些实施方案中,所述介质还含有选择试剂(基于表达载体的构建而选择),用于选择性地允许含有表达载体的原核细胞的生长。例如,将氨苄西林加入介质中用于表达氨苄西林抗性基因的细胞的生长。
还可以适当的浓度包括除碳、氮和无机磷酸源之外的任何必需的补充物,可将其单独地或作为与另一种补充剂或介质的混合物(例如复合氮源)引入。任选地,所述培养介质可含有一种或多种还原剂,其选自谷胱甘肽,半胱氨酸,胱胺,巯基乙醇酸,二硫赤藓糖醇和二硫苏糖醇。
在合适的温度下培养原核宿主细胞。在某些实施方案中,对于大肠杆菌生长,生长温度范围为约20°C至约39°C;约25°C至约37°C;或约30°C。介质的pH可以是约5至约9范围中的任何pH,主要取决于宿主生物体。在某些实施方案中,对于大肠杆菌,pH为约6.8至约7.4,或约7.0。
如果在表达载体中使用可诱导的启动子,则在适于启动子活化的条件下诱导蛋白表达。在一些实施方案中,使用PhoA启动子来控制多肽的转录。因此,在磷酸限制性介质中培养经转化的宿主细胞用于诱导。在某些实施方案中,所述磷酸限制性介质是C.R.A.P.介质(见,例如Simmons等人,J.Immunol.Methods(2002),263:133-147)。根据所采用的载体构建体,可使用各种其它的诱导剂,如本领域中已知的。
在一些实施方案中,经表达的多肽被分泌到宿主细胞的周质中并从所述周质中回收。蛋白回收通常涉及破坏所述微生物,这通常是通过例如下述手段:渗透压冲击,超声或裂解。一旦细胞被破坏,可通过离心或过滤而回收细胞碎片或全细胞。可进一步纯化所述蛋白,例如通过亲和树脂层析。备选地,可将蛋白转运到培养介质中并在那里进行分离。可从培养物中移除细胞并将培养物上清液进行过滤和离心用于所产生的蛋白的进一步纯化。可使用普遍已知的方法(例如聚丙烯酰胺凝胶电泳(PAGE)和蛋白质印迹测定)来进一步分离和鉴别所表达的多肽。
在一些实施方案中,通过发酵过程大量进行经修饰的蛋白的生产。可获得各种大规模补料批次发酵程序用于重组蛋白的生产。大规模发酵具有至少1000升的容量,在某些实施方案中,具有约1,000至100,000升的容量。这些发酵器使用搅拌叶轮来分布氧和营养物,特别是葡萄糖(优选的碳/能量源)。小规模发酵一般是指在不超过约100升体积容量(范围可为约1升至约100升)的发酵器中进行的发酵。
在发酵过程中,诱导蛋白表达通常是在细胞已经在适当的条件下生长到所需的密度(例如,OD550为约180-220时,在这一阶段细胞处于早期稳定期)后引发的。根据所采用的载体构建体,可使用各种诱导剂,如本领域中已知的以及上文所描述的。可在诱导前使细胞生长较短的时间段。通常,细胞被诱导约12-50小时,虽然可使用更长或更短的诱导时间。
为了改善蛋白的产量和质量,可适当地修饰各种发酵条件。例如,为了改善分泌的经修饰的蛋白的正确组装和折叠,可使用过表达分子伴侣蛋白(例如Dsb蛋白(DsbA,DsbB,DsbC,DsbD和或DsbG)或FkpA(具有分子伴侣活性的肽酰脯氨酰顺、反-异构酶))的另外的载体来共转化宿主原核细胞。已显示所述分子伴侣蛋白促进在细菌宿主细胞中产生的异源蛋白的正确折叠和溶解性(Chen等人(1999)J.Biol.Chem.274:19601-19605;Georgiou等人,美国专利号6,083,715;Georgiou等人,美国专利号6,027,888;Bothmann and Pluckthun(2000)J.Biol.Chem.275:17100-17105;Ramm and Pluckthun(2000)J.Biol.Chem.275:17106-17113;Arie等人(2001)Mol.Microbiol.39:199-210)。
为了使得所表达的异源蛋白(特别是对于蛋白水解敏感的那些)的蛋白水解最小化,可使用某些蛋白水解性酶有缺陷的宿主菌株。例如,宿主细胞菌株可被修饰以产生编码已知细菌蛋白酶的基因中的遗传突变,所述细菌蛋白酶为例如蛋白酶III,OmpT,DegP,Tsp,蛋白酶I,蛋白酶Mi,蛋白酶V,蛋白酶VI以及它们的组合。一些大肠杆菌蛋白酶缺陷性菌株是可获得的并被描述在下列中:例如,Joly等人(1998),见上;Georgiou等人,美国专利号5,264,365;Georgiou等人,美国专利号5,508,192;Hara等人,Microbial Drug Resistance,2:63-72(1996)。
在一些实施方案中,所述经修饰的蛋白包括降低蛋白的缓冲能力的一个或多个化学修饰。在一个实例中,所述经修饰的蛋白包括经化学修饰的N末端氨基酸残基,例如N末端甲硫氨酸残基,通过加入甲酰基。此类甲酰化在降低包含伯胺基团的N末端氨基酸残基的缓冲能力中可以是有用的。可在相对于相应的野生型宿主细胞具有降低的甲硫氨酸氨基肽酶(MAP)活性的宿主细胞中表达经甲酰修饰的蛋白和/或从所述宿主细胞中纯化所述经甲酰修饰的蛋白。使用此类MAP缺陷性菌株可改善经甲酰修饰的蛋白的表达。见例如,Sherman,F.,J.W.Stewart和S.Tsunasawa.1985.Methionine or not methionine atthe beginning of a protien.BioEssays 3:27-31。
在一些实施方案中,进一步纯化本文中生产的经修饰的蛋白以获得基本上均一的制备物用于进一步的测定和使用。可采用本领域中已知的标准的蛋白纯化方法。下面的程序是合适的纯化程序的示例:在免疫亲和或离子交换柱上进行分级,乙醇沉淀,反相HPLC,在硅胶或阳离子交换树脂(例如DEAE)上进行层析,层析聚焦,SDS-PAGE,硫酸铵沉淀以及凝胶过滤(使用例如,Sephadex G-75)。
在一些实施方案中,本公开一般性地涉及这样的多肽,其包含与另一多肽相融合以形成嵌合多肽的经修饰的蛋白。在一些实施方案中,所述嵌合多肽包含提供表位的标签多肽,所述表位被抗标签抗体选择性地结合。表位标签允许使用抗标签抗体通过亲和纯化来纯化所述经修饰的蛋白。表位标签及其相应的抗体是本领域中熟知的。实例包括流感HA标签多肽及其抗体12CA5(Field等人Mol.Cell Biol.8:2159-2165(1988));c-myc标签及其抗体8F9,3C7,6E10,G4,B7和9E10(Evan等人,Mol.Cell Biol.5:3610-3616(1985));和单纯疱疹病毒糖蛋白D(gD)标签及其抗体(Paborsky等人,Protein Engineering 3:547-553(1990))。表位标签的其它实例包括Flag肽(Hopp等人,BioTechnology 6:1204-1210(1998));KT3表位肽(Martin等人,Science 255:192-194(1992));a-微管蛋白表位肽(Skinner等人,J.Biol.Chem.266:15163-15166(1991))和T7gp10肽标签(Lutz-Freyermuth等人,Proc.Natl.Acad.Sci.USA 87:6393-6397(1990))。
可使用抗标签抗体通过亲和层析来方便地纯化表位标签化的经修饰的蛋白。抗标签抗体所附着的基质最通常是琼脂糖,但是其它的基质也是可获得的(例如,受控的孔玻璃或聚苯乙烯-二乙烯苯)。可通过例如,改变缓冲剂pH或离子强度,或者通过加入离液剂而从亲和柱上洗脱表位标签化的经修饰的蛋白。
在一些实施方案中,经修饰的蛋白与组氨酸标签(His-tag)融合。可通过例如使用镍柱、利用标准技术来纯化His标签化的经修饰的蛋白。
在一些实施方案中,本公开一般性地涉及可被用于检测和/或监测生物学和化学反应的方法、组合物、系统、装置和试剂盒。这些反应可包括酶促反应,其中消耗基质和/或试剂和/或产生反应中间体,副产物和/或产物。在一些实施方案中,本公开一般性地涉及可用于检测和/或监测生物学和化学反应的组合物和方法,其中在反应的过程中,至少一种离子的浓度改变。此类反应的实例是核酸合成方法,例如提供关于核酸序列的信息的方法。
在各种实施方案中,通过包括场效应晶体管(FET)的传感器来检测和/或监测生物学或化学反应。在各种实施方案中,所述FET为chemFET或ISFET。“chemFET”或化学场效应晶体管是作为化学传感器起作用的一类场效应晶体管。其为MOSFET晶体管的结构类似物,其中门电极上的电荷是由化学过程施以的。“ISFET”或离子敏感性场效应晶体管被用于测量溶液中的离子浓度;当离子浓度(例如H+)改变时,通过所述晶体管的电流将相应地改变。ISFET的详细操作理论在下列中给出:"Thirty years of ISFETOLOGY:whathappened in the past 30years and what may happen in the next 30years,"P.Bergveld,Sens.Actuators,88(2003),pp.1-20。
在一些实施方案中,FET可以是FET阵列。如本文中所使用的,“阵列”是元件(例如传感器或孔)的平面排布。所述阵列可以是一维或二维的。一维阵列是在第一维中具有一列(或行)元件且在第二维中具有多列(或行)的阵列。所述第一和第二维中的列(或行)的数目可以相同或不同。所述FET或阵列可包含102,103,104,105,106,107或更多个FET。
在一些实施方案中,在所述FET传感器阵列以上制作一个或多个微流体结构,以提供生物学或化学反应的保留和/或限制。例如,在一个实施方案中,所述微流体结构可被设置为一个或多个孔(或微孔,或反应室,或反应孔,这些术语在本文中可交换地使用),其被置于一个或多个传感器的阵列之上,从而其上方放置有给定孔的一个或多个传感器检测并测量所述给定孔中分析物的存在、水平和/或浓度。在一些实施方案中,有1:1的FET传感器和反应孔的对应。
微孔或反应室通常是具有确定形状和体积的空洞或孔,其被制造到基质中并可使用常规的显微制作技术被制作,例如,如在下列参考文献中所公开的:Doering and Nishi,Editors,Handbook ofSemiconductor Manufacturing Technology,Second Edition(CRCPress,2007);Saliterman,Fundamentals of BioMEMS and MedicalMicrodevices(SPIE Publications,2006);Elwenspoek等人,SiliconMicromachining(Cambridge University Press,2004)等。微孔或反应室的优选的设置(例如,间距,形状和体积)在下列中公开:Rothberg等人,美国专利公布2009/0127589;Rothberg等人,英国专利公布GB24611127,通过引用而将所述文献并入。
在一些实施方案中,在与FET(例如chemFET或ISFET)相接触或电容性偶联的溶液或反应室中进行生物学或化学反应。所述FET(或者chemFET或ISFET)和/或反应室可以分别为FET或反应室的阵列。
在一些实施方案中,在二维反应室阵列中进行生物学或化学反应,其中每个反应室与FET偶联,并且每个反应室的体积不大于10μm3(即,1pL)。在一些实施方案中,每个反应室的体积不大于0.34pL,0.096pL或甚至0.012pL。所述反应室顶部的截面积可任选地为22,32,42,52,62,72,82,92或102平方微米。优选地,所述阵列具有至少102,103,104,105,106,107,108,109或更多个反应室。在一些实施方案中,所述反应室与FET电容性偶联。
可根据常规的CMOS制作技术、以及经修饰的CMOS制作技术和在CMOS制作中常规采用的那些技术之外的其它半导体制作技术来制作在根据本公开的各种实施方案中所使用的FET阵列。因此,可采用各种蚀刻技术作为阵列制作过程的一部分。
适用于所公开的方法、以及微孔和相伴的流体的示例性FET阵列,以及制备它们的方法在下列中公开:例如,美国专利公开号20100301398;美国专利公开号20100300895;美国专利公开号20100300559;美国专利公开号20100197507,美国专利公开号20100137143;美国专利公开号20090127589;和美国专利公开号20090026082。
在一些实施方案中,本公开一般性地涉及检测在化学反应过程中离子浓度的改变的方法,所述方法包括:在具有一个或多个氨基酸置换的经修饰的多肽的存在下进行化学反应,其中在所述化学反应的过程中至少一种类型的离子的浓度改变;和检测指示离子浓度改变的信号,其中所述信号相对于从在未经修饰的多肽的存在下但是在相同条件下进行的化学反应中检测到的信号是增加的。
在一些实施方案中,所述经修饰的多肽包括相对于未经修饰的多肽降低所述经修饰的多肽的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有少于约4或大于约10的pKa的另一个氨基酸残基置换具有约4至10之间的pKa的氨基酸残基。
在一些实施方案中,所述经修饰的多肽是DNA或RNA结合蛋白。在各种实施方案中,所述多肽为DNA聚合酶,解旋酶,连接酶,核酸酶,单链DNA结合蛋白或聚合酶辅蛋白。
在一些实施方案中,所述经修饰的多肽是经修饰的聚合酶,且所述化学反应包括核苷酸掺入。
在所述方法的一些实施方案中,所述经修饰的多肽为聚合酶,其包含约在pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至pH9的范围内实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在各种实施方案中,所述DNA聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Bst聚合酶,Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,TherminatorTM聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为KOD聚合酶。在一些实施方案中,所述聚合酶为TherminatorTM聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,其包括例如,美国专利公开号20110014612中公开的变体,在此通过引用而并入。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在所述方法的一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换是表2或表3中所显示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号与SEQ ID NO:1的编号相一致。
在一些实施方案中,所述Bst DNA聚合酶包含一个或多个保守性氨基酸置换,其中所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号与SEQ ID NO:1的编号相一致。
在所述方法的一些实施方案中,所述聚合酶为Bst DNA聚合酶,其包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4或具有一个或多个保守性氨基酸置换的其变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:2中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:2至少95%同一的氨基酸序列。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶,其包含SEQID NO:3的氨基酸序列。在一些实施方案中,本公开一般性地涉及包含SEQ ID NO:3中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:3至少95%同一的氨基酸序列。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶,其包含SEQID NO:4的氨基酸序列。在其它实施方案中,本公开一般性地涉及包含SEQ ID NO:4中所示氨基酸序列的蛋白的分离的变体,其中所述变体包含与SEQ ID NO:4至少95%同一的氨基酸序列。
在所述方法的其它实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的一些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸置换,其中所述所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,所述氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少30%溶剂暴露的氨基酸残基。
在所述方法的一些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个化学氨基酸修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N末端氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂修饰包含伯胺基团的氨基酸残基的化学修饰。在一些实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在检测化学反应过程中离子浓度变化的方法的一些实施方案中,检测步骤包括使用chemFET。在一些实施方案中,所述chemFET为ISFET。在一些实施方案中,所述ISFET为ISFET阵列。
在一些实施方案中,所述化学反应是在包含chemFET或与chemFET电容性偶联的反应室中进行的。
在一些实施方案中,所述化学反应是在下列试剂的存在下进行的:所述试剂将所述经修饰的多肽中的至少一个氨基酸的pKa值由约6至约8的范围改变为少于约6或大于约8。在一些实施方案中,所述试剂为磷脂,磺酸表面活性剂,聚阴离子电解质或其盐,聚阳离子电介质或其盐,四甲基铵或其盐,或它们的组合。
在一些实施方案中,所述至少一种离子为氢离子。
在一些实施方案中,所述反应为酶促反应或结合反应。
在一些实施方案中,所述化学反应为酶促反应。在一些实施方案中,所述酶促反应为核苷酸掺入反应。
在一些实施方案中,所公开的方法还包括重复步骤a)-b)。
在一些实施方案中,本公开一般性地涉及使用本公开的经修饰的蛋白以获得关于目的核酸的序列信息的方法。此类方法涉及基于模板核酸的序列合成新的核酸(例如,使用与模板核酸杂交的引物或自引发模板,如本领域技术人员将认识到的)。即,新合成的核酸的序列与模板核酸的序列互补并且由此关于新合成的核酸的序列的知识产生关于模板核酸的序列的信息。
一方面,所公开的方法、组合物、系统、装置和试剂盒可被用于进行无标记物的核酸测序,并且特别地,用于基于离子的核酸测序。文献中描述了无标记物的核酸测序(包括基于离子的核酸测序)的概念,所述文献包括下列通过引用而并入的参考文献:Rothberg等人,美国专利公开2009/0026082;Anderson等人,Sensors and Actuators BChem.,129:79-86(2008);和Pourmand等人,Proc.Natl.Acad.Sci.,103:6466-6470(2006)。简要地,在核酸测序应用中,通过测量聚合酶催化的延伸反应的天然副产物(包括氢离子,聚磷酸酯,PPi和Pi)(例如在焦磷酸酶的存在下)而确定核苷酸掺入。
在典型的基于离子的核酸测序的实施方案中,通过检测由聚合酶催化的延伸反应产生的氢离子的存在和/或浓度来检测核苷酸掺入。在一个实施方案中,每种具有可操作地结合的引物和聚合酶的模板被加载到反应室中(例如Rothberg等人中所公开的微孔,在上文中引述),之后进行核苷酸添加和清洗的重复循环。在一些实施方案中,此类模板可作为克隆群体被附着至固体支持物,例如微颗粒、珠子等,并且所述克隆群体被加载到反应室中。例如,可如美国专利号7,323,305中所公开的制备模板,此美国专利通过引用而被并入。如本文中所使用的“可操作地结合”是指引物与模板退火从而所述引物的3'末端可被聚合酶延伸且聚合酶与此引物-模板双链体结合,或在其临近处,从而每当添加核苷酸时便发生结合和/或延伸。
在循环的每一步中,仅当模板中的下一个碱基与所加入的核苷酸互补时,聚合酶才通过掺入所加入的核苷酸而延伸引物。如果有一个互补的碱基,就有一个掺入,如果有两个,就有两个掺入,如果有三个,就有三个掺入,等等。伴随每次这样的掺入都释放氢离子,并且释放氢离子的模板群体共同地改变反应室的局部pH。氢离子的产生与模板中连续互补碱基的数目(以及参与延伸反应的具有引物和聚合酶的模板分子的总数)单调相关。因此,当模板中存在若干邻接的相同互补碱基(即均聚物区域)时,所产生的氢离子的数目以及因此局部pH改变的幅度都与邻接的相同互补碱基的数目成比例。如果模板中的下一个碱基与所加入的核苷酸不互补,则不发生掺入并且不释放氢离子。在一些实施方案中,在每个加入核苷酸步骤之后,可进行额外的步骤,其中使用预定pH的未缓冲的清洗溶液来去除前一个步骤的核苷酸,以防止在之后的循环中误掺入。在一些实施方案中,在每个加入核苷酸的步骤之后,可进行额外的步骤,其中用核苷酸破坏性试剂(例如三磷酸腺苷双磷酸酶)处理反应室以消除所述室中存留的任何残余核苷酸,所述残余核苷酸可引起随后循环中的假延伸。
在一个示例性的实施方案中,将不同种类的核苷酸顺次加入反应室中,从而使每个反应每次暴露于不同的核苷酸。例如,可以下列顺序加入核苷酸:dATP,dCTP,dGTP,dTTP,dATP,dCTP,dGTP,dTTP等等;其中每次暴露都继以清洗步骤。循环可被重复50次,100次,200次,300次,400次,500次,750次或更多次,取决于所需的序列信息的长度。
在一些实施方案中,所述聚合酶可包括而不限于可催化将核苷酸(包括其类似物)聚合到核酸链中的任何酶。典型地(但不是必然地),此类核苷酸聚合可以以模板依赖性的方式发生。此类聚合酶可包括但不限于天然存在的聚合酶和其任何亚基和截短,突变体聚合酶,变体聚合酶,重组体,融合体或经其它工程化的聚合酶,经化学修饰的聚合酶,合成的分子或组装体,以及保留催化此类聚合的能力的它们的任何类似物、衍生物或片段。任选地,所述聚合酶可以是突变体聚合酶,其包含一个或多个突变,这包括用其它氨基酸置换一个或多个氨基酸,在聚合酶或者两个或多个聚合酶的连接部分插入或缺失一个或多个氨基酸。通常,所述聚合酶包含一个或多个活性位点,在这里可发生核苷酸结合和/或核苷酸聚合的催化。一些示例性的聚合酶包括而不限于DNA聚合酶(例如大肠杆菌DNA聚合酶,Bst DNA聚合酶,Taq聚合酶,T7聚合酶,Phi-29DNA聚合酶,B103聚合酶和逆转录酶)以及RNA聚合酶。术语“聚合酶”及其变体也可指包括至少两个彼此连接的部分的融合蛋白,其中第一部分包含能够催化将核苷酸聚合到核酸链中的肽,并且所述第一部分与包含第二多肽的第二部分相连,所述第二多肽为例如报告子酶或持续合成性增强性结构域。此类聚合酶的一个示例性实施方案是
Figure BDA00002253041400831
DNA聚合酶(New EnglandBiolabs),其包含与持续合成性-增强性结构域相融合的热球菌样聚合酶,如例如美国专利号6,627,424中所描述的。
在一些实施方案中,所述经修饰的聚合酶包含一个或多个修饰,与参照聚合酶(例如,未经修饰的对应物)相比,所述修饰引起改变的外切核酸酶活性(例如3’至5’外切核酸酶活性)。在一些实施方案中,所述修饰包括氨基酸置换。在一些实施方案中,所述经修饰的聚合酶缺乏3’至5’外切核酸酶活性,或者缺乏5’至3’外切核酸酶活性,或者缺乏二者。对于各种聚合酶都描述过降低或消除3’至5’外切核酸酶活性的保守氨基酸残基处的突变。例如,Phi-29型聚合酶中各残基处的降低外切核酸酶活性的氨基酸突变被描述于,例如下列中:de Vega等人,“Primer-terminus stabilization at the 3’-5’exonuclease activesite of Φ29 DNA polymerase.Involvement of two amino acidresidues highly conserved in proofreading DNA polymerases”EMBOJ.,15(5):1182-1192(1996);Soengas等人,“Site-directed mutagenesisat the Exo III motif ofΦ29DNA polymerase;overlapping structuraldomains for the 3’-5’exonuclease and strand-displacement activities”EMBO J.,11(11):4227-4237(1992);Blanco等人,美国专利号5,001,050,5,198,543和5,576,204。
适用于某些但不是所有实施方案中的一种示例性的聚合酶为大肠杆菌DNA聚合酶I的Klenow片段的无外切(exo-)形式,其缺少3'至5'外切核酸酶活性。其它的聚合酶包括T4exo-,TherminatorTM和Bst聚合酶,以及含有降低其3'至5'外切核酸酶活性的修饰的B106DNA聚合酶的变体,如美国专利公开号20110014612中所描述的,将其在此通过引用而并入。在其它需要切除核苷酸(例如,在缺口平移反应的过程中)的实施方案中,优选具有外切核酸酶活性的聚合酶。因为DNA合成保真性主要取决于3'-5'外切核酸酶活性的存在与否,具有3'-5'外切核酸酶活性的酶可被用于某些实施方案中。也可使用酶的组合。所述聚合酶可以是经修饰以包含辅助因子的酶,这包括而不限于单链或双链DNA结合蛋白。
一些实施方案可能要求所述聚合酶具有足够的持续合成性。如本文中所使用的,持续合成性是聚合酶保持与单一引物/模板杂合体结合的能力。其可通过在聚合酶从引物/模板杂合体上解离之前,被聚合酶插入到核酸(例如测序引物)中的核苷酸数目来进行测量。在一些实施方案中,聚合酶具有的持续合成性为至少100个核苷酸,虽然在其它实施方案中,其具有的持续合成性为至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,或至少500个核苷酸。本领域技术人员将理解,聚合酶的持续合成性越高,其在解离前能够掺入的核苷酸越多,因此能够获得的序列就越长。换言之,具有低持续合成性的聚合酶与具有更高持续合成性的聚合酶相比将提供更短的读取长度。例如,在五次掺入后从杂合体上解离的聚合酶将仅提供长度为5个核苷酸的序列,而平均在500次掺入后从杂合体上解离的聚合酶将提供约500个核苷酸的序列。
聚合酶掺入核苷酸的速度将根据特定的应用而改变,虽然一般希望有更快的掺入速度。“测序”的速度将取决于芯片上阵列的数目,孔的大小,反应所运行的温度和条件等。
在一些实施方案中,以基本上相同的时间向每个模板递送核苷酸。在一些实施方案中,聚合酶是已经存在的,虽然在某些实施方案中,它们可同核苷酸一起被引入。聚合酶可以是被固定的或者可以是自由流动的。在其中聚合酶为固定的实施方案中,所述聚合酶可被附着至固体支持物,例如珠表面,珠内部或珠表面和内部的一些组合。通常,所述珠存在于反应室中,虽然也可在没有反应室的情况下进行所述方法。所述固体支持物也可以是传感器表面或与传感器电容性偶联的反应室的壁。
在一些实施方案中,反应可在反应室中发生。而在其它实施方案中,其可在没有反应室时发生。在后者的实施方案中,传感器表面可以是连续的而在传感器之间没有任何物理分隔物。
在一些实施方案中,核苷酸可包括能够与聚合酶选择性结合或可被聚合酶聚合的任何化合物。通常但不是必然地,核苷酸与聚合酶的选择性结合被继以由所述聚合酶将所述核苷酸聚合到核酸链中;然而,偶尔地,所述核苷酸可从所述聚合酶上解离而不被掺入到核酸链中,此事件在本文中被称作“非生产性”事件。所述核苷酸不仅可包括任何天然存在的核苷酸,还可包括能够选择性结合聚合酶或能够被聚合酶聚合的任何类似物(无论其结构怎样)。虽然天然存在的核苷酸通常包含碱基,糖和磷酸部分,本公开的核苷酸可包括缺少这些部分中的任意一个、一些或全部的化合物。在一些实施方案中,所述核苷酸可任选地包括含有三、四、五、六、七、八、九、十或更多磷原子的链。在一些实施方案中,所述磷链可附着至糖环的任何碳上,例如5’碳。所述磷链可以通过介于中间的O或S与所述糖相连。在一个实施方案中,所述链中的一个或多个磷原子可以是具有P和O的磷酸基团的一部分。在另一个实施方案中,所述链中的磷原子可通过介于中间的O,NH,S,亚甲基,经取代的亚甲基,乙烯基,经取代的乙烯基,CNH2,C(O),C(CH2),CH2CH2或C(OH)CH2R(其中R可以是4-嘧啶或1-咪唑)连接在一起。在一个实施方案中,所述链中的磷原子可具有含有O,BH3或S的侧基。在所述磷链中,具有除O以外的侧基的磷原子可以是经取代的磷酸基团。在所述磷链中,含有除O以外的介于中间的原子的磷原子可被磷酸基团取代。核苷酸类似物的一些实例被描述在Xu,美国专利号7,405,281中。在一些实施方案中,所述核苷酸包含标记物并在本文中称作“经标记的核苷酸”。在一些实施方案中,所述标记可以是附着至末端磷酸基团(即,距糖最远的磷酸基团)的荧光染料的形式。可被用于所公开的方法和组合物中的核苷酸的一些实例包括但不限于,核糖核苷酸,脱氧核糖核苷酸,经修饰的核糖核苷酸,经修饰的脱氧核糖核苷酸,核糖核苷酸多磷酸酯,脱氧核糖核苷酸多磷酸酯,经修饰的核糖核苷酸多磷酸酯,经修饰的脱氧核糖核苷酸多磷酸酯,肽核苷酸,经修饰的肽核苷酸,金属核苷,磷酸酯核苷,以及经修饰的磷酸-糖主链核苷酸,前述化合物的类似物、衍生物或变体等。在一些实施方案中,核苷酸可包含非氧部分,例如硫代-或硼代-部分,其替代桥接核苷酸的α磷酸和糖之间、或核苷酸的α和β磷酸之间、或核苷酸的β和γ磷酸之间、或者核苷酸的任意其它两个磷酸之间、或者它们的任意组合之间的氧部分。
本公开的某些实施方案一般性地涉及检测作为核苷酸掺入的函数而释放的氢离子;某些实施方案一般性地涉及检测作为核苷酸切除的函数而释放的氢离子。在这些和各种其它方面中重要的是检测尽可能多的释放的氢离子,从而得到尽可能高的信号(和/或信噪比)。用于增加被FET表面最终检测到的所释放的质子数目的策略包括而不限于:限制所释放的质子与孔中的反应活性基团的相互作用,选择由其来制造所述第一种情形中的孔的、对于质子相对为惰性的材料,防止所释放的质子在chemFET处的检测之前离开所述孔,和增加每个孔的模板拷贝数目(为了扩增来自每个核苷酸掺入的信号),等等。
所公开的方法的一些实施方案采用这样的环境(例如反应溶液),其经最少地缓冲,如果缓冲的话。缓冲可由溶液的组分或由与所述溶液相接触的固体支持物促成。没有或具有低缓冲能力(或活性)的溶液是其中可检测(例如使用本文中所描述的chemFET传感器)到下列量级上的氢离子浓度改变的溶液:至少约+/-0.005pH单位,至少约+/-0.01,至少约+/-0.015,至少约+/-0.02,至少约+/-0.03,至少约+/-0.04,至少约+/-0.05,至少约+/-0.10,至少约+/-0.15,至少约+/-0.20,至少约+/-0.25,至少约+/-0.30,至少约+/-0.35,至少约+/-0.45,至少约+/-0.50,或更高。在一些实施方案中,每个核苷酸掺入的pH改变在约0.005的量级上。在一些实施方案中,每个核苷酸掺入的pH改变为pH的减小。没有或具有低缓冲能力的反应溶液可不含或含有非常低浓度的缓冲剂,或者可使用弱的缓冲剂。
反应溶液可具有浓度如下的缓冲剂:等于或小于1mM,等于或小于0.9mM,等于或小于0.8mM,等于或小于0.7mM,等于或小于0.6mM,等于或小于0.5mM,等于或小于0.4mM,等于或小于0.3mM,等于或小于0.2mM,等于或小于0.1mM,或更小包括零。缓冲剂浓度可以是50-100μM。适于本文所述的测序反应(其中pH改变是读出)的弱缓冲剂的非限制性实例是0.1mM的Tris或三甲基甘氨酸。
在某些方面,除了使用缓冲性降低的溶液之外或者代替使用所述缓冲性降低的溶液,而在用于屏蔽溶液中可发生的潜在缓冲事件的额外试剂的存在下进行核苷酸掺入(和任选地切除)。这些试剂在本文中被称为缓冲抑制剂,因为它们抑制溶液内的组分或与溶液相接触的固体支持物的组分在氢离子被FET表面检测之前螯合和/或干扰释放的氢离子的能力。没有此类抑制剂时,所释放的氢离子可与溶液中或与所述溶液相接触的固体支持物上的反应活性基团相互作用或被所述反应活性基团螯合。这些氢离子较不可能到达和被FET表面检测到,导致比否则可能的信号更弱的信号。然而,在这些抑制剂的存在下,将有更少的可用于与氢离子相互作用或螯合氢离子的反应活性基团。因此,更大比例的被释放的氢离子将到达并被FET表面检测到,引起更强的信号。一些合适的缓冲抑制剂在5-9的pH范围内显示出很小的缓冲能力或无缓冲能力,这意味着在所述抑制剂的存在下,0.005,0.01,0.02,0.03,0.04,0.05,0.1,0.2,0.3,0.4,0.5或更多pH单位的量级上的pH改变是可检测的(例如,通过使用ISFET)。
存在各种类型的缓冲抑制剂。一类缓冲抑制剂的一个实例是磷脂。所述磷脂可以是天然存在的或非天然存在的磷脂。可被用作缓冲抑制剂的磷脂的实例包括但不限于磷脂酰胆碱,磷脂酰乙醇胺,磷脂酰甘油和磷脂酰丝氨酸。
一类缓冲抑制剂的另一个实例是基于磺酸的表面活性剂,例如聚(乙二醇)4-壬基酚3-磺丙基醚(PNSE),它的钾盐显示在图61D中。除了屏蔽将干扰被释放的质子的反应活性基团之外,PNSE还被报道增强聚合酶活性。
一类缓冲抑制剂的另一个实例是聚阴离子电解质,例如聚苯乙烯磺酸或其钠盐。
一类缓冲抑制剂的另一个实例是聚阳离子电介质,例如聚(二烯丙基二甲基铵)或其氯盐。已知这些化合物结合DNA。
缓冲抑制剂的另一个实例是四甲基铵或其氯盐。
这些各种抑制剂通过被包括在核苷酸溶液、清洗溶液等中,可在反应的整个过程中存在。备选地,可使它们相对于核苷酸和/或其它反应试剂的流过以确定的次数流过反应室。在其它的实施方案中,它们可被包被在FET表面(或反应室表面)上。这种包被可以是共价或非共价的。
在一个实施方案中,本公开一般性地涉及用于从核酸模板中获得信息的方法,所述方法包括:(a)提供与测序引物相杂交并与聚合酶相结合的模板核酸,其中所述聚合酶包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换;(b)通过在所述测序引物的3’端顺次掺入一个或多个核苷酸而合成新的核酸链,其中当核苷酸与模板核酸中相应的核苷酸互补时产生氢离子副产物;和(c)通过检测氢离子的释放而检测所述一个或多个核苷酸在所述测序引物中的掺入。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型(未经置换的)聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内相对于相应的野生型聚合酶降低所述聚合酶的缓冲能力的一个或多个氨基酸置换,其中所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述聚合酶包含在约pH 7至约pH 9的范围内相对于相应的野生型聚合酶降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括置换用另一个氨基酸残基置换具有约7至约9的范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,所述氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有小于约7或大于约9的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个选自:用精氨酸置换表面组氨酸,用谷氨酰胺置换表面谷氨酸,用精氨酸置换表面赖氨酸。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个是用丙氨酸残基置换氨基酸残基。
在所述方法的一些实施方案中,所述聚合酶中的一个或多个氨基酸修饰中的至少一个是氨基酸的缺失。在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个是具有约4.0至约10.0之间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N-末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个是用另一个氨基酸残基缺失具有约6.0至约8.0范围内的pKa的氨基酸残基。在一些实施方案中,所述缺失的氨基酸是His,Glu,Asp,Tyr或Lys。
在所述方法的一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH 5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个化学氨基酸修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N末端氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂修饰包含伯胺基团的氨基酸残基的化学修饰。在其它实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,所述一个或多个氨基酸置换、缺失或化学修饰中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
将理解,所述聚合酶可包含氨基酸置换、缺失或化学修饰的任意组合。包含任意一个或多个此类添加,置换,缺失和化学修饰的聚合酶可被称作“经修饰的”聚合酶。
在一些实施方案中,所述经修饰的聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列,和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型(未经置换的)聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换是表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的其变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述BstDNA聚合酶是包含SEQ ID NO:2中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:3中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在其它实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:4中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在所述方法的其它实施方案中,所述DNA聚合酶是TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,用于从核酸模板获得序列信息的方法进一步包括提供SSB,其中所述SSB包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,SSB中的所述一个或多个氨基酸置换在约pH7至约pH 9的范围内相对于相应的野生型SSB降低所述SSB的缓冲能力。
在一些实施方案中,SSB中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述SSB包含氨基酸置换K7R。
在一些实施方案中,本公开一般性地涉及用于核酸测序的方法,所述方法包括:在多个反应室中放置多个模板核酸,其中所述反应室中的一个或多个与场效应晶体管(FET)阵列相接触;和使所述模板核酸中的至少一个与包括在pH 7至pH 9的范围内实质上降低其缓冲能力的一个或多个保守性氨基酸置换的聚合酶相接触;通过向核酸分子中顺次掺入一个或多个核苷酸而合成新的核酸链并产生一个或多个氢离子作为所述核苷酸掺入的副产物;以及通过使用FET检测所述一个或多个氢离子的产生而检测所述一个或多个核苷酸的掺入。
在一些实施方案中,所述检测包括检测响应于所述一个或多个氢离子的产生的阵列内至少一个FET处电压和/或电流的改变。
在一些实施方案中,所述FET选自:离子敏感性FET(isFET)和化学敏感性FET(chemFET)。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的一个或多个保守性氨基酸置换为表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的其变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,SSB中的所述一个或多个保守性氨基酸置换为表4中所示的一个或多个氨基酸残基。
在另一个实施方案中,本公开一般性地涉及用于从核酸获得序列信息的方法,所述方法包括:
(a)将多个固体或半固体支持物放置在形成于半导体基质中的传感器阵列上的多个反应室内,其中至少一个反应室包括聚合酶,测序引物和附着至彼此间具有至少80%序列同一性的多个模板核酸的单一固体或半固体支持物,其中所述聚合酶包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换,并且每个反应室都与包括FET的传感器相接触或电容性偶联,所述FET被配置为提供至少一种输出,所述输出代表所述反应室内一个或多个氢离子的存在;
(b)将至少一个核苷酸引入所述至少一个反应室中并使用所述聚合酶来将所述至少一个核苷酸掺入所述引物中,从而产生一个或多个氢离子副产物;
(c)通过检测氢离子副产物的存在而检测所述至少一个核苷酸的掺入。
在一些实施方案中,所述方法进一步包括重复步骤(a)至(c),直到所述核酸被测序。
在一些实施方案中,所述方法进一步包括从所述至少一个反应室中清洗未掺入的核苷酸的步骤。
在一些实施方案中,所述方法进一步包括重复步骤(a)至(c)以及清洗步骤直至所述核酸被测序。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的一个或多个保守性氨基酸置换为表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,SSB中的所述一个或多个保守性氨基酸置换为表4中所示的一个或多个氨基酸残基。
在其它的实施方案中,本公开一般性地涉及用于降低在DNA测序或扩增反应中所使用的蛋白的缓冲能力的方法,所述方法包括在所述蛋白序列中制造在约pH 4至约pH 10的范围内实质上降低所述蛋白的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述氨基酸置换在约pH 7至约pH 9的范围内实质上降低所述蛋白的缓冲能力。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有少于约4或大于约10的pKa的氨基酸残基置换具有约4至约10的范围的pKa的氨基酸残基。
在一些实施方案中,所述蛋白为DNA-或RNA-结合蛋白。
在各种实施方案中,所述蛋白为DNA聚合酶,其选自A家族DNA聚合酶;B家族聚合酶;混合型聚合酶;未归类的DNA聚合酶;RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶,和Tth DNA聚合酶;B家族DNA聚合酶,其选自,Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶,和噬菌体B103聚合酶;混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列,和Hi-Fi聚合酶;未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶,和Tfi聚合酶;以及RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。
在一些实施方案中,所述聚合酶为Bst DNA聚合酶。在其它实施方案中,所述聚合酶中的一个或多个保守性氨基酸置换是表2或表3中所示的一个或多个氨基酸残基。在其它实施方案中,所述一个或多个保守性氨基酸置换选自H341R,H568R,H576R,E741Q,H768R,H823R,H867R和Y772F。在一些实施方案中,所述聚合酶选自SEQID NO:2,SEQ ID NO:3和SEQ ID NO:4,或者具有一个或多个保守性氨基酸置换的它们的变体。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包含在pH 7至pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。在其它实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,SSB中的所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。
在其它的实施方案中,本公开一般性地涉及检测核苷酸掺入的方法,所述方法包括:
(a)使用经修饰的聚合酶进行核苷酸掺入并产生一个或多个氢离子作为所述核苷酸掺入的副产物,其中所述经修饰的聚合酶包含相对于未经修饰的聚合酶降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换;和
(b)检测作为所述核苷酸掺入的副产物产生的一个或多个氢离子的存在,从而检测所述核苷酸掺入。
在各种实施方案中,所述聚合酶可以是含有本文所述的任意一个或多个置换、缺失或化学修饰的任意经修饰的聚合酶。
在一些实施方案中,所述经修饰的聚合酶包括在约4至约10的pH范围内相对于未经修饰的聚合酶降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型(未置换的)聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内相对于相应的野生型聚合酶降低所述聚合酶的缓冲能力的一个或多个氨基酸置换,其中所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸修饰中的至少一个为用丙氨酸残基置换氨基酸残基。
在所述方法的一些实施方案中,所述聚合酶中的一个或多个氨基酸修饰中的至少一个是氨基酸的缺失。在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个是具有约4.0至约10.0之间的pKa的氨基酸残基。在一些实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个缺失的氨基酸中的至少一个为用另一个氨基酸残基缺失具有约6.0至约8.0范围内的pKa的氨基酸残基。在一些实施方案中,所述缺失的氨基酸为His,Glu,Asp,Tyr或Lys。
在所述方法的一些实施方案中,所述聚合酶包含在约pH 4至约pH 10的范围内,约pH 5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个化学氨基酸修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括N末端氨基酸的化学修饰。在一些实施方案中,所述一个或多个化学氨基酸修饰包括用胺反应活性试剂修饰包含伯胺基团的氨基酸残基的化学修饰。在其它实施方案中,所述胺反应活性试剂包括酰化剂或活化酯。
在一些实施方案中,所述一个或多个氨基酸置换、缺失或化学修饰中的至少一个包括用另一个氨基酸残基置换相应的野生型蛋白中至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述经修饰的聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶,和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的野生型(未置换的)聚合酶降低所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包括选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ ID NO:2中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ IDNO:3中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ IDNO:4中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在所述方法的其它实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内,相对于相应的野生型蛋白实质上降低其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述方法进一步包括提供SSB,其中所述SSB包括在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。
在一些实施方案中,SSB中的所述一个或多个氨基酸置换在约pH7至约pH 9的范围内相对于相应的野生型SSB降低所述SSB的缓冲能力。
在一些实施方案中,SSB中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述SSB为大肠杆菌SSB。在其它实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述SSB包含氨基酸置换K7R。
在检测核苷酸掺入的方法的一些实施方案中,所述检测包括使用离子敏感性场效应晶体管(ISFET)。在一些实施方案中,所述ISFET在ISFET阵列中。
在一些实施方案中,所述反应在包含chemFET或与chemFET电容性偶联的反应室中进行。
在一些实施方案中,所述反应是在下述试剂的存在下进行的:所述试剂将所述经修饰的多肽中的至少一个氨基酸的pKa值由约6至约8的范围改变为少于约6或大于约8。在一些实施方案中,所述试剂为磷脂,磺酸表面活性剂,聚阴离子电解质或其盐,聚阳离子电介质或其盐,四甲基铵或其盐,或者它们的组合。
在一些实施方案中,所述方法进一步包括重复步骤a)-b)。
在一些实施方案中,本公开一般性地涉及核酸测序的方法,所述方法包括:提供与测序引物相杂交且与聚合酶相结合的模板核酸;通过向所述测序引物的3’端顺次掺入一个或多个已知的核苷三磷酸而合成新的核酸链;以及通过测量当所述已知的核苷三磷酸与模板核酸中相应的核苷酸互补时所产生的氢离子副产物的浓度来检测所述引物3’端的这种掺入。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换可包括本文所描述的任意一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个可以是保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的每一个都是保守性氨基酸置换。
在一些实施方案中,所述聚合酶包括本文中所述的任意一种经修饰的聚合酶。在一些实施方案中,所述聚合酶为无缓冲聚合酶。例如,相对于相应的未经置换的聚合酶,所述聚合酶能够具有降低的缓冲能力。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸的保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约9或小于约7的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约9或小于约7的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7.0至约9.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约9.0或小于约7.0的pKa的氨基酸残基置换具有约7.0至约9.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5,或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内实质上去除所述聚合酶的缓冲能力的一个或多个保守性氨基酸置换。
在一些实施方案中,所述聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内实质上去除所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内实质上去除Bst聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于未置换的Bst聚合酶实质上降低Bst聚合酶的缓冲能力。在一些实施方案中,所述未经置换的聚合酶可以是Bst聚合酶的野生型形式。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4或者具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ ID NO:2中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ ID NO:3中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶为包含SEQ ID NO:4中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KODDNA聚合酶,其包含在约pH 7至约pH 9的范围内质上去除其缓冲能力的一个或多个氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 4至约pH 10的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,本公开一般性地涉及核酸测序的方法,所述方法包括:(a)将多个模板核酸置于多个反应室中,其中所述多个反应室与化学敏感性场效应晶体管(chemFET)阵列相接触,对于每个反应室,所述chemFET阵列包含至少一个chemFET,并且其中每个模板核酸都与聚合酶相结合,其中所述聚合酶包含相对于相应的未经修饰的聚合酶实质上降低其缓冲能力的一个或多个氨基酸;(b)通过在所述测序引物的3’端顺次掺入一个或多个已知的核苷三磷酸而合成新的核酸链,其中当所述已知的核苷三磷酸与模板核酸中相应的核苷酸互补时产生氢离子副产物;和(c)通过所述阵列中的至少一个chemFET处响应于其附近氢离子浓度改变的电压和/或电流改变而检测所述一个或多个已知核苷三磷酸的掺入。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换可包括本文中所描述的一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个可以是保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的每一个都是保守性氨基酸置换。
在一些实施方案中,所述聚合酶包括本文中所描述的任意一种经修饰的聚合酶。在一些实施方案中,所述聚合酶为无缓冲性聚合酶。例如,相对于相应的未经置换的聚合酶,所述聚合酶可具有降低的缓冲能力。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸的保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约9或小于约7的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约9或小于约7的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7.0至约9.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约9.0或小于约7.0的pKa的氨基酸残基置换具有约7.0至约9.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一包括用另一个氨基酸残基置换相应的野生型蛋白中至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内实质上去除所述聚合酶的缓冲能力的一个或多个保守性氨基酸置换。
在一些实施方案中,所述聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内实质上去除所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内实质上去除Bst聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于未置换的Bst聚合酶实质上降低Bst聚合酶的缓冲能力。在一些实施方案中,所述未经置换的聚合酶可以是Bst聚合酶的野生型形式。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个是保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换是表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4或者具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ ID NO:2中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:3中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQID NO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:4中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQID NO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 4至约pH 10的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,本公开一般性地涉及核酸测序的方法,所述方法包括:(a)将多个模板核酸置于多个反应室中,其中所述多个反应室与化学敏感性场效应晶体管(chemFET)阵列相接触,所述chemFET阵列对于每个反应室都包含至少一个chemFET,其中每个模板核酸都与聚合酶相结合,其中所述聚合酶包含实质上降低其缓冲能力的一个或多个氨基酸置换;(b)通过在所述测序引物的3’端顺次掺入一个或多个已知的核苷三磷酸而合成新的核酸链,其中当所述已知的核苷三磷酸与模板核酸中相应的核苷酸互补时,产生氢离子副产物;和(c)通过所述阵列中至少一个chemFET处响应于其附近的氢离子浓度改变的电压和/或电流改变检测所述一个或多个已知核苷三磷酸的掺入。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换可包括本文中所述的任意一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个可以是保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的每一个都是保守性氨基酸置换。
在一些实施方案中,所述聚合酶包括本文中所描述的任意一种经修饰的聚合酶。在一些实施方案中,所述聚合酶为无缓冲性聚合酶。例如,所述聚合酶相对于相应的未经置换的聚合酶能够具有降低的缓冲能力。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个是选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸的保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约9或小于约7的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约9或小于约7的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7.0至约9.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约9.0或小于约7.0的pKa的氨基酸残基置换具有约7.0至约9.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包括在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包括在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述聚合酶包括在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内实质上去除所述聚合酶的缓冲能力的一个或多个保守性氨基酸置换。
在一些实施方案中,所述聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂Taq DNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为BstDNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内实质上去除所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内实质上去除Bst聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于未置换的Bst聚合酶实质上降低Bst聚合酶的缓冲能力。在一些实施方案中,所述未经置换的聚合酶可以是Bst聚合酶的野生型形式。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个是保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4或者具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ ID NO:2中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:3中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQID NO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:4中所示的氨基酸序列的蛋白的变体,其中所述变体包含与SEQID NO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 4至约pH 10的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,本公开一般性地涉及用于核酸测序的方法,所述方法包括:(a)将多个固体支持物置于在半导体基质中形成的传感器阵列上的多个反应室中,其中每个反应室包含单一的固体支持物,每个固体支持物都附着至多个相同的模板核酸,每个模板核酸与测序引物相杂交且与聚合酶相结合,其中所述聚合酶包含实质上降低其缓冲能力的一个或多个氨基酸置换,并且每个反应室与传感器的至少一个chemFET相接触或电容性偶联,且每个此种chemFET被配置为提供至少一种输出,所述输出表示其附近氢离子的存在和/或浓度;(b)向每个反应室中引入已知的核苷三磷酸;(c)通过当所述已知的核苷三磷酸与模板核酸中相应的核苷酸互补时产生的氢离子浓度的改变来检测一个或多个核苷三磷酸在测序引物3’端的顺次掺入;和(d)从反应室中清洗未掺入的核苷三磷酸。
在一些实施方案中,所述方法进一步包括(e)重复步骤(b)至(d),直至所述核酸被测序。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换可包括本文中所描述的任意一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个可以是保守性氨基酸置换。
在一些实施方案中,每一个所述一个或多个氨基酸置换都是保守性氨基酸置换。
在一些实施方案中,所述聚合酶包括本文中所描述的任一种经修饰的聚合酶。在一些实施方案中,所述聚合酶为无缓冲聚合酶。例如,相对于相应的未经置换的聚合酶,所述聚合酶可具有降低的缓冲能力。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸的保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约9或小于约7的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约9或小于约7的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7.0至约9.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约9.0或小于约7.0的pKa的氨基酸残基置换具有约7.0至约9.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包括在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内实质上去除所述聚合酶的缓冲能力的一个或多个保守性氨基酸置换。
在一些实施方案中,所述聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,其包括例如,美国专利公开号20110014612中公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶系列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内实质上去除所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内实质上去除Bst聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于未置换的Bst聚合酶实质上降低Bst聚合酶的缓冲能力。在一些实施方案中,所述未经置换的聚合酶可以是Bst聚合酶的野生型形式。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ ID NO:2中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:3中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在其它实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:4中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 4至约pH 10的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,本公开一般性地涉及用于核酸测序的方法,所述方法包括:(a)将固体支持物放置在半导体基质中形成的传感器阵列上的反应室中,其中所述固体支持物附着至多个基本上相同的模板核酸,所述模板核酸中的至少一个与测序引物相杂交并与聚合酶相结合,其中所述聚合酶包含一个或多个实质上降低其缓冲能力的氨基酸置换,其中所述反应室与传感器的至少一个chemFET相接触或电容性偶联,所述chemFET被配置为提供至少一种输出,所述输出表示其附近氢离子的存在和/或浓度;(b)将已知类型的核苷三磷酸引入反应室中;(c)通过检测由所述聚合酶掺入所述一个或多个核苷三磷酸而产生的氢离子浓度的改变来检测所述已知类型的一个或多个核苷三磷酸在测序引物3’末端的掺入;和(d)从反应室中清洗未掺入的核苷三磷酸。
在一些实施方案中,所述方法进一步包括(e)重复步骤(b)至(d),直至所述核酸被测序。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换可包括本文中所描述的任意一个或多个氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个可以是保守性氨基酸置换。
在一些实施方案中,每一个所述一个或多个氨基酸置换都是保守性氨基酸置换。
在一些实施方案中,所述聚合酶包括本文中所描述的任意一种经修饰的聚合酶。在一些实施方案中,所述聚合酶为无缓冲性聚合酶。例如,相对于相应的未经置换的聚合酶,所述聚合酶可具有降低的缓冲能力。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上去除所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶包括在约4至约10的pH范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力的一个或多个氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。
在一些实施方案中,所述聚合酶中的一个或多个氨基酸置换中的至少一个为选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸的保守性氨基酸置换。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约4.0至约10.0范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。在一些实施方案中,所述氨基酸残基的pKa是氨基酸残基的溶液pKa。在其它实施方案中,氨基酸残基的pKa是在相应的野生型蛋白的情境中所述氨基酸残基的pKa。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约10.0或小于约4.0的pKa的氨基酸残基置换具有约4.0至约10.0间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约10.0或小于约4.0的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个保守性氨基酸置换中的至少一个包括用具有大于约9或小于约7的pKa的氨基酸残基置换具有约7和约9之间的pKa的氨基酸残基。在其它实施方案中,所述具有大于约9或小于约7的pKa的氨基酸残基选自:Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约6.0至约8.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约8.0或小于约6.0的pKa的氨基酸残基置换具有约6.0至约8.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换具有约7.0至约9.0范围内的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用具有大于约9.0或小于约7.0的pKa的氨基酸残基置换具有约7.0至约9.0之间的pKa的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换选自His,Glu,Asp,Tyr和Lys的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述一个或多个氨基酸置换中的至少一个为用丙氨酸残基置换氨基酸残基。
在一些实施方案中,所述合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内相对于相应的野生型蛋白降低所述蛋白的缓冲能力的一个或多个氨基酸保守性氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换中的至少一个包括用另一个氨基酸残基置换在相应的野生型蛋白中为至少20%,至少25%,至少30%,至少35%或至少40%溶剂暴露的氨基酸残基。
在一些实施方案中,所述聚合酶包含在约pH 4至约pH 10,约pH5.5至约pH 9.5或约pH 7至约pH 9的范围内实质上去除所述聚合酶的缓冲能力的一个或多个保守性氨基酸置换。
在一些实施方案中,所述聚合酶选自A家族DNA聚合酶;B家族DNA聚合酶;混合型聚合酶;未归类的DNA聚合酶和RT家族聚合酶;以及它们的变体和衍生物。
在一些实施方案中,所述DNA聚合酶为A家族DNA聚合酶,其选自Pol I型DNA聚合酶,例如大肠杆菌DNA聚合酶,大肠杆菌DNA聚合酶的Klenow片段,Bst DNA聚合酶,Taq DNA聚合酶,铂TaqDNA聚合酶系列,T7DNA聚合酶和Tth DNA聚合酶。在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶。在其它实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶。在一些实施方案中,所述DNA聚合酶为大肠杆菌DNA聚合酶的Klenow片段。在一些实施方案中,所述聚合酶为Taq DNA聚合酶。在一些实施方案中,所述聚合酶为T7DNA聚合酶。
在其它实施方案中,所述DNA聚合酶为B家族DNA聚合酶,其选自Tli聚合酶,Pfu聚合酶,Pfutubo聚合酶,Pyrobest聚合酶,Pwo聚合酶,KOD聚合酶,Sac聚合酶,Sso聚合酶,Poc聚合酶,Pab聚合酶,Mth聚合酶,Pho聚合酶,ES4聚合酶,VENT聚合酶,DEEPVENT聚合酶,噬菌体Phi29聚合酶和噬菌体B103聚合酶。在一些实施方案中,所述聚合酶为噬菌体Phi29DNA聚合酶。在一些实施方案中,所述聚合酶为噬菌体B103聚合酶,这包括例如,美国专利公开号20110014612中所公开的变体。
在其它实施方案中,所述DNA聚合酶为混合型聚合酶,其选自EX-Taq聚合酶,LA-Taq聚合酶,Expand聚合酶列和Hi-Fi聚合酶。在其它实施方案中,所述DNA聚合酶为未归类的DNA聚合酶,其选自Tbr聚合酶,Tfl聚合酶,Tru聚合酶,Tac聚合酶,Tne聚合酶,Tma聚合酶,Tih聚合酶和Tfi聚合酶。
在其它实施方案中,所述DNA聚合酶为RT聚合酶,其选自HIV逆转录酶,M-MLV逆转录酶和AMV逆转录酶。在一些实施方案中,所述聚合酶为HIV逆转录酶或具有DNA聚合酶活性的其片段。
在一些实施方案中,所述DNA聚合酶为Bst DNA聚合酶,其包含在约pH 4至约pH 10的范围内实质上降低其缓冲能力的一个或多个氨基酸置换。在一些实施方案中,所述一个或多个氨基酸置换在约pH 4至约pH 10的范围内实质上去除所述聚合酶的缓冲能力。
在一些实施方案中,Bst DNA聚合酶中的所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低所述聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内实质上去除Bst聚合酶的缓冲能力。在一些实施方案中,所述一个或多个氨基酸置换在约pH 7至约pH 9的范围内相对于未置换的Bst聚合酶实质上降低Bst聚合酶的缓冲能力。在一些实施方案中,所述未经置换的聚合酶可以是Bst聚合酶的野生型形式。
在一些实施方案中,Bst DNA聚合酶中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。在其它实施方案中,所述至少一个保守性氨基酸置换选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。
在一些实施方案中,所述一个或多个保守性氨基酸置换为表2中所示的一个或多个氨基酸残基。在一些实施方案中,所述一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQ ID NO:1的编号。
在一些实施方案中,所述一个或多个氨基酸置换包括用Met,Asn,Gln,Leu,Ile,Phe或Trp置换位置2的丙氨酸,其中氨基酸残基的编号是根据SEQ ID NO:2的编号。
在一些实施方案中,所述Bst DNA聚合酶包含选自SEQ ID NO:2,SEQ ID NO:3和SEQ ID NO:4,或具有一个或多个保守性氨基酸置换的它们的变体的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:2的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ ID NO:2中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ ID NO:2至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:3的氨基酸序列。在一些实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:3中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:3至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述Bst DNA聚合酶包含SEQ ID NO:4的氨基酸序列。在其它实施方案中,所述Bst DNA聚合酶是包含SEQ IDNO:4中所示氨基酸序列的蛋白的变体,其中所述变体包含与SEQ IDNO:4至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%或至少99%同一的氨基酸序列。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为TherminatorTM DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换,其中所述一个或多个保守性氨基酸置换选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表5中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为KOD DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表6中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在一些实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 4至约pH 10的范围内相对于相应的未经置换的聚合酶实质上降低其缓冲能力的一个或多个保守性氨基酸置换。所述未经置换的聚合酶可以是所述聚合酶的野生型形式。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
在所述方法的其它实施方案中,所述DNA聚合酶为B103DNA聚合酶,其包含在约pH 7至约pH 9的范围内实质上去除其缓冲能力的一个或多个保守性氨基酸置换。所述一个或多个保守性氨基酸置换任选地选自:组氨酸至精氨酸,谷氨酸至谷氨酰胺,赖氨酸至精氨酸和酪氨酸至苯丙氨酸。在一些实施方案中,所述一个或多个保守性氨基酸置换为表7中所示的一个或多个氨基酸残基。
可使用任何利用聚合酶进行的、涉及核苷酸掺入和/或引物延伸的核酸合成方法来实施、使用或进行任何所公开的方法、组合物、系统、装置和试剂盒。通常,聚合酶能够催化将核苷酸掺入到延伸中的核酸分子的末端3’OH。当所述延伸中的核酸分子包括引物时,此过程通常被称作“引物延伸”。通常但不是必然地,这种核苷酸掺入以模板依赖性方式进行。通常,通过在核苷酸掺入条件下当水性溶液中存在核苷酸时,使核酸模板与聚合酶相接触而进行引物延伸和其它核苷酸掺入测定。在一些实施方案中,所述核苷酸掺入反应可包括引物,其可任选地与模板相杂交以形成引物-模板双链体。通常,一旦模板,聚合酶,核苷酸以及任选地引物在合适的水性制剂中彼此混合,从而形成核苷酸掺入反应混合物(或引物延伸混合物),则核苷酸掺入条件就实现了。水性制剂可任选地包括二价阳离子和/或盐,特别是Mg++和/或Ca++离子。典型的核苷酸掺入条件包括了对于下述的熟知的参数:时间,温度,pH,试剂,缓冲剂,试剂,盐,辅因子,核苷酸,靶DNA,引物DNA,酶(例如核酸依赖性聚合酶),反应中组分的量和/或比例等。所述试剂或缓冲剂可包括单价离子源,例如KCl,K-醋酸,NH4-醋酸,K-谷氨酸,NH4Cl或硫酸铵。所述试剂或缓冲剂可包括二价离子源,例如Mg2+和/或Mn2+,MgCl2或Mg-醋酸。大多数聚合酶在约5.0至约9.5的pH范围内、更通常在约pH 7至约pH 9之间,有时在约pH 6至约pH 8之间显示出某些水平的核苷酸掺入活性。缓冲剂可包括螯合剂,例如EDTA和EGTA等。虽然在一些实施方案中,核苷酸掺入反应可包括缓冲剂,例如Tris,三甲基甘氨酸,HEPES,MOPS,ACES或MES,其可提供约5.0至约9.5的pH范围,当进行需要检测离子副产物的基于离子的反应时,此类缓冲试剂可任选地被减少或去除。进行核酸合成的方法是在本领域中被熟知并广泛实践的,且可容易地获得教导广泛的核酸合成技术的参考文献。关于进行核酸合成(包括例如,模板依赖性核苷酸掺入以及引物延伸方法)的一些示例性教导可在下列中找到,例如Kim等人,Nature 376:612-616(2002);Ichida等人,Nucleic Acids Res.33:5214-5222(2005);Pandey等人,European Journal of Biochemistry,214:59-65(1993);Blanco等人,J.Biol.Chem.268:16763-16770(1993);美国专利申请系列号12/002781,现作为美国专利公开号2009/0026082公布;美国专利申请系列号12/474897,现作为美国专利公开号2010/0137143公布;以及美国专利申请系列号12/492844,现作为美国专利公开号2010/0282617公布;美国专利申请系列号12/748359,现作为美国专利公开号20110014612公布。
在一些实施方案中,本公开还涉及利用涉及相互依赖的核苷酸掺入和核苷酸切除的反应来分析(例如测序)核酸的模式。如本文中所使用的,相互依赖的核苷酸掺入和核苷酸切除是指,两种反应都在相同的核酸分子上、在所述核酸上的邻接位点处发生,并且一种反应促进另一种。这种反应的一个实例是缺口平移反应。如本文中所使用的,缺口平移反应是指由具有5'至3'外切核酸酶活性的聚合酶催化的反应,其包括将核苷酸掺入双链DNA的切口区域的游离3'端和切除位于双链DNA切口区域游离5’端的核苷酸。因此,缺口平移是指切口位点沿着DNA切口链在5'至3'方向中的运动。如将被本领域技术人员所认识的,缺口平移反应包括基于双链DNA的完整链的合成测序反应。此链作为模板起作用,由所述链合成新的链。所述方法不要求使用引物,因为所述双链DNA能够独立地引发反应。虽然本公开(包括下面的段落)为了简明可经常提及“缺口平移”,要理解,本公开的范围包括用于代替传统的缺口平移的任何其它核苷酸切除和掺入的组合反应。
所述缺口平移方式具有两个特征,使得它很适合用于本文所提供的核苷酸掺入和测序方法。首先,缺口平移反应引起了从每个组合的切除/掺入步骤释放两个氢离子,从而每一次当核苷酸被掺入新合成的链中时都在chemFET处提供更强的信号。合成测序方法在没有核苷酸切除时,释放一个氢离子/核苷酸掺入。相反,缺口平移在核苷酸掺入后释放第一个氢离子而在切除另一个核苷酸后释放第二个氢离子。这增加了能在chemFET处被感应到的信号,从而增加了信噪比并提供了更确定的核苷酸掺入的读取。
第二,使用双链DNA模板(而不是单链DNA模板)引起模板更少地干扰被释放的离子和chemFET处更好的信号。单链DNA具有能够干扰(例如,螯合)氢离子的暴露的基团。这些反应活性基团在双链DNA中被屏蔽,其中它们与互补的基团形成氢键。通过被屏蔽,这些基团不实质上影响氢离子水平或浓度。因此,与单链模板相比,来自氢离子释放的信号在存在双链模板时更大,信噪比也将如此,从而进一步促成更为确定的核苷酸掺入的读取。
适于缺口平移的模板通常是完全或部分双链的。这种模板包含开口(或切口),其作为聚合酶的进入点起作用。可以受控的方式将所述开口引入模板中,如下文中所描述的以及本领域中已知的。
如本领域技术人员将领会的,优选的是,这些开口在所述多个相同模板的每一个中都存在于模板序列的相同位置处。涉及缺口平移的典型分子生物学技术使用沿双链DNA随机产生的缺口,因为其目的是产生经可检测地标记的核酸。这些现有技术的方法通过使用不依赖序列的切口酶(例如DNase I)产生切口。然而,在许多方法中,切口的位置对于相同序列的所有模板必须是已知的、非随机的和均一的。实现这一点的各种方式是本领域中已知的,其中的一些将在下文中通过非限制性实例的方式进行讨论。
合适的缺口平移模板的另一个实例是自引发性核酸。所述自引发性核酸可包括能够自我退火以引发核酸合成反应的双链和单链区域。单链区域通常为与目的核酸相连的已知的合成的序列。其长度可被预先确定并且被工程化以在自我退火后产生开口,此类开口可作为聚合酶的进入点起作用。
要理解,如术语在本文中所使用的,有切口的核酸(例如有缺口的双链核酸)为具有开口(例如主链中的断裂,或者具有脱碱基位点等)的核酸,聚合酶能够从所述开口处掺入和任选地切除核苷酸。此术语不限于被酶(例如切口酶)作用的核酸,也不简单地限于核酸主链中的断裂,如基于本文中所描述的用于产生这种核酸的示例性方法而将清楚的。
一旦产生了缺口的双链核酸,它们然后将经受缺口平移反应。如果进行缺口平移反应是为了对模板核酸进行测序,则可以与本文所描述的合成测序方法平行的方式进行缺口平移。更具体地,在一些实施方案中,四种核苷酸中的每一种都在具有5'至3'外切核酸酶活性的聚合酶的存在下分别与经切口的模板相接触。在其它实施方案中,使用已知的核苷酸组合。合适的酶的实例包括来自大肠杆菌的DNA聚合酶I,Bst DNA聚合酶以及Taq DNA聚合酶。核苷酸的顺序是不重要的,只要其是已知的并且优选在运行的过程中保持是相同的。在每一种核苷酸与经切口的模板接触后,将其洗掉,随后引入另一种核苷酸,正如本文中所描述的。在缺口平移实施方案中,清洗会将所切除的核苷酸带离chemFET。
应领会,如同本文所描述的其它方面和实施方案,被掺入到切口区域中的核苷酸不需要被外在标记,因为作为读取所检测的是它们的掺入的副产物而不是所掺入的核苷酸本身。因此,缺口平移方法可被称作无标记物的方法,或无荧光的方法,因为掺入检测不依赖于被掺入的核苷酸上的外在标记。所述核苷酸通常为天然存在的核苷酸。还应认识到,由于所述方法受益于连续掺入尽可能多的核苷酸,所述核苷酸不是,例如引起过早链终止的经修饰的形式,例如某些测序方法中所使用的那些。
实施例
实施例1.经修饰的Bst DNA聚合酶的设计和表达
使用H++和PropKa二者来分析Bst DNA聚合酶的大片段的氨基酸序列(具有SEQ ID NO:1的氨基酸序列),以计算折叠的蛋白结构中可滴定侧链的pKa。表2和3显示了Bst DNA聚合酶内的氨基酸的经计算的pKa。栏1显示了氨基酸残基,其编号是基于SEQ IDNO:1的编号;栏2显示了侧链的经计算的pKa。栏3指示的是残基可在蛋白表面被接触(S)还是被包埋(B),如通过检查蛋白结构所确定的。表2中显示的值是使用PropKa确定的,而表3中的值是使用H++确定的。
具有约pH 6至约pH 8.0范围内的经计算的pKa(如通过所述两种算法中的任一种所确定的)的氨基酸残基被靶向用于置换。使用常规的技术来突变编码Bst DNA聚合酶的大片段(具有SEQ ID NO:1的氨基酸序列)的核酸序列以在所编码的蛋白产物中引入下列氨基酸置换:His46Arg,Glu446Gln和His572Arg。所产生的氨基酸序列显示在SEQ ID NO:2中。经置换的氨基酸有下划线并且为粗体。
MAKMAFTLADRVTEEMLADKAALVVEVVEENYHDAPIVGIAVVNE
Figure BDA00002253041401461
GRFFLRFETALADPQFVAWLGDETKKKSMFDSKRAAVALKWKGIELCGVSFDLLLAAYLLDPAQGVDDVAAAAKMKQYEAVRPDEAVYGKGAKRAVPDEPVLAEHLVRKAAAIWELERPFLDELRRNEQDRLLVELEQPLSSIIAEMEFAGVKVDTKRLEQMGKEIAEQLGTVEQRIYELAGQEFNINSPKQLGVILFEKLQLPVLKKTKTGYSTSADVLEKLAPYHEIVENILHYRQLGKLQSTYIEGLLKVVRPDTKKVHTIFNQAITQTGRLSSTEPNLQNIPIRLEEGRKIRQAFVPSESDWLIFAADYSQIELRVLAHIAEDDNLMEAFRRDLDIATKTAMDIFQVSEDEVTPNMRRQAKAVNFGIVYGISDYGLAQNLNISRKEAAEFIERYF
Figure BDA00002253041401462
SFPGVKRYMFNIVQEAKQKGYVTTLLRRRRYLPDITSRNFNVRSFAERMAMNTRIQGSAADIIKKAMIDLNAPIKEERIQAUILLQVHDEIILEAPKEEMERLCRLVPEVMEQAVTLRVPLEVDY
Figure BDA00002253041401463
YGSTWYDAK  SEQ ID NO:2
使用常规的技术进一步突变编码SEQ ID NO:2的核酸序列以产生具有额外突变的编码聚合酶的核酸序列。与SEQ ID NO:2相比,SEQ ID NO:3含有两个其它的氨基酸置换:His473Arg和His528Ala。因此,与参照野生型序列SEQ ID NO:1相比,SEQ ID NO:3总共含有五个氨基酸置换。与SEQ ID NO:1相比经置换的氨基酸加了下划线并且为粗体。
MAKMAFTLADRVTEEMLADKAALVVEVVEENYHDAPIVGIAVVNE
Figure BDA00002253041401464
GRFFLRPETALADPQFVAWLGDETKKRSMFDSKRAAVALRWKGIELCGVSFDLLLAAYLLDPAQGVDDVAAAARMKQYEAVRPDEAVYGKGAKRAVPDEPVLAEHLVRKAAAIWEIERPFLDELRRNEQDRLLVELEQPLSSILAEMEFAGVKVDTKRIEQMGKELAEQLGTVEQRIYELAGQEFNINSPKQLGVILFEKLQLPVIRKTKTGYSTSADVLFKLAPYHEIVFNILHYRQLGKIQSTYIEGILKVVRPDTKKVHTIFNQALTQTGRLSSTFPNLQNIPIRLEEGRRIPQAFVPSESDWLIFAADYSQIFLRVLAHIAEDDNLMEAFRRDLDIHTKTAMDIFQVSEDEVTPNMRRQAKAVNFGIVYGISDYGLAQNLNISRKEAAFFIERYFSFPGVKRYMFNIVQEAKQKGYVTTLL
Figure BDA00002253041401466
RREYLPDITSRNFNVESFAERMAMNTPIQGSAADIIKKAMIDLNARLKEERLQA
Figure BDA00002253041401467
LLLQVHDELILEAPKFEMERLCRLVPEVMEQAVTLRVPLRVDY
Figure BDA00002253041401468
YGSTWYDAK
SEQ ID NO:3
与SEQ ID NO:3相比,SEQ ID NO:4含有三个额外的氨基酸置换:His281Ala,His273Arg和Tyr477Phe。因此,与参照野生型序列SEQ ID NO:1相比,SEQ ID NO:4总共含有8个氨基酸置换。与SEQID NO:1相比经置换的氨基酸加了下划线并且为粗体。
MAKMAFTLADRVTEEMLADKAALVVEVVEENYHDAPIVGIAVVNE
Figure BDA00002253041401471
GRFFLRPETALADPQFVAWLGDETKKESMFDSKRAAVALKWKGIELCGVSFDLLLAAYLLDPAQGVDDVAAAAKMKQYEAVRPDEAVYGKGAKRAVPDEPVLAEHLVRKAAAIWELERPFLDELRRNEQDRLIVELEQPLSSILAEMRFAGVKVDTKRLEQMGRELAEQLGTVEQRIYEIAGQEFNINSPKQLGVILFEKLQLPVLKKTRTGYSTSADVLEKLAPY
Figure BDA00002253041401472
EIVENIL
Figure BDA00002253041401473
YRQLGKIQGTYIEGLLKVVRPDTKKVETIFNQALTQTGRLSSTEPNLQNIPIRLEEGRKIRQAFVPSESDWLIFAADYSQIELEVLAHIAEDDNLMEAFRRDLDIHTKTAMDIFQVSEDEVTPNMRRQAKAVNFGIVYGISDYGLAQNLNISRKEAAFFIERYF
Figure BDA00002253041401474
SFPGVKRYMENIVQEAKQKGYVTTLL
Figure BDA00002253041401475
RRR
Figure BDA00002253041401476
LPDITSRNFNVESFAERMAMNTPIQGSAADIIKKAMIDLNARLKEERLQA
Figure BDA00002253041401477
LLLQVHDELILEAPKEEMERLCRLVPEVMEQAVTLRVPLKVDY
Figure BDA00002253041401478
YGSTWYDAK  SEQ ID NO:4
使用常规的技术在大肠杆菌宿主中表达编码SEQ ID NO:2,SEQID NO:3和SEQ ID NO:4的经突变的核酸序列,并且纯化经修饰的蛋白。
实施例2:对于大肠杆菌SSB中的修饰确定候选氨基酸
使用PropKa分析了具有SEQ ID NO:19的氨基酸序列的大肠杆菌的单链DNA结合蛋白的氨基酸序列。
1
ASRGVNRVILVGNLGQDPEVRYMPNGGAVANITLATSESWRDKATSEMKEQTEWHRVVLF
61
GKLAEVASEYIRKGSQVYIEGQLRTRKWTDQSGQDRYTTEVVVNVGGTMQMIGGRQGGGA
121PAGGNIGGGQPQGGWGQPQQPQGGN
(SEQ ID NO:19)
表4中显示了具有可滴定侧链的氨基酸残基的经计算的pKa。
具有约pH 4.0至约pH 10.0范围内的经计算的pKa值的氨基酸残基被靶向用于置换。使用常规的方法产生、表达和纯化包含这些置换的经修饰的SSB蛋白。
实施例3:对于KOD DNA聚合酶中的修饰确定候选氨基酸
下面显示了TherminatorTM DNA聚合酶(SEQ ID NO:5)的氨基酸序列:
MILDTDYITENGKPVIRVFKKENGEFKIEYDRTFEPYFYALLKDDSAIEDVKKVTAKRHGTVVKVKRAEKVQKKFLGRPIEVWKLYFNHPQDVPAIRDRIRAHPAVVDIYEYDIPFAKRYLIDKGLIPMEGDEELTMLAFDIETLYHEGEEFGTGPILMISYADGSEARVITWKKIDLPYVDVVSTEKEMIKRFLRVVREKDPDVLITYNGDNFDFAYLKKRCEELGIKFTLGRDGSEPKIQPMGDRFAVEVKGRIHFDLYPVIRRTINLPTYTLEAVYEAVFGKPKEKVYAEEIAQAWESGEGLERVARYSMEDAKVTYELGREFFPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYKRNELAPNKPDERELARRRGGYAGGYVKEPERGLWDNIVYLDFRSLYPSIIITRNVSPDTLNREGCKEYDVAPEVGHKFCKDPPGFIPSLLGDLLEERQKIKRKMKATVDPLEKKLLDYRQRAIKILANSFYGYYGYAKARWYCKECAESVTAWGREYIEMVIRELEEKFGFKVLYADTDGLHATIPGADAETVKKKAKEFLKYINPKLPGLLELEVEGFYVRGFFVTKKKYAVIDEEGKITTRGLEIVRRDWSEIAKETQARVLEAILKHGDVEEAVRIVKEVTEKLSKYEVPPEKLVIHEQITRDLRDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIGDRAIPADEFDPTKHRYDAEYYIENQVLPAVEPILKAFGYRKEDLRYQKTKQVGLGAWLKVKGKK
(SEQ ID NO:5)
使用PropKa分析了TherminatorTM聚合酶的氨基酸序列(SEQID NO:5)。表5中显示了TherminatorTM聚合酶的具有可滴定侧链的氨基酸残基的经计算的pKa。栏1显示了氨基酸残基;栏2显示了由PropKa计算的蛋白中氨基酸残基的pKa;栏3中显示了溶液中氨基酸的模型pKa值。
具有约pH 4.0至约pH 10.0范围内的经计算的pKa值的氨基酸残基被靶向用于本文中所描述的任何选择和修饰原理中所采用的置换。使用常规的遗传工程化方法合成、克隆、表达和纯化编码包含这些置换的所产生的经修饰的聚合酶的核酸序列。
实施例4:确定用于KOD DNA聚合酶中的修饰的候选氨基酸
使用PropKa分析了KOD DNA聚合酶的氨基酸序列(SEQ IDNO:6)。
MILDTDYITEDGKPVIRIFKKENGEFKIEYDRTFEPYFYALLKDDSAIEEVKKITAERHGTVVTVKRVEKVQKKFLGRPVEVWKLYFTHPQDVPAIRDKIREHPAVIDIYEYDIPFAKRYLIDKGLVPMEGDEELKMLAFDIETLYREGEEFAEGPILMISYADEEGARVITWKNVDLPYVDVVSTEREMIKRFLRVVKEKDPDVLITYNGDNFDFAYLKKRCEKLGINFALGRDGSEPKIQRMGDRFAVEVKGRIHEDLYPVIRRTINLPTYTLEAVYEAVFGQPKEKVYAEEITTAWETGENLERVARYSMEDAKVTYELGKEFLPMEAQLSRLIGQSLWDVSRSSTGNLVEWFLLRKAYERNELAPNKPDEKELARRRQSYEGGYVKEPERGLWENIVYLDFRSLYPSIIITHNVSPDTLNREGCKEYDVAPQVGHRFCKDFPGFIPSLLGDLLEERQKIKKKMKATIDPIERKLLDYRQRAIKILANSYYGYYGYARARWYCKECAESVTAWGREYITMTIKETEEKYGFKVIYSDTDGFFATIPGADAETVKKKAMEFLKYINAKLPGALELEYEGPYKRGFFVTKKKYAVIDEEGKITTRGLEIVRRDWGEIAKETQARVLEALLKDGDVEKAVRIVKEVTEKLSKYEVPPEKLVIREQITRDLKDYKATGPHVAVAKRLAARGVKIRPGTVISYIVLKGSGRIGDRAIPFDEFDPTKHKYDAEYYIENQVLPAVEFILRAFGYRKEDLRYQKTRQVGLSAWLKPKGT
(SEQ ID NO:6)
表6中显示了具有可滴定侧链的氨基酸残基的经计算的pKa。栏1显示氨基酸残基;栏2显示由PropKa计算的蛋白中氨基酸残基的pKa;栏3显示溶液中氨基酸的模型pKa值。
具有约pH 4.0至约pH 10.0范围内的经计算的pKa值的氨基酸残基被靶向用于置换。使用常规的方法产生、表达和纯化包含这些置换的经修饰的聚合酶。
实施例5:确定用于B103DNA聚合酶中的修饰的氨基酸残基
下面的SEQ ID NO:7中显示了源自所公开的细菌噬菌体B103的DNA聚合酶序列的B103型聚合酶的氨基酸序列。
1 mprkmfscdf etttklddcr vwaygymeig nldnykigns ldefmqwvmeiqadlyfhnl
61 kfdgafivnw lehhgfkwsn eglpntynti iskmgqwymi dicfgykgkrklhtviydsl
121 kklpfpvkki akdfqlpllk gdidyhaerp vgheitpeey eyikndieiiaraldiqfkq
181 gldrmtagsd slkgfkdils tkkfnkvfpk lslpmdkeir rayrggftwlndkykekeig
241 egmvfdvnsl ypsqmysrpl pygapivfqg kyekdeqypl yiqrirfefelkegyiptiq
301 ikknpffkgn eylknsgaep velyltnvdl eliqehyemy nveyidgfkfrektglfkef
361 idkwtyvkth ekgakkqlak lmlnslygkf asnpdvtgkv pylkedgslgfrvgdeeykd
421 pvytpmgvfi tawarfttit aaqacydrii ycdtdsihlt gtevpeiikdivdpkklgyw
481 ahestfkrak ylrqktyiqd iyakevdgkl iecspdeatt tkfsvkcagmtdtikkkvtf
541 dnfrvgfsst gkpkpvqvng gvvlvdsvft ik
(SEQ ID NO:7)
可在美国专利公开号20110014612中找到关于SEQ ID NO:7的B103型聚合酶的进一步细节。
对SEQ ID NO:7的B103型DNA聚合酶进行突变以去除潜在的缓冲性侧链并从而降低B103型聚合酶的缓冲能力可包括用精氨酸置换任意一个或多个组氨酸残基和/或用丙氨酸置换任意一个或多个谷氨酸残基,如表7中所示。突变可进一步包括用丝氨酸置换任意一个或多个半胱氨酸残基,也如表7中所示。
任选地,所述经修饰的B103型聚合酶也可包括SEQ ID NO:7的氨基酸序列并进一步包括氨基酸置换D166A,其降低3’至5’外切核酸酶活性。外切核酸酶活性的降低或消除在涉及检测核苷酸掺入的应用(例如基于离子的核酸测序)中可以是有用的。
SEQ ID NO:7的B103型DNA聚合酶的氨基酸序列与细菌噬菌体Phi29的DNA聚合酶是高度同源的,如SEQ ID NO:18中所显示的。
1   MKBMPPKMYS CAFETTTKVE DCRVWAYGYM MIEDHSKYKI GKSLDEFMAW VLKVQADLYF
61  NNLKFAGAFI INWLERKGFK WSADGLFNTY NTIISRMGQW YMIDICIGYK GKRKIHTVIY
121 QSLKKLPEFV KKIAKDFKLT VLKGDIDYHK EPPVGYKITP EEYAYIKNDI QIIAEALIIQ
181 FKQGLDKMTA GSDSLKGFKD IITTFEFKKV FPTISIGLUK EVRYAYRGGF TWLNDRFKEK
241 EIGEGMVFDV NSLYFAQMYS RLLFYGEPIV FEGKYVWDED YPLHTQHIFC EFELKEGYIP
301 TIQIKRSBFY KGKEYLKGGG GEIADLWLSN VDLELMKEHY DUYNVEYISG LKFKATTGLF
361 BDRTDKWTYI KTTSEGAIKQ LAKLMLNSLY GEFASRPDVT GKVPYLKENG ALGFRLGEES
421 TKDFVYTPMG VFITAWARYT TITAAQACYD RIIYCDTDSI HLTGTEIFDV IKDIVDPKKL
481 GYWAHESTFK KAKYLRQKTY IQDIYMKEVD GKLVEGSPDD YTDIKFSVEC AGMTDKIKKS
541 VTFENFKVGF SKKMKVKPVQ VPGGVVLVDD TFTIK
(SEQ ID NO:18)
Phi 29DNA聚合酶的晶体结构是已知的(Kamtekar等人,EMBOJ.25:1335-1343(2006))。由于B103的DNA聚合酶有可能折叠成为与Phi29的结构类似的结构,通过程序(例如PropKa)来分析Phi29DNA聚合酶(SEQ ID NO:18)的序列以确定具有约pH 4.0至约pH10.0范围内的pKa的氨基酸残基。然后,对B103DNA聚合酶中相应的氨基酸进行置换,如使用图2中所示的氨基酸序列比对所确定的。
使用常规的方法产生、表达和纯化包含任意上述置换的经修饰的聚合酶。
实施例6:测定经修饰的蛋白的非缓冲特性
通过进行本领域中已知的标准滴定来评估SEQ ID NO:2,SEQID NO:3和SEQ ID NO:4的经修饰的Bst DNA聚合酶的缓冲特性。将所述经修饰的聚合酶的滴定曲线与具有SEQ ID NO:1的氨基酸序列的未经修饰的蛋白的滴定曲线进行比较。对于实施例2-5中所描述的其它经修饰的蛋白进行了类似的滴定。
实施例7:经修饰的Bst DNA聚合酶在示例性的基于离子的 DNA测序反应中的应用
使用Personal Genome Machine(PGMTM)系统(AppliedBiosystems,Part Number 4462921)在测序反应中对SEQ ID NO:2的经修饰的Bst聚合酶与未经修饰的聚合酶(SEQ ID NO:1)进行比较。所述Personal Genome MachineTM系统使用半导体传感器阵列来测量当聚合酶向DNA模板添加核苷酸时所产生的氢离子。
使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶来利用Ion Torrent PGMTM测序仪对核酸模板进行测序。使用IonTorrent PGMTM测序仪进行基于离子的测序的示例性指导可在随IonTorrent PGMTM 314测序系统提供的用户指南中找到(包括PGMTM314文库制备用户指南,PGMTM模板制备用户指南和Ion PGMTM315测序芯片用户指南以及Ion Torrent PGMTM测序用户指南,所有这些都在此通过引用而并入)。
根据下列示例性的方案进行测序:
文库制备
简要地,文库制备方案被用于制备片段大小具有50–60bp的分布范围且中值大小在180–210bp左右的DNA文库。每个文库片段的侧翼都有A和B适配子,这允许随后的扩增。
基本上按照下列步骤来制备文库:
DNA片段化:
Figure BDA00002253041401521
超声系统剪切DNA,基本上是根据制造商提供的方案。
将一等份经超声的DNA稀释并在BioAnalyzerTM高灵敏性DNA
Figure BDA00002253041401522
或琼脂糖凝胶上进行分析以确认片段大小为约50–500bp,其中峰值为200bp左右。
使用Ion片段文库试剂盒中提供的缓冲剂和酶混合物对经片段化的DNA进行末端修复,基本上使用下列步骤:
根据下表制备末端修复反应混合物,然后在室温下孵育20分钟:
Figure BDA00002253041401523
使用
Figure BDA00002253041401531
试剂盒纯化DNA。
适配子连接:
使用连接酶和所提供的缓冲液将与Ion Torrent PGMTM一同提供的扩增适配子与DNA相连接。在无核酸酶的水中将所述缓冲液和连接酶与经末端修复的DNA混合并使其在室温下静置30分钟。
然后,使用
Figure BDA00002253041401532
试剂盒(Beckman Coulter)纯化DNA,基本上是根据制造商提供的方案。
然后,使用Pippin
Figure BDA00002253041401533
装置(SAGE Biosciences)对经纯化的DNA进行大小选择,基本上是根据由制造商提供的方案。当分离完成时,从洗脱室中回收经大小选择的DNA并将其转移到新的微量离心管中。
然后,使用
Figure BDA00002253041401534
试剂盒(BeckmanCoulter)纯化DNA,基本上是根据制造商提供的方案。
缺口平移和扩增:
通过将DNA和引物混合物与
Figure BDA00002253041401535
PCR SuperMixHighFidelity混合来制备缺口平移和扩增反应混合物,并使用标准的PCR反应条件在热循环台上进行扩增。
然后,使用
Figure BDA00002253041401536
试剂盒(Beckman Coulter)纯化DNA,基本上是根据制造商提供的方案。
然后通过将经清洗的珠子与经大小选择和纯化的DNA孵育,并且伴随8-10rpm的摇动在室温下孵育20分钟而将所述文库与经清洗的
Figure BDA00002253041401537
链霉抗生素蛋白珠相连接。
在缓冲液中将连接了珠子的文库清洗两次,然后在包括0.125NNaOH的碱溶液中重悬。收集上清液,中和并纯化,使用样品,使用
Figure BDA00002253041401538
基本上是根据基本上是根据制造商提供的方案。
使用
Figure BDA00002253041401539
定量试剂盒或BioAnalyzerTMRNA 6000Pico
Figure BDA000022530414015310
来进行质量评估和文库定量,基本上是根据制造商提供的方案。
模板制备
基本上按照下面的方案将核酸模板扩增到水凝胶基质上(“IonSphere”,基本上按照所描述的制备):
确定对于emPCR最佳的文库浓度
评估了模板文库的浓度,将模板DNA稀释到适当的浓度。然后,通过将下列组分混合来进行乳液PCR:
  试剂   体积(μL)
  无核酸酶的水   344
  AmpMix   105
  MgCl2溶液   105
  dNTP   105
  引物混合物   105
  TIPP(NEB)   2
  聚合酶   126
  Ion SphereTM颗粒   140
  文库   18
  总计   1050
然后,将扩增混合物转移到油相中,伴随摇动。然后,使乳液经受PCR扩增,其中使用标准的热循环条件。
然后,通过用丁醇和己烷提取乳液来回收包括经扩增的核酸的IonSphere颗粒,然后在缓冲液中清洗所回收的颗粒。
通过用变性溶液清洗球体,用富集引物孵育并用链霉抗生素蛋白C1珠进行清洗而富集模板阳性的Ion SphereTM颗粒。然后,利用在包括NaOH的碱溶液中进行适当的清洗而使富集的颗粒与
Figure BDA00002253041401542
链霉抗生素蛋白C1珠分离。
测序
在Ion Torrent PGMTM测序中对经扩增的核酸模板(与水凝胶基质相结合并且基本上根据前述方案进行制备)进行测序,其中使用与测序试剂盒一起提供的测序引物。基本上,将水凝胶基质上经扩增的模板重悬于测序缓冲液中并移液到Ion Torrent 314测序芯片中,所述芯片被置于Ion Torrent PGMTM测序仪中。由PGMTM测序仪引发和进行测序运行。用于测序的试剂条件是6.3mM NaCl2,13mM MgCl2,0.1%Triton X-100,用NaOH调节至pH 7.5。将1μl的59μm聚合酶溶液加入10M珠子/314芯片测序中。核苷酸浓度为50uM。
数据分析
这个部分提供对于测序反应过程中收集的信号的数据处理的各个阶段所应用的软件模块和概念的概述。Torrent Server AnalysisPipeline(即"流水线"),处理来自PGM运行的原始获得数据,且以SFF和FASTQ两种文件格式输出碱基调用(base call)。Torrent浏览器提供用于处理的网络界面,包括许多源自流水线结果的度量,图表和报告特征。
在PGMTM运行过程中,对于每个核苷酸流,产生一个获得文件。每个获得文件包含对于给定的核苷酸流,在芯片的每个孔中的原始信号测量。所以对于314芯片,每个获得流含有约1500000个分别的掺入事件。然后,一系列这种获得文件代表大约1500000个可能的读取。分析流水线将这些原始信号测量转化为掺入测量,并最终转化为每个读取的碱基调用。原始测量是系统将每个孔中的原始pH值转化为电压,而电压被转化为所述电压的数字表示。这种测量在整个芯片上发生许多次/秒。
下面的段落简要描述分析流水线中的高水平模块。每个模块接受特定的输入并产生特定的输出,下面更详细地描述。
DAT处理
DAT处理模块直接处理原始获得文件(acq_*.dat)。
DAT处理行使下列功能:
将原始获得数据加载到存储器中。这包括解压缩数据文件。当数据从PGMTM传出时对其进行解压缩。任选的动态帧速率压缩模式,其中整个核苷酸流过程中的掺入事件的各部分以不同的帧速率被捕获。可变的帧速率允许以高分辨率捕获生物学上特定的事件,而通过允许(在适当时)将多个帧平均化而同时允许减少总体文件的大小。备选地,压缩方式可使用关键帧/差值压缩技术,其中存储初始值,随后对所述初始值进行改变,而不是存储每次的实际值。这产生文件大小的将近2x的减少。
原始测量偏移校正:使用芯片的输出值来存储原始获得数据。每个孔都有自身的参照值,为了将孔与孔进行比较,两个孔可使用共同的参照值。偏移校正取每个获得文件中前几帧的平均值,并从每个孔中减去这一值,从而允许孔测量具有共同的参照值。
插针(pinned)孔识别:由于芯片输出电压的性质,对于任何给定的芯片存在一系列值。PGM装置校准码使大多数孔在硬件类似物到数字转化器的范围内。输出为围绕中央电压的值分布。位于所选的分布之外的孔被认为是'插针的'(ADC范围之外的有功能的孔)。这些插针的孔通常占总可用孔的1%以下。
排除的孔:各种流细胞设置通常在流速特征谱和芯片覆盖区域上进行折衷。例如,对于314芯片,一定百分比的孔被细胞流覆盖且不可被流体地处理。根据芯片种类加载掩码(mask),以将这些孔标记为被排除的,从而使它们不令芯片的深加工复杂化。
分类
分类是确定芯片上每个孔的内容的过程。下面描述分类决定树:一个孔可以是空的或含有颗粒的。对于含有颗粒的孔,所述过程还确定所述颗粒是否为:(a)文库颗粒;(b)测试片段(对照)颗粒;(c)无用颗粒(不产生足够强的序列信号的颗粒);或(d)含糊的颗粒(对于软件似乎既是测试片段又是文库片段)。重要的是在这时注意分类不是简单地将整个芯片作为一个组进行处理。如对于其它流水线模块将提及的,以更小的区域对芯片进行处理。例如将314芯片分为50x50孔的区域,这总共产生约625个区域。这允许平行处理许多小的区域并且利用了具有这种能力的多核心/多过程计算节点。更重要地,芯片上被处理的区域含有流体上类似的孔,其中较小的区域倾向于更均一且允许将区域内的孔彼此进行比较。
默认测序关键和流动顺序
分类模块的下一部分包括将颗粒孔鉴别为测试片段(TF)或文库片段。为了理解算法的这一部分,首先必须理解′密钥(keys)′和流动顺序(flow order)的概念。下面的表8中显示了默认文库和TF测序密钥,其对于给定的默认流动顺序TACG,以碱基-空间和流动-空间两种方式。
表8
Figure BDA00002253041401571
上面矢量中的′X′,是指所述值至少为一,但是实际上可以更高,因为所述密钥之后的下一个碱基也能够匹配,因而产生了更长的均聚物。
分离
一旦鉴别出孔内的颗粒,就进行分离。在这个步骤中,使用两个测序密钥来比较每个读取。确定孔含有珠子;流动被转化为序列并针对每个密钥进行测试。由于针对两个密钥都进行了测试,确定了对每一个密钥进行测序所需要的流动的数目,并使用二者中较低的数目。向两个密钥中的一个添加多得多的碱基将不会总是产生更好的分离,因为二者中较短的驾驭最终所使用的流动数目。
使用上面的默认密钥和流动顺序,有两个矢量:
TACGTACG
1010010
0100101
此处,然后搜索有效的比较核苷酸对。这意味着比较两个序列,需要满足下面的规则:(1)对于密钥中的每个核苷酸有0-mer和1-mer事件;以及(2)在另一个核苷酸的0-mer事件过程中有来自一个密钥发射的1-mer。
当对于给定的核苷酸两个规则都满足时,有将被使用的分离子“事件”。“事件”越多,两个密钥可被分离得越好。换言之,对于所述两个密钥而言,核苷酸对在流动-空间中是正交的,如粗体的垂直突出对中的:
'T'nuc满足我们的规则:
1010010
0100101
上面,对于'T'nuc流动,文库密钥在第一流动上掺入,并在第二'T'流动上具有0-mer,而TF密钥具有的相反。
对于'A'核苷酸和'C'核苷酸观察到了类似的情形。不能使用'G'核苷酸,因为直至第8流动都没有观察到1-mer事件。不能包括此流动,因为文库中的'G'可以是更大的均聚物段的一部分。因此不能保证那个流动中确切地有1-mer。此外,TF密钥在第一'G'流动中没有1-mer,而是在第一'G'流动中有0-mer'G',这与文库密钥中的相同。
'A'核苷酸满足这些规则:
1010010
0100101
'C'核苷酸满足这些规则:
1010010
0100101
掩码
分类模块的输出是掩码目标(和作为bfmask.bin的文件),其对于每个孔都含有位标记,指示每个孔的内容。
信号处理
信号处理模块聚焦在含有颗粒的孔上,其现在除原始获得数据之外还使用掩码信息。信号是在掺入事件的过程中在孔中测量的。信号具有额外的部分,称作'背景'。信号的这种背景部分在每个流的过程中都存在并且可随时间、跨芯片以及在获取的过程中改变。信号处理问题可被认为具有两部分。第一部分包括获得在给定孔中将会测量到的背景信号,不发生掺入。第二部分包括减去(或适配)背景信号并检测(或适配为)剩余的信号。掺入适配模型的输出产生对于每个孔在每个核苷酸流处的掺入的估测。
此时,来自分析流水线的输出是原始掺入信号测量/孔/流,存储为1.wells文件。
碱基调用
碱基调用器模块进行信号归一化,相和固定偏差估测,信号校正,并且宣布每个孔的每个流的碱基。除了掺入事件之外,其输出非掺入事件。SFF输出文件存储所有这种调用。
归一化
对于每个读取进行归一化。归一化是使用由经过所述密钥的测序产生的已知的预期1-mer信号的方式,并且使用那些信号来确立1-mer平均信号。这起初是使用来自信号处理模块的原始测量的过程。随着碱基调用器处理每个孔,更多的碱基被准确地确定,然后可使用额外的测量来对原始测量的信号进行再归一化以在每个孔的归一化中获得更高的置信,更高的信噪比(SNR)。
固定偏差估测
所观察到的信号固定偏差可归因于测序运行中可发生的DNA聚合酶丢失。通常,这种丢失仅在掺入事件的过程中体验到,并且在运行的过程中,典型的值在0.1至0.2%的范围内。通过将区域内的读取组取平均值以及对它们的测量信号取平均值(归一化之后),可将指数与所获得的曲线相匹配,并且推导出信号随时间丧失的速度。因此,可确定对于掺入事件过程中聚合酶丢失的估测。
相估测
一旦确立了固定偏差,在相模型中使用其作为每个读取的常数。固定偏差估测跨芯片仍可改变,但假定其对于每个处理区域是固定的。然后模型对于每个读取匹配carry-forward和不完整延伸参数,其中是对于有限次数的流并排除某些流。这种匹配的输出是对于每个孔的carry-forward(CF)和不完整延伸(IE)的估测。在小区域中对所述值平均化以减少匹配中的错误和噪声。输出CF和IE值被用作解算器的输入。
解算器
碱基调用器的解算器部分对归一化信号应用相和固定偏差估测值并且对于可能的掺入事件预测每个流的可能的测量值。通过将实际测量的值与预测值列表进行比较,然后使用每个流的最佳匹配预测作为那个流的碱基调用。因此,在每个流处可预测0-mer,1-mer,2-mer等。这个过程在整个读取的过程中继续。在一个经过的最后,已经进行了对于那个读取的所有碱基的良好估测。然后,解算器再次对于所述读取进行迭代,在每个流处应用相同的相和固定偏差,并且提炼碱基调用。这种提炼是有益的,因为关于未来流动上未来碱基的知识现在可以被包括在模型中以更准确地解释carry-forward效应。
读取过滤和修整
读取过滤包括对于每个碱基调用产生各种质量度量,对于每个读取产生质量度量,并使用那些度量来滤掉低质量读取并将读取修整回可接受的质量水平。此外,在每个读取的末端进行适配子修整。
过滤
过滤读取包括计算代表碱基调用器对原始信号进行准确校正和碱基调用的能力的总体质量度量。具有经计算的低质量的读取不被写为SFF文件。低质量读取通常是混合的读取或非常低的拷贝数读取,其产生低质量序列,从而它们不匹配所预期的掺入模型。
简要地,在将序列读取写出来之前,Ion Torrent PGMTM系统对序列读取应用一些质量检查。对读取进行测试以观察它们是否可能是给定孔中单一Ion Sphere颗粒上的混合DNA模板的结果,或者它们是否一般性地为低信号质量。就与适配子序列的匹配以及就尾随低质量区域扫描读取的3'末端。仅通过这些检测的读取的高质量部分被写为SFF和FASTQ文件。
当从Personal Genome Machine(PGMTM)进行数据处理时,鉴别和去除低质量或不确定的碱基调用是递送准确结果的重要考量。在Torrent Suite分析软件中,通过下述从输出中去除低质量碱基:(a)过滤掉整个读取;(b)修整读取的低质量3'末端。
在下面的段落中描述的操作在估测了起初的碱基调用后,作为处理后操作被应用。
读取过滤
读取过滤的目标是去除被估测为包含低质量碱基调用的读取。读取过滤器的种类包括:(1)靶向去除源自具有非克隆性DNA模板群(即不同DNA模板的混合物)的孔的读取的读取过滤器;(2)靶向去除一般为不良地匹配碱基调用模型对于高质量数据的期待的读取。
混合模板读取的去除
有时,在Ion Sphere颗粒上被最终扩增的DNA模板源自多个不同的输入DNA模板。这能够发生的可能方式包括:在乳液PCR阶段开始时囊泡中存在两种或更多种不同的DNA片段,或者不同的乳液囊泡崩裂在一起。
在通常的情景中,每个颗粒使得单一的DNA模板种类在其上扩增,在这种情形中,大约一半的核苷酸流应产生阳性掺入(假设为4-碱基流循环并且在基因组中时均一和随机的核苷酸内容)。当颗粒含有多种不同的DNA模板时,其中可期待阳性掺入信号的流的数目显著增加。
鉴别可能的混合模板读取的有效方式是搜索其中流的异常大的部分被估测具有核苷酸掺入事件的读取。对于版本1.1.0的Torrent Suite软件,对于前60个流(包括密钥流)评价了阳性流的百分比(PPF)。如果PPF值大于60%,则在写出SFF和FASTQ结果之前将所述读取排除。在具有少于60个流的运行中,对于无论为多少的、可用的流评价PPF。
这种PPF过滤器的一个暗示是某些序列可能不被所述软件读出。例如,将期待正好为流动顺序TACG的长序列在每个流上都有阳性掺入,并且作为结果,其将被过滤掉。然而,实践中像这样的序列是很少的,相比于排除小部分的真读取,排除由混合模版产生的低质量读取的益处是有利的。
这一方式的一种例外是关于测试片段,其中的某些是以通常不天然存在的序列设计的并且具有大的预期PPF值。默认的是,软件对于测试片段读取不应用PPF过滤器。
去除较低质量的读取
碱基调用模型具有的某些期望值在孔-表现读取的信号分布附近。一旦估测出不完全延伸(IE)和carry forward(CF)相效应的量,对于相邻流中的信号应如何被升高或压低有一定的期望。例如,当实际上有阳性IE时,大的均聚物运行应在对应于均聚物的流中产生压低的信号值而在相同核苷酸的下一个流中产生升高的信号值。
作为碱基调用模型的一部分,将所观察到的信号值与碱基调用模型对于每个读取在每个流中所预测的值进行比较。这两个量之间的差(观察值减去预测值)被称作所考虑的孔和流的流余留。一般地,高质量的读取被碱基调用模型良好地描述并且其估测的DNA序列应具有低的余留值。
对于每个读取追踪起初的流中余留的中值绝对值,作为所观察到的数据与碱基调用模型相一致的度量。如果中值绝对余留大于某个阈值,则读取被认为是不可信的并且不将其写至SFF和FASTQ输出文件。
对于Torrent Suite软件的1.1.0,对前60个流(包括密钥流)计算中值绝对余留且超过其就拒绝读取的阈值为0.13。
对于文库和测试片段读取都应用中值绝对余留过滤器。
修整
读取修整的目的是去除读取3’端不希望的碱基调用。这种不希望的碱基调用来自:(a)读取上的高质量碱基调用,其经过文库插入一直读取到B-适配子中;和(b)读取3’端的低质量碱基调用。
应用了两个过滤器来修整读取,一个靶向两类不希望的3'碱基中的每一类。分别应用每个过滤器而取二者中较短的作为读取长度。如果所产生的经修整的长度比最小读取长度短,则将所述读取整个过滤掉,否则将所述读取写至SFF和FASTQ文件。
只要修整不将读取长度减少到最小指定允许长度(对于所述软件的版本1.1.0为四个碱基)之下,就将整个读取的流值和碱基调用写到SFF中,无论被修整的长度如何。修整信息被表示在SFF文件中的指定区域中。
去除适配子序列
通过搜索读取与流-空间中已知适配子序列的候选匹配来剪除尾部适配子序列。
碱基调用器通过反转CF和IE的效应而起作用,这产生了相校正的电离图,其被存储在SFF文件中。如果读取延伸到B-适配子中,则此相校正的电离图3'端将展现出适配子序列的特征性模式。
适配子修整是通过测试相校正电离图中的每个位置以观察其与对于所述适配子所期待的模式匹配得怎么样而完成的。所述测试计算测试位置的相校正电离图与所述适配子的已知电离图之间的欧几里德距离。如果此距离落在固定的阈值之下,则相应的位置(从流-空间翻译回读取-空间)被记录为适配子修整位置;否则,读取被认为不具有与所述适配子的匹配。对于Torrent Suite软件的版本1.1.0,所使用的阈值是为5的欧几里德距离。
去除低质量3'端
Ion Torrent读取中的质量得分分布是这样的:最高质量的读出倾向于在读取的起始处存在,在那里相误差在幅度上是最小的。对于在达到模板的末端之前运行到低质量碱基中的读取,剪除3’末端较低质量的读出是有帮助的。使用每碱基的质量得分(下文中进一步描述)进行质量修整。
所述方案是沿读取的碱基扫描,从而在固定长度的窗口中计算出移动平均,并将读取修整点设置为恰好在最早(最5')的碱基之前,在所述最早的碱基处,每碱基的质量得分的移动平均落到某些固定阈值之下。
对于Torrent Suite软件1.1.0,窗口大小被设置为30碱基,并且低于其就发生修整的阈值是质量得分为9。
质量和适配子修整
使用处理算法,可将读取修整回去,直至对于整个读取都有持续的可接受水平的质量。还对读取进行检测以确定是否能在读取中以高置信鉴别B-引物适配子序列或者其部分。如果找到了匹配的序列,则将所述读取修整到紧邻适配子开始之前的碱基处。
经修整的SFF文件
这个阶段的输出是SFF文件,其仅含有经过滤的读取,并且对于每次读取,适当地设置适配子和质量修整标记物。使用这个文件来产生FASTQ文件。
比对QC
比对QC阶段包括将通过流水线产生的读取与参照基因组进行比对,以及从那些比对中推导出度量。目前,使用TMAP比对器来比对读取。作为所述比对器的输入,使用在所述生产线中产生的读取中的一些或全部,连同参照基因组和索引文件。输出为SAM文件。加工这一输出SAM文件以推导出各种质量度量,其中包括估测Q17或Q20碱基,估测100Q17处或其之上的读取数目。比对QC模块的结果是使用Torrent浏览器网络界面,在报告总结页面中可查看的。密钥的输出部分是SAM文件。
下面的表显示了每个阶段或模块处的文件输出,以及对于典型的314芯片文库运行所期待的它们的大小:
表9
Figure BDA00002253041401641
Figure BDA00002253041401651
每碱基的质量评分
为每个读取分配每碱基的质量得分,并将其与读取本身一起写至SFF文件。通过计算读取的各种度量并使用那些度量作为在通过之前的系统训练建立的预先确定的质量查找表中的查找索引,而分配每碱基的质量得分。所述度量通常包括估测每个读取的电流碱基、流以及更早或更晚的碱基或流处的准确性。
Ion Torrent每碱基质量得分系统使用phred样查找表来预测质量。所述查找表是在来自代表性数据组的训练中产生的并且被用于在每碱基的基础上预测PGM数据的质量。以SFF,FASTQ和SAM文件公布质量得分。
所述质量得分系统包括:(1)phred样每碱基查找表;和(2)训练系统以产生所述查找表。
从读取流值,对于所述读取中的每个碱基,计算若干质量预测指标。使用这些预测指标作为索引的一部分,用来查找用于phred查找表中的碱基的适当的质量得分。参见,例如Brockman等人(2008):″Quality scores and SNP detection in sequencing-by-synthesissystems″,Genome Res.18:763-770;Ewing B,Hillier L,Wendl MC,Green P.(1998):″Base-calling of automated sequencer traces usingphred.I.Accuracy assessment″,Genome Res.8(3):175-185;EwingB,Green P.(1998):″Base-calling of automated sequencer traces usingphred.II.Error probabilities″Genome Res.8(3):186-194。
训练系统使用质量预测指标来得出所述查找表。
训练系统
为了产生查找表,选择代表性的数据组作为训练组。所述训练系统使用下面的六个预测指标来捕获与质量相关联并且指示质量的大多数特征:
表10:用于捕获与质量相关联并且指示质量的特征的六个预测指标
Figure BDA00002253041401661
从每个碱基的流值计算所述质量预测指标。连同用TMAP-比对的读取作为输入,所述系统建立了这六个预测指标,以及碱基是否被正确地读出。这种对于每个碱基有一个″匹配″布尔型加上六个预测指标的矢量被用作在训练系统中的输入。所述预测指标是二进制的,并且记录了与其实验质量得分的所有组合的详尽列表。使用算法来总结对应于相同的质量的预测指标值,以及来选择这些组合的代表性亚组。
所述训练和选择的算法的输出是查找表,其中将每个预测指标用作所述表中的索引的一部分以查找那个位置处的phred样每碱基质量得分。
查找表
查找表被用于独立于比对而分配每碱基质量得分。对于由PGM测序的每个碱基计算所述六个质量预测指标。通过找到所有六个经计算的预测指标都少于或等于表中的预测指标值的第一行而在查找表中定位相应的每碱基的质量。从相同的行读取查找质量。这个过程作为标准分析的一部分自动发生。
流水线实施
Ion Torrent流水线具有来自芯片上每个图素的信号,其中应用了对于背景、噪声和相效应的校正来产生碱基调用。
在碱基被读出后,从Analysis.cpp中读出一个单独的类别PerBaseQual,以计算每个碱基的质量预测指标并且指定phred表中的质量。
使用来自sff类的WriteData方法,将每碱基的质量以及所有其它读取信息写为标准流谱格式(SFF)文件。正整数质量得分/碱基被列为SFF文件中每个读取的最后的数据行,在质量得分的标题下。质量得分是phred-10*log_10(错误率)的标度。
除了SFF文件,Ion Torrent还将结果存储为FASTQ和序列比对/图(SAM)文件:
表11
Figure BDA00002253041401671
结果
下列分析报告是由Ion Torrent浏览器产生和提供的:(1)文库总结;(2)测试片段总结;(3)Ion SphereTM颗粒总结;(4)报告信息;以及(5)文件链接。
文件
产生了含有对于特定运行的所有文库读取的SFF格式化或FASTQ格式化的文件,并且可从Ion Torrent浏览器下载这些文件,其包括下列文件:
(1)文库序列(SFF)文件:这些文件包括标准Flowgram格式(SFF)–格式化文件且含有"流空间"数据。在每个流的基础上组织所述数据,并且含有关于产生碱基掺入和不产生碱基掺入的核苷酸流的信息。
(2)文库序列(FASTQ)文件:这些文件包括FASTQ-格式化文件,在每碱基的基础上组织所述数据,其中包括质量得分。所述文件中包含的读取是未经比对的读取。
(3)文库比对(SAM):这些是序列比对/图(SAM)文件,其中含有已经比对的数据。
(4)测试片段(SFF):这些文件仅包括对于测试片段的标准Flowgram格式(SFF)数据。
分析Log文件:这些文件包括可用于问题解决的详细的log文件。
下列序列信息被包括在SFF和FASTQ文件中:
读取过滤
满足下列条件的读取被报告在SFF和FASTQ文件中:与读取相关的孔对于Ion Sphere是"阳性的"。
所述孔在前三个密钥核苷酸中的每一个上都产生强信号(大于21计数)。读取最少含有8个碱基。
读取的密钥是匹配下列碱基调用的推导,其定义“密钥读取”。
读取的流的40%至60%被登记为阳性的。具有大于60%的阳性流的读取可能是混合读取。
读取在前60个流中匹配所预期的CAFIE模型。
读取修整
根据下列规则,使每个所报道读取经受去除较低质量的碱基:去除5’端含有密钥的前4个碱基。
在5’端不发生质量修整。
在3’端,如果测序的发生经过插入至B适配子,则去除B适配子。
修整读取的3’端直到在移动的30bp窗口中,平均质量得分为至少Q9的点。
FASTQ文件仅含有经过滤和经修整的数据。然而,SFF文件含有所有的数据,但是具有嵌入的注释信息,其定义被过滤和修整的区域。
ION SphereTM颗粒鉴别总结
报告的这一部分可在能够获得文库总结或测试片段总结部分之前获得,以提供快速确定是否应当允许分析继续进行。在报告的此部分中产生的数据是在分析过程的"早期"产生的,其在碱基调用之前产生,并且意在为运行表现的粗略的、初始评估。在分析的更晚的阶段,使孔数据经受更加严格的分析。
报告展示出下列信息:
具有Ion Sphere颗粒的孔:对于孔内ION Sphere颗粒的存在被确定为“阳性”的孔的数目。
实时(Live)IonSphere颗粒:含有具有与文库或测试片段密钥相关的强信号的ION Sphere颗粒的孔的数目。此值是下面的类别的总和:
(1)测试片段;(2)文库
测试片段Ion Sphere颗粒:具有与测试片段密钥信号相同的密钥信号的实时ION Sphere颗粒的数目。
文库Ion Sphere颗粒:所预测的具有与文库密钥信号相同的密钥信号的实时ION Sphere颗粒的数目。
模板-阳性Ion Sphere颗粒:含有足够的用于测序的DNA的IONSphere颗粒的估算百分比。比例大概为实时文库IONSphere颗粒比颗粒的总数,减去测试片段珠和较低质量的颗粒。
文库密钥:将读取鉴别为文库读取的四碱基核苷酸序列。此序列在SFF/FASTQ文件中的报告读取中被去除。
经验证的Ion Sphere文库颗粒:ION Sphere颗粒的数目,其中通过碱基调用算法证实了文库密钥的四个碱基。这是在SFF&FASTQ文件中所报告的读取的数目。
文库总结
分析报告的文库总结部分含有读取的表现度量,其包含文库密钥作为前四个碱基。
基于预测的质量、或在比对后测量的质量来测量表现。
预测的质量
读取的Q20长度值是对于其中读取中预测的总错误率将相应于Phred-标度质量得分20的读取长度的估算。Phred标度被定义为10×log10(错误概率),因此,Q20相应于1%的错误率而Q17相应于2%的错误率。
通过查看每碱基质量得分确定Q20长度,从而估算读取中每个位置的总读取错误率。例如,如果第一碱基具有20的预测质量得分,第二碱基具有17的预测质量得分,则对于前两个碱基的估算总读取错误将为0.5×1%+0.5×2%=1.5%。在读取中的每个位置处评估所述总读取错误率,之后鉴别出总读取错误率为1%或更低的最大位置。此位置确定读取的Q20长度。
Q20长度完全获得自预测的每碱基质量得分。所述预测的质量得分有些保守,并且在也可能与参照序列进行比对的情形中,用户通常将发现预测的Q17长度倾向于平均比相应的AQ17长度短,与预测的错误相反,所述AQ17长度是基于实际的错误(见下文中关于AQ20/AQ17的部分)。
比对后的质量
读取的比对可以是用于评估测序反应的质量和所基于的文库的质量的有用过程,其中可用参照。将读取与参照基因组进行比对。在与参照的比对中的任何不符(无论是生物学上的还是技术上的,意味着真正的改变还是测序错误)被列为错误。取决于允许多少误比对的碱基而报告比对表现度量。Torrent Suite在两个质量水平上报告比对表现:(1)AQ17;和(2)AQ20。
读取的AQ17长度与Q17长度(见上)的定义非常相似,差别在于不使用预测的每碱基质量得分来估测错误率,而是使用基于比对实际观察到的错误。
所基于的假设是,读取与之进行比对的参照代表我们应当见到的真正的序列。在如下情形中解释AQ17值时应适当谨慎:其中被测序的样品相对于所使用的参照有实质性差异-例如当使用与草图基因组进行的比对、或使用预期相对于所使用的参照具有高突变率的样品进行工作时。在这种情形中,甚至当测序质量很好时,AQ17长度也可能是短的。
AQ20长度是如下计算的:根据与参照的比对,读取中的每个碱基都被归类为是正确的或不正确的。在读取中的每个位置,计算总错误率直至且包括那个位置。鉴别出错误率为1%或更低的最大的位置,而那个位置确定AQ20长度。
例如,如果100bp读取由80个完美碱基、继以2个错误、然后再18个完美的碱基组成:那么在位置80处的总错误率将是0%,在位置81处将是1.2%(1/81),在位置82处将是2.4%,等等,直至位置100,在那里总错误率将是2%(2/100)。错误率为1%或更低的最大位置将是80,而错误率为2%或更低的最大位置是100,因此AQ20和AQ17长度分别为80和100个碱基。
比对:将使用Ion Torrent PGMTM系统获得的核酸序列信息与使用标准方法的已知或参照序列进行比对。序列比对的方法是本领域中熟知的并且在市场上可获得许多比对算法。比对算法也嵌在许多广泛可得的商业软件工具中。我们也鼓励你使用这些工具进行实验。在一些实施方案中,使用TMAP在Torrent浏览器中进行比对。TMAP的前身BFAST是基于下列出版物中的想法:Homer N,Merriman B,Nelson SF.,“BFAST:An alignment tool for large scale genomeresequencing.”PMID:19907642,PLoS ONE.20094(11):e7767.,http://dx.doi.org/10.1371/journal.pone.0007767;Homer N,MerrimanB,Nelson SF.,“Local alignment of two-base encoded DNA sequence.”BMC Bioinformatics.2009Jun9;10(1):175.PMID:19508732,http://dx.doi.org/10.1186/1471-2105-10-175。
文库总结报告
在下面的总结报告部分中显示表现,其是基于预测的质量、或是基于比对后测量的质量测量的:(A)基于预测的每碱基质量得分–不依赖于比对;(B)参照基因组信息;和(C)基于全文库比对。
(A)基于预测的每碱基质量得分–与比对无关
文库报告的这一部分显示基于预测的质量测量的表现。
总碱基数[Mbp]:SFF和FASTQ文件中报告的经过滤和修整的百万碱基对数目。
在预测的Q17读取段中[Mbp]:从读取起始延伸到总读取准确率为98%或更高的最3'的碱基处的读取区段(Q17)中所含有的经过滤和修整的百万碱基对数目。
在预测的Q20读取段中[Mbp]:从读取起始延伸到总读取准确率为99%或更高的最3'的碱基处的读取区段(Q20)中所含有的经过滤和修整的百万碱基对数目。
读取的总数:SFF和FASTQ文件中报告的,与长度无关的经过滤和修整的读取的总数。
至少50bp长:50碱基对或更长的读取的总数。
至少100bp长:100碱基对或更长的读取的总数。
平均长度[bp]:在SFF和FASTQ文件中报告的所有经过滤和修整的文库读取的平均长度(以碱基对计)。
最长读取[bp]:文件中报告的所有经过滤和修整的文库读取中的最大长度(以碱基对计)。
读取长度直方图:这是SFF文件中所呈递的所有读取的经修整长度的直方图。
共有密钥1-mer:此图显示的是来自文库密钥的前三个1-mer碱基的的信号强度。此图代表在核苷酸掺入过程中H+离子释放的共有信号测量。y-轴显示信号强度,是以计数测量的,其为任意但一致的测量单位。x-轴显示核苷酸流过芯片的时间。
在每个文库读取的开始处存在已知的密钥。通常,显示4-mer密钥的三个碱基。注意,所述图是以"流顺序"而不是"碱基顺序"显示的。例如,对于核苷酸一至四的四碱基文库密钥通常为TCAG。然而,所述图将TCAG显示为TAC,其代表核苷酸的流顺序。不显示负的流。虽然文库密钥是4个碱基长,在密钥一-mer图中仅显示三个碱基,因为文库读取的最后一个碱基对于质量目的而言是无信息量的,这是因为那个流能够含有密钥信息以外的文库信息。最后的密钥碱基之后的下一个碱基是第一个文库碱基。此碱基根据文库片段而变化。如果最后的密钥碱基是G且第一个文库碱基是G,那么二者在相同的流中被掺入,引起信号为一-mer的大约2X。因此,对于n-mer文库密钥,一-mer密钥图仅含有n-1个流。
测试片段总结
分析报告的测试片段总结部分提供关于实验(运行)中所包括的每个测试片段的表现的信息。
对于在特定PGMTM运行中所发现的每个测试片段,报告显示来自特定测试片段的数据总结。
对于每个测试片段显示了下列质量度量,在标题测试片段-<测试片段名称>下以表格形式显示,如在下图中所显示的:
TF名称:测试片段名称,如在Torrent浏览器的模板表中所定义的。
TF Seq:测试片段序列。
Num:对于此测试片段所鉴别的经过滤和修整的读取的数目。
Avg Q17:对于此测试片段具有Q17或更好的平均读取长度。
50AQ17:对于此测试片段具有最少50的碱基对长度和1/50的错误率,PHRED样17,或更好的读取数目。质量是基于比对,不是预测的质量。
AQ17读取长度:读取长度图是具有Phred样评分17或更好(1个错误/50bp)的读取长度(bp)的直方图。偏向右侧的分布是理想的,其显示出更长的读取长度(记住,测试片段具有离散的长度)。此外,很有可能的是,序列可一直延伸经过测试片段(条件是运行足够的循环)。因此,直方图仅能显示基于所使用的测试片段的最大大小。
平均经校正的直方图:平均经校正的直方图是此测试片段的平均经校正的直方图。x-轴在流空间中而y-轴显示信号强度。一个的单位是指在特定的流空间中仅有单一的“碱基”(即核苷酸),而两个的单位是指特定的流空间中有两个那种类型的“碱基”(即核苷酸)。
还报告了下列参数,其含有关于特定测序运行的下列信息:
表12:
对于个体测试片段的扩展的报告:
表13
下列关于个体测试片段的表现的参数也可从Ion Torrent浏览器下载:
Figure BDA00002253041401742
从Ion Torrent PGMTM测序中的测序反应获得的代表性的数据结果以及对于使用SEQ ID NO:1的未经修饰的(参照)Bst聚合酶和SEQ ID NO:2的经修饰的Bst聚合酶的结果比较显示在图3,4和5中,所述测序反应基本上是如上文所述进行的。图3显示了使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“Ion”)的测序反应的50Q17 vs.Keypass。
图4显示了使用具有SEQ ID NO:1的氨基酸序列的未经修饰的Bst DNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“ion”)的测序反应的100Q17vs.Keypass。
图5显示了使用具有SEQ ID NO:1的氨基酸序列的参照BstDNA聚合酶(“manta”)和具有SEQ ID NO:2的氨基酸序列的经修饰的Bst DNA聚合酶(“ion”)的测序反应carry forward vs.50Q17/Keypass。
从测序运行中获得的原始数据显示在图6中。“IE”是指在每个反应中观察到的不完整延伸的数目;“CF"是指在每个反应中观察到的carry forward的数目。
表2:用于Bst DNA聚合酶中的修饰的候选氨基酸残基(包括使用PropKa所计算的氨基酸残基的pKa值)
Figure BDA00002253041401751
Figure BDA00002253041401761
表3:用于Bst DNA聚合酶中的修饰的候选氨基酸残基(包括使用H++所计算的氨基酸残基的pKa值)
Figure BDA00002253041401762
表4:用于大肠杆菌SSB中的修饰的候选氨基酸
表5:用于TherminatorTMDNA聚合酶中的置换的候选氨基酸
Figure BDA00002253041401781
Figure BDA00002253041401791
Figure BDA00002253041401801
Figure BDA00002253041401811
Figure BDA00002253041401821
Figure BDA00002253041401841
Figure BDA00002253041401851
Figure BDA00002253041401861
Figure BDA00002253041401881
Figure BDA00002253041401891
表6:用于KOD DNA聚合酶中的置换的候选氨基酸
Figure BDA00002253041401892
Figure BDA00002253041401901
Figure BDA00002253041401911
Figure BDA00002253041401921
Figure BDA00002253041401931
Figure BDA00002253041401941
Figure BDA00002253041401961
Figure BDA00002253041401971
Figure BDA00002253041401981
Figure BDA00002253041401991
Figure BDA00002253041402001
表7:用于B103型聚合酶中的修饰的候选氨基酸
Figure BDA00002253041402012
Figure BDA00002253041402021

Claims (15)

1.检测核苷酸掺入的方法,包括:
(a)使用经修饰的聚合酶进行核苷酸掺入并产生一个或多个氢离子作为所述核苷酸掺入的副产物,其中所述经修饰的聚合酶包括相对于未经修饰的聚合酶降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换;和
(b)检测作为所述核苷酸掺入的副产物产生的所述一个或多个氢离子的存在,从而检测所述核苷酸掺入。
2.权利要求1的方法,其中所述经修饰的聚合酶包括在约pH 7至约pH 9的pH范围内相对于未经修饰的聚合酶降低所述经修饰的聚合酶的缓冲能力的一个或多个氨基酸置换。
3.权利要求1的方法,其中所述聚合酶包含一个或多个用其它氨基酸残基置换具有约7至约9范围内的pKa的氨基酸残基。
4.权利要求3的方法,其中所述其它氨基酸残基选自:Ala,Arg,Asp,Gln,ly,Ile,Leu,正亮氨酸(Nle),Met,Phe,Ser,Thr,Trp,Val和N末端甲酰甲硫氨酸(N-fMet)。
5.权利要求3的方法,其中所述一个或多个氨基酸修饰中的至少一个包括用具有小于约7或大于约9的pKa的氨基酸残基置换具有约7至约9之间的pKa的氨基酸残基。
6.权利要求5的方法,其中所述一个或多个氨基酸置换中的至少一个为保守性氨基酸置换。
7.权利要求1的方法,其中所述一个或多个氨基酸置换中的至少一个选自组氨酸至精氨酸,谷氨酸至谷氨酰胺,天冬氨酸至天冬酰胺,赖氨酸至精氨酸,和酪氨酸至苯丙氨酸。
8.权利要求1的方法,其中所述一个或多个氨基酸置换中的至少一个选自:用精氨酸置换表面组氨酸,用谷氨酰胺置换表面谷氨酸,以及用精氨酸置换表面赖氨酸。
9.权利要求1的方法,其中所述经修饰的聚合酶为经修饰的Phi29DNA聚合酶。
10.权利要求1的方法,其中所述经修饰的聚合酶为经修饰的BstDNA聚合酶。
11.权利要求10的方法,其中所述经修饰的Bst DNA聚合酶中的一个或多个氨基酸置换为表1中所示的一个或多个氨基酸残基。
12.权利要求10的方法,其中所述经修饰的Bst DNA聚合酶中的一个或多个保守性氨基酸置换选自H46R,H273R,H281R,E446Q,H473R,H528R,H572R和Y477F,其中氨基酸残基的编号是根据SEQID NO:1的编号。
13.权利要求1的方法,其中所述一个或多个氨基酸置换中的至少一个包括用丙氨酸残基置换所述聚合酶的氨基酸残基。
14.核酸测序的方法,所述方法包括:
提供模板核酸,其与测序引物相杂交并且与无缓冲聚合酶相结合;
通过在所述测序引物的3’端顺次掺入一个或多个已知的核苷三磷酸而合成新的核酸链;以及
通过测量当所述已知的核苷三磷酸与模板核酸中相应的核苷酸互补时所产生的氢离子副产物的浓度来检测引物3’端的所述掺入。
15.权利要求14的方法,其中所述无缓冲聚合酶为包括SEQ IDNO:2的氨基酸序列的聚合酶。
CN201180018980.2A 2010-02-26 2011-02-28 经修饰的蛋白及其制备和使用方法 Active CN103097547B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US30886310P 2010-02-26 2010-02-26
US61/308,863 2010-02-26
USPCT/US2011/026228 2011-02-25
PCT/US2011/026228 WO2011106634A2 (en) 2010-02-26 2011-02-25 Modified proteins and methods of making and using same
PCT/US2011/026468 WO2011106770A2 (en) 2010-02-26 2011-02-28 Modified proteins and methods of making and using same

Publications (2)

Publication Number Publication Date
CN103097547A true CN103097547A (zh) 2013-05-08
CN103097547B CN103097547B (zh) 2018-06-05

Family

ID=44507583

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201180018980.2A Active CN103097547B (zh) 2010-02-26 2011-02-28 经修饰的蛋白及其制备和使用方法

Country Status (6)

Country Link
US (2) US20110262903A1 (zh)
EP (4) EP2539471B1 (zh)
CN (1) CN103097547B (zh)
AU (1) AU2011220536B2 (zh)
LT (1) LT3040424T (zh)
WO (4) WO2011106629A2 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104212711A (zh) * 2014-04-08 2014-12-17 张世理 电子传感器及基于电子传感器的基因探测方法
CN105765082A (zh) * 2013-09-30 2016-07-13 生命技术公司 聚合酶组合物、制得和使用其的方法
CN110114458A (zh) * 2016-09-22 2019-08-09 豪夫迈·罗氏有限公司 Pol6聚合酶变体
CN111073871A (zh) * 2019-12-17 2020-04-28 中国科学院苏州生物医学工程技术研究所 热稳定性提高的dna聚合酶突变体及其构建方法和应用
CN112823392A (zh) * 2018-10-12 2021-05-18 生命科技股份有限公司 用于评估微卫星不稳定性状态的方法和系统
CN113403293A (zh) * 2014-12-16 2021-09-17 生命技术公司 聚合酶组合物和制造与使用其的方法
CN113583996A (zh) * 2021-09-29 2021-11-02 翌圣生物科技(上海)股份有限公司 Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8262900B2 (en) * 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US11339430B2 (en) 2007-07-10 2022-05-24 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
EP2092322B1 (en) 2006-12-14 2016-02-17 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale fet arrays
WO2010008480A2 (en) 2008-06-25 2010-01-21 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes using large scale fet arrays
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20120156728A1 (en) 2010-12-17 2012-06-21 Life Technologies Corporation Clonal amplification of nucleic acid on solid surface with template walking
US9334531B2 (en) 2010-12-17 2016-05-10 Life Technologies Corporation Nucleic acid amplification
US9309557B2 (en) 2010-12-17 2016-04-12 Life Technologies Corporation Nucleic acid amplification
US20120261274A1 (en) 2009-05-29 2012-10-18 Life Technologies Corporation Methods and apparatus for measuring analytes
US8776573B2 (en) 2009-05-29 2014-07-15 Life Technologies Corporation Methods and apparatus for measuring analytes
US20110262903A1 (en) * 2010-02-26 2011-10-27 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same
US20120202276A1 (en) 2010-02-26 2012-08-09 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same
US9164070B2 (en) 2010-06-30 2015-10-20 Life Technologies Corporation Column adc
EP2588850B1 (en) 2010-06-30 2016-12-28 Life Technologies Corporation Method for dry testing isfet arrays
AU2011226767B1 (en) 2010-06-30 2011-11-10 Life Technologies Corporation Ion-sensing charge-accumulation circuits and methods
US11307166B2 (en) 2010-07-01 2022-04-19 Life Technologies Corporation Column ADC
TWI527245B (zh) 2010-07-03 2016-03-21 生命技術公司 具有微摻雜汲極之化學感測器
WO2012036679A1 (en) 2010-09-15 2012-03-22 Life Technologies Corporation Methods and apparatus for measuring analytes
CN105911126B (zh) 2010-09-24 2018-12-18 生命科技公司 匹配的晶体管对电路
LT2742151T (lt) * 2011-08-10 2018-02-12 Life Technologies Corporation Polimerazės kompozicija
US11208636B2 (en) 2011-08-10 2021-12-28 Life Technologies Corporation Polymerase compositions, methods of making and using same
US9970984B2 (en) 2011-12-01 2018-05-15 Life Technologies Corporation Method and apparatus for identifying defects in a chemical sensor array
KR20150011359A (ko) * 2012-04-19 2015-01-30 라이프 테크놀로지스 코포레이션 디지털 pcr을 수행하는 방법
CN114854832A (zh) 2012-04-19 2022-08-05 生命技术公司 核酸扩增
EP3461910B1 (en) 2012-04-19 2020-08-26 Life Technologies Corporation Nucleic acid amplification
US8786331B2 (en) 2012-05-29 2014-07-22 Life Technologies Corporation System for reducing noise in a chemical sensor array
US9034606B2 (en) 2012-08-23 2015-05-19 New England Biolabs, Inc. Detection of an amplification reaction product using pH-sensitive dyes
WO2014043143A1 (en) 2012-09-11 2014-03-20 Life Technologies Corporation Nucleic acid amplification
EP2895620B1 (en) 2012-09-11 2017-08-02 Life Technologies Corporation Nucleic acid amplification
US9080968B2 (en) 2013-01-04 2015-07-14 Life Technologies Corporation Methods and systems for point of use removal of sacrificial material
US9841398B2 (en) 2013-01-08 2017-12-12 Life Technologies Corporation Methods for manufacturing well structures for low-noise chemical sensors
US8963216B2 (en) 2013-03-13 2015-02-24 Life Technologies Corporation Chemical sensor with sidewall spacer sensor surface
US9116117B2 (en) 2013-03-15 2015-08-25 Life Technologies Corporation Chemical sensor with sidewall sensor surface
JP2016510895A (ja) 2013-03-15 2016-04-11 ライフ テクノロジーズ コーポレーション 一貫性のあるセンサ表面積を有する化学センサ
EP2972281B1 (en) 2013-03-15 2023-07-26 Life Technologies Corporation Chemical device with thin conductive element
US9835585B2 (en) 2013-03-15 2017-12-05 Life Technologies Corporation Chemical sensor with protruded sensor surface
JP6581074B2 (ja) 2013-03-15 2019-09-25 ライフ テクノロジーズ コーポレーション 一貫性のあるセンサ表面積を有する化学センサ
US20140336063A1 (en) 2013-05-09 2014-11-13 Life Technologies Corporation Windowed Sequencing
US10458942B2 (en) 2013-06-10 2019-10-29 Life Technologies Corporation Chemical sensor array having multiple sensors per well
US10758700B2 (en) 2013-09-30 2020-09-01 Arizona Board Of Regents On Behalf Of The University Of Arizona Home-based heliox system with carbon dioxide removal
WO2016077324A1 (en) 2014-11-11 2016-05-19 Life Technologies Corporation Thiolated nucleotide analogues for nucleic acid synthesis
TWI684004B (zh) 2014-12-18 2020-02-01 美商生命技術公司 用於使用大規模fet陣列量測分析物之方法及設備
TWI832669B (zh) 2014-12-18 2024-02-11 美商生命技術公司 具有傳輸器組態的高資料速率積體電路
US10077472B2 (en) 2014-12-18 2018-09-18 Life Technologies Corporation High data rate integrated circuit with power management
US10344268B2 (en) 2015-10-01 2019-07-09 Life Technologies Corporation Polymerase compositions and kits, and methods of using and making the same
WO2017196676A1 (en) 2016-05-10 2017-11-16 Life Technologies Corporation Metal chelation post incorporation detection methods
US11268117B2 (en) 2016-06-10 2022-03-08 Life Technologies Corporation Methods and compositions for nucleic acid amplification
CN110573616B (zh) * 2017-04-18 2023-09-05 深圳华大智造科技股份有限公司 Phi29 DNA聚合酶及其编码基因与应用
US11163726B2 (en) 2017-08-31 2021-11-02 International Business Machines Corporation Context aware delta algorithm for genomic files
WO2019094524A1 (en) 2017-11-07 2019-05-16 Life Technologies Corporation Methods and compositions for manipulating nucleic acids
CN112534063A (zh) 2018-05-22 2021-03-19 安序源有限公司 用于核酸测序的方法、系统和组合物
EP3963103B1 (en) 2019-05-03 2024-02-28 Life Technologies Corporation Methods and compositions for manipulating nucleic acids

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060240439A1 (en) * 2003-09-11 2006-10-26 Smith Geoffrey P Modified polymerases for improved incorporation of nucleotide analogues
CN101180390A (zh) * 2005-05-10 2008-05-14 索莱克萨有限公司 改进的聚合酶
GB2461128A (en) * 2008-06-25 2009-12-30 Ion Torrent Systems Inc Nucleic acid sequencing using chemically-sensitive field effect transistors (chemFETs)
CN101669026A (zh) * 2006-12-14 2010-03-10 离子流系统有限公司 利用大规模fet阵列测量分析物的方法和装置

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5466591A (en) 1986-08-22 1995-11-14 Hoffmann-La Roche Inc. 5' to 3' exonuclease mutations of thermostable DNA polymerases
US5001050A (en) 1989-03-24 1991-03-19 Consejo Superior Investigaciones Cientificas PHφ29 DNA polymerase
US5198543A (en) 1989-03-24 1993-03-30 Consejo Superior Investigaciones Cientificas PHI29 DNA polymerase
US5264365A (en) 1990-11-09 1993-11-23 Board Of Regents, The University Of Texas System Protease-deficient bacterial strains for production of proteolytically sensitive polypeptides
US5508192A (en) 1990-11-09 1996-04-16 Board Of Regents, The University Of Texas System Bacterial host strains for producing proteolytically sensitive polypeptides
US5783415A (en) 1991-03-29 1998-07-21 Genentech, Inc. Method of producing an IL-8 receptor polypeptide
EP0861893A3 (en) 1991-09-19 1999-11-10 Genentech, Inc. High level expression of immunoglobulin polypeptides
WO1994016107A1 (en) * 1993-01-12 1994-07-21 Thomas Jefferson University DNA SEQUENCING WITH Bst POLYMERASE
US5427928A (en) 1993-03-24 1995-06-27 Slesarev; Alexei I. Thermostable DNA Topoisomerase V
US5639635A (en) 1994-11-03 1997-06-17 Genentech, Inc. Process for bacterial production of polypeptides
US6184344B1 (en) 1995-05-04 2001-02-06 The Scripps Research Institute Synthesis of proteins by native chemical ligation
US6165765A (en) * 1995-10-18 2000-12-26 Shanghai Institute Of Biochemistry, Chinese Academy Of Sciences DNA polymerase having ability to reduce innate selective discrimination against fluorescent dye-labeled dideoxynucleotides
US6027888A (en) 1996-04-05 2000-02-22 Board Of Regents, The University Of Texas System Methods for producing soluble, biologically-active disulfide-bond containing eukaryotic proteins in bacterial cells
SG86311A1 (en) * 1997-04-10 2002-02-19 Univ Singapore Bacillus stearothermophilus dna polymerase i (klenow) clones with reduced 3'-to-5' exonuclease activity
US6083715A (en) 1997-06-09 2000-07-04 Board Of Regents, The University Of Texas System Methods for producing heterologous disulfide bond-containing polypeptides in bacterial cells
US20030138834A1 (en) * 1998-08-19 2003-07-24 Dawson Elliott P. Method for determining polynucleotide sequence variations
WO2001023411A2 (en) * 1999-09-30 2001-04-05 New England Biolabs, Inc. Incorporation of modified nucleotides by archaeon dna polymerases and related methods
US6627424B1 (en) 2000-05-26 2003-09-30 Mj Bioworks, Inc. Nucleic acid modifying enzymes
US20030134292A1 (en) * 2001-10-30 2003-07-17 Farchaus Joseph W. Thermostable DNA polymerases and methods of making same
US7282328B2 (en) 2002-09-20 2007-10-16 New England Biolabs, Inc. Helicase dependent amplification of nucleic acids
EP2159285B1 (en) 2003-01-29 2012-09-26 454 Life Sciences Corporation Methods of amplifying and sequencing nucleic acids
US20070059713A1 (en) 2005-09-09 2007-03-15 Lee Jun E SSB-DNA polymerase fusion proteins
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
CA2633524A1 (en) * 2005-12-22 2007-07-05 Pacific Biosciences Of California, Inc. Polymerases for nucleotide analogue incorporation
US8262900B2 (en) * 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US7972828B2 (en) * 2006-12-19 2011-07-05 Sigma-Aldrich Co. Stabilized compositions of thermostable DNA polymerase and anionic or zwitterionic detergent
US7932034B2 (en) 2006-12-20 2011-04-26 The Board Of Trustees Of The Leland Stanford Junior University Heat and pH measurement for sequencing of DNA
JP4193997B1 (ja) * 2007-12-05 2008-12-10 プレシジョン・システム・サイエンス株式会社 新規dnaポリメラーゼ
US20110165652A1 (en) * 2008-01-14 2011-07-07 Life Technologies Corporation Compositions, methods and systems for single molecule sequencing
GB2461127B (en) 2008-06-25 2010-07-14 Ion Torrent Systems Inc Methods and apparatus for measuring analytes using large scale FET arrays
US20100301398A1 (en) 2009-05-29 2010-12-02 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8546128B2 (en) 2008-10-22 2013-10-01 Life Technologies Corporation Fluidics system for sequential delivery of reagents
WO2010111691A2 (en) 2009-03-27 2010-09-30 Life Technologies Corp Conjugates of biomolecules to nanoparticles
US8673627B2 (en) 2009-05-29 2014-03-18 Life Technologies Corporation Apparatus and methods for performing electrochemical reactions
US20110262903A1 (en) * 2010-02-26 2011-10-27 Life Technologies Corporation Modified Proteins and Methods of Making and Using Same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060240439A1 (en) * 2003-09-11 2006-10-26 Smith Geoffrey P Modified polymerases for improved incorporation of nucleotide analogues
CN101180390A (zh) * 2005-05-10 2008-05-14 索莱克萨有限公司 改进的聚合酶
CN101669026A (zh) * 2006-12-14 2010-03-10 离子流系统有限公司 利用大规模fet阵列测量分析物的方法和装置
GB2461128A (en) * 2008-06-25 2009-12-30 Ion Torrent Systems Inc Nucleic acid sequencing using chemically-sensitive field effect transistors (chemFETs)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆祖宏等: "快速低成本全基因组DNA测序技术", 《中国生物医学工程学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105765082A (zh) * 2013-09-30 2016-07-13 生命技术公司 聚合酶组合物、制得和使用其的方法
CN105765082B (zh) * 2013-09-30 2019-09-27 生命技术公司 聚合酶组合物、制得和使用其的方法
CN104212711A (zh) * 2014-04-08 2014-12-17 张世理 电子传感器及基于电子传感器的基因探测方法
CN104212711B (zh) * 2014-04-08 2017-10-27 上海小海龟科技有限公司 电子传感器及基于电子传感器的基因探测方法
CN113403293A (zh) * 2014-12-16 2021-09-17 生命技术公司 聚合酶组合物和制造与使用其的方法
CN110114458A (zh) * 2016-09-22 2019-08-09 豪夫迈·罗氏有限公司 Pol6聚合酶变体
CN112823392A (zh) * 2018-10-12 2021-05-18 生命科技股份有限公司 用于评估微卫星不稳定性状态的方法和系统
CN111073871A (zh) * 2019-12-17 2020-04-28 中国科学院苏州生物医学工程技术研究所 热稳定性提高的dna聚合酶突变体及其构建方法和应用
CN113583996A (zh) * 2021-09-29 2021-11-02 翌圣生物科技(上海)股份有限公司 Bst DNA聚合酶重组突变体、其编码DNA及超快磁珠LAMP检测方法

Also Published As

Publication number Publication date
WO2011106770A3 (en) 2012-04-05
EP3040424A1 (en) 2016-07-06
EP3040424B1 (en) 2018-01-10
EP2808401A1 (en) 2014-12-03
EP2539473B8 (en) 2016-03-30
WO2011106770A2 (en) 2011-09-01
WO2011106766A2 (en) 2011-09-01
WO2011106634A3 (en) 2012-05-03
EP2539473A4 (en) 2013-03-13
US20110262903A1 (en) 2011-10-27
EP2539473B1 (en) 2015-11-04
EP2539471B1 (en) 2014-08-06
AU2011220536A1 (en) 2011-12-01
AU2011220536B2 (en) 2012-05-24
WO2011106629A3 (en) 2012-01-19
LT3040424T (lt) 2018-05-10
WO2011106629A2 (en) 2011-09-01
WO2011106766A3 (en) 2012-04-26
US20110318748A1 (en) 2011-12-29
WO2011106634A2 (en) 2011-09-01
EP2539473A2 (en) 2013-01-02
CN103097547B (zh) 2018-06-05
EP2539471A2 (en) 2013-01-02
EP2539471A4 (en) 2013-03-13
EP2808401B1 (en) 2016-12-14

Similar Documents

Publication Publication Date Title
CN103097547A (zh) 经修饰的蛋白及其制备和使用方法
US11198854B2 (en) Modified polymerases for improved incorporation of nucleotide analogues
US10059987B2 (en) Modified proteins and methods of making and using same
US10745685B2 (en) DP04 polymerase variants
JP2020127415A (ja) ヌクレオチドアナログの取り込みを改善するための修飾ポリメラーゼ
US20110301041A1 (en) Modified Proteins and Methods of Making and Using Same
CN101365807A (zh) 用于掺入核苷酸类似物的聚合酶
Nikoomanzar et al. Programmed allelic mutagenesis of a DNA polymerase with single amino acid resolution
KR101600902B1 (ko) 코돈 조합화 및 변이유발을 이용한 유전자 라이브러리의 합성 방법
US20210108183A1 (en) Dp04 polymerase variants
AU2012216424B2 (en) Modified proteins and methods of making and using same
JP6070180B2 (ja) 酵素のスクリーニング方法
US11613775B2 (en) Measuring DNA polymerase fidelity
RU2779599C1 (ru) Полимеразы, композиции и способы их применения
Alvarado Torres Structure-function analysis of a Group II Intron reverse transcriptase
JP6416885B2 (ja) 高温で活性なhivタイプ1グループo逆転写酵素

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant