CN118103501A - 工程化dna聚合酶变体 - Google Patents

工程化dna聚合酶变体 Download PDF

Info

Publication number
CN118103501A
CN118103501A CN202280069578.5A CN202280069578A CN118103501A CN 118103501 A CN118103501 A CN 118103501A CN 202280069578 A CN202280069578 A CN 202280069578A CN 118103501 A CN118103501 A CN 118103501A
Authority
CN
China
Prior art keywords
dna polymerase
seq
sequence
engineered dna
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280069578.5A
Other languages
English (en)
Inventor
埃里卡·贝穆德斯
大卫·艾尔加特
尼基·D·克鲁斯
马修·G·米勒
韦丝娜·米切尔
约瓦娜·纳佐尔
南希塔·苏布兰马尼安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN118103501A publication Critical patent/CN118103501A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Heterocyclic Carbon Compounds Containing A Hetero Ring Having Nitrogen And Oxygen As The Only Ring Hetero Atoms (AREA)

Abstract

本公开内容涉及工程化DNA聚合酶多肽及其组合物、以及编码该工程化DNA聚合酶多肽的多核苷酸。本公开内容还提供了将该工程化DNA聚合酶多肽或其组合物用于诊断和其他目的的方法。

Description

工程化DNA聚合酶变体
相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求2021年10月15日提交的美国临时申请第63/256,492号的权益,所述申请通过引用以其整体并入本文。
对序列表、表格或计算机程序的引用
经由EFS-Web以文件名CX9-218WO1_ST26.xml在此同时提交的、创建于2022年10月14日、具有2.21兆字节文件大小的序列表通过引用并入本文。
技术领域
本公开内容提供了工程化DNA聚合酶多肽及其组合物、以及编码该工程化DNA聚合酶多肽的多核苷酸。本公开内容还提供了将重组DNA聚合酶或其组合物用于诊断、分子生物学工具和其他目的的方法。
背景
DNA聚合酶是从脱氧核糖核苷酸合成DNA的酶。这些酶是DNA复制必需的。存在显示出不同特性并存在于不同类型的生物体中的各种类型的DNA聚合酶。发现从嗜热生物体获得的聚合酶在各种体外方法中的宽范围重要用途,包括但不限于聚合酶链式反应(PCR)、核酸测序和其他诊断、分子生物学和法医学应用。虽然存在许多商购可得的热稳定DNA聚合酶,诸如Taq和Pfu DNA聚合酶,但本领域对于具有改进的特性诸如增强的进行性(processivity)和/或保真度的热稳定酶仍然存在需求。
概述
本公开内容涉及工程化DNA聚合酶多肽及其组合物、以及编码该工程化DNA聚合酶多肽的多核苷酸。本公开内容还提供了将工程化DNA聚合酶多肽及其组合物用于诊断和其他目的的方法。
在一方面,本公开内容提供了一种工程化DNA聚合酶或其功能片段,所述工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:2、8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ IDNO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:2、8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ IDNO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q、587S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A或849T或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、748、521或750或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。在一些实施方案中,工程化DNA聚合酶多肽的多肽序列包含以下至少一个取代:40A、85E、102S、132Y、157G、177T、262L、263A、748Y、521G或750S或其组合。在一些实施方案中,工程化DNA聚合酶多肽的多肽序列包含以下至少一个取代:S40A、P85E、V102S、V132Y、S157G、R177T、I262L、S263A、H748Y、A521G或P750S或其组合。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:213/503/508/584/748、40/132/748、40/132/157/262/263/748、132、40/132/503/748、40/132/157/503/562、40/132/213/748/814、132/157/562/584、132/584/748、40/132/231/684/748、40/132、40/41/132/562/684/748、41/213/231/503/650/674/748、132/231/503/748、40/132/157/503、503/748/814、40/132/231/503/674/748、40/88/132/503/684/748、132/157/213/674/748/814、157/263/748、40/748、41/157/231/262/748/814、40/213/503/562/584/748、523/524、40/132/503/514/650/674、40/132/157/213/231、41/213/520/814、40/41/157/231/503、40/157/503、40/132/562/748、132/748、40/41/132/562/748、88/213/503/584/684/748、57/58/523/616/677、40/213/231/503/514/562/748、132/562、213/503/650、40/41/88/231/748/814、41/213/262/562、41/88/231/748、213/263/748、40/157/213、157/520、40/132/263/503/674/814、40/41、524/665/756、58/186/217/523/524/677、40/41/748、132/514、520、41/213/503/562、231/503/748/772、503/562、73/232/514/584/814、58/507/616、132/262/520/562/684/748、88/562/814、41/88/157/814、88/157/213/674/684、57/58/523/779、40/132/157/514/520/684、40/41/213/684/772、40/41/231/503/814、88/213/503/584/814、40/41/132/562/584、41/88/213/231/503/650/748、40/503、40/132/213/231/520/562/650/814、40/41/132/231/262/503/562/584/748/814、57/58/264/265/524/688、88/132/157/262/263/520/562、88/132/157/262/503/514/562/650、40/584/674/748、40/41/132/263/503、584/748、40/213/674、40/41/88T/132/503/562/584/748、88/213/514/562/748/814、263/520/814或40/41/88/157,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773或803,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495、440或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/40/132/157/262/263/407/748、40/132/157/262/263/328/748、40/132/157/262/263/401/748、40/132/157/262/263/402/748、40/132/157/262/263/403/748、40/132/157/262/263/404/748、40/132/157/262/263/406/748、40/132/157/262/263/407/748、40/132/157/262/263/503/748、40/132/157/262/263/504/748、40/132/157/262/263/506/748、40/132/157/262/263/521/748、40/132/157/262/263/523/748、40/132/157/262/263/524/748、40/132/157/262/263/525/748、40/132/157/262/263/526/748、40/132/157/262/263/527/748、40/132/157/262/263/528/748、40/132/157/262/263/529/748、40/132/157/262/263/530/748、40/132/157/262/263/531/748、40/132/157/262/263/533/748、40/132/157/262/263/534/748、40/132/157/262/263/535/748、40/132/157/262/263/536/748、40/132/157/262/263/537/748、40/132/157/262/263/538/748、40/132/157/262/263/539/748、40/132/157/262/263/540/748、40/132/157/262/263/542/748、40/132/157/262/263/54/748、40/132/157/262/263/553/748、40/132/157/262/263/554/748、40/132/157/262/263/555/748、40/132/157/262/263/556/748、40/132/157/262/263/557/748、40/132/157/262/263/558/748、40/132/157/262/263/559/748、40/132/157/262/263/560/748、40/132/157/262/263/563/748、40/132/157/262/263/581/748、40/132/157/262/263/582/748、40/132/157/262/263/585/748、40/132/157/262/263/586/748、40/132/157/262/263/587/748、40/132/157/262/263/589/748、40/132/157/262/263/592/748、40/132/157/262/263/593/748、40/132/157/262/263/594/748、40/132/157/262/263/595/748、40/132/157/262/263/596/748、40/132/157/262/263/597/748、40/132/157/262/263/598/748、40/132/157/262/263/599/748、40/132/157/262/263/601/748、40/132/157/262/263/602/748、40/132/157/262/263/603/748、40/132/157/262/263/605/748、40/132/157/262/263/607/748、40/132/157/262/263/696/748、40/132/157/262/263/747/748、40/132/157/262/263/748、40/132/157/262/263/748/749、40/132/157/262/263/748/751、40/132/157/262/263/748/762、40/132/157/262/263/748/763、40/132/157/262/263/748/764、40/132/157/262/263/748/766、40/132/157/262/263/748/773、40/132/157/262/263/748/803、40/132/157/605/262/263/748、40/132/157/262/263/403/521/748或40/132/157/262/263/403/553/748,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/132/157/262/263/403/404/521/524/542/555/748/762/764、40/132/157/262/263/404/521/524/542/589/748/762/764、40/132/157/262/263/521/524/542/581/748/762/764、40/132/157/262/263/521/542/748/762/764、40/132/157/262/263/404/521/542/748/762、40/132/157/262/263/521/748/750/849、40/132/157/262/263/521/524/581/748、16/40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/820、40/132/157/262/263/521/748/793、40/132/157/262/263/521/748/764、40/132/157/262/263/521/748/755、40/132/157/262/263/521/748/753、40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/728、40/132/157/262/263/521/704/748、40/132/157/262/263/521/675/748、40/132/157/262/263/521/671/748、40/132/157/262/263/521/570/748、40/132/157/262/263/495/521/748、40/132/157/262/263/480/521/748、40/132/157/262/263/476/521/748、40/132/157/262/263/384/521/748、40/132/157/262/263/322/521/748、40/132/157/262/263/321/521/748、40/132/157/243/262/263/521/748、15/40/132/157/262/263/521/748、40/102/132/157/262/263/521/748、40/91/132/157/262/263/521/748、40/87/132/157/262/263/521/748、40/85/132/157/262/263/521/748、20/40/132/157/262/263/521/748、21/40/132/157/262/263/521/748或40/52/132/157/262/263/521/748,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/102/132/157/262/263/476/521/748、40/102/132/157/262/263/495/521/748、40/102/132/157/262/263/521/748/750、21/40/52/102/132/157/262/263/521/748、21/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/476/521/748、40/85/102/132/157/262/263/521/748/750、40/102/132/157/262/263/386/495/521/748、40/102/132/157/262/263/476/495/521/748、40/102/132/157/262/263/322/521/748/820、40/102/132/157/262/263/386/521/748/849、20/40/52/85/102/132/157/262/263/521/748、40/102/132/157/262/263/476/521/748/750、40/102/132/157/262/263/495/521/748/820、40/102/132/157/262/263/521/748/750/820、21/40/52/102/132/157/262/263/521/572/748、20/40/102/132/157/262/263/322/386/521/748、21/40/102/132/157/262/263/322/495/521/748、40/85/102/132/157/262/263/322/476/521/748、20/40/102/132/157/262/263/386/476/521/748、21/40/102/132/157/262/263/322/521/748/750、21/40/102/132/157/262/263/495/521/748/820、20/40/102/132/157/262/263/495/521/748/820、40/85/102/132/157/262/263/476/521/748/849、21/40/102/132/157/262/263/521/748/820/849、40/102/132/157/262/263/322/386/495/521/748、40/102/132/157/262/263/273/322/521/748/849、40/102/132/157/262/263/476/495/521/748/750、40/102/132/157/262/263/322/521/748/750/820、40/102/132/157/262/263/386/521/748/750/849、21/40/85/102/132/157/262/263/322/521/748/820、20/40/85/102/132/157/262/263/476/521/748/750、20/40/85/102/132/157/262/263/495/521/748/849、20/40/85/102/132/157/262/263/521/566/748/820、40/52/102/132/157/262/263/322/498/521/748/750、21/40/102/132/157/262/263/322/386/521/748/820、40/52/102/132/157/262/263/386/495/521/748/820、20/40/102/132/157/262/263/322/476/521/748/820、40/85/102/132/157/262/263/386/495/521/748/750、40/85/102/132/157/262/263/476/495/521/748/820、40/85/102/132/157/262/263/322/521/748/750/820、40/85/102/132/157/262/263/322/386/476/495/521/748、21/40/102/132/157/262/263/322/495/521/748/750/820、20/21/40/85/102/132/157/262/263/322/476/495/521/748、20/40/102/132/157/262/263/299/322/386/476/495/521/748、40/52/102/132/157/262/263/476/495/521/566/748/750/849、20/40/85/102/132/157/262/200/263/322/476/495/521/748/750或21/40/85/102/132/157/262/263/322/386/495/521/748/820/849,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶多肽的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/85/102/132/157/262/263/299/386/521/566/748/750/820、40/85/102/132/157/262/263/476/521/748/750/820/849、21/40/85/102/132/157/262/263/322/476/495/521/748/750/820、40/85/102/132/157/262/177/263/521/748/750、21/40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/476/521/748/750/820、20/40/52/85/102/132/157/262/263/299/521/748/750、52/40/85/102/132/157/262/263/299/521/748/750、40/85/102/132/157/262/263/322/521/748/750/820、20/40/85/102/132/157/262/263/521/748/750/820、20/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/476/495/521/748/750/820、40/85/102/132/157/262/263/386/476/495/521/748/750、20/21/40/85/102/132/157/262/263/299/322/386/521/748/750、40/85/102/132/157/262/263/322/386/495/521/748/750、21/40/85/102/132/157/262/263/299/322/476/495/521/748/750/820、21/40/85/102/132/157/262/263/299/386/521/748/750/820、40/85/102/132/157/262/263/299/476/521/748/750/820、20/21/40/85/102/132/157/262/263/521/748/750、21/40/102/132/157/262/263/521/748、40/85/102/132/157/262/263/521/705/748/750、21/40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/299/322/521/748/750、20/40/85/102/132/157/262/263/322/386/521/748/750/820、40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/109/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/495/521/748/750、40/85/102/132/157/262/263/491/521/748/750、40/52/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/386/521/748/750/820、20/21/40/85/102/132/157/262/263/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/566/748/750/820、20/21/40/85/102/132/157/262/263/299/495/521/748/750、40/85/102/132/157/262/263/521/748/750/756、40/85/102/132/157/262/263/386/521/748/750/820、40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/511/521/748/750、21/40/52/85/102/132/157/262/263/242/386/495/521/748/750/820、40/85/102/132/157/262/263/299/476/495/521/748/750、40/85/102/132/157/262/263/521/706/748/750、21/40/85/102/132/157/262/263/299/386/476/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/748/750、21/40/85/102/132/157/262/263/476/521/748/750/849、40/85/102/132/157/262/263/299/322/476/521/748/750/820、21/40/52/85/102/132/157/262/263/299/322/521/748/750/820、20/21/40/85/102/132/157/262/263/521/566/748/750、20/40/52//85/102/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/386/495/521/566/748/750/820、21/40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/521/748/750、40/85/102/132/157/262/263/386/521/748/750/849、40/52/85/102/132/157/262/263/476/521/748/750、40/52/85/102/132/157/262/263/299/322/386/495/521/748/750或40/85/102/132/157/262/263/440/521/748/750,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,与包含SEQ ID NO:8、332、462或606的残基12至850的参考序列或与SEQ ID NO:8、332、462或606的参考序列具有以上序列同一性的工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个氨基酸残基:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q/S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A或849T或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、521、748或750或其组合。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:8的残基12至850的参考序列或与对应于SEQ ID NO:8的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ IDNO:8的残基12至850的参考序列或相对于对应于SEQ ID NO:8的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773或803或其组合,其中氨基酸位置是相对于SEQ ID NO:8的参考序列。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:332的残基12至850的参考序列或与对应于SEQ ID NO:332的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQID NO:332的残基12至850的参考序列或相对于对应于SEQ ID NO:332的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764或542/762/764,其中氨基酸位置是相对于SEQ ID NO:332的参考序列。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:462的残基12至850的参考序列或与对应于SEQ ID NO:462的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQID NO:462的残基12至850的参考序列或相对于对应于SEQ ID NO:462的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中氨基酸位置是相对于SEQ ID NO:462的参考序列。
在一些实施方案中,本公开内容的工程化DNA聚合酶包含与对应于SEQ ID NO:606的残基12至850的参考序列或与对应于SEQ ID NO:606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQID NO:606的残基12至850的参考序列或相对于对应于SEQ ID NO:606的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495、440或其组合,其中氨基酸位置是相对于SEQID NO:606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中提供的取代或取代集的多肽序列,其中所述取代或取代集是相对于SEQ ID NO:2、8、332、462或606的参考序列。
在一些实施方案中,DNA聚合酶包含与包含表4.1、表5.1、表6.1、表7.1和表8.1中列出的至少一种工程化DNA聚合酶变体的残基12至850的参考序列或与表4.1、表5.1、表6.1、表7.1和表8.1中列出的至少一种工程化变体的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些实施方案中,工程化DNA聚合酶包含含有选自SEQ ID NO:4-770的偶数编号序列的序列的残基12至850的多肽序列,其中所述多肽任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,工程化DNA聚合酶包含含有选自SEQ ID NO:4-770的偶数编号序列的序列的多肽序列,其中所述多肽任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,工程化DNA聚合酶包含含有包含SEQ ID NO:8、332、462或606的残基12至850的序列或包含SEQ ID NO:8、332、462或606的序列的多肽序列。
在一些实施方案中,工程化DNA聚合酶具有DNA聚合酶活性。在一些实施方案中,与参考DNA聚合酶相比,工程化DNA聚合酶具有至少一种改进的特性。在一些实施方案中,与参考DNA聚合酶相比,工程化DNA聚合酶在聚合酶链式反应中表现出增加的活性或产生更大的产物产率。在一些实施方案中,与参考DNA聚合酶相比,工程化DNA聚合酶表现出增加的保真度。在一些实施方案中,与参考DNA聚合酶相比,工程化DNA聚合酶表现出增加的热稳定性。在一些实施方案中,工程化DNA聚合酶表现出比比较物DNA聚合酶增加的进行性。在一些实施方案中,参考或比较物DNA聚合酶是具有对应于SEQ ID NO:2、8、332、462或606的残基12至850的序列的DNA聚合酶;或者具有对应于SEQ ID NO:2、8、332、462或606的序列的DNA聚合酶。在一些实施方案中,参考或比较物DNA聚合酶是具有对应于SEQ ID NO:2的残基12至850的序列的DNA聚合酶;或者具有对应于SEQ ID NO:2的序列的DNA聚合酶。在一些实施方案中,参考或比较物DNA聚合酶是野生型DNA聚合酶,选自来自强烈火球菌(Pyrococcusfuriosus)的Pfu DNA聚合酶,来自嗜热球菌属(Thermococcus)物种菌株2319x1的B组DNA聚合酶和来自水生栖热菌(Thermus aquaticus)的Taq DNA聚合酶。
在一些另外的实施方案中,工程化DNA聚合酶是纯化的。在一些实施方案中,工程化DNA聚合酶在溶液中提供,或者固定在基底,诸如固体基底或膜或颗粒的表面上。
在另一方面,本公开内容提供了编码本文公开的工程化DNA聚合酶中的任何一种的重组多核苷酸。在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶或其功能片段,所述工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:2、8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:2、8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶或其功能片段,所述工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代,如以上及本文描述的。
在一些实施方案中,重组多核苷酸包含与对应于SEQ ID NO:1、5、21、23、25、27或823的核苷酸残基34至2550的参考多核苷酸序列或与对应于SEQ ID NO:1、5、21、23、25、27或823的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列,其中多核苷酸编码工程化DNA聚合酶。在一些实施方案中,重组多核苷酸包含含有SEQ IDNO:1、5、21、23、25、27或823的核苷酸残基34至2550的序列。在一些实施方案中,重组多核苷酸包含含有SEQ ID NO:1、5、21、23、25、27或823的序列。
在一些实施方案中,重组多核苷酸包含与对应于选自SEQ ID NO:3-769的奇数编号多核苷酸序列的核苷酸残基34至2550的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列,其中多核苷酸编码工程化DNA聚合酶。在一些实施方案中,重组多核苷酸包含与对应于选自SEQ ID NO:3-769的奇数编号多核苷酸序列的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列,其中多核苷酸编码工程化DNA聚合酶。
在一些实施方案中,重组多核苷酸包含含有选自SEQ ID NO:3-769的奇数编号多核苷酸序列的核苷酸残基34至2550的序列。在一些实施方案中,重组多核苷酸包含含有选自SEQ ID NO:3-769的奇数编号多核苷酸序列的序列。
在一些实施方案中,多核苷酸序列针对在生物体(例如细菌细胞或哺乳动物细胞)中表达而密码子优化。在一些实施方案中,多核苷酸序列被可操作地连接至控制序列。
在另外的方面,本公开内容提供了包含至少一种本文提供的编码工程化DNA聚合酶的多核苷酸序列的表达载体。在一些实施方案中,编码工程化DNA聚合酶的重组多核苷酸被可操作地连接至控制序列。在一些实施方案中,控制序列包括启动子。
在另外的方面,本公开内容还提供了用至少一种本文提供的重组多核苷酸或表达载体转化的宿主细胞。在一些实施方案中,宿主细胞是原核细胞或真核细胞。在一些实施方案中,宿主细胞是细菌细胞、真菌细胞或哺乳动物细胞。在一些实施方案中,宿主细胞是细菌细胞,诸如大肠杆菌(E.coli.)或枯草芽孢杆菌(B.subtilis)。
在另一方面,本公开内容提供了一种在宿主细胞中产生工程化DNA聚合酶多肽的方法,该方法包括将本文提供的宿主细胞在产生至少一种工程化DNA聚合酶的合适的培养条件下培养。在一些实施方案中,方法还包括从培养物和/或宿主细胞中回收工程化DNA聚合酶。在一些实施方案中,方法还包括纯化工程化DNA聚合酶的步骤。
在另一方面,本公开内容提供了包含至少一种本文公开的工程化DNA聚合酶的组合物。在一些实施方案中,组合物包含至少一种缓冲液。在一些实施方案中,组合物还包含一种或更多种DNA聚合酶底物,例如核苷酸底物和/或寡核苷酸引物底物。在一些实施方案中,组合物还包含DNA模板,诸如靶DNA。
在另外的方面,本公开内容提供了工程化DNA聚合酶在制备靶DNA整体或部分的互补DNA拷贝的方法中的用途。在一些实施方案中,本公开内容提供了一种制备靶DNA整体或部分的互补DNA的方法,所述方法包括在存在适当底物的情况下,在适于DNA聚合酶介导产生与靶DNA互补的DNA的条件下,使靶DNA与本文描述的工程化DNA聚合酶接触。
在一些实施方案中,工程化DNA聚合酶用于检测靶DNA,方法包括在存在适当底物的情况下,在适于DNA聚合酶介导产生与靶DNA整体或部分互补的DNA的条件下,使怀疑含有靶DNA的样品与本公开内容的工程化DNA聚合酶接触,并检测互补DNA的存在。在一些实施方案中,样品是生物样品。在一些实施方案中,检测互补DNA是通过扩增互补DNA,诸如通过聚合酶链式反应(PCR)或LAMP。在一些实施方案中,工程化DNA聚合酶可以与逆转录酶一起使用来检测靶RNA,诸如通过RT-PCR。
在另外的方面,本公开内容还提供了包含至少一种本文公开的工程化DNA聚合酶的试剂盒。在一些实施方案中,试剂盒还可以包含缓冲液、核苷酸底物和/或寡核苷酸引物底物中的一种或更多种。在一些实施方案中,试剂盒还包含模板DNA。在一些实施方案中,试剂盒可以包含第二DNA聚合酶,例如另一种热稳定DNA聚合酶或逆转录酶。
详述
本公开内容提供了工程化DNA聚合酶多肽及其组合物、以及编码工程化DNA聚合酶多肽的多核苷酸。本公开内容还提供了用于将工程化DNA聚合酶多肽及其组合物用于诊断和其他目的的方法。在一些实施方案中,工程化DNA聚合酶多肽提供增强的聚合活性、高复制保真度和/或高进行性,特别是在涉及低浓度DNA输入、高通量分析和/或测序反应条件的条件下。
在一些实施方案中,本公开内容的工程化DNA聚合酶可用于使用来自样品的少量DNA的诊断和研究应用,所述少量DNA包括无细胞DNA、循环肿瘤DNA、从循环肿瘤细胞分离的DNA、循环胎儿DNA、从病毒感染的细胞分离的DNA、细针抽吸物,或通过FACS(荧光激活细胞分选)、激光捕获显微术或微流体装置分离的单细胞。然而,并不意图本发明使用的样品限于任何特定的样品类型,因为任何合适的样品,包括那些具有低DNA浓度的样品,可用于本发明。
缩写和定义
除非另外定义,否则本文使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学的实验室程序是本领域中熟知的并且普遍地采用的那些。这样的技术是熟知的,并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析,使用了标准技术或其修改形式。
尽管本发明的实践中可以使用类似或等同于本文描述的那些方法和材料的任何适合的方法和材料,但本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文即将定义的术语通过参考本申请作为整体而被更充分地描述。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,特此通过引用明确并入本文。
如本文使用的,除非上下文另外清楚地指示,否则单数“一(a)”、“一(an)”和“所述/该(the)”包括复数指示物。
如本文使用的,术语“包含(comprising)”及其同源词以其包括性含义被使用(即,等同于术语“包括(including)”及其相应的同源词)。
应进一步理解,在实施方案的描述使用术语“包含(comprising)”及其同源词的情况下,实施方案也可以使用语言“基本上由...组成”或“由...组成”来描述。
数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同此类较低(或较高)数值限制在本文被清楚地写出。
如本文使用的,术语“约”意指特定值的可接受误差。在一些情况下,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%内。在一些实例中,“约”意指在给定值的1、2、3或4个标准差内。
此外,本文所提供的标题不是可以通过参考本申请作为整体而获得的本发明的各个方面或实施方案的限制。因此,下文即将定义的术语通过参考本申请作为整体而被更充分地定义。尽管如此,为了便于理解本发明,许多术语定义如下。
除非另外指示,否则,分别地,核酸以5’至3’方向从左到右书写;氨基酸序列以氨基至羧基方向从左至右书写。
如本文使用的,“EC”编号是指生物化学和分子生物学国际联合命名委员会(Nomenclature Committee of the International Union of Biochemistry andMolecular Biology,NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
如本文使用的,“ATCC”是指美国典型培养物保藏中心(American Type CultureCollection),其生物保藏收集物包括基因和菌株。
如本文使用的,“NCBI”是指美国国家生物技术信息中心(National Center forBiological Information)和其中提供的序列数据库。
如本文使用的,术语“DNA”指脱氧核糖核酸。
如本文使用的,术语“RNA”指核糖核酸。
如本文使用的,术语“融合蛋白”和“嵌合蛋白”以及“嵌合体”是指通过连接最初编码单独蛋白的两个或更多个基因而产生的杂合蛋白。在一些实施方案中,融合蛋白通过重组技术(例如,本领域已知的分子生物学技术)产生。
如本文使用的,术语“聚合酶”是指使核苷三磷酸聚合的一类酶。聚合酶使用模板核酸链来合成互补核酸链。模板链和合成的核酸链可以独立地是DNA或RNA。本领域已知的聚合酶包括但不限于DNA聚合酶(例如,大肠杆菌DNA polI、水生栖热菌(T.aquaticus)DNA聚合酶(Taq)、DNA依赖性RNA聚合酶,以及逆转录酶)。如本文使用的,聚合酶是含有足够的氨基酸来发挥聚合酶的期望酶功能的多肽或蛋白。在一些实施方案中,聚合酶不包含天然酶中发现的所有氨基酸,而仅包含足以允许聚合酶发挥期望催化活性的氨基酸,包括但不限于发挥5’-3’聚合、5’-3’核酸外切酶和3’-5’核酸外切酶活性的氨基酸。
如本文使用的,术语“DNA聚合酶活性”、“合成活性”和“聚合酶活性”在本文中可互换使用,并且是指酶通过掺入脱氧核苷三磷酸来合成新DNA链的能力。
如本文使用的,术语“双链体”和“ds”是指双链核酸(例如DNA)分子,其由两个单链多核苷酸组成,这两个单链多核苷酸的序列互补(A与T配对,C与G配对),以反向平行的5’至3’方向排列,并通过核碱基(即腺嘌呤[A]、鸟嘌呤[G]、胞嘧啶[C]和胸腺嘧啶[T])之间的氢键保持在一起。
如本文使用的,术语“蛋白”、“多肽”和“肽”可互换使用,以表示无论长度或翻译后修饰(例如,糖基化或磷酸化),通过酰胺键共价连接的至少两个氨基酸的聚合物。
如本文使用的,术语“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文中被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。用于遗传编码的氨基酸的缩写是常规的,并且如下:丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、甘氨酸(Gly或G)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以是关于α-碳(Cα)的L-构型或D-构型。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸,并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时,序列按照常规惯例呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非特别描述,否则缩写的核苷可以是核糖核苷或2’-脱氧核糖核苷。核苷可以基于单独地或基于总体地指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列以一串单字母缩写呈现时,序列按照常规惯例呈现为5’至3’方向,并且不示出磷酸。
如本文使用的,当提及细胞、多核苷酸或多肽使用时,术语“工程化”、“重组”、“非天然存在的”和“变体”是指如下材料或与该材料的天然或自然形式对应的材料:已经以自然界中本来不存在的方式被修饰或与其相同但从合成材料产生或衍生和/或通过使用重组技术操作产生或衍生。
如本文使用的,“野生型”和“天然存在的”是指在自然界中发现的形式。例如野生型多肽或多核苷酸序列是生物体中存在的序列,其可以从自然界中的来源分离并且未通过人为操纵被有意地修饰。
如本文使用的,“编码序列”是指核酸(例如基因)编码蛋白的氨基酸序列的部分。
如本文使用的,术语“序列同一性百分比(%)”是指多核苷酸和多肽之间的比较,并且通过在比较窗上比较两条最佳比对的序列来确定,其中为了两个序列的最佳比对,多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包含添加或缺失(即,空位)。百分比可以通过如下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。可选地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以例如通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,1981,2:482)、通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,1970,48:443)、通过Pearson和Lipman的搜索相似性方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,1988,85:2444)、通过这些算法的计算机化执行(例如GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)、或通过如本领域已知的目视检查进行。适于确定序列同一性百分比和序列相似性的算法的实例包括但不限于BLAST和BLAST 2.0算法(参见例如,Altschul等人,J.Mol.Biol.,1990,215:403-410;和Altschul等人,Nuclcic Acids Res.,1977,3389-3402)。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度“W”的短字来鉴定高评分序列对(HSP),所述短字当与数据库序列中相同长度的字比对时匹配或满足某一正值的阈值评分“T”。T被称为邻近字评分阈值(参见,Altschul等人,上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数“M”(用于匹配残基对的奖励评分;总是>0)和“N”(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况,字击中在每一个方向的延伸停止:累积比对评分从其最大达到值下降了量“X”;由于累积一个或更多个负评分残基比对,累积评分达到0或低于0;或到达任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:3的字长(W),10的期望值(E)和BLOSUM62评分矩阵(参见例如,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA,1989,89:10915)。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
如本文使用的,“参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间不同的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primary amino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。例如,短语“基于SEQ IDNO:2的参考序列,在对应于X200的残基处具有缬氨酸”(或“基于SEQ ID NO:2的参考序列,在对应于位置200的残基处具有缬氨酸”)是指这样的参考序列,其中在SEQ ID NO:2中的位置X200处的对应残基(例如,丙氨酸)已经被改变为缬氨酸。
如本文使用的,“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中序列在比较窗中与参考序列(其不包含添加或缺失)相比的部分可以包含20%或更少的添加或缺失(即,空位),以获得两个序列的最佳比对。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
如本文使用的,当在对给定氨基酸或多核苷酸序列进行编号的情况中使用时,“对应于”、“参考于”和“相对于”是指当给定氨基酸或多核苷酸序列与参考序列相比较时对指定参考序列的残基进行编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定的氨基酸序列,诸如工程化DNA聚合酶的氨基酸序列可以通过引入空位以与参考序列对齐从而优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。在一些实施方案中,序列被加标签(例如,使用组氨酸标签)。
如本文使用的,“突变”是指核酸序列的改变。在一些实施方案中,突变导致编码的多肽序列的改变(即,与不具有突变的原始序列相比)。在一些实施方案中,突变包括取代,从而产生不同的氨基酸(例如,用色氨酸取代天冬氨酸)。在一些替代实施方案中,突变包括添加,使得氨基酸被添加到原始多肽序列中。在一些另外的实施方案中,突变包括缺失,使得氨基酸从原始多肽序列中缺失。给定序列中可能存在任何数量的突变。
如本文使用的,“氨基酸差异”和“残基差异”是指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比在位置X200处的残基差异”(或“与SEQ ID NO:2相比在位置200处的残基差异”)是指在对应于SEQ ID NO:2的位置200的多肽位置处的氨基酸残基的差异。因此,如果参考多肽SEQID NO:2在位置200处具有丙氨酸,则“与SEQ ID NO:2相比在位置X200处的残基差异”是指在对应于SEQ ID NO:2的位置200的多肽位置处除丙氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异被指示为“XnY”,其中“Xn”指定(如上文描述的)参考多肽的对应残基和位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中不同的残基)的单字母标识符。在一些情况下(例如,实施例中的表格中),本公开内容还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是在参考序列中的残基位置的编号,并且B是工程化多肽的序列中残基取代的单字母标识符。在一些情况下,本公开内容的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异,所述氨基酸残基差异由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中,在多于一个氨基酸可以在多肽的特定残基位置中使用的情况下,可以使用的各种氨基酸残基由“/”分开(例如,X15A/X15G、X15A/G或V15A/G或15A/G)。本公开内容包括包含一个或更多个氨基酸差异的工程化多肽序列,所述一个或更多个氨基酸差异包括保守氨基酸取代和非保守氨基酸取代中的一种/或两者,以及序列中氨基酸的插入和缺失。
如本文使用的,术语“氨基酸取代集”和“取代集”是指多肽序列中的一组氨基酸取代。在一些实施方案中,取代集包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个氨基酸取代。在一些实施方案中,取代集是指在实施例中任一表格中列出的任一变体DNA聚合酶多肽中存在的氨基酸取代的集合。在这些取代集中,个体取代用分号(“;”;例如V15G;L20A;F21K)或斜线(“/”;例如V15G/L20A/F21K或15G/20A/21K)分开。在一些实施方案中,“取代”包括氨基酸的缺失。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,具有脂肪族侧链的氨基酸可以被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和疏水性氨基酸或亲水性氨基酸分别被另一种疏水性氨基酸或亲水性氨基酸取代。
如本文使用的,“非保守取代”是指用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以利用以上限定的组之间的,而不是其内部的氨基酸,并且影响(a)取代区域中肽骨架的结构(例如,脯氨酸取代甘氨酸);(b)电荷或疏水性;和/或(c)侧链的体积。例如但不限于,示例性非保守取代包括用碱性氨基酸或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
如本文使用的,“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%或者多达组成参考酶的氨基酸总数的20%,同时保留酶活性和/或保留工程化聚合酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。缺失用“-”表示,并且可能存在于取代集中。
如本文使用的,“插入”是指通过向参考多肽添加一个或更多个氨基酸对多肽进行的修饰。插入可以处于多肽的内部部分或者到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或被天然存在的多肽中的一个或更多个氨基酸隔开。
如本文使用的,“功能片段”和“生物活性片段”在本文可互换使用,是指如下多肽:所述多肽具有一个或更多个氨基末端缺失和/或羧基末端缺失和/或内部缺失,但其中剩余的氨基酸序列与和它进行比较的序列(例如,本发明的全长工程化DNA聚合酶)中的对应位置相同,并且保留全长多肽的基本上全部活性。
如本文使用的,“分离的多肽”是指与其天然伴随的其他污染物(例如蛋白、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。重组DNA聚合酶多肽可以存在于细胞内、存在于细胞培养基中,或以各种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,本文提供的重组DNA聚合酶多肽是分离的多肽。
如本文使用的,“基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的主要物质(即,在摩尔或重量基础上,它比该组合物中的任何其他单独的大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,通常是基本上纯化的组合物。通常,基本上纯的DNA聚合酶组合物构成组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多和约98%或更多。在一些实施方案中,将目标物质纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的重组DNA聚合酶多肽是基本上纯的多肽组合物。
如本文使用的,“改进的酶特性”是指与参考DNA聚合酶多肽诸如野生型DNA聚合酶多肽(例如SEQ ID NO:2的残基12至850的野生型DNA聚合酶多肽序列)或另一种工程化DNA聚合酶多肽相比表现出任何酶特性的改进的工程化DNA聚合酶多肽。改进的特性包括但不限于诸如以下的特性:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的稳定性、增加的酶活性、增加的底物特异性和/或亲和力、增加的比活性、增加的对底物和/或终产物抑制的耐受性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对蛋白水解活性的耐受性(即,降低的对蛋白水解的敏感性)、增加的溶解度、增加的保真度、增加的进行性和改变的温度谱(temperatureprofile)。
如本文使用的,“增加的酶活性”和“增强的催化活性”是指工程化DNA聚合酶多肽的改进的特性,其可以被表示为与参考DNA聚合酶(例如,野生型DNA聚合酶和/或另一种工程化DNA聚合酶)相比,比活性(例如,产生的产物/时间/重量蛋白)的增加和/或底物向产物转化的转化百分比(例如,在指定的时间段使用指定量的DNA聚合酶,起始量的底物向产物转化的转化百分比)的增加。在实施例中提供了确定酶活性的示例性方法。与酶活性相关的任何特性都可以被影响,包括典型的酶特性Km、Vmax或kcat,其变化可以导致酶活性的增加。酶活性的改进可以是对应野生型酶的酶活性的约1.1倍到相比于天然存在的DNA聚合酶或DNA聚合酶多肽所源自的另一种工程化DNA聚合酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶活性。
如本文使用的,术语“蛋白水解活性”和“蛋白水解”在本文中可互换使用,是指将蛋白分解成更小的多肽或氨基酸。蛋白的分解通常是蛋白酶(protease)(蛋白酶(proteinase))水解肽键的结果。蛋白酶包括但不限于胃蛋白酶、胰蛋白酶、糜蛋白酶、弹性蛋白酶;羧肽酶A和B,以及肽酶(例如,氨基肽酶、二肽酶和肠肽酶)。
如本文使用的,短语“降低对蛋白水解的灵敏度”和“降低蛋白水解灵敏度”在本文中可互换使用,意指在用一种或更多种蛋白酶处理后,根据本发明的工程化DNA聚合酶多肽与参考DNA聚合酶相比在标准测定(例如,如实施例中所公开的)中具有更高的酶活性。
如本文使用的,“转化”指一种或更多种底物向一种或更多种对应的产物的酶促转化(或生物转化)。“转化百分比”是指在指定条件下在一定时间段内被转化为产物的底物的百分比。因此,DNA聚合酶多肽的“酶活性”或“活性”可以表示为在指定的时间段内底物向产物转化的“转化百分比”。
如本文使用的,“杂交严格性”是指核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中杂交,随后在42℃于0.2×SSPE、0.2%SDS中洗涤的条件。“高严格性杂交”通常是指与定义的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格性条件是指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交的条件(即,如果杂交体在0.018M NaCl中在65℃是不稳定的,它在如本文设想的高严格性条件下将是不稳定的)。例如,可以通过在等同于在42℃于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件杂交,随后在65℃于0.1×SSPE和0.1%SDS中洗涤来提供高严格性条件。另一种高严格性条件包括在等同于在65℃于含有0.1%(w:v)SDS的5X SSC中杂交并且在65℃于含有0.1%SDS的0.1×SSC中洗涤的条件杂交。其他高严格性杂交条件以及中度严格条件在上文引用的参考文献中被描述。
如本文使用的,“密码子优化的”是指将编码蛋白的多核苷酸的密码子改变为特定生物体中优先使用的那些密码子,使得所编码的蛋白在该生物体中被更有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义(synonyms)”或“同义(synonymous)”密码子的若干个密码子表示,但熟知的是,特定生物体的密码子使用是非随机的并且对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,编码DNA聚合酶的多核苷酸是密码子优化的,用于从选择用于表达的宿主生物体的最佳产生。
如本文使用的,“控制序列”在本文中是指包括对本公开内容的多核苷酸和/或多肽的表达必要或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括,但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。最低程度而言,控制序列包括启动子以及转录和翻译终止信号。在一些实施方案中,控制序列与接头一起被提供,以用于引入促进控制序列与编码多肽的核酸序列的编码区域的连接的特定限制性位点的目的。
如本文使用的,“可操作地连接”指其中控制序列被适当地放置在(即,在功能关系上)与感兴趣的多核苷酸有关的位置处,以使得控制序列指导或调节编码感兴趣多肽的多核苷酸的表达的配置。
如本文使用的,“启动子序列”是指被宿主细胞识别用于表达感兴趣的多核苷酸诸如编码序列的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
如本文使用的,“合适的反应条件”或“合适的条件”是指在酶促转化反应溶液中的那些条件(例如,酶载量(enzyme loading)、底物载量、温度、pH、缓冲液、助溶剂等的范围),在所述条件下本公开内容的DNA聚合酶多肽能够将底物转化为期望的产物化合物。本文提供了示例性“合适的反应条件”(参见实施例)。
如本文使用的,“载量”,诸如在“化合物载量”或“酶载量”中,是指在反应起始时组分在反应混合物中的浓度或量。在酶促转化反应过程的情况下,“底物”是指由DNA聚合酶多肽作用的化合物或分子。
如本文使用的,在酶促转化过程的情况下,“产物”是指由DNA聚合酶多肽对底物的作用产生的化合物或分子。
如本文使用的,“培养”是指微生物细胞群体在合适的条件下使用任何合适的培养基(例如,液体、凝胶或固体培养基)的生长。
重组多肽(例如DNA聚合酶变体)可以使用本领域已知的任何合适的方法产生。例如,存在本领域技术人员熟知的许多种不同的诱变技术。此外,诱变试剂盒还可从许多商业分子生物学供应商获得。方法可用于做出确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变,或整个基因内的随机诱变(例如,饱和诱变)。本领域的技术人员已知产生酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组和化学饱和诱变,或本领域已知的任何其他合适的方法。用于DNA和蛋白工程化的方法的非限制性实例在以下专利中提供:美国专利第6,117,679号;美国专利第6,420,175号;美国专利第6,376,246号;美国专利第6,586,182号;美国专利第7,747,391号;美国专利第7,747,393号;美国专利第7,783,428号和美国专利第8,383,346号。在变体产生之后,可以筛选它们的任何期望的特性(例如,高或增加的活性、或者低或降低的活性、增加的热活性、增加的热稳定性、和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组DNA聚合酶多肽”(在本文中还被称为“工程化DNA聚合酶多肽”、“工程化DNA聚合酶”、“变体DNA聚合酶”和“DNA聚合酶变体”)。
如本文使用的,“载体”是用于将DNA序列引入细胞中的DNA构建体。在一些实施方案中,载体是可操作地连接至能够实现DNA序列中编码的多肽在适合宿主中的表达的适合的控制序列的表达载体。在一些实施方案中,“表达载体”具有可操作地连接至DNA序列(例如,转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,术语“表达”包括参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,术语“产生”是指蛋白和/或其他化合物从细胞的产生。意图该术语涵盖参与多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)与它可操作地连接至的另一个序列在自然界中未缔合,则这两个序列是“异源的”。
如本文使用的,术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如,编码至少一种DNA聚合酶变体的多核苷酸序列)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
如本文使用的,术语“类似物”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如,多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,类似物包含非天然存在的氨基酸残基以及天然存在的氨基酸,所述非天然存在的氨基酸残基包括但不限于高精氨酸、鸟氨酸和正缬氨酸。在一些实施方案中,类似物还包括一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽键。
如本文使用的,术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。
术语“分离的”和“纯化的”用于指分子(例如,分离的核酸、多肽等)或其他组分从与其天然缔合的至少一种其他组分中取出。术语“纯化的”不要求绝对纯度,而是意在作为相对定义。
如本文使用的,“无细胞DNA”是指在血流中自由循环且不被细胞包含或与之缔合的DNA。在一些实施方案中,无细胞DNA包含最初从正常体细胞或种系细胞、癌细胞、胎儿细胞、微生物细胞或病毒衍生和释放的DNA。
如本文使用的,“扩增”是指核酸复制。在一些实施方案中,该术语是指特定模板核酸的复制。
如本文使用的,“聚合酶链式反应”和“PCR”是指在此通过引用并入的美国专利第4,683,195号和第4,6884,202号中描述的方法。这些方法可用于增加混合物或纯化的DNA中靶序列区段或整个靶序列的浓度,而不需要克隆或纯化。一连串的(a sequence of)变性、退火和延伸构成了“循环”。变性、引物退火和聚合酶延伸的步骤可以重复许多次(即,使用多个循环),以获得高浓度的扩增DNA。该方法是本领域熟知的,并且自从该方法首次被描述以来,多年来已经开发了许多变化形式。通过PCR,有可能将特定靶序列的单个拷贝扩增到可通过若干不同方法检测到的水平,所述若干不同方法包括但不限于与标记的探针杂交,掺入生物素化引物,然后进行抗生物素蛋白-酶缀合物检测,将32P标记的脱氧核糖核苷三磷酸(例如,dCTP或dATP)掺入扩增的区段,等等。除了基因组DNA以外,任何适于扩增的寡核苷酸序列可以使用PCR与适当引物组进行复制。PCR产物也可以充当扩增的模板。
如本文使用的,当在提及采用DNA聚合酶的方法中使用时,“靶”是指用于制备互补DNA的核酸区域。“靶”是从使用DNA聚合酶的方法中存在的其他核酸中分选出来的。在一些实施方案中,“区段”是靶序列内的核酸区域。
如本文使用的,当在DNA聚合酶的上下文中使用时,“靶DNA”是指作为制备互补DNA拷贝的对象的全部或其一部分的DNA。靶DNA可以是DNA序列整体或其一部分,诸如DNA序列的区段。
如本文使用的,“靶RNA”是指作为制备互补DNA拷贝的对象的全部或其一部分的RNA。靶RNA可以是RNA序列整体或其一部分,诸如RNA序列的区段。
如本文使用的,“样品模板”是指来源于其中分析了靶核酸的存在的样品的核酸。相比之下,“背景模板”是指样品模板以外的核酸,其可能存在或可能不存在于样品中。背景模板可能无意中被包含在样品中,它可能是由遗留(carryover)引起的,或者可能是由于从其纯化靶核酸的核酸污染物的存在而引起。例如,在一些实施方案中,来自待检测生物体以外的生物体的核酸可以作为背景存在于测试样品中。然而,并不意图本发明限于任何特定的核酸样品或模板。
如本文使用的,“可扩增核酸”用于指可以通过包括但不限于PCR的任何扩增方法进行扩增的核酸。在大多数实施方案中,可扩增核酸包含样品模板。
如本文使用的,“PCR产物”、“PCR片段”和“扩增产物”是指在通常包括变性、退火和延伸步骤的PCR扩增(或其他扩增方法,如上下文所示)的两个或更多个循环后获得的所得化合物。这些术语包括其中已经扩增了一个或更多个靶序列的一个或更多个区段的情况。
如本文使用的,“扩增试剂”和“PCR试剂”是指扩增所需的除了引物、核酸模板和扩增酶之外的那些试剂(例如脱氧核糖核苷三磷酸、缓冲液等)。通常,扩增试剂与其他反应组分一起被放置并包含在反应容器(例如试管、微孔等)中。并不意图本发明限于任何特定的扩增试剂,因为任何合适的试剂可用于本发明。
如本文使用的,“引物”是指这样的寡核苷酸(即,一连串的核苷酸),所述寡核苷酸无论是天然存在的还是合成产生的、重组产生的或通过扩增产生的,当置于诱导与核酸链互补的引物延伸产物的合成的条件下(即在核苷酸和诱导剂诸如DNA聚合酶的存在的情况下,并在合适的温度和pH)时,能够充当核酸合成的起始点。在大多数实施方案中,引物是单链的,但在一些实施方案中,它们是双链的。在一些实施方案中,引物具有足够的长度,以在存在DNA聚合酶的情况下引发延伸产物的合成。如本领域技术人员已知的,确切的引物长度取决于许多因素。
如本文使用的,“探针”是指这样的寡核苷酸(即,一连串的核苷酸),所述寡核苷酸无论是天然存在的还是合成产生的、重组产生的或通过扩增产生的,能够与另一种感兴趣的寡核苷酸杂交。探针可用于检测、鉴定和/或分离感兴趣的特定基因序列。在一些实施方案中,探针用“报告分子”(也称为“标记”)进行标记,该“报告分子”(也称为“标记”)有助于在合适的检测系统(例如,荧光、放射性、发光、酶和其他系统)中检测探针。不预期将本发明限于任何特定的检测系统或标记。引物、脱氧核糖核苷酸和脱氧核糖核苷可以含有标记。实际上,并不意图本发明的经标记的组合物限于任何特定的组分。说明性标记包括但不限于32P、35S和荧光分子(例如,荧光染料,包括但不限于绿色荧光蛋白)。
如本文使用的,当关于聚合酶使用时,“保真度”意图是指相对于模板链,在合成的DNA链中模板指导地掺入互补碱基的准确性。通常,保真度基于在新合成的核酸链中掺入不正确碱基的频率来测量。掺入不正确的碱基可能导致点突变、插入或缺失。保真度可以根据本领域已知的任何方法来计算(参见例如Tindall和Kunkel,Biochem.,1988,27:6008-6013;和Barnes,Gene,1992,112:29-35)。聚合酶或聚合酶变体可以表现出高保真度或低保真度。如本文使用的,“高保真度”是指具有超过预定值的准确碱基掺入频率的聚合酶。如本文使用的,术语“低保真度”是指具有低于预定值的准确碱基掺入频率的聚合酶。在一些实施方案中,预定值是期望的准确碱基掺入频率或已知聚合酶(即参考聚合酶)的保真度。
如本文使用的,“改变的保真度”是指聚合酶变体的保真度不同于该聚合酶变体从其来源的亲本聚合酶的保真度。在一些实施方案中,改变的保真度高于亲本聚合酶的保真度,而在一些其他实施方案中,改变的保真度低于亲本聚合酶的保真度。改变的保真度可以通过使用本领域已知的任何合适的测定对亲本聚合酶和变体聚合酶进行测定并比较它们的活性来确定。
如本文使用的,术语“进行性”是指核酸修饰酶,诸如DNA聚合酶,保持与模板或底物结合并进行多次修饰反应的能力。进行性通常由每个结合事件发生的催化事件的数量来测量。
如本文使用的,“改变的进行性”是指聚合酶或其变体的进行性不同于该变体从其衍生的亲本聚合酶的进行性。在一些实施方案中,改变的进行性高于亲本酶的进行性,而在一些其他实施方案中,改变的进行性低于亲本酶的进行性。改变的进行性可以通过使用本领域已知的任何合适的测定对亲本聚合酶和变体聚合酶进行测定并比较它们的活性来确定。
术语“受试者”涵盖哺乳动物诸如人类、非人类灵长目动物、家畜、宠物和实验动物(例如,啮齿动物和兔形目动物)。意图该术语包括雌性以及雄性。
如本文使用的,术语“患者”意指正在被评估、治疗或正在经历疾病的任何受试者。
如本文使用的,术语“样品”是指用于与DNA聚合酶反应的材料或物质,例如诸如用于检测靶核酸的存在或制备靶核酸的DNA拷贝以用于测序或产生cDNA文库。在一些实施方案中,样品是“生物样品”,其是指生物组织或流体的样品。这样的样品通常来自人类,但包括从非人类灵长类动物或啮齿动物(例如小鼠和大鼠)分离的组织,并且包括组织切片,诸如活检和尸检样品、出于组织学目的采集的冷冻切片、血液、血浆、血清、痰、粪便、眼泪、黏液、毛发、皮肤等。“生物样品”也指来自生物体的细胞或细胞群体或一定量的组织或流体。在一些实施方案中,生物样品已经从动物中取出,但是术语“生物样品”也可以指体内分析(即没有从动物中取出)的细胞或组织。通常,“生物样品”将含有来自动物或生物体的细胞,但是该术语也可以指非细胞生物材料,诸如血液、唾液或尿液的非细胞级分。多种类型的生物样品可以与本公开内容中的酶、组合物和方法一起使用,包括但不限于组织活检、血液样品、口腔刮擦(buccal scrape)、唾液样品或乳头溢液。如本文使用的,“组织活检”是指从动物(优选地人类)取出的一定量的组织用于诊断分析。在患有癌症的患者中,可以从肿瘤中取出组织,允许对肿瘤内的细胞进行分析。“组织活检”可以指任何类型的活检,诸如针刺活检、细针刺活检、外科活检等。
工程化DNA聚合酶多肽
本公开内容提供了被工程化为具有改进的特性的DNA聚合酶多肽变体。在一些实施方案中,工程化DNA聚合酶多肽变体可用于进行聚合酶反应,包括制备靶DNA靶/模板的互补DNA。工程化DNA聚合酶变体可用于从DNA模板整体或部分有效产生互补DNA,诸如在测序(例如NGS测序)、扩增(例如PCR)和诊断方法中,诸如用于检测靶核酸。这些工程化DNA聚合酶变体可以用于溶液中,以及用于固定的实施方案中。在一些实施方案中,工程化DNA聚合酶可以制备并用作非融合多肽或用作融合多肽。
在一些实施方案中,当通过参考在野生型DNA聚合酶或参考DNA聚合酶多肽的序列中的特定氨基酸残基的修饰来提及特定的DNA聚合酶变体(即,工程化DNA聚合酶多肽)时,应当理解,本文涵盖在一个或更多个等同位置(如根据相应氨基酸序列之间的任选氨基酸序列比对来确定的)修饰的另一种DNA聚合酶的变体。例如,对于参考SEQ ID NO:2编号的一个或更多个指定氨基酸位置处的取代,可以容易地对另一个参考序列确定一个或更多个等同氨基酸位置,所述另一个参考序列诸如包含SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或诸如SEQ ID NO:8、332、462或606的参考序列。
在一方面,本公开内容提供了一种工程化DNA聚合酶或其功能片段,所述工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:2、8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ IDNO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:2、8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ IDNO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少80%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶或其功能片段包含与对应于表4.1、表5.1、表6.1、表7.1和表8.1中列出的工程化DNA聚合酶变体的残基12至850的参考序列或与对应于表4.1、表5.1、表6.1、表7.1和表8.1中列出的工程化DNA聚合酶变体的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820、849或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q/S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A、849T或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:V15A/G/K/N、Q16R、L20A/C、F21K/Q/S、Q22K、S40A、Y41F、S52R、V57T、H58N、E73A、P85E/P/R/S、P87N、S88T、H91K、S102V/M/S、K109P、V132Y、S157G、R177T、Q186E、A200V、R213P、A217E、D231E、R232C、P242Q、P243L/S、I262L、S263A、R264T、M265I、V273M、T299N、E321G、R322N/S、V328I、R384Y、R386V、S401A/G/I、N402G/R、N403L/R、Q404S/T、A406K/Q、S407R/W、E440G、L476I/N、Q480E/V/W、A491G、R495E/M/S、G498D、L503I/V、N504M、R506P、D507K、Q508H、T511M、Y514F、A520P、A521G/W/Y、R523A/K/V、R524G/K/Q、T525L/V、A526T、K527V/W、T528A/Q/R/W、G529S、K530G/P/R/W、T533L/P/Q/V、S534H/W、A535K、S536R、V537G/L/W、L538A、E539L/R、T540H/V、R542G/M/T/W、Q553F/K/N/R、Y554E、R555H/K/M/W、E556F/M/P/W、L557G/H、A558R/S/V/Q、K559D/G/P、L560G/M、G562S、T563L、D566A、K570R、V572I、T581A、R582F、H584N、Q585K/R、T586M、G587Q/S、A589G/L/R/S/W、R592G/T/V、L593N、S594C/Q/T/V/W、S595A/P/R、S596L/R/W、D597E、N599G/S/T、Q601M/P、N602V、I603G/V/W、I605E/A、T607N、G616A、M665V、V671E/R、D674T、P675L、R677M、I684V、V688I、R696H/V、D704P、Y705W、G706E、R728K、E735G/L、R747T、H748Y、V749L/R/T、P750S/P、E751H、L753K/V、K755P、A756N/T、A762M/Q/V、A763G/Y、E764A/I/V、V766Y、V772I、Q773R、L779I、P793G、H803C/R、R814E、R820A、A849T或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、521、748或750或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置40处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置85处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置102处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置132处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置157处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置177处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置262处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置263处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置503处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置521处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置748处包含至少一个取代。在一些实施方案中,工程化DNA聚合酶的多肽序列在氨基酸位置750处包含至少一个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、132、157、262、263或748。在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、132、157、262、263、503和748。在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、102、132、157、262、263、521或748。在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、521、748或750。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:40A、85E/P/R/S、102V/M/S、132Y、157G、177T、262L、263A、521G/W/Y、748Y或750S/P或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:S40A、P85E/P/R/S、S102V/M/S、V132Y、S157G、R177T、I262L、S263A、A521G/W/Y、H748Y或P750S或其组合。在一些实施方案中,对于在氨基酸位置40、85、102、132、157、262、263、521、748或750处包含一个或更多个取代的工程化DNA聚合酶,取代可以选自前述,例如40A、85E/P/R/S、102V/M/S、132Y、157G、177T、262L、263A、521G/W/Y、748Y和/或750S/P。在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代:40A、85E、102S、132Y、157G、177T、262L、263A、521G、748Y或750S或其组合。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:213/503/508/584/748、40/132/748、40/132/157/262/263/748、132、40/132/503/748、40/132/157/503/562、40/132/213/748/814、132/157/562/584、132/584/748、40/132/231/684/748、40/132、40/41/132/562/684/748、41/213/231/503/650/674/748、132/231/503/748、40/132/157/503、503/748/814、40/132/231/503/674/748、40/88/132/503/684/748、132/157/213/674/748/814、157/263/748、40/748、41/157/231/262/748/814、40/213/503/562/584/748、523/524、40/132/503/514/650/674、40/132/157/213/231、41/213/520/814、40/41/157/231/503、40/157/503、40/132/562/748、132/748、40/41/132/562/748、88/213/503/584/684/748、57/58/523/616/677、40/213/231/503/514/562/748、132/562、213/503/650、40/41/88/231/748/814、41/213/262/562、41/88/231/748、213/263/748、40/157/213、157/520、40/132/263/503/674/814、40/41、524/665/756、58/186/217/523/524/677、40/41/748、132/514、520、41/213/503/562、231/503/748/772、503/562、73/232/514/584/814、58/507/616、132/262/520/562/684/748、88/562/814、41/88/157/814、88/157/213/674/684、57/58/523/779、40/132/157/514/520/684、40/41/213/684/772、40/41/231/503/814、88/213/503/584/814、40/41/132/562/584、41/88/213/231/503/650/748、40/503、40/132/213/231/520/562/650/814、40/41/132/231/262/503/562/584/748/814、57/58/264/265/524/688、88/132/157/262/263/520/562、88/132/157/262/503/514/562/650、40/584/674/748、40/41/132/263/503、584/748、40/213/674、40/41/88T/132/503/562/584/748、88/213/514/562/748/814、263/520/814或40/41/88/157,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:213P/503I/508H/584N/748Y;40A/132Y/748Y;40A/132Y/157G/262L/263A/748Y;132Y;40A/132Y/503I/748Y;40A/132Y/157G/503I/562S;40A/132Y/213P/748Y/814E;132Y/157G/562S/584N;132Y/584N/748Y;40A/132Y/231E/684V/748Y;40A/132Y;40A/41F/132Y/562S/684V/748Y;41F/213P/231E/503I/650A/674T/748Y;132Y/231E/503I/748Y;40A/132Y/157G/503I;503I/748Y/814E;40A/132Y/231E/503I/674T/748Y;40A/88T/132Y/503I/684V/748Y;132Y/157G/213P/674T/748Y/814E;157G/263A/748Y;40A/748Y;41F/157G/231E/262L/748Y/814E;40A/213P/503I/562S/584N/748Y;523K/524K;40A/132Y/503I/514F/650A/674T;40A/132Y/157G/213P/231E;41F/213P/520P/814E;40A/41F/157G/231E/503I;40A/157G/503I;40A/132Y/562S/748Y;132Y/748Y;40A/41F/132Y/562S/748Y;88T/213P/503I/584N/684V/748Y;57T/58N/523K/616A/677M;40A/213P/231E/503I/514F/562S/748Y;132Y/562S;213P/503I/650A;40A/41F/88T/231E/748Y/814E;41F/213P/262L/562S;41F/88T/231E/748Y;213P/263A/748Y;40A/157G/213P;157G/520P;40A/132Y/263A/503I/674T/814E;40A/41F;524K/665V/756N;58N/186E/217E/R523K/R524K/R677M;S40A/Y41F/748Y;132Y/514F;520P;41F/213P/503I/562S;231E/503I/748Y/772I;503I/562S;73A/232C/514F/584N/814E;58N/507K/616A;132Y/262L/520P/562S/684V/748Y;88T/562S/814E;41F/88T/157G/814E;88T/157G/213P/674T/684V;57T/58N/523K/779I;40A/132Y/157G/514F/520P/684V;40A/41F/213P/684V/772I;40A/41F/231E/503I/814E;88T/213P/503I/584N/814E;40A/41F/132Y/562S/584N;41F/88T/213P/231E/503I/650A/748Y;40A/503I;40A/132Y/213P/231E/520P/562S/650A/814E;40A/41F/132Y/231E/262L/503I/562S/584N/748Y/814E;57T/58N/264T/265I/524K/688I;88T/132Y/157G/262L/263A/520P/562S;88T/132Y/157G/262L/503I/514F/562S/650A;40A/584N/674T/748Y;40A/41F/132Y/263A/503I;584N/748Y;40A/213P/674T;40A/41F/88T/132Y/503I/562S/584N/748Y;88T/213P/514F/562S/748Y/814E;263A/520P/814E;40A/41F/88T/157G或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:R213P/L503I/Q508H/H584N/H748Y;S40A/V132Y/H748Y;S40A/V132Y/S157G/I262L/S263A/H748Y;V132Y;S40A/V132Y/L503I/H748Y;S40A/V132Y/S157G/L503I/G562S;S40A/V132Y/R213P/H748Y/R814E;V132Y/S157G/G562S/H584N;V132Y/H584N/H748Y;S40A/V132Y/D231E/I684V/H748Y;S40A/V132Y;S40A/Y41F/V132Y/G562S/I684V/H748Y;Y41F/R213P/D231E/L503I/I650A/D674T/H748Y;V132Y/D231E/L503I/H748Y;S40A/V132Y/S157G/L503I;L503I/H748Y/R814E;S40A/V132Y/D231E/L503I/D674T/H748Y;S40A/S88T/V132Y/L503I/I684V/H748Y;V132Y/S157G/R213P/D674T/H748Y/R814E;S157G/S263A/H748Y;S40A/H748Y;Y41F/S157G/D231E/I262L/H748Y/R814E;S40A/R213P/L503I/G562S/H584N/H748Y;R523K/R524K;S40A/V132Y/L503I/Y514F/I650A/D674T;S40A/V132Y/S157G/R213P/D231E;Y41F/R213P/A520P/R814E;S40A/Y41F/S157G/D231E/L503I;S40A/S157G/L503I;S40A/V132Y/G562S/H748Y;V132Y/H748Y;S40A/Y41F/V132Y/G562S/H748Y;S88T/R213P/L503I/H584N/I684V/H748Y;V57T/H58N/R523K/G616A/R677M;S40A/R213P/D231E/L503I/Y514F/G562S/H748Y;V132Y/G562S;R213P/L503I/I650A;S40A/Y41F/S88T/D231E/H748Y/R814E;Y41F/R213P/I262L/G562S;Y41F/S88T/D231E/H748Y;R213P/S263A/H748Y;S40A/S157G/R213P;S157G/A520P;S40A/V132Y/S263A/L503I/D674T/R814E;S40A/Y41F;R524K/M665V/A756N;H58N/Q186E/A217E/R523K/R524K/R677M;S40A/Y41F/H748Y;V132Y/Y514F;A520P;Y41F/R213P/L503I/G562S;D231E/L503I/H748Y/V772I;L503I/G562S;E73A/R232C/Y514F/H584N/R814E;H58N/D507K/G616A;V132Y/I262L/A520P/G562S/I684V/H748Y;S88T/G562S/R814E;Y41F/S88T/S157G/R814E;S88T/S157G/R213P/D674T/I684V;V57T/H58N/R523K/L779I;S40A/V132Y/S157G/Y514F/A520P/I684V;S40A/Y41F/R213P/I684V/V772I;S40A/Y41F/D231E/L503I/R814E;S88T/R213P/L503I/H584N/R814E;S40A/Y41F/V132Y/G562S/H584N;Y41F/S88T/R213P/D231E/L503I/I650A/H748Y;S40A/L503I;S40A/V132Y/R213P/D231E/A520P/G562S/I650A/R814E;S40A/Y41F/V132Y/D231E/I262L/L503I/G562S/H584N/H748Y/R814E;V57T/H58N/R264T/M265I/R524K/V688I;S88T/V132Y/S157G/I262L/S263A/A520P/G562S;S88T/V132Y/S157G/I262L/L503I/Y514F/G562S/I650A;S40A/H584N/D674T/H748Y;S40A/Y41F/V132Y/S263A/L503I;H584N/H748Y;S40A/R213P/D674T;S40A/Y41F/S88T/V132Y/L503I/G562S/H584N/H748Y;S88T/R213P/Y514F/G562S/H748Y/R814E;S263A/A520P/R814E;S40A/Y41F/S88T/S157G或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773、803或其组合,其中氨基酸位置是相对于SEQID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:599S、530G、596L、696H、542W、530R、553F、533V、555M、594V、594W、536R、585K、401G、597E、553K、402R、763Y、762V、605E、530P、506P、589G、558S、553N、559P、751H、589S、747T、560M、696V、540V、594C、556W、589R、407W、557H、559G、599T、521Y、605A、559D、534H、592G、533P、529S、524G、749R、766Y、556P、595P、533Q、603V、537G、589W、598W、22K/407R、555W、539R、531Q、581A、803R、538A、404T、406Q、537L、595R、534W、404S、592V、521W、603G、401I、595A、762Q、530W、558V、527W、596W、603W、528W、504M、587Q、587S、523V、521G、558R、558Q、593N、525V、749L、503V、527V、554E、535K、592T、528A、585R、401A、586M、764I、556M、763G、406K、582F、540H、560G、402G、594Q、539L、602V、523A、749T、542T、764A、523K、607N、525L、403L、526T、528R、599G、537W、803C、556F、557G、601M、596R、563L、601P、773R、553R、542M、594T、533L、328I、555K、542G或528Q或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:N599S、K530G、S596L、R696H、R542W、K530R、Q553F、T533V、R555M、S594V、S594W、S536R、Q585K、S401G、D597E、Q553K、N402R、A763Y、A762V、I605E、K530P、R506P、A589G、A558S、Q553N、K559P、E751H、A589S、R747T、L560M、R696V、T540V、S594C、E556W、A589R、S407W、L557H、K559G、N599T、A521Y、I605A、K559D、S534H、R592G、T533P、G529S、R524G、V749R、V766Y、E556P、S595P、T533Q、I603V、V537G、A589W、P598W、Q22K/S407R、R555W、E539R、R531Q、T581A、H803R、L538A、Q404T、A406Q、V537L、S595R、S534W、Q404S、R592V、A521W、I603G、S401I、S595A、A762Q、K530W、A558V、K527W、S596W、I603W、T528W、N504M、G587Q、G587S、R523V、A521G、A558R、A558Q、L593N、T525V、V749L、L503V、K527V、Y554E、A535K、R592T、T528A、Q585R、S401A、T586M、E764I、E556M、A763G、A406K、R582F、T540H、L560G、N402G、S594Q、E539L、N602V、R523A、V749T、R542T、E764A、R523K、T607N、T525L、N403L、A526T、T528R、N599G、V537W、H803C、E556F、L557G、Q601M、S596R、T563L、Q601P、Q773R、Q553R、R542M、S594T、T533L、V328I、R555K、R542G、T528Q或其组合,其中氨基酸位置是相对于SEQID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764、542/762/764,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:404S、542G、762M、524Q/542G/581A/762M/764V、404S/524Q/542G/589L/762M/764V、764V、403R/404S/524Q/542G/555H/762M/764V、476N、542G/762M/764V、728K、52R、476I、675L、750S/849T、102S、21C、755P、21S、321G、20A、21K、87N、20C、16R/735L、21Q、704P、735G、384Y、480W、102M、793G、322S、322N、570R、480V、753V、753K、524Q/581A、91K、243L、243S、671E、85S、495M、15A、15N、15K、820A、495E、85E、85R、480E、15G或671R,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:Q404S、R542G、A762M、R524Q/R542G/T581A/A762M/E764V、Q404S/R524Q/R542G/A589L/A762M/E764V、E764V、N403R/Q404S/R524Q/R542G/R555H/A762M/E764V、L476N、R542G/A762M/E764V、R728K、S52R、L476I、P675L、P750S/A849T、V102S、F21C、K755P、F21S、E321G、L20A、F21K、P87N、L20C、Q16R/E735L、F21Q、D704P、E735G、R384Y、Q480W、V102M、P793G、R322S、R322N、K570R、Q480V、L753V、L753K、R524Q/T581A、H91K、P243L、P243S、V671E、P85S、R495M、V15A、V15N、V15K、R820A、R495E、P85E、P85R、Q480E、V15G或V671R,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20C/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:750S/820A、21C/52R、20C/21C/85E/322N/476N/495E、20C/85E/200V/322N/476N/495S/750S、476N/750S、20C/476N、20C/322N/386V、85E/322N/476N、52R/322N/498D/750S、20C/322N/476N/820A、85E/476N/495E/820A、21C/85E/322N/820A、20C/299N/322N/386V/476N/495E/820A、20C/322N、21C/820A/849T、476N、322N/820A、21C/322N/386V/820A、322N/386V/495E、85E/386V/495E/750S、20C/85E/476N/750S、20C/386V/476N、85E/322N/386V/476N/495S、20C/495E/820A、750S、21C/322N/495E、52R/386V/495S/820A、21C/322N、85E/322N/750S/820A、20C/52R/85E、21C/52R/572I、20C/85E/495E/849T、85E/750S、21C/495E/820A、273M/322N/849T、495E、322N/750S/820A、52R/476N/495E/566A/750S/849T、386V/495E、495S/820A、21C/322N/495E/750S/820A、21C/85E/322N/386V/495S/820A/849T、495S、476N/495E/750S、386V/849T、476N/495E、85E/476N/849T、21C/322N/750S、20C/85E/566A/820A或386V/750S/849T,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:P750S/R820A、F21C/S52R、L20C/F21C/P85E/R322N/L476N/R495E、L20C/P85E/A200V/R322N/L476N/R495S/P750S、L476N/P750S、L20C/L476N、L20C/R322N/R386V、P85E/R322N/L476N、S52R/R322N/G498D/P750S、L20C/R322N/L476N/R820A、P85E/L476N/R495E/R820A、F21C/P85E/R322N/R820A、L20C/T299N/R322N/R386V/L476N/R495E/R820A、L20C/R322N、F21C/R820A/A849T、L476N、R322N/R820A、F21C/R322N/R386V/R820A、R322N/R386V/R495E、P85E/R386V/R495E/P750S、L20C/P85E/L476N/P750S、L20C/R386V/L476N、P85E/R322N/R386V/L476N/R495S、L20C/R495E/R820A、P750S、F21C/R322N/R495E、S52R/R386V/R495S/R820A、F21C/R322N、P85E/R322N/P750S/R820A、L20C/S52R/P85E、F21C/S52R/V572I、L20C/P85E/R495E/A849T、P85E/P750S、F21C/R495E/R820A、V273M/R322N/A849T、R495E、R322N/P750S/R820A、S52R/L476N/R495E/D566A/P750S/A849T、R386V/R495E、R495S/R820A、F21C/R322N/R495E/P750S/R820A、F21C/P85E/R322N/R386V/R495S/R820A/A849T、R495S、L476N/R495E/P750S、R386V/A849T、L476N/R495E、P85E/L476N/A849T、F21C/R322N/P750S、L20C/P85E/D566A/R820A或R386V/P750S/A849T,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495或440,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:299N/386V/566A/820A、476N/820A/849T、21C/322N/476N/495E/820A、177T、21C/495E、476N/820A、20C/52R/299N、52R/299N、322N/820A、20C/820A、20C/299N/386V/476N、386V/476N/820A、476N/495E/820A、386V/476N/495E、20C/21C/299N/322N/386V、322N/386V/495E、21C/299N/322N/476N/495E/820A、21C/299N/386V/820A、299N/476N/820A、20C/21C、21C/85P/102V/750P、705W、21C/386V/476N/820A、820A、21C/299N/322N、20C/21C/322N/386V/820A、299N、21C/299N/386V/476N、109P、322N/495E、491G、52R/820A、21C/386V/820A、20C/21C/495E、21C/T99N/322N/495E/566A/820A、20C/21C/299N/495E、756T、386V/820A、495E、511M、21C/52R/242Q/386V/495E/820A、299N/476N/495E、706E、21C/299N/386V/476N/495E、21C/299N/322N/495E、21C/476N/849T、299N/322N/476N/820A、21C/52R/299N/322N/820A、20C/21C/566A、20C/52R、322N/386V/495E/566A/820A、21C/299N、21C/299N/386V、386V/849T、52R/476N、52R/299N/322N/386V/495E或440G,其中氨基酸位置是相对于SEQ IDNO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:T299N/R386V/D566A/R820A、L476N/R820A/A849T、F21C/R322N/L476N/R495E/R820A、R177T、F21C/R495E、L476N/R820A、L20C/S52R/T299N、S52R/T299N、R322N/R820A、L20C/R820A、L20C/T299N/R386V/L476N、R386V/L476N/R820A、L476N/R495E/R820A、R386V/L476N/R495E、L20C/F21C/T299N/R322N/R386V、R322N/R386V/R495E、F21C/T299N/R322N/L476N/R495E/R820A、F21C/T299N/R386V/R820A、T299N/L476N/R820A、L20C/F21C、F21C/E85P/S102V/S750P、Y705W、F21C/R386V/L476N/R820A、R820A、F21C/T299N/R322N、L20C/F21C/R322N/R386V/R820A、T299N、F21C/T299N/R386V/L476N、K109P、R322N/R495E、A491G、S52R/R820A、F21C/R386V/R820A、L20C/F21C/R495E、F21C/T299N/R322N/R495E/D566A/R820A、L20C/F21C/T299N/R495E、A756T、R386V/R820A、R495E、T511M、F21C/S52R/P242Q/R386V/R495E/R820A、T299N/L476N/R495E、G706E、F21C/T299N/R386V/L476N/R495E、F21C/T299N/R322N/R495E、F21C/L476N/A849T、T299N/R322N/L476N/R820A、F21C/S52R/T299N/R322N/R820A、L20C/F21C/D566A、L20C/S52R、R322N/R386V/R495E/D566A/R820A、F21C/T299N、F21C/T299N/R386V、R386V/A849T、S52R/L476N、S52R/T299N/R322N/R386V/R495E或E440G,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代集:22/40/132/157/262/263/407/748、40/132/157/262/263/328/748、40/132/157/262/263/401/748、40/132/157/262/263/402/748、40/132/157/262/263/403/748、40/132/157/262/263/404/748、40/132/157/262/263/406/748、40/132/157/262/263/407/748、40/132/157/262/263/503/748、40/132/157/262/263/504/748、40/132/157/262/263/506/748、40/132/157/262/263/521/748、40/132/157/262/263/523/748、40/132/157/262/263/524/748、40/132/157/262/263/525/748、40/132/157/262/263/526/748、40/132/157/262/263/527/748、40/132/157/262/263/528/748、40/132/157/262/263/529/748、40/132/157/262/263/530/748、40/132/157/262/263/531/748、40/132/157/262/263/533/748、40/132/157/262/263/534/748、40/132/157/262/263/535/748、40/132/157/262/263/536/748、40/132/157/262/263/537/748、40/132/157/262/263/538/748、40/132/157/262/263/539/748、40/132/157/262/263/540/748、40/132/157/262/263/542/748、40/132/157/262/263/54/748、40/132/157/262/263/553/748、40/132/157/262/263/554/748、40/132/157/262/263/555/748、40/132/157/262/263/556/748、40/132/157/262/263/557/748、40/132/157/262/263/558/748、40/132/157/262/263/559/748、40/132/157/262/263/560/748、40/132/157/262/263/563/748、40/132/157/262/263/581/748、40/132/157/262/263/582/748、40/132/157/262/263/585/748、40/132/157/262/263/586/748、40/132/157/262/263/587/748、40/132/157/262/263/589/748、40/132/157/262/263/592/748、40/132/157/262/263/593/748、40/132/157/262/263/594/748、40/132/157/262/263/595/748、40/132/157/262/263/596/748、40/132/157/262/263/597/748、40/132/157/262/263/598/748、40/132/157/262/263/599/748、40/132/157/262/263/601/748、40/132/157/262/263/602/748、40/132/157/262/263/603/748、40/132/157/262/263/605/748、40/132/157/262/263/607/748、40/132/157/262/263/696/748、40/132/157/262/263/747/748、40/132/157/262/263/748、40/132/157/262/263/748/749、40/132/157/262/263/748/751、40/132/157/262/263/748/762、40/132/157/262/263/748/763、40/132/157/262/263/748/764、40/132/157/262/263/748/766、40/132/157/262/263/748/773、40/132/157/262/263/748/803、40/132/157/605/262/263/748、40/132/157/262/263/403/521/748或40/132/157/262/263/403/553/748,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代集:40A/132Y/157G/262L/263A/599S/748Y、40A/132Y/157G/262L/263A/530G/748Y、40A/132Y/157G/262L/263A/596L/748Y、40A/132Y/157G/262L/263A/696H/748Y、40A/132Y/157G/262L/263A/542W/748Y、40A/132Y/157G/262L/263A/530R/748Y、40A/132Y/157G/262L/263A/553F/748Y、40A/132Y/157G/262L/263A/533V/748Y、40A/132Y/157G/262L/263A/555M/748Y、40A/132Y/157G/262L/263A/594V/748Y、40A/132Y/157G/262L/263A/594W/748Y、40A/132Y/157G/262L/263A/536R/748Y、40A/132Y/157G/262L/263A/585K/748Y、40A/132Y/157G/262L/263A/401G/748Y、40A/132Y/157G/262L/263A/597E/748Y、40A/132Y/157G/262L/263A/553K/748Y、40A/132Y/157G/262L/263A/402R/748Y、40A/132Y/157G/262L/263A/748Y/763Y、40A/132Y/157G/262L/263A/748Y/762V、40A/132Y/157G/262L/263A/605E/748Y、40A/132Y/157G/262L/263A/530P/748Y、40A/132Y/157G/262L/263A/506P/748Y、40A/132Y/157G/262L/263A/589G/748Y、40A/132Y/157G/262L/263A/558S/748Y、40A/132Y/157G/262L/263A/553N/748Y、40A/132Y/157G/262L/263748Y、40A/132Y/157G/262L/263A/748Y/751H、40A/132Y/157G/262L/263A/589S/748Y、40A/132Y/157G/262L/263A/747T/748Y、40A/132Y/157G/262L/263A/560M/748Y、40A/132Y/157G/262L/263A/696V/748Y、40A/132Y/157G/262L/263A/540V/748Y、40A/132Y/157G/262L/263A/594C/748Y、40A/132Y/157G/262L/263A/556W/748Y、40A/132Y/157G/262L/263A/589R/748Y、40A/132Y/157G/262L/263A/407W/748Y、40A/132Y/157G/262L/263A/557H/748Y、40A/132Y/157G/262L/263A/559G/748Y、40A/132Y/157G/262L/263A/599T/748Y、40A/132Y/157G/262L/263A/521Y/748Y、40A/132Y/157G/605A/262L/263A/748Y、40A/132Y/157G/262L/263A/559D/748Y、40A/132Y/157G/262L/263A/534H/748Y、40A/132Y/157G/262L/263A/592G/748Y、40A/132Y/157G/262L/263A/533P/748Y、40A/132Y/157G/262L/263A/529S/748Y、40A/132Y/157G/262L/263A/524G/748Y、40A/132Y/157G/262L/263A/748Y/749R、40A/132Y/157G/262L/263A/748Y/766Y、40A/132Y/157G/262L/263A/556P/748Y、40A/132Y/157G/262L/263A/595P/748Y、40A/132Y/157G/262L/263A/533Q/748Y、40A/132Y/157G/262L/263A/603V/748Y、40A/132Y/157G/262L/263A/537G/748Y、40A/132Y/157G/262L/263A/589W/748Y、40A/132Y/157G/262L/263A/598W/748Y、22K/40A/132Y/157G/262L/263A/407R/748Y、40A/132Y/157G/262L/263A/555W/748Y、40A/132Y/157G/262L/263A/539R/748Y、40A/132Y/157G/262L/263A/531Q/748Y、40A/132Y/157G/262L/263A/581A/748Y、40A/132Y/157G/262L/263A/748Y/803R、40A/132Y/157G/262L/263A/538A/748Y、40A/132Y/157G/262L/263A/404T/748Y、40A/132Y/157G/262L/263A/406Q/748Y、40A/132Y/157G/262L/263A/537L/748Y、40A/132Y/157G/262L/263A/595R/748Y、40A/132Y/157G/262L/263A/534W/748Y、40A/132Y/157G/262L/263A/404S/748Y、40A/132Y/157G/262L/263A/592V/748Y、40A/132Y/157G/262L/263A/521W/748Y、40A/132Y/157G/262L/263A/603G/748Y、40A/132Y/157G/262L/263A/401I/748Y、40A/132Y/157G/262L/263A/595A/748Y、40A/132Y/157G/262L/263A/748Y/762Q、40A/132Y/157G/262L/S263A/530W/748Y、40A/132Y/157G/262L/263A/558V/748Y、40A/132Y/157G/262L/263A/527W/748Y、40A/132Y/157G/262L/S263A/596W/748Y、40A/132Y/157G/262L/263A/603W/748Y、40A/132Y/157G/262L/263A/528W/748Y、40A/132Y/157G/262L/263A/504M/748Y、40A/132Y/157G/262L/263A/587Q/748Y、40A/132Y/157G/262L/263A/523V/748Y、40A/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/558R/748Y、40A/132Y/157G/262L/263A/593N/748Y、40A/132Y/157GI262L/263A/525V/748Y、40A/132Y/157G/262L/263A/748Y/749L、40A/132Y/157G/262L/263A/503V/748Y、40A/132Y/157G/262L/263A/527V/748Y、40A/132Y/157G/262L/263A/554E/748Y、40A/132Y/157G/262L/263A/535K/748Y、40A/132Y/157G/262L/263A/592T/748Y、40A/132Y/157G/262L/263A/528A/748Y、40A/132Y/157G/262L/263A/585R/748Y、40A/132Y/157G/262L/263A/401A/748Y、40A/132Y/157G/262L/263A/586M/748Y、40A/132Y/157G/262L/263A/748Y/764I、40A/132Y/157G/262L/263A/556M/748Y、40A/132Y/157G/262L/263A/748Y/763G、40A/132Y/157G/262L/263A/406K/748Y、40A/132Y/157G/262L/263A/582F/748Y、40A/132Y/157G/262L/263A/540H/748Y、40A/132Y/157G/262L/263A/560G/748Y、40A/132Y/157G/262L/263A/402G/748Y、40A/132Y/157G/262L/263A/594Q/748Y、40A/132Y/157G/262L/263A/539L/748Y、40A/132Y/157G/262L/263A/602V/748Y、40A/132Y/157G/262L/263A/523A/748Y、40A/132Y/157G/262L/263A/748Y/749T、40A/132Y/157G/262L/263A/542T/748Y、40A/132Y/157G/262L/263A/748Y/764A、40A/132Y/157G/262L/263A/523K/748Y、40A/132Y/157G/262L/263A/607N/748Y、40A/132Y/157G/262L/263A/525L/748Y、40A/132Y/157G/262L/263A/403L/748Y、40A/132Y/157G/262L/263A/526T/748Y、40A/132Y/157G/262L/263A/528R/748Y、40A/132Y/157G/262L/263A/599G/748Y、40A/132Y/157G/262L/263A/537W/748Y、40A/132Y/157G/262L/263A/748Y/803C、40A/132Y/157G/262L/263A/556F/748Y、40A/132Y/157G/262L/263A/557G/748Y、40A/132Y/157G/262L/263A/601M/748Y、40A/132Y/157G/262L/263A/596R/748Y、40A/132Y/157G/262L/263A/563L/748Y、40A/132Y/157G/262L/263A/601P/748Y、40A/132Y/157G/262L/263A/748Y/773R、40A/132Y/157G/262L/263A/553R/748Y、40A/132Y/157G/262L/263A/542M/748Y、40A/132Y/157G/262L/263A/594T/748Y、40A/132Y/157G/262L/263A/533L/748Y、40A/132Y/157G/262L/263A/328I/748Y、40A/132Y/157G/262L/263A/555K/748Y、40A/132Y/157G/262L/263A/542G/748Y或40A/132Y/157G/262L/263A/528Q/748Y、40A/132Y/157G/262L/263A/587S/748Y、40A/132Y/157G/262L/263A/558Q/748Y、40A/132Y/157G/262L/263A/403R/521A/748Y、40A/132Y/157G/262L/263A/748Y/762M、40A/132Y/157G/262L/263A/748Y/764V或40A/132Y/157G/262L/263A/403R/553K/748Y,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:S40A/V132Y/S157G/I262L/S263A/N599S/H748Y、S40A/V132Y/S157G/I262L/S263A/K530G/H748Y、S40A/V132Y/S157G/I262L/S263A/S596L/H748Y、S40A/V132Y/S157G/I262L/S263A/R696H/H748Y、S40A/V132Y/S157G/I262L/S263A/R542W/H748Y、S40A/V132Y/S157G/I262L/S263A/K530R/H748Y、S40A/V132Y/S157G/I262L/S263A/Q553F/H748Y、S40A/V132Y/S157G/I262L/S263A/T533V/H748Y、S40A/V132Y/S157G/I262L/S263A/R555M/H748Y、S40A/V132Y/S157G/I262L/S263A/S594V/H748Y、S40A/V132Y/S157G/I262L/S263A/S594W/H748Y、S40A/V132Y/S157G/I262L/S263A/S536R/H748Y、S40A/V132Y/S157G/I262L/S263A/Q585K/H748Y、S40A/V132Y/S157G/I262L/S263A/S401G/H748Y、S40A/V132Y/S157G/I262L/S263A/D597E/H748Y、S40A/V132Y/S157G/I262L/S263A/Q553K/H748Y、S40A/V132Y/S157G/I262L/S263A/N402R/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/A763Y、S40A/V132Y/S157G/I262L/S263A/H748Y/A762V、S40A/V132Y/S157G/I262L/S263A/I605E/H748Y、S40A/V132Y/S157G/I262L/S263A/K530P/H748Y、S40A/V132Y/S157G/I262L/S263A/R506P/H748Y、S40A/V132Y/S157G/I262L/S263A/A589G/H748Y、S40A/V132Y/S157G/I262L/S263A/A558S/H748Y、S40A/V132Y/S157G/I262L/S263A/Q553N/H748Y、S40A/V132Y/S157G/I262L/S263A/K559P/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/E751H、S40A/V132Y/S157G/I262L/S263A/A589S/H748Y、S40A/V132Y/S157G/I262L/S263A/R747T/H748Y、S40A/V132Y/S157G/I262L/S263A/L560M/H748Y、S40A/V132Y/S157G/I262L/S263A/R696V/H748Y、S40A/V132Y/S157G/I262L/S263A/T540V/H748Y、S40A/V132Y/S157G/I262L/S263A/S594C/H748Y、S40A/V132Y/S157G/I262L/S263A/E556W/H748Y、S40A/V132Y/S157G/I262L/S263A/A589R/H748Y、S40A/V132Y/S157G/I262L/S263A/S407W/H748Y、S40A/V132Y/S157G/I262L/S263A/L557H/H748Y、S40A/V132Y/S157G/I262L/S263A/K559G/H748Y、S40A/V132Y/S157G/I262L/S263A/N599T/H748Y、S40A/V132Y/S157G/I262L/S263A/A521Y/H748Y、S40A/V132Y/S157G/I605A/I262L/S263A/H748Y、S40A/V132Y/S157G/I262L/S263A/K559D/H748Y、S40A/V132Y/S157G/I262L/S263A/S534H/H748Y、S40A/V132Y/S157G/I262L/S263A/R592G/H748Y、S40A/V132Y/S157G/I262L/S263A/T533P/H748Y、S40A/V132Y/S157G/I262L/S263A/G529S/H748Y、S40A/V132Y/S157G/I262L/S263A/R524G/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/V749R、S40A/V132Y/S157G/I262L/S263A/H748Y/V766Y、S40A/V132Y/S157G/I262L/S263A/E556P/H748Y、S40A/V132Y/S157G/I262L/S263A/S595P/H748Y、S40A/V132Y/S157G/I262L/S263A/T533Q/H748Y、S40A/V132Y/S157G/I262L/S263A/I603V/H748Y、S40A/V132Y/S157G/I262L/S263A/V537G/H748Y、S40A/V132Y/S157G/I262L/S263A/A589W/H748Y、S40A/V132Y/S157G/I262L/S263A/P598W/H748Y、Q22K/S40A/V132Y/S157G/I262L/S263A/S407R/H748Y、S40A/V132Y/S157G/I262L/S263A/R555W/H748Y、S40A/V132Y/S157G/I262L/S263A/E539R/H748Y、S40A/V132Y/S157G/I262L/S263A/R531Q/H748Y、S40A/V132Y/S157G/I262L/S263A/T581A/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/H803R、S40A/V132Y/S157G/I262L/S263A/L538A/H748Y、S40A/V132Y/S157G/I262L/S263A/Q404T/H748Y、S40A/V132Y/S157G/I262L/S263A/A406Q/H748Y、S40A/V132Y/S157G/I262L/S263A/V537L/H748Y、S40A/V132Y/S157G/I262L/S263A/S595R/H748Y、S40A/V132Y/S157G/I262L/S263A/S534W/H748Y、S40A/V132Y/S157G/I262L/S263A/Q404S/H748Y、S40A/V132Y/S157G/I262L/S263A/R592V/H748Y、S40A/V132Y/S157G/I262L/S263A/A521W/H748Y、S40A/V132Y/S157G/I262L/S263A/I603G/H748Y、S40A/V132Y/S157G/I262L/S263A/S401I/H748Y、S40A/V132Y/S157G/I262L/S263A/S595A/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/A762Q、S40A/V132Y/S157G/I262L/S263A/K530W/H748Y、S40A/V132Y/S157G/I262L/S263A/A558V/H748Y、S40A/V132Y/S157G/I262L/S263A/K527W/H748Y、S40A/V132Y/S157G/I262L/S263A/S596W/H748Y、S40A/V132Y/S157G/I262L/S263A/I603W/H748Y、S40A/V132Y/S157G/I262L/S263A/T528W/H748Y、S40A/V132Y/S157G/I262L/S263A/N504M/H748Y、S40A/V132Y/S157G/I262L/S263A/G587Q/H748Y、S40A/V132Y/S157G/I262L/S263A/R523V/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A558R/H748Y、S40A/V132Y/S157G/I262L/S263A/L593N/H748Y、S40A/V132Y/S157G/I262L/S263A/T525V/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/V749L、S40A/V132Y/S157G/I262L/S263A/L503V/H748Y、S40A/V132Y/S157G/I262L/S263A/K527V/H748Y、S40A/V132Y/S157G/I262L/S263A/Y554E/H748Y、S40A/V132Y/S157G/I262L/S263A/A535K/H748Y、S40A/V132Y/S157G/I262L/S263A/R592T/H748Y、S40A/V132Y/S157G/I262L/S263A/T528A/H748Y、S40A/V132Y/S157G/I262L/S263A/Q585R/H748Y、S40A/V132Y/S157G/I262L/S263A/S401A/H748Y、S40A/V132Y/S157G/I262L/S263A/T586M/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/E764I、S40A/V132Y/S157G/I262L/S263A/E556M/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/A763G、S40A/V132Y/S157G/I262L/S263A/A406K/H748Y、S40A/V132Y/S157G/I262L/S263A/R582F/H748Y、S40A/V132Y/S157G/I262L/S263A/T540H/H748Y、S40A/V132Y/S157G/I262L/S263A/L560G/H748Y、S40A/V132Y/S157G/I262L/S263A/N402G/H748Y、S40A/V132Y/S157G/I262L/S263A/S594Q/H748Y、S40A/V132Y/S157G/I262L/S263A/E539L/H748Y、S40A/V132Y/S157G/I262L/S263A/N602V/H748Y、S40A/V132Y/S157G/I262L/S263A/R523A/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/V749T、S40A/V132Y/S157G/I262L/S263A/R542T/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/E764A、S40A/V132Y/S157G/I262L/S263A/R523K/H748Y、S40A/V132Y/S157G/I262L/S263A/T607N/H748Y、S40A/V132Y/S157G/I262L/S263A/T525L/H748Y、S40A/V132Y/S157G/I262L/S263A/N403L/H748Y、S40A/V132Y/S157G/I262L/S263A/A526T/H748Y、S40A/V132Y/S157G/I262L/S263A/T528R/H748Y、S40A/V132Y/S157G/I262L/S263A/N599G/H748Y、S40A/V132Y/S157G/I262L/S263A/V537W/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/H803C、S40A/V132Y/S157G/I262L/S263A/E556F/H748Y、S40A/V132Y/S157G/I262L/S263A/L557G/H748Y、S40A/V132Y/S157G/I262L/S263A/Q601M/H748Y、S40A/V132Y/S157G/I262L/S263A/S596R/H748Y、S40A/V132Y/S157G/I262L/S263A/T563L/H748Y、S40A/V132Y/S157G/I262L/S263A/Q601P/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/Q773R、S40A/V132Y/S157G/I262L/S263A/Q553R/H748Y、S40A/V132Y/S157G/I262L/S263A/R542M/H748Y、S40A/V132Y/S157G/I262L/S263A/S594T/H748Y、S40A/V132Y/S157G/I262L/S263A/T533L/H748Y、S40A/V132Y/S157G/I262L/S263A/V328I/H748Y、S40A/V132Y/S157G/I262L/S263A/R555K/H748Y、S40A/V132Y/S157G/I262L/S263A/R542G/H748Y、S40A/V132Y/S157G/I262L/S263A/T528Q/H748Y、S40A/V132Y/S157G/I262L/S263A/G587S/H748Y、S40A/V132Y/S157G/I262L/S263A/A558Q/H748Y、S40A/V132Y/S157G/I262L/S263A/N403R/G521A/H748Y、S40A/V132Y/S157G/I262L/S263A/H748Y/A762M、S40A/V132Y/S157G/I262L/S263A/H748Y/E764V或S40A/V132Y/S157G/I262L/S263A/N403R/Q553K/H748Y,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代集:40/132/157/262/263/403/404/521/524/542/555/748/762/764、40/132/157/262/263/404/521/524/542/589/748/762/764、40/132/157/262/263/521/524/542/581/748/762/764、40/132/157/262/263/521/542/748/762/764、40/132/157/262/263/404/521/542/748/762、40/132/157/262/263/521/748/750/849、40/132/157/262/263/521/524/581/748、16/40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/820、40/132/157/262/263/521/748/793、40/132/157/262/263/521/748/764、40/132/157/262/263/521/748/755、40/132/157/262/263/521/748/753、40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/728、40/132/157/262/263/521/704/748、40/132/157/262/263/521/675/748、40/132/157/262/263/521/671/748、40/132/157/262/263/521/570/748、40/132/157/262/263/495/521/748、40/132/157/262/263/480/521/748、40/132/157/262/263/476/521/748、40/132/157/262/263/384/521/748、40/132/157/262/263/322/521/748、40/132/157/262/263/321/521/748、40/132/157/243/262/263/521/748、15/40/132/157/262/263/521/748、40/102/132/157/262/263/521/748、40/91/132/157/262/263/521/748、40/87/132/157/262/263/521/748、40/85/132/157/262/263/521/748、20/40/132/157/262/263/521/748、21/40/132/157/262/263/521/748或40/52/132/157/262/263/521/748,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代集:40A/132Y/157G/262L/263A/404S/521G/542G/748Y/762M、40A/132Y/157G/262L/263A/521G/524Q/542G/581A/748Y/762M/764V、40A/132Y/157G/262L/263A/404S/521G/524Q/542G/589L/748Y/762M/764V、40A/132Y/157G/262L/263A/521G/748Y/764V、40A/132Y/157G/262L/263A/403R/404S/521G/524Q/542G/555H/748Y/762M/764V、40A/132Y/157G/262L/263A/476N/521G/748Y、40A/132Y/157G/262L/263A/521G/542G/748Y/762M/764V、40A/132Y/157G/262L/263A/521G/748Y/728K、40A/52R/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/476I/521G/748Y、40A/132Y/157G/262L/263A/521G/675L/748Y、40A/132Y/157G/262L/263A/521G/748Y/750S/849T、40A/102S/132Y/157G/262L/263A/521G/748Y、21C/40A/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/521G/748Y/755P、21S/40A/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/321G/521G/748Y、20A/40A/132Y/157G/262L/263A/521G/748Y、21K/40A/132Y/157G/262L/263A/521G/748Y、40A/87N/132Y/157G/262L/263A/521G/748Y、20C/40A/132Y/157G/262L/263A/521G/748Y、16R/40A/132Y/157G/262L/263A/521G/735L/748Y、21Q/40A/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/521G/704P/748Y、40A/132Y/157G/262L/263A/521G/735G/748Y、40A/132Y/157G/262L/263A/384Y/521G/748Y、40A/132Y/157G/262L/263A/480W/521G/748Y、40A/V102M/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/521G/748Y/793G、40A/132Y/157G/262L/263A/322S/521G/748Y、40A/132Y/157G/262L/263A/322N/521G/748Y、40A/132Y/157G/262L/263A/521G/570R/748Y、40A/132Y/157G/262L/263A/480V/521G/748Y、40A/132Y/157G/262L/263A/521G/748Y/753V、40A/132Y/157G/262L/263A/521G/748Y/753K、40A/132Y/157G/262L/263A/521G/R524Q/581A/748Y、40A/91K/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/243L/262L/263A/521G/748Y、40A/132Y/157G/243S/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/521G/671E/748Y、40A/85S/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/495M/521G/748Y、15A/40A/132Y/157G/262L/263A/521G/748Y、15N/40A/132Y/157G/262L/263A/521G/748Y、15K/40A/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/521G/748Y/820A、40A/132Y/157G/262L/263A/495E/521G/748Y/、40A/85E/132Y/157G/262L/263A/521G/748Y、40A/85R/132Y/157G/262L/263A/521G/748Y、40A/132Y/157G/262L/263A/480E/521G/748Y、15G/40A/132Y/157G/262L/263A/521G/748Y或40A/132Y/157G/262L/263A/521G/671R/748Y,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代集:S40A/V132Y/S157G/I262L/S263A/Q404S/A521G/R542G/H748Y/A762M、S40A/V132Y/S157G/I262L/S263A/A521G/R524Q/R542G/T581A/H748Y/A762M/E764V、S40A/V132Y/S157G/I262L/S263A/Q404S/A521G/R524Q/R542G/A589L/H748Y/A762M/E764V、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/E764V、S40A/V132Y/S157G/I262L/S263A/N403R/Q404S/A521G/R524Q/R542G/R555H/H748Y/A762M/E764V、S40A/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/R542G/H748Y/A762M/E764V、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/R728K、S40A/S52R/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/L476I/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/P675L/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y、F21C/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/K755P、F21S/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/E321G/A521G/H748Y、L20A/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、F21K/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/P87N/V132Y/S157G/I262L/S263A/A521G/H748Y、L20C/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、Q16R/S40A/V132Y/S157G/I262L/S263A/A521G/E735L/H748Y、F21Q/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/D704P/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/E735G/H748Y、S40A/V132Y/S157G/I262L/S263A/R384Y/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/Q480W/A521G/H748Y、S40A/V102M/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/P793G、S40A/V132Y/S157G/I262L/S263A/R322S/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/K570R/H748Y、S40A/V132Y/S157G/I262L/S263A/Q480V/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/L753V、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/L753K、S40A/V132Y/S157G/I262L/S263A/A521G/R524Q/T581A/H748Y、S40A/H91K/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/P243L/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/P243S/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/V671E/H748Y、S40A/P85S/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/R495M/A521G/H748Y、V15A/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、V15N/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、V15K/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/R820A、S40A/V132Y/S157G/I262L/S263A/A521G/H748Y/R495E、S40A/P85E/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/P85R/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/Q480E/A521G/H748Y、V15G/S40A/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/V132Y/S157G/I262L/S263A/A521G/V671R/H748Y,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代集:40/102/132/157/262/263/476/521/748、40/102/132/157/262/263/495/521/748、40/102/132/157/262/263/521/748/750、21/40/52/102/132/157/262/263/521/748、21/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/476/521/748、40/85/102/132/157/262/263/521/748/750、40/102/132/157/262/263/386/495/521/748、40/102/132/157/262/263/476/495/521/748、40/102/132/157/262/263/322/521/748/820、40/102/132/157/262/263/386/521/748/849、20/40/52/85/102/132/157/262/263/521/748、40/102/132/157/262/263/476/521/748/750、40/102/132/157/262/263/495/521/748/820、40/102/132/157/262/263/521/748/750/820、21/40/52/102/132/157/262/263/521/572/748、20/40/102/132/157/262/263/322/386/521/748、21/40/102/132/157/262/263/322/495/521/748、40/85/102/132/157/262/263/322/476/521/748、20/40/102/132/157/262/263/386/476/521/748、21/40/102/132/157/262/263/322/521/748/750、21/40/102/132/157/262/263/495/521/748/820、20/40/102/132/157/262/263/495/521/748/820、40/85/102/132/157/262/263/476/521/748/849、21/40/102/132/157/262/263/521/748/820/849、40/102/132/157/262/263/322/386/495/521/748、40/102/132/157/262/263/273/322/521/748/849、40/102/132/157/262/263/476/495/521/748/750、40/102/132/157/262/263/322/521/748/750/820、40/102/132/157/262/263/386/521/748/750/849、21/40/85/102/132/157/262/263/322/521/748/820、20/40/85/102/132/157/262/263/476/521/748/750、20/40/85/102/132/157/262/263/495/521/748/849、20/40/85/102/132/157/262/263/521/566/748/820、40/52/102/132/157/262/263/322/498/521/748/750、21/40/102/132/157/262/263/322/386/521/748/820、40/52/102/132/157/262/263/386/495/521/748/820、20/40/102/132/157/262/263/322/476/521/748/820、40/85/102/132/157/262/263/386/495/521/748/750、40/85/102/132/157/262/263/476/495/521/748/820、40/85/102/132/157/262/263/322/521/748/750/820、40/85/102/132/157/262/263/322/386/476/495/521/748、21/40/102/132/157/262/263/322/495/521/748/750/820、20/21/40/85/102/132/157/262/263/322/476/495/521/748、20/40/102/132/157/262/263/299/322/386/476/495/521/748、40/52/102/132/157/262/263/476/495/521/566/748/750/849、20/40/85/102/132/157/262/200/263/322/476/495/521/748/750或21/40/85/102/132/157/262/263/322/386/495/521/748/820/849,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代集:40A/102S/132Y/157G/262L/263A/521G/748Y/750S/820A、21C/40A/52R/102S/132Y/157G/262L/263A/521G/748Y、20C/21C/40A/85E/102S/132Y/157G/262L/263A/322N/476N/495E/521G/748Y、20C/40A/85E/102S/132Y/157G/262L/200V/263A/322N/476N/495S/521G/748Y/750S、40A/102S/132Y/157G/262L/263A/476N/521G/748Y/750S、20C/40A/102S/132Y/157G/262L/263A/476N/521G/748Y、20C/40A/102S/132Y/157G/262L/263A/322N/386V/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/322N/476N/521G/748Y、40A/52R/102S/132Y/157G/262L/263A/322N/498D/521G/748Y/750S、20C/40A/102S/132Y/157G/262L/263A/322N/476N/521G/748Y/820A、40A/85E/102S/132Y/157G/262L/263A/476N/495E/521G/748Y/820A、21C/40A/85E/102S/132Y/157G/262L/263A/322N/521G/748Y/820A、20C/40A/102S/132Y/157G/262L/263A/299N/322N/386V/476N/495E/521G/748Y、20C/40A/102S/132Y/157G/262L/263A/322N/521G/748Y、21C/40A/102S/132Y/157G/262L/263A/521G/748Y/820A/849T、40A/102S/132Y/157G/262L/263A/476N/521G/748Y、40A/102S/132Y/157G/262L/263A/322N/521G/748Y/820A、21C/40A/102S/132Y/157G/262L/263A/322N/386V/521G/748Y/820A、40A/102S/132Y/157G/262L/263A/322N/386V/495E/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/386V/495E/521G/748Y/750S、20C/40A/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/750S、20C/40A/102S/132Y/157G/262L/263A/386V/476N/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/322N/386V/476N/495S/521G/748Y、20C/40A/102S/132Y/157G/262L/263A/495E/521G/748Y/820A、40A/102S/132Y/157G/262L/263A/521G/748Y/750S、21C/40A/102S/132Y/157G/262L/263A/322N/495E/521G/748Y、40A/52R/102S/132Y/157G/262L/263A/386V/495S/521G/748Y/820A、21C/40A/102S/132Y/157G/262L/263A/322N/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/322N/521G/748Y/750S/820A、20C/40A/52R/85E/102S/132Y/157G/262L/263A/521G/748Y、21C/40A/52R/102S/132Y/157G/262L/263A/521G/572I/748Y、20C/40A/85E/102S/132Y/157G/262L/263A/495E/521G/748Y/849T、40A/85E/102S/132Y/157G/262L/263A/521G/748Y/750S、21C/40A/102S/132Y/157G/262L/263A/495E/521G/748Y/820A、40A/102S/132Y/157G/262L/263A/273M/322N/521G/748Y/849T、40A/102S/132Y/157G/262L/263A/495E/521G/748Y、40A/102S/132Y/157G/262L/263A/322N/521G/748Y/750S/820A、40A/52R/102S/132Y/157G/262L/263A/476N/495E/521G/566A/748Y/750S/849T、40A/102S/132Y/157G/262L/263A/386V/495E/521G/748Y、40A/102S/132Y/157G/262L/263A/495S/521G/748Y/820A、21C/40A/102S/132Y/157G/262L/263A/322N/495E/521G/748Y/750S/820A、21C/40A/85E/102S/132Y/157G/262L/263A/322N/386V/495S/521G/748Y/820A/849T、40A/102S/132Y/157G/262L/263A/495S/521G/748Y、40A/102S/132Y/157G/262L/263A/476N/495E/521G/748Y/750S、40A/102S/132Y/157G/262L/263A/386V/521G/748Y/849T、40A/102S/132Y/157G/262L/263A/476N/495E/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/849T、21C/40A/102S/132Y/157G/262L/263A/322N/521G/748Y/750S、20C/40A/85E/102S/132Y/157G/262L/263A/521G/566A/748Y/820A或40A/102S/132Y/157G/262L/263A/386V/521G/748Y/750S/849T,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代集:S40A/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/R820A、F21C/S40A/S52R/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/L476N/R495E/A521G/H748Y、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/A200V/S263A/R322N/L476N/R495S/A521G/H748Y/P750S、S40A/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/L476N/A521G/H748Y、S40A/S52R/V102S/V132Y/S157G/I262L/S263A/R322N/G498D/A521G/H748Y/P750S、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/L476N/A521G/H748Y/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/R495E/A521G/H748Y/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/R820A、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/R386V/L476N/R495E/A521G/H748Y、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/R820A/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y、S40A/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/R820A、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/A521G/H748Y/R820A、S40A/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/R495E/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/R495E/A521G/H748Y/P750S、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/R386V/L476N/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/L476N/R495S/A521G/H748Y、L20C/S40A/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/R820A、S40A/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/R495E/A521G/H748Y、S40A/S52R/V102S/V132Y/S157G/I262L/S263A/R386V/R495S/A521G/H748Y/R820A、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/P750S/R820A、L20C/S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y、F21C/S40A/S52R/V102S/V132Y/S157G/I262L/S263A/A521G/V572I/H748Y、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/A849T、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/R820A、S40A/V102S/V132Y/S157G/I262L/S263A/V273M/R322N/A521G/H748Y/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y、S40A/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/P750S/R820A、S40A/S52R/V102S/V132Y/S157G/I262L/S263A/L476N/R495E/A521G/D566A/H748Y/P750S/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/R386V/R495E/A521G/H748Y、S40A/V102S/V132Y/S157G/I262L/S263A/R495S/A521G/H748Y/R820A、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/R495E/A521G/H748Y/P750S/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/R495S/A521G/H748Y/R820A/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/R495S/A521G/H748Y、S40A/V102S/V132Y/S157G/I262L/S263A/L476N/R495E/A521G/H748Y/P750S、S40A/V102S/V132Y/S157G/I262L/S263A/R386V/A521G/H748Y/A849T、S40A/V102S/V132Y/S157G/I262L/S263A/L476N/R495E/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/A849T、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/P750S、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/D566A/H748Y/R820A、S40A/V102S/V132Y/S157G/I262L/S263A/R386V/A521G/H748Y/P750S/A849T,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/85/102/132/157/262/263/299/386/521/566/748/750/820、40/85/102/132/157/262/263/476/521/748/750/820/849、21/40/85/102/132/157/262/263/322/476/495/521/748/750/820、40/85/102/132/157/262/177/263/521/748/750、21/40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/476/521/748/750/820、20/40/52/85/102/132/157/262/263/299/521/748/750、52/40/85/102/132/157/262/263/299/521/748/750、40/85/102/132/157/262/263/322/521/748Y/750S/820、20/40/85/102/132/157/262/263/521/748/750/820、20/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/476/495/521/748/750/820、40/85/102/132/157/262/263/386/476/495/521/748/750、20/21/40/85/102/132/157/262/263/299/322/386/521/748/750、40/85/102/132/157/262/263/322/386/495/521/748/750、21/40/85/102/132/157/262/263/299/322/476/495/521/748/750/820、21/40/85/102/132/157/262/263/299/386/521/748/750/820、40/85/102/132/157/262/263/299/476/521/748/750/820、20/21/40/85/102/132/157/262/263/521/748/750、21/40/102/132/157/262/263/521/748、40/85/102/132/157/262/263/521/705/748/750、21/40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/299/322/521/748/750、20/40/85/102/132/157/262/263/322/386/521/748/750/820、40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/109/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/495/521/748/750、40/85/102/132/157/262/263/491/521/748/750、40/52/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/386/521/748/750/820、20/21/40/85/102/132/157/262/263/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/566/748/750/820、20/21/40/85/102/132/157/262/263/299/495/521/748/750、40/85/102/132/157/262/263/521/748/750/756、40/85/102/132/157/262/263/386/521/748/750/820、40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/511/521/748/750、21/40/52/85/102/132/157/262/263/242/386/495/521/748/750/820、40/85/102/132/157/262/263/299/476/495/521/748/750、40/85/102/132/157/262/263/521/706/748/750、21/40/85/102/132/157/262/263/299/386/476/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/748/750、21/40/85/102/132/157/262/263/476/521/748/750/849、40/85/102/132/157/262/263/299/322/476/521/748/750/820、21/40/52/85/102/132/157/262/263/299/322/521/748/750/820、20/21/40/85/102/132/157/262/263/521/566/748/750、20/40/52//85/102/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/386/495/521/566/748/750/820、21/40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/521/748/750、40/85/102/132/157/262/263/386/521/748/750/849、40/52/85/102/132/157/262/263/476/521/748/750、40/52/85/102/132/157/262/263/299/322/386/495/521/748/750或40/85/102/132/157/262/263/440/521/748/750,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:40A/85E/102S/132Y/157G/262L/263A/299N/386V/521G/566A/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/750S/820A/849T、21C/40A/85E/102S/132Y/157G/262L/263A/322N/476N/495E/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/177T/263A/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/495E/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/750S/820A、20C/40A/52R/85E/102S/132Y/157G/262L/263A/299N/521G/748Y/750S、52R/40A/85E/102S/132Y/157G/262L/263A/299N/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/322N/521G/748Y/750S/820A、20C/40A/85E/102S/132Y/157G/262L/263A/521G/748Y/750S/820A、20C/40A/85E/102S/132Y/157G/262L/263A/299N/386V/476N/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/386V/476N/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/476N/495E/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/386V/476N/495E/521G/748Y/750S、20C/21C/40A/85E/102S/132Y/157G/262L/263A/299N/322N/386V/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/322N/386V/495E/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/322N/476N/495E/521G/748Y/750S/820A、21C/40A/85E/102S/132Y/157G/262L/263A/299N/386V/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/299N/476N/521G/748Y/750S/820A、20C/21C/40A/85E/102S/132Y/157G/262L/263A/521G/748Y/750S、21C/40A/102S/132Y/157G/262L/263A/521G/748Y、40A/85E/102S/132Y/157G/262L/263A/521G/705W/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/386V/476N/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/521G/748Y/750S/820A、21C/40A/85E/102S/132Y/157G/262L/263A/299N/322N/521G/748Y/750S、20C/40A/85E/102S/132Y/157G/262L/263A/322N/386V/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/299N/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/386V/476N/521G/748Y/750S、40A/85E/102S/109P/132Y/157G/262L/263A/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/322N/495E/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/491G/521G/748Y/750S、40A/52R/85E/102S/132Y/157G/262L/263A/521G/748Y/750S/820A、21C/40A/85E/102S/132Y/157G/262L/263A/386V/521G/748Y/750S/820A、20C/21C/40A/85E/102S/132Y/157G/262L/263A/495E/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/322N/495E/521G/566A/748Y/750S/820A、20C/21C/40A/85E/102S/132Y/157G/262L/263A/299N/495E/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/521G/748Y/750S/756T、40A/85E/102S/132Y/157G/262L/263A/386V/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/495E/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/511M/521G/748Y/750S、21C/40A/52R/85E/102S/132Y/157G/262L/263A/242Q/386V/495E/521G/748Y/750S/820A、40A/85E/102S/132Y/157G/262L/263A/299N/476N/495E/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/521G/706E/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/386V/476N/495E/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/322N/495E/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/750S/849T、40A/85E/102S/132Y/157G/262L/263A/299N/322N/476N/521G/748Y/750S/820A、21C/40A/52R/85E/102S/132Y/157G/262L/263A/299N/322N/521G/748Y/750S/820A、20C/21C/40A/85E/102S/132Y/157G/262L/263A/521G/566A/748Y/750S、20C/40A/52R/85E/102S/132Y/157G/262L/263A/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/322N/386V/495E/521G/566A/748Y/750S/820A、21C/40A/85E/102S/132Y/157G/262L/263A/299N/521G/748Y/750S、21C/40A/85E/102S/132Y/157G/262L/263A/299N/386V/521G/748Y/750S、40A/85E/102S/132Y/157G/262L/263A/386V/521G/748Y/750S/849T、40A/52R/85E/102S/132Y/157G/262L/263A/476N/521G/748Y/750S、40A/52R/85E/102S/132Y/157G/262L/263A/299N/322N/386V/495E/521G/748Y/750S或40A/85E/102S/132Y/157G/262L/263A/440G/521G/748Y/750S,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/A521G/D566A/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S/R820A/A849T、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/L476N/R495E/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/R177T/S263A/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S/R820A、L20C/S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/A521G/H748Y/P750S、S52R/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/A521G/H748Y/P750S/R820A、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/R820A、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/L476N/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/L476N/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/R495E/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/L476N/R495E/A521G/H748Y/P750S、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/R386V/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/R495E/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/L476N/R495E/A521G/H748Y/P750S/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/L476N/A521G/H748Y/P750S/R820A、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S、F21C/S40A/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/Y705W/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/L476N/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/A521G/H748Y/P750S、L20C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/L476N/A521G/H748Y/P750S、S40A/P85E/V102S/K109P/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R495E/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A491G/A521G/H748Y/P750S、S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/A521G/H748Y/P750S/R820A、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/R495E/A521G/D566A/H748Y/P750S/R820A、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R495E/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S/A756T、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/A521G/H748Y/P750S/R820A、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R495E/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T511M/A521G/H748Y/P750S、F21C/S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/P242Q/R386V/R495E/A521G/H748Y/P750S/R820A;S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/L476N/R495E/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/G706E/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/L476N/R495E/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/R495E/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S/A849T、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/L476N/A521G/H748Y/P750S/R820A、F21C/S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/A521G/H748Y/P750S/R820A、L20C/F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/D566A/H748Y/P750S、L20C/S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R322N/R386V/R495E/A521G/D566A/H748Y/P750S/R820A、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/A521G/H748Y/P750S、F21C/S40A/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R386V/A521G/H748Y/P750S、S40A/P85E/V102S/V132Y/S157G/I262L/S263A/R386V/A521G/H748Y/P750S/A849T、S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/L476N/A521G/H748Y/P750S、S40A/S52R/P85E/V102S/V132Y/S157G/I262L/S263A/T299N/R322N/R386V/R495E/A521G/H748Y/P750S或S40A/P85E/V102S/V132Y/S157G/I262L/S263A/440/A521G/H748Y/P750S,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,工程化DNA聚合酶或其片段包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些实施方案中,工程化DNA聚合酶或其片段包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,条件是所述多肽序列不包括对应于SEQ IDNO:2的残基12至850的序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或相对于对应于SEQ IDNO:8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8的残基12至850的参考序列或相对于对应于SEQ ID NO:8的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:462或606的残基12至850的参考序列或与对应于SEQ ID NO:462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQID NO:332的残基12至850的参考序列或相对于对应于SEQ ID NO:332的参考序列包含一个或更多个取代。
在前述的一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中氨基酸位置是相对于SEQ IDNO:8、332、462或606的参考序列。
在前述的一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个氨基酸残基:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q/S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A或849T或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、521、748或750或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个氨基酸残基:40A、85E、102S、132Y、177T、157G、262L、263A、521G、748Y或750S或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:8的残基12至850的参考序列或与对应于SEQ ID NO:8的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8的残基12至850的参考序列或相对于对应于SEQ ID NO:8的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773、803或403/553,其中氨基酸位置是相对于SEQ ID NO:8的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:599S、530G、596L、696H、542W、530R、553F、533V、555M、594V、594W、536R、585K、401G、597E、553K、402R、763Y、762V、605E、530P、506P、589G、558S、553N、559P、751H、589S、747T、560M、696V、540V、594C、556W、589R、407W、557H、559G、599T、521Y、605A、559D、534H、592G、533P、529S、524G、749R、766Y、556P、595P、533Q、603V、537G、589W、598W、22K/407R、555W、539R、531Q、581A、803R、538A、404T、406Q、537L、595R、534W、404S、592V、521W、603G、401I、595A、762Q、530W、558V、527W、596W、603W、528W、504M、587Q、587S、523V、521G、558R、558Q、593N、525V、749L、503V、527V、554E、535K、592T、528A、585R、401A、586M、764I、556M、763G、406K、582F、540H、560G、402G、594Q、539L、602V、523A、749T、542T、764A、523K、607N、525L、403L、526T、528R、599G、537W、803C、556F、557G、601M、596R、563L、601P、773R、553R、542M、594T、533L、328I、555K、542G、528Q或403R/553K,其中氨基酸位置是相对于SEQ ID NO:8的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:N599S、K530G、S596L、R696H、R542W、K530R、Q553F、T533V、R555M、S594V、S594W、S536R、Q585K、S401G、D597E、Q553K、N402R、A763Y、A762V、I605E、K530P、R506P、A589G、A558S、Q553N、K559P、E751H、A589S、R747T、L560M、R696V、T540V、S594C、E556W、A589R、S407W、L557H、K559G、N599T、A521Y、I605A、K559D、S534H、R592G、T533P、G529S、R524G、V749R、V766Y、E556P、S595P、T533Q、I603V、V537G、A589W、P598W、Q22K/S407R、R555W、E539R、R531Q、T581A、H803R、L538A、Q404T、A406Q、V537L、S595R、S534W、Q404S、R592V、A521W、I603G、S401I、S595A、A762Q、K530W、A558V、K527W、S596W、I603W、T528W、N504M、G587Q、G587S、R523V、A521G、A558R、A558Q、L593N、T525V、V749L、L503V、K527V、Y554E、A535K、R592T、T528A、Q585R、S401A、T586M、E764I、E556M、A763G、A406K、R582F、T540H、L560G、N402G、S594Q、E539L、N602V、R523A、V749T、R542T、E764A、R523K、T607N、T525L、N403L、A526T、T528R、N599G、V537W、H803C、E556F、L557G、Q601M、S596R、T563L、Q601P、Q773R、Q553R、R542M、S594T、T533L、V328I、R555K、R542G、T528Q或N403R/Q553K,其中氨基酸位置是相对于SEQ ID NO:8的参考序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:332的残基12至850的参考序列或与对应于SEQ ID NO:332的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:332的残基12至850的参考序列或相对于对应于SEQ ID NO:332的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764、542/762/764,其中氨基酸位置是相对于SEQ ID NO:332的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:404S、542G、762M、524Q/542G/581A/762M/764V、404S/524Q/542G/589L/762M/764V、764V、403R/404S/524Q/542G/555H/762M/764V、476N、542G/762M/764V、728K、52R、476I、675L、750S/849T、102S、21C、755P、21S、321G、20A、21K、87N、20C、16R/735L、21Q、704P、735G、384Y、480W、102M、793G、322S、322N、570R、480V、753V、753K、524Q/581A、91K、243L、243S、671E、85S、495M、15A、15N、15K、820A、495E、85E、85R、480E、15G或671R,其中氨基酸位置是相对于SEQ ID NO:332的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:Q404S、R542G、A762M、R524Q/R542G/T581A/A762M/E764V、Q404S/R524Q/R542G/A589L/A762M/E764V、E764V、N403R/Q404S/R524Q/R542G/R555H/A762M/E764V、L476N、R542G/A762M/E764V、R728K、S52R、L476I、P675L、P750S/A849T、V102S、F21C、K755P、F21S、E321G、L20A、F21K、P87N、L20C、Q16R/E735L、F21Q、D704P、E735G、R384Y、Q480W、V102M、P793G、R322S、R322N、K570R、Q480V、L753V、L753K、R524Q/T581A、H91K、P243L、P243S、V671E、P85S、R495M、V15A、V15N、V15K、R820A、R495E、P85E、P85R、Q480E、V15G或V671R,其中氨基酸位置是相对于SEQ ID NO:332的参考序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:462的残基12至850的参考序列或与对应于SEQ ID NO:462的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:462的残基12至850的参考序列或相对于对应于SEQ ID NO:462的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820、386/750/849或其组合,其中氨基酸位置是相对于SEQ ID NO:462的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:750S/820A、21C/52R、20C/21C/85E/322N/476N/495E、20C/85E/200V/322N/476N/495S/750S、476N/750S、20C/476N、20C/322N/386V、85E/322N/476N、52R/322N/498D/750S、20C/322N/476N/820A、85E/476N/495E/820A、21C/85E/322N/820A、20C/299N/322N/386V/476N/495E/820A、20C/322N、21C/820A/849T、476N、322N/820A、21C/322N/386V/820A、322N/386V/495E、85E/386V/495E/750S、20C/85E/476N/750S、20C/386V/476N、85E/322N/386V/476N/495S、20C/495E/820A、750S、21C/322N/495E、52R/386V/495S/820A、21C/322N、85E/322N/750S/820A、20C/52R/85E、21C/52R/572I、20C/85E/495E/849T、85E/750S、21C/495E/820A、273M/322N/849T、495E、322N/750S/820A、52R/476N/495E/566A/750S/849T、386V/495E、495S/820A、21C/322N/495E/750S/820A、21C/85E/322N/386V/495S/820A/849T、495S、476N/495E/750S、386V/849T、476N/495E、85E/476N/849T、21C/322N/750S、20C/85E/566A/820A或386V/750S/849T,其中氨基酸位置是相对于SEQ ID NO:462的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:P750S/R820A、F21C/S52R、L20C/F21C/P85E/R322N/L476N/R495E、L20C/P85E/A200V/R322N/L476N/R495S/P750S、L476N/P750S、L20C/L476N、L20C/R322N/R386V、P85E/R322N/L476N、S52R/R322N/G498D/P750S、L20C/R322N/L476N/R820A、P85E/L476N/R495E/R820A、F21C/P85E/R322N/R820A、L20C/T299N/R322N/R386V/L476N/R495E/R820A、L20C/R322N、F21C/R820A/A849T、L476N、R322N/R820A、F21C/R322N/R386V/R820A、R322N/R386V/R495E、P85E/R386V/R495E/P750S、L20C/P85E/L476N/P750S、L20C/R386V/L476N、P85E/R322N/R386V/L476N/R495S、L20C/R495E/R820A、P750S、F21C/R322N/R495E、S52R/R386V/R495S/R820A、F21C/R322N、P85E/R322N/P750S/R820A、L20C/S52R/P85E、F21C/S52R/V572I、L20C/P85E/R495E/A849T、P85E/P750S、F21C/R495E/R820A、V273M/R322N/A849T、R495E、R322N/P750S/R820A、S52R/L476N/R495E/D566A/P750S/A849T、R386V/R495E、R495S/R820A、F21C/R322N/R495E/P750S/R820A、F21C/P85E/R322N/R386V/R495S/R820A/A849T、R495S、L476N/R495E/P750S、R386V/A849T、L476N/R495E、P85E/L476N/A849T、F21C/R322N/P750S、L20C/P85E/D566A/R820A或R386V/P750S/A849T,其中氨基酸位置是相对于SEQ ID NO:462的参考序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于SEQ ID NO:606的残基12至850的参考序列或与对应于SEQ ID NO:606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:606的残基12至850的参考序列或相对于对应于SEQ ID NO:606的参考序列包含一个或更多个取代。
在一些实施方案中,工程化DNA聚合酶的多肽序列在以下氨基酸位置处包含至少一个取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495或440,其中氨基酸位置是相对于SEQ ID NO:606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:299N/386V/566A/820A、476N/820A/849T、21C/322N/476N/495E/820A、177T、21C/495E、476N/820A、20C/52R/299N、52R/299N、322N/820A、20C/820A、20C/299N/386V/476N、386V/476N/820A、476N/495E/820A、386V/476N/495E、20C/21C/299N/322N/386V、322N/386V/495E、21C/299N/322N/476N/495E/820A、21C/299N/386V/820A、299N/476N/820A、20C/21C、21C/85P/102V/750P、705W、21C/386V/476N/820A、820A、21C/299N/322N、20C/21C/322N/386V/820A、299N、21C/299N/386V/476N、109P、322N/495E、491G、52R/820A、21C/386V/820A、20C/21C/495E、21C/T99N/322N/495E/566A/820A、20C/21C/299N/495E、756T、386V/820A、495E、511M、21C/52R/242Q/386V/495E/820A、299N/476N/495E、706E、21C/299N/386V/476N/495E、21C/299N/322N/495E、21C/476N/849T、299N/322N/476N/820A、21C/52R/299N/322N/820A、20C/21C/566A、20C/52R、322N/386V/495E/566A/820A、21C/299N、21C/299N/386V、386V/849T、52R/476N、52R/299N/322N/386V/495E或440G,其中氨基酸位置是相对于SEQ IDNO:606的参考序列。
在一些实施方案中,工程化DNA聚合酶的多肽序列包含以下至少一个取代或取代集:T299N/R386V/D566A/R820A、L476N/R820A/A849T、F21C/R322N/L476N/R495E/R820A、R177T、F21C/R495E、L476N/R820A、L20C/S52R/T299N、S52R/T299N、R322N/R820A、L20C/R820A、L20C/T299N/R386V/L476N、R386V/L476N/R820A、L476N/R495E/R820A、R386V/L476N/R495E、L20C/F21C/T299N/R322N/R386V、R322N/R386V/R495E、F21C/T299N/R322N/L476N/R495E/R820A、F21C/T299N/R386V/R820A、T299N/L476N/R820A、L20C/F21C、F21C/E85P/S102V/S750P、Y705W、F21C/R386V/L476N/R820A、R820A、F21C/T299N/R322N、L20C/F21C/R322N/R386V/R820A、T299N、F21C/T299N/R386V/L476N、K109P、R322N/R495E、A491G、S52R/R820A、F21C/R386V/R820A、L20C/F21C/R495E、F21C/T299N/R322N/R495E/D566A/R820A、L20C/F21C/T299N/R495E、A756T、R386V/R820A、R495E、T511M、F21C/S52R/P242Q/R386V/R495E/R820A、T299N/L476N/R495E、G706E、F21C/T299N/R386V/L476N/R495E、F21C/T299N/R322N/R495E、F21C/L476N/A849T、T299N/R322N/L476N/R820A、F21C/S52R/T299N/R322N/R820A、L20C/F21C/D566A、L20C/S52R、R322N/R386V/R495E/D566A/R820A、F21C/T299N、F21C/T299N/R386V、R386V/A849T、S52R/L476N、S52R/T299N/R322N/R386V/R495E或E440G,其中氨基酸位置是相对于SEQ ID NO:606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含在表4.1、表5.1、表6.1、表7.1和表8.1中提供的至少一个氨基酸位置中包含取代的多肽序列,其中所述取代是相对于对应于SEQID NO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:2、8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中提供的至少一个取代的多肽序列,其中所述取代是相对于包含SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或相对于SEQ ID NO:2、8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中提供的至少一个取代或取代集的多肽序列,其中所述取代或取代集是相对于包含SEQID NO:2、8、332、462或606的残基12至850的参考序列或相对于SEQ ID NO:2、8、332、462或606的参考序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的残基12至850的参考序列或与表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的残基12至850的多肽序列或包含表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的多肽序列。
在一些实施方案中,工程化DNA聚合酶包含与对应于以下的残基12至850的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、7762、764、766、768或770。
在一些实施方案中,工程化DNA聚合酶包含含有以下的残基12至850的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、7762、764、766、768或770或其片段,其中所述多肽序列任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,工程化DNA聚合酶包含与对应于以下的参考序列包含至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、7762、764、766、768或770。
在一些实施方案中,工程化DNA聚合酶包含含有以下的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、7762、764、766、768或770或其片段,其中所述多肽任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,工程化DNA聚合酶多肽在多肽序列中具有1、2、3、4或多达5个取代。在一些实施方案中,工程化DNA聚合酶多肽在多肽序列中具有1、2、3或4个取代。在一些实施方案中,取代包括非保守取代或保守取代。在一些实施方案中,取代包括保守取代。在一些实施方案中,取代包括非保守取代。在一些实施方案中,本文公开的变体(包括在实施例中)提供了关于非保守取代和保守取代的指导。
在一些实施方案中,工程化DNA聚合酶包含含有SEQ ID NO:2、8、332、462或606的残基12至850的多肽序列,其中所述多肽序列任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。在一些实施方案中,工程化DNA聚合酶包含含有SEQ ID NO:2、8、332、462或606的多肽序列,其中所述多肽序列任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。在一些实施方案中,工程化DNA聚合酶在多肽序列中包含1、2、3、4、多达5个取代。在一些实施方案中,工程化DNA聚合酶在多肽序列中包含1、2、3或4个取代。
将明显的是,本文的描述,包括实施例和表格,提供了将特定氨基酸序列特征与工程化DNA聚合酶多肽的功能活性/特性关联的结构信息。该结构-功能相关信息以相对于参考工程化多肽SEQ ID NO:2、8、332、462或606的特定氨基酸残基差异、以及示例性工程化DNA聚合酶多肽的经实验确定的相关活性数据的形式来提供。这样的信息提供了关于在制备工程化DNA聚合酶变体中实施的取代的指导和信息。
在一些实施方案中,本公开内容的工程化DNA聚合酶具有DNA聚合酶活性。在一些实施方案中,与参考或比较物DNA聚合酶相比,工程化DNA聚合酶具有至少一种改进的特性。在一些实施方案中,与参考或比较物DNA聚合酶相比,在PCR反应中,工程化DNA聚合酶具有选自增加的活性;增加的DNA产物产率;增加的热稳定性;增加的进行性;增加的保真度;增加了DNA模板灵敏度和增加的产物产率的一种或更多种改进的特性。在一些实施方案中,参考或比较物DNA聚合酶具有对应于SEQ ID NO:2、8、332、462或606的残基12至850的序列或对应于SEQ ID NO:2、8、332、462或606的序列。在一些实施方案中,参考DNA聚合酶具有对应于SEQ ID NO:2的残基12至850的序列或对应于SEQ ID NO:2的序列。在一些实施方案中,参考或比较物DNA聚合酶是野生型DNA聚合酶,选自来自强烈火球菌的Pfu DNA聚合酶、来自嗜热球菌属物种菌株2319x1的B组DNA聚合酶和来自水生栖热菌的Taq DNA聚合酶。
在一些实施方案中,本文描述的工程化DNA聚合酶多肽是分离的组合物。在一些实施方案中,工程化DNA聚合酶多肽是纯化的组合物,如本文进一步讨论的。
在一些实施方案中,本公开内容还提供了本文描述的工程化DNA聚合酶多肽的功能片段或生物活性片段。因此,对于工程化DNA聚合酶的每一种和每种实施方案,本文提供了工程化DNA聚合酶的功能片段或生物活性片段。在一些实施方案中,工程化DNA聚合酶的功能片段或生物活性片段包含它从其衍生的DNA聚合酶多肽(即亲本DNA聚合酶)活性的至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。
在一些实施方案中,功能片段或生物活性片段包含DNA聚合酶亲本序列的至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%。在一些实施方案中,功能片段被截短少于5、少于10、少于15、少于20、少于25、少于30、少于35、少于40、少于45和少于50个氨基酸。
在一些实施方案中,本文的工程化DNA聚合酶的功能片段包含工程化DNA聚合酶亲本序列的至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,功能片段被截短少于5、少于10、少于15、少于20、少于25、少于30、少于35、少于40、少于45、少于50、少于55、少于60、少于65或少于70个氨基酸。
在一些实施方案中,本文描述的工程化DNA聚合酶多肽的功能片段或生物活性片段在本文描述的工程化DNA聚合酶的氨基酸序列中包含至少一个取代或取代集。因此,在一些实施方案中,工程化DNA聚合酶的功能片段或生物活性片段显示出与亲本工程化DNA聚合酶中的取代或取代集关联的增强的或改进的特性。
编码工程化多肽的多核苷酸、表达载体和宿主细胞
在另一方面,本公开内容提供了编码本文描述的工程化DNA聚合酶多肽的重组多核苷酸。在一些实施方案中,重组多核苷酸可操作地连接至控制基因表达的一个或更多个异源调节序列,以产生能够表达多肽的重组多核苷酸。在一些实施方案中,包含编码一种或更多种工程化DNA聚合酶多肽的至少一种异源多核苷酸的表达构建体被引入适当的宿主细胞中以表达对应的一种或更多种DNA聚合酶多肽。
如对技术人员将是明显的,蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供了能够编码主题多肽的所有多核苷酸的描述。遗传密码的简并性(其中相同氨基酸由可选的或同义的密码子编码)允许制备极大数目的核酸,所有这些核酸编码本公开内容的工程化DNA聚合酶多肽。因此,本公开内容提供了用于产生工程化DNA聚合酶多核苷酸的每一种和每种可能的变异的方法和组合物,所述变异编码本文描述的工程化DNA聚合酶多肽,可以通过基于可能的密码子选择来选择组合进行制备,并且对于本文描述的任何多肽,包括实施例中(例如,表4.1、表5.1、表6.1、表7.1和表8.1中)和序列表中呈现的氨基酸序列,重组多核苷酸的所有这样的变异被认为具体地公开。
在一些实施方案中,密码子被优选地优化,以被用于蛋白产生的选择的宿主细胞利用。例如,细菌中使用的优选的密码子通常用于在细菌中表达,并且哺乳动物细胞中使用的优选的密码子通常用于在哺乳动物细胞中表达。因此,编码工程化DNA聚合酶多肽的经密码子优化的多核苷酸在全长编码区域中约40%、50%、60%、70%、80%、90%或大于90%的密码子位置处包含优选的密码子。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或与对应于SEQ IDNO:2、8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:2、8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代,如本文描述的。
如以上描述的,在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代的多肽序列:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代的多肽序列:40、85、102、132、157、177、262、263、503、521、748或750或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:213/503/508/584/748、40/132/748、40/132/157/262/263/748、132、40/132/503/748、40/132/157/503/562、40/132/213/748/814、132/157/562/584、132/584/748、40/132/D231E/I684V/H748Y、40/132、40/41/132/562/684/748、41/213/231/503/650/674/748、132/231/503/748、40/132Y/S157G/L503I、503/748/814、40/132/231/503/674/748、40/88/132/503/684/748、132/157/213/674/748/814、157/263/748、40/748、41/157/231/262/748/814、40/213/503/562/584/748、523/524、40/132/503/514/650/674、40/132/157/213/231、41/213/520/814、40/41/157/231/503、40/157/503、40/132/562/748、132/748、40/41/132/562/748、88/213/503/584/684/748、57/58/523/616/677、40/213/231/503/514/562/748、132/562、213/503/650、40/41/88/231/748/814、41/213/262/562、41/88/231/748、213/263/748、40/157/213、157/520、40/132/263/503/674/814、40/41、524/665/756、58/186/217/523/524/677、40/41/748、132/514、520、41/213/503/562、231/503/748/772、503/562、73/232/514/584/814、58/507/616、132/262/520/562/684/748、88/562/814、41/88/157/814、88/157/213/674/684、57/58/523/779、40/132/157/514/520/684、40/41/213/684/772、40/41/231/503/814、88/213/503/584/814、40/41/132/562/584、41/88/213/231/503/650/748、40/503、40/132/213/231/520/562/650/814、40/41/132/231/262/503/562/584/748/814、57/58/264/265/524/688、88/132/157/262/263/520/562、88/132/157/262/503/514/562/650、40/584/674/748、40/41/132/263/503、584/748、40/213/674、40/41/88T/132/503/562/584/748、88/213/514/562/748/814、263/520/814或40/41/88/157,其中氨基酸位置是相对于SEQ IDNO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773、803或其组合,其中氨基酸位置是相对于SEQID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764或542/762/764,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20C/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820、386/750/849或其组合,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495或440,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽在以下氨基酸位置处包含取代或取代集:22/40/132/157/262/263/407/748、40/132/157/262/263/328/748、40/132/157/262/263/401/748、40/132/157/262/263/402/748、40/132/157/262/263/403/748、40/132/157/262/263/404/748、40/132/157/262/263/406/748、40/132/157/262/263/407/748、40/132/157/262/263/503/748、40/132/157/262/263/504/748、40/132/157/262/263/506/748、40/132/157/262/263/521/748、40/132/157/262/263/523/748、40/132/157/262/263/524/748、40/132/157/262/263/525/748、40/132/157/262/263/526/748、40/132/157/262/263/527/748、40/132/157/262/263/528/748、40/132/157/262/263/529/748、40/132/157/262/263/530/748、40/132/157/262/263/531/748、40/132/157/262/263/533/748、40/132/157/262/263/534/748、40/132/157/262/263/535/748、40/132/157/262/263/536/748、40/132/157/262/263/537/748、40/132/157/262/263/538/748、40/132/157/262/263/539/748、40/132/157/262/263/540/748、40/132/157/262/263/542/748、40/132/157/262/263/54/748、40/132/157/262/263/553/748、40/132/157/262/263/554/748、40/132/157/262/263/555/748、40/132/157/262/263/556/748、40/132/157/262/263/557/748、40/132/157/262/263/558/748、40/132/157/262/263/559/748、40/132/157/262/263/560/748、40/132/157/262/263/563/748、40/132/157/262/263/581/748、40/132/157/262/263/582/748、40/132/157/262/263/585/748、40/132/157/262/263/586/748、40/132/157/262/263/587/748、40/132/157/262/263/589/748、40/132/157/262/263/592/748、40/132/157/262/263/593/748、40/132/157/262/263/594/748、40/132/157/262/263/595/748、40/132/157/262/263/596/748、40/132/157/262/263/597/748、40/132/157/262/263/598/748、40/132/157/262/263/599/748、40/132/157/262/263/601/748、40/132/157/262/263/602/748、40/132/157/262/263/603/748、40/132/157/262/263/605/748、40/132/157/262/263/607/748、40/132/157/262/263/696/748、40/132/157/262/263/747/748、40/132/157/262/263/748、40/132/157/262/263/748/749、40/132/157/262/263/748/751、40/132/157/262/263/748/762、40/132/157/262/263/748/763、40/132/157/262/263/748/764、40/132/157/262/263/748/766、40/132/157/262/263/748/773、40/132/157/262/263/748/803、40/132/157/605/262/263/748、40/132/157/262/263/403/521/748或40/132/157/262/263/403/553/748,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽在以下氨基酸位置处包含取代或取代集:40/132/157/262/263/403/404/521/524/542/555/748/762/764、40/132/157/262/263/404/521/524/542/589/748/762/764、40/132/157/262/263/521/524/542/581/748/762/764、40/132/157/262/263/521/542/748/762/764、40/132/157/262/263/404/521/542/748/762、40/132/157/262/263/521/748/750/849、40/132/157/262/263/521/524/581/748、16/40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/820、40/132/157/262/263/521/748/793、40/132/157/262/263/521/748/764、40/132/157/262/263/521/748/755、40/132/157/262/263/521/748/753、40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/728、40/132/157/262/263/521/704/748、40/132/157/262/263/521/675/748、40/132/157/262/263/521/671/748、40/132/157/262/263/521/570/748、40/132/157/262/263/495/521/748、40/132/157/262/263/480/521/748、40/132/157/262/263/476/521/748、40/132/157/262/263/384/521/748、40/132/157/262/263/322/521/748、40/132/157/262/263/321/521/748、40/132/157/243/262/263/521/748、15/40/132/157/262/263/521/748、40/102/132/157/262/263/521/748、40/91/132/157/262/263/521/748、40/87/132/157/262/263/521/748、40/85/132/157/262/263/521/748、20/40/132/157/262/263/521/748、21/40/132/157/262/263/521/748或40/52/132/157/262/263/521/748,其中氨基酸位置是相对于SEQID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽在以下氨基酸位置处包含取代或取代集:40/102/132/157/262/263/476/521/748、40/102/132/157/262/263/495/521/748、40/102/132/157/262/263/521/748/750、21/40/52/102/132/157/262/263/521/748、21/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/476/521/748、40/85/102/132/157/262/263/521/748/750、40/102/132/157/262/263/386/495/521/748、40/102/132/157/262/263/476/495/521/748、40/102/132/157/262/263/322/521/748/820、40/102/132/157/262/263/386/521/748/849、20/40/52/85/102/132/157/262/263/521/748、40/102/132/157/262/263/476/521/748/750、40/102/132/157/262/263/495/521/748/820、40/102/132/157/262/263/521/748/750/820、21/40/52/102/132/157/262/263/521/572/748、20/40/102/132/157/262/263/322/386/521/748、21/40/102/132/157/262/263/322/495/521/748、40/85/102/132/157/262/263/322/476/521/748、20/40/102/132/157/262/263/386/476/521/748、21/40/102/132/157/262/263/322/521/748/750、21/40/102/132/157/262/263/495/521/748/820、20/40/102/132/157/262/263/495/521/748/820、40/85/102/132/157/262/263/476/521/748/849、21/40/102/132/157/262/263/521/748/820/849、40/102/132/157/262/263/322/386/495/521/748、40/102/132/157/262/263/273/322/521/748/849、40/102/132/157/262/263/476/495/521/748/750、40/102/132/157/262/263/322/521/748/750/820、40/102/132/157/262/263/386/521/748/750/849、21/40/85/102/132/157/262/263/322/521/748/820、20/40/85/102/132/157/262/263/476/521/748/750、20/40/85/102/132/157/262/263/495/521/748/849、20/40/85/102/132/157/262/263/521/566/748/820、40/52/102/132/157/262/263/322/498/521/748/750、21/40/102/132/157/262/263/322/386/521/748/820、40/52/102/132/157/262/263/386/495/521/748/820、20/40/102/132/157/262/263/322/476/521/748/820、40/85/102/132/157/262/263/386/495/521/748/750、40/85/102/132/157/262/263/476/495/521/748/820、40/85/102/132/157/262/263/322/521/748/750/820、40/85/102/132/157/262/263/322/386/476/495S/521/748、21/40/102/132/157/262/263/322/495/521/748/750/820、20/21/40/85/102/132/157/262/263/322/476/495/521/748、20/40/102/132/157/262/263/299/322/386/476/495/521/748、40/52/102/132/157/262/263/476/495/521/566/748/750/849、20/40/85/102/132/157/262/200/263/322/476/495S/521/748/750或21/40/85/102/132/157/262/263/322/386/495/521/748/820/849,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽在以下氨基酸位置处包含取代或取代集:40/85/102/132/157/262/263/299/386/521/566/748/750/820、40/85/102/132/157/262/263/476/521/748/750/820/849、21/40/85/102/132/157/262/263/322/476/495/521/748/750/820、40/85/102/132/157/262/177/263/521/748/750、21/40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/476/521/748/750/820、20/40/52/85/102/132/157/262/263/299/521/748/750、52/40/85/102/132/157/262/263/299/521/748/750、40/85/102/132/157/262/263/322/521/748Y/750S/820、20/40/85/102/132/157/262/263/521/748/750/820、20/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/476/495/521/748/750/820、40/85/102/132/157/262/263/386/476/495/521/748/750、20/21/40/85/102/132/157/262/263/299/322/386/521/748/750、40/85/102/132/157/262/263/322/386/495/521/748/750、21/40/85/102/132/157/262/263/299/322/476/495/521/748/750/820、21/40/85/102/132/157/262/263/299/386/521/748/750/820、40/85/102/132/157/262/263/299/476/521/748/750/820、20/21/40/85/102/132/157/262/263/521/748/750、21/40/102/132/157/262/263/521/748、40/85/102/132/157/262/263/521/705/748/750、21/40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/299/322/521/748/750、20/40/85/102/132/157/262/263/322/386/521/748/750/820、40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/109/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/495/521/748/750、40/85/102/132/157/262/263/491/521/748/750、40/52/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/386/521/748/750/820、20/21/40/85/102/132/157/262/263/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/566/748/750/820、20/21/40/85/102/132/157/262/263/299/495/521/748/750、40/85/102/132/157/262/263/521/748/750/756、40/85/102/132/157/262/263/386/521/748/750/820、40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/511/521/748/750、21/40/52/85/102/132/157/262/263/242/386/495/521/748/750/820、40/85/102/132/157/262/263/299/476/495/521/748/750、40/85/102/132/157/262/263/521/706/748/750、21/40/85/102/132/157/262/263/299/386/476/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/748/750、21/40/85/102/132/157/262/263/476/521/748/750/849、40/85/102/132/157/262/263/299/322/476/521/748/750/820、21/40/52/85/102/132/157/262/263/299/322/521/748/750/820、20/21/40/85/102/132/157/262/263/521/566/748/750、20/40/52//85/102/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/386/495/521/566/748/750/820、21/40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/521/748/750、40/85/102/132/157/262/263/386/521/748/750/849、40/52/85/102/132/157/262/263/476/521/748/750、40/52/85/102/132/157/262/263/299/322/386/495/521/748/750或40/85/102/132/157/262/263/440/521/748/750,其中氨基酸位置是相对于SEQ ID NO:2的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ IDNO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:8、332、462或606的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ IDNO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或相对于对应于SEQ ID NO:8、332、462或606的参考序列包含一个或更多个取代,条件是所述多肽序列不包括包含SEQ ID NO:2的残基12至850的序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代的多肽序列:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代的多肽序列:40、85、102、132、157、177、262、263、521、748或750或其组合。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:8的残基12至850的参考序列或与对应于SEQ ID NO:8的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8的残基12至850的参考序列或相对于对应于SEQ ID NO:8的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773、803或403/553,其中氨基酸位置是相对于SEQ ID NO:8的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:332的残基12至850的参考序列或与对应于SEQ ID NO:332的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:332的残基12至850的参考序列或相对于对应于SEQ IDNO:332的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764或542/762/764,其中氨基酸位置是相对于SEQ ID NO:332的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:462的残基12至850的参考序列或与对应于SEQ ID NO:462的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:462的残基12至850的参考序列或相对于对应于SEQ IDNO:462的参考序列包含一个或更多个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中氨基酸位置是相对于SEQ ID NO:462的参考序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与对应于SEQ ID NO:606的残基12至850的参考序列或与对应于SEQ ID NO:606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:606的残基12至850的参考序列或相对于对应于SEQ IDNO:606的参考序列包含一个或更多个取代。
重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在以下氨基酸位置处包含至少一个取代或取代集的多肽序列:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495、440或其组合,其中氨基酸位置是相对于SEQ ID NO:606的参考序列。
在一些实施方案中,对于前述每一种实施方案,本文描述的取代或取代集的特定氨基酸取代可以用于编码的工程化DNA聚合酶多肽。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含在表4.1、表5.1、表6.1、表7.1和表8.1中提供的至少一个氨基酸位置中包含至少一个取代的多肽序列,其中所述取代是相对于SEQ ID NO:2、8、332、462或606。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中提供的至少一个取代的多肽序列,其中所述取代是相对于SEQ ID NO:2、8、332、462或606。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含对于表4.1、表5.1、表6.1、表7.1和表8.1中的每一种变体提供的至少一个取代或取代集,其中所述取代或取代集是相对于SEQ ID NO:2、8、332、462或606。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与包含表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的残基12至850的序列具有至少75%、80%、85%、86%、887%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含与表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的序列包含至少75%、80%、85%、86%、887%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的残基12至850的多肽序列。在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中列出的偶数编号SEQ ID NO的多肽序列。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含含有以下的残基12至850的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768或770或其片段,其中所述多肽序列在所述多肽序列中任选地具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶,所述工程化DNA聚合酶包含含有以下的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768或770或其片段,其中所述多肽序列在所述多肽序列中任选地具有1、2、3、4、5、6、7、8、9或多达10个取代。
在一些实施方案中,编码的工程化DNA聚合酶多肽在多肽序列中包含1、2、3、4、多达5个取代。在一些实施方案中,编码的工程化DNA聚合酶多肽在多肽序列中包含1、2、3或4个取代。在一些实施方案中,取代包括非保守取代或保守取代。在一些实施方案中,取代包括保守取代。在一些实施方案中,取代包括非保守取代。在一些实施方案中,本文公开的变体提供了关于非保守取代和保守取代的指导。
在一些实施方案中,重组多核苷酸编码工程化DNA聚合酶多肽,所述工程化DNA聚合酶多肽包含含有SEQ ID NO:8、332、462或606的残基12至850的多肽序列或包含SEQ IDNO:8、332、462或606的多肽序列,其中所述多肽序列在所述多肽序列中任选地具有1、2、3、4、5、6、7、8、9或多达10个取代。在一些实施方案中,编码的DNA聚合酶在多肽序列中包含1、2、3、4、多达5个取代。在一些实施方案中,编码的DNA聚合酶在多肽序列中包含1、2、3或4个取代。
在一些实施方案中,重组多核苷酸包含与包含SEQ ID NO:1的核苷酸残基34至2550的参考多核苷酸序列或与SEQ ID NO:1的参考多核苷酸序列具有至少75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多核苷酸序列,其中重组多核苷酸编码工程化DNA聚合酶或其功能片段,其中工程化DNA聚合酶的多肽序列相对于包含SEQ ID NO:2的残基12至850的参考序列或相对于SEQ ID NO:2的参考序列在一个或更多个氨基酸位置处包含一个或更多个取代。
在一些实施方案中,重组多核苷酸包含与包含SEQ ID NO:7、331、461或605的核苷酸残基34至2550的参考多核苷酸序列或与SEQ ID NO:7、331、461或605的参考多核苷酸序列具有至少75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多核苷酸序列,其中重组多核苷酸编码工程化DNA聚合酶或其功能片段。
在一些实施方案中,重组多核苷酸包含与对应于以下的核苷酸残基34至2550的多核苷酸序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的多核苷酸序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769,其中所述多核苷酸编码工程化DNA聚合酶,如本文描述的。
在一些实施方案中,重组多核苷酸包含含有以下的核苷酸残基34至2550的多核苷酸序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769。
在一些实施方案中,重组多核苷酸包含与对应于以下的多核苷酸序列具有至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多核苷酸序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769,其中所述重组多核苷酸编码工程化DNA聚合酶,如本文描述的。
在一些实施方案中,重组多核苷酸包含含有以下的序列:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769。
在一些实施方案中,重组多核苷酸编码DNA聚合酶,并在高度严格的条件下与本文描述的编码工程化DNA聚合酶的参考多核苷酸序列杂交。在一些实施方案中,参考序列对应于SEQ ID NO:1、7、331、461或605的残基34至2550或对应于SEQ ID NO:1、7、331、461或605的序列或其互补物或编码本文提供的其他工程化DNA聚合酶中的任何一种的多核苷酸序列。在一些实施方案中,多核苷酸编码DNA聚合酶,并在高度严格的条件下与包含对应于SEQID NO:1-769的奇数编号序列的残基34至2550的序列的参考多核苷酸杂交或与包含对应于SEQ ID NO:1-769的奇数编号序列的序列的参考多核苷酸杂交。
在一些实施方案中,能够在高度严格条件下杂交的多核苷酸编码包含这样的氨基酸序列的DNA聚合酶,所述氨基酸序列与SEQ ID NO:2、8、332、462和/或606相比,在如选自表4.1、表5.1、表6.1、表7.1和表8.1中列出的任何位置的残基位置处具有一个或更多个残基差异。在一些实施方案中,在高度严格的条件下杂交的多核苷酸包含与对应于SEQ IDNO:1、7、331、461或605的残基34至2550的参考序列或与对应于SEQ ID NO:1、7、331、461或605的参考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多核苷酸。在一些另外的实施方案中,在高度严格的条件下杂交的多核苷酸包含与对应于表4.1、表5.1、表6.1、表7.1和表8.1中提供的多核苷酸序列的残基34至2550或对应于表4.1、表5.1、表6.1、表7.1和表8.1中提供的多核苷酸序列的至少一种多核苷酸参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。
在一些实施方案中,编码本文的工程化DNA聚合酶多肽中的任何一个的分离的多核苷酸以各种方式被操纵,以促进DNA聚合酶多肽的表达。在一些实施方案中,编码DNA聚合酶多肽的多核苷酸构成表达载体,其中存在一个或更多个控制序列来调节DNA聚合酶多核苷酸和/或多肽的表达。根据所用的表达载体,在分离的多核苷酸插入载体之前对分离的多核苷酸的操纵可以是期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除其他以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。在一些实施方案中,基于宿主细胞的选择对适合的启动子进行选择。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的合适启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因,以及原核β-内酰胺酶基因(参见,例如,Villa-Kamaroff等人,Proc.NatlAcad.Sci.USA,1978,75:3727-3731),以及tac启动子(参见,例如,DeBoer等人,Proc.Natl Acad.Sci.USA,1983,80:21-25)。用于丝状真菌宿主细胞的示例性启动子包括但不限于从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast,1992,8:423-488)。
在一些实施方案中,控制序列也是适合的转录终止子序列(即由宿主细胞识别以终止转录的序列)。在一些实施方案中,终止子序列可操作地连接至编码DNA聚合酶多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何适合的终止子可用于本发明中。对于细菌表达,转录终止子可以是依赖于Rho转录因子的Rho依赖性终止子,或者是不需要转录因子的Rho独立性或内在终止子。示例性细菌转录终止子在Peters等人,J Mol Biol.,2011,412(5):793-813中描述。用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等人,上文)。
在一些实施方案中,控制序列也是适合的前导序列(即对由宿主细胞的翻译重要的mRNA的非翻译区)。在一些实施方案中,前导序列可操作地连接至编码DNA聚合酶多肽的核酸序列的5’末端。在选择的宿主细胞中有功能的任何适合的前导序列可用于本发明中。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的适合的前导序列从以下的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
在一些实施方案中,控制序列也是多腺苷酸化序列(即可操作地连接至核酸序列的3'末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号)。在选择的宿主细胞中有功能的任何适合的多腺苷酸化序列可用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括,但不限于以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列是已知的(参见例如Guo和Sherman,Mol.Cell.Biol.,1995,15:5983-5990)。
在一些实施方案中,控制序列包括3’非翻译核酸区和多腺苷酸化尾核酸序列,这些序列可操作地连接至蛋白编码核酸序列的3’末端,介导与涉及mRNA转运和翻译以及mRNA半衰期的蛋白的结合。在所选择的宿主细胞中有功能的任何多腺苷酸化序列和3’-UTR可用于本发明。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于来自以下的基因的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。
在一些实施方案中,控制序列也是信号肽(即编码连接至多肽的氨基末端并将编码的多肽引导到细胞的分泌途径的氨基酸序列的编码区)。在一些实施方案中,核酸序列的编码序列的5’末端固有地包含信号肽编码区,其符合翻译阅读框地(in translationreading frame)与编码分泌的多肽的编码区的区段天然地连接。可选地,在一些实施方案中,编码序列的5’末端包含对编码序列而言外来的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何适合的信号肽编码区可用于一种或更多种工程化多肽的表达。用于细菌宿主细胞的有效信号肽编码区是包括但不限于从以下的基因获得的那些信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,1993,57:109-137)。在一些实施方案中,对于丝状真菌宿主细胞有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和Humicola lanuginosa脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些:酿酒酵母α-因子和酿酒酵母转化酶。
在一些实施方案中,控制序列也是编码定位在多肽的氨基末端处的氨基酸序列的前肽编码区。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区可以从包括但不限于以下的基因的任何适合的来源获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如WO 95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达调节。调节系统的实例是引起基因的表达响应于化学或物理刺激(包括调节性化合物的存在)被开启或关闭的那些。在原核宿主细胞中,适合的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,适合的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,适合的调节序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
在另一方面,本公开内容提供了包含编码工程化DNA聚合酶多肽的多核苷酸以及根据其待被引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等的重组表达载体。在一些实施方案中,本文描述的各种核酸和控制序列连接在一起(即可操作地连接)以产生重组表达载体,所述重组表达载体包括一个或更多个方便的限制性位点,以允许在这样的位点插入或取代编码DNA聚合酶多肽的核酸序列。可选地,在一些实施方案中,本发明的核酸序列通过将核酸序列或包含该序列的核酸构建体插入到用于表达的适合的载体中来表达。在涉及产生表达载体的一些实施方案中,编码序列位于载体中使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何合适的载体(例如,质粒或病毒),其可以方便地进行重组DNA程序并且引起DNA聚合酶多核苷酸序列的表达。载体的选择通常取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体为自主复制载体(即,作为染色体外的实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选的实施方案中,载体是其中当被引入宿主细胞中时,被整合到基因组中并与其被整合进的一条或更多条染色体一起复制的载体。此外,在一些实施方案中,使用了单一载体或质粒,或者一起包含待引入宿主细胞的基因组中的总DNA的两种或更多种载体或质粒,和/或转座子。
在一些实施方案中,表达载体包含允许容易选择转化的细胞的一个或更多个选择标记(selectable marker)。“选择标记”是其产物提供抗生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。细菌的选择标记的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标记包括但不限于amdS(乙酰胺酶;例如来自构巢曲霉(A.nidulans)或米曲霉(A.orzyae))、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶;例如来自吸水链霉菌(S.hygroscopicus))、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶;例如来自构巢曲霉或米曲霉)、sC(硫酸腺苷酰转移酶(sulfateadenyltransferase))和trpC(邻氨基苯甲酸合酶),以及其等同物。
在另一方面,本发明提供了一种宿主细胞,所述宿主细胞包含编码本发明的至少一种工程化DNA聚合酶多肽的至少一种多核苷酸,所述多核苷酸被可操作地连接至一个或更多个控制序列用于在宿主细胞中表达一种或更多种工程化DNA聚合酶。适于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞还包括各种大肠杆菌(Escherichia coli)菌株(例如,W3110(ΔfhuA)和BL21)。
因此,在另一方面,本公开内容提供了产生工程化DNA聚合酶多肽的方法,其中所述方法包括将能够表达编码工程化DNA聚合酶多肽的多核苷酸的宿主细胞在适合该多肽表达的条件下培养。在一些实施方案中,方法还包括分离和/或纯化如本文描述的DNA聚合酶多肽的一个或更多个步骤。在一些实施方案中,宿主细胞是细菌细胞,诸如大肠杆菌或枯草芽孢杆菌。
用于宿主细胞的适当的培养基和生长条件是本领域熟知的。预期任何用于将表达DNA聚合酶多肽的多核苷酸引入细胞的合适方法可用于本发明。合适的技术包括但不限于,电穿孔、生物弹射粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的特性的工程化DNA聚合酶多肽可以通过使编码天然存在的或工程化DNA聚合酶多肽的多核苷酸经历本领域中已知的和/或如本文所描述的任何合适的诱变和/或定向演化方法来获得。示例性的定向演化技术为诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA,1994,91:10747-10751;WO 95/22625;WO 97/0078;WO97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746)。可以使用的其他定向演化程序包括,尤其是,交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,1998,16:258–261)、诱变PCR(参见例如,Caldwell等人,PCR MethodsAppl.,1994,3:S136-S140)和盒式诱变(参见例如,Black等人,Proc.Natl.Acad.Sci.USA,1996,93:3525-3529)。
例如,诱变和定向演化的方法可以容易地应用至编码DNA聚合酶的多核苷酸,以产生可以被表达、筛选和测定的变体文库。任何合适的诱变和定向演化方法可用于本发明并是本领域熟知的(参见例如美国专利第5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326、9,665,694、9,684,771号,以及所有相关的PCT和非美国的对应申请;Ling等人,Anal.Biochem.,1997,254(2):157-78;Dale等人,Meth.Mol.Biol.,1996,57:369-74;Smith,Ann.Rev.Genet.,1985,19:423-462;Botstein等人,Science,1985,229:1193-1201;Carter,Biochem.J.,1986,237:1-7;Kramer等人,Cell,1984,38:879-887;Wells等人,Gene,1985,34:315-323;Minshull等人,Curr.Op.Chem.Biol.,1999,3:284-290;Christians等人,Nat.Biotechnol.,1999,17:259-264;Crameri等人,Nature,1998,391:288-291;Crameri,等人,Nat.Biotechnol.,1997,15:436-438;Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,1997,94:4504-4509;Crameri等人,Nat.Biotechnol.,1996,14:315-319;Stemmer,Nature,1994,370:389-391;Stemmer,Proc.Nat.Acad.Sci.USA,1994,91:10747-10751;EP 3 049 973;WO95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767;WO2009/152336;和WO 2015/048573,其全部通过引用并入本文)。
在一些实施方案中,诱变处理后获得的蛋白变体通过使酶制品经历确定的温度(或其他测定条件),并测量热处理或其他适合的测定条件之后剩余的酶活性的量来进行筛选。然后包含编码DNA聚合酶多肽的多核苷酸的克隆从基因分离、测序以鉴定核苷酸序列的改变(如果有),并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何适合的方法(例如,标准生物化学技术,诸如HPLC分析)进行。
对于具有已知序列的工程化多肽,编码酶的多核苷酸可以根据已知的合成方法通过标准的固相方法制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶促或化学连接方法(chemical ligation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如,本文公开的多核苷酸和寡核苷酸可以使用经典的亚磷酰胺方法通过化学合成制备(参见例如,Beaucage等人,Tet.Lett.,1981,22:1859-69;和Matthes等人,EMBO J.,1984,3:801-05),如通常在自动合成方法中所实践的。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动的DNA合成仪中、纯化、退火、连接并克隆在适当的载体中)。
因此,在一些实施方案中,用于制备工程化DNA聚合酶多肽的方法可以包括:(a)合成编码包含选自如本文描述的任何变体的氨基酸序列的氨基酸序列的多肽的多核苷酸,和(b)表达由该多核苷酸编码的DNA聚合酶多肽。在方法的一些实施方案中,由该多核苷酸编码的氨基酸序列可以任选地具有一个或若干(例如,多达3、4、5个或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-15、1-20、1-21、1-22、1-23、1-24、1-25、1-30、1-35、1-40、1-45或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、30、35、40、45或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、18、20、21、22、23、24或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代是保守的或非保守的取代。
可以使用本领域已知的任何合适的测定,包括但并不限于本文描述的测定和条件,评价所表达的工程化DNA聚合酶多肽的任何期望的改进的特性或特性的组合(例如,活性、选择性、保真度、稳定性、热稳定性、对各种pH水平的耐受性、蛋白酶灵敏度等)。
在一些实施方案中,使用用于蛋白纯化的熟知技术中的任何一种或更多种,将宿主细胞中表达的工程化DNA聚合酶多肽中的任一种从细胞和/或培养基中回收,用于蛋白纯化的熟知技术除了其他以外包括,溶菌酶处理、声处理(sonication)、过滤、盐析、超离心和色谱法。
用于分离DNA聚合酶多肽的色谱技术,除了其他以外,包括,反相色谱、高效液相色谱、离子交换色谱、疏水相互作用色谱、尺寸排阻色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件部分地取决于因素诸如净电荷、疏水性、亲水性、分子量、分子形状等,并且对本领域技术人员将是明显的。在一些实施方案中,亲和技术可以用于分离改进的DNA聚合酶。对于亲和色谱纯化,可以使用与感兴趣的DNA聚合酶多肽特异性结合的任何抗体。为了产生抗体,通过注射DNA聚合酶多肽或其片段免疫接种各种宿主动物,包括但不限于兔、小鼠、大鼠等。在一些实施方案中,DNA聚合酶多肽或片段借助于侧链官能基团或附接至侧链官能基团的接头被附接至合适的载体,诸如BSA。
在一些实施方案中,将分离或纯化的工程化DNA聚合酶多肽与其他成分和化合物组合以提供包含工程化DNA聚合酶多肽根据需要用于不同应用和用途的组合物和制剂(例如,诊断方法和组合物)。在一些实施方案中,组合物包含至少一种本公开内容的工程化DNA聚合酶。在一些实施方案中,组合物还包含缓冲液。在一些实施方案中,组合物还包含底物,诸如核苷酸底物(例如dNTP、dNTP类似物和/或修饰的dNTP)和/或至少一种引物,例如与靶核酸互补。在一些实施方案中,组合物还包含靶DNA模板。
在一些实施方案中,组合物还可以包含除工程化DNA聚合酶以外的DNA聚合酶(例如,第二DNA聚合酶)。在一些实施方案中,第二DNA聚合酶是第二热稳定DNA聚合酶,例如Taq或Pfu聚合酶,或者逆转录酶,诸如在RT-PCR偶联反应中有用的那些。在一些实施方案中,组合物包含探针或指示物,诸如核酸结合染料(例如Green),用于检测和/或定量例如在qRT-PCR反应中形成的产物的量。
工程化DNA聚合酶多肽及试剂盒的用途
在另一方面,本公开内容提供了工程化DNA聚合酶用于诊断和分子生物学目的的用途,诸如用于检测靶核酸的存在和核酸的直接/间接测序。
在一些实施方案中,工程化DNA聚合酶用于制备靶DNA的互补DNA。在一些实施方案中,制备靶DNA的互补DNA的方法包括在存在足以产生互补DNA的底物的情况下,在适于产生靶DNA的全部或一部分(即整体或部分)互补DNA的反应条件下,使靶DNA与本文描述的工程化DNA聚合酶接触。如本文讨论和本领域已知的,底物包括用于DNA聚合酶活性的核苷酸(例如dNTP)和/或寡核苷酸引物。引物可以是针对靶核酸的特定序列,或者是随机引物,诸如用于产生DNA文库。
在一些实施方案中,靶DNA是适合作为工程化DNA聚合酶模板的任何DNA,包括但不限于基因组DNA、线粒体DNA、无细胞DNA(例如,从血液/血清中获得)、细菌DNA、真菌DNA或病毒DNA。
在一些实施方案中,工程化DNA聚合酶可用于诊断应用,例如用于检测靶核酸(包括RNA和DNA)的存在。在一些实施方案中,用于检测靶DNA存在的方法包括在存在底物的情况下,在适于DNA聚合酶介导产生与靶DNA的全部或一部分(即整体或部分)互补的DNA的的条件下,使怀疑含有靶DNA的样品与本文描述的工程化DNA聚合酶反应,并检测互补DNA的存在。在一些实施方案中,靶RNA可以通过使用逆转录酶以产生与靶RNA互补的对应靶DNA来检测。
在一些实施方案中,样品可以是怀疑含有靶核酸的任何材料或物质。在一些实施方案中,样品是生物样品,诸如活检和尸检样品、用于组织学目的采集的冷冻切片、血液、血浆、血清、痰、粪便、眼泪、黏液、毛发、皮肤等。在一些实施方案中,生物样品是细胞或病毒,诸如来自细菌培养物、病毒培养物或细胞培养物。在一些实施方案中,样品是环境样品,诸如来自水、污水、表面、空气、滤液等。
在用于检测靶DNA的一些实施方案中,互补DNA产物的检测可以通过本领域已知的方法实现。在一些实施方案中,互补DNA通过扩增互补DNA来检测,诸如通过聚合酶链式反应(PCR)或等温扩增。在一些实施方案中,合适的等温扩增是通过环介导等温扩增(LAMP)。在用于检测靶RNA存在的一些实施方案中,与逆转录酶的反应与用DNA聚合酶的扩增反应单独进行。在其中扩增是通过PCR的一些实施方案中,逆转录酶反应和PCR是一步RT-PCR(即,在单个反应中同时进行)。在其中扩增是通过PCR的一些实施方案中,逆转录酶反应和PCR是两步RT-PCR(即,单独进行)。
在一些实施方案中,工程化DNA聚合酶用于对核酸进行测序。用于DNA测序的各种方法,特别是NGS测序方法,是本领域熟知的。
在另外的方面,本公开内容提供了包含至少一种本文公开的工程化DNA聚合酶的试剂盒。在一些实施方案中,试剂盒还包含缓冲液、核苷酸底物和/或寡核苷酸引物中的一种或更多种。在一些实施方案中,试剂盒可以包含多个(例如两个或更多个)寡核苷酸引物,例如针对靶核酸的不同部分。在一些实施方案中,试剂盒还包含模板DNA或靶DNA。在一些实施方案中,试剂盒包含第二DNA聚合酶,诸如Taq或Pfu DNA聚合酶或逆转录酶,例如用于偶联RT-PCR反应。
实施例
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。
在下文的实验公开内容中,应用了以下缩写:ppm(百万分率);M(摩尔/升);mM(毫摩尔/升);uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和1(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);Ω(欧姆);μf(微法拉);U(单位);MW(分子量);rpm(转/分);rcf(相对离心力);psi和PSI(磅/平方英寸);℃(摄氏度);RT和rt(室温);NGS(下一代测序);ds(双链);ss(单链);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);大肠杆菌W3110(常用实验室大肠杆菌菌株,可从Coli Genetic Stock Center[CGSC],New Haven,CT获得);HTP(高通量);HPLC(高压液相色谱法);MCYP(microcyp);ddH2O(双蒸水);PBS(磷酸盐缓冲盐水);BSA(牛血清白蛋白);DTT(二硫苏糖醇);CAM(氯霉素);CAT(氯霉素乙酰转移酶);IPTG(异丙基β-D-1-硫代半乳糖苷);GFP(绿色荧光蛋白);eGFP(增强型GFP);DsRed(从Discosoma sp.分离的红色荧光蛋白);FIOPC(相对于阳性对照的倍数改进);LB(Luria-Bertani);SPRI(固相可逆固定);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);PerkinElmer(Perkin Elmer,Inc,Waltham,MA);Harvard Apparatus(Harvard Apparatus,Holliston,MA);Millipore(Millipore,Corp.,Billerica MA);Covaris(Covaris,Inc.,Woburn,MA);MagBio(MagBio Genomics,Inc.,Gaithersburg,MD);Qiagen(Qiagen Inc.,Germantown,MD);Illumina(Illumina,Inc.,San Diego,CA);BD Biosciences(BDBiosciences,San Jose,CA);Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Kuhner(Adolf Kuhner,AG,Basel,Switzerland);Zymo(Zymo Research,Irvine,CA);Agilent(Agilent Technologies,Inc.,Santa Clara,CA);ThermoScientific(Thermo Fisher Scientific,Waltham,MA的一部分);GE Healthcare(GEHealthcare Bio-Sciences,Piscataway,NJ);和Bio-Rad(Bio-Rad Laboratories,Hercules,CA)。
实施例1:含有重组聚合酶基因的大肠杆菌表达宿主
用于产生本公开内容变体的初始聚合酶是SEQ ID NO:2,将其克隆到表达载体pCK110900(参见,美国专利申请公布第2006/0195947号的图3)中,可操作地连接至处于lacl阻遏物的控制下的lac启动子。所述表达载体还包含P15a复制起点和氯霉素抗性基因。使用本领域已知的标准方法将所得质粒转化到大肠杆菌W3110中。通过使细胞经历氯霉素选择来分离转化体,如本领域已知的(参见例如美国专利第8,383,346号和WO2010/144103)。
实施例2:HTP含有聚合酶的湿细胞沉淀物的制备
将来自单克隆菌落的含有重组聚合酶编码基因的大肠杆菌细胞接种到96孔浅孔微量滴定板的孔中的含有1%葡萄糖和30μg/mL氯霉素(CAM)的180μL LB中。将板用O2可透过密封件密封,并使培养物在30℃、200rpm和85%湿度生长过夜。然后,将10μL每一种细胞培养物转移到含有390mL TB和30μg/mL CAM的96孔深孔板的孔中。用O2可透过的密封件密封深孔板,并且在30℃、250rpm和85%湿度培养,直至达到OD6000.6-0.8。然后将细胞培养物用达到1mM的最终浓度的IPTG诱导,并且在与最初使用的相同条件下培养过夜。然后使用4,000rpm离心10分钟将细胞沉淀。弃去上清液,并在裂解前将沉淀冷冻在-80℃。
实施例3:HTP含有聚合酶的细胞裂解物的制备
首先,将含有50mM pH 7.5的Tris-HCl和20mM氯化钠的300μl缓冲液添加至每个孔中的如实施例2描述产生的细胞糊状物中。将细胞在台式震荡器上摇动以重悬。将重悬的细胞转移至96孔硬壳板,并在热循环仪中在80℃裂解60min。然后将板在4,000rpm和40℃离心30min。将澄清上清液用于生物催化反应,以确定其活性、DNA灵敏度和热稳定性水平。
实施例4:相比于SEQ ID NO:2在PCR扩增活性方面的改进
在使用pCK载体中的β-内酰胺片段(PCK-β内酰胺酶),用引物SeqF1(CCAATACGCAAACCGCCTC)(SEQ ID NO:771)和SeqR1(CAACGGTGGTATATCCAGTGA)(SEQ ID NO:772)在PCR测定中筛选野生型酶聚合酶活性后,选择SEQ ID NO:2作为亲本酶。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例2中描述以HTP产生每种基因编码的多肽,并且如实施例3中描述产生可溶性裂解物。每种变体在20μL的反应中进行筛选,该反应包含5ng/uL PCK-β内酰胺酶、500nM SeqF1和SeqR1引物、0.2mM dNTP、Pfu缓冲液(20mM Tris-HCl(在25℃、pH 8.8)、10mM(NH4)2SO4、10mM KCl、0.1%(v/v)Triton X-100、0.1mg/mL BSA.)、5体积%HTP裂解物。在Eppendorf Master Nexus热循环仪中进行PCR循环(95℃2min、95℃30秒、55℃30秒、68℃1min,持续30个循环)。
相对于SEQ ID NO:2的活性(相对于亲本的活性倍数改进FIOP)计算为相对于SEQID NO:2的产物浓度(ng/ul)并在表4.1中示出。
实施例5:相比于SEQ ID NO:8在qPCR酶活性方面的改进
选择DNA聚合酶变体SEQ ID NO:8作为用于这一轮定向演化的亲本酶。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例2中描述以HTP产生每种基因编码的多肽,并且如实施例3中描述产生可溶性裂解物。每种变体在20μL的反应中进行筛选,该反应包含含有核衣壳基因的1ng/uL SARS-CoV2DNA片段(IDT目录号>CAT_10006625_2019-nCoV_N_阳性对照)、500nM N1引物、125nM探针(CDC EUA assay,目录号2019-nCoVEUA-01)、0.2mM dNTP、RT缓冲液(10mM Tris-HCl、50mM KCl、1.5mMMgCl2)、12.5体积%HTP裂解物,并在CFX384触摸实时PCR检测系统(BioRad)中进行qPCR循环(95℃2min、95℃3秒、55℃30秒,持续45个循环)。
相对于SEQ ID NO:8的参考多肽增加的活性(活性FIOP)计算为由变体形成的Ct值(临界阈值)的倒数相比于SEQ ID NO:8的Ct值,并在表5.1中示出。
实施例6:相比于SEQ ID NO:332在DNA活性和稳定性方面的改进
选择DNA聚合酶变体SEQ ID NO:332作为用于这一轮定向演化的亲本酶。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例2中描述以HTP产生每种基因编码的多肽,并且如实施例3中描述产生可溶性裂解物。每种变体在20μL的反应中进行筛选,该反应包含含有核衣壳基因转录物的1ng/uL SARS-CoV2DNA片段(IDT目录号>CAT_10006625_2019-nCoV_N_阳性对照)、500nM N1引物、125nM探针(CDCEUA assay,目录号2019-nCoVEUA-01)、0.2mM dNTP、RT缓冲液(10mM Tris-HCl、50mM KCl、1.5mM MgCl2)、6体积%HTP裂解物。通过在CFX384触摸实时PCR检测系统(BioRad)中在62.5℃孵育30min,随后循环(95℃2min、95℃3秒、55℃30秒、持续45个循环)来进行qPCR。
相对于SEQ ID NO:332的酶活性(活性FIOP)计算为由变体形成的Ct值(临界阈值)的倒数相比于SEQ ID NO:332的Ct值的倒数,并在表6.1中示出。
实施例7:相比于SEQ ID NO:462在稳定性和活性方面的改进
选择DNA聚合酶变体SEQ ID NO:462作为用于这一轮定向演化的亲本酶。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例2中描述以HTP产生每种基因编码的多肽,并且如实施例3中描述产生可溶性裂解物。每种变体在20μL的反应中进行筛选,该反应包含含有核衣壳基因转录物的0.2ng/uL SARS-CoV2DNA片段(IDT目录号>CAT_10006625_2019-nCoV_N_阳性对照)、500nM N1引物、125nM探针(CDCEUAassay,目录号2019-nCoVEUA-01)、0.2mM dNTP、RT缓冲液(10mM Tris-HCl、50mM KCl、1.5mM MgCl2)、6体积%HTP裂解物,并通过以下进行qPCR:在CFX384触摸实时PCR检测系统(BioRad)中,通过在62.5℃孵育30min,随后qPCR循环(95℃2min、95℃3秒、55℃30秒,持续45个循环)。
相对于SEQ ID NO:462的聚合酶稳定性及活性(进行性FIOP)计算为由变体形成的Ct值(临界阈值)的倒数相比于SEQ ID NO:462的Ct值的倒数,并在表7.1中示出。
实施例8:相比于SEQ ID NO:606在活性和灵敏度方面的改进
选择SEQ ID NO:606作为本轮定向演化的亲本酶。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例2中描述以HTP产生每种基因编码的多肽,并且如实施例3中描述产生可溶性裂解物。每种变体在20μL的反应中进行筛选,该反应包含含有核衣壳基因的0.125ng/uL SARS-CoV2DNA片段(IDT目录号>CAT_10006625_2019-nCoV_N_阳性对照)、500nM N1引物、125nM探针(CDC EUA assay,目录号2019-nCoVEUA-01)、0.2mM dNTP、RT缓冲液(10mM Tris-HCl、50mM KCl、1.5mM MgCl2)、1.5体积%HTP裂解物,并通过以下进行qPCR:在CFX384触摸实时PCR检测系统(BioRad)中,通过在62.5℃孵育30min,随后qPCR循环(95℃2min、95℃3秒、55℃30秒,持续45个循环)。
相对于SEQ ID NO:606的聚合酶稳定性及活性(进行性FIOP)计算为由变体形成的Ct值(临界阈值)的倒数相比于SEQ ID NO:606的Ct值的倒数,并在表8.1中示出。
虽然已经参考特定实施方案描述了本发明,但可以进行各种改变并且可以替换等同物,以适应特定的情况、材料、物质的组成、方法、一个方法步骤或多于一个方法步骤,从而实现本发明的益处,而不偏离所要求保护的范围。
出于所有目的,本公开内容中引用的每一个出版物和专利文件都通过引用并入本文,如同每一个这样的出版物或文件都被具体和单独地指示通过引用并入本文。对出版物和专利文件的引用不意图为指示任何这样的文件是相关的现有技术,也不构成对其内容或日期的承认。

Claims (71)

1.一种工程化DNA聚合酶或其功能片段,包含与对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:2、8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2、8、332、462或606的残基12至850的参考序列或相对于对应于SEQ IDNO:2、8、332、462或606的参考序列包含一个或更多个取代。
2.根据权利要求1所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:2的残基12至850的参考序列或与对应于SEQ ID NO:2的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
3.根据权利要求1所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:2的残基12至850的参考序列或相对于对应于SEQ ID NO:2的参考序列包含一个或更多个取代。
4.根据权利要求2或3所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
5.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列包含以下至少一个取代:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q/S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A或849T或其组合,其中所述氨基酸位置是相对于SEQ ID NO:2。
6.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、503、521、748或750或其组合,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
7.根据权利要求6所述的工程化DNA聚合酶,其中所述多肽序列包含以下至少一个取代:40A、85E、102S、132Y、157G、177T、262L、263A、521G、748Y或750S或其组合,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
8.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:213/503/508/584/748、40/132/748、40/132/157/262/263/748、132、40/132/503/748、40/132/157/503/562、40/132/213/748/814、132/157/562/584、132/584/748、40/132/231/684/748、40/132、40/41/132/562/684/748、41/213/231/503/650/674/748、132/231/503/748、40/132/157/503、503/748/814、40/132/231/503/674/748、40/88/132/503/684/748、132/157/213/674/748/814、157/263/748、40/748、41/157/231/262/748/814、40/213/503/562/584/748、523/524、40/132/503/514/650/674、40/132/157/213/231、41/213/520/814、40/41/157/231/503、40/157/503、40/132/562/748、132/748、40/41/132/562/748、88/213/503/584/684/748、57/58/523/616/677、40/213/231/503/514/562/748、132/562、213/503/650、40/41/88/231/748/814、41/213/262/562、41/88/231/748、213/263/748、40/157/213、157/520、40/132/263/503/674/814、40/41、524/665/756、58/186/217/523/524/677、40/41/748、132/514、520、41/213/503/562、231/503/748/772、503/562、73/232/514/584/814、58/507/616、132/262/520/562/684/748、88/562/814、41/88/157/814、88/157/213/674/684、57/58/523/779、40/132/157/514/520/684、40/41/213/684/772、40/41/231/503/814、88/213/503/584/814、40/41/132/562/584、41/88/213/231/503/650/748、40/503、40/132/213/231/520/562/650/814、40/41/132/231/262/503/562/584/748/814、57/58/264/265/524/688、88/132/157/262/263/520/562、88/132/157/262/503/514/562/650、40/584/674/748、40/41/132/263/503、584/748、40/213/674、40/41/88T/132/503/562/584/748、88/213/514/562/748/814、263/520/814、40/41/88/157,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
9.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773或803,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
10.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764、542/762/764,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
11.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20C/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
12.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495或440,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
13.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/40/132/157/262/263/407/748、40/132/157/262/263/328/748、40/132/157/262/263/401/748、40/132/157/262/263/402/748、40/132/157/262/263/403/748、40/132/157/262/263/404/748、40/132/157/262/263/406/748、40/132/157/262/263/407/748、40/132/157/262/263/503/748、40/132/157/262/263/504/748、40/132/157/262/263/506/748、40/132/157/262/263/521/748、40/132/157/262/263/523/748、40/132/157/262/263/524/748、40/132/157/262/263/525/748、40/132/157/262/263/526/748、40/132/157/262/263/527/748、40/132/157/262/263/528/748、40/132/157/262/263/529/748、40/132/157/262/263/530/748、40/132/157/262/263/531/748、40/132/157/262/263/533/748、40/132/157/262/263/534/748、40/132/157/262/263/535/748、40/132/157/262/263/536/748、40/132/157/262/263/537/748、40/132/157/262/263/538/748、40/132/157/262/263/539/748、40/132/157/262/263/540/748、40/132/157/262/263/542/748、40/132/157/262/263/54G/748、40/132/157/262/263/553/748、40/132/157/262/263/554/748、40/132/157/262/263/555/748、40/132/157/262/263/556/748、40/132/157/262/263/557/748、40/132/157/262/263/558/748、40/132/157/262/263/559/748、40/132/157/262/263/560/748、40/132/157/262/263/563/748、40/132/157/262/263/581/748、40/132/157/262/263/582/748、40/132/157/262/263/585/748、40/132/157/262/263/586/748、40/132/157/262/263/587/748、40/132/157/262/263/589/748、40/132/157/262/263/592/748、40/132/157/262/263/593/748、40/132/157/262/263/594/748、40/132/157/262/263/595/748、40/132/157/262/263/596/748、40/132/157/262/263/597/748、40/132/157/262/263/598/748、40/132/157/262/263/599/748、40/132/157/262/263/601/748、40/132/157/262/263/602/748、40/132/157/262/263/603/748、40/132/157/262/263/605/748、40/132/157/262/263/607/748、40/132/157/262/263/696/748、40/132/157/262/263/747/748、40/132/157/262/263/748、40/132/157/262/263/748/749、40/132/157/262/263/748/751、40/132/157/262/263/748/762、40/132/157/262/263/748/763、40/132/157/262/263/748/764、40/132/157/262/263/748/766、40/132/157/262/263/748/773、40/132/157/262/263/748/803、40/132/157/605/262/263/748、40/132/157/262/263/403/521/748或40/132/157/262/263/403/553/748,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
14.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/132/157/262/263/403/404/521/524/542/555/748/762/764、40/132/157/262/263/404/521/524/542/589/748/762/764、40/132/157/262/263/521/524/542/581/748/762/764、40/132/157/262/263/521/542/748/762/764、40/132/157/262/263/404/521/542/748/762、40/132/157/262/263/521/748/750/849、40/132/157/262/263/521/524/581/748、16/40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/820、40/132/157/262/263/521/748/793、40/132/157/262/263/521/748/764、40/132/157/262/263/521/748/755、40/132/157/262/263/521/748/753、40/132/157/262/263/521/735/748、40/132/157/262/263/521/748/728、40/132/157/262/263/521/704/748、40/132/157/262/263/521/675/748、40/132/157/262/263/521/671/748、40/132/157/262/263/521/570/748、40/132/157/262/263/495/521/748、40/132/157/262/263/480/521/748、40/132/157/262/263/476/521/748、40/132/157/262/263/384/521/748、40/132/157/262/263/322/521/748、40/132/157/262/263/321/521/748、40/132/157/243/262/263/521/748、15/40/132/157/262/263/521/748、40/102/132/157/262/263/521/748、40/91/132/157/262/263/521/748、40/87/132/157/262/263/521/748、40/85/132/157/262/263/521/748、20/40/132/157/262/263/521/748、21/40/132/157/262/263/521/748或40/52/132/157/262/263/521/748,其中所述氨基酸位置是相对于SEQ IDNO:2的参考序列。
15.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/102/132/157/262/263/476/521/748、40/102/132/157/262/263/495/521/748、40/102/132/157/262/263/521/748/750、21/40/52/102/132/157/262/263/521/748、21/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/322/521/748、20/40/102/132/157/262/263/476/521/748、40/85/102/132/157/262/263/521/748/750、40/102/132/157/262/263/386/495/521/748、40/102/132/157/262/263/476/495/521/748、40/102/132/157/262/263/322/521/748/820、40/102/132/157/262/263/386/521/748/849、20/40/52/85/102/132/157/262/263/521/748、40/102/132/157/262/263/476/521/748/750、40/102/132/157/262/263/495/521/748/820、40/102/132/157/262/263/521/748/750/820、21/40/52/102/132/157/262/263/521/572/748、20/40/102/132/157/262/263/322/386/521/748、21/40/102/132/157/262/263/322/495/521/748、40/85/102/132/157/262/263/322/476/521/748、20/40/102/132/157/262/263/386/476/521/748、21/40/102/132/157/262/263/322/521/748/750、21/40/102/132/157/262/263/495/521/748/820、20/40/102/132/157/262/263/495/521/748/820、40/85/102/132/157/262/263/476/521/748/849、21/40/102/132/157/262/263/521/748/820/849、40/102/132/157/262/263/322/386/495/521/748、40/102/132/157/262/263/273/322/521/748/849、40/102/132/157/262/263/476/495/521/748/750、40/102/132/157/262/263/322/521/748/750/820、40/102/132/157/262/263/386/521/748/750/849、21/40/85/102/132/157/262/263/322/521/748/820、20/40/85/102/132/157/262/263/476/521/748/750、20/40/85/102/132/157/262/263/495/521/748/849、20/40/85/102/132/157/262/263/521/566/748/820、40/52/102/132/157/262/263/322/498/521/748/750、21/40/102/132/157/262/263/322/386/521/748/820、40/52/102/132/157/262/263/386/495/521/748/820、20/40/102/132/157/262/263/322/476/521/748/820、40/85/102/132/157/262/263/386/495/521/748/750、40/85/102/132/157/262/263/476/495/521/748/820、40/85/102/132/157/262/263/322/521/748/750/820、40/85/102/132/157/262/263/322/386/476/495/521/748、21/40/102/132/157/262/263/322/495/521/748/750/820、20/21/40/85/102/132/157/262/263/322/476/495/521/748、20/40/102/132/157/262/263/299/322/386/476/495/521/748、40/52/102/132/157/262/263/476/495/521/566/748/750/849、20/40/85/102/132/157/262/200/263/322/476/495/521/748/750或21/40/85/102/132/157/262/263/322/386/495/521/748/820/849,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
16.根据权利要求2-4中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:40/85/102/132/157/262/263/299/386/521/566/748/750/820、40/85/102/132/157/262/263/476/521/748/750/820/849、21/40/85/102/132/157/262/263/322/476/495/521/748/750/820、40/85/102/132/157/262/177/263/521/748/750、21/40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/476/521/748/750/820、20/40/52/85/102/132/157/262/263/299/521/748/750、52/40/85/102/132/157/262/263/299/521/748/750、40/85/102/132/157/262/263/322/521/748/750/820、20/40/85/102/132/157/262/263/521/748/750/820、20/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/476/495/521/748/750/820、40/85/102/132/157/262/263/386/476/495/521/748/750、20/21/40/85/102/132/157/262/263/299/322/386/521/748/750、40/85/102/132/157/262/263/322/386/495/521/748/750、21/40/85/102/132/157/262/263/299/322/476/495/521/748/750/820、21/40/85/102/132/157/262/263/299/386/521/748/750/820、40/85/102/132/157/262/263/299/476/521/748/750/820、20/21/40/85/102/132/157/262/263/521/748/750、21/40/102/132/157/262/263/521/748、40/85/102/132/157/262/263/521/705/748/750、21/40/85/102/132/157/262/263/386/476/521/748/750/820、40/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/299/322/521/748/750、20/40/85/102/132/157/262/263/322/386/521/748/750/820、40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/476/521/748/750、40/85/102/109/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/495/521/748/750、40/85/102/132/157/262/263/491/521/748/750、40/52/85/102/132/157/262/263/521/748/750/820、21/40/85/102/132/157/262/263/386/521/748/750/820、20/21/40/85/102/132/157/262/263/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/566/748/750/820、20/21/40/85/102/132/157/262/263/299/495/521/748/750、40/85/102/132/157/262/263/521/748/750/756、40/85/102/132/157/262/263/386/521/748/750/820、40/85/102/132/157/262/263/495/521/748/750、40/85/102/132/157/262/263/511/521/748/750、21/40/52/85/102/132/157/262/263/242/386/495/521/748/750/820、40/85/102/132/157/262/263/299/476/495/521/748/750、40/85/102/132/157/262/263/521/706/748/750、21/40/85/102/132/157/262/263/299/386/476/495/521/748/750、21/40/85/102/132/157/262/263/299/322/495/521/748/750、21/40/85/102/132/157/262/263/476/521/748/750/849、40/85/102/132/157/262/263/299/322/476/521/748/750/820、21/40/52/85/102/132/157/262/263/299/322/521/748/750/820、20/21/40/85/102/132/157/262/263/521/566/748/750、20/40/52//85/102/132/157/262/263/521/748/750、40/85/102/132/157/262/263/322/386/495/521/566/748/750/820、21/40/85/102/132/157/262/263/299/521/748/750、21/40/85/102/132/157/262/263/299/386/521/748/750、40/85/102/132/157/262/263/386/521/748/750/849、40/52/85/102/132/157/262/263/476/521/748/750、40/52/85/102/132/157/262/263/299/322/386/495/521/748/750或40/85/102/132/157/262/263/440/521/748/750,其中所述氨基酸位置是相对于SEQ ID NO:2的参考序列。
17.根据权利要求1所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
18.根据权利要求1所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或与对应于SEQ ID NO:8、332、462或606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8、332、462或606的残基12至850的参考序列或相对于对应于SEQ IDNO:8、332、462或606的参考序列包含一个或更多个取代。
19.根据权利要求18所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代:15、16、20、21、22、40、41、52、57、58、73、85、87、88、91、102、109、132、157、177、186、200、213、217、231、232、242、243、262、263、264、265、273、299、321、322、328、384、386、401、402、403、404、406、407、440、476、480、491、495、498、503、504、506、507、508、511、514、520、521、523、524、525、526、527、528、529、530、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、562、563、566、570、572、581、582、584、585、586、587、589、592、593、594、595、596、597、599、601、602、603、605、607、616、665、671、674、675、677、684、688、696、704、705、706、728、735、747、748、749、750、751、753、755、756、762、763、764、766、772、773、779、793、803、814、820或849或其组合,其中所述氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
20.根据权利要求18-19中任一项所述的工程化DNA聚合酶,其中所述多肽序列包含以下至少一个氨基酸残基:15A/G/K/N、16R、20A/C、21K/Q/S、22K、40A、41F、52R、57T、58N、73A、85E/P/R/S、87N、88T、91K、102V/M/S、109P、132Y、157G、177T、186E、200V、213P、217E、231E、232C、242Q、243L/S、262L、263A、264T、265I、273M、299N、321G、322N/S、328I、384Y、386V、401A/G/I、402G/R、403L/R、404S/T、406K/Q、407R/W、440G、476I/N、480E/V/W、491G、495E/M/S、498D、503I/V、504M、506P、507K、508H、511M、514F、520P、521G/W/Y、523A/K/V、524G/K/Q、525L/V、526T、527V/W、528A/Q/R/W、529S、530G/P/R/W、533L/P/Q/V、534H/W、535K、536R、537G/L/W、538A、539L/R、540H/V、542G/M/T/W、553F/K/N/R、554E、555H/K/M/W、556F/M/P/W、557G/H、558R/S/V/Q、559D/G/P、560G/M、562S、563L、566A、570R、572I、581A、582F、584N、585KR、586M、587Q/S、589G/L/R/S/W、592G/T/V、593N、594C/Q/T/V/W、595A/P/R、596L/R/W、597E、599G/S/T、601M/P、602V、603G/V/W、605E/A、607N、616A、665V、671E/R、674T、675L、677M、684V、688I、696H/V、704P、705W、706E、728K、735G/L、747T、748Y、749L/R/T、750S/P、751H、753K/V、755P、756N/T、762M/Q/V、763G/Y、764A/I/V、766Y、772I、773R、779I、793G、803C/R、814E、820A或849T或其组合,其中所述氨基酸位置是相对于SEQ ID NO:8、332、462或606的参考序列。
21.根据权利要求18-20中任一项所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代:40、85、102、132、157、177、262、263、521、748或750或其组合。
22.根据权利要求18-21中任一项所述的工程化DNA聚合酶,其中所述多肽序列包含以下至少一个氨基酸残基:40A、85E、102S、132Y、157G、177T、262L、263A、521G、748Y或750S或其组合。
23.根据权利要求18所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:8的残基12至850的参考序列或与对应于SEQ ID NO:8的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:8的残基12至850的参考序列或相对于对应于SEQ ID NO:8的参考序列包含一个或更多个取代。
24.根据权利要求18或23所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:22/407、328、401、402、403、404、406、407、503、504、506、521、523、524、525、526、527、528、529、530、531、533、534、535、536、537、538、539、540、542、553、554、555、556、557、558、559、560、563、581、582、585、586、587、589、592、592、592、593、594、595、596、597、598、599、601、602、603、605、607、696、747、749、751、762、763、764、766、773、803、403/553或其组合,其中所述氨基酸位置是相对于SEQ ID NO:8的参考序列。
25.根据权利要求18所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:332的残基12至850的参考序列或与对应于SEQ ID NO:332的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:332的残基12至850的参考序列或相对于对应于SEQ ID NO:332的参考序列包含一个或更多个取代。
26.根据权利要求18或25所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:15、20、21、52、85、87、91、102、243、321、322、384、404、476、480、480、495、542、570、671、675、704、728、735、753、755、762、764、793、820、16/735、750/849、524/581、403/404/524/542/555/762/764、404/524/542/589/762/764、524/542/581/762/764或542/762/764,其中所述氨基酸位置是相对于SEQ ID NO:332的参考序列。
27.根据权利要求18所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:462的残基12至850的参考序列或与对应于SEQ ID NO:462的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:462的残基12至850的参考序列或相对于对应于SEQ ID NO:462的参考序列包含一个或更多个取代。
28.根据权利要求18或27所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:750/820、21/52、20/21/85/322/476/495、20/85/200/322/476/495/750、476/750、20/476、20/322/386、85/322/476、52/322/498/750、20/322/476/820、85/476/495/820、21/85/322/820、20/299/322/386/476/495/820、20/322、21/820/849、476、322/820、21/322/386/820、322/386/495、85/386/495/750、20/85/476/750、20/386/476、85/322/386/476/495、20/495/820、750、21/322/495、52/386/495/820、21/322、85/322/750/820、20/52/85、21/52/572、20/85/495/849、85/750、21/495/820、273/322/849、495、322/750/820、52/476/495/566/750/849、386/495、495/820、21/322/495/750/820、21/85/322/386/495/820/849、476/495/750、386/849、476/495、85/476/849、21/322/750、20/85/566/820或386/750/849,其中所述氨基酸位置是相对于SEQ ID NO:462的参考序列。
29.根据权利要求18所述的工程化DNA聚合酶,包含与对应于SEQ ID NO:606的残基12至850的参考序列或与对应于SEQ ID NO:606的参考序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述多肽序列相对于对应于SEQ ID NO:606的残基12至850的参考序列或相对于对应于SEQ ID NO:606的参考序列包含一个或更多个取代。
30.根据权利要求18或29所述的工程化DNA聚合酶,其中所述多肽序列在以下氨基酸位置处包含至少一个取代或取代集:299/386/566/820、476/820/849、21/322/476/495/820、177、21/495、476/820、20/52/299、52/299、322/820、20/820、20/299/386/476、386/476/820、476/495/820、386/476/495、20/21/299/322/386、322/386/495、21/299/322/476/495/820、21/299/386/820、299/476/820、20/21、21/85/102/750、705、21/386/476/820、820、21/299/322、20/21/322/386/820、299、21/299/386/476、109、322/495、491、52/820、21/386/820、20/21/495、21/299/322/495/566/820、20/21/299/495、756、386/820、495、511、21/52/242/386/495/820、299/476/495、706、21/299/386/476/495、21/299/322/495、21/476/849、299/322/476/820、21/52/299/322/820、20/21/566、20/52、322/386/495/566/820、21/299、21/299/386、386/849、52/476、52/299/322/386/495、440或其组合,其中所述氨基酸位置是相对于SEQ ID NO:606的参考序列。
31.根据权利要求1所述的工程化DNA聚合酶,其中所述DNA聚合酶包含含有表4.1、表5.1、表6.1、表7.1和表8.1中提供的取代或取代集的多肽序列,其中所述取代或取代集是相对于SEQ ID NO:2、8、332、462或606的参考序列。
32.根据权利要求1所述的工程化DNA聚合酶,其中所述工程化DNA聚合酶包含与包含表4.1、表5.1、表6.1、表7.1和表8.1中列出的工程化DNA聚合酶变体的残基12至850的序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
33.根据权利要求1所述的工程化DNA聚合酶,其中所述DNA聚合酶包含与包含表4.1、表5.1、表6.1、表7.1和表8.1中列出的工程化DNA聚合酶变体的序列具有至少75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列。
34.根据权利要求1所述的工程化DNA聚合酶,其中所述DNA聚合酶包含含有以下的残基12至850的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768或770,其中所述多肽序列任选地具有1、2、3、4、5、6、7、8、9或多达10个取代。
35.根据权利要求1所述的工程化DNA聚合酶,其中所述DNA聚合酶包含含有以下的多肽序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486、488、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530、532、534、536、538、540、542、544、546、548、550、552、554、556、558、560、565、564、566、568、570、572、574、576、578、580、582、584、586、588、590、592、594、596、598、600、602、604、606、608、610、612、614、616、618、620、622、624、626、628、630、632、634、636、638、640、642、644、646、648、650、652、654、656、658、660、662、664、666、668、670、672、674、676、678、680、682、684、686、688、690、692、694、696、698、700、700、702、704、706、708、710、712、714、716、718、720、722、724、726、728、730、732、734、736、738、740、742、744、746、748、750、752、754、756、758、760、762、764、766、768或770,其中所述多肽任选地在所述多肽序列中具有1、2、3、4、5、6、7、8、9或多达10个取代。
36.根据权利要求34-35中任一项所述的工程化DNA聚合酶,其中所述多肽在所述多肽序列中具有1、2、3、4、多达5个取代。
37.根据权利要求34-36中任一项所述的工程化DNA聚合酶,其中所述取代包括保守取代。
38.根据权利要求1所述的工程化DNA聚合酶,其中所述多肽序列包含含有SEQ ID NO:8、332、462或606的残基12至850的序列或包含SEQ ID NO:8、332、462或606的序列。
39.根据权利要求1-38中任一项所述的工程化DNA聚合酶,其中所述工程化DNA聚合酶是融合蛋白。
40.根据权利要求1-39中任一项所述的工程化DNA聚合酶,其中所述工程化DNA聚合酶具有DNA聚合酶活性。
41.根据权利要求1-40中任一项所述的工程化DNA聚合酶,与参考DNA聚合酶相比具有至少一种改进的特性。
42.根据权利要求41所述的工程化DNA聚合酶,与所述参考DNA聚合酶相比,在PCR反应中,所述工程化DNA聚合酶具有选自增加的活性、增加的稳定性、增加的热稳定性、增加的进行性、增加的保真度和增加的产物产率的至少一种改进的特性。
43.根据权利要求41所述的工程化DNA聚合酶,其中所述参考DNA聚合酶具有对应于SEQID NO:8、332、462或606的残基12至850的序列或对应于SEQ ID NO:2、8、332、462或606的序列。
44.根据权利要求1-43中任一项所述的工程化DNA聚合酶,其中所述DNA聚合酶是纯化的。
45.一种重组多核苷酸,所述重组多核苷酸编码权利要求1-43中任一项所述的工程化DNA聚合酶。
46.根据权利要求45的重组多核苷酸,包含与对应于SEQ ID NO:1、7、331、461或605的核苷酸残基34至2550的参考多核苷酸序列或与对应于SEQ ID NO:1、7、331、461或605的参考多核苷酸序列具有至少75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列,其中所述重组多核苷酸编码工程化DNA聚合酶或其功能片段。
47.根据权利要求45-46中任一项所述的重组多核苷酸,其中所述多核苷酸序列是密码子优化的。
48.根据权利要求46所述的重组多核苷酸,其中所述多核苷酸序列包含SEQ ID NO:7、331、461或605的核苷酸残基34至2550,或者包含SEQ ID NO:7、331、461或605。
49.根据权利要求45所述的重组多核苷酸,其中所述多核苷酸序列包含以下的核苷酸残基34至2550:SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769。
50.根据权利要求45所述的重组多核苷酸,其中所述多核苷酸序列包含以下:SEQ IDNO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485、487、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529、531、533、535、537、539、541、543、545、547、549、551、553、555、557、559、561、563、565、567、569、571、573、575、577、579、581、583、585、587、589、591、593、595、597、599、601、603、605、607、609、611、613、615、617、619、621、623、625、627、629、631、633、635、637、639、641、643、645、647、649、651、656、655、657、659、661、663、665、677、679、681、683、685、687、689、691、693、695、697、699、701、703、705、707、709、711、713、715、717、719、721、723、725、727、729、731、733、735、737、739、741、743、745、747、749、751、753、755、757、759、761、763、765、767或769。
51.一种表达载体,所述表达载体包含至少一种权利要求45-50中任一项所述的多核苷酸。
52.根据权利要求51所述的表达载体,其中所述多核苷酸可操作地连接至控制序列。
53.根据权利要求51或52所述的表达载体,其中所述控制序列包括启动子。
54.一种宿主细胞,所述宿主细胞用权利要求45-50中任一项所述的重组多核苷酸或权利要求51-53中任一项所述的表达载体转化。
55.一种在宿主细胞中产生工程化DNA聚合酶多肽的方法,所述方法包括将权利要求54所述的宿主细胞在产生至少一种工程化DNA聚合酶的合适的培养条件下培养。
56.根据权利要求55所述的方法,所述方法还包括从培养物和/或宿主细胞中回收至少一种工程化DNA聚合酶。
57.根据权利要求55或56所述的方法,所述方法还包括纯化所述至少一种工程化DNA聚合酶的步骤。
58.一种组合物,所述组合物包含至少一种权利要求1-44中任一项所述的工程化DNA聚合酶。
59.根据权利要求58所述的组合物,所述组合物还包含缓冲液、核苷酸底物和/或寡核苷酸引物底物中的一种或更多种。
60.一种制备靶DNA的互补DNA的方法,所述方法包括在存在底物的情况下,在适于产生与靶DNA的全部或一部分的互补DNA的条件下,使所述靶DNA与权利要求1-44中任一项所述的工程化DNA聚合酶接触。
61.一种用于检测靶DNA存在的方法,所述方法包括在存在底物的情况下,在适于DNA聚合酶介导产生与所述靶DNA的全部或一部分互补的DNA的条件下,使怀疑含有所述靶DNA的样品与权利要求1-44中任一项所述的工程化DNA聚合酶接触,并检测所述互补DNA的存在。
62.根据权利要求61所述的方法,其中所述互补DNA通过扩增所述互补DNA来检测。
63.根据权利要求62所述的方法,其中所述扩增是通过聚合酶链式反应(PCR)或等温扩增。
64.根据权利要求63所述的方法,其中所述等温扩增是通过环介导等温扩增(LAMP)。
65.一种扩增靶DNA的方法,所述方法包括在存在底物的情况下,在适于扩增所述靶DNA的条件下,使所述靶DNA与权利要求1-44中任一项所述的DNA聚合酶接触。
66.根据权利要求65所述的方法,其中所述条件用于聚合酶链式反应。
67.根据权利要求65所述的方法,其中所述条件用于LAMP。
68.一种对靶DNA进行测序的方法,所述方法包括在存在适于测序的底物的情况下,在适于DNA聚合酶介导与所述靶DNA的互补DNA延伸的条件下,使所述靶DNA与权利要求1-44中任一项所述的DNA聚合酶接触,并确定所述靶DNA的序列。
69.一种试剂盒,所述试剂盒包含至少一种权利要求1-44中任一项所述的工程化DNA聚合酶。
70.根据权利要求69所述的试剂盒,所述试剂盒还包含缓冲液、核苷酸底物和/或寡核苷酸引物底物中的一种或更多种。
71.根据权利要求69-70中任一项所述的试剂盒,所述试剂盒还包含第二DNA聚合酶。
CN202280069578.5A 2021-10-15 2022-10-14 工程化dna聚合酶变体 Pending CN118103501A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202163256492P 2021-10-15 2021-10-15
PCT/US2022/078169 WO2023064938A1 (en) 2021-10-15 2022-10-14 Engineered dna polymerase variants

Publications (1)

Publication Number Publication Date
CN118103501A true CN118103501A (zh) 2024-05-28

Family

ID=85988056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280069578.5A Pending CN118103501A (zh) 2021-10-15 2022-10-14 工程化dna聚合酶变体

Country Status (3)

Country Link
EP (1) EP4416278A1 (zh)
CN (1) CN118103501A (zh)
WO (1) WO2023064938A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2002316586A1 (en) * 2001-07-06 2003-01-21 Amersham Biosciences Corp Novel dna polymerases having amino acid substitutions and homologs thereof
EP3068876B1 (en) * 2013-11-14 2019-05-08 Integrated DNA Technologies Inc. Dna polymerase mutants having enhanced template discrimination activity

Also Published As

Publication number Publication date
US20230193224A1 (en) 2023-06-22
WO2023064938A1 (en) 2023-04-20
EP4416278A1 (en) 2024-08-21

Similar Documents

Publication Publication Date Title
AU2018266606B2 (en) Engineered ligase variants
AU766543B2 (en) Thermostable nucleoside diphosphate kinase for nucleic acid detection
EP3167052B1 (en) P450-bm3 variants with improved activity
US11060075B2 (en) Engineered DNA polymerase variants
US10793841B2 (en) T7 RNA polymerase variants
US12129495B2 (en) Engineered DNA polymerase variants
CN118103501A (zh) 工程化dna聚合酶变体
CN118103500A (zh) 重组逆转录酶变体
JP2024538098A (ja) 組換え逆転写酵素バリアント
WO2024059581A2 (en) Engineered dna polymerase variants
WO2024102861A2 (en) Dna polymerase variants
RU2820531C2 (ru) Сконструированные варианты днк-полимеразы
WO2024059547A2 (en) Engineered dna polymerase variants
WO2024097739A2 (en) Engineered vaccinia capping enzyme variants
WO2024138074A1 (en) Engineered rnase inhibitor variants
WO2024138200A2 (en) Engineered rna ligase variants
WO2024158764A1 (en) Engineered dna ligase variants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination