CN114302961A - 用于测序反应的聚合酶 - Google Patents

用于测序反应的聚合酶 Download PDF

Info

Publication number
CN114302961A
CN114302961A CN202080061326.9A CN202080061326A CN114302961A CN 114302961 A CN114302961 A CN 114302961A CN 202080061326 A CN202080061326 A CN 202080061326A CN 114302961 A CN114302961 A CN 114302961A
Authority
CN
China
Prior art keywords
polymerase
amino acid
modified
modified recombinase
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080061326.9A
Other languages
English (en)
Inventor
布莱恩·瑞德
曼珠拉·潘迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quantum Si Inc
Original Assignee
Quantum Si Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quantum Si Inc filed Critical Quantum Si Inc
Publication of CN114302961A publication Critical patent/CN114302961A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1247DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • C12N9/1252DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N11/00Carrier-bound or immobilised enzymes; Carrier-bound or immobilised microbial cells; Preparation thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/26Preparation of nitrogen-containing carbohydrates
    • C12P19/28N-glycosides
    • C12P19/30Nucleotides
    • C12P19/34Polynucleotides, e.g. nucleic acids, oligoribonucleotides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07006DNA-directed RNA polymerase (2.7.7.6)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/07Nucleotidyltransferases (2.7.7)
    • C12Y207/07007DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供包含经修饰的重组聚合酶的组合物以及编码这些经修饰的聚合酶的核酸分子。在一些方面中,提供使用此类聚合酶合成核酸分子或测序核酸模板的方法。

Description

用于测序反应的聚合酶
相关申请
本申请根据35 U.S.S.§119(e)主张2019年6月28日申请的美国临时专利申请第62/868,806号及2020年3月23日申请的美国临时专利申请第62/993,597号的优先权,其中的每一个以全文引用的方式并入本文中。
背景技术
DNA聚合酶是所有活生物体的基因组复制所必需的核苷酸聚合酶。除其在复制及修复期间保持基因组完整性方面的作用之外,DNA聚合酶也广泛用于体外DNA操控,包括DNA克隆、诱变及测序。DNA聚合酶根据模板DNA合成互补链的基本能力是保守的,尽管特定特性,包括持续效力、保真性及底物核苷酸选择性在不同酶中有所不同。
发明内容
本文中所公开的技术的方面是关于可用于进行体外聚合反应的经修饰的聚合酶(polymerizing enzymes)(例如聚合酶(polymerases))。在一些方面中,本文中所描述的聚合酶适合用于测序反应(例如核酸测序)。在一些方面中,本发明提供具有一或多个修饰的重组聚合酶。在一些实施方案中,本发明的重组聚合酶包含氨基酸突变或域取代中的至少一个。
在一些方面中,本发明提供具有基于天然存在聚合酶(例如选自表1)且包括一或多个氨基酸突变和/或区段取代的氨基酸序列的经修饰的聚合酶(例如核酸聚合酶(nucleic acid polymerizing enzyme/nucleic acid polymerase))。在一些实施方案中,经修饰的聚合酶具有基于屎肠球菌(E.faecium)聚合酶(SEQ ID No:2-5)的氨基酸序列。在一些实施方案中,经修饰的聚合酶具有基于SEQ ID NO:23-33的氨基酸序列。在一些实施方案中,经修饰的聚合酶包含一或多个区段取代(例如其中聚合酶的一或多个区段经一或多个来自不同聚合酶的对应的区段置换)、一或多个氨基酸添加、缺失和/或取代或其组合。在一些实施方案中,区段包含聚合酶的定义区域(例如结构性或功能性域或子域)或其部分,且任选地包括一或多个侧接氨基酸(例如,在表1的天然存在聚合酶,例如,SEQ ID No:2-5或SEQ ID No:23-33中的一个区域或其部分的任一侧上的,例如,1-50、1-40、1-30、1-20、1-10、1-5、5-10、5-25个氨基酸或这些范围内的任何整数个氨基酸)。在一些实施方案中,一或多个氨基酸插入、缺失或取代对应于两个天然存在聚合酶之间在一或多个位置处的天然存在的差异。在一些实施方案中,一或多个氨基酸插入、缺失或取代是新的非天然存在的变化。在一些实施方案中,氨基酸取代是保守氨基酸取代(例如用一种具有相似特性,例如具有相似带电、极性、疏水性、亲水性和/或其他相似特性(诸如相似大小)的氨基酸置换另一种氨基酸)。在一些实施方案中,氨基酸取代是非保守氨基酸取代。在一些实施方案中,一或多个氨基酸插入、缺失或取代可在经修饰的聚合酶中的任何位置,包括在来自不同聚合酶的一或多个交换区段中和/或在原始聚合酶的区段中。
相应地,在一些实施方案中本发明提供满足以下条件的重组聚合酶:具有选自表1的氨基酸序列,例如SEQ ID NO:2-5或SEQ ID NO:23-33(或具有拥有与选自表1的氨基酸序列,例如SEQ ID NO:2-5或SEQ ID NO:23-33的氨基酸序列至少50%、至少60%、至少70%、至少80%、80-90%、90-95%、95-99%或更高的氨基酸序列一致性的氨基酸序列),且包含一或多个来自表2、表3、表4、表5、表6或表7的氨基酸修饰。在一些实施方案中,一或多个氨基酸修饰包括至少一个氨基酸突变(例如1、2、3、4、5、6、7、8、9、10、15、20、25或更多个氨基酸突变)。在一些实施方案中,一或多个氨基酸修饰包括至少1个且至多5个氨基酸突变、至少1个且至多10个氨基酸突变、至少1个且至多15个氨基酸突变、至少1个且至多25个氨基酸突变、至少1个且至多50个氨基酸突变、或至少1个且至多100个氨基酸突变。在一些实施方案中,一或多个氨基酸修饰包括至少一个域取代(例如全部域的取代或包涵域或一部分域的区段的取代)。在一些实施方案中,该至少一个域取代包含外切核酸酶域取代及聚合酶域取代中的至少一个。在一些实施方案中,外切核酸酶域取代包含外切核酸酶环取代。在一些实施方案中,聚合酶域取代包含掌型子域取代、TPR1子域取代、手指型子域取代、TPR2子域取代或拇指型子域取代中的任一个(例如全部聚合酶、掌型、TPR1、手指型、TPR2或拇指型域或子域或其中任一个的部分,任选地包括一或多个侧接氨基酸的取代)。在一些实施方案中,一或多个氨基酸修饰包括至少一个域取代及至少一个氨基酸突变。在一些实施方案中,氨基酸突变可为氨基酸插入、缺失或取代。
在一些实施方案中,本发明的重组聚合酶具有选自表2的序列。在一些实施方案中,本发明提供具有选自表3的序列的重组聚合酶。在一些实施方案中,本发明提供具有选自表4的序列的重组聚合酶。在一些实施方案中,本发明提供具有表7中所列的修饰的组合的重组聚合酶。
在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQ ID NO:23-33)中的任一个的外切核酸酶区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQ ID NO:23-33)中的任一个的掌型区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQ ID NO:23-33)中的任一个的TPR1区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQ ID NO:23-33)中的任一个的手指型区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQID NO:23-33)中的任一个的TPR2区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含以下区段的重组聚合酶,所述区段包括表1中的重组聚合酶(例如SEQ ID NO:2-5或SEQ ID NO:23-33)中的任一个的拇指型区域或其部分(及任选地,位于一侧或两侧上的侧接氨基酸)。在一些方面中,本发明提供包含两个或更多个如本文中所描述的区段的重组聚合酶。
相应地,在一些实施方案中,重组聚合酶为包含一或多个来自不同聚合酶(例如来自不同物种)的氨基酸区段的嵌合酶。在一些实施方案中,嵌合聚合酶包含来自第一聚合酶的氨基酸序列,其中一或多个区段已经被来自不同聚合酶的区段置换。在一些实施方案中,一或多个来自不同聚合酶的区段可为包含来自M2Y聚合酶的氨基酸1-51的区段、包含来自屎肠球菌(E.faecium)聚合酶的氨基酸271-375的区段、包含来自屎肠球菌聚合酶的氨基酸72-89的区段和/或包含来自屎肠球菌聚合酶的氨基酸445-449的区段。在一些实施方案中,来自M2Y聚合酶的1-51区段置换对应的天然存在聚合酶区段(例如Φ29聚合酶的氨基酸1-54)。在一些实施方案中,来自屎肠球菌聚合酶的271-375区段置换对应的天然存在聚合酶区段(例如Φ29聚合酶的氨基酸260-359)。在一些实施方案中,来自屎肠球菌聚合酶的72-89区段置换对应的天然存在聚合酶区段(例如Φ29聚合酶的氨基酸75-91)。在一些实施方案中,来自屎肠球菌聚合酶的445-449区段置换对应的天然存在聚合酶区段(例如Φ29聚合酶的氨基酸429-433)。
在一些实施方案中,重组聚合酶包含一或多个对应于Φ29中的以下取代的取代:M8R、V51A、N62D、I71V、L107I、K131E、K135Q、L142K、G197D、Y224K、E239G、V250A/I、L253A/H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375Y、A437G、A444T、E466K、D476H、A484E、E508R、D510K/R、K512Y、E515Q、K539E、D570S及T571V。
在一些实施方案中,重组聚合酶包含一或多个对应于屎肠球菌中的以下取代的取代:K4R、S22A、N59D、E60L、E85P、N106G、Q122V、P136T、E139K/Q、E142K/Q、I148K、D167P、D171K、D189K、T211A、D232K、V261A/I、L264A/H/M、T479V、E482K、D492H、S493P、K500E、Q513D、E519R、D521K/R、E523K/Y、R308G、S319L、L320M、E323V、D337G、E338K、D341T、I384F/S、E391Y/W/F/H/M/K/R、L437Y、E537K、T568S及M569V。
在一些实施方案中,经修饰的聚合酶包含一或多个本文中所描述的区段取代和/或氨基酸插入、缺失和/或取代,且还包含一或多个(例如1-5、5-10、10-25、25-50、50-75、75-100、100-125、125-150个)额外氨基酸插入、缺失和/或取代(例如保守或非保守氨基酸取代)。相应地,在一些实施方案中,表2、表3或表4的经修饰的聚合酶可包括一或多个额外(例如1-5、5-10、10-25、25-50、50-75、75-100、100-125、125-150个)额外氨基酸插入、缺失和/或取代(例如保守或非保守氨基酸取代)。
在一些方面中,本发明是关于包含第一区段及第二区段的经修饰的重组酶,其中:所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ ID NO:2的氨基酸197-271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ ID NO:2的氨基酸443-528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。在特定实施方案中,第一区段包含与SEQ ID NO:2的197-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列,且第二区段包含与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
在一些方面中,本发明是关于经修饰的重组酶,其包含:包含对应于参考区段的氨基酸序列的第一区段,所述参考区段含有SEQ ID NO:2的氨基酸1-196,其中第一区段的氨基酸序列与参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致;且其中第一区段具有高于参考区段的等电点。在特定实施方案中,第一区段包含与SEQ ID NO:2的1-196至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
在一些方面中,本发明是关于包含第一区段及第二区段的经修饰的重组酶,其中:所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ ID NO:2的氨基酸1-271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ ID NO:2的氨基酸443-528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。在特定实施方案中,第一区段包含与SEQ ID NO:2的1-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列,且第二区段包含与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。
在一些实施方案中,经修饰的重组酶包含表7中所列的修饰的组合。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537的位置处的修饰。在一些实施方案中,位置E142处的修饰为E142K;位置I148处的修饰为I148K;位置D189处的修饰为D189K;位置V261处的修饰为V261A;位置L264处的修饰为L264H;位置R308处的修饰为R308G;位置E391处的修饰为E391Y;位置E482处的修饰为E482K;位置D492处的修饰为D492H;位置K500处的修饰为K500E;位置D521处的修饰为D521K;位置E523处的修饰为E523K;及位置E537处的修饰为E537K。在一些实施方案中,经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含位置E60处的修饰。在一些实施方案中,E60处的修饰为E60L。在一些实施方案中,经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
在一些实施方案中,经修饰的重组酶进一步包含双生物素标签。
在一些实施方案中,经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
在一些方面中,本发明是关于包含一或多个选自以下的区段的经修饰的重组酶:具有与SEQ ID NO:2的氨基酸1-196至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第一区段,其中所述第一区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188及D189;具有与SEQ ID NO:2的氨基酸197-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第二区段,其中所述第二区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264及S267;和/或具有与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第三区段,其中所述第三区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
在一些实施方案中,经修饰的重组酶包含第一区段及第二区段。在一些实施方案中,经修饰的重组酶包含第二区段及第三区段。在一些实施方案中,经修饰的重组酶包含第一区段及第三区段。在一些实施方案中,经修饰的重组酶包含第一区段、第二区段及第三区段。
在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。
在一些实施方案中,经修饰的重组酶包含表7中所列的修饰的组合。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537的位置处的修饰。在一些实施方案中,位置E142处的修饰为E142K;位置I148处的修饰为I148K;位置D189处的修饰为D189K;位置V261处的修饰为V261A;位置L264处的修饰为L264H;位置R308处的修饰为R308G;位置E391处的修饰为E391Y;位置E482处的修饰为E482K;位置D492处的修饰为D492H;位置K500处的修饰为K500E;位置D521处的修饰为D521K;位置E523处的修饰为E523K;及位置E537处的修饰为E537K。
在一些实施方案中,经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含位置E60处的修饰。在一些实施方案中,E60处的修饰为E60L。
在一些实施方案中,经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
在一些实施方案中,经修饰的重组酶进一步包含双生物素标签。
在一些实施方案中,经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
在一些方面中,本发明是关于包含氨基酸序列的经修饰的重组酶,所述氨基酸序列包含:(i)第一区段、第二区段、第三区段、第四区段、第五区段、第六区段及第七区段;及(ii)在对应于SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545的一或多个位置处的修饰;其中所述第一区段包含与表1、表2或表3的聚合酶的外切核酸酶区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;所述第二区段及所述第六区段共同包含与表1、表2或表3的聚合酶的掌型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;所述第三区段包含与表1、表2或表3的聚合酶的TPR1区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;所述第四区段包含与表1、表2或表3的聚合酶的手指型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;所述第五区段包含与表1、表2或表3的聚合酶的TPR2区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;及所述第七区段包含与表1、表2或表3的聚合酶的拇指型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。在特定实施方案中,来自表1的聚合酶是选自SEQ ID NO:2-5中的任一个。在一些实施方案中,来自表1的聚合酶是选自SEQ ID NO:23-33中的任一个。
在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。在一些实施方案中,经修饰的重组酶进一步包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、P147、E152、I153、P160、N175、F188、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、I384、N388、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、T479、A484、E485、A486、L490、S493、K500、S503、Q506、Q513、E519、V526、R534、G547、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、P147Q、P147T、E152D、I153V、P160A、N175T、N175Y、F188C、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、I384T、I384F、I384S、N388T、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、T479V、A484E、E485D、A486E、L490M、S493P、K500E、S503A、S503T、Q506K、Q513D、V526L、R534K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
在一些实施方案中,经修饰的重组酶包含表7中所列的修饰的组合。
在一些方面中,本发明是关于经修饰的重组酶,其包含:与SEQ ID NO:2至少60%、60-70%、70-80%或至少80%一致的氨基酸序列;及延长掌型域,其中所述延长掌型域包含与SEQ ID NO:1的氨基酸505-524至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
在一些实施方案中,经修饰的重组酶进一步包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、N145H、N145R、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。在一些实施方案中,经修饰的重组酶的氨基酸序列进一步包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
在一些实施方案中,经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。
在一些实施方案中,经修饰的重组酶包含表7中所列的修饰的组合。
在一些方面中,本发明是关于具有与SEQ ID NO:1-33中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列的经修饰的重组酶,其中所述氨基酸序列包含对应于以下的一或多个位置处的修饰:屎肠球菌(E.faecium)聚合酶(SEQ ID NO:2)的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在特定实施方案中,经修饰的重组酶具有与SEQ ID NO:2-5中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列且包含上述位置中的一或多个处的修饰。在一个特定实施方案中,经修饰的重组酶为具有与SEQ ID NO:2中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列的经修饰的屎肠球菌聚合酶,且包含上述位置中的一或多个处的修饰。在一个特定实施方案中,经修饰的重组酶为包含SEQ ID NO:2的氨基酸序列的经修饰的屎肠球菌聚合酶,且包含这些位置中的一或多个处的修饰。在一些实施方案中,经修饰的重组酶具有与SEQ ID NO:23-33中的任一个60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含上述位置中的一或多个处的修饰。
在一些实施方案中,经修饰的重组酶包含对应于SEQ ID NO:2的T568及M569的一个或两个位置处的修饰。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:T568D、T568S、M569T及M569V。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的持续效力。
在一些实施方案中,经修饰的重组酶包含对应于SEQ ID NO:2的N59的位置处的修饰。在一些实施方案中,修饰为N59D。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改变的外切核酸酶活性。
在一些实施方案中,经修饰的重组酶包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:V261A、V261I、L264A、L264H、L264M、S267A、I384F、I384S、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、W452Y、G453A、Y455W、D492H及K500E。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ IDNO:2)具有改善的核苷酸底物利用率。
在一些实施方案中,经修饰的重组酶包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E65、Y133、V261、L264、S267、I384、E391、G400、V443、L445、A446、S447、V449、T450、W452、G453、Y455、K500、S503、E523、L555及P556。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E65S、Y133L、V261A、V261I、L264A、L264H、S267A、I384F、I384S、E391Y、E391W、E391F、E391K、G400L、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、K500E、S503A、E523K、E523Y、E523F、E523H、E523W、L555K及P556A。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的精确度。
在一些实施方案中,经修饰的重组酶包含一或多个对应于SEQ ID NO:2的Q317、S319、I322、Q323、R429、L555及T559的位置处的修饰。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:Q317R、S319R、I322K、Q323G、R429G、L555K及T559V。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的DNA结合亲和力。
在一些实施方案中,经修饰的重组酶包含对应于SEQ ID NO:2的E391、S503及E523的一或多个位置处的修饰。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E391Y、E391W、E391F、E391K、S503A、E523K、E523Y、E523F、E523H及E523W。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的类似物结合亲和力。
在一些实施方案中,经修饰的重组酶包含一或多个对应于SEQ ID NO:2的Q206、E436及L437的位置处的修饰。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:Q206R、Q206K、Q206H、E436R、L437Y及L437E。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的链置换。
在一些实施方案中,经修饰的重组酶包含一或多个对应于SEQ ID NO:2的E436、L437、R534、T568及M569的位置处的修饰。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E436R、L437Y、L437E、R534K、T568D、T568S、M569T及M569V。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增强的平均读段长度。
在一些实施方案中,经修饰的重组酶包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的T13、V25、C26、D27、N33、I34、F36、S42、D54、E60、M95、T110、T114、K119、P136、P147、E152、I153、P160、N175、F188、S216、R217、D232、A236、V247、P273、P275、E283、V315、S319、L320、Q323、E338、T345、F352、F353、T364、D414、D425、E436、F465、E485、A486、L490、S503、E523、V526、G547、L555、R558、V564、M569及T571。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:T13N、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、E60V、M95T、M95K、T110I、T114S、K119Q、P136T、P147Q、P147T、E152D、I153V、P160A、N175Y、F188C、S216G、S216R、R217G、D232H、A236G、V247D、P273R、P275S、E283K、V315L、S319R、L320M、L320T、Q323R、E338K、T345I、F352I、F353C、T364I、D414V、D425N、E436G、F465Y、E485D、A486E、L490M、S503T、E523V、V526L、G547S、L555R、R558H、V564L、M569K及T571S。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的复制能力。
在一些实施方案中,经修饰的重组酶包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的正电性表面电荷。
在一些实施方案中,经修饰的重组酶包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、S22、D27、I34、D54、E60、E85、M95、N106、T110、Q122、Y133、P136、P147、D167、T211、D232、P275、R308、S319、L320、E323、D337、E338、D341、T345、F352、T364、D414、F465、T479、E485、L490、S493、Q513及R558。在一些实施方案中,修饰为选自由以下组成的组的氨基酸取代:K4R、S22A、D27E、I34V、D54Y、E60V、E60L、E85P、M95K、T110I、N106G、Q122V、Y133L、P136T、P147Q、P147T、D167P、T211A、D232K、P275S、R308G、S319R、L320M、Q323V、D337G、E338K、D341T、T345I、F352I、T364I、D414V、F465Y、T479V、E485D、L490M、S493P、Q513D及R558H。在一些实施方案中,经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的稳定性。
在一些实施方案中,经修饰的重组酶包含表7中所列的修饰的组合。
经修饰的聚合酶相对于野生型聚合酶(例如表1的序列,例如SEQ ID NO:1、SEQ IDNO:2-5、SEQ ID NO:6-22或SEQ ID NO:23-33)或相对于表2-7中任一个中所描述的序列,可包括一或多个修饰(例如,如此申请中所述的一或多个氨基酸的缺失、一或多个氨基酸的添加、一或多个氨基酸的取代,或其组合)。
在一些实施方案中,经修饰的聚合酶中的唯一修饰为本发明中所提供的修饰(例如氨基酸取代)中的一或多个,且除此以外,聚合酶的序列与野生型聚合酶(例如表1的序列)或与表2-7中的任一个所描述的序列一致。
在一些实施方案中,经修饰的重组酶进一步包含纯化标签。在一些实施方案中,纯化标签共价结合至聚合酶序列中的区域。在一些实施方案中,纯化标签共价结合在聚合酶序列的末端。在一些实施方案中,纯化标签是C端标签。在一些实施方案中,纯化标签是N端标签。在一些实施方案中,纯化标签是His标签(例如重复组氨酸残基的序列,诸如六组氨酸序列)。
在一些实施方案中,经修饰的重组酶进一步包含偶联基团。在一些实施方案中,偶联基团附接在经修饰的重组酶序列内的区域处。在一些实施方案中,偶联基团附接在经修饰的重组酶的末端处。在一些实施方案中,偶联基团附接在经修饰的重组酶的C末端处。在一些实施方案中,偶联基团附接在经修饰的重组酶的N末端处。在一些实施方案中,偶联基团是生物素标记序列。在一些实施方案中,偶联基团是双生物素标记序列。在一些实施方案中,经修饰的重组酶包含(例如在其C端处)直接连接或由肽连接子(例如5至15个氨基酸长或更长)分开的纯化标签(例如His标签)及偶联基团(例如生物素标记或双生物素标记序列)。
在一些实施方案中,经修饰的重组酶固定于表面上。在一些实施方案中,表面包含经配置以结合经修饰的重组酶的偶联基团。在一些实施方案中,表面包含纳米孔。在一些实施方案中,表面包含样品槽的底表面。在一些实施方案中,样品槽安置于表面(例如芯片或集成装置的表面)上的多个样品槽的中。在一些实施方案中,多个样品槽中的每一个经配置以接收经修饰的重组酶。在一些实施方案中,包含经修饰的重组酶的多个样品槽中的每一个能够进行单分子测序反应。在一些实施方案中,表面可为由玻璃或其他透明材料、硅石、熔融硅石、二氧化硅、聚合物、其他材料或其组合制成的芯片的表面(例如,不同层的组合,例如包括一或多个金属层)。
在一些方面中,本发明提供编码本文所述的经修饰的重组酶的经分离的核酸分子。在一些实施方案中,经分离的核酸分子包含RNA。在一些实施方案中,经分离的核酸分子包含DNA。在一些实施方案中,经分离的核酸分子包含病毒载体。在一些实施方案中,经分离的核酸分子包含表达载体。在一些实施方案中,经分离的核酸分子包含质粒。在一些实施方案中,经分离的核酸包括启动子(例如诱导型启动子)。在一些实施方案中,经分离的核酸处于能够表达经修饰的重组酶的宿主细胞中。在一些实施方案中,经修饰的重组酶自宿主细胞(例如自宿主细胞制剂,例如在生物反应器中生长及诱导诱导型启动子的后)分离。
在一些方面中,本发明提供一种包含此申请中所述的经修饰的重组酶的组合物。在一些实施方案中,组合物用于测序核酸的方法中。在一些实施方案中,组合物进一步包含测序反应混合物。在一些实施方案中,测序反应混合物可包括:聚磷酸核苷(例如包含多于一个磷酸基的核苷,诸如六磷酸核苷酸或核苷)中的一或多个、待测序的模板核酸、充当互补链合成的起始点的核酸引物、二价金属离子、缓冲组分及盐。在一些实施方案中,聚磷酸核苷包含可检测部分(例如发光标记)。
在一些方面中,本发明提供一种通过使此申请中所述的经修饰的重组酶与测序反应混合物接触来测序核酸的方法。在一些实施方案中,测序反应混合物可包括:聚磷酸核苷(例如包含多于一个磷酸基的核苷,诸如六磷酸核苷酸或核苷)中的一或多个、待测序的模板核酸、充当互补链合成的起始点的核酸引物、二价金属离子、缓冲组分及盐。在一些实施方案中,聚磷酸核苷包含发光标记。在一些实施方案中,该方法进一步包含检测在与模板核酸互补的生长链中的一或多个聚磷酸核苷的并入。在一些实施方案中,检测包含测量并入事件中所涉及的经发光标记的聚磷酸核苷的一或多个发光特性(例如寿命、强度、光子出现时间、量子产率)。
在一些方面中,本发明是关于包含本文所述的经修饰的重组酶的组合物。
在一些方面中,本发明是关于使用本文所述的重组酶测序核酸的方法。在一些实施方案中,该方法包含使经修饰的重组酶与测序反应混合物接触。
这些及其他方面在以下详细描述中更详细地描述且通过非限制性图式及实例说明。
附图说明
本领域技术人员将理解本文所描述的图式仅出于说明的目的。应理解,在一些情况下,为辅助理解本发明,本发明的各种方面可能经放大或扩大展示。在图式中,在通篇各种图中,相同参考标号一般是指相同特点、功能上类似和/或结构上类似的元素。图式未必为按比例的,实际上重点在于说明教导内容的原理。图式不意欲以任何方式限制本教导内容的范畴。
本发明的特点及优势将自下文结合图式所述的实施方式而变得更显而易见。
当参考图式描述实施方案时,可使用方向参考(“之上”、“之下”、“顶部”、“底部”、“左侧”、“右侧”、“水平”、“垂直”等)。此类参考仅意欲作为读者在正常方向上观看图式的辅助。这些方向参考不意欲描述实施装置的较佳或唯一方向。装置可以其他定向实施。
如根据详细描述显而易见的,在本申请通篇中,图中描绘且出于说明目的进一步描述的实例描述非限制性实施方案,且在一些情况下出于更清楚说明的目的可以简化某些方法或省略特点或步骤。
图1是说明监测单分子方法的非限制性方法中与信号读出相关的聚合反应进程的示意图。
图2是描绘Φ29聚合酶及该聚合酶的域及子域的结构的非限制性说明。
图3描绘所选择的具有在多肽链的域及子域中的突变位点的突变变体的非限制性实例。
图4描绘所选择的具有经取代至多肽链中的不同域及子域的嵌合聚合酶变体的非限制性实例。
图5A是描绘Φ29聚合酶的外切核酸酶域中的环区域的非限制性说明。
图5B描绘Φ29聚合酶的外切核酸酶区域与非限制性的一组其他聚合酶之间的序列同源性比对。
图6描绘包含一或多个定点突变的嵌合聚合酶变体的非限制性通用实例。
图7是经实施以评估在大肠杆菌(E.coli)中表达的聚合酶的纯度的SDS-PAGE的图片。
图8A-8D展示来自用屎肠球菌聚合酶变体、EFM37、EFM48及EFM66进行的DNA合成实验的结果。图8A描绘负载有EFM37哑铃三元复合物的测序芯片。图8B说明实时停流链置换DNA合成分析。图8C展示针对不同变体测定的DNA合成速率。图8D展示针对不同变体测定的幅度。
图9A-9B展示野生型屎肠球菌聚合酶的结构表征。图9A展示野生型屎肠球菌聚合酶的建模表面。图9B展示映射至野生型屎肠球菌多肽的聚合酶同源域。
图10A-10F展示来自用基于EFM37亲本研发的屎肠球菌聚合酶变体进行的DNA合成实验的结果。图10A展示在用dN6P类似物及含有双螺旋DNA连接子的类似物(“Q24”)进行的停流链置换合成分析中,针对不同变体所测定的DNA合成速率。图10B为展示野生型及变体聚合酶中带负电及带正电残基的数目的图。图10C描绘野生型及变体聚合酶的建模静电表面。图10D-10E展示在用Q24进行的停流链置换合成分析中,用25mM相对于10mM MgCl2实现的改善的EFM89速率(图10D)及幅度(图10E)。图10F展示在30℃及25mM MgCl2情况下,在针对野生型EF、EF exo-及EFM89的停流链置换合成分析中使用dNTP的DNA合成的幅度。
图11展示使用EFM89及M13ssDNA质粒模板自测序反应获得的示例性测序比对。
图12A-12D展示来自商业平台上的用两个独立的EFM89制剂进行的DNA测序反应的结果。图12A报告各种输出测量值。图12B展示指示利用EFM89的插入、缺失及错配误差的分布的盒状图,其中平均值在上文各盒状图指示出。图12C展示EFM89(批次1)的总读段长度的直方图。图12D展示EFM89(批次1)的亚读段精确度的直方图。
图13A-13B展示序列比对结果。图13A展示四种天然存在屎肠球菌聚合酶变体之间的序列一致性。图13B展示变体之间共有的序列一致性。序列通过其NCBI蛋白质数据库登录号列出。
图14A-14B展示屎肠球菌聚合酶与Φ29的比较。图14A展示屎肠球菌聚合酶及Φ29的N端的氨基酸序列比对。图14B展示屎肠球菌聚合酶与Φ29手指型子域(顶部)及掌型子域(底部)的晶体结构比较。Φ29在掌型域中具有延长结构,其可包括于屎肠球菌聚合酶中,例如以提供与核苷酸类似物的有利相互作用(例如dN6P利用率),且用以提供当结合核苷酸类似物时更接近于手指型域的结构特点。
图15展示相对于Φ29的屎肠球菌聚合酶的域组织,其中指示了各域的起始位置。
图16是经实施以评估所指示聚合酶的纯度的SDS-PAGE的图片。
图17展示屎肠球菌聚合酶及十七个同源聚合酶的序列的氨基酸序列比对。自顶部至底部的序列为:WP_060797276.1(SEQ ID NO:2);NP_690635.1(SEQ ID NO:828);YP_002004529.1(SEQ ID NO:829);KNC25437.1(SEQ ID NO:830);NP_073685.1(SEQ ID NO:10);ARM70154.1(SEQ ID NO:22);ARQ95230.1(SEQ ID NO:831);QDH50332.1(SEQ ID NO:832);HMB70020.1(SEQ ID NO:833);YP_009198012.1(SEQ ID NO:9);WP_077841611.1(SEQID NO:834);PWM80583.1(SEQ ID NO:835);PWM70763.1(SEQ ID NO:836);YP_001333659.1(SEQ ID NO:11);KKP77830.1(SEQ ID NO:12);AYQ98978.1(SEQ ID NO:837);AYQ99922.1(SEQ ID NO:838);及AXF52067.1(SEQ ID NO:839)。突出显示各种位置(用星号),包括E60(取代L)、E139(取代K、Q、T、A、V)及D167(取代P、K、S、Q、A)。
图18展示相比于Φ29聚合酶中的相同区域,野生型屎肠球菌聚合酶的内部晶体结构中残基60周围的区域。
图19展示来自用EFM89及EFM158制剂进行的DNA测序反应的结果。
图20展示使用EFM89聚合酶(左)及EFM158聚合酶(右)达成的读段长度。
图21展示野生型屎肠球菌聚合酶与EFM158的晶体结构比较,包括活性位点(左)的视图及进化变体(右)的表面的视图。
图22A-22C展示在位置I148(图22A)、E482(图22B)及D492(图22C)处引入带正电氨基酸的情况下脉冲间持续时间减少。针对一对仅在所提及的序列处不同的屎肠球菌聚合酶变体显示来自单分子DNA测序的脉冲间持续时间。脉冲间持续时间分别对于I148K、E482K及D492H减少21.3%、5.8%及22.6%。
图23展示改善单分子DNA测序中的比对精确度的单取代及组合。变体序列识别符列于圆括号中。除了在所提及的位置以外,所有变体均具有等效于EFM182的氨基酸序列。取代是相对于EFM182书写。
图24展示来自评定野生型EF聚合酶持续效力的滚环分析的结果,这些分析在30℃下用90-聚体哑铃DNA模板用dNTP(左)及dN6P类似物(右)进行30分钟。关于已知的持续性聚合酶QTDE1.0的结果作为参考展示。
图25展示富集于用屎肠球菌聚合酶进行的基于乳剂的IVTT-RCA筛选中的取代。
具体实施方式
本发明的方面是关于经修饰的聚合酶及其组合物。在一些方面中,本发明提供使用经修饰的重组聚合酶及包含这些酶的组合物的方法。在一些实施方案中,本发明提供可用于进行体外聚合反应的经修饰的重组聚合酶及其组合物。在一些方面中,本文中所描述的聚合酶是经修饰的重组核酸聚合酶,例如经修饰的重组DNA聚合酶。在一些实施方案中,由本发明提供的经修饰的重组DNA聚合酶可用于与DNA操控(例如DNA测序)相关的体外反应。
I.经修饰的聚合酶
在其他方面中,本发明提供可用于进行体外聚合反应的经修饰的聚合酶(polymerizing enzyme)(或经修饰的聚合酶(polymerase))。在一些实施方案中,本文中所描述的聚合酶包含一或多个修饰,其单独或组合适用于进行测序反应。在一些实施方案中,可利用一或多个本文中所描述的修饰来产生具有一或多个适用于进行测序反应的特性的聚合酶,例如,诸如以下的特性:聚合酶持续效力、保真性(例如精确度)、底物(例如聚磷酸核苷)结合亲和力、底物利用率(例如聚磷酸核苷并入至与模板链互补的生长链中的比率)、聚合酶与经修饰的底物(例如经标记的聚磷酸核苷)的相互作用或其某种组合。在一些实施方案中,一或多个修饰最小化或消除聚合酶的校读能力。举例而言,在一些实施方案中,可对聚合酶的外切核酸酶域作出一或多个修饰,使得聚合酶的外切核酸酶活性受损。
本申请部分地基于本发明人的认识:对野生型聚合酶的某些修饰(例如突变、插入和/或取代)增强所述聚合酶的功能属性,以提供用于核酸操纵应用的改善试剂。因此,在一些方面中,本发明是关于经修饰的聚合酶。如本文所用,术语“聚合酶(polymerase)”及“聚合酶(polymerizing enzyme)”一般是指能够催化聚合反应的任何酶。聚合酶的实例包括但不限于DNA聚合酶、RNA聚合酶、热稳定聚合酶、野生型聚合酶、重组聚合酶、大肠杆菌DNA聚合酶I、T7 DNA聚合酶、噬菌体T4 DNA聚合酶
Figure BDA0003525124290000261
(phi29)DNA聚合酶、Taq聚合酶、Tth聚合酶、Tli聚合酶、Pfu聚合酶、Pwo聚合酶、
Figure BDA0003525124290000262
聚合酶、Deep VENTTM聚合酶、Ex TAQTM聚合酶、LA TAQTM聚合酶、Sso聚合酶、Poc聚合酶、Pab聚合酶、Mth聚合酶、ES4聚合酶、Tru聚合酶、Tac聚合酶、Tne聚合酶、Tma聚合酶、Tca聚合酶、Tih聚合酶、Tfi聚合酶、
Figure BDA0003525124290000271
Taq聚合酶、Tbr聚合酶、Tfl聚合酶、Tth聚合酶、
Figure BDA0003525124290000272
聚合酶、PYROBESTTM聚合酶、Pwo聚合酶、KOD聚合酶、Bst聚合酶、Sac聚合酶、克列诺(Klenow)片段,具有3'至5'外切核酸酶活性的聚合酶及其变体、修饰产物及衍生物。在一些实施方案中,聚合酶为单一子单元聚合酶。聚合酶的其他实例包括M2Y聚合酶、铜绿蝇(Lucilia cuprina)聚合酶、屎肠球菌(Enterococcus faecium)聚合酶、芽孢杆菌(Bacillus)噬菌体VMY22聚合酶、芽孢杆菌噬菌体GA-1聚合酶、放线菌(Actinomyces)噬菌体AV-1聚合酶、候选莫兰菌(CandidatusMoranbacteria)聚合酶、芽孢杆菌噬菌体MG-B1聚合酶、埃格特菌属(Eggerthella sp.)聚合酶、链球菌(Streptococcus)噬菌体CP-7聚合酶、拟杆菌属(Bacteroides sp.)聚合酶、沙眼披衣菌(Chlamydia trachomatis)聚合酶及马铃薯白线虫(Globodera pallida)聚合酶。DNA聚合酶的其他非限制性实例包括9°NMTM DNA聚合酶(新英格兰生物实验室(New EnglandBiolabs))及克列诺外聚合酶的P680G突变体(Tuske等人(2000)JBC275(31):23759-23768)。DNA聚合酶的非限制性实例及其特性详细描述于DNA Replication第2版,Kornberg及Baker,W.H.Freeman,New York,N.Y.(1991)及其他位置中。此类序列的非限制性实例可见于表1中。
如本文中所述,当聚合酶和/或聚合酶序列天然或人工地衍生自共同上代蛋白质或氨基酸序列时,其为“同源”。类似地,当核酸和/或核酸序列天然或人工地衍生自共同上代核酸或核酸序列时,其为同源。举例而言,任何天然存在核酸可以通过任何可利用的诱变方法修饰,以在多肽中在给定位置处包括至少一种编码不会天然存在的氨基酸的特定密码子。当表达时,此经诱变核酸编码包含一或多个突变氨基酸的多肽。在一些实施方案中,同源性一般根据两个或更多个核酸或蛋白质(或其序列)之间的序列相似性推断。适用于确立同源性的序列之间的相似性的精确百分比随所研究的核酸及蛋白质而变化,但常规地使用小至25%序列相似性来确立同源性。也可使用更高水准的序列相似性,例如30%、40%、50%、60%、70%、80%、90%、95%或99%或更大,来确立同源性。测定序列相似性百分比的方法已为一般本领域技术人员所熟知。在一些实施方案中,相似性可以使用诸如本文中所述的算法的算法,包括例如BLASTP及BLASTN算法,例如使用预设参数来测定。
表1.示例性野生型聚合酶氨氨基酸序列
Figure BDA0003525124290000281
Figure BDA0003525124290000291
Figure BDA0003525124290000301
Figure BDA0003525124290000311
Figure BDA0003525124290000321
Figure BDA0003525124290000331
Figure BDA0003525124290000341
Figure BDA0003525124290000351
Figure BDA0003525124290000361
聚合酶具有各种特征,包括持续效力。聚合酶持续效力一般是指聚合酶将dNTP连续并入至核酸模板中而不释放核酸模板的能力。在目标核酸的核碱基与互补dNTP之间碱基配对后,聚合酶通过在新合成的链的3'羟基端与dNTP的α磷酸酯之间形成磷酸二酯键,将dNTP并入新合成的核酸链中。通过在单一缔合/解离事件上由聚合酶并入的核苷酸的平均数量来确定持续效力。
聚合酶的持续效力变化。举例而言,聚合酶可呈现相对于另一聚合酶的较高持续效力。替代地,相对于另一聚合酶,聚合酶可呈现降低的持续效力。类似地,聚合酶可在第一条件(例如包含第一核苷酸组合)中呈现较高持续效力且在第二条件(例如包含第二核苷酸组合)中呈现降低的持续效力。
聚合酶的其他特征包括但不限于合成精确度、核酸酶活性、核苷酸底物利用率、核酸亲和力、复制能力、平均读段长度产生率、表面电荷及稳定性。类似于持续效力,这些特征在聚合酶之间及在反应条件之间变化。
聚合酶的特征可通过在聚合酶的氨基酸序列中引入修饰(或变化)来改变。举例而言,在一些实施方案中,聚合酶的持续效力通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶的核酸酶活性通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶的(一或多个底物的)核苷酸底物利用率通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶对一或多个底物的亲和力通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶的复制能力通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶的平均读段长度通过修饰而增加(或替代地减少)。在一些实施方案中,聚合酶的表面电荷通过修饰变得更呈阳性(或替代地更呈阴性)。在一些实施方案中,聚合酶的稳定性通过修饰而增加(或替代地降低)。在一些实施方案中,聚合酶的一或多个特征(例如,持续效力、核酸酶活性、核苷酸底物利用率、对一或多个底物的亲和力、复制能力、平均读段长度、表面电荷、稳定性等)增加约5%-10%、10%-20%、20%-30%、30%-40%、40%-50%、50%-60%、60%-70%、70%-80%、80%-90%、90%-100%或更多。在一些实施方案中,聚合酶的一或多个特征(例如,持续效力、核酸酶活性、核苷酸底物利用率、对一或多个底物的亲和力、复制能力、平均读段长度、表面电荷、稳定性等)增加超过约5%、超过约10%、超过约20%、超过约30%、超过约40%、超过约50%、超过约60%、超过约70%、超过约80%、超过约90%、超过约100%或更多。在一些实施方案中,聚合酶的一或多个特征(例如,持续效力、核酸酶活性、核苷酸底物利用率、对一或多个底物的亲和力、复制能力、平均读段长度、表面电荷、稳定性等)降低约5%-10%、10%-20%、20%-30%、30%-40%、40%-50%、50%-60%、60%-70%、70%-80%、80%-90%、90%-100%或更多。在一些实施方案中,聚合酶的一或多个特征(例如,持续效力、核酸酶活性、核苷酸底物利用率、对一或多个底物的亲和力、复制能力、平均读段长度、表面电荷、稳定性等)降低超过约5%、超过约10%、超过约20%、超过约30%、超过约40%、超过约50%、超过约60%、超过约70%、超过约80%、超过约90%。在一些实施方案中,可消除一或多个特征。
当将修饰引入到聚合酶的氨基酸序列中时,产生“经修饰的聚合酶(modifiedpolymerase)”(在本文中也称为“经修饰的聚合酶(modified polymerizing enzyme)”,或当以重组方式产生时,称为“经修饰的重组聚合酶(modified recombinantpolymerase)”)。修饰可包含一或多个氨基酸的缺失、一或多个氨基酸的添加、一或多个氨基酸的取代或其组合。经修饰的聚合酶相对于野生型聚合酶(例如表1的序列,例如SEQ IDNO:1、SEQ ID NO:2-5、SEQ ID NO:6-22或SEQ ID NO:23-33)或相对于表2-7中任一个中所描述的序列,可包括一或多个修饰(例如,如此申请中所述的一或多个氨基酸的缺失、一或多个氨基酸的添加、一或多个氨基酸的取代,或其组合)。举例而言,在一些实施方案中,修饰包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个、至少40个、至少41个、至少42个、至少43个、至少44个、至少45个、至少46个、至少47个、至少48个、至少49个、至少50个、至少55个、至少60个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少110个、至少120个、至少130个、至少140个或至少150个氨基酸(其可为或可不为连续氨基酸)的缺失、添加或取代。在一些实施方案中,修饰包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个、51个、52个、53个、54个、55个、56个、57个、58个、59个、60个、61个、62个、63个、64个、65个、66个、67个、68个、69个、70个、71个、72个、73个、74个、75个、76个、77个、78个、79个、80个、81个、82个、83个、84个、85个、86个、87个、88个、89个、90个、91个、92个、93个、94个、95个、96个、97个、98个、99个、100个、105个、110个、115个、120个、125个、130个、140个或150个氨基酸(其可为或可不为连续氨基酸)的缺失、添加或取代。
在一些实施方案中,经修饰的聚合酶包含一或多个非天然氨基酸取代。如本文所用,“非天然氨基酸”是指除了以下二十种基因编码的α氨基酸之外的任何氨基酸、经修饰的氨基酸或氨基酸类似物:丙氨酸、精氨酸、天冬酰氨、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。在一些实施方案中,非天然氨基酸可包括除了上述二十种α氨基酸之外的天然存在化合物。非天然氨基酸及非天然氨基酸并入至蛋白质序列中的方法是本领域中已知的,例如,如美国专利第7,045,337号中所述,其内容以引用的方式并入本文中。
A.氨基酸修饰命名
修饰可由氨基酸序列内的位置命名。举例而言,修饰可命名为“A484”,指示在聚合酶的氨基酸序列中的位置484处的丙氨酸残基已经被修饰(由此产生经修饰的聚合酶)。修饰也可通过参考聚合酶的对应氨基酸的位置/一致性命名。
举例而言,在一些实施方案中,经修饰的聚合酶包含对应于Φ29聚合酶(SEQ IDNO:1)中的A484的位置处的突变。对应于其他聚合酶中的A484的氨基酸可通过本领域中已知的任何方法(包括同源性比对)来测定。参见例如图5B及图17。
作为此分析的非限制性实例,同源性比对使用多个表1中所报告的聚合酶进行,且确定Φ29聚合酶中的A484对应于M2Y中的A481、芽孢杆菌噬菌体VMY22中的A492、屎肠球菌中的K500及铜绿蝇中的K827。相应地,可使用同源性比对及本领域中已知的相似方法鉴别对应于本文中所描述的经修饰的残基的位置的其他聚合酶中的氨基酸。因此,应了解,本发明的修饰不意欲限于本文中所描述的聚合酶(例如表1中所列的聚合酶)且可延长至使用已知技术的任何聚合酶。
在一些实施方案中,经修饰的聚合酶的序列不包含一或多个对应于参考聚合酶(例如表1中所列的聚合酶)中的位置的氨基酸(即一或多个“同源氨基酸”)。因此,在一些实施方案中,聚合酶通过在指定参考位置处添加(或插入)同源氨基酸来修饰,该参考位置基于经修饰的聚合酶的周围同源残基而推断。包含同源氨基酸的突变聚合酶变体根据本文所述的实施方案经工程改造且列于表3中。
(i)参考屎肠球菌聚合酶的氨基酸修饰。
在一些实施方案中,对聚合酶(例如表1中所列的聚合酶)进行氨基酸修饰,其中参考屎肠球菌聚合酶(SEQ ID NO:2-5)进行氨基酸修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含对应于以下的一或多个位置处(例如在1-117个位置处或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)的氨基酸修饰(即突变):屎肠球菌聚合酶(SEQ ID NO:2)中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
此类修饰可包含缺失(例如在对应于以下的位置处的氨基酸缺失:屎肠球菌聚合酶(SEQ ID NO:2)中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569或T571(或其任何组合))。
替代地或另外,此类修饰可包含添加(例如,在对应于以下的位置处的同源氨基酸添加:屎肠球菌聚合酶(SEQ ID NO:2)中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569或T571(或其任何组合))。
替代地或另外,此类修饰可包含取代。举例而言,修饰可包含对应于以下的一或多个位置处(例如在1-117个位置处或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)的取代:屎肠球菌聚合酶(SEQ ID NO:2)中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,取代是选自由以下组成的组:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W、V526L、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S(对应于屎肠球菌聚合酶(SEQ ID NO:2)中的位置)。
示例性修饰组合列于表7中。
(ii)参考Φ29聚合酶的氨基酸修饰。
在一些实施方案中,对聚合酶(例如表1中所列的聚合酶)进行氨基酸修饰,其中参考Φ29聚合酶(SEQ ID NO:1)进行氨基酸修饰。例如,在一些实施方案中,经修饰的聚合酶包含对应于以下一或多个位置(例如,2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个位置,以其任何组合形式)处的氨基酸修饰(即突变):Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571。
此类修饰可包含缺失(例如在对应于以下的位置处的氨基酸缺失:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571(或其任何组合))。
替代地或另外,此类修饰可包含添加(例如,在对应于以下的位置处的同源氨基酸添加:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571(或其任何组合))。
替代地或另外,此类修饰可包含取代。举例而言,修饰可包含对应于以下的一或多个位置处(例如在1-44个位置处或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)的取代:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570及T571。在一些实施方案中,取代是选自由以下组成的组:M8R、V51A、N62D、I71V、L107I、K131E、K135Q、L142K、Y148I、G197D、Y224K、Y226F、E239G、V250A、V250I、N251R、L253A、L253H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375K、E375Y、K379R、Q380R、A437G、A444T、E466K、D476H、P477D、K478D、A484C、A484Q、A484N、A484E、A484D、A484K、A484R、A484H、A484Y及A484X(其中X表示非天然氨基酸,如本文所述)、E508R、D510K、D510R、K512Y、E515Q、K539E、D570S及T571V(对应于Φ29聚合酶中的位置)。
在一些实施方案中,经修饰的聚合酶包含对应于以下的位置处的一或多个(例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如全部)氨基酸突变:Φ29聚合酶中的K131、K135、L142、Y148、Y224、E239、V250、L253、R306、R308、E375、A437、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571。
B.大多数聚合酶序列(majority polymerase sequence)
在一些实施方案中,由本发明提供的经修饰的聚合酶包含根据野生型聚合酶序列(例如如表1中所述)的聚合酶序列,其具有一或多个修饰(例如如表2-6中所示例,或其两个或更多个的组合)。在一些实施方案中,野生型聚合酶氨基酸序列(例如如表1中所述)提供大多数聚合酶序列,其中可进行一或多个修饰以产生经修饰的聚合酶。如本文所用,经修饰的聚合酶的“大多数聚合酶序列”或“大多数序列”是指在经修饰的聚合酶氨基酸序列内占绝大多数的野生型聚合酶氨基酸序列(例如,其中经修饰的聚合酶序列中的至少50%氨基酸对应于大多数序列中的氨基酸)。在一些实施方案中,经修饰的聚合酶序列包含进一步包含一或多个氨基酸突变的大多数序列。在一些实施方案中,一或多个氨基酸突变包含对应于同源蛋白质中的位置的位置处的氨基酸。在一些实施方案中,表2-6中的任一个中所述的聚合酶氨基酸序列提供大多数聚合酶序列,其中可进行一或多个修饰以产生经修饰的聚合酶。
在一些实施方案中,经修饰的聚合酶具有与表1中所列的一或多个聚合酶(例如与表1中所列的SEQ ID NO:1、SEQ ID NO:2-5、SEQ ID NO:6-22或SEQ ID NO:23-33)的至少25%氨基酸序列一致性。在一些实施方案中,经修饰的聚合酶具有与表1中所列的聚合酶中的一或多个(例如与表1中所列的SEQ ID NO:1、SEQ ID NO:2-5、SEQ ID NO:6-22或SEQ IDNO:23-33)的25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列一致性。在一些实施方案中,经修饰的聚合酶具有与SEQ ID No:2-5中的任一个的25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列一致性。在一些实施方案中,经修饰的聚合酶具有与SEQ ID NO:2的25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列一致性。在一些实施方案中,经修饰的聚合酶具有与SEQ ID NO:23-33中的任一个的25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列一致性。在一些实施方案中,此类经修饰的聚合酶包括一或多个在此申请中所提供的不同经修饰的聚合酶配置和/或实例的内容中所描述的氨基酸突变和/或域取代。在一些实施方案中,经修饰的聚合酶中的唯一修饰为本发明中所提供的修饰(例如氨基酸取代)中的一或多个,且除此以外,聚合酶的序列与野生型聚合酶(例如表1的序列)或与表2-7中的任一个所描述的序列一致。
序列一致性可参考经修饰的聚合酶的整个氨基酸序列。然而,在一些实施方案中,序列一致性参考经修饰的聚合酶的一或多个区段、子域或域。举例而言,在一些实施方案中,经修饰的聚合酶的一或多个区段、子域或域描述为具有与表1中所列的参考聚合酶的区段、子域或域(例如与表1中所列的SEQ ID NO:1、SEQ ID NO:2-5、SEQ ID NO:6-22或SEQ IDNO:23-33)的至少50%氨基酸序列一致性。此类区段、子域或域可具有与表1中所列的参考聚合酶的相对应区段、子域或域(例如与表1中所列的SEQ ID NO:1、SEQ ID NO:2-5、SEQ IDNO:6-22或SEQ ID NO:23-33)的例如50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性。在一些实施方案中,此类区段、子域或域可具有与SEQ ID No:2-5中的任一个的相对应区段、子域或域的例如50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性。在一些实施方案中,此类区段、子域或域可具有与SEQ ID NO:2的相对应区段、子域或域的例如50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性。在一些实施方案中,此类区段、子域或域可具有与SEQ ID No:23-33中的任一个的相对应区段、子域或域的例如50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列一致性。
出于比较两个或更多个氨基酸序列的目的,第一氨基酸序列与第二氨基酸序列之间的“序列一致性”百分比(在本文中也称为“氨基酸一致性”)可通过将[第一氨基酸序列中与第二氨基酸序列中对应位置处的氨基酸残基一致的氨基酸残基的数目]除以[第一氨基酸序列中氨基酸残基的总数目]且乘以[100%]来计算,其中与第一氨基酸序列相比第二氨基酸序列中氨基酸残基的缺失、插入、取代或添加各个均视为单一氨基酸残基(位置)处的差异,即如本文所定义的“氨基酸差异”。替代地,两个氨基酸序列之间的序列一致性程度可使用已知电脑算法(例如通过Smith及Waterman(1970)Adv.Appl.Math.2:482c的局部同源性算法,通过Needleman及Wunsch,J.Mol.Biol.(1970)48:443的同源性比对算法,通过Pearson及Lipman.Proc.Natl.Acad.Sci.USA(1998)85:2444的相似性方法的搜索,或通过如Blast、Clustal Omega的可利用的算法或其他序列比对算法的电脑化实施)且例如使用标准设置来计算。通常,出于根据上文概述的计算方法测定两个氨基酸序列之间的“序列一致性”的百分比的目的,具有最大氨基酸残基数目的氨基酸序列将视为“第一”氨基酸序列且另一氨基酸序列将视为“第二”氨基酸序列。
另外或替代地,可评定两个或更多个序列的序列间的一致性。在两个或更多个核酸或氨基酸序列的内容中,术语“一致”或百分比“一致性”是指相同的两个或更多个序列或子序列。若当在比较窗上经比较及比对以达到最大对应度时,在指定区域上或整个序列上,或如使用以下序列比对演算法中的一个或通过手动比对及目视检查所测量的指定区域上,两个序列具有指定百分比的相同氨基酸残基或核苷酸(例如至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%一致),则两个序列“实质上一致”。任选地,该一致性存在于长度为至少约25、50、75或100个氨基酸的区域上,或更佳长度为100至150、200或更多个氨基酸的区域上。
另外或替代地,可评定两个或更多个序列的序列间的比对。在两个或更多个核酸或氨基酸序列的内容中,术语“比对”或“比对”百分比是指相同的两个或更多个序列或子序列。若当在比较窗上经比较及比对以达到最大对应时,在指定区域上或整个序列上,或如使用以下序列比对演算法中的一个或通过手动比对及目视检查所测量的指定区域上,两个序列具有指定百分比的相同氨基酸残基或核苷酸(例如至少80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%一致),则两个序列“实质上比对”。任选地,该比对存在于长度为至少约25、50、75或100个氨基酸的区域上,或更佳长度为100至150、200或更多个氨基酸的区域上。
(i)经修饰的屎肠球菌聚合酶
本申请部分地基于认识到,来自屎肠球菌的聚合酶可有利地用作体外聚合反应中的试剂,诸如单分子核酸测序反应。本发明人已认识到,野生型屎肠球菌聚合酶显示稳固的链置换活性、对核苷酸底物(例如超过70千碱基)的较高持续效力以及利用合成核苷酸类似物的能力。图24展示来自评定相比于已知持续性聚合酶QTDE1.0的野生型EF聚合酶的持续效力的滚环分析的结果。本发明人已进一步认识到,对野生型屎肠球菌聚合酶的某些修饰(例如突变、插入和/或取代)进一步增强这些及其他功能属性,以提供用于核酸测序反应的改善试剂。因此,在一些实施方案中,经修饰的聚合酶为经修饰的屎肠球菌聚合酶(即,包含屎肠球菌聚合酶大多数序列,诸如SEQ ID NO:2-5中的任一个)。图13A展示四种天然存在屎肠球菌聚合酶变体之间的序列一致性。图13B展示变体之间共有的序列一致性。序列通过其NCBI蛋白质数据库登录号列出。在一些实施方案中,经修饰的聚合酶包含屎肠球菌聚合酶大多数序列SEQ ID NO:2。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含对应于一下的一或多个位置处(例如在1-117个位置处或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)的氨基酸修饰(亦即突变):参考屎肠球菌聚合酶的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。经修饰的屎肠球菌聚合酶可包含一或多个相对于SEQ ID No:2-5或表2或表7中所述的序列的氨基酸修饰。
此类修饰可包含缺失(例如在对应于以下的位置处的氨基酸缺失:参考屎肠球菌聚合酶中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569或T571(或其任何组合))。
替代地或另外,此类修饰可包含添加(例如,在对应于以下的位置处的同源氨基酸添加:参考屎肠球菌聚合酶中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569或T571(或其任何组合))。
替代地或另外,此类修饰可包含取代。举例而言,修饰可包含对应于以下的一或多个位置处(例如在1-117个位置处或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)的取代:屎肠球菌聚合酶中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,取代是选自由以下组成的组:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W、V526L、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S(对应于参考屎肠球菌聚合酶中的位置)。
示例性修饰组合列于表7中。
在一些实施方案中,经修饰的屎肠球菌聚合酶不包含对应于以下一或多个位置处(例如,2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个,以其任何组合形式)的氨基酸修饰(即突变):Φ29聚合酶(SEQ ID NO:1)中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含至少一种改变聚合酶相对于参考屎肠球菌聚合酶的特征的修饰。举例而言,修饰可使得:增加(或替代地降低)持续效力;增加(或替代地降低)核酸酶活性;增加(或替代地降低)精确度;增加(或替代地降低)(一或多个底物的)核苷酸底物利用率;增加(或替代地降低)对一或多个底物的亲和力;增加(或替代地降低)复制能力;增加(或替代地降低)平均读段长度;增加(或替代地降低)在表面处的正电性电荷。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多个改善持续效力的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含对应于屎肠球菌聚合酶中的T568及M569的一或多个位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含T568及M569中的一个或两个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:选自T568D及T568S的T568处的突变;及选自M569T及M569V的M569处的突变。在一些实施方案中,经修饰的屎肠球菌聚合酶包含T568及K500中的每一个处的突变。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含消除或降低外切核酸酶活性的修饰。举例而言,在一些实施方案中,经修饰的屎肠球菌聚合酶包含N59处的突变,其消除或降低外切核酸酶活性。在一些实施方案中,经修饰的屎肠球菌聚合酶包含N59D。在一些实施方案中,经修饰的屎肠球菌聚合酶不包含N59处的突变(例如经修饰的屎肠球菌聚合酶包含N59)。应了解,视所需功能性而定,经修饰的屎肠球菌聚合酶中N59处的突变可引入或恢复回野生型。相应地,在一些实施方案中,经修饰的屎肠球菌聚合酶包含选自表2的序列,其经进一步修饰以在N59处引入突变(例如经进一步修饰以包含N59D)。在一些实施方案中,经修饰的屎肠球菌聚合酶包含选自表2的序列,其经进一步修饰以使N59处的突变恢复回野生型(例如,经进一步修饰以包含D59N)。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种修饰,其改善在活性位点处的核苷酸底物利用率。在一些实施方案中,此类修饰增强聚合反应中核苷酸或核苷酸类似物(例如六磷酸核苷酸)至新合成核酸链中的并入。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于屎肠球菌聚合酶中的V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500中的一或多个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的屎肠球菌聚合酶包含以下中的一或多个:选自V261A及V261I的V261处的突变;选自L264A、L264H及L264M的L264处的突变;S267A;选自I384F及I384S的I384处的突变;选自E391Y、E391W、E391F、E391H、E391M、E391K及E391R的E391处的突变;W452Y;G453A;Y455W;D492H;及K500E。在一些实施方案中,本发明的经修饰的聚合酶为包含在V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500中的每一个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的屎肠球菌聚合酶包含V261A、L264H及K500E。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含改善在活性位点处的核苷酸底物利用率的区段插入。举例而言,基于结构同源性分析,确定了:野生型屎肠球菌聚合酶不含有如在Φ29聚合酶的掌型域中所发现的,接近活性位点的结构基元。跨越Φ29序列中的D503至K525的此结构基元形成与核苷酸类似物(例如核苷酸六磷酸酯)的有利相互作用,从而改善测序反应中的效能。图14A-14B展示屎肠球菌聚合酶与Φ29的比较。在一些实施方案中,活性位点修饰包含区段插入,其用对应于Φ29聚合酶中的位置D503至K525的区段(例如包含跨越Φ29聚合酶中的D503至K525的序列的区段,或M2Y聚合酶中的同源区段)置换屎肠球菌聚合酶中的位置519至522处的氨基酸(E519至G522)。在一些实施方案中,区段插入包含一或多个在对应于Φ29聚合酶中的E508、D510、K512及E515Q的位置处的突变。在一些实施方案中,区段插入包含选自E508R、D510R、K512Y及E515Q的一或多个突变。在一些实施方案中,区段插入用包含氨基酸序列DIYAKRVRGYLIECSPDEATTTK(SEQ ID NO:841)的区段置换屎肠球菌聚合酶中的位置519至522处的氨基酸(EIKG,SEQ ID NO:840)。在一些实施方案中,区段插入用包含氨基酸序列DIYMKRVRGYLVQGSPDDYTDIK(SEQ ID NO:842)的区段置换屎肠球菌聚合酶中的位置519至522处的氨基酸(EIKG,SEQ ID NO:840)。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种提高聚合精确度的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下的位置处的突变:屎肠球菌聚合酶中的E65、Y133、V261、L264、S267、I384、E391、G400、V443、L445、A446、S447、V449、T450、W452、G453、Y455、K500、S503、E523、L555及P556。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下中的一或多个处的突变的经修饰的屎肠球菌聚合酶:E65、Y133、V261、L264、S267、I384、E391、G400、V443、L445、A446、S447、V449、T450、W452、G453、Y455、K500、S503、E523、L555及P556。在一些实施方案中,经修饰的屎肠球菌聚合酶包含以下中的一或多个:E65S;Y133L;选自V261A及V261I的V261处的突变;选自L264A及L264H的L264处的突变;S267A;选自I384F、I384S的I384处的突变;选自E391Y、E391W、E391F及E391K的E391处的突变;G400L;V443T;L445M;A446G;S447V;V449I;T450A;W452Y;G453A、Y455W;K500E;S503A;选自E523K、E523Y、E523F、E523H及E523W的E523处的突变;L555K;及P556A。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强DNA结合的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于屎肠球菌聚合酶中的Q317、S319、I322、Q323、R429、L555及T559的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在Q317、S319、I322、Q323、R429、L555及T559中的一或多个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:Q317R;S319R;I322K;Q323G;R429G;L555K;及T559V。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强类似物结合的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于屎肠球菌聚合酶中的E391、S503及E523的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在E391、S503及E523中的一或多个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:在选自E391Y、E391W、E391F及E391K的E391处的突变;S503A;及在选自E523K、E523Y、E523F、E523H及E523W的E523处的突变。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强链置换的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于屎肠球菌聚合酶中的Q206、E436及L437的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在Q206、E436及L437中的一或多个处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:选自Q206R、Q206K及Q206H的Q206处的突变;E436R;及选自L437Y及L437E的L437处的突变。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强平均读段长度的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于屎肠球菌聚合酶中的E436、L437、R534、T568及M569的位置处的突变。在一些实施方案中,经修饰的屎肠球菌聚合酶包含在E436、L437、R534、T568及M569中的一或多者处的突变。在一些实施方案中,经修饰的聚合酶包含以下中的一或多者:E436R;选自L437Y及L437E的L437处的突变;R534K;选自T568D及T568S的T568处的突变;及选自M569T及M569V的M569处的突变。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强复制能力(例如在45℃下)的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下的位置处的突变:屎肠球菌聚合酶中的T13、V25、C26、D27、N33、I34、F36、S42、D54、E60、M95、T110、T114、K119、P136、P147、E152、I153、P160、N175、F188、S216、R217、D232、A236、V247、P273、P275、E283、V315、S319、L320、Q323、E338、T345、F352、F353、T364、D414、D425、E436、F465、E485、A486、L490、S503、E523、V526、G547、L555、R558、V564、M569及T571。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下中的一或多者处的突变的经修饰的屎肠球菌聚合酶:T13、V25、C26、D27、N33、I34、F36、S42、D54、E60、M95、T110、T114、K119、P136、P147、E152、I153、P160、N175、F188、S216、R217、D232、A236、V247、P273、P275、E283、V315、S319、L320、Q323、E338、T345、F352、F353、T364、D414、D425、E436、F465、E485、A486、L490、S503、E523、V526、G547、L555、R558、V564、M569及T571。在一些实施方案中,经修饰的聚合酶包含以下中的一或多者:T13N;V25L;C26W;D27E;N33T;I34V;F36V;S42T;D54Y;E60V;选自M95T及M95K的位置M95处的突变;T110I;T114S;K119Q;P136T;选自P147Q及P147T的位置P147处的突变;E152D;I153V;P160A;N175Y;F188C;选自S216G及S216R的位置S216处的突变;R217G;D232H;A236G;V247D;P273R;P275S;E283K;V315L;S319R;选自L320M及L320T的位置L320处的突变;Q323R;E338K;T345I;F352I;F353C;T364I;D414V;D425N;E436G;F465Y;E485D;A486E;L490M;S503T;E523V;V526L;G547S;L555R;R558H;V564L;M569K;及T571S。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多个增加蛋白质表面处的正电性电荷的修饰。类似地,在一些实施方案中,经修饰的屎肠球菌聚合酶包含增加的等电点。在一些实施方案中,经修饰的屎肠球菌聚合酶的等电点比野生型屎肠球菌聚合酶(例如SEQ ID NO:2)的等电点高0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1.0、1.0-1.5、1.5-2.0、2.0-2.5、2.5-3.0、3.0-3.5、3.5-4.0、4.0-4.5、5.0-5.5、5.5-6.0、6.0-6.5、6.5-7.0、7.0-7.5、7.5-8.0、8.0-8.5、8.5-9.0、9.0-9.5或9.5-10.0等电点(pI)单元。测量表面电荷及等电点的方法为一般本领域技术人员所已知。等电点(pI)为本领域技术人员熟悉的蛋白质生物化学中的标准概念。pI为蛋白质显示净电荷为零时的pH值。pI的增加意味蛋白质显示净电荷为零需要较高pH值。因此,pI的增加表示在给定pH下蛋白质的净正电荷的增加。测定蛋白质的pI的方法在本领域中已知。举例而言,蛋白质的pI可由蛋白质中所存在的各氨基酸的平均pKa值计算出(“计算的pI”)。这些计算可使用本领域中已知的电脑程序(例如来自Scripps研究协会的蛋白质计算器及来自ExPASy的计算pI/MW工具)进行。应使用相同计算技术/程序进行不同分子之间pI值的比较。适当时,蛋白质的计算的pI可使用等电聚焦技术以实验方式证实(“观测的pI”)。此技术根据其pI使用电泳来分离蛋白质。通常使用具有固定pH梯度的凝胶进行等电聚焦。当施加电场时,蛋白质经由pH梯度迁移直至其达到具有零净电荷时的pH,此时为蛋白质的pI。通过等电聚焦提供的结果可在本质上具有相对低解析度,且因此在一些实施方案中,通过计算pI(如上文所描述)提供的结果更适于使用。
在一些实施方案中,此类表面电荷修饰通过提供对核苷酸类似物更具吸引力的蛋白质表面,来提高包含负电性组分(例如核酸连接子)的核苷酸类似物的并入率。在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下的位置处的突变:屎肠球菌聚合酶中的E139;E142;N145;I148;D167;D171;D189;D374;E385;E391;N467;E482;D492;K495;D521;E523;D533;E537及E545。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下中的一或多个处的突变的经修饰的屎肠球菌聚合酶:E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:选自E139K、E139Q、E139R及E139H的E139处的突变;选自E142K、E142H、E142R及E142Q的E142处的突变;选自N145K、N145H及N145R的N145处的突变;选自I148K、I148H及I148R的I148处的突变;选自D167P、D167K、D167H及D167R的D167处的突变;选自D171K、D171H及D171R的D171处的突变;选自D189K、D189H及D189R的D189处的突变;选自D374G、D374Q及D374H的D374处的突变;选自E385Y、E385K、E385R、E385N、E385Q、E385L及E385A的E385处的突变;选自E391Y、E391W、E391K及E391F的E391处的突变;选自N467R、N467K、N467H、N467S及N467T的N467处的突变;选自E482K、E482H及E482R的E482处的突变;选自D492H、D492K及D492R的D492处的突变;K495R;选自D521K、D521H及D521R的D521处的突变;选自E523K、E523Y、E523H、E523R、E523F及E523W的E523处的突变;选自D533A、D533Q、D533T、D533R及D533S的D533处的突变;选自E537K、E537H及E537R的E537处的突变;以及选自E545K、E545H及E545R的E545处的突变。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强蛋白质稳定性(例如增强热稳定性、蛋白质产率和/或活性聚合酶群体)的修饰。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下中的位置处的突变:屎肠球菌聚合酶中的K4、S22、D27、I34、D54、E60、E85、M95、N106、T110、Q122、Y133、P136、P147、D167、T211、D232、P275、R308、S319、L320、E323、D337、E338、D341、T345、F352、T364、D414、F465、T479、E485、L490、S493、Q513及R558。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下中的一或多个处的突变的经修饰的屎肠球菌聚合酶:K4、S22、D27、I34、D54、E60、E85、M95、N106、T110、Q122、Y133、P136、P147、D167、T211、D232、P275、R308、S319、L320、Q323、D337、E338、D341、T345、F352、T364、D414、F465、T479、E485、L490、S493、Q513及R558。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:K4R;S22A;D27E;I34V;D54Y;选自E60V及E60L的E60处的突变;E85P;M95K;T110I;N106G;Q122V;Y133L;P136T;选自P147Q及P147T的P147处的突变;D167P;T211A;D232K;P275S;R308G;S319R;L320M;Q323V;D337G;E338K;D341T;T345I;F352I;T364I;D414V;F465Y;T479V;E485D;L490M;S493P;Q513D;及R558H。
在一些实施方案中,经修饰的屎肠球菌聚合酶包含一或多种增强聚合反应中的效能(例如通过改善的精确度、增加的读段长度和/或增加的速度)的修饰。在一些实施方案中,经修饰的聚合酶包含增强在一或多个对应于屎肠球菌聚合酶中的E142、V261、L264、S319、E391、L437、E482、D492、K500、E519、D521、E523、T568及M569的位置处的突变。在一些实施方案中,经修饰的屎肠球菌聚合酶包含在以下中的一或多个处的突变:E142、V261、L264、S319、E391、L437、E482、D492、K500、E519、D521、E523、T568及M569。在一些实施方案中,经修饰的聚合酶包含以下中的一或多个:选自E142K及E142Q的E142处的突变;选自V261A及V261I的V261处的突变;选自L264A、L264H及L264M的L264处的突变;选自E391Y、E391W、E391F、E391H、E391M、E391K及E391R的E391处的突变;选自D521R及D521K的D521处的突变;选自E523Y及E523K的E523处的突变;及选自S319L、L437Y、E482K、D492H、K500E、E519R、T568S及M569V的突变。
应了解,出于本发明的目的,本文所描述的屎肠球菌聚合酶修饰可根据不同功能增强或不同结构域来分类。有利地,本发明的经修饰的屎肠球菌聚合酶包含多个选自本文所描述的不同功能和/或结构分类的修饰。这由表2中列出的,根据本文所描述的实施方案工程改造的经修饰的屎肠球菌聚合酶变体示例。在一些实施方案中,经修饰的屎肠球菌聚合酶包含与表2中提供的SEQ ID No:34-305中的任一个至少25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的氨基酸序列。在一些实施方案中,经修饰的屎肠球菌聚合酶包含SEQ ID No:34-305中的任一个的氨基酸序列。在一些实施方案中,经修饰的屎肠球菌聚合酶由与表2中所提供的SEQ IDNo:34-305中的任一个至少25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的氨基酸序列组成。在一些实施方案中,经修饰的屎肠球菌聚合酶由SEQ ID NO:34-305中的任一个的氨基酸序列组成。在一些实施方案中,经修饰的屎肠球菌聚合酶包含与SEQ ID NO:88、SEQ ID NO:157或SEQ ID NO:180至少25-50%、50-60%、60-70%、70-80%、80-90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%一致的氨基酸序列。在一些实施方案中,经修饰的屎肠球菌聚合酶包含SEQ ID NO:88、SEQ ID NO:157或SEQ ID NO:180的氨基酸序列。在一些实施方案中,经修饰的屎肠球菌聚合酶由SEQ ID NO:88、SEQ ID NO:157或SEQ ID NO:180的氨基酸序列组成。
在一些实施方案中,经修饰的聚合酶中的唯一修饰为本发明中所提供的修饰(例如,屎肠球菌聚合酶中的氨基酸取代)中的一或多个,且除此以外,聚合酶的序列与野生型聚合酶(例如,SEQ ID NO:2-5)或与表2或表7中描述的序列一致。
(ii)经修饰的Φ29聚合酶
在一些实施方案中,经修饰的聚合酶是经修饰的Φ29聚合酶(即包含Φ29聚合酶大多数序列,诸如SEQ ID NO:1)。
在一些实施方案中,经修饰的Φ29聚合酶包含对应于以下的一或多个位置(例如,2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44个位置,以其任何组合)处的氨基酸修饰(即突变):参考Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571。
此类修饰可包含缺失(例如在对应于以下的位置处的氨基酸缺失:参考Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571(或其任何组合))。
替代地或另外,此类修饰可包含添加(例如在对应于以下的位置处的同源氨基酸添加:参考Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570或T571(或其任何组合))。
替代地或另外,此类修饰可包含取代。举例而言,修饰可包含对应于以下的一或多个位置(例如在1-44个位置或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有,且以任何组合)处的取代:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570及T571。在一些实施方案中,取代是选自由以下组成的组:M8R、V51A、N62D、I71V、L107I、K131E、K135Q、L142K、Y148I、G197D、Y224K、Y226F、E239G、V250A、V250I、N251R、L253A、L253H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375K、E375Y、K379R、Q380R、A437G、A444T、E466K、D476H、P477D、K478D、A484C、A484Q、A484N、A484E、A484D、A484K、A484R、A484H、A484Y及A484X(其中X表示非天然氨基酸,如本文所描述)、E508R、D510K、D510R、K512Y、E515Q、K539E、D570S及T571V(对应于参考Φ29聚合酶中的位置)。
举例而言,在一些实施方案中,在经修饰的聚合酶包含Φ29聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个在如前文中列出的位置处的突变。在一些实施方案中,在经修饰的聚合酶不包含Φ29聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个对应于上述所列出的位置的氨基酸,例如,如通过同源性比对或本领域中已知的其他方法测定。
在一些实施方案中,经修饰的聚合酶包含在一或多个对应于Φ29聚合酶中的Y148、Y226、V250、N251、T368、E375、K379、Q380、A437、P477、K478及A484的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在Y148、Y226、V250、N251、T368、E375、K379、Q380、A437、P477、K478及A484中的一或多个处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484C中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484S中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484T中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484Q中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484N中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484E中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484D中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484K中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484R中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484H中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484Y中的一或多个。在一些实施方案中,经修饰的聚合酶包含Y148I、Y226F、V250A、N251R、T368F、E375K、K379R、Q380R、A437G、P477D、K478D及A484X中的一或多个,其中X表示非天然氨基酸,如本文中所描述。如本文所用,一或多个可以是2个或更多个、4个或更多个、6个或更多个、8个或更多个、10个或更多个、12个或更多个,例如,所有的所列出的氨基酸取代。
在一些实施方案中,经修饰的聚合酶包含对应于以下的一或多个位置(例如在1至35个或其间任何整数个位置,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有)处的突变:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G197、Y224、E239、V250、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、A437、A444、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571。在一些实施方案中,经修饰的聚合酶为包含在Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G197、Y224、E239、V250、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、A437、A444、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571中的一或多个处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含一或多个(例如1至35个或其间任何整数个,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个、20个或更多个,例如所有)以下突变:M8R、V51A、N62D、I71V、L107I、K131E、K135Q、L142K、G197D、Y224K、E239G、V250A、V250I、L253A、L253H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375Y、A437G、A444T、E466K、D476H、A484E、E508R、D510K、D510R、K512Y、E515Q、K539E、D570S及T571V。
在一些实施方案中,经修饰的聚合酶包含对应于以下的一或多个位置处(例如在1-18个或其间任何整数个位置处,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个,例如所有)的突变:Φ29聚合酶中的K135、L142、Y224、E239、V250、L253、E375、A437、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571。在一些实施方案中,本发明的经修饰的聚合酶为包含在K135、L142、Y224、E239、V250、L253、E375、A437、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571中的一或多个处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含K135Q、L142K、Y224K、E239G、V250I、L253A、E375Y、A437G、E466K、D476H、A484E、E508R、D510R、K512Y、E515Q、K539E、D570S及T571V中的一或多个(例如1-18个或其间任何整数个,例如2个或更多个、5个或更多个、10个或更多个、15个或更多个,例如所有)。
在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2或3个)对应于Φ29聚合酶的G197、I71及L107的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在G197、I71及L107中的一或多个(例如1、2或3个)处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含G197D、I71V及L107I中的一或多个(例如1、2或3个)。
C.域、子域及区段修饰
如上文所述,修饰可包含一或多个氨基酸(其可为或可不为连续的)的添加、取代或缺失,诸如:(i)聚合酶域、子域或区段内的氨基酸的添加、取代或缺失;或(i)聚合酶域、子域或区段的添加、取代或缺失。
图2、图9B及图15提供示例性聚合酶域及子域。举例而言,图2描绘Φ29聚合酶200的图解说明。折叠三维结构包含对应于覆盖图202的不同的域及子域:N端外切核酸酶域(1)及含有掌型子域(2)、末端蛋白质区域1(terminal protein region,TPR1)子域(3)、手指型子域(4)、TPR2子域(5)及拇指型子域(6)的C端聚合酶域。这些域及子域映射至根据多肽结构204的多肽链区,其以N端至C端方式定向。如所示,N端外切核酸酶域(1)的跨度为野生型Φ29聚合酶的残基1-189且C端聚合酶域的跨度为该聚合酶的残基190-575。在C端聚合酶域中,掌型子域(2)的跨度为野生型Φ29聚合酶的残基190-260及427-530,TPR1子域(3)的跨度为该聚合酶的残基261-358,手指型子域(4)的跨度为该聚合酶的残基359-394,TPR2子域(5)的跨度为该聚合酶的残基395-426,且拇指型子域(6)的跨度为该聚合酶的残基531-575。
如本文所用,聚合酶“区段”是指聚合酶的部分(例如,至少2个或更多连续氨基酸)。在一些实施方案中,区段包含至少2个、至少3个、至少4个、至少5个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少110个、至少120个、至少130个、至少140个、至少150个、至少160个、至少170个、至少180个、至少190个、至少200个、至少210个、至少220个、至少230个、至少240个、至少250个、至少275或至少300个连续聚合酶氨基酸。在一些实施方案中,区段包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、9、20、21、22、23、44、25、26、27、28、29、30、31、32、33、34、35、36、37、38、9、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、105、110、115、120、125、130、140或150个连续聚合酶氨基酸。在一些实施方案中,区段包含聚合酶的域或子域。
(i)聚合酶域、子域或区段内的修饰
在一些实施方案中,本申请的重组聚合酶包含一或多个在聚合酶的一或多个域、子域或区段(任选地包括侧接氨基酸)中的氨基酸突变。在一些实施方案中,重组聚合酶包含一或多个在外切核酸酶区域、掌型区域、TPR1区域、手指型区域、TPR2区域及拇指型区域中的一或多个中的氨基酸突变。
在一些实施方案中,重组聚合酶包含在外切核酸酶区域(例如外切核酸酶区域的外切核酸酶环)中的一或多个位置处的突变。在一些实施方案中,具有屎肠球菌聚合酶大多数序列的重组聚合酶包含在外切核酸酶区域中的一或多个位置处的突变。例如,在一些实施方案中,本发明的重组聚合酶为包含在对应于以下的一或多个(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36个,以任何组合形式)处的突变的经修饰的屎肠球菌聚合酶:屎肠球菌聚合酶的外切核酸酶区域中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188及D189。在一些实施方案中,重组聚合酶包含在一或多个对应于以下的位置(例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或36个位置,以任何组合形式)处的突变:屎肠球菌聚合酶中的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188及D189。相应地,在一些实施方案中,在重组聚合酶不包含屎肠球菌聚合酶大多数序列的情况下,重组聚合酶包含一或多个对应于上述列出的位置的氨基酸,例如,如通过同源性比对或本领域中已知的其他方法所测定。在一些实施方案中,重组聚合酶包含以下中的一或多个:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H及D189R。
在一些实施方案中,本发明的经修饰的屎肠球菌聚合酶包含消除或降低外切核酸酶活性的修饰。举例而言,在一些实施方案中,经修饰的屎肠球菌聚合酶包含N59处的突变,其消除或降低外切核酸酶活性。在一些实施方案中,经修饰的屎肠球菌聚合酶包含N59D。在一些实施方案中,经修饰的屎肠球菌聚合酶不包含N59处的突变(例如经修饰的屎肠球菌聚合酶包含N59)。应了解,视所需功能性而定,经修饰的屎肠球菌聚合酶中N59处的突变可引入或恢复回野生型。相应地,在一些实施方案中,经修饰的屎肠球菌聚合酶包含选自表2的序列,其经进一步修饰以在N59处引入突变(例如经进一步修饰以包含N59D)。在一些实施方案中,经修饰的屎肠球菌聚合酶包含选自表2的序列,其经进一步修饰以使N59处的突变恢复回野生型(例如,经进一步修饰以包含D59N)。
在一些实施方案中,具有Φ29聚合酶大多数序列的经修饰的聚合酶包含在外切核酸酶区域中的一或多个位置处的突变。举例而言,在一些实施方案中,本发明的经修饰的聚合酶为包含在对应于以下的一或多个(例如,2、3、4、5、6、7、8、9、10或11个,以任何组合形式)处的突变的经修饰的Φ29聚合酶:Φ29聚合酶的外切核酸酶区域中的E75、R76、S82、A83、D84、G85、L86、P87、N88、Y90及N91。在一些实施方案中,经修饰的聚合酶包含一或多个在对应于Φ29聚合酶中的E75、R76、S82、A83、D84、G85、L86、P87、N88、Y90及N91的位置处的氨基酸突变。相应地,在一些实施方案中,在经修饰的聚合酶不包含Φ29聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个对应于上述所列出的位置的氨基酸,例如,如通过同源性比对或本领域中已知的其他方法所测定。在一些实施方案中,经修饰的聚合酶包含E75F、R76K、S82C、A83K、D84E、G85A、L86K、P87E、N88R、Y90F及N91S中的一或多个。相应地,在一些实施方案中,包含外切核酸酶域或其部分的区段被来自不同聚合酶的对应的外切核酸酶域交换。举例而言,在一些实施方案中,包含一种聚合酶的外切核酸酶域的环及侧接氨基酸的区段被来自另一聚合酶的对应的区段置换。举例而言,在一些实施方案中,Φ29E75-N91区段用来自屎肠球菌的对应F72-S89区段置换。在一些实施方案中,交换包含外切核酸酶环的区段可以减小聚合酶的脉冲间距离。
在一些实施方案中,经修饰的聚合酶包含在TPR1区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下的位置(例如1、2、3、4、5、6或7个,以任何组合形式)处的突变:屎肠球菌聚合酶中的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364及D374。在一些实施方案中,本发明的经修饰的聚合酶为包含在R308、S319、L320、E323、D337、E338及D341中的一或多个(例如,1、2、3、4、5、6或7个,以任何组合形式)处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,将R308、S319、L320、E323、D337、E338及D341中的一或多个(例如1、2、3、4、5、6或7个)处的氨基酸变为其他聚合酶(例如Φ29、M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中的对应位置处的氨基酸。在一些实施方案中,经修饰的聚合酶包含R308G、S319L、L320M、E323V、D337G、E338K及D341T中的一或多个(例如,1、2、3、4、5、6或7个,以任何组合形式)。
在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2、3、4、5或6个,以任何组合形式)对应于以下的位置处的突变:Φ29聚合酶中的Y281、I288、T301、D325、D341及K354。在一些实施方案中,本发明的经修饰的聚合酶为包含在Y281、I288、T301、D325、D341及K354中的一或多个(例如1、2、3、4、5或6个,以任何组合形式)处的突变的经修饰的Φ29聚合酶。在一些实施方案中,Y281、I288、T301、D325、D341及K354中的一或多个(例如1、2、3、4、5或6个,以任何组合形式)处的氨基酸变为其他聚合酶(例如M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中的对应位置处的氨基酸。在一些实施方案中,经修饰的聚合酶包含Y281H、I288L、T301C、D325E、D341E及K354R中的一或多个(例如,1、2、3、4、5或6个,以任何组合形式)。在一些实施方案中,在一或多个(例如1、2、3、4、5或6个)对应于Φ29聚合酶中的Y281、I288、T301、D325、D341及K354的位置处的突变增加并入率(例如在单分子测序反应中)。
在一些实施方案中,经修饰的聚合酶包含在掌型区域中的一或多个位置处的突变。例如,在一些实施方案中,经修饰的聚合酶包含一或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38或39个,以任何组合形式)对应于以下的位置处的突变:屎肠球菌聚合酶中的Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下的一或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38或39个,以任何组合形式)处的突变的经修饰的屎肠球菌聚合酶:T211、D232、V261、L264、T479、E482、D492、S493、K500、Q513、E519、D521及E523。在一些实施方案中,在T211、D232、V261、L264、T479、E482、D492、S493、K500、Q513、E519、D521及E523中的一或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38或39,以任何组合形式)处的氨基酸变为其他聚合酶(例如,Φ29、M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中对应位置处的氨基酸。在一些实施方案中,修饰是选自由以下组成的组:Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2、3、4或5个,以任何组合形式)对应于Φ29聚合酶中的M429、G430、V431、I433及A444的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在M429、G430、V431、I433及A444的一或多个位置(例如1、2、3、4或5个,以任何组合形式)处的突变的经修饰的Φ29聚合酶。在一些实施方案中,M429、G430、V431、I433及A444中的一或多个(例如1、2、3、4或5个,以任何组合形式)处的氨基酸变为其他聚合酶(例如M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中的对应位置处的氨基酸。在一些实施方案中,经修饰的聚合酶包含M429L、G430A、V431S、I433V及A444T中的一或多个(例如,1、2、3、4或5个,以任何组合形式)。在一些实施方案中,在一或多个(例如1、2、3、4或5个,以任何组合形式)对应于Φ29聚合酶中的M429、G430、V431、I433及A444的位置处的突变增加精确度(例如在单分子测序反应中)。
在一些实施方案中,经修饰的聚合酶包含在手指型区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2、3、4、5、6或7个,以任何组合形式)对应于屎肠球菌聚合酶中的I384、E385、N388、E391、A396、N397及G400的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在一或多个(例如1、2、3、4、5、6或7个,以任何组合形式)对应于屎肠球菌聚合酶中的I384、E385、N388、E391、A396、N397及G400的位置处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,突变是选自由以下组成的组:I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L及G400L。在一些实施方案中,一或多个(例如1、2、3、4、5、6或7个,以任何组合形式)对应于I384、E385、N388、E391、A396、N397及G400的位置处的氨基酸变为其他聚合酶(例如Φ29、M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中的对应位置处的氨基酸。
在一些实施方案中,经修饰的聚合酶包含在TPR2区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2、3、4或5个,以任何组合形式)对应于屎肠球菌聚合酶中的D414、D425、R429、E436及L437的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在D414、D425、R429、E436及L437中的一或多个(例如1、2、3、4或5个,以任何组合形式)处的突变的经修饰的屎肠球菌聚合酶。在一些实施方案中,突变是选自由以下组成的组:D414V、D425N、R429G、E436R、E436G、L437Y及L437E。在一些实施方案中,对应于D414、D425、R429、E436或L437的位置处的氨基酸变为其他聚合酶中的对应位置处的氨基酸(例如Φ29、M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)。
在一些实施方案中,经修饰的聚合酶包含在拇指型区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个对应于以下的位置(例如,1、2、3、4、5、6、7、8、9、10、11、12或13个,以任何组合形式)处的突变:屎肠球菌聚合酶中的D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,本发明的经修饰的聚合酶为包含在以下的一或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12或13个,以任何组合形式)处的突变的经修饰的屎肠球菌聚合酶:D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在一些实施方案中,突变是选自由以下组成的组:D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。在一些实施方案中,一或多个(例如,1、2、3、4、5、6、7、8、9、10、11、12或13个,以任何组合形式)对应于D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571的位置处的氨基酸变为其他聚合酶(例如,Φ29、M2Y、铜绿蝇、芽孢杆菌菌株,例如GA-1)中的对应位置处的氨基酸。
在一些实施方案中,经修饰的聚合酶包含在掌型区域中的一或多个位置及外切核酸酶区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2或3个)对应于Φ29聚合酶的G197、M8及V51的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶为包含在G197、M8及V51中的一或多个(例如1、2或3个)处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含G197D、M8R及V51A中的一或多个(例如1、2或3个)。在一些实施方案中,在一或多个(例如1、2或3个)对应于Φ29聚合酶中的G197、M8及V51的位置处的突变可以提高生产率、热稳定性和/或提高负载效率(例如,负载至阵列的样品槽)。
在一些实施方案中,经修饰的聚合酶包含在掌型区域中的一或多个位置及拇指型区域中的一或多个位置处的突变。举例而言,在一些实施方案中,经修饰的聚合酶包含在一或多个(例如1、2、3、4或5个)对应于Φ29聚合酶中的E466、D476、K539、D570及T571的位置处的突变。在一些实施方案中,本发明的经修饰的聚合酶是包含在E466、D476、K539、D570及T571中的一或多个(例如1、2、3、4或5个)处的突变的经修饰的Φ29聚合酶。在一些实施方案中,经修饰的聚合酶包含E466K、D476H、K539E、D570S及T571V中的一或多个(例如1、2、3、4或5个)。
在一些实施方案中,经修饰的聚合酶包含一或多个(例如1、2、3、4、5、6或7个)在对应于M2Y聚合酶中的N59、Y145、V247、L250、E372、A481及K509的位置处的氨基酸突变。举例而言,在一些实施方案中,在经修饰的聚合酶包含M2Y聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个在如前文中列出的位置处的突变。在一些实施方案中,在经修饰的聚合酶不包含M2Y聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个对应于上述列出的位置的氨基酸突变,例如,如通过同源性比对或本领域中已知的其他方法所测定。
在一些实施方案中,经修饰的聚合酶包含野生型聚合酶(例如如表1中所述,例如SEQ ID NO:1、SEQ ID NO:2-5或SEQ ID NO:23-33)的一或多个区段(例如域或其部分,任选地包括侧接氨基酸)。在一些实施方案中,屎肠球菌聚合酶的一或多个区段(例如域或其部分,任选地包括侧接氨基酸)(例如SEQ ID NO:2-5中任一个的一或多个区段)可取代SEQ IDNO:1及6-33中任一个的一或多个区段。在一些实施方案中,屎肠球菌聚合酶的一或多个区段(例如域或其部分,任选地包括侧接氨基酸)(例如SEQ ID NO:2-5中任一个的一或多个区段)可取代SEQ ID NO:23-33中任一个的一或多个区段。在一些实施方案中,一或多个屎肠球菌聚合酶的区段(例如域或其部分,任选地包括侧接氨基酸)可取代一或多个Φ29聚合酶的区段。在一些实施方案中,一或多个屎肠球菌聚合酶的区段(例如域或其部分,任选地包括侧接氨基酸)可取代一或多个M2Y聚合酶的区段。在一些实施方案中,一或多个屎肠球菌聚合酶的区段(例如域或其部分,任选地包括侧接氨基酸)可取代一或多个Φ29聚合酶的区段和/或M2Y聚合酶的区段。在一些实施方案中,屎肠球菌聚合酶的一或多个区段(例如域或其部分,任选地包括侧接氨基酸)(例如SEQ ID NO:2-5中的任一个的域或其修饰形式,例如其含有一或多个氨基酸取代)可取代本文所描述的变体聚合酶(例如表3中所列的变体聚合酶,或表3中所说明的或表4-6中所描述的含有一或多个氨基酸取代或其他域取代的变体聚合酶)的一或多个区段。
(ii)聚合酶域、子域或区段-嵌合聚合酶的修饰
图2描绘Φ29聚合酶200的图解说明。折叠三维结构包含对应于覆盖图202的不同的域及子域:N端外切核酸酶域(1)及含有掌型子域(2)、末端蛋白质区域1(TPR1)子域(3)、手指型子域(4)、TPR2子域(5)及拇指型子域(6)的C端聚合酶域。这些域及子域映射至根据多肽结构204的多肽链区,其以N端至C端方式定向。如所示,N端外切核酸酶域(1)的跨度为野生型Φ29聚合酶的残基1-189且C端聚合酶域的跨度为该聚合酶的残基190-575。在C端聚合酶域中,掌型子域(2)的跨度为野生型Φ29聚合酶的残基190-260及427-530,TPR1子域(3)的跨度为该聚合酶的残基261-358,手指型子域(4)的跨度为该聚合酶的残基359-394,TPR2子域(5)的跨度为该聚合酶的残基395-426,且拇指型子域(6)的跨度为该聚合酶的残基531-575。此申请中所描述的不同聚合酶的等效区段(例如域或其部分,任选地包括侧接氨基酸)可以取代彼此以产生嵌合聚合酶。举例而言,来自一种聚合酶(例如具有表1中所示的野生型序列或具有表2-3中示例或表4-6中所描述的一或多个突变)的外切核酸酶域、掌型子域、TPR1子域、一或多个手指型子域、TPR2子域和/或拇指型子域中的一或多个可以取代另一聚合酶中的对应的域(例如具有表1中所示的野生型序列或具有表2-3中示例或表4-6中所描述的一或多个突变)。在一些实施方案中,包含这些域(任选地包括一或多个侧接氨基酸)中的一或多个的部分的区段可以被取代。
在一些实施方案中,聚合酶的修饰包含添加区段、子域或域。举例而言,在一些实施方案中,修饰包含聚合酶的区段、子域或域的重复。在一些实施方案中,修饰包含添加参考聚合酶的区段、子域或域(由此产生如本文所描述的“嵌合聚合酶”)。在一些实施方案中,聚合酶的修饰包含添加非天然化学实体。举例而言,在一些实施方案中,聚合酶的修饰包含在聚合酶的N端添加一或多个组氨酸残基。在一些实施方案中,聚合酶的修饰包含添加双生物素标签。
在一些实施方案中,聚合酶的修饰包含区段、子域或域的缺失。
在一些实施方案中,聚合酶的修饰包含用参考聚合酶的对应域取代区段、子域或域(由此产生如本文所述的“嵌合聚合酶”,参见例如图6)。举例而言,来自一个聚合酶(例如具有表1中所示的野生型序列或具有本文中示例的一或多种突变)的外切核酸酶域、掌型子域、TPR1子域、一或多个手指型子域、TPR2子域和/或拇指型子域中的一或多个可取代另一聚合酶(例如具有表1中所示的野生型序列或具有本文中示例的一或多种突变)中的对应域。在一些实施方案中,包含这些域(任选地包括一或多个侧接氨基酸)中的一或多个的部分的区段可以被取代。
举例而言,在一些实施方案中,经修饰的聚合酶包含TPR1区域取代。举例而言,在一些实施方案中,经修饰的聚合酶包含来自屎肠球菌的TPR1区域(例如SEQ ID NO:5中的V271-M375)替代对应于Φ29聚合酶(SEQ ID NO:1)中的S260-L359的TPR1区域。
在一些实施方案中,本申请的经修饰的聚合酶包含一或多个在外切核酸酶区域中的取代。举例而言,在一些实施方案中,经修饰的聚合酶包含来自M2Y的外切核酸酶区域的部分(例如SEQ ID NO:6中的M1-I51)替代对应于Φ29聚合酶(SEQ ID NO:1)中的M1-V54的氨基酸。在一些实施方案中,经修饰的聚合酶包含来自屎肠球菌的外切核酸酶区域的部分(例如SEQ ID NO:2中的F72-S89)替代对应于Φ29聚合酶(SEQ ID NO:1)中的E75-N91的氨基酸。在一些实施方案中,经修饰的聚合酶包含来自M2Y的外切核酸酶区域的部分及来自屎肠球菌的外切核酸酶区域的部分分别替代对应于Φ29聚合酶中的M1-V54及E75-N91的氨基酸。
在一些实施方案中,本申请的经修饰的聚合酶包含经修饰的掌型区域。举例而言,在一些实施方案中,经修饰的聚合酶包含来自屎肠球菌的掌型区域的部分(例如SEQ IDNO:2中的L445-V449)替代对应于Φ29聚合酶(SEQ ID NO:1)中的M429-I433的氨基酸。在一些实施方案中,经修饰的聚合酶包含在对应于Φ29聚合酶中的A444位置处的丙氨酸至胸腺嘧啶突变(例如A444T)。在一些实施方案中,经修饰的聚合酶包含来自屎肠球菌的掌型区域的部分及对应于Φ29聚合酶中的A444T的氨基酸突变。
在一些实施方案中,经修饰的聚合酶包含除了Φ29聚合酶之外的大多数聚合酶序列。在这类实施方案中,大多数聚合酶序列包含一或多个可以类推至Φ29聚合酶200的区域(例如根据同源性比对、计算模拟、结构分析或任何适合方法)。如本文所用,聚合酶的“区域”是指聚合酶的不同的域或子域。举例而言,在一些实施方案中,聚合酶的区域是指N端外切核酸酶域或C端聚合酶域。在一些实施方案中,聚合酶的区域是指掌型子域、TPR1子域、手指型子域、TPR2子域或拇指型子域。相应地,在一些实施方案中,聚合酶的区域是指包含给定域或子域的所有氨基酸。在一些实施方案中,经修饰的聚合酶包含对大多数聚合酶序列的一或多个区域的修饰。在一些实施方案中,经修饰的聚合酶包含对大多数聚合酶序列的一或多个部分的修饰。如本文所用,聚合酶的“部分”是指聚合酶序列中的一段两个或更多个连续残基。在一些实施方案中,聚合酶序列的部分是指单个聚合酶域或单个聚合酶子域中的两个或更多个连续氨基酸。在一些实施方案中,聚合酶序列的部分是指跨越多于一个聚合酶域和/或聚合酶子域的两个或更多个连续氨基酸。因此,在一些实施方案中,聚合酶序列的部分是聚合酶序列中的任何一段连续氨基酸。在一些实施方案中,部分是指构成,例如聚合酶区域或域的部分的5-10个连续氨基酸、10-25个连续氨基酸、25-50个连续氨基酸、50-75个连续氨基酸、75-100个连续氨基酸或其他数目的连续氨基酸。
在一些实施方案中,经修饰的聚合酶包含一或多个如图2中大体描绘的域和/或子域中的一或多个中的单点突变。举例而言,图3描绘表3的所选择的突变变体,这些突变变体具有在各多肽链中的突变的位点(用箭头大致展示)。多肽链针对以下展示:M2Y及M2Y突变变体H016、铜绿蝇及铜绿蝇突变变体H018、屎肠球菌及屎肠球菌突变变体H020及芽孢杆菌噬菌体VMY22及芽孢杆菌噬菌体VMY22突变变体H022。然而,也可使用包含如本文中所描述的其他区段交换和/或氨基酸突变的嵌合体。
在一些实施方案中,除本文中所描述的一或多个单点突变修饰的外或替代本文中所描述的一或多个单点突变修饰,大多数聚合酶序列的一段氨基酸(例如两个或更多个连续氨基酸)被修饰。在一些实施方案中,该段氨基酸是对应于不同聚合酶序列的部分的一段氨基酸。举例而言,在一些实施方案中,大多数聚合酶序列的域/子域(或其中部分)与不同聚合酶序列的对应的域/子域(或其中部分)交换。在这类实施方案中,聚合酶称为嵌合聚合酶、嵌合聚合酶变体或嵌合体。嵌合聚合酶是根据本文中所描述的实施方案经工程改造且列于表4中。
在一些实施方案中,本发明的经修饰的重组聚合酶是选自表4。在一些实施方案中,嵌合聚合酶变体(例如如表4中所列出)包含大多数聚合酶序列,其大多数序列的区域或部分被不同聚合酶序列的对应的区域或部分取代。在一些实施方案中,所有包含大多数聚合酶序列中的区域(例如域和/或子域)的残基被所有包含不同聚合酶序列中的对应的区域的残基取代。在一些实施方案中,包含大多数聚合酶序列中的区域的残基的至少一部分被包含不同聚合酶序列中的对应的区域的残基的至少一部分取代。
在一些实施方案中,仅大多数序列中的单个子域被不同序列的对应的子域取代。举例而言,图4描绘选自表4的嵌合聚合酶变体。六个所选择的变体以多肽链展示,其中子域如其一般在多肽中出现的以氨基端至羧基端方向展示。图4的多肽链中的每一个包含Q001的聚合酶大多数序列(阴影线填充),其中一或多个域和/或子域被M2Y聚合酶(SEQ ID NO:6,开放填充)的一或多个对应的域和/或子域或铜绿蝇(SEQ ID NO:7,点划填充)的一或多个对应的域和/或子域及或一或多个侧接氨基酸取代。
在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的外切核酸酶域。如图4中所示,C017是嵌合聚合酶变体,其包含取代自M2Y聚合酶序列(例如如SEQ ID NO:6中所述)的外切核酸酶域。类似地,C020包含取代自铜绿蝇聚合酶序列(例如如SEQ ID NO:7中所述)的外切核酸酶域。在一些实施方案中,在聚合酶的校读能力不理想的情况下(例如在测序反应中),在经修饰的聚合酶变体中外切核酸酶域的修饰或置换可能很有用。然而,应了解,本发明的经修饰的重组聚合酶涵盖额外及替代域和/或子域取代。
在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的外切核酸酶环。如本文所用,在一些实施方案中,“外切核酸酶环”是指形成外切核酸酶域中的环区域的一段连续氨基酸。举例而言,图5A以全透视图500及放大透视图502的方式描绘Φ29聚合酶的图解说明。放大透视图502是于全透视图500中所示的方形区的特写视图,其展示Φ29聚合酶的外切核酸酶域中的环区域。所选择的环残基在放大透视图502中以杆形式展示,具有形成跨越残基N77至N88的外切核酸酶环的该段连续氨基酸。外切核酸酶域的此区域的进化保守性分析揭示,该环及若干侧接残基的保守相对不佳。图5B描绘Φ29聚合酶的外切核酸酶区域与选自表1的一组非限制性其他聚合酶之间的同源性比对504。还描绘了展示Φ29聚合酶的外切核酸酶环N77-N88与其他聚合酶中的对应的外切核酸酶环的环同源性比对506。
同源性分析展示对应于Φ29聚合酶的外切核酸酶环N77-N88的区域中的相对较低保守性,基于此,提供了在聚合酶变体中搜索所期望的生化特性时的变化源(例如适合用于测序反应中的)。相应地,在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的外切核酸酶环,其中“外切核酸酶环”与Φ29聚合酶的外切核酸酶环N77-N88同源(例如如通过图5B中的环同源性比对506所示)。
如通过图5B中的实例比对所示,序列同源性分析可用于鉴别与Φ29聚合酶的N77-N88同源的外切核酸酶环序列。借助于实例而非限制,环同源性比对506展示M2Y(H74-N85)、铜绿蝇(N64-G76)、屎肠球菌(N74-R86)、芽孢杆菌GA-1(N74-K88)、芽孢杆菌VMY22(K80-K91)、放线菌AV-1(H93-K105)、马铃薯包囊线虫(L86-K99)、伊比利亚猞猁肠(D73-R87)、候选种(N85-N98)及埃格特菌属(V73-K88)的同源外切核酸酶环序列。相应地,在一些实施方案中,经取代的外切核酸酶环在与Φ29聚合酶的N77-N88同源的区域中可包括约12个与约16个之间的氨基酸。在一些实施方案中,经取代的外切核酸酶环在与Φ29聚合酶的N77-N88同源的区域中包含约10个氨基酸至至多20个氨基酸、约5个氨基酸至至多15个氨基酸、约5个氨基酸至至多20个氨基酸、或约5个氨基酸至25个氨基酸或更多。
在一些实施方案中,本申请的经修饰的聚合酶在包括与Φ29聚合酶的N77-N88同源的外切核酸酶环的外切核酸酶域的区域中,包含一或多个氨基酸突变。举例而言,在一些实施方案中,本发明的经修饰的聚合酶是经修饰的Φ29聚合酶,其包含在Φ29聚合酶中的E75、R76、S82、A83、D84、G85、L86、P87、N88、Y90及N91中的一或多个处的突变。在一些实施方案中,经修饰的聚合酶包含E75F、R76K、S82C、A83K、D84E、G85A、L86K、P87E、N88R、Y90F及N91S中的一或多个。在一些实施方案中,经修饰的聚合酶包含一或多个在对应于Φ29聚合酶中的E75、R76、S82、A83、D84、G85、L86、P87、N88、Y90及N91的位置处的氨基酸突变。举例而言,在一些实施方案中,在经修饰的聚合酶不包含Φ29聚合酶大多数序列的情况下,经修饰的聚合酶包含一或多个对应于上述列出的位置的氨基酸,例如,如通过同源性比对或本领域中已知的其他方法所测定。
在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的TPR1子域。举例而言,C018是包含取代自M2Y聚合酶序列的TPR1子域的嵌合聚合酶。类似地,C021包含取代自铜绿蝇聚合酶的TPR1子域。在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的掌型子域。在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的手指型子域。在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的TPR2子域。在一些实施方案中,嵌合聚合酶变体包含大多数聚合酶序列,所述大多数聚合酶序列具有取代自不同聚合酶序列的拇指型子域。如本文中所描述的经修饰的重组聚合酶包括包含多于一个域和/或子域取代的嵌合聚合酶变体。
在一些实施方案中,大多数序列中的两个区域(例如域/子域)被不同序列的两个对应的区域(例如对应的域/子域)取代。举例而言,如图4中所示,C019是嵌合聚合酶,其包含被M2Y聚合酶序列的对应的外切核酸酶域及TPR1子域取代的外切核酸酶域及TPR1子域。类似地,C022包含被铜绿蝇聚合酶的对应的外切核酸酶域及TPR1子域取代的外切核酸酶域及TPR1子域。在一些实施方案中,涵盖具有本文中所描述的经修饰的聚合酶的额外域和/或子域取代。举例而言,在一些实施方案中,大多数序列中的多于两个(例如三、四、五或六个)区域(例如域/子域)被不同序列的多于两个(例如三、四、五或六个)对应的区域取代。
在一些实施方案中,嵌合聚合酶变体的大多数聚合酶序列是选自表1-4中的序列。在一些实施方案中,嵌合聚合酶变体的大多数聚合酶序列是选自SEQ ID NO:2-5或SEQ IDNO:23-33。在一些实施方案中,大多数聚合酶序列包含一或多个取代自选自表1-4的不同聚合酶序列的区域和/或部分。举例而言,表5提供自表4选择的嵌合聚合酶变体的概述,且针对各个列举大多数聚合酶序列以及经取代区域/部分及该取代所基于的序列的描述。
然而,可使用和/或另外修饰,例如,如本文中的表中的一或多个中所描述及所说明的其他嵌合体。
在一些实施方案中,嵌合聚合酶变体可以进一步包含一或多个定点突变。因此,在一些实施方案中,可将本文中所描述的一或多个突变中的任一个(例如,包括在表2-3中的各序列中的一或多个突变中的任一个)施加至本发明中所涵盖的任何嵌合聚合酶(例如,如上文中及表4中所列)。图6大体描绘包含一或多个突变的嵌合聚合酶变体。举例而言,突变嵌合聚合酶602包含Φ29聚合酶大多数序列,其具有经取代的M2Y外切核酸酶域及该经取代域中的突变。在一些实施方案中,突变嵌合聚合酶包含具有被对应于两个或更多个不同聚合酶序列的区域取代的两个或更多个区域的大多数序列。举例而言,突变嵌合聚合酶604包含Φ29聚合酶大多数序列,其具有经取代的屎肠球菌聚合酶TPR1子域及经取代的M2Y聚合酶TPR2子域,其具有在聚合酶序列中的各种位置进行的定点突变。在一些实施方案中,突变嵌合聚合酶包含具有被对应于不同聚合酶的区域取代的两个或更多个区域的大多数序列。举例而言,突变嵌合聚合酶606包含Φ29聚合酶大多数序列,其具有经取代的屎肠球菌聚合酶TPR1、TPR2及拇指型子域,其具有在聚合酶序列中的各种位置进行的定点突变。
表6提供自表4中选择的嵌合聚合酶变体的概述,其针对各个提供大多数聚合酶序列以及对特定变体所作出的氨基酸突变的描述。
然而,其他氨基酸突变可以并入至一或多个本文中所描述的嵌合聚合酶中。举例而言,一或多个氨基酸变化可在位置M8、V51、N62、I71、L107和/或K131中的一或多个处,和/或在参考Φ29聚合酶序列的位置K135、L142、G197、Y224、E239、V250、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、A437、A444、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571中的一或多个处并入。举例而言,在一些实施方案中,嵌合聚合酶亦可包括以下氨基酸取代中的一或多个:M8R、V51A、N62D、I71V、L107I和/或K131E,和/或以下氨基酸取代中的一或多个:K135Q、L142K、G197D、Y224K、E239G、V250A、V250I、L253A、L253H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375Y、A437G、A444T、E466K、D476H、A484E、E508R、D510K、D510R、K512Y、E515Q、K539E、D570S和/或T571V。
在其他实施方案中,一或多个氨基酸变化可在位置中的一或多个处并入:关于屎肠球菌聚合酶(SEQ ID NO:2)的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569和/或T571。在一些实施方案中,嵌合聚合酶亦可包括以下氨基酸取代中的一或多个:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W、V526L、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V和/或T571S。
表2.屎肠球菌聚合酶变体
Figure BDA0003525124290000831
Figure BDA0003525124290000841
Figure BDA0003525124290000851
Figure BDA0003525124290000861
Figure BDA0003525124290000871
Figure BDA0003525124290000881
Figure BDA0003525124290000891
Figure BDA0003525124290000901
Figure BDA0003525124290000911
Figure BDA0003525124290000921
Figure BDA0003525124290000931
Figure BDA0003525124290000941
Figure BDA0003525124290000951
Figure BDA0003525124290000961
Figure BDA0003525124290000971
Figure BDA0003525124290000981
Figure BDA0003525124290000991
Figure BDA0003525124290001001
Figure BDA0003525124290001011
Figure BDA0003525124290001021
Figure BDA0003525124290001031
Figure BDA0003525124290001041
Figure BDA0003525124290001051
Figure BDA0003525124290001061
Figure BDA0003525124290001071
Figure BDA0003525124290001081
Figure BDA0003525124290001091
Figure BDA0003525124290001101
Figure BDA0003525124290001111
Figure BDA0003525124290001121
Figure BDA0003525124290001131
Figure BDA0003525124290001141
Figure BDA0003525124290001151
Figure BDA0003525124290001161
Figure BDA0003525124290001171
Figure BDA0003525124290001181
Figure BDA0003525124290001191
Figure BDA0003525124290001201
Figure BDA0003525124290001211
Figure BDA0003525124290001221
Figure BDA0003525124290001231
Figure BDA0003525124290001241
Figure BDA0003525124290001251
Figure BDA0003525124290001261
Figure BDA0003525124290001271
Figure BDA0003525124290001281
Figure BDA0003525124290001291
Figure BDA0003525124290001301
Figure BDA0003525124290001311
Figure BDA0003525124290001321
Figure BDA0003525124290001331
Figure BDA0003525124290001341
Figure BDA0003525124290001351
Figure BDA0003525124290001361
Figure BDA0003525124290001371
表3.同源聚合酶变体
Figure BDA0003525124290001372
Figure BDA0003525124290001381
Figure BDA0003525124290001391
Figure BDA0003525124290001401
Figure BDA0003525124290001411
Figure BDA0003525124290001421
Figure BDA0003525124290001431
Figure BDA0003525124290001441
Figure BDA0003525124290001451
Figure BDA0003525124290001461
Figure BDA0003525124290001471
Figure BDA0003525124290001481
Figure BDA0003525124290001491
Figure BDA0003525124290001501
Figure BDA0003525124290001511
表4.嵌合聚合酶变体
Figure BDA0003525124290001512
Figure BDA0003525124290001521
Figure BDA0003525124290001531
Figure BDA0003525124290001541
Figure BDA0003525124290001551
Figure BDA0003525124290001561
Figure BDA0003525124290001571
Figure BDA0003525124290001581
Figure BDA0003525124290001591
Figure BDA0003525124290001601
Figure BDA0003525124290001611
Figure BDA0003525124290001621
Figure BDA0003525124290001631
Figure BDA0003525124290001641
Figure BDA0003525124290001651
Figure BDA0003525124290001661
Figure BDA0003525124290001671
Figure BDA0003525124290001681
Figure BDA0003525124290001691
Figure BDA0003525124290001701
Figure BDA0003525124290001711
Figure BDA0003525124290001721
Figure BDA0003525124290001731
Figure BDA0003525124290001741
Figure BDA0003525124290001751
Figure BDA0003525124290001761
Figure BDA0003525124290001771
Figure BDA0003525124290001781
Figure BDA0003525124290001791
Figure BDA0003525124290001801
Figure BDA0003525124290001811
Figure BDA0003525124290001821
Figure BDA0003525124290001831
Figure BDA0003525124290001841
Figure BDA0003525124290001851
Figure BDA0003525124290001861
Figure BDA0003525124290001871
Figure BDA0003525124290001881
Figure BDA0003525124290001891
Figure BDA0003525124290001901
Figure BDA0003525124290001911
Figure BDA0003525124290001921
Figure BDA0003525124290001931
Figure BDA0003525124290001941
Figure BDA0003525124290001951
Figure BDA0003525124290001961
Figure BDA0003525124290001971
Figure BDA0003525124290001981
Figure BDA0003525124290001991
Figure BDA0003525124290002001
Figure BDA0003525124290002011
Figure BDA0003525124290002021
Figure BDA0003525124290002031
Figure BDA0003525124290002041
Figure BDA0003525124290002051
Figure BDA0003525124290002061
Figure BDA0003525124290002071
Figure BDA0003525124290002081
Figure BDA0003525124290002091
Figure BDA0003525124290002101
Figure BDA0003525124290002111
Figure BDA0003525124290002121
Figure BDA0003525124290002131
Figure BDA0003525124290002141
Figure BDA0003525124290002151
Figure BDA0003525124290002161
Figure BDA0003525124290002171
Figure BDA0003525124290002181
Figure BDA0003525124290002191
Figure BDA0003525124290002201
Figure BDA0003525124290002211
Figure BDA0003525124290002221
Figure BDA0003525124290002231
Figure BDA0003525124290002241
Figure BDA0003525124290002251
Figure BDA0003525124290002261
Figure BDA0003525124290002271
Figure BDA0003525124290002281
Figure BDA0003525124290002291
表5.嵌合聚合酶–经取代的部分
Figure BDA0003525124290002292
Figure BDA0003525124290002301
Figure BDA0003525124290002311
Figure BDA0003525124290002321
Figure BDA0003525124290002331
表6.嵌合聚合酶–定点突变体
Figure BDA0003525124290002332
Figure BDA0003525124290002341
表7.示例性修饰组合–对应于SEQ ID NO:2的位置。
Figure BDA0003525124290002342
Figure BDA0003525124290002351
Figure BDA0003525124290002361
Figure BDA0003525124290002371
Figure BDA0003525124290002381
Figure BDA0003525124290002391
Figure BDA0003525124290002401
Figure BDA0003525124290002411
Figure BDA0003525124290002421
Figure BDA0003525124290002431
Figure BDA0003525124290002441
Figure BDA0003525124290002451
Figure BDA0003525124290002461
Figure BDA0003525124290002471
II.包含经修饰的重组酶的组合物及试剂盒
在一些方面中,本发明是关于包含本文所描述的经修饰的聚合酶的组合物。在一些实施方案中,组合物包含多个经修饰的聚合酶。在一些实施方案中,组合物进一步包含盐和/或缓冲剂。
在一些方面中,本发明是关于包含本文所述的经修饰的聚合酶的试剂盒。在一些实施方案中,试剂盒包含多个经修饰的聚合酶。试剂盒可任选地提供额外组分(诸如缓冲剂)及说明性资讯。通常,试剂盒包含容器及在容器上或与容器相关联的标签或包装插页。在一些实施方案中,本发明提供包含上文所描述的试剂盒的内含物的物品。适合的包装包括但不限于小瓶、瓶子、广口瓶、可挠性包装以及类似物。在一些实施方案中,该试剂盒进一步包含容器、盐和/或缓冲剂。
III.产生经修饰的重组酶的方法
在一些方面中,本发明是关于以重组方式产生本文所述的经修饰的聚合酶的方法。在一些实施方案中,为表达本发明的聚合酶,将编码该聚合酶的DNA插入至一或多个表达载体中,使得编码的聚合酶可操作地连接于转录及转译控制序列(参见,例如美国专利第6,914,128号,其内容以引用的方式并入本文中)。在此背景下,术语“可操作地连接”意指编码聚合酶的序列连接至载体中,使得载体中的转录及转译控制序列发挥其调节聚合酶的转录及转译的预期功能。选择与所用表达宿主细胞相容的表达载体及表达控制序列。将聚合酶编码序列通过标准方法(例如,聚合酶编码序列上的互补限制位点与载体的连接或当无限制位点存在时的钝端连接)插入至表达载体中。
为表达经修饰的聚合酶,可以将编码该经修饰的聚合酶的表达载体通过标准技术转染至宿主细胞中。术语“转染”的各种形式意欲涵盖常用于将外源DNA引入至原核或真核宿主细胞中的各种技术,例如电穿孔、磷酸钙沉淀、DEAE-聚葡萄糖转染及类似技术。用于表达本发明的聚合酶的适合宿主细胞包括原核生物、酵母或更高级真核生物细胞。
用于此目的的适合原核生物包括真细菌,诸如革兰氏阴性或革兰氏阳性生物体,例如肠内菌科(Enterobacteriaceae),诸如埃希氏杆菌属(Escherichia),例如大肠杆菌,肠杆菌属(Enterobacter)、欧文菌属(Erwinia)、克雷伯氏菌属(Klebsiella)、变形杆菌属(Proteus)、沙门氏菌属(Salmonella),例如鼠伤寒沙门杆菌(Salmonella typhimurium),沙雷菌属(Serratia),例如黏质沙雷氏菌(Serratia marcescans),及志贺杆菌属(Shigella),以及杆菌(Bacilli),诸如枯草芽孢杆菌(B.subtilis)及地衣芽孢杆菌(B.licheniformis),假单胞菌属(Pseudomonas),诸如绿脓杆菌(P.aeruginosa),及链霉菌(Streptomyces)。除原核生物之外,诸如丝状真菌或酵母的真核微生物是用于编码载体的多肽的适合克隆或表达宿主。在低级真核宿主微生物中,最常用的是酿酒酵母(Saccharomyces cerevisiae)或普通烘焙酵母。然而,在本文中若干其他属、物种及菌株通常是可获得的且有用的,诸如粟酒裂殖酵母(Schizosaccharomyces pombe);克鲁维酵母(Kluyveromyces)宿主诸如,例如,乳酸克鲁维酵母(K.lactis)、脆壁克鲁维酵母(K.fragilis)、保加利亚克鲁维酵母(K.bulgaricus)、魏氏克鲁维酵母(K.wickeramii)、沃特克鲁维酵母(K.waltii)、果蝇克鲁维酵母(K.drosophilarum)、耐热克鲁维酵母(K.thermotolerans)及马克斯克鲁维酵母(K.marxianus);巴斯德毕赤酵母(Pichiapastoris);假丝酵母(Candida);瑞氏木霉菌(Trichoderma reesia);粗厚神经胞子菌(Neurospora crassa);施氏酵母(Schwanniomyces)诸如西方施氏酵母(Schwanniomycesoccidentalis);及丝状真菌,诸如红霉属(Neurospora)、青霉菌属(Penicillium)、弯颈霉属(Tolypocladium)及曲霉属(Aspergillus)宿主诸如,构巢曲霉(A.nidulans)及黑曲霉(A.niger)。
在一些实施方案中,宿主细胞经用于产生聚合酶的上述表达或克隆载体转化,且在适于诱导启动子、选择转化体或扩增编码所需序列的基因的经调节的常规营养物培养基中培养。用于产生聚合酶的宿主细胞可以在各种培养基中培养。市售培养基,诸Ham's F10TM(Sigma)、Minimal Essential MediumTM(MEM)(Sigma)、RPMI-1640(Sigma)及Dulbecco'sModified Eagle's MediumTM(DMEM)(Sigma)适合于培养宿主细胞。培养条件(诸如温度、pH及类似条件)为先前用于经选择用于表达的宿主细胞的培养条件,且对于一般本领域技术人员而言将显而易见。
在一些实施方案中,聚合酶变体可以在周质空间中胞内产生,或直接分泌于细胞培养基中。在其中聚合酶变体胞内产生的实施方案中,宿主细胞或溶解细胞颗粒碎片(例如由均质化产生)可以通过各种手段移除,包括但不限于通过离心或超过滤。其中聚合酶分泌于培养基中的情况下,来自此类表达系统的上清液可以首先使用可商购的蛋白质浓缩过滤器来浓缩,随后可将其进行一或多个其他纯化技术,包括但不限于:亲和层析,包括蛋白质亲和层析;离子交换层析,诸如阴离子或阳离子交换层析;及疏水相互作用层析。
在一些实施方案中,经修饰的聚合酶包含一或多个非天然氨基酸取代。如本文所用,“非天然氨基酸”是指除了以下二十种基因编码的α氨基酸之外的任何氨基酸、经修饰的氨基酸或氨基酸类似物:丙氨酸、精氨酸、天冬酰氨、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。在一些实施方案中,非天然氨基酸可包括除了上述二十种α氨基酸之外的天然存在化合物。非天然氨基酸及非天然氨基酸并入至蛋白质序列中的方法是本领域中已知的,例如,如美国专利第7,045,337号中所述,其内容以引用的方式并入本文中。
IV.使用经修饰的重组酶的方法
在一些实施方案中,本发明提供可用于进行体外聚合反应的经修饰的重组酶及其组合物。在一些实施方案中,由本发明提供的经修饰的重组DNA聚合酶可用于与DNA操控(例如DNA测序)相关的体外反应。
在其他方面中,本发明提供可用于进行体外聚合反应的经修饰的重组酶(例如聚合酶(polymerases))。在一些实施方案中,本文中所描述的聚合酶包含一或多个修饰,其单独或组合适用于进行测序反应。在一些实施方案中,可利用一或多个本文中所描述的修饰来产生具有一或多个适用于进行测序反应的特性的聚合酶,例如,诸如以下的特性:聚合酶持续效力、保真性(例如精确度)、底物(例如聚磷酸核苷)结合亲和力、底物利用率(例如聚磷酸核苷并入至与模板链互补的生长链中的比率)、聚合酶与经修饰的底物(例如经标记的聚磷酸核苷)的相互作用或其某种组合。在一些实施方案中,一或多个修饰最小化或消除聚合酶的校读能力。举例而言,在一些实施方案中,可对聚合酶的外切核酸酶域作出一或多个修饰,使得聚合酶的外切核酸酶活性受损。
在一些方面中,本申请是关于经修饰的聚合酶,其具有有利于单分子核酸测序技术的经改变的生化特性。在一些实施方案中,本文中所描述的变体聚合酶已经被修饰以在单分子测序反应中提供改善的信号读出。图1提供与实时信号读出相关的测序反应进程的实例说明。不希望受理论所束缚,认为一些单分子核酸测序反应根据流程100进行。
在反应开始时(第I组),聚合酶(虚线)被限制于观测区域中且结合于模板链及引物链。如所示,各自具有不同类型的可检测标记的不同类型的核苷酸(例如A、G、T、C、U)存在于相同反应混合物中。当聚合酶与经发光标记的核苷酸缔结时(第II组),标记变为被限制在观测区域中一段时间。在并入事件期间,例如,此段时间足够接收标记和/或发出呈足以在观测区域中检测且鉴别其存在的量的能量。如与信号读出102相关的流程100的第I组及第II组所说明,并入事件可以与对应于脉冲宽度pw的时间段内的信号脉冲相关联。
应了解,在一些实施方案中,与并入事件相关联的个别信号脉冲可能受各种条件影响,诸如在特定时间点上并入的核苷酸的类型或聚合酶的活性。在一些实施方案中,个别信号脉冲可具有约10毫秒与约10秒之间的个别脉冲宽度。相应地,在一些实施方案中,可以将个别脉冲宽度平均化以提供用于比较目的的参数。如本文所用,在一些实施方案中,“脉冲宽度”是指对应于多个个别信号脉冲的平均值的值,其中各个别信号脉冲具有个别脉冲宽度。
在一些实施方案中,本申请的经修饰的聚合酶产生约10毫秒与约10秒之间的脉冲宽度。在一些实施方案中,脉冲宽度为至少10毫秒且至多10秒、至少10毫秒且至多5秒、至少10毫秒且至多1秒或在约10毫秒与约1秒之间。在一些实施方案中,脉冲宽度在约10与约500毫秒之间、约10与约200毫秒之间、约10与约100毫秒之间、约10与约50毫秒之间、约50毫秒与约1秒之间、约50与约500毫秒之间、约50与约200毫秒之间、约50与约100毫秒之间、约100毫秒与约1秒之间、约100与约500毫秒之间、约100与约200毫秒之间、约200毫秒与约1秒之间、约200与约500毫秒之间或约500毫秒与约1秒之间。
在核苷酸并入至生长链中且发光标记分裂之后,标记扩散至发光体积之外且在观测区域中不再可检测(第III组)。亦如第III组中所说明,在并入事件之后,聚合酶沿模板链进展,使得能够与后续经发光标记的核苷酸缔结。类似于自第I组至第II组的进程,在信号迹线102中对应于自第III组至第IV组的进程的信号的强度自相对低强度位准增大至指示缔结事件的信号脉冲。关于信号迹线102,并入事件与后续缔结事件之间的时间段可以与脉冲间距离ipd相关联。
如在前文中关于脉冲宽度所详述,在一些实施方案中,与第一与第二信号脉冲之间的时间段相关联的个别脉冲间距离可以受各种条件影响,诸如在特定时间点上聚合酶活性或持续效力。在一些实施方案中,个别脉冲间距离对应于约10毫秒与约1分钟之间或较长的时段(例如约1秒与约60秒之间、约1秒与约30秒之间、约1秒与约20秒之间、约1秒与约10秒之间或小于约1秒)。相应地,在一些实施方案中,可以将个别脉冲间距离平均化以提供用于比较目的的参数。如本文中所使用,在一些实施方案中,“脉冲间距离”是指对应于多个个别脉冲间距离的平均值的值。
在一些实施方案中,本申请的经修饰的聚合酶产生约10毫秒与约10秒之间的脉冲间距离。在一些实施方案中,脉冲间距离为至少10毫秒且至多10秒、至少10毫秒且至多5秒、至少10毫秒且至多1秒或在约10毫秒与约1秒之间。在一些实施方案中,脉冲间距离在约10与约500毫秒之间、约10与约200毫秒之间、约10与约100毫秒之间、约10与约50毫秒之间、约50毫秒与约1秒之间、约50与约500毫秒之间、约50与约200毫秒之间、约50与约100毫秒之间、约100毫秒与约1秒之间、约100与约500毫秒之间、约100与约200毫秒之间、约200毫秒与约1秒之间、约200与约500毫秒之间或约500毫秒与约1秒之间。
在一些实施方案中,可使用脉冲宽度和/或脉冲间距离的特征来鉴别特定发光标记。在一些实施方案中,可在测序反应中使用本发明的经修饰的聚合酶通过观测一系列指示经发光标记的核苷酸的缔结的脉冲宽度来测定模板链的核苷酸序列。在一些实施方案中,在此过程中的假影会引起不正确测序信息。举例而言,第V组说明结合及释放事件,其中经发光标记的核苷酸被限制在观测区域中一段足以引起信号脉冲的时间但无并入事件。
如第V组中所示,在检测到第IV组中的并入之后,分裂的发光标记扩散至可观测区域(i)之外。在可观测区域中另一经发光标记的核苷酸与聚合酶缔结,发出可检测信号(ii)。该经发光标记的核苷酸并不并入至生长链中而是与聚合酶分裂且扩散回反应混合物(iii)中。由此,在随后成功并入相同类型的核苷酸之后(未展示),对应于第V组的信号脉冲将引起在测序资讯读出中的明显插入。相应地,在一些实施方案中,本申请的经修饰的重组酶具有长度足以自这些及其他此类假影事件中辨别纯并入事件的脉冲宽度。在一些实施方案中,本申请的经修饰的重组酶具有一或多个减小底物自聚合酶活性位点过早释放的概率的修饰。在一些实施方案中,本申请的经修饰的重组酶具有一或多个增加在底物与聚合酶活性位点缔结后并入底物的概率的修饰。
在一些实施方案中,本申请的方面可用于与生物样品分析相关方法中。在示例性实施方案中,本文中所提供的方法适用于测定样品中的一或多个核酸或多肽的序列和/或测定样品中是否存在一或多个核酸或多肽变体(例如所关注基因中的一或多个突变)的技术中。在一些实施方案中,可对患者样品(例如人类患者样品)进行测试以提供核酸序列资讯或出于诊断、预后和/或治疗目的,测定一或多个相关核酸的存在或不存在。在一些实例中,诊断性测试可包括例如通过测序个体的生物样品中无细胞的DNA分子和/或表达产物(例如RNA)测序个体的生物样品中核酸分子。举例而言,本发明提供可有利地利用在同在申请中的美国专利申请第14/543,865号;第14/543,867号;第14/543,888号;第14/821,656号;第14/821,686号;第14/821,688号;第15/161,067号;第15/161,088号;第15/161,125号;第15/255,245号;第15/255,303号;第15/255,624号;第15/261,697号;第15/261,724号;第62/289,019号;第62/296,546号;第62/310,398号;第62/339,790号;第62/343,997号;第62/344,123号及第62/426,144号中所描述的技术中的方法及组合物,各申请的内容均以引用的方式并入本文中。
本申请的一些方面适用于能够测序生物聚合物诸如核酸及蛋白质的技术。在一些实施方案中,本申请中所描述的方法及组合物可用于鉴别并入至核酸或蛋白质中的一系列核苷酸或氨基酸单体的技术(例如通过检测并入一系列经标记核苷酸或氨基酸单体的时程)中。在一些实施方案中,本申请中所描述的方法及组合物可以并入至鉴别一系列核苷酸的技术中,这些核苷酸是经并入至通过聚合酶合成的模板依赖性核酸测序反应产物中。
在测序期间,聚合酶可以偶联(例如附接)于目标核酸分子的引发位置(例如测序模板的核酸分子)。引发位置可包含与目标核酸分子的部分互补的引物。作为替代方案,引发位置为提供于目标核酸分子的双链区段内之间隙或切口。间隙或缺口的长度可以为0至至少1、2、3、4、5、6、7、8、9、10、20、30或40个核苷酸。切口可在双链序列的一个链中提供断裂,其可为聚合酶提供引发位置,诸如链置换聚合酶。
在一些情况下,测序引物可退火(anneal)至目标核酸分子,该目标核酸分子可以固定于固体支撑物或未固定于固体支撑物。固体支撑物可包含,例如,用于核酸测序的集成装置上的样品槽。在一些实施方案中,测序引物可固定于固体支撑物且目标核酸分子的杂交也使目标核酸分子固定于固体支撑物。在一些实施方案中,聚合酶固定于固体支撑物且使可溶性引物及目标核酸与聚合酶接触。然而,在一些实施方案中,包含聚合酶、目标核酸及引物的复合物在溶液中形成且使复合物固定于固体支撑物(例如经由聚合酶、引物和/或目标核酸的固定)。在一些实施方案中,样品槽中无组分固定于固体支撑物。举例而言,在一些实施方案中,包含聚合酶、目标核酸及引物的复合物在溶液中形成且复合物不固定于固体支撑物。在一些实施方案中,经修饰的重组酶固定于表面上。在一些实施方案中,表面包含纳米孔。在某些实施方案中,纳米孔包含底表面,该底表面包含第一材料及由多个金属或金属氧化物层形成的侧壁。在一些实施方案中,第一材料为透明材料或玻璃。在一些实施方案中,底表面为平坦的。在一些实施方案中,底表面为曲面槽。在一些实施方案中,底表面包括侧壁的一部分,其在由多个金属或金属氧化物层形成的侧壁下方。在一些实施方案中,第一材料为熔融硅石或二氧化硅。在一些实施方案中,多个层各自包含金属(例如,Al、Ti)或金属氧化物(例如,Al2O3、TiO2、TiN)。在一些实施方案中,表面可为由玻璃或其他透明材料、硅石、熔融硅石、二氧化硅、聚合物、其他材料或其组合制成的芯片的表面(例如,不同层的组合,例如包括一或多个金属层)。
在适当的条件下,接触经退火的引物/目标核酸的聚合酶可以将一或多个核苷酸添加或并入引物中,且核苷酸可以5'至3'模板依赖性方式添加至引物中。此类核苷酸并入引物上(例如经由聚合酶的作用)一般可称作引物延长反应。各核苷酸可与可检测标签联合,该标签可在核酸延长反应期间被检测及鉴别出(例如基于其发光寿命和/或其他特征)且用于测定并入经延长引物及因此新合成的核酸分子序列中的各核苷酸。经由新合成的核酸分子的序列互补,也可测定目标核酸分子的序列。在一些情况下,测序引物与目标核酸分子的退火及核苷酸并入至测序引物可在类似反应条件(例如相同或类似反应温度)下或在不同反应条件(例如不同反应温度)下进行。在一些实施方案中,通过合成方法测序可包括目标核酸分子(例如目标核酸的复本)的群体和/或为获得目标核酸群体的目标核酸扩增步骤的存在。然而,在一些实施方案中,通过合成测序用于测定受评估的各反应中的单个分子的序列(且制备用于测序的目标模板不需要核酸扩增)。在一些实施方案中,根据本申请的方面平行进行(例如在单个集成装置上)多个单分子测序反应。举例而言,在一些实施方案中,多个单分子测序反应在集成装置上的单独反应室中各自进行。
在一些实施方案中,本发明的聚合酶适用于在显著小体积的样品槽中进行的单分子测序反应。举例而言,在一些实施中,样品槽的体积可在约10-21升与约10-15升之间。因为样品槽具有较小体积,可达成单个样品检测事件(例如单分子事件)。在一些实施方案中,表面(例如样品槽的表面)经配置以接收本文中所描述的聚合酶。在一些实施方案中,样品槽接收可置于样品槽的表面,诸如底表面上的聚合酶。在一些实施方案中,样品槽在集成装置内形成,其中样品槽的底表面位于形成其的集成装置的表面的远端。
在某些实施方案中,本文所描述的技术是关于可添加至样品槽中的聚合酶及其复合物。在一些实施方案中,本文中所描述的聚合酶可被限制在样品槽的目标体积(例如反应体积)内。在一些实施方案中,目标体积是样品槽中的区域。在存在一或多个待固定于底表面上的聚合酶的实施方案中,可能需要将底表面官能化以使得能附接一或多个聚合酶(例如聚合酶及其复合物)。在一些实施方案中,底表面使用包含偶联基团的物质官能化。举例而言,偶联基团可包含化学部分,诸如氨基、羧基、羟基、巯基、金属、螯合剂及类似物。替代地,其可包括特定结合单元,诸如生物素、双生物素、抗生物素蛋白、抗生蛋白链菌素、中性抗生物素蛋白、凝集蛋白、SNAP-标签TM(SNAP-tagsTM),或因此底物,缔合或结合肽或蛋白质、抗体或抗体片段、核酸或核酸类似物或类似物。另外或替代地,偶联基团可用于偶联用于与所关注的分子(例如聚合酶或其复合物)偶联或结合的其他基团,在一些情况下其可以包括化学官能基及特定结合单元。举例而言,偶联基团,例如生物素或双生物素,可以沉积在底物表面上且在给定区域中选择性地活化。中间体结合剂,例如抗生蛋白链菌素,可随后偶联于第一偶联基团。所关注的分子(例如聚合酶或其复合物),其在此特定实例中是经生物素标记的,随后偶联于抗生蛋白链菌素。在一些实施方案中,本文中所描述的聚合酶可进一步包含能够与将聚合酶固定于表面(例如样品槽的表面)的偶联基团形成相互作用的偶联部分。举例而言,在一些实施方案中,聚合酶包含能够结合于抗生素蛋白的N端或C端生物素标记或双生物素标记序列。在一些实施方案中,生物素标记或双生物素标记序列进一步包含连接子序列。举例而言,在一些实施方案中,C端连接子/生物素标记序列包含氨基酸序列GGGSGGGSGGGSGLNDFFEAQKIEWHE(SEQ ID NO:843)。在一些实施方案中,聚合酶包含能够结合于两个抗生物素蛋白蛋白的结合位点的N端或C端双生物素标记序列。举例而言,在一些实施方案中,N端或C端连接子/双生物素标记序列包含氨基酸序列GGGGSGGGSGGGSGLNDFFEAQKIEWHEGGGSGGGSGGGSGLNDFFEAQKIEWHE(SEQ ID NO:844)。
实施例
实施例1.经修饰的聚合酶的表达及评估
在大肠杆菌中表达重组聚合酶变体,并使用His-旋转管柱自150mL规模培养物中纯化。通过SDS-PAGE分析蛋白质纯度,随后进行考马斯蓝(Coomassie Blue)染色(图7)。在缓冲液交换及蛋白质浓缩之后,在30℃下追踪捕集30分钟,在dNTP存在下评估重组变体的活性及持续效力。在捕集器存在下,嵌合聚合酶变体C017及C020展示出活性、持续效力及合成长度。测量变体聚合酶对dNTP类似物的利用率以评估聚合酶在测序反应中的适用性。同源突变变体及嵌合聚合酶变体皆显示对dN6P的利用率。来自单分子测序的结果展示于下表8中。
表8.关于经修饰的聚合酶的测序结果
Figure BDA0003525124290002571
Figure BDA0003525124290002581
Figure BDA0003525124290002591
实施例2.具有改善的底物利用率的经修饰的聚合酶
屎肠球菌聚合酶变体EFM37含有位置L264、V261及K500处的三个活性位点取代,经测定它们改善六磷酸底物(dN6P)的利用率。基于纳米球分析观测到,具有EFM37的哑铃三元复合物或诸如EFM48的相关变体,可负载于测序芯片上,并使用未标记的dN6P(10μM)在样品槽内部及上表面进行持续性DNA复制(图8A-8D)。通过用EFM37哑铃三元复合物负载测序芯片,并用10μM dN6P进行1小时复制,随后与FAM标记的寡核苷酸探针一起孵育,从而产生DNA纳米球。
在后续实验中,使用dN6P与染料之间含有双螺旋DNA连接子的经染料标记的dN6P底物,未观测到实时DNA合成。使用了短叉状链置换DNA合成的实时停流分析来进一步评估变体EFM37、EFM48及EMF66。实时停流链置换DNA合成分析利用短叉状DNA底物,其中在30℃下快速添加核苷酸及Mg++(10mM MgCl2)后,引物延长引起经FAM标记的置换寡核苷酸的链置换及未淬灭(图10A)。基于分析结果,确定相较于dN6P,与双螺旋DNA连接子类似物的DNA合成速率大致在速率(每秒的碱基对)上慢3-10倍(图8C-8D)。
确定屎肠球菌具有整体带负电表面,包括在聚合酶活性位点附近,及相对较低的理论等电点(pI=5.5)。基于此理解及其他观测结果,假设带负电核苷酸类似物与屎肠球菌聚合酶表面之间的静电斥力提供这些类似物的不良利用率。
运算建模野生型屎肠球菌结构,且鉴别出在活性位点附近的表面位置用于引入取代,以使此区域更具正电性,且因此对带负电类似物(包括DNA连接子类似物)更具吸引力,同时最低限度地影响结构稳定性。建模结构的描述展示于图9A中,带负电残基展示有色,且催化性天冬氨酸残基在由箭头指示的聚合酶活性位点中的位置。如图9B中所示,聚合酶同源域映射至屎肠球菌多肽的区域,其以N端至C端方式定向,其中指示各域的起始位置。设计总共12种影响表面电荷的取代,包括九种阴性取代,且在两轮筛选中针对dN6P及DNA连接子类似物利用率,筛选这些取代的多个组合。
所有经筛选的屎肠球菌变体含有与亲本酶EFM37相同的三个活性位点突变(L264H、V261A、K500E),且EFM37通过停流链置换合成分析同时进行纯化及筛选,作为参考,以从其中鉴别出速率的改善。在两轮筛选之后,相对于EFM37,鉴别两个相关变体EFM88及EFM89,其中dN6P(2.0-2.7倍)及DNA连接子类似物(6.3-8.7倍)两者的并入率大部分增加(图10A)。EFM88及EFM89皆含有相对于野生型的九个表面电荷取代(其中的七个常见),且总共13个取代。这些变化使得在环绕聚合酶活性位点入口的区域中净消除七个负电荷并添加五个正电荷(图10B),引起此区中的静电表面的主要重塑。建模野生型与EFM88静电表面之间的比较展示于图10C中。
在单分子测序反应中,使用DNA连接子类似物底物评估EFM88及EFM89变体。用引发的(primed)M13质粒DNA产生含有EFM88或EFM89的三元复合物,并负载至测序芯片上。在用含有染料标记的DNA连接子类似物的缓冲剂引发测序反应后,观测到核苷酸并入的脉冲特征,并使用用突崩光电二极体仪器收集的数据获得在67-82%精确度范围内对M13参考序列的测序比对。结果展示于图10D-10F中。与EFM89的实例比对也展示于图11中。
为了进一步评估这些发现,使用商业平台在其他测序反应中评估由来自两个独立表达及纯化批次的EFM89制成的三元复合物(2kb模板DNA,衍生自来自λ噬菌体的PCR)。两批EFM89均显示一致测序结果(图12A-12D),具有74-76%精确度及大致3kb读段长度。
实施例3.具有改善的稳定性的经修饰的重组酶
归因于高水平取代(总计13个)的去稳定化作用,EFM88及EFM89在单分子测序中显示低于野生型屎肠球菌聚合酶的纯化产率及活性分率,及较低负载及较短读段长度。
使用合理设计原理及计算工具,设计三张基于EFM89的变体的图,其含有取代以改善稳定性:1.聚合酶活性位点中的逆转或取代(EFM144-154);2.外切核酸酶域或TPR1子域中的新颖稳定性取代(EFM155-160);及3.位于聚合酶表面上的六个残基处的逆转(EFM161-166)。在这些图的情况下,使用针对芯片上筛选优化的EFM的自动小规模纯化工作流程。EFM过程的小型化涉及多个步骤的修饰及优化,包括使用试管培养、溶胞物内抗生蛋白链菌素复合及用与EFM相容的低严格度缓冲剂进行的单步纯化。此方法对野生型屎肠球菌聚合酶产生较高产量,并对多个候选物产生足够进行芯片上筛选的产量(图16)。
在此方法中含有单取代E60L的EFM158(相对于EFM158)显示显著较高的产量(图16)。此产量增加指示E60L的引入使得蛋白质稳定性得到很大改善。
屎肠球菌聚合酶含有位置60处的谷氨酸,而所有其他同源物含有亮氨酸(参见图17中的多个序列比对)。甚至在非常遥远的同源物(<30%一致性)中观测到在此位置处亮氨酸的强序列保守性。此保守亮氨酸残基埋入外切核酸酶域的疏水性核心中。图18显示在内部屎肠球菌聚合酶晶体结构中包围E60且在嵌合体C320中包围L60的疏水性环境。
在商业平台上使用2kb模板测试多个EFM变体。此处,与其产量的显著提高一致,EFM158在负载、读段长度、N50及在6小时测序运行结束时仍具有活性的槽的百分比方面,显示出主要改善(图19)。与EFM89相比,读段长度自3kb增加80%至5.4kb。归因于改善的读段长度分布(图20),EFM158的N50读段长度自4kb增加至8.6kb(意味50%数据在更长的8.6kb读段中)。EFM158的读段长度增加可归因于酶和/或三元复合物在测序条件下的增加的稳定性/可持性,如在6小时运行结束时仍主动复制的槽的百分比自0.9%至12.2%的大幅增加所指示。EFM158及野生型屎肠球菌聚合酶的表面电荷的比较提供于图21中。
实施例4.其他聚合酶变体
EFM158为进化具有改善的测序效能的新EFM候选物提供了更加坚固的主链。产量及芯片上负载的增加能够实现筛选方法的改善,包括自动高通量纯化及多重单分子测序。
因而,使用EFM158作为主链,来筛选所关注的额外EFM变体。多个这些EFM变体证实了精确度的提高,和/或对测序具有其他作用,诸如脉冲间持续时间(图22)、脉冲宽度及读段长度(图23)。
实施例5.富集于用EF聚合酶进行的基于乳剂的IVTT-RCA筛选中的取代
使用诱变PCR,对编码EF聚合酶的基因进行随机诱变,并将其亚克隆至适合于在体外转录及转译(IVTT)表达系统中进行蛋白质表达的环形构筑体中,随后进行滚环复制(IVTT-RCA)。用引物与诱变的EF聚合酶库进行退火,以用于DNA复制,并使用微流芯片在含有IVTT组分、dNTP及Mg++的缓冲剂中乳化至毫微微升级液滴中(Leman等人.Lab Chip,2015,15,753-765);库的乳化得到每个液滴单个基因。在30℃下孵育乳剂16小时。以此方式,使液滴分离的EF变体通过RCA复制其自身基因,使得编码含有有利取代的EF变体的DNA序列富集,这些取代增加其复制能力;负责增加复制能力的取代可包括改善的蛋白质稳定性及产率、持续效力、链置换、DNA结合及速度。在IVTT-RCA之后,破坏乳剂,并回收复制的DNA并对其用引物进行PCR,其中引物经设计以自RCA产物回收含有全长基因的扩增子。使扩增子经受额外一轮IVTT-RCA选择或与发夹衔接子接合,并经受高通量单分子DNA测序以便鉴别所回收的基因中存在的取代。还对起始库进行测序(即在IVTT-RCA选择之前)以充当参考物。在2轮IVTT-RCA选择之后,通过比较该组前后选择序列读段中各取代的相对丰度(含有取代的读段的分率)来鉴别富集的取代(图25)。
实施方案
在一些实施方案中,本发明提供:
1.一种基于选自表1的第一聚合酶的重组聚合酶,其中第一聚合酶的至少一个氨基酸区段已经被来自选自表1的第二聚合酶的对应氨基酸区段置换,其中第一及第二聚合酶不同,且任选地其中重组聚合酶相对于表1的第一和/或第二聚合酶的序列进一步包含一或多个氨基酸插入、缺失或取代。在特定实施方案中,第一聚合酶为屎肠球菌聚合酶(SEQID No:2-5)。在特定实施方案中,第一聚合酶是选自SEQ ID No.23-33中的任一个。
2.如段落1的重组聚合酶,其中第一聚合酶是Φ29聚合酶(SEQ ID NO:1)且第二聚合酶是选自SEQ ID NO:2-33中的任一个。在特定实施方案中,第二聚合酶选自SEQ ID NO:2-5。在特定实施方案中,第二聚合酶选自SEQ ID NO:23-33。
3.如任何前述段落的重组聚合酶,其中第一聚合酶的至少一个至三个额外氨基酸区段已经被来自表1的一或多个聚合酶的对应的氨基酸区段置换,其中表1的该一或多个聚合酶不同于第一聚合酶,且任选地其中对应的氨基酸区段中的一或多个包含相对于表1中的其序列的一或多个氨基酸插入、缺失或取代。
4.如任何前述段落的重组聚合酶,其中区段中的一或多个包含表1的聚合酶的域。
5.如任何前述段落的重组聚合酶,其中氨基酸区段中的一或多个包含表1的聚合酶的域的一部分。
6.如段落4或5的重组聚合酶,其中氨基酸区段中的一或多个包含一或多个在表1的聚合酶中侧接该域或其部分的氨基酸。
7.如任何先前段落的重组聚合酶,其中至少一个氨基酸插入、缺失或取代对应于在表1的不同天然存在聚合酶中发现的氨基酸插入、缺失或取代。
8.如任何先前段落的重组聚合酶,其中至少一个氨基酸插入、缺失或取代对应于未在表1的天然存在聚合酶中发现的氨基酸插入、缺失或取代。
9.如任何先前段落的重组聚合酶,其中一或多个对应氨基酸区段是选自由以下组成的组:来自M2Y聚合酶的氨基酸1-51、来自屎肠球菌聚合酶的氨基酸271-375、来自屎肠球菌聚合酶的氨基酸72-89和/或来自屎肠球菌聚合酶的氨基酸445-449。
10.如任何先前段落的重组聚合酶,其中至少一个氨基酸插入、缺失或取代是在对应于选自以下位置的位置的位置处:Φ29聚合酶中的M8、V51、N62、I71、L107、K131、K135、L142、G135、L142、Y148、G197、Y224、Y226、E239、V250、N251、L253、Y281、I288、T301、R306、R308、D325、D341、K354、T368、E375、K379、Q380、A437、A444、P447、E466、D476、K478、A484、E508、D510、K512、E515、K539、D570及T571。
11.如段落10的重组聚合酶,其包含一或多个选自以下的氨基酸取代:M8R、V51A、N62D、I71V、L107I、K131E、K135Q、L142K、Y148I、G197D、Y224K、Y226F、E239G、V250A、V250I、N251R、L253A、L253H、Y281H、I288L、T301C、R306Q、R308L、D325E、D341E、K354R、T368F、E375K、E375Y、K379R、Q380R、A437G、A444T、E466K、D476H、P477D、K478D、A484C、A484Q、A484N、A484E、A484D、A484K、A484R、A484H、A484Y及A484X(其中X表示非天然氨基酸,如本文中所描述)、E508R、D510K、D510R、K512Y、E515Q、K539E、D570S及T571V。
12.如任何先前段落的重组聚合酶,其包含一或多个对应于以下的位置处的氨基酸取代:SEQ ID NO:1中的I71、L107、K135、L142、G197、Y224、E239、V250、L253、E375、A437、A444、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571。
13.如段落12的重组聚合酶,其中该一或多个氨基酸取代是选自SEQ ID NO:1中的I71V、L107I、K135Q、L142K、G197V、Y224K、E239G、V250I、L253A、E375Y、A437G、A444V、E466K、D476H、A484E、E508R、D510R、K512Y、E515Q、K539E、D570S及T571V。
14.如任何先前段落的重组聚合酶,其包含一或多个对应于以下的位置处的氨基酸取代:SEQ ID NO:1中的K131、K135、L142、Y148、Y224、E239、V250、L253、R306、R308、E375、A437、E466、D476、A484、E508、D510、K512、E515、K539、D570及T571。
15.如段落14的重组聚合酶,其中该一或多个氨基酸取代是选自SEQ ID NO:1中的K131E、K135Q、L142K、Y148I、Y224K、E239G、V250A、V250I、L253A、L253H、R306Q、R308L、E375Y、A437G、E466K、D476H、A484E、E508R、D510K、D510R、K512Y、E515Q、K539E、D570E、D570S及T571V。
16.如段落14的重组聚合酶,其中该一或多个氨基酸取代是选自SEQ ID NO:1中的K131E、L142K、Y148I、Y224K、E239G、V250A、L253H、E375Y、A437G、A484E、E508R、D510K、K512Y、E515Q及D570E。
17.如任何前述段落的重组聚合酶,其中经取代区段中的至少一或多个包含外切核酸酶区域、掌型区域、TPR1区域、手指型区域、TPR2区域、拇指型区域或其中任一个的部分,且任选地包含一或多个侧接氨基酸。
18.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致且包含表2-7的一或多个氨基酸修饰的氨基酸序列。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.23-33中的任一个。
19.如段落18的重组聚合酶,其中一或多个氨基酸修饰包括至少一个氨基酸突变。
20.如段落18的重组聚合酶,其中一或多个氨基酸修饰包括至少一个域取代。
21.如段落18的重组聚合酶,其中一或多个氨基酸修饰包括至少一个域取代及至少一个氨基酸突变。
22.如段落18的重组聚合酶,其具有选自表2的序列,或如段落18的重组聚合酶,其具有表7中所列的修饰的组合。
23.如段落18的重组聚合酶,其具有选自表3或表4的序列。
24.如任何前述段落的重组聚合酶,其进一步包含纯化标签。
25.如段落24的重组聚合酶,其中纯化标签是C端标签。
26.如段落24的重组聚合酶,其中纯化标签是N端标签。
27.如段落24、25或26的重组聚合酶,其中纯化标签为His标签。
28.如任何前述段落的重组聚合酶,其进一步包含偶联基团。
29.如段落28的重组聚合酶,其中偶联基团附接在重组聚合酶的C末端处。
30.如段落28的重组聚合酶,其中偶联基团附接在重组聚合酶的N末端处。
31.如段落28、29或30的重组聚合酶,其中偶联基团是生物素标记序列或双生物素标记序列。
32.如任何先前段落的重组聚合酶,其包含His标签及生物素标记序列或双生物素标记序列。
33.如段落18的重组聚合酶,其固定于表面上。
34.如段落33的重组聚合酶,其中该表面包含纳米孔。
35.一种经分离核酸分子,其编码如段落18的重组聚合酶。
36.一种组合物,其包含如段落18的重组聚合酶。
37.一种测序核酸的方法,该方法包含使如段落18的重组聚合酶与测序反应混合物接触。
38.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含与来自表1、表2、表3或表4的不同聚合酶的外切核酸酶区域至少60%、60-70%、70-80%或至少80%一致的外切核酸酶区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.23-33中的任一个。
39.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含与来自表1、表2或表3的不同聚合酶的掌型区域至少60%、60-70%、70-80%或至少80%一致的掌型区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ IDNo.23-33中的任一个。
40.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含与来自表1、表2或表3的不同聚合酶的TPR1区域至少60%、60-70%、70-80%或至少80%一致的TPR1区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ IDNo.23-33中的任一个。
41.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含与来自表1、表2或表3的不同聚合酶的手指型区域至少60%、60-70%、70-80%或至少80%一致的手指型区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ IDNo.23-33中的任一个。
42.一种重组聚合酶,其具有与表1的氨基酸序列至少80%一致的氨基酸序列,且包含与来自表1、表2或表3的不同聚合酶的TPR2区域至少80%一致的TPR2区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.23-33中的任一个。
43.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含与来自表1、表2或表3的不同聚合酶的拇指型区域至少60%、60-70%、70-80%或至少80%一致的拇指型区域。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ IDNo.23-33中的任一个。
44.一种重组聚合酶,其具有与表1的氨基酸序列至少60%、60-70%、70-80%或至少80%一致且包含两个或更多个先前段落中的任一个的区域的氨基酸序列。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.2-5中的任一个。在特定实施方案中,表1的氨基酸序列是选自SEQ ID No.23-33中的任一个。
45.一种测序方法,其包含使用任何先前段落的一或多个聚合酶进行测序反应。
46.一种经修饰的重组酶,其包含第一区段及第二区段,其中:
所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ ID NO:2的氨基酸197-271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及
所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ ID NO:2的氨基酸443-528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。在特定实施方案中,第一区段包含与SEQ ID NO:2的197-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列,且第二区段包含与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
47.一种包含第一区段的经修饰的重组酶,所述第一区段包含对应于参考区段的氨基酸序列,所述参考区段含有SEQ ID NO:2的氨基酸1-196,其中所述第一区段的氨基酸序列与所述参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致;且其中所述第一区段具有高于所述参考区段的等电点。在特定实施方案中,第一区段包含与SEQ IDNO:2的1-196至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
48.一种经修饰的重组酶,其包含第一区段及第二区段,其中:
所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ ID NO:2的氨基酸1-271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及
所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ ID NO:2的氨基酸443-528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80-90%、90-95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。在特定实施方案中,第一区段包含与SEQ ID NO:2的1-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列,且第二区段包含与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
49.如段落46至48中任一项的经修饰的重组酶,其中经修饰的重组酶之胺基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
50.如段落49的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D171K、D171H、D171R、N175T、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
51.如段落49或段落50的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
52.如段落51的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、I148K、I148H、I148R、D167P、D167K、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
53.如段落46至52中任一项的经修饰的重组酶,其中经修饰的重组酶之胺基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
54.如段落53的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、I384T、I384F、I384S、E385Y、E385Y、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、R534K、E537K、E537H、E537R、E545K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
55.如段落53的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:D374G、E385Y、E391Y、E391W、E391K、E391F、D533A、E537K、E537H、E537R及E545K。
56.如段落53至55中任一项的经修饰的重组酶,其中经修饰的重组酶包含表7中所列的修饰的组合。
57.如段落53至55中任一项的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的位置处的修饰:E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537。
58.如段落57的经修饰的重组酶,其中:
位置E142处的修饰为E142K;
位置I148处的修饰为I148K;
位置D189处的修饰为D189K;
位置V261处的修饰为V261A;
位置L264处的修饰为L264H;
位置R308处的修饰为R308G;
位置E391处的修饰为E391Y;
位置E482处的修饰为E482K;
位置D492处的修饰为D492H;
位置K500处的修饰为K500E;
位置D521处的修饰为D521K;
位置E523处的修饰为E523K;及
位置E537处的修饰为E537K。
59.如段落58的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
60.如段落58的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含位置E60处的修饰。
61.如段落60的经修饰的重组酶,其中E60处的修饰为E60L。
62.如段落61的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
63.如段落61的经修饰的重组酶,其中经修饰的重组酶进一步包含双生物素标签。
64.如段落63的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
65.一种经修饰的重组酶,其包含一或多个选自以下的区段:
具有与SEQ ID NO:2的氨基酸1-196至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第一区段,其中所述第一区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188及D189;
具有与SEQ ID NO:2的氨基酸197-271至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第二区段,其中所述第二区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264及S267;和/或
具有与SEQ ID NO:2的氨基酸443-528至少80%、80-90%、90-95%或至少95%一致的氨基酸序列的第三区段,其中所述第三区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
66.如段落65的经修饰的重组酶,其中经修饰的重组酶包含第一区段及第二区段。
67.如段落65的经修饰的重组酶,其中经修饰的重组酶包含第二区段及第三区段。
68.如段落65的经修饰的重组酶,其中经修饰的重组酶包含第一区段及第三区段。
69.如段落65的经修饰的重组酶,其中经修饰的重组酶包含第一区段、第二区段及第三区段。
70.如段落65至69中任一项的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D171K、D171H、D171R、N175T、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
71.如段落65至70中任一项的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
72.如段落71的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、I148K、I148H、I148R、D167P、D167K、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
73.如段落65至72中任一项的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
74.如段落73中的方法,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、I384T、I384F、I384S、E385Y、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、R534K、E537K、E537H、E537R、E545K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
75.如段落73中的方法,其中修饰为选自由以下组成的组的氨基酸取代:D374G、E385Y、E391Y、E391W、E391K、E391F、D533A、E537K、E537H、E537R及E545K。
76.如段落73至75中任一项的经修饰的重组酶,其中经修饰的重组酶包含表7中所列的修饰的组合。
77.如段落73至76中任一项的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的位置处的修饰:E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537。
78.如段落77的经修饰的重组酶,其中:
位置E142处的修饰为E142K;
位置I148处的修饰为I148K;
位置D189处的修饰为D189K;
位置V261处的修饰为V261A;
位置L264处的修饰为L264H;
位置R308处的修饰为R308G;
位置E391处的修饰为E391Y;
位置E482处的修饰为E482K;
位置D492处的修饰为D492H;
位置K500处的修饰为K500E;
位置D521处的修饰为D521K;
位置E523处的修饰为E523K;及
位置E537处的修饰为E537K。
79.如段落78的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
80.如段落78的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含位置E60的修饰。
81.如段落80的经修饰的重组酶,其中E60处的修饰为E60L。
82.如段落81的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
83.如段落81的经修饰的重组酶,其中经修饰的重组酶进一步包含双生物素标签。
84.如段落83的经修饰的重组酶,其中经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
85.一种经修饰的重组酶,其包含含有以下的氨基酸序列:(i)第一区段、第二区段、第三区段、第四区段、第五区段、第六区段及第七区段;及(ii)在对应于SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545的一或多个位置处的修饰;其中
所述第一区段包含与表1、表2或表3的聚合酶的外切核酸酶区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;
所述第二区段及所述第六区段共同包含与表1、表2或表3的聚合酶的掌型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;
所述第三区段包含与表1、表2或表3的聚合酶的TPR1区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;
所述第四区段包含与表1、表2或表3的聚合酶的手指型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;
所述第五区段包含与表1、表2或表3的聚合酶的TPR2区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列;及
所述第七区段包含与表1、表2或表3的聚合酶的拇指型区域至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。在特定实施方案中,来自表1的聚合酶是选自SEQID No:2-5中的任一个。在一些实施方案中,来自表1的聚合酶是选自SEQ ID NO:23-33中的任一个。
86.如段落85的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、I148K、I148H、I148R、D167P、D167K、D171K、D171H、D171R、D189K、D189H、D189R、D374G、E385Y、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、E537K、E537H、E537R及E545K。
87.如段落85或86的经修饰的重组酶,其进一步包含一或多个对应于以下的位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、P147、E152、I153、P160、N175、F188、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、I384、N388、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、T479、A484、E485、A486、L490、S493、K500、S503、Q506、Q513、E519、V526、R534、G547、L555、P556、R558、T559、V564、T568、M569及T571。
88.如段落87的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、P147Q、P147T、E152D、I153V、P160A、N175T、F188C、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、I384T、I384F、I384S、N388T、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、T479V、A484E、E485D、A486E、L490M、S493P、K500E、S503A、S503T、Q506K、Q513D、V526L、R534K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
89.如段落87或88的经修饰的重组酶,其中经修饰的重组酶包含表7中所列的修饰的组合。
90.一种经修饰的重组酶,其包含:
与SEQ ID NO:2至少60%、60-70%、70-80%或至少80%一致的氨基酸序列;及
延长掌型域,其中所述延长掌型域包含与SEQ ID NO:1的氨基酸505-524至少80%、80-90%、90-95%或至少95%一致的氨基酸序列。
91.如段落90的经修饰的重组酶,其进一步包含一或多个对应于以下的位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
92.如段落91的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D171K、D171H、D171R、N175T、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
93.如段落91或92的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列进一步包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
94.如段落93的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、I148K、I148H、I148R、D167P、D167K、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
95.如段落91至94中任一项的经修饰的重组酶,其中经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
96.如段落95中的方法,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、I384T、I384F、I384S、E385Y、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、R534K、E537K、E537H、E537R、E545K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
97.如段落95中的方法,其中修饰为选自由以下组成的组的氨基酸取代:D374G、E385Y、E391Y、E391W、E391K、E391F、D533A、E537K、E537H、E537R及E545K。
98.如段落95至97中任一项的经修饰的重组酶,其中经修饰的重组酶包含表7中所列的修饰的组合。
99.一种经修饰的重组酶,其具有与SEQ ID NO:1-33中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列,其中所述氨基酸序列包含对应于以下的一或多个位置处的修饰:屎肠球菌聚合酶(SEQ ID NO:2)的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。在特定实施方案中,经修饰的重组酶具有与SEQ ID NO:2-5中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列且包含一或多个位置处的修饰。在一个特定实施方案中,经修饰的重组酶为具有与SEQ ID NO:2中的任一个至少60%、60-70%、70-80%或至少80%一致的氨基酸序列的经修饰的屎肠球菌聚合酶,且包含所述等位置中的一或多个处的修饰。在一个特定实施方案中,经修饰的重组酶为包含SEQ ID NO:2的氨基酸序列的经修饰的屎肠球菌聚合酶,且包含所述等位置中的一或多个处的修饰。在一些实施方案中,经修饰的重组酶具有与SEQ ID NO:23-33中的任一个60%、60-70%、70-80%或至少80%一致的氨基酸序列,且包含一或多个位置处的修饰。
100.如段落99的经修饰的重组酶,其包含对应于SEQ ID NO:2的T568及M569的一个或两个位置处的修饰。
101.如段落100的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:T568D、T568S、M569T及M569V。
102.如段落100或段落101的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的持续效力。
103.如段落99至102中任一项的经修饰的重组酶,其包含对应于SEQ ID NO:2的N59的位置处的修饰。
104.如段落103的经修饰的重组酶,其中所述修饰为N59D。
105.如段落103或段落104的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改变的外切核酸酶活性。
106.如段落99至105中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500的位置处的修饰。
107.如段落106的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:V261A、V261I、L264A、L264H、L264M、S267A、I384F、I384S、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、W452Y、G453A、Y455W、D492H及K500E。
108.如段落106或段落107的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的核苷酸底物利用率。
109.如段落99至108中任一项的经修饰的重组酶,其包含一或多个对应于以下的位置处的修饰:SEQ ID NO:2的E65、Y133、E391、G400、V443、L445、A446、S447、V449、T450、S503、E523、L555及P556。
110.如段落109的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E65S、Y133L、E391Y、E391W、E391F、E391K、G400L、V443T、L445M、A446G、S447V、V449I、T450A、S503A、E523K、E523Y、E523F、E523H、E523W、L555K及P556A。
111.如段落109或段落110的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的精确度。
112.如权利要求99至111中任一项的经修饰的重组酶,其包含一或多个对应于SEQID NO:2的Q317、S319、I322、Q323、R429、L555及T559的位置处的修饰。
113.如段落112的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:Q317R、S319R、I322K、Q323G、R429G、L555K及T559V。
114.如段落112或段落113的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的DNA结合亲和力。
115.如段落99至114中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的E391、S503及E523的位置处的修饰。
116.如段落115的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E391Y、E391W、E391F、E391K、S503A、E523K、E523Y、E523F、E523H及E523W。
117.如段落115或段落116的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的类似物结合亲和力。
118.如段落99至117中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的Q206、E436及L437的位置处的修饰。
119.如段落118的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:Q206R、Q206K、Q206H、E436R、L437Y及L437E。
120.如段落118或段落119的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的链置换。
121.如段落99至120中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的E436、L437、R534、T568及M569的位置处的修饰。
122.如段落121的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E436R、L437Y、L437E、R534K、T568D、T568S、M569T及M569V。
123.如段落121或段落122的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增强的平均读段长度。
124.如段落99至123中任一项的经修饰的重组酶,其包含一或多个对应于以下的位置处的修饰:SEQ ID NO:2的T13、V25、C26、D27、N33、I34、F36、S42、D54、M95、T110、T114、K119、P136、P147、E152、I153、P160、N175、F188、S216、R217、D232、A236、V247、P273、E283、V315、S319、L320、Q323、E338、T345、F352、F353、T364、D414、D425、E436、F465、E485、A486、L490、S503、E523、V526、G547、L555、R558、V564、M569及T571。
125.如段落124的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:T13N、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、M95T、M95K、T110I、T114S、K119Q、P136T、P147Q、P147T、E152D、I153V、P160A、N175T、F188C、S216G、S216R、R217G、D232H、A236G、V247D、P273S、E283K、V315L、S319R、L320M、L320T、Q323R、E338K、T345I、F352I、F353C、T364I、D414V、D425N、E436G、F465Y、E485D、A486E、L490M、S503T、E523V、V526L、G547S、L555R、R558H、V564L、M569K及T571S。
126.如段落124或段落125的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的复制能力。
127.如段落99至126中任一项的经修饰的重组酶,其包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545。
128.如段落127的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、I148K、I148H、I148R、D167P、D167K、D171K、D171H、D171R、D189K、D189H、D189R、D374G、E385Y、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、E537K、E537H、E537R及E545K。
129.如段落127或段落128的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的正电性表面电荷。
130.如段落99至129中任一项的经修饰的重组酶,其包含一或多个对应于以下的位置处的修饰:SEQ ID NO:2的K4、S22、D27、I34、D54、E60、E85、M95、N106、T110、Q122、Y133、P136、P147、D167、T211、D232、P275、R308、S319、L320、E323、D337、E338、D341、T345、F352、T364、D414、F465、T479、E485、L490、S493、Q513及R558。
131.如段落130的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、S22A、D27E、I34V、D54Y、E60V、E60L、E85P、M95K、T110I、N106G、Q122V、Y133L、P136T、P147Q、P147T、D167P、T211A、D232K、P275S、R308G、S319R、L320M、Q323V、D337G、E338K、D341T、T345I、F352I、T364I、D414V、F465Y、T479V、E485D、L490M、S493P、Q513D及R558H。
132.如段落130或段落131的经修饰的重组酶,其中经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的稳定性。
133.如段落99至132中任一项的经修饰的重组酶,其中经修饰的重组酶包含表7中所列的修饰的组合。
134.一种组合物,其包含如段落46至133中任一项的经修饰的重组酶。
135.一种测序核酸的方法,所述方法包含使如段落46至133中任一项的经修饰的重组酶与测序反应混合物接触。
本说明书中公开的所有特点可以任何组合形式组合。本说明书中公开的各特点可被用于相同、等效或类似目的的替代特点置换。因此,除非另外明确说明,否则所公开的各特点仅为等效或类似特点的通用系列的一个实例。
根据以上描述,本领域技术人员可易于确定本发明的基本特征,且在不脱离本发明的精神及范畴的情况下可对本发明作出各种改变及修改以使其适应各种用途及条件。因此,其他实施方案亦属于申请专利范围内。
等效物及范畴
尽管本文中已描述及说明若干个发明实施方案,但本领域普通技术人员将容易设想多种其他方法和/或结构来执行功能和/或获得本文所述的结果和/或一或多种优点,且此类变更和/或润饰中的每一个视为属于本文所述的本发明实施方案的范畴内。更一般化地,本领域技术人员将易于了解本文所述的所有参数、尺寸、材料及配置意欲为示例性的,且实际参数、尺寸、材料和/或配置将视使用发明的教导所针对的特定应用或多种应用而定。本领域技术人员将认识到或使用不多于常规实验便能够确定本文所描述的特定本发明实施方案的许多等效物。因此,应理解前述实施方案仅借助于实例展现,且在随附申请专利范围及其等效物的范畴内,发明性实施方案可以不同于具体描述及主张的其他方式来实践。本发明的发明性实施方案是关于本文所述的各个别特点、系统、物品、材料、试剂盒和/或方法。另外,若两种或更多种此类特点、系统、物品、材料、试剂盒和/或方法彼此间无不一致,则此类特点、系统、物品、材料、试剂盒和/或方法的任何组合包括于本发明的发明范畴内。
如本文所定义及使用的所有定义应理解为高于辞典定义、以引用方式所并入的文献中的定义和/或所定义术语的普通含义。
本文中所公开的所有参考、专利及专利申请以引用的方式相关于各自经引用的主题并入,其在一些情况下可涵盖文件的全部内容。
除非有清晰相反指示,否则如在本说明书及申请专利范围中所使用的词“一”应被理解为意味“至少一个”。
如本文在说明书及申请专利范围中使用的短语“和/或”应理解为意味如此结合的元素的“任一个或两个”,即,在一些情况下,元素结合地存在,且在其他情况下,元素未结合地存在。使用“和/或”列出的多个元素应以相同方式解释,即,如此结合的“一或多个”元素。可任选地存在除了通过“和/或”从句所具体标识的元素之外的其他元素,无论与具体标识的这些元素相关或无关。因此,作为非限制性实例,指代“A和/或B”在结合诸如“包含”等开放式措辞使用时,在一个实施方案中,可仅指A(任选地包括除了B以外的元素);在另一实施方案中,可仅指B(任选地包括除了A以外的元素);在另一实施方案中,可指A及B两者(任选地包括其他元素);等。
如在本说明书及申请专利范围中所用,“或”应理解为具有与上文所定义的“和/或”相同的含义。举例而言,当分离清单中的项目时,“或”或“和/或”应解释为包括性的,即,包括若干或一列元素中的至少一个,但也包括多于一个,及,任选地,额外未列出的项目。截然相反的术语,诸如“中的仅一个”或“中的恰好一个”或当用于申请专利范围中时“由……组成”将指包括若干或一列元素中的恰好一个元素。一般而言,当置于排他性术语,诸如“任一”、“中的一个”、“中的仅一个”或“中的恰好一个”之前时,如本文所用的术语“或”应仅解释为指示排他性替代方式(即“一个或另一个但非二者皆”)。当用于申请专利范围中时,“基本上由……组成”应具有如其在专利法律领域中所使用的普通含义。
如说明书及申请专利范围中所用,短语“至少一个”在提及一或多个元素的清单时,应该理解为意味选自元素清单的任一或多个元素中的至少一个元素,但不一定包括元素清单内具体所列的每一个元素中的至少一个且不排除元素清单中的任何元素组合。此定义也允许可任选地存在除短语“至少一个”所指的该系列元素内具体识别的元素以外的元素,而无论与具体识别的这些元素相关抑或不相关。由此,作为非限制性实例,“至少一个A及B”(或等效地“至少一个A或B”,或等效地“至少一个A和/或B”)可在一个实施方案中指至少一个(任选地包括超过一个)A而不存在B(且任选地包括除B以外的元素);在另一实施方案中,指至少一个(任选地包括超过一个)B而不存在A(且任选地包括除A以外的元素);在又一实施方案中,指至少一个(任选地包括超过一个)A及至少一个(任选地包括超过一个)B(且任选地包括其他元素);等。
亦应理解,除非截然相反地指示,否则在本文所主张的包括超过一个步骤或操作的任何方法中,该方法的步骤或操作的次序无需局限于叙述该方法的步骤或操作的顺序。
在申请专利范围中以及在上述说明书中,诸如“包含”、“包括”、“携载”、“具有”、“含有”、“涉及”、“拥有”、“由……构成”及其类似者的全部过渡性短语应理解为开放的,即,意味包括但不限于。仅过渡短语“由…组成”及“基本上由…组成”应分别为封闭或半封闭过渡短语,如美国专利局专利审查程序手册(United States Patent Office Manual ofPatent Examining Procedures)第2111.03节中所述。应了解,在替代实施方案中,还涵盖此文件中使用开放式过渡短语(例如“包含”)描述的实施方案,如“由……组成”及“基本上由……组成”由开放式过渡短语描述的特点。举例而言,若本发明描述“包含A及B的组合物”,则本发明亦涵盖替代实施方案“由A及B组成的组合物”及“基本上由A及B组成的组合物”。

Claims (103)

1.一种经修饰的重组酶,其包含第一区段及第二区段,其中:
所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ IDNO:2的氨基酸197至271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80至90%、90至95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及
所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ IDNO:2的氨基酸443至528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80至90%、90至95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。
2.一种经修饰的重组酶,其包含第一区段,所述第一区段包含对应于参考区段的氨基酸序列,所述参考区段含有SEQ ID NO:2的氨基酸1至196,其中所述第一区段的氨基酸序列与所述参考区段的氨基酸序列至少80%、80至90%、90至95%或至少95%一致;且其中所述第一区段具有高于所述参考区段的等电点。
3.一种经修饰的重组酶,其包含第一区段及第二区段,其中:
所述第一区段包含对应于第一参考区段的氨基酸序列,所述第一参考区段含有SEQ IDNO:2的氨基酸1至271,其中所述第一区段的氨基酸序列与所述第一参考区段的氨基酸序列至少80%、80至90%、90至95%或至少95%一致,且其中所述第一区段具有高于所述第一参考区段的等电点;及
所述第二区段包含对应于第二参考区段的氨基酸序列,所述第二参考区段含有SEQ IDNO:2的氨基酸443至528,其中所述第二区段的氨基酸序列与所述第二参考区段的氨基酸序列至少80%、80至90%、90至95%或至少95%一致,且其中所述第二区段具有高于所述第二参考区段的等电点。
4.如权利要求1至3中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
5.如权利要求4的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
6.如权利要求3或4的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
7.如权利要求6的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
8.如权利要求1至7中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
9.如权利要求8的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
10.如权利要求8的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。
11.如权利要求8至10中任一项的经修饰的重组酶,其中所述经修饰的重组酶包含表7中所列的修饰的组合。
12.如权利要求1至11中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537。
13.如权利要求12的经修饰的重组酶,其中:
位置E142处的修饰为E142K;
位置I148处的修饰为I148K;
位置D189处的修饰为D189K;
位置V261处的修饰为V261A;
位置L264处的修饰为L264H;
位置R308处的修饰为R308G;
位置E391处的修饰为E391Y;
位置E482处的修饰为E482K;
位置D492处的修饰为D492H;
位置K500处的修饰为K500E;
位置D521处的修饰为D521K;
位置E523处的修饰为E523K;及
位置E537处的修饰为E537K。
14.如权利要求13的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
15.如权利要求13的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含位置E60处的修饰。
16.如权利要求15的经修饰的重组酶,其中E60处的修饰为E60L。
17.如权利要求16的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
18.如权利要求17的经修饰的重组酶,其中所述经修饰的重组酶进一步包含双生物素标签。
19.如权利要求18的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
20.一种经修饰的重组酶,其包含一或多个选自以下的区段:
具有与SEQ ID NO:2的氨基酸1至196至少80%、80至90%、90至95%或至少95%一致的氨基酸序列的第一区段,其中所述第一区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188及D189;
具有与SEQ ID NO:2的氨基酸197至271至少80%、80至90%、90至95%或至少95%一致的氨基酸序列的第二区段,其中所述第二区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264及S267;和/或
具有与SEQ ID NO:2的氨基酸443至528至少80%、80至90%、90至95%或至少95%一致的氨基酸序列的第三区段,其中所述第三区段的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
21.如权利要求20的经修饰的重组酶,其中所述经修饰的重组酶包含所述第一区段及所述第二区段。
22.如权利要求20的经修饰的重组酶,其中所述经修饰的重组酶包含所述第二区段及所述第三区段。
23.如权利要求20的经修饰的重组酶,其中所述经修饰的重组酶包含所述第一区段及所述第三区段。
24.如权利要求20的经修饰的重组酶,其中所述经修饰的重组酶包含所述第一区段、所述第二区段及所述第三区段。
25.如权利要求20至24中任一项的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
26.如权利要求20至25中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
27.如权利要求26的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
28.如权利要求20至27中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
29.如权利要求28的方法,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
30.如权利要求28的方法,其中修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H、E545R。
31.如权利要求28至30中任一项的经修饰的重组酶,其中所述经修饰的重组酶包含表7中所列的修饰的组合。
32.如权利要求20至31中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E142、I148、D189、V261、L264、R308、E391、E482、D492、K500、D521、E523及E537。
33.如权利要求32的经修饰的重组酶,其中:
位置E142处的修饰为E142K;
位置I148处的修饰为I148K;
位置D189处的修饰为D189K;
位置V261处的修饰为V261A;
位置L264处的修饰为L264H;
位置R308处的修饰为R308G;
位置E391处的修饰为E391Y;
位置E482处的修饰为E482K;
位置D492处的修饰为D492H;
位置K500处的修饰为K500E;
位置D521处的修饰为D521K;
位置E523处的修饰为E523K;及
位置E537处的修饰为E537K。
34.如权利要求33的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:88的氨基酸序列。
35.如权利要求33的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含位置E60处的修饰。
36.如权利要求35的经修饰的重组酶,其中E60处的修饰为E60L。
37.如权利要求36的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:157的氨基酸序列。
38.如权利要求36的经修饰的重组酶,其中所述经修饰的重组酶进一步包含双生物素标签。
39.如权利要求38的经修饰的重组酶,其中所述经修饰的重组酶包含SEQ ID NO:180的氨基酸序列。
40.一种经修饰的重组酶,其包含含有以下的氨基酸序列:(i)第一区段、第二区段、第三区段、第四区段、第五区段、第六区段及第七区段;及(ii)在对应于SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545的一或多个位置处的修饰;其中
所述第一区段包含与表1、表2或表3的聚合酶的外切核酸酶区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列;
所述第二区段及所述第六区段共同包含与表1、表2或表3的聚合酶的掌型区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列;
所述第三区段包含与表1、表2或表3的聚合酶的TPR1区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列;
所述第四区段包含与表1、表2或表3的聚合酶的手指型区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列;
所述第五区段包含与表1、表2或表3的聚合酶的TPR2区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列;及
所述第七区段包含与表1、表2或表3的聚合酶的拇指型区域至少80%、80至90%、90至95%或至少95%一致的氨基酸序列。
41.如权利要求40的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H、E545R。
42.如权利要求40或41的经修饰的重组酶,其进一步包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、P147、E152、I153、P160、N175、F188、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、I384、N388、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、T479、A484、E485、A486、L490、S493、K500、S503、Q506、Q513、E519、V526、R534、G547、L555、P556、R558、T559、V564、T568、M569及T571。
43.如权利要求42的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、P147Q、P147T、E152D、I153V、P160A、N175T、N175Y、F188C、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、I384T、I384F、I384S、N388T、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、T479V、A484E、E485D、A486E、L490M、S493P、K500E、S503A、S503T、Q506K、Q513D、V526L、R534K、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
44.如权利要求42或43的经修饰的重组酶,其中所述经修饰的重组酶包含表7中所列的修饰的组合。
45.一种经修饰的重组酶,其包含:
与SEQ ID NO:2至少60%、60至70%、70至80%或至少80%一致的氨基酸序列;及
延长掌型域,其中所述延长掌型域包含与SEQ ID NO:1的氨基酸505至524至少80%、80至90%、90至95%或至少95%一致的氨基酸序列的添加。
46.如权利要求45的经修饰的重组酶,其进一步包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523及V526。
47.如权利要求46的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、T13N、S22A、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、N59D、E60L、E60V、E65S、E85P、M95T、M95K、N106G、T110I、T114S、K119Q、Q122V、Y133L、P136T、E139K、E139Q、E139R、E139H、E142K、E142Q、E142R、E142H、N145K、N145H、N145R、P147Q、P147T、I148K、I148H、I148R、E152D、I153V、P160A、D167P、D167K、D167H、D167R、D171K、D171H、D171R、N175T、N175Y、F188C、D189K、D189H、D189R、Q206R、Q206K、Q206H、T211A、S216G、S216R、R217G、D232K、A236G、V247D、I253H、I253A、V261A、V261I、V261L、L264H、L264A、L264M、S267A、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、F465Y、N467R、N467K、N467H、N467S、N467T、T479V、E482K、E482H、E482R、A484E、E485D、A486E、L490M、D492H、D492K、D492R、D492A、H492S、S493P、K495R、K500E、S503A、S503T、Q506K、Q513D、D521K、D521R、D521H、E523R、E523V、E523Y、E523F、E523H、E523W及V526L。
48.如权利要求46或47的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列进一步包含对应于以下的一或多个位置处的修饰:E139、E142、N145、I148、D167、D171、D189、N467、E482、D492、K495、D521及E523。
49.如权利要求48的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F及E523W。
50.如权利要求46至49中任一项的经修饰的重组酶,其中所述经修饰的重组酶的氨基酸序列包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
51.如权利要求50的方法,其中修饰为选自由以下组成的组的氨基酸取代:P273S、P273R、P275S、E283K、V315L、S319R、R308G、G308R、Q317R、S319R、L320M、L320T、I322K、Q323G、Q323V、Q323R、D337G、E338K、D341T、T345I、F352I、F353C、T364I、D374G、D374Q、D374H、I384T、I384F、I384S、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、N388T、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、A396Q、N397L、G400L、D414V、D425N、R429G、E436R、E436G、L437Y、L437E、D533A、D533Q、D533T、D533R、D533S、R534K、E537K、E537H、E537R、E545K、E545H、E545R、G547S、L555K、L555R、P556A、R558H、T559V、V564L、T568D、T568S、M569K、M569T、M569V及T571S。
52.如权利要求50的方法,其中修饰为选自由以下组成的组的氨基酸取代:D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K E545H、E545R。
53.如权利要求50至52中任一项的经修饰的重组酶,其中所述经修饰的重组酶包含表7中所列的修饰的组合。
54.一种经修饰的重组酶,其具有与SEQ ID NO:1至33中的任一个至少60%、60至70%、70至80%或至少80%一致的氨基酸序列,其中所述氨基酸序列包含对应于以下的一或多个位置处的修饰:屎肠球菌(E.faecium)聚合酶(SEQ ID NO:2)的K4、T13、S22、V25、C26、D27、N33、I34、F36、S42、D54、N59、E60、E65、E85、M95、N106、T110、T114、K119、Q122、Y133、P136、E139、E142、N145、P147、I148、E152、I153、P160、D167、D171、N175、F188、D189、Q206、T211、S216、R217、D232、A236、V247、I253、V261、L264、S267、P273、P275、R308、V315、Q317、S319、L320、I322、Q323、D337、E338、D341、T345、F352、F353、T364、D374、I384、E385、N388、E391、A396、N397、G400、D414、D425、R429、E436、L437、V443、L445、A446、S447、V449、T450、W452、G453、Y455、F465、N467、T479、E482、A484、E485、A486、L490、D492、S493、K495、K500、S503、Q506、Q513、E519、D521、E523、V526、D533、R534、E537、G547、E545、L555、P556、R558、T559、V564、T568、M569及T571。
55.如权利要求54的经修饰的重组酶,其包含对应于SEQ ID NO:2的T568及M569的一个或两个位置处的修饰。
56.如权利要求55的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:T568D、T568S、M569T及M569V。
57.如权利要求55或权利要求56的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的持续效力。
58.如权利要求54至57中任一项的经修饰的重组酶,其包含对应于SEQ ID NO:2的N59的位置处的修饰。
59.如权利要求58的经修饰的重组酶,其中所述修饰为N59D。
60.如权利要求58或权利要求59的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改变的外切核酸酶活性。
61.如权利要求54至60中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的V261、L264、S267、I384、E391、W452、G453、Y455、D492及K500的位置处的修饰。
62.如权利要求61的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:V261A、V261I、L264A、L264H、L264M、S267A、I384F、I384S、E391Y、E391W、E391F、E391H、E391M、E391K、E391R、W452Y、G453A、Y455W、D492H及K500E。
63.如权利要求61或权利要求62的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的核苷酸底物利用率。
64.如权利要求54至63中任一项的经修饰的重组酶,其包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E65、Y133、V261、L264、S267、I384、E391、G400、V443、L445、A446、S447、V449、T450、W452、G453、Y455、K500、S503、E523、L555及P556。
65.如权利要求64的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E65S、Y133L、V261A、V261I、L264A、L264H、S267A、I384F、I384S、E391Y、E391W、E391F、E391K、G400L、V443T、L445M、A446G、S447V、V449I、T450A、W452Y、G453A、Y455W、K500E、S503A、E523K、E523Y、E523F、E523H、E523W、L555K及P556A。
66.如权利要求64或权利要求65的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的精确度。
67.如权利要求54至66中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的Q317、S319、I322、Q323、R429、L555及T559的位置处的修饰。
68.如权利要求67的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:Q317R、S319R、I322K、Q323G、R429G、L555K及T559V。
69.如权利要求67或权利要求68的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的DNA结合亲和力。
70.如权利要求54至69中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的E391、S503及E523的位置处的修饰。
71.如权利要求70的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E391Y、E391W、E391F、E391K、S503A、E523K、E523Y、E523F、E523H及E523W。
72.如权利要求70或权利要求71的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的类似物结合亲和力。
73.如权利要求54至72中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的Q206、E436及L437的位置处的修饰。
74.如权利要求73的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:Q206R、Q206K、Q206H、E436R、L437Y及L437E。
75.如权利要求73或权利要求74的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有改善的链置换作用。
76.如权利要求54至75中任一项的经修饰的重组酶,其包含一或多个对应于SEQ IDNO:2的E436、L437、R534、T568及M569的位置处的修饰。
77.如权利要求76的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E436R、L437Y、L437E、R534K、T568D、T568S、M569T及M569V。
78.如权利要求76或权利要求77的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增强的平均读段长度。
79.如权利要求54至78中任一项的经修饰的重组酶,其包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的T13、V25、C26、D27、N33、I34、F36、S42、D54、E60、M95、T110、T114、K119、P136、P147、E152、I153、P160、N175、F188、S216、R217、D232、A236、V247、P273、P275、E283、V315、S319、L320、Q323、E338、T345、F352、F353、T364、D414、D425、E436、F465、E485、A486、L490、S503、E523、V526、G547、L555、R558、V564、M569及T571。
80.如权利要求79的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:T13N、V25L、C26W、D27E、N33T、I34V、F36V、S42T、D54Y、E60V、M95T、M95K、T110I、T114S、K119Q、P136T、P147Q、P147T、E152D、I153V、P160A、N175Y、F188C、S216G、S216R、R217G、D232H、A236G、V247D、P273R、P275S、E283K、V315L、S319R、L320M、L320T、Q323R、E338K、T345I、F352I、F353C、T364I、D414V、D425N、E436G、F465Y、E485D、A486E、L490M、S503T、E523V、V526L、G547S、L555R、R558H、V564L、M569K及T571S。
81.如权利要求79或权利要求80的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的复制能力。
82.如权利要求54至81中任一项的经修饰的重组酶,其包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的E139、E142、N145、I148、D167、D171、D189、D374、E385、E391、N467、E482、D492、K495、D521、E523、D533、E537及E545。
83.如权利要求82的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:E139K、E139Q、E139R、E139H、E142K、E142H、E142R、E142Q、N145K、N145H、N145R、I148K、I148H、I148R、D167P、D167K、D167H、D167R、D171K、D171H、D171R、D189K、D189H、D189R、D374G、D374Q、D374H、E385Y、E385K、E385R、E385N、E385Q、E385L、E385A、E391Y、E391W、E391K、E391F、N467R、N467K、N467H、N467S、N467T、E482K、E482H、E482R、D492H、D492K、D492R、K495R、D521K、D521H、D521R、E523K、E523Y、E523H、E523R、E523F、E523W、D533A、D533Q、D533T、D533R、D533S、E537K、E537H、E537R、E545K、E545H及E545R。
84.如权利要求82或权利要求83的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的正电性表面电荷。
85.如权利要求54至84中任一项的经修饰的重组酶,其包含对应于以下的一或多个位置处的修饰:SEQ ID NO:2的K4、S22、D27、I34、D54、E60、E85、M95、N106、T110、Q122、Y133、P136、P147、D167、T211、D232、P275、R308、S319、L320、E323、D337、E338、D341、T345、F352、T364、D414、F465、T479、E485、L490、S493、Q513及R558。
86.如权利要求85的经修饰的重组酶,其中修饰为选自由以下组成的组的氨基酸取代:K4R、S22A、D27E、I34V、D54Y、E60V、E60L、E85P、M95K、T110I、N106G、Q122V、Y133L、P136T、P147Q、P147T、D167P、T211A、D232K、P275S、R308G、S319R、L320M、Q323V、D337G、E338K、D341T、T345I、F352I、T364I、D414V、F465Y、T479V、E485D、L490M、S493P、Q513D及R558H。
87.如权利要求85或权利要求86的经修饰的重组酶,其中所述经修饰的重组酶相对于屎肠球菌聚合酶(SEQ ID NO:2)具有增加的稳定性。
88.如权利要求54至87中任一项的经修饰的重组酶,其中所述经修饰的重组酶包含表7中所列的修饰的组合。
89.如权利要求1至88中任一项的经修饰的重组酶,其进一步包含纯化标签。
90.如权利要求89的经修饰的重组酶,其中所述纯化标签为C端标签。
91.如权利要求89的经修饰的重组酶,其中所述纯化标签为N端标签。
92.如权利要求89至91中任一项的经修饰的重组酶,其中所述纯化标签为His标签。
93.如权利要求1至92中任一项的经修饰的重组酶,其进一步包含偶联基团。
94.如权利要求93的经修饰的重组酶,其中所述偶联基团附接在所述重组聚合酶的C末端处。
95.如权利要求93的经修饰的重组酶,其中所述偶联基团附接在所述重组聚合酶的N末端处。
96.如权利要求93至95中任一项的经修饰的重组酶,其中所述偶联基团是生物素标记序列。
97.如权利要求93至95中任一项的经修饰的重组酶,其中所述偶联基团是双生物素标记序列。
98.如权利要求1至88中任一项的经修饰的重组酶,其包含His标签及生物素标记或双生物素标记序列。
99.如权利要求1至98中任一项的经修饰的重组酶,其固定于表面上。
100.如权利要求99的经修饰的重组酶,其中所述表面包含纳米孔。
101.一种经分离的核酸分子,其编码如权利要求1至98中任一项的经修饰的重组酶。
102.一种组合物,其包含如权利要求1至98中任一项的经修饰的重组酶。
103.一种测序核酸的方法,所述方法包含使如权利要求1至98中任一项的经修饰的重组酶与测序反应混合物接触。
CN202080061326.9A 2019-06-28 2020-06-26 用于测序反应的聚合酶 Pending CN114302961A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962868806P 2019-06-28 2019-06-28
US62/868,806 2019-06-28
US202062993597P 2020-03-23 2020-03-23
US62/993,597 2020-03-23
PCT/US2020/039994 WO2020264429A1 (en) 2019-06-28 2020-06-26 Polymerizing enzymes for sequencing reactions

Publications (1)

Publication Number Publication Date
CN114302961A true CN114302961A (zh) 2022-04-08

Family

ID=71662370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080061326.9A Pending CN114302961A (zh) 2019-06-28 2020-06-26 用于测序反应的聚合酶

Country Status (11)

Country Link
US (1) US11959105B2 (zh)
EP (1) EP3976771A1 (zh)
JP (1) JP2022539560A (zh)
KR (1) KR20220029708A (zh)
CN (1) CN114302961A (zh)
AU (1) AU2020302099A1 (zh)
BR (1) BR112021026484A2 (zh)
CA (1) CA3145246A1 (zh)
MX (1) MX2022000055A (zh)
TW (1) TW202115249A (zh)
WO (1) WO2020264429A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023082266A1 (zh) * 2021-11-15 2023-05-19 深圳华大生命科学研究院 嵌合dna聚合酶及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018118997A2 (en) * 2016-12-19 2018-06-28 Quantum-Si Incorporated Polymerizing enzymes for sequencing reactions

Family Cites Families (56)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4435728A1 (de) 1994-01-19 1995-07-20 Boehringer Mannheim Gmbh Biotinsilan-Verbindungen und diese Verbindungen enthaltende Bindematrix
US5654419A (en) 1994-02-01 1997-08-05 The Regents Of The University Of California Fluorescent labels and their use in separations
AU5152798A (en) 1996-10-29 1998-05-22 University Of Nebraska-Lincoln Method for detecting point mutations in dna utilizing fluorescence energy transfer
DE19810879A1 (de) 1998-03-13 1999-09-16 Roche Diagnostics Gmbh Polymerasenchimären
US6153442A (en) 1998-05-20 2000-11-28 Dade Behring Inc. Reagents and methods for specific binding assays
US6787308B2 (en) 1998-07-30 2004-09-07 Solexa Ltd. Arrayed biomolecules and their use in sequencing
US6232075B1 (en) 1998-12-14 2001-05-15 Li-Cor, Inc. Heterogeneous assay for pyrophosphate detection
US6914128B1 (en) 1999-03-25 2005-07-05 Abbott Gmbh & Co. Kg Human antibodies that bind human IL-12 and methods for producing
US7056661B2 (en) 1999-05-19 2006-06-06 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
US6869764B2 (en) 2000-06-07 2005-03-22 L--Cor, Inc. Nucleic acid sequencing using charge-switch nucleotides
US6936702B2 (en) 2000-06-07 2005-08-30 Li-Cor, Inc. Charge-switch nucleotides
CA2314398A1 (en) 2000-08-10 2002-02-10 Edward Shipwash Microarrays and microsystems for amino acid analysis and protein sequencing
DK2128246T3 (da) 2001-04-19 2014-05-12 Univ California Fremgangsmåder og sammensætninger til fremstilling af ortogonale tRNA-aminoacyl-tRNA-syntetasepar.
US20100035254A1 (en) 2003-04-08 2010-02-11 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
US7745116B2 (en) 2003-04-08 2010-06-29 Pacific Biosciences Of California, Inc. Composition and method for nucleic acid sequencing
GB0324456D0 (en) 2003-10-20 2003-11-19 Isis Innovation Parallel DNA sequencing methods
WO2005044836A2 (de) 2003-11-05 2005-05-19 Genovoxx Gmbh Makromolekulare nukleotidverbindungen und methoden zu deren anwendung
US7462452B2 (en) 2004-04-30 2008-12-09 Pacific Biosciences Of California, Inc. Field-switch sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US7871777B2 (en) 2005-12-12 2011-01-18 The United States Of America As Represented By The Department Of Health And Human Services Probe for nucleic acid sequencing and methods of use
EP1963536B1 (en) 2005-12-22 2016-05-04 Pacific Biosciences of California, Inc. Polymerases for nucleotide analogue incorporation
US8084734B2 (en) 2006-05-26 2011-12-27 The George Washington University Laser desorption ionization and peptide sequencing on laser induced silicon microcolumn arrays
US8617811B2 (en) 2008-01-28 2013-12-31 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
AU2009223702B2 (en) 2008-03-13 2013-08-22 Pacific Biosciences Of California, Inc. Labeled reactants and their uses
CN104862383B (zh) 2008-03-28 2019-05-28 加利福尼亚太平洋生物科学股份有限公司 用于核酸测序的组合物和方法
WO2009145820A2 (en) 2008-03-31 2009-12-03 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US8906831B2 (en) 2008-03-31 2014-12-09 Pacific Biosciences Of California, Inc. Single molecule loading methods and compositions
US8420366B2 (en) 2008-03-31 2013-04-16 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
US8999676B2 (en) 2008-03-31 2015-04-07 Pacific Biosciences Of California, Inc. Recombinant polymerases for improved single molecule sequencing
JP2012507986A (ja) 2008-11-03 2012-04-05 カパバイオシステムズ キメラdnaポリメラーゼ
WO2010059206A2 (en) 2008-11-19 2010-05-27 Pacific Biosciences Of California, Inc. Modular nucleotide compositions and uses therefor
CA2745197A1 (en) 2008-12-01 2010-06-10 Research Triangle Institute Concurrent identification of multitudes of polypeptides
KR101063981B1 (ko) 2009-01-12 2011-09-14 서강대학교산학협력단 자유 라디칼 개시제 및 이를 이용한 펩타이드 서열의 동정방법
DE102009013653B4 (de) 2009-03-18 2014-09-18 Bruker Daltonik Gmbh Protein-Sequenzierung mit MALDI-Massenspektrometrie
WO2010111686A2 (en) * 2009-03-27 2010-09-30 Life Technologies Corp Labeled enzyme compositions, methods & systems
WO2010117420A2 (en) 2009-03-30 2010-10-14 Pacific Biosciences Of California, Inc. Fret-labeled compounds and uses therefor
WO2010115016A2 (en) 2009-04-03 2010-10-07 Sequenom, Inc. Nucleic acid preparation compositions and methods
ES2359058B1 (es) 2009-07-02 2012-03-27 Consejo Superior De Investigaciones Cient�?Ficas (Csic) Quimera de adn polimerasa del fago ph1 29.
US9566335B1 (en) 2009-09-25 2017-02-14 The Governing Council Of The University Of Toronto Protein sequencing method and reagents
WO2011040971A2 (en) 2009-09-30 2011-04-07 Pacific Biosciences Of California, Inc. Generation of modified polymerases for improved accuracy in single molecule sequencing
SG185438A1 (en) 2010-05-06 2012-12-28 Ibis Biosciences Inc Integrated sample preparation systems and stabilized enzyme mixtures
WO2012129242A2 (en) 2011-03-23 2012-09-27 Pacific Biosciences Of California, Inc. Isolation of polymerase-nucleic acid complexes and loading onto substrates
US8906660B2 (en) 2012-02-01 2014-12-09 Pacific Biosciences Of California, Inc. Recombinant polymerases with increased phototolerance
US9062091B2 (en) 2012-02-15 2015-06-23 Pacific Biosciences Of California, Inc. Polymerase enzyme substrates with protein shield
US9435810B2 (en) 2013-03-15 2016-09-06 Washington University Molecules and methods for iterative polypeptide analysis and processing
US10544449B2 (en) 2013-06-14 2020-01-28 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
WO2014201265A1 (en) 2013-06-14 2014-12-18 Pacific Biosciences Of California, Inc. Bis-biotinylation tags
WO2015021079A1 (en) 2013-08-05 2015-02-12 Pacific Biosciences Of California, Inc. Protected fluorescent reagent compounds
CA2961493C (en) 2014-09-15 2023-10-03 Board Of Regents, The University Of Texas System Improved single molecule peptide sequencing
US10266885B2 (en) 2014-10-07 2019-04-23 Oxford Nanopore Technologies Ltd. Mutant pores
WO2016126941A1 (en) 2015-02-04 2016-08-11 Pacific Biosciences Of California, Inc. Multimeric protected fluorescent reagents
CA3040566A1 (en) 2015-10-16 2017-04-20 The Governing Council Of The University Of Toronto Protein sequencing methods and reagents
WO2017087702A1 (en) 2015-11-18 2017-05-26 Pacific Biosciences Of California, Inc. Loading nucleic acids onto substrates
US10676788B2 (en) 2015-11-20 2020-06-09 Pacific Biosciences Of California, Inc. Modified nucleotide reagents
US10994029B2 (en) 2017-08-24 2021-05-04 The Usa, As Represented By The Secretary, Department Of Health And Human Services Conformational restriction of cyanine fluorophores in far-red and near-IR range
US10836798B2 (en) 2018-11-08 2020-11-17 Government Of The United States Of America, As Represented By The Secretary Of Commerce Amino acid-specific binder and selectively identifying an amino acid

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018118997A2 (en) * 2016-12-19 2018-06-28 Quantum-Si Incorporated Polymerizing enzymes for sequencing reactions

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
佚名: "hypothetical protein [Enterococcus faecium], GENBANK ACCESSION NO. WP_060797276.1", GENBANK, pages 1 *

Also Published As

Publication number Publication date
MX2022000055A (es) 2022-05-30
KR20220029708A (ko) 2022-03-08
CA3145246A1 (en) 2020-12-30
US20210102180A1 (en) 2021-04-08
EP3976771A1 (en) 2022-04-06
AU2020302099A1 (en) 2022-01-27
JP2022539560A (ja) 2022-09-12
WO2020264429A1 (en) 2020-12-30
TW202115249A (zh) 2021-04-16
US11959105B2 (en) 2024-04-16
BR112021026484A2 (pt) 2022-04-12
US20210395707A9 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
US20230058852A1 (en) Polymerizing enzymes for sequencing reactions
JP3553018B2 (ja) ポリメラーゼキメラ
Kromayer et al. Domain structure of the prokaryotic selenocysteine-specific elongation factor SelB
JP3742659B2 (ja) Dnaポリメラーゼ関連因子
EP2981609B1 (en) Novel dna-polymerases
US9926542B2 (en) Practical method for enzymatically synthesizing cyclic di-GMP
CN114302961A (zh) 用于测序反应的聚合酶
US8986968B2 (en) Thermostable DNA polymerase
Xiang et al. The catalytically active domain in the A subunit of calcineurin
JP3688367B2 (ja) 変異型dnaポリメラーゼ
JP5020487B2 (ja) 融合タンパク質発現用新規dna及び該dnaを用いたタンパク質の製造方法
Song Functional interactions of the delta (') subunit of Escherichia coli DNA polymerase III holoenzyme
JP2013146235A (ja) トリ骨髄芽細胞腫ウイルス逆転写酵素の製造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination