CN118284690A - 工程化末端脱氧核苷酸转移酶变体 - Google Patents
工程化末端脱氧核苷酸转移酶变体 Download PDFInfo
- Publication number
- CN118284690A CN118284690A CN202280069586.XA CN202280069586A CN118284690A CN 118284690 A CN118284690 A CN 118284690A CN 202280069586 A CN202280069586 A CN 202280069586A CN 118284690 A CN118284690 A CN 118284690A
- Authority
- CN
- China
- Prior art keywords
- residue
- amino acid
- acid positions
- seq
- residue differences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 title claims abstract description 523
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 title claims abstract description 521
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 381
- 229920001184 polypeptide Polymers 0.000 claims abstract description 379
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 379
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 97
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 97
- 239000002157 polynucleotide Substances 0.000 claims abstract description 97
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 48
- 238000000034 method Methods 0.000 claims abstract description 44
- 239000000203 mixture Substances 0.000 claims abstract description 21
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 478
- 239000000758 substrate Substances 0.000 claims description 61
- 230000000694 effects Effects 0.000 claims description 36
- 238000006243 chemical reaction Methods 0.000 claims description 25
- 230000014509 gene expression Effects 0.000 claims description 23
- 239000000047 product Substances 0.000 claims description 21
- 108020004705 Codon Proteins 0.000 claims description 18
- 239000006227 byproduct Substances 0.000 claims description 7
- 230000002829 reductive effect Effects 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 5
- 238000012258 culturing Methods 0.000 claims description 2
- 239000013604 expression vector Substances 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 abstract description 43
- 108091034117 Oligonucleotide Proteins 0.000 abstract description 38
- 230000000903 blocking effect Effects 0.000 abstract description 34
- 239000002777 nucleoside Substances 0.000 abstract description 21
- 150000003833 nucleoside derivatives Chemical class 0.000 abstract description 10
- 102220551399 Cellular tumor antigen p53_V203A_mutation Human genes 0.000 description 77
- 235000001014 amino acid Nutrition 0.000 description 73
- 229940024606 amino acid Drugs 0.000 description 67
- 102220588435 Keratin, type I cytoskeletal 18_S34A_mutation Human genes 0.000 description 66
- 102220102837 rs878854689 Human genes 0.000 description 64
- 102220616092 Complexin-1_M55L_mutation Human genes 0.000 description 63
- 102220125958 rs886044127 Human genes 0.000 description 63
- 150000001413 amino acids Chemical class 0.000 description 62
- 102220414507 c.232C>T Human genes 0.000 description 53
- 102220197702 rs1057519652 Human genes 0.000 description 53
- 102220101373 rs878854666 Human genes 0.000 description 48
- 102200140660 rs17882252 Human genes 0.000 description 43
- 102220539293 Programmed cell death 1 ligand 2_F67A_mutation Human genes 0.000 description 40
- 102220124166 rs758073926 Human genes 0.000 description 40
- 102220588161 Cell growth regulator with EF hand domain protein 1_F48W_mutation Human genes 0.000 description 39
- 102220050044 rs587783406 Human genes 0.000 description 39
- 102000004190 Enzymes Human genes 0.000 description 38
- 108090000790 Enzymes Proteins 0.000 description 38
- 102220195869 rs751437780 Human genes 0.000 description 37
- 229940088598 enzyme Drugs 0.000 description 33
- 102220282954 rs1457582183 Human genes 0.000 description 32
- 102200065572 rs28364364 Human genes 0.000 description 31
- 102220414645 c.82A>G Human genes 0.000 description 30
- 102200118278 rs33972593 Human genes 0.000 description 27
- 108090000623 proteins and genes Proteins 0.000 description 26
- 102200023387 rs267607180 Human genes 0.000 description 25
- 102220590464 Cellular tumor antigen p53_R342L_mutation Human genes 0.000 description 24
- 102220566882 Cellular tumor antigen p53_S261R_mutation Human genes 0.000 description 24
- 150000007523 nucleic acids Chemical class 0.000 description 23
- 238000006467 substitution reaction Methods 0.000 description 23
- 102220627589 Coagulation factor IX_L20S_mutation Human genes 0.000 description 22
- 238000007792 addition Methods 0.000 description 20
- 125000000217 alkyl group Chemical group 0.000 description 20
- 210000004027 cell Anatomy 0.000 description 20
- -1 nucleoside triphosphates Chemical class 0.000 description 20
- 125000003729 nucleotide group Chemical group 0.000 description 17
- 102200002864 rs4795581 Human genes 0.000 description 17
- 239000002773 nucleotide Substances 0.000 description 16
- 102220270557 rs1489623582 Human genes 0.000 description 16
- 102220611719 RNA polymerase I-specific transcription initiation factor RRN3_R28E_mutation Human genes 0.000 description 15
- 125000005647 linker group Chemical group 0.000 description 15
- 102000039446 nucleic acids Human genes 0.000 description 15
- 108020004707 nucleic acids Proteins 0.000 description 15
- 102000005962 receptors Human genes 0.000 description 15
- 108020003175 receptors Proteins 0.000 description 15
- 125000000539 amino acid group Chemical group 0.000 description 14
- 102200061165 rs1441030187 Human genes 0.000 description 14
- 102220414578 c.184A>G Human genes 0.000 description 12
- 102000004169 proteins and genes Human genes 0.000 description 12
- 102220005154 rs33988732 Human genes 0.000 description 12
- 102000053602 DNA Human genes 0.000 description 11
- 108020004414 DNA Proteins 0.000 description 11
- 125000003118 aryl group Chemical group 0.000 description 11
- 230000002255 enzymatic effect Effects 0.000 description 11
- 238000009396 hybridization Methods 0.000 description 11
- 102200037023 rs387907270 Human genes 0.000 description 11
- 108700010070 Codon Usage Proteins 0.000 description 10
- 102220353216 c.186A>C Human genes 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 102200014184 rs1365349586 Human genes 0.000 description 10
- 241000894007 species Species 0.000 description 10
- 102220557148 Alstrom syndrome protein 1_I91L_mutation Human genes 0.000 description 9
- 102220347737 c.98G>T Human genes 0.000 description 9
- 125000004432 carbon atom Chemical group C* 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 102220214526 rs1060502912 Human genes 0.000 description 9
- 102220095085 rs749141001 Human genes 0.000 description 9
- 102200037600 rs774467219 Human genes 0.000 description 9
- 239000002904 solvent Substances 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 102220588149 Cell growth regulator with EF hand domain protein 1_F71L_mutation Human genes 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 8
- 125000003636 chemical group Chemical group 0.000 description 8
- 125000005842 heteroatom Chemical group 0.000 description 8
- 102220050277 rs147509697 Human genes 0.000 description 8
- 108091026890 Coding region Proteins 0.000 description 7
- 102220520403 DNA polymerase beta_K72R_mutation Human genes 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 150000001875 compounds Chemical class 0.000 description 7
- 125000001072 heteroaryl group Chemical group 0.000 description 7
- 238000011068 loading method Methods 0.000 description 7
- 125000003835 nucleoside group Chemical group 0.000 description 7
- 102200105394 rs1060501198 Human genes 0.000 description 7
- 102220041105 rs587778621 Human genes 0.000 description 7
- 102220075246 rs796052426 Human genes 0.000 description 7
- 239000001226 triphosphate Substances 0.000 description 7
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 6
- 102220623268 Forkhead box protein P3_L69A_mutation Human genes 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 229910052799 carbon Inorganic materials 0.000 description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 6
- 125000000753 cycloalkyl group Chemical group 0.000 description 6
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 6
- 125000001424 substituent group Chemical group 0.000 description 6
- 235000011178 triphosphate Nutrition 0.000 description 6
- QNAYBMKLOCPYGJ-UWTATZPHSA-N D-alanine Chemical compound C[C@@H](N)C(O)=O QNAYBMKLOCPYGJ-UWTATZPHSA-N 0.000 description 5
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 5
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 5
- 150000007513 acids Chemical class 0.000 description 5
- 239000011942 biocatalyst Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 229910052740 iodine Chemical group 0.000 description 5
- 102220062571 rs752980085 Human genes 0.000 description 5
- 102220099789 rs878855170 Human genes 0.000 description 5
- 125000003396 thiol group Chemical group [H]S* 0.000 description 5
- 239000004474 valine Substances 0.000 description 5
- 229960004295 valine Drugs 0.000 description 5
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 4
- QNAYBMKLOCPYGJ-UHFFFAOYSA-N D-alpha-Ala Natural products CC([NH3+])C([O-])=O QNAYBMKLOCPYGJ-UHFFFAOYSA-N 0.000 description 4
- 150000008574 D-amino acids Chemical class 0.000 description 4
- 230000006820 DNA synthesis Effects 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 102220496706 Growth/differentiation factor 3_R73K_mutation Human genes 0.000 description 4
- 150000008575 L-amino acids Chemical class 0.000 description 4
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 4
- 108091028664 Ribonucleotide Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 229960003767 alanine Drugs 0.000 description 4
- 125000003545 alkoxy group Chemical group 0.000 description 4
- 125000003277 amino group Chemical group 0.000 description 4
- 230000001186 cumulative effect Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 125000001188 haloalkyl group Chemical group 0.000 description 4
- 229910052736 halogen Inorganic materials 0.000 description 4
- 150000002367 halogens Chemical class 0.000 description 4
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 4
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 150000008300 phosphoramidites Chemical class 0.000 description 4
- 239000002336 ribonucleotide Substances 0.000 description 4
- 125000002652 ribonucleotide group Chemical group 0.000 description 4
- 102220222936 rs1060502586 Human genes 0.000 description 4
- 102200012954 rs121918642 Human genes 0.000 description 4
- 102220198567 rs142516271 Human genes 0.000 description 4
- 102220045104 rs587781832 Human genes 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 3
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 102220624560 Actin, alpha skeletal muscle_I77L_mutation Human genes 0.000 description 3
- 102220538181 BBSome-interacting protein 1_N278A_mutation Human genes 0.000 description 3
- 102000001421 BRCT domains Human genes 0.000 description 3
- 108050009608 BRCT domains Proteins 0.000 description 3
- 102220573714 Cellular tumor antigen p53_C182R_mutation Human genes 0.000 description 3
- 102220571905 Cellular tumor antigen p53_S166T_mutation Human genes 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102220536901 PRKC apoptosis WT1 regulator protein_L69I_mutation Human genes 0.000 description 3
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 3
- YXFVVABEGXRONW-UHFFFAOYSA-N Toluene Chemical compound CC1=CC=CC=C1 YXFVVABEGXRONW-UHFFFAOYSA-N 0.000 description 3
- 102220469745 Voltage-dependent L-type calcium channel subunit beta-2_Y59K_mutation Human genes 0.000 description 3
- 230000002378 acidificating effect Effects 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 125000004390 alkyl sulfonyl group Chemical group 0.000 description 3
- 125000000304 alkynyl group Chemical group 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 102220360906 c.179A>G Human genes 0.000 description 3
- 102220364345 c.189G>T Human genes 0.000 description 3
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 3
- 125000005518 carboxamido group Chemical group 0.000 description 3
- 239000005549 deoxyribonucleoside Substances 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000002209 hydrophobic effect Effects 0.000 description 3
- 239000006166 lysate Substances 0.000 description 3
- 238000002844 melting Methods 0.000 description 3
- 230000008018 melting Effects 0.000 description 3
- 125000001820 oxy group Chemical group [*:1]O[*:2] 0.000 description 3
- 229910052760 oxygen Inorganic materials 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000002342 ribonucleoside Substances 0.000 description 3
- 102220247022 rs1262941514 Human genes 0.000 description 3
- 102220326600 rs1555418283 Human genes 0.000 description 3
- 102220129329 rs533967597 Human genes 0.000 description 3
- 125000000547 substituted alkyl group Chemical group 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- 239000011593 sulfur Substances 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 102220623569 2-(3-amino-3-carboxypropyl)histidine synthase subunit 1_L65T_mutation Human genes 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- 101150079978 AGRN gene Proteins 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 102100040026 Agrin Human genes 0.000 description 2
- 108700019743 Agrin Proteins 0.000 description 2
- 102220483802 Aminopeptidase RNPEPL1_E84G_mutation Human genes 0.000 description 2
- 102000006306 Antigen Receptors Human genes 0.000 description 2
- 108010083359 Antigen Receptors Proteins 0.000 description 2
- 102220470698 BUD13 homolog_V30P_mutation Human genes 0.000 description 2
- 102220533157 Baculoviral IAP repeat-containing protein 5_K62R_mutation Human genes 0.000 description 2
- 102220552218 Breast cancer type 1 susceptibility protein_I26A_mutation Human genes 0.000 description 2
- 102220479122 CD59 glycoprotein_F67K_mutation Human genes 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 102220588148 Cell growth regulator with EF hand domain protein 1_L52Q_mutation Human genes 0.000 description 2
- 102220592335 Cellular tumor antigen p53_A307S_mutation Human genes 0.000 description 2
- 102220571935 Cellular tumor antigen p53_K164M_mutation Human genes 0.000 description 2
- 102220584298 Cellular tumor antigen p53_P82S_mutation Human genes 0.000 description 2
- 102220480220 Dolichyl-diphosphooligosaccharide-protein glycosyltransferase subunit 1_F67R_mutation Human genes 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108091060211 Expressed sequence tag Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102220487182 Growth/differentiation factor 9_E53Q_mutation Human genes 0.000 description 2
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- 102220641676 Iodotyrosine deiodinase 1_P14G_mutation Human genes 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- BAVYZALUXZFZLV-UHFFFAOYSA-N Methylamine Chemical compound NC BAVYZALUXZFZLV-UHFFFAOYSA-N 0.000 description 2
- 102220466759 Olfactory receptor 13C5_L69M_mutation Human genes 0.000 description 2
- 102220519997 Protein DEK_H12L_mutation Human genes 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 125000002252 acyl group Chemical group 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000004453 alkoxycarbonyl group Chemical group 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 125000004103 aminoalkyl group Chemical group 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- 230000002210 biocatalytic effect Effects 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 102220349339 c.160A>G Human genes 0.000 description 2
- 102220370335 c.59G>A Human genes 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 150000002170 ethers Chemical class 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 125000001153 fluoro group Chemical group F* 0.000 description 2
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 125000002768 hydroxyalkyl group Chemical group 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 125000004430 oxygen atom Chemical group O* 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N phosphoric acid Substances OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 235000011007 phosphoric acid Nutrition 0.000 description 2
- 125000004437 phosphorous atom Chemical group 0.000 description 2
- 229920002477 rna polymer Polymers 0.000 description 2
- 102200103808 rs1057519990 Human genes 0.000 description 2
- 102220219207 rs1060503410 Human genes 0.000 description 2
- 102220235887 rs1131692016 Human genes 0.000 description 2
- 102200104889 rs121912663 Human genes 0.000 description 2
- 102220308250 rs151153655 Human genes 0.000 description 2
- 102220259028 rs199980106 Human genes 0.000 description 2
- 102200118251 rs34974709 Human genes 0.000 description 2
- 102200140502 rs35993958 Human genes 0.000 description 2
- 102220158494 rs370701548 Human genes 0.000 description 2
- 102220313588 rs376510300 Human genes 0.000 description 2
- 102220039261 rs515726206 Human genes 0.000 description 2
- 102200068053 rs587777039 Human genes 0.000 description 2
- 102220254568 rs772086117 Human genes 0.000 description 2
- 102220148903 rs779404585 Human genes 0.000 description 2
- 102220060546 rs786201444 Human genes 0.000 description 2
- 102220070931 rs794728600 Human genes 0.000 description 2
- 102220094503 rs876659361 Human genes 0.000 description 2
- 102220093586 rs876661278 Human genes 0.000 description 2
- 231100000241 scar Toxicity 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 2
- 238000001308 synthesis method Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 239000010891 toxic waste Substances 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 229940045145 uridine Drugs 0.000 description 2
- 229910052720 vanadium Inorganic materials 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 229940075420 xanthine Drugs 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 125000004169 (C1-C6) alkyl group Chemical group 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- 125000004776 1-fluoroethyl group Chemical group [H]C([H])([H])C([H])(F)* 0.000 description 1
- JWUJQDFVADABEY-UHFFFAOYSA-N 2-methyltetrahydrofuran Chemical compound CC1CCCO1 JWUJQDFVADABEY-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical group [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- 102220553782 APC membrane recruitment protein 1_K89A_mutation Human genes 0.000 description 1
- 102220489593 Acetyl-CoA acetyltransferase, cytosolic_K62A_mutation Human genes 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 102220529375 Aurora kinase C_Q92A_mutation Human genes 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical group [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- DKPFZGUDAPQIHT-UHFFFAOYSA-N Butyl acetate Natural products CCCCOC(C)=O DKPFZGUDAPQIHT-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 102220571942 Cellular tumor antigen p53_K164R_mutation Human genes 0.000 description 1
- 102220551322 Cellular tumor antigen p53_P219T_mutation Human genes 0.000 description 1
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical group [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 1
- 102000004405 Collectins Human genes 0.000 description 1
- 108090000909 Collectins Proteins 0.000 description 1
- 101710199851 Copy number protein Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 102220597636 Cyclin-dependent kinase inhibitor 1B_S10D_mutation Human genes 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 108010076499 DNA polymerase X Proteins 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102220545278 Desmoglein-1_S24E_mutation Human genes 0.000 description 1
- 102220640801 E3 ubiquitin-protein transferase MAEA_K47L_mutation Human genes 0.000 description 1
- 102220640803 E3 ubiquitin-protein transferase MAEA_M55I_mutation Human genes 0.000 description 1
- 241000367532 Empidonax traillii Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000287227 Fringillidae Species 0.000 description 1
- 101000579587 Gallus gallus Limbic system-associated membrane protein Proteins 0.000 description 1
- 102220487170 Gamma-aminobutyric acid receptor subunit beta-3_S15F_mutation Human genes 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102220467515 HLA class II histocompatibility antigen, DR beta 5 chain_D99Q_mutation Human genes 0.000 description 1
- 102220633263 Hexokinase-4_E70K_mutation Human genes 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 102220564708 Killer cell immunoglobulin-like receptor 2DL2_E70Q_mutation Human genes 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 241000252146 Lepisosteus oculatus Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102220539755 Lymphocyte antigen 6 complex locus protein G5b_E57D_mutation Human genes 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- BZLVMXJERCGZMT-UHFFFAOYSA-N Methyl tert-butyl ether Chemical compound COC(C)(C)C BZLVMXJERCGZMT-UHFFFAOYSA-N 0.000 description 1
- 102220527709 Methyltransferase N6AMT1_L72D_mutation Human genes 0.000 description 1
- 102220557454 Mitochondrial 2-oxoglutarate/malate carrier protein_C68V_mutation Human genes 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 102220564289 Natural killer cells antigen CD94_K20A_mutation Human genes 0.000 description 1
- 102220537828 Nebulette_S15E_mutation Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 102220580620 Porphobilinogen deaminase_D99N_mutation Human genes 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102220543917 Protocadherin-10_L78M_mutation Human genes 0.000 description 1
- 102220640339 Proton channel OTOP1_P84T_mutation Human genes 0.000 description 1
- 102220536023 Quinone oxidoreductase-like protein 1_Y59W_mutation Human genes 0.000 description 1
- 102220643974 RNA-binding protein 4_E63S_mutation Human genes 0.000 description 1
- 102220573257 Ras-related protein Ral-A_K47I_mutation Human genes 0.000 description 1
- 102220611759 SPOC domain-containing protein 1_L65H_mutation Human genes 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102220525882 Serine protease inhibitor Kazal-type 2_Y44V_mutation Human genes 0.000 description 1
- 102220493404 Sodium/calcium exchanger 3_N42T_mutation Human genes 0.000 description 1
- 102100026263 Sphingomyelin phosphodiesterase Human genes 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102220472176 Thymidine kinase 2, mitochondrial_T17D_mutation Human genes 0.000 description 1
- 102220560320 Tribbles homolog 1_I26L_mutation Human genes 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102220563998 U1 small nuclear ribonucleoprotein A_N16V_mutation Human genes 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000004442 acylamino group Chemical group 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 150000001299 aldehydes Chemical class 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000004644 alkyl sulfinyl group Chemical group 0.000 description 1
- 125000004656 alkyl sulfonylamino group Chemical group 0.000 description 1
- 125000004414 alkyl thio group Chemical group 0.000 description 1
- 125000005097 aminocarbonylalkyl group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 125000005018 aryl alkenyl group Chemical group 0.000 description 1
- 125000005015 aryl alkynyl group Chemical group 0.000 description 1
- 125000004104 aryloxy group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- JEHKKBHWRAXMCH-UHFFFAOYSA-N benzenesulfinic acid Chemical class O[S@@](=O)C1=CC=CC=C1 JEHKKBHWRAXMCH-UHFFFAOYSA-N 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Chemical group BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 102220414499 c.131A>G Human genes 0.000 description 1
- 102220355834 c.220_221delGCinsTT Human genes 0.000 description 1
- 102220423675 c.96G>T Human genes 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 125000003739 carbamimidoyl group Chemical group C(N)(=N)* 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 125000004181 carboxyalkyl group Chemical group 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000460 chlorine Chemical group 0.000 description 1
- 229910052801 chlorine Inorganic materials 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000000000 cycloalkoxy group Chemical group 0.000 description 1
- 125000001316 cycloalkyl alkyl group Chemical group 0.000 description 1
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 1
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 1
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 125000004663 dialkyl amino group Chemical group 0.000 description 1
- CKIDTYWBOZNDIH-UHFFFAOYSA-N diethylamino-[(dimethylamino)methyl]-dimethylazanium Chemical compound CCN(CC)[N+](C)(C)CN(C)C CKIDTYWBOZNDIH-UHFFFAOYSA-N 0.000 description 1
- 125000001028 difluoromethyl group Chemical group [H]C(F)(F)* 0.000 description 1
- 229940079919 digestives enzyme preparation Drugs 0.000 description 1
- 125000004982 dihaloalkyl group Chemical group 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 1
- 125000006125 ethylsulfonyl group Chemical group 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 229910052731 fluorine Inorganic materials 0.000 description 1
- 239000011737 fluorine Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000004438 haloalkoxy group Chemical group 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 125000004404 heteroalkyl group Chemical group 0.000 description 1
- 125000004447 heteroarylalkenyl group Chemical group 0.000 description 1
- 125000005312 heteroarylalkynyl group Chemical group 0.000 description 1
- 125000005553 heteroaryloxy group Chemical group 0.000 description 1
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 1
- FUZZWVXGSFPDMH-UHFFFAOYSA-N hexanoic acid Chemical compound CCCCCC(O)=O FUZZWVXGSFPDMH-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 150000002430 hydrocarbons Chemical group 0.000 description 1
- 150000002431 hydrogen Chemical class 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 238000007641 inkjet printing Methods 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 239000011630 iodine Chemical group 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 150000002576 ketones Chemical class 0.000 description 1
- 238000011005 laboratory method Methods 0.000 description 1
- 229960003136 leucine Drugs 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000029226 lipidation Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 125000004170 methylsulfonyl group Chemical group [H]C([H])([H])S(*)(=O)=O 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 125000006682 monohaloalkyl group Chemical group 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 125000006124 n-propyl sulfonyl group Chemical group 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 150000002825 nitriles Chemical class 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 125000000962 organic group Chemical group 0.000 description 1
- 125000005004 perfluoroethyl group Chemical group FC(F)(F)C(F)(F)* 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 102220234446 rs1064795967 Human genes 0.000 description 1
- 102200149714 rs113604459 Human genes 0.000 description 1
- 102200156861 rs121964885 Human genes 0.000 description 1
- 102220276885 rs1330621664 Human genes 0.000 description 1
- 102220285423 rs1384507048 Human genes 0.000 description 1
- 102220016929 rs145013633 Human genes 0.000 description 1
- 102220276435 rs1553177769 Human genes 0.000 description 1
- 102220277590 rs1553638834 Human genes 0.000 description 1
- 102220291363 rs1553775776 Human genes 0.000 description 1
- 102220263512 rs1554569112 Human genes 0.000 description 1
- 102220321823 rs1554812271 Human genes 0.000 description 1
- 102220322817 rs1554841834 Human genes 0.000 description 1
- 102220281569 rs1555514427 Human genes 0.000 description 1
- 102220285792 rs1555570487 Human genes 0.000 description 1
- 102220282987 rs1555618704 Human genes 0.000 description 1
- 102220004862 rs35537181 Human genes 0.000 description 1
- 102220251169 rs368061837 Human genes 0.000 description 1
- 102200002863 rs4795581 Human genes 0.000 description 1
- 102220227976 rs527289778 Human genes 0.000 description 1
- 102220056930 rs534282225 Human genes 0.000 description 1
- 102220272954 rs55819519 Human genes 0.000 description 1
- 102220234440 rs572685299 Human genes 0.000 description 1
- 102200140568 rs587781736 Human genes 0.000 description 1
- 102220261975 rs73749738 Human genes 0.000 description 1
- 102220224007 rs750303995 Human genes 0.000 description 1
- 102220061399 rs752396270 Human genes 0.000 description 1
- 102220203056 rs753524431 Human genes 0.000 description 1
- 102220279067 rs766666529 Human genes 0.000 description 1
- 102220159627 rs768471108 Human genes 0.000 description 1
- 102220250982 rs771619614 Human genes 0.000 description 1
- 102220282696 rs775224480 Human genes 0.000 description 1
- 102220282943 rs776471760 Human genes 0.000 description 1
- 102220075177 rs779736481 Human genes 0.000 description 1
- 102220066002 rs794726952 Human genes 0.000 description 1
- 102220075247 rs796052425 Human genes 0.000 description 1
- 102200067134 rs79777494 Human genes 0.000 description 1
- 102220084752 rs863225149 Human genes 0.000 description 1
- 102220087058 rs864622276 Human genes 0.000 description 1
- 102220093883 rs876659143 Human genes 0.000 description 1
- 102220096713 rs876659643 Human genes 0.000 description 1
- 102220095991 rs876660536 Human genes 0.000 description 1
- 102220124379 rs886043653 Human genes 0.000 description 1
- 102220250575 rs900324585 Human genes 0.000 description 1
- 229930195734 saturated hydrocarbon Natural products 0.000 description 1
- 230000037390 scarring Effects 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012289 standard assay Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 125000005415 substituted alkoxy group Chemical group 0.000 description 1
- 125000003107 substituted aryl group Chemical group 0.000 description 1
- 125000005346 substituted cycloalkyl group Chemical group 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 1
- 150000003457 sulfones Chemical class 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000013077 target material Substances 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000004385 trihaloalkyl group Chemical group 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明提供了用于非模板依赖性多核苷酸合成的工程化末端脱氧核苷酸转移酶(TdT)多肽,以及组合物、利用这些工程化多肽的方法和编码工程化末端脱氧核苷酸转移酶的多核苷酸,非模板依赖性多核苷酸合成能够以非模板依赖性方式将核苷三磷酸‑3’‑O‑可去除封闭基团(NTP‑3’‑O‑RBG)添加到生长中的寡核苷酸或多核苷酸链的3’‑OH端。
Description
本申请要求2021年10月15日提交的序号为63/256,353的美国临时专利申请和2022年4月11日提交的序号为63/329,777的美国临时专利申请的优先权,出于所有目的,这两个专利通过引用以其整体并入。
技术领域
本发明提供了用于使用核苷三磷酸-3’-O-可去除封闭基团(nucleosidetriphosphate-3’-O-removable blocking group,NTP-3’-O-RBG)的非模板依赖性多核苷酸合成的工程化末端脱氧核苷酸转移酶(TdT)多肽,以及组合物和利用这些工程化多肽的方法。对序列表、表格或计算机程序的引用
序列表的正式副本作为XML文件与说明书同时提交,文件名为“CX9-217WO2_ST26.xml”,创建日期为2022年10月13日,并且大小为13.3兆字节。序列表是说明书的一部分,并通过引用以其整体并入本文。
背景
合成生物学正在各种高价值、高增长的市场中得到确立。从食品和农业到治疗学、诊断学和疫苗;诸如基因编辑、DNA测序和基因合成的工具正被用于构建具有先进功能的增值产品(例如,细胞生物反应器等)和期望的终产品(例如,药物、化学品等)。这些技术广泛实施的障碍是有效合成DNA和其他多核苷酸的能力。DNA合成的传统方法使用亚磷酰胺DNA合成化学,其局限于产生大约200个碱基对的短寡核苷酸(Beaucage&Caruthers.(1981).Tetrahedron Lett.22(20):1859)。亚磷酰胺DNA合成具有产生大量有毒废物的另外缺点。
在20世纪80年代早期,亚磷酰胺DNA合成是一项关键的发展,它促成了基因组学革命,并为研究疾病和前瞻性治疗提供了新方法。然而,在过去的四十年中,多核苷酸合成方法的进展是有限的,并且没有跟上分子生物学其他领域的进展。合成天然DNA和其他多核苷酸的长而纯的链的新方法对于实现合成生物学当前的机遇是必要的。
非模板依赖性酶促合成
酶促合成可以促进长多核苷酸(>200个碱基对)的产生,同时最大限度地减少有毒废物。已知多种原核和真核DNA和RNA聚合酶天然合成数千个碱基对或更多碱基对的多核苷酸。这些聚合酶中的大多数在与细胞分裂相关的DNA复制或与基因或蛋白质表达相关的从DNA转录RNA期间发挥作用。这两种过程都涉及模板依赖性多核苷酸合成,其中聚合酶使用现有的模板多核苷酸链来合成互补的多核苷酸链。
非模板依赖性酶促多核苷酸合成产生限定的序列的潜力早已被认识到。一份早期报告建议使用具有封闭的3’-OH基团的NTP来允许特定核苷酸残基的逐步添加(Bollum.(1962).JBC,237,1945-1949)。
然而,已知很少有聚合酶可以催化非模板依赖性多核苷酸合成。这些包括聚合酶λ、聚合酶μ和末端脱氧核苷酸转移酶(TdT),它们都是DNA聚合酶X家族的成员,其中许多参与DNA修复过程(Dominnguez等人(2000).EMBO,19(7),1731-1742)。其中,已知TdT通过在非模板依赖性过程中不加选择地将核苷添加到单链多核苷酸的3’端而在抗原受体中产生多样性(Bentolila等人(1995).EMBO,14(17),4221-4229)。
其他人已经公布了一种多核苷酸合成方法,该方法使用核苷5’-三磷酸(其3’-OH位置被可去除封闭部分保护)和特别地非模板依赖性多核苷酸聚合酶,包括末端脱氧核苷酸转移酶(美国专利5,763,594)。封闭基团,本领域技术人员也称为抑制剂基团或终止基团(inhibitor or terminating group),可以包括通过阻断接近活性位点来阻止TdT向新生多核苷酸链添加另外的NTP的多种基团。这可以包括带电分子、大分子和部分、或本领域技术人员已知的其它封闭基团。适当的可去除封闭基团可以包括腈、磷酸酯、碳酸酯、氨基甲酸酯、酯、醚、硼酸酯、硝酸酯、糖、氨基磷酸酯、苯基亚磺酸酯、硫酸酯和砜。其他3’-OH封闭基团在本领域也是已知的,包括3’-O-胺和甲胺(美国专利7,544,794)和3’-O-叠氮化物(美国专利10,407,721)。
虽然最初很有希望,但在TdT催化的非模板依赖性合成中使用3’-OH封闭的NTP在实践中被证明是困难的,因为封闭的3’-OH不允许酶识别多核苷酸作为另外合成步骤的底物。
最近,有几份报告描述了非模板依赖性合成方法,这些方法使用修饰的NTP,其封闭基团附接到嘌呤或嘧啶碱基,而3’-OH未被修饰,并且可用于另外的合成轮次。这些碱基封闭基团可以包括允许在每个NTP添加步骤之后去除封闭基团的可裂解接头。可裂解接头也可以与可检测的标记物附接(美国专利7,057,026等)。本领域技术人员已知多种可裂解接头。这些包括经由可还原二硫键附接的接头,可光裂解的、亲电的或亲核的、pH敏感的、温度敏感的接头和被酶裂解的接头。使用可裂解接头的一个缺点是,接头部分的一些原子在裂解后通常仍然附接在NTP上,在初级多核苷酸链的初始非模板依赖性合成后留下可能会干扰互补链合成的“疤痕(scar)”。
最近,已经开发了修饰的NTP,其碱基附接到具有可裂解接头的封闭基团,这些接头是“无痕的(scarless)”,并使新生DNA为下一轮合成做好准备。在一个实例中,封闭基团和可裂解接头经由二硫键附接到碱基。添加还原剂时,封闭基团被去除,并且接头的剩余原子自环化(self-cyclize),使新生DNA不含任何接头原子(美国专利8,808,989、美国专利9,695,470、美国专利10,041,110)。使用附接到可裂解封闭基团的NTP合成多核苷酸的方法是已知的,包括使用微流体装置或喷墨打印技术(美国专利9,279,149)。外切核酸酶也可用于合成多核苷酸的方法中,以在多核苷酸延伸步骤之后和去除封闭基团之前缩短或完全降解没有成功添加NTP的多核苷酸链(美国专利9,771,613)。
然而,用经由可裂解接头附接的大封闭基团(bulky blocking groups)标记的NTP碱基对于长寡核苷酸的有效合成不是最佳的。大标记物可能对酶动力学产生负面影响,并且当合成互补链时,接头疤痕可能导致不可接受的错误掺入率。此外,较大的接头和必要的可去除步骤可能会增加反应的成本、时间和低效率,使得这些方法在经济上不可行。
最近,几个组已经探索了修饰TdT或其他聚合酶的结构或氨基酸序列,以允许使用3’-OH封闭基团进行非模板依赖性合成。Efcavitch等人描述了在非模板依赖性合成中使用具有取代的氨基酸残基的鼠或细菌TdT来通过TdT掺入3’-OH修饰的dNTP(美国专利10,059,929)。其他报告描述了工程化的牛和雀鳝(斑点雀鳝(Lepisosteus oculatus))TdT,其展示出优于野生型TdT的活性(美国专利10,745,727、PCT/GB2020/050247)。类似地,已经描述了多种突变来提高Pol X家族酶的活性(WO 2017216472 A2)。最后,TdT的BRCT结构域的N-末端截短(或可选地BRCT结构域的突变)也被描述为增强在核酸的3’-OH上添加可逆封闭的NTP时的活性(US20210164008A1)。
然而,尽管该技术价值得到公认并且为了解决该领域的挑战进行了密集的研究努力,但目前还没有已知的或商业上可得的长多核苷酸的非模板依赖性酶促合成的可行方法。改进的工程化TdT酶对于使用具有3’-O-可去除封闭基团的核苷三磷酸进行限定的序列的长多核苷酸或寡核苷酸的非模板依赖性酶促合成是必要的。
概述
本发明提供了可用于使用核苷三磷酸-3’-O-可去除封闭基团(NTP-3’-O-RBG)的非模板依赖性多核苷酸合成的工程化末端脱氧核苷酸转移酶(TdT)多肽,以及组合物和利用这些工程化多肽的方法。本发明的TdT是来自纹霸鹟(Empidonax traillii)的野生型基因(SEQ ID NO:2)的预测剪接变体的变体。这些工程化TdT能够以非模板依赖性的方式将具有3’-O-可去除封闭基团的核苷三磷酸添加到生长中的寡核苷酸或多核苷酸链的3’-OH端。去除封闭基团后,另外几轮NTP添加可用于合成具有限定的碱基序列的多核苷酸,而无需使用互补模板链作为NTP掺入的指导(非模板依赖性合成)。
在一些实施方案中,本发明提供了一种工程化TdT多肽,其包含与SEQ NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,并且还包含在一个或更多个位置处的至少一个取代或一个取代集,其中这些位置参考SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号,并且其中该工程化TdT多肽与野生型TdT或本领域技术人员已知的其他TdT相比具有改进的热稳定性、增加的在高温的活性、增加的可溶性表达、减少的副产物形成、增加的对NTP-3’-O-RBG底物的比活性,和/或增加的对各种寡核苷酸受体(oligo acceptor)底物的活性。这些具有一个或更多个氨基酸残基差异或残基差异集的工程化TdT多肽将在下面本发明的详细描述中描述。
在一些另外的实施方案中,工程化多肽包含与SEQ ID NO:6至SEQ ID NO:3592和SEQ ID NO:3698至SEQ ID NO:6766中列出的任何偶数编号序列具有至少60%序列同一性的氨基酸序列。
本发明还提供了编码上述段落中描述的至少一种工程化多肽的工程化多核苷酸。在一些实施方案中,工程化多核苷酸包含SEQ ID NO:5至SEQ ID NO:3591和SEQ ID NO:3697至SEQ ID NO:6765中列出的奇数编号的序列。
本发明还提供了包含至少一种上述工程化多核苷酸的载体。在一些实施方案中,载体还包括至少一种控制序列。
本发明还提供包含本文提供的载体的宿主细胞。在一些实施方案中,宿主细胞产生至少一种本文提供的工程化多肽。
本发明还提供了产生工程化TdT多肽的方法,包括在表达工程化多核苷酸和产生工程化多肽的条件下培养本文提供的宿主细胞的步骤。在一些实施方案中,方法还包括回收工程化多肽的步骤。
附图说明
图1描绘了全长TdT变体和这些酶的表示为系统发育树的基于序列保守性的关系。
图2描绘了截短的TdT变体和这些酶的表示为系统发育树的基于序列保守性的关系。
图3A、图3B、图3C和图3D描绘了TdT变体的比对,突出了保守的残基。
图4描绘了TAATC的结合和检测的评估,如下面实施例6中描述的。
发明描述
除非另外定义,本文使用的所有技术和科学术语通常具有与本发明相关领域的普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下面描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学的实验室程序是本领域中熟知的和普遍采用的。这样的技术是熟知的,并在本领域技术人员熟知的许多教科书和参考著作中描述。标准技术或其修改用于化学合成和化学分析。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,特此通过引用明确并入本文。
尽管本发明的实践中可使用与本文描述的方法和材料类似或等同的任何合适的方法和材料,但本文也描述了一些方法和材料。应理解,本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文紧接着定义的术语通过参考本发明作为整体而被更充分地描述。
应理解,上文的一般描述和下文的详细描述仅是示例性的和说明性的,而不是限制本发明。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图涵盖落在这样的较宽数值范围内的每个较窄数值范围,如同这样的较窄数值范围在本文被全部明确地书写。还意图本文公开的每个最大的(或最小的)数值限制包括每个较低(或较高)的数值限制,如同这样的较低(或较高)数值限制在本文被明确地书写。
除非上下文另外清楚地指示,否则如本说明书和所附的权利要求书中使用的单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指示物。因此,例如,提及“多肽”包括多于一种多肽。类似地,“包括(comprise、comprises、comprising)”、“包含(include、includes和including)”是可互换的,而不意图为限制性的。
应理解,当各种实施方案的描述使用术语“包含/包括”时,本领域技术人员将理解,在一些具体情况下,可选地,可以使用语言“基本由...组成”或“由...组成”来描述实施方案。还应理解,当各种实施方案的描述使用术语“任选的(optional)”或“任选地(optionally)”的情况下,随后描述的事件或情况可能发生或可能不发生,并且该描述包括事件或情况发生的情况和其中它不发生的情况。应理解,上文的一般描述和下文的详细描述两者仅是示例性的和说明性的,而不是限制本公开内容。本文使用的章节标题仅用于组织目的,并且不应被解释为限制所描述的主题。
缩写:
用于遗传编码的氨基酸的缩写是常规的,并且如下:
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以是关于α-碳(Cα)的L-构型或D-构型。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。
当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸,并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时,根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。这些缩写也可互换用于核苷和核苷酸(具有一个或更多个磷酸基团的核苷)。除非具体描述,否则缩写的核苷或核苷酸可以是核糖核苷(或核糖核苷酸)或2’-脱氧核糖核苷(或2’-脱氧核糖核苷酸)。核苷或核苷酸也可以在3’位置处被修饰。核苷可以基于单独地或基于总体地指定为核糖核苷(或核糖核苷酸)或2’-脱氧核糖核苷(或2’-脱氧核糖核苷酸)。当核酸序列以单字母缩写串表示时,序列按照常规惯例呈现为5’至3’方向,并且不指示磷酸。
定义:
关于本发明,除非另外具体定义,否则本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义。因此,以下术语意图具有以下含义。
“EC”编号是指生物化学和分子生物学国际联合命名委员会(NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
“ATCC”是指美国典型培养物保藏中心(American Type Culture Collection),其生物保藏收集物包括基因和菌株。
“NCBI”是指美国国家生物技术信息中心(National Center for BiologicalInformation)和其中提供的序列数据库。
“蛋白质”、“多肽”和“肽”在本文中可互换地使用,来表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不考虑长度或翻译后修饰(例如,糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等)。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,“多核苷酸”、“寡核苷酸”和“核酸”在本文中可互换地使用,并且指共价连接在一起的两种或更多种核苷或核苷酸。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2’脱氧核糖核苷酸(即DNA)、完全包含其它合成核苷酸或包含合成核糖核苷酸和/或2’脱氧核糖核苷酸的混合物。多核苷酸还可以包含具有取代的核苷酸,包括2’取代(例如,2’-氟或2’-O-甲基)。虽然核苷通常经由标准磷酸二酯键连接在一起,但多核苷酸可以包含一个或更多个非标准键,包括但不限于磷酸硫醇化键(phosphothiolatedlinkages)。多核苷酸可以是单链或双链的,或者可以包含单链区域和双链区域二者。此外,虽然多核苷酸通常包含天然存在的编码核碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),但它还可以包含一种或更多种经修饰的和/或合成的核碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这样的经修饰的或合成的核碱基是编码氨基酸序列的核碱基。经修饰的或合成的核碱基可以包含任何已知的或假设的或未来发现的修饰或结构,其将被本领域技术人员识别为经修饰的或合成的核碱基。类似地,术语“多核苷酸”、“寡核苷酸”和“核酸”意图包括将被本领域技术人员识别为是“多核苷酸”、“寡核苷酸”或“核酸”,或具有“多核苷酸”、“寡核苷酸”或“核酸”的功能的现在已知或未来发现的任何经修饰的或合成的结构。具有“多核苷酸”、“寡核苷酸”或“核酸”功能的经修饰的或合成的结构的实例是PNA或肽核酸。
如本文使用的,“寡核苷酸受体底物”和“受体底物”和“生长中的寡核苷酸受体底物链”和“生长中的多核苷酸链”在本文中可互换使用,并指任何具有暴露的3’-OH的寡核苷酸或核苷酸链或类似部分,其可被野生型TdT或聚合酶或本公开内容的工程化TdT或聚合酶识别为用于核苷添加或合成的底物。在一些实施方案中,受体底物可以是单链的。在又其他实施方案中,受体底物可以是双链的或部分双链的。在一些实施方案中,受体底物可以包含由1-10个NTP、5-20个NTP、15-50个NTP、30-100个NTP或大于100个NTP组成的核苷酸链。在一些实施方案中,受体底物可以包含不是核苷酸链但含有能够被野生型或工程化TdT识别为底物的游离-OH的化学部分。在实施例中提供了示例性寡核苷酸受体底物。
如本文使用的,“核苷三磷酸-3’-O-可去除封闭基团”和“核苷酸三磷酸-3’-O-可去除封闭基团”和“NTP-3’-O-RBG”在本文中可互换使用,并且指包含替代的或修饰的糖的核糖核苷三磷酸或脱氧核糖核苷三磷酸或合成的核苷三磷酸,替代的或修饰的糖在糖部分的3’OH处附接有可去除封闭基团。
如本文使用的,“寡核苷酸受体产物”和“寡核苷酸受体延伸产物”在本文中可互换使用,并指NTP-3’-O-RBG底物和寡核苷酸受体底物的产物,其中TdT或相关聚合酶催化了延伸或NTP-3’-O-RBG向寡核苷酸受体底物的添加。
如本文使用的,“可去除封闭基团”和“封闭基团”和“终止子基团”和“抑制剂基团”以及这些术语的相关变化形式在本文中可互换使用,并指在从第一轮添加中去除可去除封闭之前,阻碍第二个NTP-3’-O-RBG底物添加到生长中的寡核苷酸受体底物链的3’端的化学基团。在一些实施方案中,NTP-3’-O-RBG底物可以包含选自由NTP-3’-O-NH2或NTP-3’-O-PO3组成的组的可去除封闭基团。在一些实施方案中,NTP-3’-O-RBG可以具有天然嘌呤或嘧啶碱基,诸如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿苷。在一些实施方案中,NTP-3’-O-RBG可以具有非天然的碱基类似物,诸如肌苷、黄嘌呤、次黄嘌呤或另一种碱基类似物,如本领域已知的。
如本文使用的,“非模板依赖性合成”是指在不使用模板链作为合成互补寡核苷酸或多核苷酸链的指导的情况下合成寡核苷酸或多核苷酸。因此,非模板依赖性合成是指成功的NTP藉以被添加到生长中的寡核苷酸链或核苷酸链或受体底物的迭代过程。非模板依赖性合成可以是序列确定的方式,也可以是随机的,如野生型TdT产生抗原受体多样性的情况。本文进一步描述了非模板依赖性合成的过程。
“编码序列”是指编码蛋白质的氨基酸序列的核酸部分(例如,基因)。
“天然存在的”或“野生型”是指自然界中发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于可以从自然界中的来源分离的生物体中并且尚未被人工操作有意修饰的序列。
如本文使用的,当本发明中关于(例如细胞、核酸或多肽)使用时,“重组”、“工程化”和“非天然存在的”或是指一种材料或对应于该材料的自然(natural)或天然(native)形式的材料,其已经以自然界中原本不存在的方式修饰。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但是是从合成材料和/或通过使用重组技术的操作产生或衍生的。非限制性实例包括,除其他以外,表达天然(非重组)形式的细胞内未发现的基因或表达原本以不同水平表达的天然基因的重组细胞。
“序列同一性百分比”和“同源性百分比”在本文中可互换地用于指多核苷酸或多肽之间的比较,并通过比较比较窗中两条最佳对齐的序列确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包含添加或缺失(即,空位),以用于两个序列的最佳对齐。百分比可以通过以下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以产生序列同一性的百分比。可选地,百分比可以通过以下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以产生序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以通过以下进行:例如通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981]),通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970]),通过Pearson和Lipman的相似性搜索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]),通过这些算法的计算机化实现(例如,GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或者通过目视检查,如本领域已知的。适合于确定序列同一性和序列相似性百分比的算法的实例包括但不限于由Altschul等人描述的BLAST和BLAST 2.0算法,(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见,Altschul等人,上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于匹配残基对的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量X;由于累积了一个或更多个负评分残基比对,累积得分达到0或小于0;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3,期望值(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
“参考序列”是指用作序列比较的基础的限定的序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度或核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间不同的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primary amino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。例如,“基于SEQ ID NO:4的在对应于X14的残基处具有缬氨酸的参考序列”或X14V是指其中SEQ ID NO:4中X14处的对应残基(酪氨酸)已经被改变为缬氨酸的参考序列。
“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中在比较窗中序列的一部分与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比,可包括20%或更少的添加或缺失(即,空位)。比较窗可以比20个连续残基更长,并任选地包括30个、40个、50个、100个或更长的连续残基的窗。
如本文使用的,“大体同一性”是指在至少20个残基位置的比较窗中、通常在至少30个-50个残基的窗中,与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间序列同一性,或更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性的百分比通过在比较窗上比较参考序列与包含总计参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中,术语“大体同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共享至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性或更高(例如,99%的序列同一性)。在一些实施方案中,在所比较的序列中不相同的残基位置因保守氨基酸取代而不同。
当在对给定氨基酸或多核苷酸序列进行编号的情况中使用时,“对应”、“参考”和“相对于”是指当给定氨基酸或多核苷酸序列与参考序列相比较时对指定参考序列的残基进行编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定的氨基酸序列,诸如工程化TdT的氨基酸序列可以通过引入空位以与参考序列对齐,来优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,给定氨基酸或多核苷酸序列中的残基是关于与其比对的参考序列进行编号的。
“氨基酸差异”或“残基差异”或“取代”是指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的变化。氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比位置X25处的残基差异”是指对应于SEQ ID NO:2的位置25的多肽位置处的氨基酸残基的变化。因此,如果SEQ ID NO:2的参考多肽在位置25处具有缬氨酸,则“与SEQ ID NO:2相比位置X25处的残基差异”是指在对应于SEQ ID NO:2的位置25的多肽位置处的除了缬氨酸以外的任何残基的氨基酸取代。在本文的大多数情况中,在一个位置处的具体氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中不同的残基)的单字母标识符。在一些实施方案中,多于一种氨基酸可以出现在特定的残基位置(即,替代氨基酸可以以XnY/Z的形式列出,其中Y和Z代表替代氨基酸残基)。在一些情况下(例如,在表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2中),本发明还提供由常规符号“AnB”表示的具体氨基酸差异,其中A为参考序列中的残基的单字母标识符,“n”为参考序列中的残基位置的编号,并且B为工程化多肽的序列中残基取代的单字母标识符。此外,在一些情况下,本发明的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异,这由相对于参考序列发生变化的特定位置的列表来指示。在一些另外的实施方案中,本发明提供了包含保守氨基酸取代和非保守氨基酸取代两者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。通过实例的方式而非限制,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。示例性保守取代在下面的表1中提供。
“非保守取代”是指用具有显著不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸,并且影响(a)取代区域中的肽主链的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。通过实例的方式而非限制,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳香族氨基酸;和用疏水氨基酸取代亲水氨基酸。
“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%或多达组成参考酶的氨基酸总数的20%,同时保留酶促活性和/或保留工程化TdT的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。
“插入”是指通过向参考多肽添加一个或更多个氨基酸对多肽进行的修饰。在一些实施方案中,改进的工程化TdT酶包括将一种或更多种氨基酸插入到天然存在的多肽中,以及将一种或更多种氨基酸插入到其他改进的TdT多肽中。插入可以处于多肽的内部部分或者可以是插入到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。
如本文使用的,“片段”是指具有氨基末端和/或羧基末端缺失,但其中剩余的氨基酸序列与序列中的对应位置相同的多肽。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及高达全长TdT多肽例如SEQ ID NO:4的多肽或SEQ IDNO:6-3592和3698-6766的偶数编号序列中提供的TdT的70%、80%、90%、95%、98%和99%。
“分离的多肽”是指与其天然伴随的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。工程化TdT酶可以存在于细胞内、存在于细胞培养基中,或以各种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,工程化TdT酶多肽可以是分离的多肽。
“基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的主要物质(即,在摩尔或重量基础上,它比该组合物中的任何其他单独的大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,通常是基本上纯化的组合物。通常,基本上纯的TdT组合物构成该组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的工程化TdT多肽是基本上纯的多肽组合物。
如本文使用的,“改进的酶性质”是指酶的至少一种改进的性质。在一些实施方案中,本发明提供了与参考TdT多肽和/或野生型TdT多肽和/或另一种工程化TdT多肽相比表现出任何酶性质的改进的工程化TdT多肽。对于本文描述的工程化TdT多肽,通常与衍生TdT的野生型酶进行比较,尽管在一些实施方案中,参考酶可以是另一种改进的工程化TdT。因此,可以确定并比较各种TdT多肽(包括野生型以及工程化TdT)之间的“改进”水平。改进的性质包括但不限于诸如以下的性质:酶活性(其可以用底物转化的百分比表示)、热稳定性、溶剂稳定性、pH活性谱、辅因子需求、对抑制剂的耐性(refractoriness)(例如底物或产物抑制)、在高温的活性、增加的可溶性表达、减少的副产物形成、增加的对NTP-3’-O-RBG底物的比活性和/或增加的对各种寡核苷酸受体底物的活性(包括对映选择性)。
“增加的酶活性”是指可以被表示为与参考TdT酶相比,比活性(例如产生的产物/时间/重量蛋白)的增加或将底物转化为产物的转化百分比(例如使用特定量的TdT,在特定时间段内将起始量的底物转化为产物的转化百分比)的增加的TdT多肽的改进的性质。在实施例中提供了确定酶活性的示例性方法。与酶活性相关的任何性质都可以被影响,包括典型的酶性质Km、Vmax或kcat,其变化可以导致酶活性的增加。例如,酶活性的改进可以是对应野生型酶的酶促活性的约1.2倍到相比于天然存在的TdT多肽或TdT多肽所衍生的另一种工程化TdT的多达2倍、5倍、10倍、20倍、25倍、50倍或更大的酶促活性。TdT活性可以通过任何一种标准测定来测量,诸如通过监测底物、辅因子或产物性质的变化。在一些实施方案中,生成的产物量可以通过液相色谱-质谱(LC-MS)、HPLC或本领域已知的其他方法来测量。酶活性的比较使用限定的酶制品、在设定条件下的限定的测定和一种或更多种限定的底物进行,如本文进一步详细描述的。通常,当比较裂解物时,确定细胞的数目和测定的蛋白的量,以及使用相同的表达系统和相同的宿主细胞以使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。
“转化”是指将底物酶促转化为对应的产物。“转化百分比”是指在特定条件下,在一段时间内,转化为产物的底物的百分比。因此,TdT多肽的“酶促活性”或“活性”可以表示为底物转化为产物的“转化百分比”。
“热稳定”是指与暴露于相同高温的野生型酶相比,在暴露于高温(例如40-80℃)一段时间(例如0.5-24小时)后维持类似活性(例如大于60%-80%)的TdT多肽。
“溶剂稳定”是指与暴露于相同浓度的相同溶剂的野生型酶相比,在暴露于不同浓度(例如5%-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)一段时间(例如0.5-24小时)后维持类似活性(大于例如60%至80%)的TdT多肽。
“热稳定且溶剂稳定”是指既热稳定又溶剂稳定的TdT多肽。
术语“严格杂交条件”在本文中用于指在该条件下核酸杂交体是稳定的条件。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)中。通常,杂交体的稳定性随着离子强度、温度、G/C含量和离液剂的存在而变化。多核苷酸的Tm值可以使用用于预测解链温度的已知方法来计算(参见例如Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,1990,Nucl.Acids Res.,18:6409-6412[1990](erratum,Nucl.Acids Res.,19:698[1991]);Sambrook等人,上文);Suggs等人,1981,于Developmental Biology Using Purified Genes中,Brown等人[eds.],pp.683-693,Academic Press,Cambridge,MA[1981];以及Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格条件下,与编码本发明的工程化TdT酶的序列的互补体杂交。
“杂交严格性”是指核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格性条件是指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交的条件(即,如果杂交体在0.018M NaCl中在65℃是不稳定的,它在如本文预期的高严格性条件下将是不稳定的)。可以提供高严格性条件,例如,通过在等同于50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS在42℃的条件杂交,然后在0.1×SSPE和0.1%SDS中在65℃洗涤提供。另一种高严格性条件是在等同于在含有0.1%(w/v)SDS的5X SSC中在65℃杂交的条件进行杂交和在含有0.1%SDS的0.1×SSC中在65℃洗涤。其他高严格性杂交条件以及中度严格条件在上文引用的参考文献中描述。
“异源”多核苷酸是指通过实验室技术引入宿主细胞的任何多核苷酸,并且包括从宿主细胞中取出、经过实验室操作并且然后重新引入宿主细胞的多核苷酸。
“密码子优化”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中更有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,编码TdT酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体的获得最佳产量。
如本文使用的,“优选的、最佳的、高密码子使用偏倚密码子”可互换地指在蛋白编码区中的以高于编码相同氨基酸的其他密码子的频率使用的密码子。优选的密码子可以根据单个基因、具有共同功能或起源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率,或它们的组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用于确定特定生物体中密码子频率(例如密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析,和基因中使用的密码子的有效数目(参见例如GCG CodonPreference,Genetics Computer GroupWisconsin Package;CodonW,Peden,University of Nottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.222437-46[1994];Wright,Gene 87:23-29[1990])。许多不同的生物体的密码子使用表是可用的(参见例如Wada等人,Nucl.AcidsRes.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret等人,同上;Henaut和Danchin,于Escherichia coli and Salmonella中,Neidhardt等人(编辑),ASM Press,Washington D.C.,p.2047-2066[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达的蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达的序列标签(ESTS),或基因组序列的预测编码区(参见例如Mount,Bioinformatics:Sequence and Genome Analysis,Chapter 8,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];和Tiwari等人,Comput.Appl.Biosci.,13:26 3-270[1997])。
本文将“控制序列”定义为包括对本发明的多核苷酸和/或多肽的表达必要或有利的所有组分。每个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。出于引入特定限制性位点的目的,控制序列可以与接头一起提供,所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作连接的”在本文中被定义为如下配置:在所述配置中控制序列适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包括介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,包括突变、截短的和杂合启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因来获得。
“合适的反应条件”是指在生物催化反应溶液中的那些条件(例如,酶载量(enzymeloading)、底物载量、辅因子载量、温度、pH、缓冲液、助溶剂等的范围),在这些条件下,本发明的TdT多肽能够将一种或更多种底物化合物转化为产物化合物(例如,将NTP-3’-O-RBG添加到寡核苷酸受体底物)。本发明中提供了示例性的“合适的反应条件”,并通过实施例进行说明。
“组合物”是指一种或更多种物质的混合物或组合,其中组合物中的每种物质或组分都保留其单独的性质。如本文使用的,生物催化组合物是指用于生物催化的一种或更多种物质的组合。
“载量”,诸如“化合物载量”或“酶载量”或“辅因子载量”,是指反应开始时组分在反应混合物中的浓度或量。
在生物催化剂介导的过程的情况下,“底物”是指生物催化剂所作用于的化合物或分子。例如,本文公开的合成过程中使用的TdT生物催化剂作用于NTP-3’-O-RBG底物和寡核苷酸受体底物。
在生物催化剂介导的过程的情况下,“产物”是指由生物催化剂的作用产生的化合物或分子。例如,本文公开的过程中使用的TdT生物催化剂的示例性产物是寡核苷酸受体延伸产物,如方案1和方案2描绘的。
“烷基(Alkyl)”是指具有1个至18个碳原子、更优选地1个至8个碳原子、并且最优选地1个至6个碳原子的直链的或支链的饱和烃基团。具有特定数量碳原子的烷基在括号中表示(例如,(C1-C6)烷基是指具有1个至6个碳原子的烷基)。
“烯基”是指具有2个至12个碳原子的、直链的或支链的、包含至少一个双键但任选地包含多于一个双键的基团。
“炔基”是指具有2个至12个碳原子的、直链的或支链的、包含至少一个三键但任选地包含多于一个三键,并且另外任选地包含一个或更多个双键键合部分的基团。
“杂烷基”、“杂烯基”和“杂炔基”分别指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团替代的如本文定义的烷基、烯基和炔基。可以替代碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRα-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-等,包括其组合,其中每个Rγ独立地选自氢、烷基、环烷基、杂环烃基、芳基和杂芳基。
“氨基”是指基团“-NH2”。被取代的氨基是指基团-NHRη、NRηRη和NRηRηRη,其中每个Rη独立选自被取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚硫酰基、磺酰基等。经典的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“氨基烷基”是指其中一个或更多个氢原子被一个或更多个氨基基团替代的烷基基团,包括被取代的氨基基团。
“氨基羰基”是指-C(O)NH2。被取代的氨基羰基是指-C(O)NRηRη,其中氨基基团NRηRη是如本文定义的。
“氧基”是指二价基团“-O-”,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
“烷氧基”或“烷基氧基”在本文中可互换使用以是指基团“–ORζ”,其中Rζ是烷基基团,包括任选地被取代的烷基基团。
“羧基”是指-COOH。
“羰基”是指-C(O)-,其可以具有各种取代基以形成不同的羰基基团,包括酸、酸性卤化物、醛、酰胺、酯和酮。
“羧基烷基”是指其中一个或更多个氢原子被一个或更多个羧基基团替代的烷基。
“氨基羰基烷基”是指被如本文定义的氨基羰基基团取代的烷基。
“卤素(halogen)”或“卤代(halo)”是指氟、氯、溴和碘。
“卤代烷基”是指其中一个或更多个氢原子被卤素替代的烷基基团。因此,术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等直到全卤代烷基。例如,表述“(C1-C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1-三氟乙基、全氟乙基等。
“羟基”是指-OH。
“羟基烷基”是指其中一个或更多个氢原子被一个或更多个羟基基团替代的烷基基团。
“硫氢基(thiol)”或“氢硫基(sulfanyl)”是指-SH。被取代的硫氢基或氢硫基是指-S-Rη,其中Rη是烷基、芳基或其他合适的取代基。
“磺酰基”是指-SO2-。被取代的磺酰基是指-SO2-Rη,其中Rη是烷基、芳基或其他合适的取代基。
“烷基磺酰基”是指-SO2-Rζ,其中Rζ是可以任选地被取代的烷基。典型的烷基磺酰基基团包括但不限于甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
如本文使用的“磷酸酯”是指包含正磷酸根离子(与四个氧原子共价连接的磷原子)的官能团。正磷酸根离子通常具有一个或更多个氢原子或有机基团。
如本文使用的“磷酸化”是指一个或更多个磷酰基基团(与三个氧原子共价连接的磷原子)的添加或存在。
在本文中关于上述化学基团使用的“任选地被取代的”意指由氢占据的化学基团的位置可以被另一个原子(除非另外说明)或化学基团取代,所述另一个原子例如但不限于碳、氧、氮或硫,所述化学基团例如但不限于羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫代、烷硫基、酰基、羧基、烷氧基羰基、甲酰氨基(carboxamido)、被取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、被取代的磺酰氨基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基肟基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环基、(杂环)氧基和(杂环)烷基;其中优选的杂原子是氧、氮和硫。
另外,在这些取代化学基团上存在开放化合价的情况下,它们可以进一步被烷基、环烷基、芳基、杂芳基和/或杂环基团取代,在这些开放化合价存在于碳上的情况下,它们可以进一步被卤素和被氧键合的、氮键合的或硫键合的取代基取代,并且在存在多于一个这样的开放化合价的情况下,这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接以形成环。还设想,可以进行上文的取代,条件是用取代基替代氢不会对本发明的分子带来不可接受的不稳定性,并且以其他方式在化学上是合理的。本领域普通技术人员将理解,对于被描述为任选地被取代的任何化学基团,仅意在包括空间上可实现的和/或合成上可行的化学基团。如本文使用的“任选地被取代的”是指术语或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。
如本文所用的“反应”是指其中一种或更多种物质或化合物或底物被转化成一种或更多种不同的物质、化合物的一种或更多种过程。
通过工程化TdT的非模板依赖性合成
有效合成长的纯DNA链和其他多核苷酸的新方法对于克服现有亚磷酰胺化学合成方法的局限性是必要的,以便实现一系列新兴的和现有的合成生物学应用。
本发明提供了新的末端脱氧核苷酸转移酶,其在使用用3’-O-可去除封闭基团(NTP-3’-O-RBG)修饰的5’-核苷三磷酸(“NTP”)的多核苷酸的非模板依赖性合成中具有改进的活性。与野生型TdT或本领域技术人员已知的其他TdT相比,本公开内容的TdT具有改进的热稳定性、在高温的活性、增加的可溶性表达、减少的副产物形成、增加的对NTP-3’-O-RBG底物的亲和力、增加的对寡核苷酸受体底物的亲和力、增加的对NTP-3’-O-RBG底物的活性或比活性、和/或增加的对各种寡核苷酸受体底物的活性或比活性。本公开内容的工程化多肽是SEQ ID NO:2的变体,SEQ ID NO:2是由物种纹霸鹟的基因组编码的预测剪接变体。这些工程化TdT能够非模板依赖性合成寡核苷酸和多核苷酸。
使用工程化TdT对限定的多核苷酸序列进行非模板依赖性合成是一个多步骤过程。在一种实施方案中,具有3’-OH的寡核苷酸受体底物允许通过工程化TdT添加限定的NTP-3’-O-RBG底物,如下面的方案1描绘的。
方案1
在将NTP-3’-O-RBG添加到寡核苷酸受体底物或生长中的多核苷酸链的3’-OH后,3’-O-RBG阻断了TdT进一步添加。然后去除RBG,暴露3’-OH,并允许另一轮添加。在每一轮添加后,去除来自前一轮的NTP-3’-O-RBG底物,并添加新的NTP-3’-O-RBG底物,以通过在多核苷酸或寡核苷酸受体底物的3’-OH末端添加来顺序和有效地产生限定的多核苷酸序列,而不需要引物序列。
如本领域技术人员所设想的,在该方法中可以使用多种寡核苷酸受体底物和NTP-3’-O-RBG底物。一个反应的实例在下面的方案2中详述。方案2描绘了如实施例15描述的[N]7ATC和3’-phos-dCTP的TdT催化的反应,而合适的寡核苷酸受体底物和NTP-3’-O-RBG对的其他实例在其他实施例中描述。这些实例是非限制性的。
方案2
偶尔,在添加步骤期间,TdT会产生不期望的合成产物。这包括掺入丢失其封闭基团的NTP、添加多于一个NTP、或切除或“反嚼(back chewing)”生长中的多核苷酸链上的TdT。
在一些实施方案中,使用一个或更多个另外的质量控制步骤,诸如在去除封闭基团之前添加外切核酸酶并起始新一轮合成。在一些实施方案中,磷酸酶用于分解无机磷酸盐并将可逆TdT反应推向合成。
如本文进一步描述的,本公开内容的工程化TdT多肽在方案1中描绘的非模板依赖性多核苷酸合成过程中表现出一个或更多个改进的性质。
在一些实施方案中,本发明提供了一种工程化TdT多肽,其包含与SEQ ID NO:4的氨基酸参考序列具有至少60%序列同一性的氨基酸序列,并且与参考氨基酸序列相比还包含一种或更多种氨基酸残基差异,其中与野生型TdT或本领域技术人员已知的其他TdT相比,工程化TdT多肽具有改进的热稳定性、增加的在高温的活性、增加的可溶性表达、减少的副产物形成、增加的对NTP-3’-O-RBG底物的比活性和/或增加的对各种寡核苷酸受体底物的活性。
特别地,本公开内容的工程化TdT多肽已经被工程化用于在上述方法中使用NTP-3’-O-RBG有效合成长多核苷酸。
本领域技术人员已知多种合适的反应条件,如下文和实施例中详述的。
工程化末端脱氧核苷酸转移酶多肽
本发明提供了可用于使用核苷三磷酸-3’-O-可去除封闭基团的非模板依赖性多核苷酸合成的工程化末端脱氧核苷酸转移酶(TDT)多肽,以及组合物和利用这些工程化多肽的方法。
本发明提供了TdT多肽、编码多肽的多核苷酸、制备多肽的方法和使用多肽的方法。在描述涉及多肽的情况下,应当理解,它可以描述编码多肽的多核苷酸。
可以关于多肽、底物、共底物的浓度或量,缓冲液,溶剂,pH,包括温度和反应时间的条件和/或多肽固定在固体支持物上的条件来确定工程化多肽的上述改进性质进行期望的反应的合适反应条件,如下文和实施例中进一步描述的。
在一些实施方案中,示例性工程化TDT包含与SEQ ID NO:4相比在表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2中指示的残基位置处具有一个或更多个残基差异的氨基酸序列。
本发明的示例性工程化多肽的结构和功能信息基于寡核苷酸受体底物和NTP-3’-O-RBG或双脱氧NTP的转化,其结果如下表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2所示,如实施例中进一步描述的。这些表中的奇数编号的序列标识符(即SEQ ID NO)是指编码由这些表中的偶数编号SEQ ID NO提供的氨基酸序列的核苷酸序列。示例性序列在本发明随附的电子序列列表文件中提供,该电子序列列表文件通过引用并入本文。氨基酸残基差异基于与SEQNO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列的比较,如指示的。
末端脱氧核苷酸转移酶(Pol X家族的一员)已在许多物种中被鉴定。已知不同PolX家族的成员共享某些残基,这些残基在家族成员中是保守的。对于被认为参与结合二价金属离子、三元复合物形成以及结合dNTP和DNA配体的残基,TdT也具有跨物种的高水平保守性(Dominnguez等人(2000).EMBO,19(7),1731-1742)。此外,已知TDT具有N-末端截短的、缺乏BRCT结构域的剪接变体。
在本公开内容中,筛选来自多种物种的TDT,包括截短的酶和全长的酶两者,以获得可溶性表达,如下文实施例72中描述的。图1描绘了全长TdT变体和这些酶的表示为系统发育树的基于序列保守性的关系。图2描绘了截短的TdT变体和这些酶的表示为系统发育树的基于序列保守性的关系。图3A、图3B、图3C和图3D描绘了来自本公开内容中针对可溶性表达筛选的多种物种的TdT的比对,突出了这些物种之间的保守残基。
基于该筛选,基于可溶性表达选择来自纹霸鹟的野生型TdT的预测剪接变体(SEQID NO:2)。本公开内容的TdT多肽是SEQ ID NO:2和SEQ ID NO:4的工程化变体,SEQ ID NO:4是在氨基酸位置131处截短的WT TdT的N-末端加6-组氨酸标签的版本(SEQ ID NO:4)。
本公开内容的多肽具有残基差异,这些残基差异产生开发能够非模板依赖性合成长多核苷酸的高效TdT酶所需的改进性质。已经发现保守位置和非保守位置两者处的各种残基差异与各种酶性质的改进有关,包括与野生型TdT或本领域技术人员已知的其他TdT相比,改进的热稳定性、增加的在高温的活性、增加的可溶性表达、减少的副产物形成、增加的对NTP-3’-O-RBG底物的比活性和/或增加的对各种寡核苷酸受体底物的活性。
每种工程化TdT相对于SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考多肽的活性被确定为本文实施例中描述的底物的转化。在一些实施方案中,摇瓶纯化酶(SFP)用作二次筛选以评估工程化TdT的性质,其结果在实施例中提供。
在一些实施方案中,具体的酶性质与残基差异相关,所述残基差异是与SEQ NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比在本文指示的残基位置处的残基差异。在一些实施方案中,影响多肽表达的残基差异可用于增加工程化TdT的表达。
鉴于本文提供的指导,还设想了包含SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的偶数编号序列的示例性工程化多肽中的任一个通过例如随后轮次的演化可用作用于合成其他TdT多肽的起始氨基酸序列,所述演化掺入来自表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2中的其他多肽和本文描述的其他残基位置的各种氨基酸差异的新的组合。另外的改进可以通过在贯穿较早轮次的演化中维持未改变的残基位置处包含氨基酸差异来生成。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:14、17、19、20、21、22、24、27、28/304、55、66、67、68、80、99、103、111、113、115、140、158、159、160、161、167、170、180、192、197、200、201、219、233、235、238、246、249、256、258、267、268、273、295、296、297、300、303、304、306、322、350、353、367和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:14G、17R、19S、20F、20G、20S、21G、22D、24E、24Q、24V、27G、27Y、28S/304L、55I、66A、66E、66L、66R、67K、67R、68R、80S、99S、103R、103S、111R、113Q、115R、140I、158R、159L、160S、161S、167E、170Q、180A、180T、192S、197G、200A、200R、201R、219A、219R、219W、233G、233R、235D、235S、235V、238G、246G、249T、256G、258C、267G、268E、273R、295D、295S、295V、295W、296V、297A、297L、297V、300S、303G、304E、304W、306L、322V、350V、353N、367C和373D。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:P14G、T17R、E19S、L20F、L20G、L20S、E21G、V22D、S24E、S24Q、S24V、A27G、A27Y、R28S/S304L、M55I、I66A、I66E、I66L、I66R、F67K、F67R、C68R、Y80S、D99S、D103R、D103S、E111R、E113Q、S115R、V140I、K158R、A159L、D160S、K161S、K167E、K170Q、V180A、V180T、T192S、N197G、S200A、S200R、T201R、K219A、K219R、K219W、P233G、P233R、E235D、E235S、E235V、E238G、L246G、K249T、C256G、I258C、Q267G、L268E、I273R、N295D、N295S、N295V、N295W、S296V、S297A、S297L、S297V、T300S、K303G、S304E、S304W、M306L、T322V、H350V、K353N、R367C和G373D。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:10、17、20、27、28、55、62、63、66、67、68、68/118、87、103、106、111、131、155、157、160、160/296、177、181、200、219、246、256、263、292、295、296、297、315和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:10Q、17D、20S、27G、28F、28S、55L、62M、63G、66V、67A、67D、67N、68R、68R/118H、87S、103H、106R、111T、131E、155S、157A、157I、160C、160N/296W、160T、177S、181R、200A、219P、246C、256E、263A、292S、295V、296G、297T、315G、315V、373D和373R。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:S10Q、T17D、L20S、A27G、R28F、R28S、M55L、K62M、E63G、I66V、F67A、F67D、F67N、C68R、C68R/K118H、R87S、D103H、E106R、E111T、Q131E、E155S、L157A、L157I、D160C、D160N/S296W、D160T、E177S、S181R、S200A、K219P、L246C、C256E、F263A、G292S、N295V、S296G、S297T、I315G、I315V、G373D和G373R。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:8、10、11、15、16、20、21、22、24、26、28、30、34、42、44、47、48、52、54、55、62、63、66、67、68、72、77、80、84、87、89、91、92、99、101、102、103、106、109、111、111/346、113、115、116、118、122、123、131、140、144、147、156、157、160、160/296、161、162、163、164、170、173、174、175、180、181、185、189、192、193、194、197、198、198/289、200、201、207、219、230、234、235、237、238、241、245、246、249、256、257、258、262、263、264、267、268、272、273、280、284、286、289、290、291、292、295、296、297、299、300、302、304、307、308、310、311、321、322、325、350、353、355、365、366、368、371、373和388。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:8P、8R、10D、10G、10Q、11R、15F、15G、16V、20G、21G、22G、24N、24T、24Y、26L、28S、30G、30P、34H、42T、44D、47I、48N、52L、54L、55L、62L、62M、63G、66A、66E、66R、66V、67A、67D、67G、67K、67N、67R、68R、68S、68T、72D、77V、80C、80G、80R、80S、80T、84T、87S、89A、91L、92D、92M、92S、99P、101T、102W、103A、103E、103L、103Q、103S、106R、109C、109L、111A、111I、111M、111P/346H、111R、111S、111T、113C、115E、115R、116I、116P、118M、122S、123G、131L、140I、144R、147L、147S、147Y、156F、157A、157I、157V、160C、160N/296W、160T、161L、161R、162R、163R、164D、164R、170D、173L、174R、175D、180A、180R、180T、181R、185R、189A、192Y、193A、193G、193W、194K、197S、198G、198G/289H、200C、200N、201L、201N、207G、219G、219P、230C、234L、235D、235Q、235S、237R、238L、238S、238Y、241D、245E、246C、246V、249Q、256E、256G、256P、257F、258S、262G、262R、263A、263K、264T、264Y、267D、267S、267V、267W、268V、272G、273P、273Q、280C、284F、286A、289G、289R、290K、290R、291K、291Q、292S、292V、295A、296R、296W、296Y、297P、297T、299V、300L、300R、300S、302A、304A、304K、307I、308M、310G、311V、321E、321G、322R、322V、325L、350E、350V、350Y、353A、353F、353N、355E、355F、365D、365R、366P、368L、371I、373N和388Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:G8P、G8R、S10D、S10G、S10Q、G11R、S15F、S15G、N16V、L20G、E21G、V22G、S24N、S24T、S24Y、I26L、R28S、V30G、V30P、S34H、N42T、Y44D、K47I、F48N、F52L、I54L、M55L、K62L、K62M、E63G、I66A、I66E、I66R、I66V、F67A、F67D、F67G、F67K、F67N、F67R、C68R、C68S、C68T、L72D、L77V、Y80C、Y80G、Y80R、Y80S、Y80T、P84T、R87S、K89A、I91L、Q92D、Q92M、Q92S、D99P、V101T、R102W、D103A、D103E、D103L、D103Q、D103S、E106R、I109C、I109L、E111A、E111I、E111M、E111P/R346H、E111R、E111S、E111T、E113C、S115E、S115R、R116I、R116P、K118M、N122S、D123G、Q131L、V140I、E144R、F147L、F147S、F147Y、E156F、L157A、L157I、L157V、D160C、D160N/S296W、D160T、K161L、K161R、S162R、L163R、K164D、K164R、K170D、F173L、L174R、Y175D、V180A、V180R、V180T、S181R、K185R、D189A、T192Y、L193A、L193G、L193W、I194K、N197S、T198G、T198G/Y289H、S200C、S200N、T201L、T201N、L207G、K219G、K219P、N230C、K234L、E235D、E235Q、E235S、D237R、E238L、E238S、E238Y、H241D、D245E、L246C、L246V、K249Q、C256E、C256G、C256P、D257F、I258S、T262G、T262R、F263A、F263K、V264T、V264Y、Q267D、Q267S、Q267V、Q267W、L268V、K272G、I273P、I273Q、Q280C、A284F、L286A、Y289G、Y289R、Q290K、Q290R、P291K、P291Q、G292S、G292V、N295A、S296R、S296W、S296Y、S297P、S297T、N299V、T300L、T300R、T300S、K302A、S304A、S304K、A307I、E308M、K310G、D311V、I321E、I321G、T322R、T322V、E325L、H350E、H350V、H350Y、K353A、K353F、K353N、I355E、I355F、K365D、K365R、K366P、I368L、K371I、G373N和E388Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:60、60/259、60/278和65/259。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:60K、60K/259K、60K/278H和65K/259Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:E60K、E60K/I259K、E60K/N278H和E65K/I259Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:20、20/21/68/103/200/238/297、20/21/68/111/235、20/21/68/160、20/21/68/160/180/200/246、20/21/68/160/246、20/21/68/180、20/21/68/180/235、20/21/68/200/235/297、20/21/68/233/246/297、20/21/103/233、20/21/111、20/21/111/160/200、20/21/111/200/238、20/21/180/297、20/21/233、20/68/103/160/200、20/68/103/180/200、20/68/160、20/68/160/180、20/68/160/180/233/235/246、20/68/160/235/297、20/68/160/246、20/68/200/238/246、20/68/235/297、20/103/160/180/200/235、20/103/233、20/111、20/111/180/235/246/297、21、21/68、21/68/103/111、21/68/111/200、21/68/160/180/200/205/297、21/68/160/180/200/297、21/68/160/238、21/68/160/238/246、21/68/180、21/68/180/235、21/68/180/246、21/68/200、21/68/235、21/103/233、21/233/297、68、68/103/160/235、68/103/200/235/246/297、68/111/200/238、68/111/233/236/297、68/160/233/246、68/200/235/297、103、103/160/180、103/160/297、103/233、111和111/160/233/235/297。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:20G/21G/68R/103S/200R/238G/297A、20G/21G/68R/160S/180A/200R/246G、20G/21G/68R/180A、20G/21G/68R/180A/235S、20G/21G/111R/160S/200A、20G/21G/180A/297A、20G/21G/233G、20G/68R/103S/160S/200R、20G/68R/160S、20S、20S/21G/68R/111R/235S、20S/21G/68R/160S、20S/21G/68R/160S/246G、20S/21G/68R/200R/235S/297A、20S/21G/68R/233G/246G/297A、20S/21G/103S/233G、20S/21G/111R、20S/21G/111R/200R/238G、20S/68R/103S/180A/200A、20S/68R/160S/180A、20S/68R/160S/180A/233G/235S/246G、20S/68R/160S/235S/297A、20S/68R/160S/246G、20S/68R/200A/238G/246G、20S/68R/235S/297A、20S/103S/160S/180A/200R/235S、20S/103S/233G、20S/111R、20S/111R/180A/235S/246G/297A、21G、21G/68R、21G/68R/103S/111R、21G/68R/111R/200R、21G/68R/160S/180A/200R/205A/297A、21G/68R/160S/180A/200R/297A、21G/68R/160S/238G、21G/68R/160S/238G/246G、21G/68R/180A、21G/68R/180A/235S、21G/68R/180A/246G、21G/68R/200R、21G/68R/235S、21G/103S/233G、21G/233G/297A、68R、68R/103S/160S/235S、68R/103S/200R/235S/246G/297A、68R/111R/200A/238G、68R/111R/233G/236N/297A、68R/160S/233G/246G、68R/200A/235S/297A、103S、103S/160S/180A、103S/160S/297A、103S/233G、111R和111R/160S/233G/235S/297A。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:4相比选自以下的一个或更多个残基差异或残基差异集:L20G/E21G/C68R/D103S/S200R/E238G/S297A 、L20G/E21G/C68R/D160S/V180A/S200R/L246G、 L20G/E21G/C68R/V180A、L20G/E21G/C68R/V180A/E235S 、 L20G/E21G/E111R/D160S/S200A 、L20G/E21G/V180A/S297A、L20G/E21G/P233G、L20G/C68R/D103S/D160S/S200R、L20G/C68R/D160S、L20S、L20S/E21G/C68R/E111R/E235S、L20S/E21G/C68R/D160S、L20S/E21G/C68R/D160S/L246G、L20S/E21G/C68R/S200R/E235S/S297A、L20S/E21G/C68R/P233G/L246G/S297A、L20S/E21G/D103S/P233G、L20S/E21G/E111R、L20S/E21G/E111R/S200R/E238G 、 L20S/C68R/D103S/V180A/S200A 、L20S/C68R/D160S/V180A、 L20S/C68R/D160S/V180A/P233G/E235S/L246G、L20S/C68R/D160S/E235S/S297A 、 L20S/C68R/D160S/L246G 、L20S/C68R/S200A/E238G/L246G 、 L20S/C68R/E235S/S297A 、L20S/D103S/D160S/V180A/S200R/E235S、L20S/D103S/P233G、L20S/E111R、L20S/E111R/V180A/E235S/L246G/S297A、E21G、E21G/C68R、E21G/C68R/D103S/E111R、E21G/C68R/E111R/S200R、 E21G/C68R/D160S/V180A/S200R/D205A/S297A、E21G/C68R/D160S/V180A/S200R/S297A 、 E21G/C68R/D160S/E238G 、E21G/C68R/D160S/E238G/L246G、E21G/C68R/V180A、E21G/C68R/V180A/E235S、E21G/C68R/V180A/L246G、E21G/C68R/S200R、E21G/C68R/E235S、E21G/D103S/P233G、E21G/P233G/S297A 、 C68R 、 C68R/D103S/D160S/E235S 、C68R/D103S/S200R/E235S/L246G/S297A 、 C68R/E111R/S200A/E238G 、C68R/E111R/P233G/D236N/S297A、C68R/D160S/P233G/L246G、C68R/S200A/E235S/S297A、D103S、D103S/D160S/V180A、D103S/D160S/S297A、D103S/P233G、E111R和E111R/D160S/P233G/E235S/S297A。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:55、55/67、55/67/87、55/67/87/106/111/315、55/67/87/157/315、55/67/106/111/157、55/67/106/315、55/67/111、55/67/111/315、55/67/315、55/87、55/87/106、55/87/106/111/315、55/87/106/315、55/87/157、55/87/157/207、55/106/111、55/106/157、55/111、55/111/315、55/157、55/315、67、67/87、67/87/106/157、67/87/111/157/315、67/87/157、67/87/315、67/106、67/106/111、67/106/111/315、67/106/157、67/111、67/111/315、67/157、67/157/315、87、87/106、87/106/111/315、87/111/157/315、87/157、87/157/315、87/315、106、106/111/157、106/315、157、157/315和315。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:55L、55L/67A/106R/111T/157I、55L/67A/111T、55L/67A/111T/315V、55L/67D、55L/67D/87S/157I/315V、55L/67D/315V、55L/67M/87S、55L/67M/106R/315V、55L/67N/87S、55L/67N/87S/106R/111T/315V、55L/87S、55L/87S/106R、55L/87S/106R/111T/315V、55L/87S/106R/315V、55L/87S/157A、55L/87S/157I、55L/87S/157I/207Q、55L/106R/111T、55L/106R/157I、55L/111T、55L/111T/315V、55L/157I、55L/315V、67A、67A/87S/106R/157A、67A/87S/111T/157A/315V、67A/106R/111T/315V、67A/111T、67A/157I、67D、67D/111T、67M、67M/87S、67M/87S/157A、67M/87S/157I、67M/106R/157A、67M/111T/315V、67M/157A、67M/157A/315V、67N、67N/87S、67N/87S/315V、67N/106R、67N/106R/111T、87S、87S/106R、87S/106R/111T/315V、87S/111T/157A/315V、87S/111T/157I/315V、87S/157A、87S/157I、87S/157I/315V、87S/315V、106R、106R/111T/157I、106R/315V、157A、157I、157I/315V和315V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:M55L、M55L/F67A/E106R/E111T/L157I、M55L/F67A/E111T、M55L/F67A/E111T/I315V、M55L/F67D、M55L/F67D/R87S/L157I/I315V、M55L/F67D/I315V、M55L/F67M/R87S、M55L/F67M/E106R/I315V、M55L/F67N/R87S、M55L/F67N/R87S/E106R/E111T/I315V、M55L/R87S、M55L/R87S/E106R、M55L/R87S/E106R/E111T/I315V、M55L/R87S/E106R/I315V、M55L/R87S/L157A、M55L/R87S/L157I、M55L/R87S/L157I/L207Q、M55L/E106R/E111T、M55L/E106R/L157I、M55L/E111T、M55L/E111T/I315V、M55L/L157I、M55L/I315V、F67A、F67A/R87S/E106R/L157A、F67A/R87S/E111T/L157A/I315V、F67A/E106R/E111T/I315V、F67A/E111T、F67A/L157I、F67D、F67D/E111T、F67M、F67M/R87S、F67M/R87S/L157A、F67M/R87S/L157I、F67M/E106R/L157A、F67M/E111T/I315V、F67M/L157A、F67M/L157A/I315V、F67N、F67N/R87S、F67N/R87S/I315V、F67N/E106R、F67N/E106R/E111T、R87S、R87S/E106R、R87S/E106R/E111T/I315V、R87S/E111T/L157A/I315V、R87S/E111T/L157I/I315V、R87S/L157A、R87S/L157I、R87S/L157I/I315V、R87S/I315V、E106R、E106R/E111T/L157I、E106R/I315V、L157A、L157I、L157I/I315V和I315V
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:59/62/63/68、59/62/63/68/103/234、59/62/63/68/147、60/62/68/91/111/234/289、62/63/68、62/63/68/91/109/210、62/63/68/91/147/205/210/234、62/68/91/111/289、62/68/103、62/68/111、91、91/109/111、91/109/147/205/210/234、109/111/205/210/234/289、111和147/210/234。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:59A/62N/63G/68C、59A/62N/63G/68C/103R/234G、59A/62N/63G/68C/147Y、60V/62N/68C/91L/111Y/234G/289P、62N/63G/68C、62N/63G/68C/91L/109L/210L、62N/63G/68C/91L/147Y/205G/210L/234G、62N/68C/91L/111Y/289P、62N/68C/103R、62N/68C/111Y、91L、91L/109L/111Y、91L/109L/147Y/205G/210L/234G、109L/111Y/205G/210L/234G/289P、111Y和147Y/210L/234G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:580具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:580相比选自以下的一个或更多个残基差异或残基差异集:Y59A/K62N/E63G/R68C、Y59A/K62N/E63G/R68C/D103R/K234G、Y59A/K62N/E63G/R68C/F147Y、E60V/K62N/R68C/I91L/E111Y/K234G/Y289P、K62N/E63G/R68C、K62N/E63G/R68C/I91L/I109L/I210L、K62N/E63G/R68C/I91L/F147Y/D205G/I210L/K234G、K62N/R68C/I91L/E111Y/Y289P、K62N/R68C/D103R、K62N/R68C/E111Y、I91L、I91L/I109L/E111Y、I91L/I109L/F147Y/D205G/I210L/K234G、I109L/E111Y/D205G/I210L/K234G/Y289P、E111Y和F147Y/I210L/K234G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:692具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:692相比选自以下的一个或更多个残基差异或残基差异集:52/55/106/256、52/55/181/235/256、52/55/181/256、52/99/181/235、52/106/181/235/256、52/106/235/256、52/106/256、52/173/235、52/235、52/235/256、55/99/181/256、55/99/256/350、55/181/235/256/350、55/256、99/235、106、173和235。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:692具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:692相比选自以下的一个或更多个残基差异或残基差异集:52L/55L/106R/256G、52L/55L/181R/235Q/256E、52L/55L/181R/256G、52L/99P/181R/235Q、52L/106R/181R/235Q/256G、52L/106R/235Q/256G、52L/106R/256E、52L/173L/235Q、52L/235Q、52L/235Q/256E、55L/99P/181R/256G、55L/99P/256G/350V、55L/181R/235Q/256E/350V、55L/256G、99P/235Q、106R、173L和235Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:692具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:692相比选自以下的一个或更多个残基差异或残基差异集:F52L/M55L/E106R/C256G、F52L/M55L/S181R/E235Q/C256E、F52L/M55L/S181R/C256G、F52L/D99P/S181R/E235Q、F52L/E106R/S181R/E235Q/C256G、F52L/E106R/E235Q/C256G、F52L/E106R/C256E、F52L/F173L/E235Q、F52L/E235Q、F52L/E235Q/C256E、M55L/D99P/S181R/C256G、M55L/D99P/C256G/H350V、M55L/S181R/E235Q/C256E/H350V、M55L/C256G、D99P/E235Q、E106R、F173L和E235Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:20/21/52/67/68/87/111/157/160/173/180/200/235/246/315、20/21/55/67/68/87/111/157/160/180/181/200/235/246/256/315/350、20/21/55/67/68/87/111/157/160/180/200/246/256/315、20/21/60/72/160/180/200/246/259/338/358、20/21/67/68/87/111/157/160/180/200/235/246/315、20/21/67/68/87/111/157/160/180/200/246/315和20/21/68/160/180/200/246。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:20G/21G/52L/67A/68R/87S/111T/157A/160S/173L/180A/200R/235Q/246G/315V、20G/21G/55L/67A/68R/87S/111T/157A/160S/180A/181R/200R/235Q/246G/256E/315V/350V、20G/21G/55L/67A/68R/87S/111T/157A/160S/180A/200R/246G/256G/315V、20G/21G/60K/72K/160S/180A/200R/246G/259K/338K/358R、20G/21G/67A/68R/87S/111T/157A/160S/180A/200R/235Q/246G/315V、20G/21G/67A/68R/87S/111T/157A/160S/180A/200R/246G/315V和20G/21G/68R/160S/180A/200R/246G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4相比选自以下的一个或更多个残基差异或残基差异集:L20G/E21G/F52L/F67A/C68R/R87S/E111T/L157A/D160S/F173L/V180A/S200R/E235Q/L246G/I315、L20G/E21G/M55L/F67A/C68R/R87S/E111T/L157A/D160S/V180A/S181R/S200R/E235Q/L246G/C256E/I315V/H350V、L20G/E21G/M55L/F67A/C68R/R87S/E111T/L157A/D160S/V180A/S200R/L246G/C256G/I315V、L20G/E21G/E60K/L72K/D160S/V180A/S200R/L246G/I259K/R338K/N358R、L20G/E21G/F67A/C68R/R87S/E111T/L157A/D160S/V180A/S200R/E235Q/L246G/I315V、L20G/E21G/F67A/C68R/R87S/E111T/L157A/D160S/V180A/S200R/L246G/I315V和L20G/E21G/C68R/D160S/V180A/S200R/L246G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:63、68、72、211、220、275、349和350。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:63G、68M、72R、211C、220R、275R、349E、349M、349R、350E和350Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:E63G、C68M、K72R、T211C、M220R、A275R、S349E、S349M、S349R、H350E和H350Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:20/21、20/21/67、20/21/67/87、20/21/67/87/111、20/21/67/87/111/200、20/21/67/87/111/315、20/21/67/87/157/180、20/21/67/87/246/315、20/21/67/160、20/21/87/111/246/315、20/21/87/157/200、20/21/87/180/246/315、20/21/87/315、20/21/111/157/315、20/21/111/246、20/21/315、20/67/87/111/180、20/67/87/157/160/180/315、20/68/111/157/160、20/68/160/200/246、20/87/111/180、20/87/157/160、20/160/315、20/200、21、21/67/87/111/200、21/67/87/157/246、21/67/180/315、21/67/200、21/87/157/160、21/87/160/200/315、21/87/160/315、21/87/200、21/87/246/315、21/111、21/157/160、21/160/315、21/200/315、21/246、67、67/87、67/87/111/157/160/315、67/111、67/157/160/180、67/157/160/315、67/160、67/180/200、67/180/200/315、67/315、68/87、68/157/160/200/315、87、87/111、87/111/200、87/111/200/246、87/157、87/157/180/200、111/157/180/200/315、157、157/160、246和315。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:20L/21E、20L/21E/67A、20L/21E/67A/87S、20L/21E/67A/87S/111T、20L/21E/67A/87S/111T/200S、20L/21E/67A/87S/111T/315V、20L/21E/67A/87S/157A/180V、20L/21E/67A/87S/246L/315V、20L/21E/67A/160D、20L/21E/87S/111T/246L/315V、20L/21E/87S/157A/200S、20L/21E/87S/180V/246L/315V、20L/21E/87S/315V、20L/21E/111T/157A/315V、20L/21E/111T/246L、20L/21E/315V、20L/67A/87S/111T/180V、20L/67A/87S/157A/160D/180V/315V、20L/68R/111T/157A/160D、20L/68R/160D/200S/246L、20L/87S/111T/180V、20L/87S/157A/160D、20L/160D/315V、20L/200S、21E、21E/67A/87S/111T/200S、21E/67A/87S/157A/246L、21E/67A/180V/315V、21E/67A/200S、21E/87S/157A/160D、21E/87S/160D/200S/315V、21E/87S/160D/315V、21E/87S/200S、21E/87S/246L/315V、21E/111T、21E/157A/160D、21E/160D/315V、21E/200S/315V、21E/246L、67A、67A/87S、67A/87S/111T/157A/160D/315V、67A/111T、67A/157A/160D/180V、67A/157A/160D/315V、67A/160D、67A/180V/200S、67A/180V/200S/315V、67A/315V、68R/87S、68R/157A/160D/200S/315V、87S、87S/111T、87S/111T/200S、87S/111T/200S/246L、87S/157A、87S/157A/180V/200S、111T/157A/180V/200S/315V、157A、157A/160D、246L和315V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:882具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:882相比选自以下的一个或更多个残基差异或残基差异集:G20L/G21E、G20L/G21E/F67A、G20L/G21E/F67A/R87S、G20L/G21E/F67A/R87S/E111T、G20L/G21E/F67A/R87S/E111T/R200S、G20L/G21E/F67A/R87S/E111T/I315V、G20L/G21E/F67A/R87S/L157A/A180V、G20L/G21E/F67A/R87S/G246L/I315V、G20L/G21E/F67A/S160D、G20L/G21E/R87S/E111T/G246L/I315V、G20L/G21E/R87S/L157A/R200S、G20L/G21E/R87S/A180V/G246L/I315V、G20L/G21E/R87S/I315V、G20L/G21E/E111T/L157A/I315V、G20L/G21E/E111T/G246L、G20L/G21E/I315V、G20L/F67A/R87S/E111T/A180V、G20L/F67A/R87S/L157A/S160D/A180V/I315V、G20L/C68R/E111T/L157A/S160D、G20L/C68R/S160D/R200S/G246L、G20L/R87S/E111T/A180V、G20L/R87S/L157A/S160D、G20L/S160D/I315V、G20L/R200S、G21E、G21E/F67A/R87S/E111T/R200S、G21E/F67A/R87S/L157A/G246L、G21E/F67A/A180V/I315V、G21E/F67A/R200S、G21E/R87S/L157A/S160D、G21E/R87S/S160D/R200S/I315V、G21E/R87S/S160D/I315V、G21E/R87S/R200S、G21E/R87S/G246L/I315V、G21E/E111T、G21E/L157A/S160D、G21E/S160D/I315V、G21E/R200S/I315V、G21E/G246L、F67A、F67A/R87S、F67A/R87S/E111T/L157A/S160D/I315V、F67A/E111T、F67A/L157A/S160D/A180V、F67A/L157A/S160D/I315V、F67A/S160D、F67A/A180V/R200S、F67A/A180V/R200S/I315V、F67A/I315V、C68R/R87S、C68R/L157A/S160D/R200S/I315V、R87S、R87S/E111T、R87S/E111T/R200S、R87S/E111T/R200S/G246L、R87S/L157A、R87S/L157A/A180V/R200S、E111T/L157A/A180V/R200S/I315V、L157A、L157A/S160D、G246L和I315V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:914具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:914相比选自以下的一个或更多个残基差异或残基差异集:52、52/180、52/180/200/235/315/349、52/180/200/349、52/180/349、52/200、52/200/315、52/200/349、52/200/349/350、52/315、52/315/349、52/349、52/349/350、180和349。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:914具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:914相比选自以下的一个或更多个残基差异或残基差异集:52L、52L/180V、52L/180V/200S/235Q/315V/349E、52L/180V/200S/349E、52L/180V/349E、52L/200S、52L/200S/315V、52L/200S/349E、52L/200S/349E/350E、52L/315V、52L/315V/349E、52L/349E、52L/349E/350E、180V和349E。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:914具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:914相比选自以下的一个或更多个残基差异或残基差异集:F52L、F52L/A180V、F52L/A180V/R200S/E235Q/I315V/S349E、F52L/A180V/R200S/S349E、F52L/A180V/S349E、F52L/R200S、F52L/R200S/I315V、F52L/R200S/S349E、F52L/R200S/S349E/H350E、F52L/I315V、F52L/I315V/S349E、F52L/S349E、F52L/S349E/H350E、A180V和S349E。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:53/219/358、55、55/99/103、55/99/219/358/373、55/103/181、55/103/219、55/103/338、55/181/219、55/181/246、55/181/358、55/219/246/358、55/219/256/338、55/256/259、99/103/219、103/219/256、103/219/338/358、103/256、103/259、106/173/200/235/315、106/173/388、111/173、111/173/235/315、173、173/297、181、219、219/358、256、256/259和358。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:53Q/219P/358N、55L、55L/99P/103A、55L/99P/219P/358N/373D、55L/103A/181R、55L/103A/219P、55L/103A/338R、55L/181R/219P、55L/181R/246G、55L/181R/358N、55L/219P/246G/358N、55L/219P/256G/338R、55L/256G/259I、99P/103A/219P、103A/219P/256E、103A/219P/338R/358N、103A/256G、103A/259I、106R/173L/200S/235Q/315V、106R/173L/388Q、111T/173L、111T/173L/235Q/315V、173L、173L/297A、181R、219P、219P/358N、256E、256G、256G/259I和358N。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:E53Q/K219P/R358N、M55L、M55L/D99P/D103A、M55L/D99P/K219P/R358N/G373D、M55L/D103A/S181R、M55L/D103A/K219P、M55L/D103A/K338R、M55L/S181R/K219P、M55L/S181R/L246G、M55L/S181R/R358N、M55L/K219P/L246G/R358N、M55L/K219P/C256G/K338R、M55L/C256G/K259I、D99P/D103A/K219P、D103A/K219P/C256E、D103A/K219P/K338R/R358N、D103A/C256G、D103A/K259I、E106R/F173L/R200S/E235Q/I315V、E106R/F173L/E388Q、E111T/F173L、E111T/F173L/E235Q/I315V、F173L、F173L/S297A、S181R、K219P、K219P/R358N、C256E、C256G、C256G/K259I和R358N。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:48、52、53/219/358、55、55/99/219/358/373、55/181/358、55/219/246/358、55/256、56、58、62、65、66、70、71、74、77、78、79、103/219/338/358、219、219/358、328、345、350、353、355和358。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:1034相比选自以下的一个或更多个残基差异或残基差异集:48T、52A、53Q/219P/358N、55L、55L/99P/219P/358N/373D、55L/181R/358N、55L/219P/246G/358N、55L/256E、56V、58D、62G、65L、66P、66S、70V、71A、74G、77I、77V、78F、79R、103A/219P/338R/358N、219L、219P/358N、219V、328F、345V、350T、353S、355V和358N。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:F48T、L52A、E53Q/K219P/R358N、M55L、M55L/D99P/K219P/R358N/G373D、M55L/S181R/R358N、M55L/K219P/L246G/R358N、M55L/C256E、A56V、N58D、K62G、E65L、I66P、I66S、E70V、F71A、A74G、L77I、L77V、L78F、K79R、D103A/K219P/K338R/R358N、K219L、K219P/R358N、K219V、A328F、R345V、E350T、K353S、I355V和R358N。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:47、48、51、52、54、55、57、58、59、61、62、63、64、65、66、69、70、71、73、74、77、79、131、133、134、219、319、321、322、325、328、332、345、350、351、352、353和355。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:47Q、48I、48Y、51L、51S、52A、54N、54V、55R、57C、58C、58D、58M、58S、59W、61T、62G、62R、62W、63D、64Q、64R、65L、66P、66R、66S、69I、70A、70H、70I、70V、71A、71S、73G、74G、77I、77V、79R、131V、133Y、134M、134V、219L、219V、319F、321V、322S、325S、328F、328P、328S、328W、332C、345A、345Q、345V、350S、351Q、352A、352S、353G、353M、353Q、355A、355L和355V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1034具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1034相比选自以下的一个或更多个残基差异或残基差异集:K47Q、F48I、F48Y、A51L、A51S、L52A、I54N、I54V、M55R、E57C、N58C、N58D、N58M、N58S、Y59W、F61T、K62G、K62R、K62W、E63D、N64Q、N64R、E65L、I66P、I66R、I66S、L69I、E70A、E70H、E70I、E70V、F71A、F71S、R73G、A74G、L77I、L77V、K79R、Q131V、T133Y、S134M、S134V、K219L、K219V、L319F、I321V、T322S、E325S、A328F、A328P、A328S、A328W、L332C、R345A、R345Q、R345V、E350S、E351Q、R352A、R352S、K353G、K353M、K353Q、I355A、I355L和I355V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23、32、36、40、49、93、98、107、117、124、165、182、186、269、288、309、374、377和386。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23L、32H、36H、40S、49S、93Q、93W、98P、107G、107S、117I、124P、165M、182G、186D、186R、269R、288H、309K、374E、374G、377N和386V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:P23L、Q32H、Q36H、T40S、T49S、G93Q、G93W、G98P、E107G、E107S、V117I、E124P、L165M、C182G、A186D、A186R、P269R、L288H、V309K、S374E、S374G、E377N和Y386V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23、40、49、107、112、120、186、271、309、374和377。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23L、40S、49S、107G、107S、112T、120T、186D、271Q、309K、374E和377N。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:P23L、T40S、T49S、E107G、E107S、G112T、V120T、A186D、R271Q、V309K、S374E和E377N。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23、182、186、269、270、293、360、372和378。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:23V、182A、182R、186E、269A、270T、293G、360A、372G和378C。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1270具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1270相比选自以下的一个或更多个残基差异或残基差异集:P23V、C182A、C182R、A186E、P269A、S270T、V293G、G360A、A372G和I378C。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:55/58/256/350/373、58、58/69/256/373、58/99/351/355、58/256、70/71、70/71/353、70/134/353、70/353、71/77/353、71/353、77、77/134/353、77/353、99/256/351/355、134/353、256、350和353。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:55R/58D/256E/350S/373D、58D、58S/69I/256E/373D、58S/99V/351Q/355A、58S/256E、70V/71A、70V/71A/353G、70V/134M/353G、70V/353M、71A/77I/353G、71A/353G、77I、77I/134V/353G、77I/353M、99V/256E/351Q/355A、134V/353G、256E、350S、353G和353M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:M55R/N58D/C256E/E350S/G373D、N58D、N58S/L69I/C256E/G373D、N58S/D99V/E351Q/I355A、N58S/C256E、E70V/F71A、E70V/F71A/K353G、E70V/S134M/K353G、E70V/K353M、F71A/L77I/K353G、F71A/K353G、L77I、L77I/S134V/K353G、L77I/K353M、D99V/C256E/E351Q/I355A、S134V/K353G、C256E、E350S、K353G和K353M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:55/58、55/58/69/350/351、55/58/99/256/351/373、55/58/99/256/355、55/58/99/351、55/58/256、55/58/256/355、55/58/350/351、58/99、58/99/355、58/256/350/355、58/350/355、70、70/353、71/77/133/353、71/353、77/133/353、77/353、133、353和355/373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:55R/58M、55R/58M/69I/350S/351Q、55R/58M/256E、55R/58S/99V/256E/351Q/373D、55R/58S/99V/256E/355A、55R/58S/99V/351Q、55R/58S/256E/355A、55R/58S/350S/351Q、58D/99V/355V、58M/256E/350S/355V、58S/99V、58S/350S/355V、70L、70V/353G、71A/77I/133Y/353M、71A/353G、77I/133Y/353G、77I/133Y/353M、77I/353G、133Y、353G、353M和355V/373D。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:M55R/N58M、M55R/N58M/L69I/E350S/E351Q、M55R/N58M/C256E、M55R/N58S/D99V/C256E/E351Q/G373D、M55R/N58S/D99V/C256E/I355A、M55R/N58S/D99V/E351Q、M55R/N58S/C256E/I355A、M55R/N58S/E350S/E351Q、N58D/D99V/I355V、N58M/C256E/E350S/I355V、N58S/D99V、N58S/E350S/I355V、E70L、E70V/K353G、F71A/L77I/T133Y/K353M、F71A/K353G、L77I/T133Y/K353G、L77I/T133Y/K353M、L77I/K353G、T133Y、K353G、K353M和I355V/G373D。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:8、9、14、15、16、28、29、42、89、100、116、125、190、197、201、233、237、289、298、302、364、368和380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:1344相比选自以下的一个或更多个残基差异或残基差异集:8S、9D、14E、14G、15E、16G、28G、29R、42V、89G、89Y、100E、116L、125K、190V、197G、201G、233R、237A、237G、289G、298D、302A、302G、364F、364W、368S和380G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:G8S、G9D、P14E、P14G、S15E、N16G、R28G、K29R、N42V、K89G、K89Y、Q100E、R116L、R125K、A190V、N197G、T201G、P233R、D237A、D237G、Y289G、Y298D、K302A、K302G、R364F、R364W、I368S和A380G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:9、14、28、86、89、91、92、104、116、125、196、197、198、201、230、234、248、266、272、278、298、304、307、308、341、364、365和380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:9E、14I、28I、28S、86Q、89D、91C、91V、92A、92F、92V、104I、116T、125A、125F、196C、196F、196R、197R、198C、201L、230D、230I、234Q、248L、248W、266Q、272G、278S、298V、304V、307L、308D、341E、341T、364L、364N、365G、380G和380M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1344具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1344相比选自以下的一个或更多个残基差异或残基差异集:G9E、P14I、R28I、R28S、T86Q、K89D、I91C、I91V、Q92A、Q92F、Q92V、V104I、R116T、R125A、R125F、K196C、K196F、K196R、N197R、T198C、T201L、N230D、N230I、K234Q、K248L、K248W、E266Q、K272G、N278S、Y298V、S304V、A307L、E308D、G341E、G341T、R364L、R364N、K365G、A380G和A380M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:27、28、29、84、92、98、110、143、147、158、162、170、173、174、181、185、193、197、204、204/264/340、290、297和303。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:27L、28E、28G、29C、29P、84E、92E、98A、98T、110L、143A、147Y、158R、162A、170R、173L、174M、181R、185R、193R、193S、193V、197E、204E/264L/340L、204F、204I、204L、204M、204R、290R、290V、297A、303G和303T。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:A27L、R28E、R28G、K29C、K29P、P84E、Q92E、G98A、G98T、E110L、S143A、F147Y、K158R、S162A、K170R、F173L、L174M、S181R、K185R、L193R、L193S、L193V、N197E、P204E/V264L/F340L、P204F、P204I、P204L、P204M、P204R、Q290R、Q290V、S297A、K303G和K303T。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:38、44、57/367、66、92、101、102、111、143、147、154、156、158、160、167、173、184、185、196、197、224、233、248、324和352。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:38R、44H、57D/367K、66G、92E、101S、102K、111D、143A、147Y、154L、156D、158R、160E、167R、173L、184T、185R、196E、197E、224V、233E、248E、324I和352K。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:K38R、Y44H、E57D/R367K、I66G、Q92E、V101S、R102K、E111D、S143A、F147Y、V154L、E156D、K158R、S160E、K167R、F173L、S184T、K185R、K196E、N197E、I224V、P233E、K248E、F324I和R352K。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:23/186/256/309、58/186/270、182/186/256/360、182/256、186/256、186/256/270、256和270/309。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:1346相比选自以下的一个或更多个残基差异或残基差异集:23V/186E/256E/309K、58S/186E/270T、182R/186E/256E/360A、182R/256E、186E/256E、186E/256E/270T、256E和270T/309K。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1346具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1346相比选自以下的一个或更多个残基差异或残基差异集:P23V/A186E/C256E/V309K、N58S/A186E/S270T、C182R/A186E/C256E/G360A、C182R/C256E、A186E/C256E、A186E/C256E/S270T、C256E和S270T/V309K。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1678相比选自以下的一个或更多个残基差异或残基差异集:341。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:1678相比选自以下的一个或更多个残基差异或残基差异集:341C、341H、341I、341K、341L、341M、341R、341T和341V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1678相比选自以下的一个或更多个残基差异或残基差异集:G341C、G341H、G341I、G341K、G341L、G341M、G341R、G341T和G341V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1678相比选自以下的一个或更多个残基差异或残基差异集:9/14/58、9/14/58/182/190/197/298、9/14/190/197/364、9/58/197、9/298、10/14/197/364、14/58/182/197/298/364、14/190/197/298、14/197/298/364、14/298/364、58/197、58/197/364、58/364、182、182/197、182/298/364、197/298和298。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1678相比选自以下的一个或更多个残基差异或残基差异集:9D/14I/58S、9D/298V、9E/14I/58S/182C/190V/197G/298V、9E/14I/190V/197G/364L、9E/58S/197G、10I/14I/197G/364L、14I/58S/182C/197G/298V/364L、14I/190V/197G/298V、14I/197G/298V/364L、14I/298V/364F、58S/197G、58S/197G/364L、58S/364L、182C、182C/197G、182C/298V/364L、197G/298V和298V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1678具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1678相比选自以下的一个或更多个残基差异或残基差异集:G9D/P14I/N58S、G9D/Y298V、G9E/P14I/N58S/R182C/A190V/N197G/Y298V、G9E/P14I/A190V/N197G/R364L、G9E/N58S/N197G、S10I/P14I/N197G/R364L、P14I/N58S/R182C/N197G/Y298V/R364L、P14I/A190V/N197G/Y298V、P14I/N197G/Y298V/R364L、P14I/Y298V/R364F、N58S/N197G、N58S/N197G/R364L、N58S/R364L、R182C、R182C/N197G、R182C/Y298V/R364L、N197G/Y298V和Y298V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:18/28/147/303、28、28/84、28/84/92/147/204、28/84/147/204、28/84/156/173/204/290/303、28/84/173/204/303、28/84/173/303、28/84/303、28/92/147、28/92/147/204/290/303、28/92/156/204/290、28/92/204、28/147/303、28/156/204、28/204、28/290、28/303、29、29/98/143/266、29/98/185/197/266、29/98/185/266/296/299、29/143、29/143/162、29/143/170/193/197/266、29/143/185/193/266、29/158/266、29/170/185/193/266/299、29/185/296、29/193/197/296/297、72、84、84/92/173、84/156/173/204、84/173/204/303、92/173/204/290/303、98、98/143/158/170/185/296/297、98/143/162/266、98/143/185/266、98/162/193、98/170/193/197、98/185、98/185/193/197/266/297、143、143/158/197/266、143/266/296/297、147/290/303/307、170/193/197、173、173/204、173/204/303、182、204、266/297/299和303。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:18Q/28G/147Y/303G、28E/84E、28E/84E/92E/147Y/204R、28E/84E/156D/173L/204M/290R/303G、28E/84E/173L/303G、28E/92E/147Y、28E/290R、28G、28G/84E/147Y/204L、28G/84E/173L/204R/303T、28G/84E/303G、28G/92E/147Y/204I/290R/303G、28G/92E/156D/204L/290R、28G/92E/204R、28G/147Y/303G、28G/156D/204I、28G/204R、28G/303G、29P、29P/98A/185R/197E/266G、29P/98T/143A/266G、29P/98T/185R/266G/296N/299G、29P/143A、29P/143A/162A、29P/143A/170R/193S/197E/266G、29P/143A/185R/193S/266G、29P/158R/266G、29P/170R/185R/193S/266G/299G、29P/185R/296N、29P/193V/197E/296N/297A、72R、84E、84E/92E/173L、84E/156D/173L/204F、84E/173L/204F/303T、92E/173L/204F/290V/303G、98A/185R、98A/185R/193S/197E/266G/297A、98T、98T/143A/158R/170R/185R/296N/297A、98T/143A/162A/266G、98T/143A/185R/266G、98T/162A/193V、98T/170R/193S/197E、143A、143A/158R/197E/266G、143A/266G/296N/297A、147Y/290R/303T/307V、170R/193S/197E、173L、173L/204F/303G、173L/204R、182G、204R、266G/297A/299G和303G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:P18Q/R28G/F147Y/K303G、R28E/P84E、R28E/P84E/Q92E/F147Y/P204R、R28E/P84E/E156D/F173L/P204M/Q290R/K303G、R28E/P84E/F173L/K303G、R28E/Q92E/F147Y、R28E/Q290R、R28G、R28G/P84E/F147Y/P204L、R28G/P84E/F173L/P204R/K303T、R28G/P84E/K303G、R28G/Q92E/F147Y/P204I/Q290R/K303G、R28G/Q92E/E156D/P204L/Q290R、R28G/Q92E/P204R、R28G/F147Y/K303G、R28G/E156D/P204I、R28G/P204R、R28G/K303G、K29P、K29P/G98A/K185R/N197E/E266G、K29P/G98T/S143A/E266G、K29P/G98T/K185R/E266G/S296N/N299G、K29P/S143A、K29P/S143A/S162A、K29P/S143A/K170R/L193S/N197E/E266G、K29P/S143A/K185R/L193S/E266G、K29P/K158R/E266G、K29P/K170R/K185R/L193S/E266G/N299G、K29P/K185R/S296N、K29P/L193V/N197E/S296N/S297A、K72R、P84E、P84E/Q92E/F173L、P84E/E156D/F173L/P204F、P84E/F173L/P204F/K303T、Q92E/F173L/P204F/Q290V/K303G、G98A/K185R、G98A/K185R/L193S/N197E/E266G/S297A、G98T、G98T/S143A/K158R/K170R/K185R/S296N/S297A、G98T/S143A/S162A/E266G、G98T/S143A/K185R/E266G、G98T/S162A/L193V、G98T/K170R/L193S/N197E、S143A、S143A/K158R/N197E/E266G、S143A/E266G/S296N/S297A、F147Y/Q290R/K303T/A307V、K170R/L193S/N197E、F173L、F173L/P204F/K303G、F173L/P204R、R182G、P204R、E266G/S297A/N299G和K303G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:29、60、72、84、147、182、211、220、224、266、290、338、339、342和345。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:29P、60T、72E、72G、72Q、72S、72W、84E、147Y、182A、182F、182G、182N、182Q、182S、182W、182Y、211A、211V、220L、220S、220V、220Y、224A、224C、224T、224V、266G、290R、338A、338G、339C、342A、345I和345K。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1700具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1700相比选自以下的一个或更多个残基差异或残基差异集:K29P、K60T、K72E、K72G、K72Q、K72S、K72W、P84E、F147Y、R182A、R182F、R182G、R182N、R182Q、R182S、R182W、R182Y、T211A、T211V、M220L、M220S、M220V、M220Y、I224A、I224C、I224T、I224V、E266G、Q290R、K338A、K338G、E339C、R342A、R345I和R345K。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:9、9/28/156/158/173/190/193/303/364、9/28/156/158/290/364、9/28/190/193/303/364、9/28/290/303/364、9/156/158/193/290/303/364、9/156/364、9/290/364、9/364、14、14/58/84/147/162/224/296/297/298/299、14/58/84/147/162/224/296/297/299、14/58/84/224/298、14/84/147/193/197/224/296、14/84/162/224/297/299、14/84/224/296/299、14/162/224/298/299、14/224/296/298、23/28/156/158/190/193/290/364、28/156/173/364、28/158/173/190/193/290/364、28/190/193、28/296/303/364、28/364、58/147/162/197/224/296/297/298/299、58/162/224/296/298、58/224、58/224/299、84/147、147/224、147/224/297/298、156/158/190/193/364、158/193/290/303、193/290、224/296/298、224/297/299、290/303/364、303和364。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:9D、9D/28E/156D/158R/290R/364L、9D/28E/190V/193S/303G/364L、9D/28E/290R/303G/364L、9D/28G/156D/158R/173L/190V/193S/303G/364L、9D/156D/158R/193V/290R/303G/364L、9D/156D/364L、9D/290R/364L、9D/364L、14I、14I/58S/84E/147Y/162A/224V/296N/297A/298V/299G、14I/58S/84E/147Y/162A/224V/296N/297A/299G、14I/58S/84E/224V/298V、14I/84E/147Y/193S/197E/224V/296N、14I/84E/162A/224V/297A/299G、14I/84E/224V/296N/299G、14I/162A/224V/298V/299G、14I/224V/296N/298V、23S/28E/156D/158R/190V/193S/290R/364L、28E/156D/173L/364L、28G/156D/173L/364L、28G/158R/173L/190V/193V/290R/364L、28G/190V/193V、28G/296G/303G/364L、28G/364L、58S/147Y/162A/197E/224V/296N/297A/298V/299G、58S/162A/224V/296N/298V、58S/224V、58S/224V/299G、84E/147Y、147Y/224V、147Y/224V/297A/298V、156D/158R/190V/193V/364L、158R/193V/290R/303G、193V/290R、224V/296N/298V、224V/297A/299G、290R/303G/364L、303T和364L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:G9D、G9D/R28E/E156D/K158R/Q290R/R364L、G9D/R28E/A190V/L193S/K303G/R364L、G9D/R28E/Q290R/K303G/R364L、G9D/R28G/E156D/K158R/F173L/A190V/L193S/K303G/R364L、G9D/E156D/K158R/L193V/Q290R/K303G/R364L、G9D/E156D/R364L、G9D/Q290R/R364L、G9D/R364L、P14I、P14I/N58S/P84E/F147Y/S162A/I224V/S296N/S297A/Y298V/N299G、P14I/N58S/P84E/F147Y/S162A/I224V/S296N/S297A/N299G、P14I/N58S/P84E/I224V/Y298V、P14I/P84E/F147Y/L193S/N197E/I224V/S296N、P14I/P84E/S162A/I224V/S297A/N299G、P14I/P84E/I224V/S296N/N299G、P14I/S162A/I224V/Y298V/N299G、P14I/I224V/S296N/Y298V、P23S/R28E/E156D/K158R/A190V/L193S/Q290R/R364L、R28E/E156D/F173L/R364L、R28G/E156D/F173L/R364L、R28G/K158R/F173L/A190V/L193V/Q290R/R364L、R28G/A190V/L193V、R28G/S296G/K303G/R364L、R28G/R364L、N58S/F147Y/S162A/N197E/I224V/S296N/S297A/Y298V/N299G、N58S/S162A/I224V/S296N/Y298V、N58S/I224V、N58S/I224V/N299G、P84E/F147Y、F147Y/I224V、F147Y/I224V/S297A/Y298V、E156D/K158R/A190V/L193V/R364L、K158R/L193V/Q290R/K303G、L193V/Q290R、I224V/S296N/Y298V、I224V/S297A/N299G、Q290R/K303G/R364L、K303T和R364L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:34、48、69、78、237/271、249、302、309、315、353、364和365。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:34A、48L、69I、78F、237A/271H、249T、302G、309K、315V、353Q、364F、364L和365G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1750具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1750相比选自以下的一个或更多个残基差异或残基差异集:S34A、F48L、L69I、L78F、D237A/R271H、K249T、K302G、V309K、I315V、G353Q、R364F、R364L和K365G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:12、14、14/28/58/84/173/297、14/28/58/162/190/193/224、14/28/58/224、14/28/224/296/298、14/58/147/162/190/193/224/296/303、14/58/158/224、14/58/162、14/147、14/147/158/162/224、14/147/173、14/147/224、14/158/162/197/224/296/298/299、14/173/193/197/296/297/298/299、14/193/197/224/297/298/299/300、14/224/296/303、28、28/58/84/158/162/193/224/296/298/299、28/58/147/224/296/297/298/299/303、28/58/162/224/298/299、28/84、28/84/147/297/298、28/224/296/297/298/303、28/296/298、58/72/211/315、58/72/220/224、58/84/211/220/224、58/147/162/296/298、66/220/224、72、72/84/86/224、72/84/220/224/315、72/86/220、72/220/224、72/220/315、75、77、84/147/197/296/297、84/147/297/298/303、84/173/224、84/220/315、84/224/297/298/299、100、104、120、147、147/158/162/190/224/296/297/299/303、162/224、173、190/193/197、193/197/296/303、197、220/224/315、220/315、224、224/298/299、233、292、297、315、353和367。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:12L、14I、14I/28G/58S/84E/173L/297A、14I/28G/58S/162A/190V/193V/224V、14I/28G/58S/224V、14I/28G/224V/296N/298V、14I/58S/147Y/162A/190V/193V/224V/296N/303G、14I/58S/158R/224V、14I/58S/162A、14I/147Y、14I/147Y/158R/162A/224V、14I/147Y/173L、14I/147Y/224V、14I/158R/162A/197E/224V/296N/298V/299G、14I/173L/193V/197E/296N/297A/298V/299G、14I/193V/197E/224V/297R/298W/299-/300A、14I/224V/296N/303G、28E/58S/84E/158R/162A/193V/224V/296N/298V/299G、28E/58S/147Y/224V/296N/297A/298V/299G/303G、28E/58S/162A/224V/298V/299G、28G、28G/84E、28G/84E/147Y/297A/298V、28G/224V/296N/297A/298V/303G、28G/296N/298V、58D/72Q/211A/315V、58D/72Q/220V/224V、58D/84E/211A/220V/224V、58S/147Y/162A/296N/298V、66P/220V/224V、72G/84E/86Q/224V、72G/84E/220V/224V/315V、72Q、72Q/86Q/220V、72Q/220V/224V、72Q/220V/315V、75V、77L、77V、84E/147Y/197E/296N/297A、84E/147Y/297A/298V/303G、84E/173L/224V、84E/220V/315V、84E/224V/297A/298V/299G、100D、104L、120I、147Y、147Y/158R/162A/190V/224V/296N/297A/299G/303G、162A/224V、173L、190V/193V/197E、193V/197E/296N/303G、197E、220V/224V/315V、220V/315V、224V、224V/298V/299G、233G、233R、292K、297A、315V、353D和367K。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:H12L、P14I、P14I/R28G/N58S/P84E/F173L/S297A、P14I/R28G/N58S/S162A/A190V/L193V/I224V、P14I/R28G/N58S/I224V、P14I/R28G/I224V/S296N/Y298V、P14I/N58S/F147Y/S162A/A190V/L193V/I224V/S296N/K303G、P14I/N58S/K158R/I224V、P14I/N58S/S162A、P14I/F147Y、P14I/F147Y/K158R/S162A/I224V、P14I/F147Y/F173L、P14I/F147Y/I224V、P14I/K158R/S162A/N197E/I224V/S296N/Y298V/N299G、P14I/F173L/L193V/N197E/S296N/S297A/Y298V/N299G、P14I/L193V/N197E/I224V/S297R/Y298W/N299-/T300A、P14I/I224V/S296N/K303G、R28E/N58S/P84E/K158R/S162A/L193V/I224V/S296N/Y298V/N299G、R28E/N58S/F147Y/I224V/S296N/S297A/Y298V/N299G/K303G、R28E/N58S/S162A/I224V/Y298V/N299G、R28G、R28G/P84E、R28G/P84E/F147Y/S297A/Y298V、R28G/I224V/S296N/S297A/Y298V/K303G、R28G/S296N/Y298V、N58D/K72Q/T211A/I315V、N58D/K72Q/M220V/I224V、N58D/P84E/T211A/M220V/I224V、N58S/F147Y/S162A/S296N/Y298V、I66P/M220V/I224V、K72G/P84E/T86Q/I224V、K72G/P84E/M220V/I224V/I315V、K72Q、K72Q/T86Q/M220V、K72Q/M220V/I224V、K72Q/M220V/I315V、A75V、I77L、I77V、P84E/F147Y/N197E/S296N/S297A、P84E/F147Y/S297A/Y298V/K303G、P84E/F173L/I224V、P84E/M220V/I315V、P84E/I224V/S297A/Y298V/N299G、Q100D、V104L、V120I、F147Y、F147Y/K158R/S162A/A190V/I224V/S296N/S297A/N299G/K303G、S162A/I224V、F173L、A190V/L193V/N197E、L193V/N197E/S296N/K303G、N197E、M220V/I224V/I315V、M220V/I315V、I224V、I224V/Y298V/N299G、P233G、P233R、G292K、S297A、I315V、G353D和R367K。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:12、75、77、100、104、120、197、233、292、353和367。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:12L、75V、77L、77V、100D、104L、120I、197E、233G、233R、292K、353D和367K。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:1932具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:1932相比选自以下的一个或更多个残基差异或残基差异集:H12L、A75V、I77L、I77V、Q100D、V104L、V120I、N197E、P233G、P233R、G292K、G353D和R367K。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:51、52、66和71。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:51V、52V、66E、66S和71M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:A51V、L52V、I66E、I66S和A71M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:9/11、20、52、74、78、80、96、101、108、111、116、145、147、173、200、203、206、232、235、242、249、264、267、288、293、304、306、308、324、326、328、350、352、361、368、374、378和380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:9D/11L、20E、20K、20L、20R、20V、52G、74L、78M、80S、96A、101C、108D、111F、111R、116L、116P、145C、145R、145V、147M、173R、200I、200L、203S、203V、206V、232M、235C、235F、235M、235R、235V、242R、249A、249G、264T、267S、288R、293D、293G、304G、304L、306P、308L、324V、326C、328W、350L、350T、352A、361W、368R、374D、378G和380S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:G9D/G11L、G20E、G20K、G20L、G20R、G20V、L52G、A74L、L78M、Y80S、C96A、V101C、I108D、E111F、E111R、R116L、R116P、K145C、K145R、K145V、F147M、F173R、R200I、R200L、L203S、L203V、A206V、G232M、E235C、E235F、E235M、E235R、E235V、K242R、K249A、K249G、V264T、Q267S、L288R、V293D、V293G、S304G、S304L、M306P、E308L、F324V、Q326C、A328W、E350L、E350T、R352A、L361W、I368R、S374D、I378G和A380S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97、168、259、273和276。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97L、168A、168Q、259Q、259V、273V和276L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:I97L、M168A、M168Q、K259Q、K259V、I273V和M276L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97、135、259、273、276和278。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97L、135I、259Q、259V、273V、276L和278A。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:2164相比选自以下的一个或更多个残基差异或残基差异集:I97L、V135I、K259Q、K259V、I273V、M276L和N278A。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97、135、166、273和278。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97L、135I、166T、273V和278A。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:I97L、V135I、S166T、I273V和N278A。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97、135、140、166、167、168、230、259、273、276和278。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:97F、97L、135I、140L、166N、167R、168Q、230H、259Q、259V、273V、276L、278A和278R。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:I97F、I97L、V135I、V140L、S166N、K167R、M168Q、N230H、K259Q、K259V、I273V、M276L、N278A和N278R。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:34、34/48/78/133/147/182、34/48/78/147/158、34/48/78/147/182/220/233/249/307/315/339、34/48/78/158/182/220/249/307、34/48/78/158/182/233/315/345、34/48/78/182/220/230/315、34/48/78/182/220/233、34/48/133/158/182/230/233/271/345、34/48/147、34/48/147/158/182/220/233/307、34/48/147/182/230/233/249/307、34/48/147/271、34/48/182/233/249、34/48/339、34/78、34/78/84/147/158/182/220、34/78/84/158/230、34/78/147/182/220/249、34/78/147/182/233/249/315、34/78/147/182/233/271/339、34/78/158、34/78/158/182/315/345、34/78/158/249、34/78/182/233/307、34/78/204/220/339、34/78/220/271、34/78/220/307/339、34/78/315、34/133/147/158/230/233/249、34/147、34/147/155/233/339、34/147/158、34/147/158/182/233、34/147/158/182/249/271、34/147/182、34/147/182/220、34/147/182/220/230/249/315/339、34/147/182/220/230/339、34/147/182/220/271/315、34/147/182/233/271/339、34/147/182/249/307/315/339、34/147/182/315、34/147/182/345、34/147/220/271、34/147/230/273/315/345、34/147/233、34/147/249、34/147/315/339、34/158/182/315/339/345、34/158/220、34/158/307、34/182、34/182/230/315、34/182/307/339、34/182/345、34/220、34/220/307、34/220/307/345、34/220/315/339、34/220/339、34/233、34/271/339、34/315/345、34/339、48/78/147/158/182/220/230/307、48/78/147/158/182/230/249/271/315、48/78/147/158/233/249、48/78/147/182/220/233/249/339/345、48/78/147/182/220/315、48/78/147/182/230/233/249、48/78/158/182/220/233/249、48/78/158/230/339、48/78/233/315/339、48/147/158/182/220/230/249/271/307/315/339、48/147/158/182/220/249/307/339、48/147/158/182/220/315、48/147/158/182/230/233、48/147/158/182/233/345、48/147/158/233、48/147/158/307/345、48/147/233、48/147/233/345、48/147/271/307/339、48/158/182/230/233/249、48/182、48/182/307/315、48/339、78/133/147/158/182/220/271/339、78/135/182/233/249/315/345、78/147/158/182、78/147/158/182/230/249、78/147/158/182/233/271/307/345、78/147/158/182/339/345、78/147/158/220/230/233/249/271/307/315/345、78/147/158/249/307/315、78/147/182/230/233/249、78/147/182/249/307、78/147/182/339/345、78/147/230/307、78/147/233、78/147/249/271/339、78/158/182、78/158/182/233/271/315、78/158/182/307/315/345、78/182/220/339、78/182/271/315/339、78/233、78/339、133/135/307/315、133/220/233/271、133/307、147、147/158/182/220/233、147/158/182/230/233/249/271/339、147/158/182/233/249、147/158/182/233/271/307/339、147/158/182/233/307/339、147/158/182/233/315/345、147/158/182/271/315、147/158/182/315、147/158/220/230/233/249/345、147/158/220/249/315、147/158/233/249、147/182/220/233/345、147/182/230/307/315/339、147/182/233、147/182/233/249、147/182/249/271/307、147/182/345、147/220、147/232/233/271/315/339、147/233/345、147/249、147/339、158/182/220/230/249/307/339、158/233、158/307、158/315、158/315/339、182、182/220/345、182/230、182/230/233、182/345、220、220/249、220/307/339、233、233/271、233/315、249、249/315/339、271/339、315和339。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2164相比选自以下的一个或更多个残基差异或残基差异集:34A、34A/48L/78F/133S/147Y/182M 、 34A/48L/78F/147Y/158R 、34A/48L/78F/147Y/182M/220V/233G/249T/307G/315V/339Q 、34A/48L/78F/158R/182G/233R/315V/345K、34A/48L/78F/158R/182M/220V/249T/307G、34A/48L/78F/182G/220V/230L/315V 、 34A/48L/78F/182G/220V/233R 、34A/48L/133S/158R/182G/230L/233G/271H/345K 、 34A/48L/147Y 、34A/48L/147Y/158R/182M/220V/233R/307G、34A/48L/147Y/182G/230L/233G/249T/307G、34A/48L/147Y/271H、34A/48L/182G/233G/249T、34A/48L/339Q、34A/78F、34A/78F/84G/147Y/158R/182M/220V 、 34A/78F/84G/158R/230L 、34A/78F/147Y/182G/233R/249T/315V 、 34A/78F/147Y/182M/220V/249T 、34A/78F/147Y/182M/233R/271H/339Q、34A/78F/158R、34A/78F/158R/182M/315V/345K、34A/78F/158R/249T、34A/78F/182M/233R/307G、34A/78F/204T/220V/339Q、34A/78F/220V/271H、34A/78F/220V/307G/339Q、34A/78F/315V、34A/133S/147Y/158R/230L/233G/249T、34A/147Y、34A/147Y/155D/233G/339Q、34A/147Y/158R、34A/147Y/158R/182G/249T/271H、34A/147Y/158R/182M/233R、34A/147Y/182G/220V、34A/147Y/182G/233G/271H/339Q、34A/147Y/182G/345K、34A/147Y/182M 、 34A/147Y/182M/220V/230L/249T/315V/339Q 、34A/147Y/182M/220V/230L/339Q 、 34A/147Y/182M/220V/271H/315V 、34A/147Y/182M/249T/307G/315V/339Q、34A/147Y/182M/315V、34A/147Y/220V/271H、34A/147Y/230L/273N/315V/345K、34A/147Y/233R、34A/147Y/249T、34A/147Y/315V/339Q、34A/158R/182G/315V/339Q/345K、34A/158R/220V、34A/158R/307G、34A/182G/307G/339Q、34A/182G/345K、34A/182M、34A/182M/230L/315V、34A/220V、34A/220V/307G、34A/220V/307G/345K、34A/220V/315V/339Q、34A/220V/339Q、34A/233G、34A/271H/339Q、34A/315V/345K、34A/339Q、48L/78F/147Y/158M/182G/230L/249T/271H/315V、48L/78F/147Y/158R/182M/220V/230L/307G、48L/78F/147Y/158R/233G/249T、48L/78F/147Y/182G/230L/233G/249T、48L/78F/147Y/182M/220V/233G/249T/339Q/345K、48L/78F/147Y/182M/220V/315V 、 48L/78F/158R/182G/220V/233G/249T 、48L/78F/158R/230L/339Q 、 48L/78F/233R/315V/339Q 、48L/147Y/158R/182G/220V/249T/307G/339Q、48L/147Y/158R/182G/230L/233G、48L/147Y/158R/182M/220V/230L/249T/271H/307G/315V/339Q、48L/147Y/158R/182M/220V/315V、48L/147Y/158R/182M/233G/345K、48L/147Y/158R/233G、48L/147Y/158R/307G/345K、48L/147Y/233G/345K、48L/147Y/233R、48L/147Y/271H/307G/339Q、48L/158R/182M/230L/233R/249T、48L/182G/307G/315V、48L/182M、48L/339Q、78F/133S/147Y/158R/182G/220V/271H/339Q、78F/135A/182M/233R/249T/315V/345K、 78F/147Y/158R/182G/230L/249T、78F/147Y/158R/182G/339Q/345K 、 78F/147Y/158R/182M 、78F/147Y/158R/182M/233R/271H/307G/345K 、78F/147Y/158R/220V/230L/233G/249T/271H/307G/315V/345K 、78F/147Y/158R/249T/307G/315V 、78F/147Y/182G/249T/307G 、78F/147Y/182M/230L/233G/249T、78F/147Y/182M/339Q/345K、78F/147Y/230L/307G、78F/147Y/233G、 78F/147Y/249T/271H/339Q、 78F/158R/182M、78F/158R/182M/233R/271H/315V 、 78F/158R/182M/307G/315V/345K 、78F/182G/271H/315V/339Q、78F/182M/220V/339Q、78F/233R、78F/339Q、133S/135A/307G/315V、133S/220V/233G/271H、133S/307G、147Y、147Y/158R/182G/220V/233G、147Y/158R/182G/233G/271H/307G/339Q、147Y/158R/182G/233G/307G/339Q、147Y/158R/182M/230L/233R/249T/271H/339Q、147Y/158R/182M/233R/249T 、 147Y/158R/182M/233R/315V/345K 、147Y/158R/182M/271H/315V 、 147Y/158R/182M/315V 、147Y/158R/220V/230L/233R/249T/345K、 147Y/158R/220V/249T/315V 、147Y/158R/233G/249T、147Y/182G/233R、147Y/182M/220V/233R/345K、147Y/182M/230L/307G/315V/339Q、147Y/182M/233G/249T、147Y/182M/249T/271H/307G、147Y/182M/345K、147Y/220V、147Y/232N/233G/271H/315V/339Q、147Y/233R/345K、147Y/249T、147Y/339Q、158R/182G/220V/230L/249T/307G/339Q、158R/233R、158R/307G、158R/315V、158R/315V/339Q、182G、182G/230L/233R、182G/345K、182M/220V/345K、182M/230L、220V、220V/249T、220V/307G/339Q、233G/315V、233R、233R/271H、249T、249T/315V/339Q、271H/339Q、315V和339Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2164具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:2164相比选自以下的一个或更多个残基差异或残基差异集:S34A、S34A/F48L/L78F/T133S/F147Y/R182M、S34A/F48L/L78F/F147Y/K158R、S34A/F48L/L78F/F147Y/R182M/M220V/P233G/K249T/A307G/I315V/E339Q、S34A/F48L/L78F/K158R/R182G/P233R/I315V/R345K、S34A/F48L/L78F/K158R/R182M/M220V/K249T/A307G、S34A/F48L/L78F/R182G/M220V/N230L/I315V、S34A/F48L/L78F/R182G/M220V/P233R、S34A/F48L/T133S/K158R/R182G/N230L/P233G/R271H/R345K、S34A/F48L/F147Y、S34A/F48L/F147Y/K158R/R182M/M220V/P233R/A307G、S34A/F48L/F147Y/R182G/N230L/P233G/K249T/A307G、S34A/F48L/F147Y/R271H、S34A/F48L/R182G/P233G/K249T、S34A/F48L/E339Q、S34A/L78F、S34A/L78F/E84G/F147Y/K158R/R182M/M220V、S34A/L78F/E84G/K158R/N230L、S34A/L78F/F147Y/R182G/P233R/K249T/I315V、S34A/L78F/F147Y/R182M/M220V/K249T、S34A/L78F/F147Y/R182M/P233R/R271H/E339Q、S34A/L78F/K158R、S34A/L78F/K158R/R182M/I315V/R345K、S34A/L78F/K158R/K249T、S34A/L78F/R182M/P233R/A307G、S34A/L78F/P204T/M220V/E339Q、S34A/L78F/M220V/R271H、S34A/L78F/M220V/A307G/E339Q、S34A/L78F/I315V、S34A/T133S/F147Y/K158R/N230L/P233G/K249T、S34A/F147Y、S34A/F147Y/E155D/P233G/E339Q、S34A/F147Y/K158R、S34A/F147Y/K158R/R182G/K249T/R271H、S34A/F147Y/K158R/R182M/P233R、S34A/F147Y/R182G/M220V、S34A/F147Y/R182G/P233G/R271H/E339Q、S34A/F147Y/R182G/R345K、S34A/F147Y/R182M、S34A/F147Y/R182M/M220V/N230L/K249T/I315V/E339Q、S34A/F147Y/R182M/M220V/N230L/E339Q、S34A/F147Y/R182M/M220V/R271H/I315V、S34A/F147Y/R182M/K249T/A307G/I315V/E339Q、S34A/F147Y/R182M/I315V、S34A/F147Y/M220V/R271H、S34A/F147Y/N230L/I273N/I315V/R345K、S34A/F147Y/P233R、S34A/F147Y/K249T、S34A/F147Y/I315V/E339Q、S34A/K158R/R182G/I315V/E339Q/R345K、S34A/K158R/M220V、S34A/K158R/A307G、S34A/R182G/A307G/E339Q、S34A/R182G/R345K、S34A/R182M、S34A/R182M/N230L/I315V、S34A/M220V、S34A/M220V/A307G、S34A/M220V/A307G/R345K、S34A/M220V/I315V/E339Q、S34A/M220V/E339Q、S34A/P233G、S34A/R271H/E339Q、S34A/I315V/R345K、S34A/E339Q、F48L/L78F/F147Y/K158M/R182G/N230L/K249T/R271H/I315V、F48L/L78F/F147Y/K158R/R182M/M220V/N230L/A307G、F48L/L78F/F147Y/K158R/P233G/K249T、F48L/L78F/F147Y/R182G/N230L/P233G/K249T、F48L/L78F/F147Y/R182M/M220V/P233G/K249T/E339Q/R345K、F48L/L78F/F147Y/R182M/M220V/I315V、F48L/L78F/K158R/R182G/M220V/P233G/K249T、F48L/L78F/K158R/N230L/E339Q、F48L/L78F/P233R/I315V/E339Q、F48L/F147Y/K158R/R182G/M220V/K249T/A307G/E339Q、F48L/F147Y/K158R/R182G/N230L/P233G、F48L/F147Y/K158R/R182M/M220V/N230L/K249T/R271H/A307G/I315V/E339Q、F48L/F147Y/K158R/R182M/M220V/I315V、F48L/F147Y/K158R/R182M/P233G/R345K、F48L/F147Y/K158R/P233G、F48L/F147Y/K158R/A307G/R345K、F48L/F147Y/P233G/R345K、F48L/F147Y/P233R、F48L/F147Y/R271H/A307G/E339Q、F48L/K158R/R182M/N230L/P233R/K249T、F48L/R182G/A307G/I315V、F48L/R182M、F48L/E339Q、L78F/T133S/F147Y/K158R/R182G/M220V/R271H/E339Q、L78F/V135A/R182M/P233R/K249T/I315V/R345K、L78F/F147Y/K158R/R182G/N230L/K249T、L78F/F147Y/K158R/R182G/E339Q/R345K、L78F/F147Y/K158R/R182M、L78F/F147Y/K158R/R182M/P233R/R271H/A307G/R345K、L78F/F147Y/K158R/M220V/N230L/P233G/K249T/R271H/A307G/I315V/R345K、L78F/F147Y/K158R/K249T/A307G/I315V、L78F/F147Y/R182G/K249T/A307G、L78F/F147Y/R182M/N230L/P233G/K249T、L78F/F147Y/R182M/E339Q/R345K、L78F/F147Y/N230L/A307G、L78F/F147Y/P233G、L78F/F147Y/K249T/R271H/E339Q、L78F/K158R/R182M、L78F/K158R/R182M/P233R/R271H/I315V、L78F/K158R/R182M/A307G/I315V/R345K、L78F/R182G/R271H/I315V/E339Q、L78F/R182M/M220V/E339Q、L78F/P233R、L78F/E339Q、T133S/V135A/A307G/I315V、T133S/M220V/P233G/R271H、T133S/A307G、F147Y、F147Y/K158R/R182G/M220V/P233G、F147Y/K158R/R182G/P233G/R271H/A307G/E339Q、F147Y/K158R/R182G/P233G/A307G/E339Q、F147Y/K158R/R182M/N230L/P233R/K249T/R271H/E339Q、F147Y/K158R/R182M/P233R/K249T、F147Y/K158R/R182M/P233R/I315V/R345K、F147Y/K158R/R182M/R271H/I315V、F147Y/K158R/R182M/I315V、F147Y/K158R/M220V/N230L/P233R/K249T/R345K、F147Y/K158R/M220V/K249T/I315V、F147Y/K158R/P233G/K249T、F147Y/R182G/P233R、F147Y/R182M/M220V/P233R/R345K、F147Y/R182M/N230L/A307G/I315V/E339Q、F147Y/R182M/P233G/K249T、F147Y/R182M/K249T/R271H/A307G、F147Y/R182M/R345K、F147Y/M220V、F147Y/G232N/P233G/R271H/I315V/E339Q、F147Y/P233R/R345K、F147Y/K249T、F147Y/E339Q、K158R/R182G/M220V/N230L/K249T/A307G/E339Q、K158R/P233R、K158R/A307G、K158R/I315V、K158R/I315V/E339Q、R182G、R182G/N230L/P233R、R182G/R345K、R182M/M220V/R345K、R182M/N230L、M220V、M220V/K249T、M220V/A307G/E339Q、P233G/I315V、P233R、P233R/R271H、K249T、K249T/I315V/E339Q、R271H/E339Q、I315V和E339Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:162、167、259、272、273、345、346和365。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:162T、167A、259R、272M、273E、345C、346W和365G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:S162T、K167A、K259R、K272M、I273E、R345C、R346W和K365G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:260、272、273、280、345和346。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:260P、272M、273E、280S、345C、346Q和346W。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:2666相比选自以下的一个或更多个残基差异或残基差异集:E260P、K272M、I273E、Q280S、R345C、R346Q和R346W。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:167、170、259、260、272、325、346、365、367、368、371和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:167R、170R、259R、260P、272G、272M、325S、346Q、365S、367G、368S、371P和373M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:K167R、K170R、K259R、E260P、K272G、K272M、E325S、R346Q、K365S、R367G、I368S、K371P和G373M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:162、259、272、273、325、345、346、367和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:162T、259R、272G、272M、273E、325S、345C、346Q、346W、367G和373M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:S162T、K259R、K272G、K272M、I273E、E325S、R345C、R346Q、R346W、R367G和G373M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:136、162、164、167、170、200/271、259、262、267、268、272、278、284、321、324、327、328、345、346、352、353、355、364、365、366、368、370、371和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:136W、162C、162E、162F、162H、162T、162V、164A、164S、164W、167A、170T、200C/271G、259V、262S、267E、268I、268V、272G、272M、278D、284S、321V、324W、327F、328S、345C、346A、346I、346Q、346S、346V、346W、352C、352V、353H、355L、364K、365G、365S、366E、366R、368V、370Y、371P、373M和373S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:2666相比选自以下的一个或更多个残基差异或残基差异集:F136W、S162C、S162E、S162F、S162H、S162T、S162V、K164A、K164S、K164W、K167A、K170T、R200C/H271G、K259V、T262S、Q267E、L268I、L268V、K272G、K272M、N278D、A284S、I321V、F324W、Y327F、A328S、R345C、R346A、R346I、R346Q、R346S、R346V、R346W、R352C、R352V、G353H、I355L、L364K、K365G、K365S、K366E、K366R、I368V、L370Y、K371P、G373M和G373S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:20、20/100、20/100/104/111/242、20/100/104/120/197/367、20/100/104/197/203/242/292、20/100/104/203/350/353、20/100/111、20/100/120/197/232/235/315/366/367、20/100/197/292/315、20/100/203、20/100/232/292/366/367、20/100/235/315/367、20/104/111/120/203、20/120/197/292、20/120/235、20/292、100、100/111、100/120/197/242、104/120/232/353和111/197/242。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2666相比选自以下的一个或更多个残基差异或残基差异集:20E/100D/120I/197E/232M/235M/315V/366S/367K、20K、20K/100D、20K/100D/104L/203V/350L/353D、20K/100D/111R、20K/100D/232M/292K/366S/367K、20K/120I/197E/292K、20K/120I/235M、20K/292K、20R/100D/104L/111R/242R、20R/100D/104L/120I/197E/367K、20R/100D/104L/197E/203V/242R/292K、20R/100D/197E/292K/315V、20R/100D/203V、20R/100D/235M/315V/367K、20R/104L/111R/120I/203V、100D、100D/111R、100D/120I/197E/242R、104L/120I/232M/353D和111R/197E/242R。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2666具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:2666相比选自以下的一个或更多个残基差异或残基差异集:G20E/Q100D/V120I/N197E/G232M/E235M/I315V/K366S/R367K、G20K、G20K/Q100D、G20K/Q100D/V104L/L203V/E350L/G353D、G20K/Q100D/E111R、G20K/Q100D/G232M/G292K/K366S/R367K、G20K/V120I/N197E/G292K、G20K/V120I/E235M、G20K/G292K、G20R/Q100D/V104L/E111R/K242R、G20R/Q100D/V104L/V120I/N197E/R367K、G20R/Q100D/V104L/N197E/L203V/K242R/G292K、G20R/Q100D/N197E/G292K/I315V、G20R/Q100D/L203V、G20R/Q100D/E235M/I315V/R367K、G20R/V104L/E111R/V120I/L203V、Q100D、Q100D/E111R、Q100D/V120I/N197E/K242R、V104L/V120I/G232M/G353D和E111R/N197E/K242R。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200、201、202、203、226、229、230、234、235、236、237、238、324、326、342、344、352、355、360、366、369、371、373、374、377、378、383、388和390。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200A、200M、201R、202V、203A、226L、226M、229S、230T、234H、234R、235T、236L、237C、237E、237T、238R、324A、324T、326S、342L、342V、344M、352L、352V、355L、360G、366E、366Q、366R、369L、369Y、371A、373A、373S、373T、374N、377D、378V、383N、388A、388L和390Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:R200A、R200M、T201R、F202V、L203A、F226L、F226M、T229S、N230T、K234H、K234R、E235T、D236L、D237C、D237E、D237T、E238R、F324A、F324T、Q326S、R342L、R342V、L344M、R352L、R352V、I355L、A360G、K366E、K366Q、K366R、F369L、F369Y、K371A、G373A、G373S、G373T、S374N、E377D、I378V、G383N、E388A、E388L和W390Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200、203、226、234、237、342、350、360、366、369、373、377、378、380和390。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200A、200G、200M、203A、226L、234R、237C、237E、237R、342L、342V、350I、360R、366E、366Q、369Y、373A、377D、378V、380M和390Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:R200A、R200G、R200M、L203A、F226L、K234R、D237C、D237E、D237R、R342L、R342V、E350I、A360R、K366E、K366Q、F369Y、G373A、E377D、I378V、A380M和W390Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200、201、203、207、226、230、233、234、235、322、342、344、352、355、360、366、371、373、374、378和387。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:200A、200G、200M、201R、203A、207A、207E、226L、230Y、233S、234H、234R、235T、322C、322P、342L、342V、344M、344T、352L、352V、355L、360G、366E、366Q、371A、371S、373A、373S、374D、378V和387L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:R200A、R200G、R200M、T201R、L203A、L207A、L207E、F226L、N230Y、R233S、K234H、K234R、E235T、T322C、T322P、R342L、R342V、L344M、L344T、R352L、R352V、I355L、A360G、K366E、K366Q、K371A、K371S、G373A、G373S、S374D、I378V和V387L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:15、200、202、203、205、206、207、226、229、230、231、233、234、237、321、324、326、327、330、342、344、349、352、353、360、366、369、371、373、374、378、380、386、387、388和390。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:15G、200A、200G、200M、200T、200W、202V、203A、205G、206G、207A、207E、207G、226L、226M、229S、230G、230T、231G、233S、234H、234R、234S、237C、237E、237T、321C、324T、326S、327R、330G、342L、344M、344T、349M、349T、352L、353A、353D、353N、360R、366E、369Y、371A、373A、373T、374D、374N、378V、380M、386F、387L、388L、388Q和390Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:S15G、R200A、R200G、R200M、R200T、R200W、F202V、L203A、D205G、A206G、L207A、L207E、L207G、F226L、F226M、T229S、N230G、N230T、P231G、R233S、K234H、K234R、K234S、D237C、D237E、D237T、I321C、F324T、Q326S、Y327R、A330G、R342L、L344M、L344T、E349M、E349T、R352L、G353A、G353D、G353N、A360R、K366E、F369Y、K371A、G373A、G373T、S374D、S374N、I378V、A380M、Y386F、V387L、E388L、E388Q和W390Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:55/80/174/268/355/366、55/80/268/315/366、55/80/268/346、55/111/156/268/315/324/327/366/373、55/111/268/346/355、55/111/268/355/366、55/111/315/355/373、55/268、55/268/315/346、55/268/324/366、55/268/346/355、62/66/69/143/338/353、62/66/100/101/104/203/235/338、62/69/80/101/104/143/235/338、62/203/211/235/338/350、66/69/143/235/338、69/80/203/211/278/338、80/111/268/324/327/346/366/373、80/111/355/366、80/143/203/211/338、80/268/315/346/355、80/268/327/346/366、80/268/346、80/315/346/364/373、80/346/366、100/101/211/278/338/350/353、111/268、268、268/315/327/346、268/315/346、268/315/346/366、268/315/355、268/324、268/324/327/346、268/327/346、268/346、268/346/355、268/355/366、315/324/327/355/366、324/346/355/366和327/346。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:55L/80S/174Q/268I/355L/366E、55L/80S/268I/315V/366E、55L/80S/268V/346V、55L/111R/156A/268V/315V/324W/327F/366E/373S、55L/111R/268V/346I/355L、55L/111R/268V/355L/366E、55L/111R/315V/355L/373S、55L/268I/346V/355L、55L/268V、55L/268V/315V/346V、55L/268V/324W/366E、62E/66Q/69H/143S/338G/353D、62E/66Q/100D/101C/104L/203V/235M/338G、62E/69H/80S/101C/104L/143S/235M/338G、62E/203V/211A/235M/338G/350L、66Q/69H/143S/235M/338G、69H/80S/203V/211A/278H/338G、80S/111R/268I/324W/327F/346I/366E/373S、80S/111R/355L/366E、80S/143S/203V/211A/338G、80S/268I/315V/346I/355L、80S/268V/327F/346I/366E、80S/268V/346I、80S/268V/346V、80S/315V/346A/364P/373S、80S/346A/366E、100D/101C/211A/278H/338G/350L/353D、111R/268I、268I、268I/315V/346V、268I/315V/355L、268I/324W、268I/324W/327F/346V、268V/315V/327F/346V、268V/315V/346A、268V/315V/346I、268V/315V/346V/366E、268V/324W/327F/346I、268V/327F/346A、268V/346A/355L、268V/346I、268V/346V、268V/355L/366E、315V/324W/327F/355L/366E、324W/346I/355L/366E和327F/346A。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2794具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2794相比选自以下的一个或更多个残基差异或残基差异集:M55L/Y80S/L174Q/L268I/I355L/K366E、M55L/Y80S/L268I/I315V/K366E、M55L/Y80S/L268V/R346V、M55L/E111R/E156A/L268V/I315V/F324W/Y327F/K366E/G373S、M55L/E111R/L268V/R346I/I355L、M55L/E111R/L268V/I355L/K366E、M55L/E111R/I315V/I355L/G373S、M55L/L268I/R346V/I355L、M55L/L268V、M55L/L268V/I315V/R346V、M55L/L268V/F324W/K366E、K62E/I66Q/L69H/A143S/K338G/G353D、K62E/I66Q/Q100D/V101C/V104L/L203V/E235M/K338G、K62E/L69H/Y80S/V101C/V104L/A143S/E235M/K338G、K62E/L203V/T211A/E235M/K338G/E350L、I66Q/L69H/A143S/E235M/K338G、L69H/Y80S/L203V/T211A/N278H/K338G、Y80S/E111R/L268I/F324W/Y327F/R346I/K366E/G373S、Y80S/E111R/I355L/K366E、Y80S/A143S/L203V/T211A/K338G、Y80S/L268I/I315V/R346I/I355L、Y80S/L268V/Y327F/R346I/K366E、Y80S/L268V/R346I、Y80S/L268V/R346V、Y80S/I315V/R346A/L364P/G373S、Y80S/R346A/K366E、Q100D/V101C/T211A/N278H/K338G/E350L/G353D、E111R/L268I、L268I、L268I/I315V/R346V、L268I/I315V/I355L、L268I/F324W、L268I/F324W/Y327F/R346V、L268V/I315V/Y327F/R346V、L268V/I315V/R346A、L268V/I315V/R346I、L268V/I315V/R346V/K366E、L268V/F324W/Y327F/R346I、L268V/Y327F/R346A、L268V/R346A/I355L、L268V/R346I、L268V/R346V、L268V/I355L/K366E、I315V/F324W/Y327F/I355L/K366E、F324W/R346I/I355L/K366E和Y327F/R346A。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2978具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2978相比选自以下的一个或更多个残基差异或残基差异集:62/69/100/235/268/346、62/69/353、62/111/235/315/355、62/111/235/324/346、62/235/268/327/346/350/353/355、62/235/346/350/355、62/315/327/353、62/323/346/353/355、66、66/100/235/315/327/353/355、66/111/346/353/355、66/235/268/346、66/235/346、66/235/373、69、69/100、69/100/111/298/353/355、69/100/235、69/100/353/366、69/111/235、69/111/235/300/353/355、69/111/235/315、69/235/315、69/235/353、69/268、69/268/324/327/353/355、69/268/346、69/268/346/353、69/315/353、69/324/327/346、69/324/346/350、69/324/353、69/353/355、100、100/111/353、100/235/268/315/346、100/235/268/346/355、100/235/268/366/373、100/235/346/350/353、100/268/346、100/268/366、111/235/268/327/346、111/235/268/346、111/235/346/350、111/268、111/327、232/346/350/355、235/268/327/346、235/268/346、235/315、235/315/353/355、235/346、235/346/350、235/353、235/353/355、268/346、268/346/350/353/355、268/353、315/327/346、324/327/346、324/346/350、324/355、327/346、346和353/355。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:2978具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2978相比选自以下的一个或更多个残基差异或残基差异集:62E/69H/100D/235M/268V/346I、62E/69H/353D、62E/111R/235M/315V/355L、62E/111R/235M/324W/346I、62E/235M/268V/327F/346I/350L/353D/355L、62E/235M/346V/350L/355L、62E/315V/327F/353D、62E/323S/346I/353D/355L、66Q、66Q/100D/235M/315V/327F/353D/355L、66Q/111R/346V/353D/355L、66Q/235M/268V/346I、66Q/235M/346S、66Q/235M/373S、69H、69H/100D、69H/100D/111R/298I/353D/355L、69H/100D/235M、69H/100D/353D/366E、69H/111R/235M、69H/111R/235M/300K/353D/355L、69H/111R/235M/315V、69H/235M/315V、69H/235M/353D、69H/268V、69H/268V/324W/327F/353D/355L、69H/268V/346I、69H/268V/346V/353D、69H/315V/353D、69H/324W/327F/346I、69H/324W/346I/350L、69H/324W/353D、69H/353D/355L、100D、100D/111R/353D、100D/235M/268V/315V/346I、100D/235M/268V/346V/355L、100D/235M/268V/366E/373S、100D/235M/346I/350L/353D、100D/268V/346I、100D/268V/366E、111R/235M/268V/327F/346V、111R/235M/268V/346I、111R/235M/346V/350L、111R/268V、111R/327F、232D/346I/350L/355L、235M/268V/327F/346V、235M/268V/346I、235M/315V、235M/315V/353D/355L、235M/346I、235M/346V、235M/346V/350L、235M/353D、235M/353D/355L、268V/346I、268V/346I/350L/353D/355L、268V/353D、315V/327F/346I、324W/327F/346I、324W/346I/350L、324W/355L、327F/346V、346I和353D/355L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:2978具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:2978相比选自以下的一个或更多个残基差异或残基差异集:K62E/L69H/Q100D/E235M/L268V/R346I、K62E/L69H/G353D、K62E/E111R/E235M/I315V/I355L、K62E/E111R/E235M/F324W/R346I、K62E/E235M/L268V/Y327F/R346I/E350L/G353D/I355L、K62E/E235M/R346V/E350L/I355L、K62E/I315V/Y327F/G353D、K62E/P323S/R346I/G353D/I355L、I66Q、I66Q/Q100D/E235M/I315V/Y327F/G353D/I355L、I66Q/E111R/R346V/G353D/I355L、I66Q/E235M/L268V/R346I、I66Q/E235M/R346S、I66Q/E235M/G373S、L69H、L69H/Q100D、L69H/Q100D/E111R/V298I/G353D/I355L、L69H/Q100D/E235M、L69H/Q100D/G353D/K366E、L69H/E111R/E235M、L69H/E111R/E235M/T300K/G353D/I355L、L69H/E111R/E235M/I315V、L69H/E235M/I315V、L69H/E235M/G353D、L69H/L268V、L69H/L268V/F324W/Y327F/G353D/I355L、L69H/L268V/R346I、L69H/L268V/R346V/G353D、L69H/I315V/G353D、L69H/F324W/Y327F/R346I、L69H/F324W/R346I/E350L、L69H/F324W/G353D、L69H/G353D/I355L、Q100D、Q100D/E111R/G353D、Q100D/E235M/L268V/I315V/R346I、Q100D/E235M/L268V/R346V/I355L、Q100D/E235M/L268V/K366E/G373S、Q100D/E235M/R346I/E350L/G353D、Q100D/L268V/R346I、Q100D/L268V/K366E、E111R/E235M/L268V/Y327F/R346V、E111R/E235M/L268V/R346I、E111R/E235M/R346V/E350L、E111R/L268V、E111R/Y327F、G232D/R346I/E350L/I355L、E235M/L268V/Y327F/R346V、E235M/L268V/R346I、E235M/I315V、E235M/I315V/G353D/I355L、E235M/R346I、E235M/R346V、E235M/R346V/E350L、E235M/G353D、E235M/G353D/I355L、L268V/R346I、L268V/R346I/E350L/G353D/I355L、L268V/G353D、I315V/Y327F/R346I、F324W/Y327F/R346I、F324W/R346I/E350L、F324W/I355L、Y327F/R346V、R346I和G353D/I355L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16、17、210、234、373和380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16M、17R、210L、234A、234Q、373N和380S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:3074相比选自以下的一个或更多个残基差异或残基差异集:N16M、T17R、I210L、K234A、K234Q、G373N和A380S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16、17、18、20、21、22、24、27、28、29、32、38、44、48、77、78、78/127、79、80、103、106、111、115、117、119、210、232、238、272和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16M、17G、18L、20A、20G、21N、22C、22P、22Q、24T、27S、28G、29H、29S、32C、32P、38R、44R、44V、48I、77L、77V、78L、78L/127R、79R、80W、103C、103G、103P、103S、106Q、106R、106Y、111H、111M、111N、111S、111V、115R、117I、119A、210L、232T、238D、272D和373N。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:N16M、T17G、P18L、K20A、K20G、E21N、V22C、V22P、V22Q、S24T、A27S、R28G、P29H、P29S、Q32C、Q32P、K38R、Y44R、Y44V、F48I、I77L、I77V、F78L、F78L/K127R、K79R、S80W、D103C、D103G、D103P、D103S、E106Q、E106R、E106Y、E111H、E111M、E111N、E111S、E111V、S115R、V117I、E119A、I210L、G232T、E238D、K272D和G373N。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:111/226、111/226/321/344/346/369/387、162/367/371、201/202、201/202/272/360、202/233、202/235/360/367/371、207/235/327/360/371、226、226/268、226/321/369、226/366、226/366/369/387、233/367/371、233/371和367/371。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:111R/226L、111R/226L/321C/344T/346I/369Y/387L、162T/367G/371S、201G/202V、201G/202V/272G/360R、202V/233S、202V/235E/360R/367G/371S、207A/235E/327Y/360R/371S、226L、226L/268V、226L/321C/369Y、226L/366E、226L/366E/369Y/387L、233S/367G/371S、233S/371S和367G/371S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:E111R/F226L、E111R/F226L/I321C/L344T/R346I/F369Y/V387L、S162T/R367G/K371S、T201G/F202V、T201G/F202V/K272G/A360R、F202V/R233S、F202V/M235E/A360R/R367G/K371S、L207A/M235E/F327Y/A360R/K371S、F226L、F226L/L268V、F226L/I321C/F369Y、F226L/K366E、F226L/K366E/F369Y/V387L、R233S/R367G/K371S、R233S/K371S和R367G/K371S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75、75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、106/182/203/226/235/342/346、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/342/346、201/203/226/234/342/346、201/203/226/234/346、201/203/226/268/342、201/203/226/346、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/342、203/226/235/346、203/226/342/346、203/226/346、207、207/233/237/344/387、207/387、226、226/235/268、226/235/268/342/346、226/235/268/346、226/235/342、226/268/342、226/268/342/346、226/268/346、226/342、226/342/346、226/346、259/276/387和346。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75V、75V/233S/344T、75V/233S/366E、104L/200A/207E/237R/344M/373A/387L、104L/207E/344T/387L、106D/182G/203A/226L/235T/342L/346I、182G/201R/203A/226L/234H/235T/346I、182G/201R/203A/226L/234R/235T/346I、182G/201R/203A/226L/234R/342V/346I、182G/201R/203A/226L/235T 、 182G/201R/203A/226L/235T/346I 、182G/201R/203A/226L/342V/346I 、 182G/201R/203A/268I/346I 、182G/201R/226L/234H/342V/346I、182G/201R/226L/235T/346I、182G/201R/226L/268V/346I、182G/201R/342V、182G/203A/226L、182G/226L/234R/268I/342V/346I、182G/226L/234R/346I、182G/226L/235T、182G/226L/235T/268V/346I、182G/226L/235T/342L、182G/226L/235T/346I、182G/226L/268I/342V/346I、182G/226L/342V、182G/226L/346I、182G/342L/346I、201R/203A/226L/234H/342V/346I、201R/203A/226L/234H/346I、201R/203A/226L/268I/342V、201R/203A/226L/346I、201R/203A/268I/346I、201R/226L/234H/346I、201R/226L/234R/342L/346I、201R/226L/235T/342L、201R/226L/268I/346I、203A/226L、203A/226L/234H/235T/346I、203A/226L/234R/235T、203A/226L/235T/268V/346I、203A/226L/235T/342L、203A/226L/235T/346I、203A/226L/342V/346I、203A/226L/346I、207E、207E/233S/237R/344M/387I、207E/387L、226L、226L/235T/268I、226L/235T/268V/342L/346I、226L/235T/268V/346I、226L/235T/342V、226L/268I/342L/346I、226L/268I/342V、226L/268I/346I、226L/268V/346I、226L/342V、226L/342V/346I、226L/346I、259R/276L/387L和346I。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:A75V、A75V/R233S/L344T、A75V/R233S/K366E、V104L/R200A/L207E/D237R/L344M/G373A/V387L、V104L/L207E/L344T/V387L、E106D/M182G/V203A/F226L/E235T/R342L/R346I、M182G/T201R/V203A/F226L/K234H/E235T/R346I、M182G/T201R/V203A/F226L/K234R/E235T/R346I、M182G/T201R/V203A/F226L/K234R/R342V/R346I、M182G/T201R/V203A/F226L/E235T、M182G/T201R/V203A/F226L/E235T/R346I、M182G/T201R/V203A/F226L/R342V/R346I、M182G/T201R/V203A/L268I/R346I、M182G/T201R/F226L/K234H/R342V/R346I、M182G/T201R/F226L/E235T/R346I、M182G/T201R/F226L/L268V/R346I、M182G/T201R/R342V、M182G/V203A/F226L、M182G/F226L/K234R/L268I/R342V/R346I、M182G/F226L/K234R/R346I、M182G/F226L/E235T、M182G/F226L/E235T/L268V/R346I、M182G/F226L/E235T/R342L、M182G/F226L/E235T/R346I、M182G/F226L/L268I/R342V/R346I、M182G/F226L/R342V、M182G/F226L/R346I、M182G/R342L/R346I、T201R/V203A/F226L/K234H/R342V/R346I、T201R/V203A/F226L/K234H/R346I、T201R/V203A/F226L/L268I/R342V、T201R/V203A/F226L/R346I、T201R/V203A/L268I/R346I、T201R/F226L/K234H/R346I、T201R/F226L/K234R/R342L/R346I、T201R/F226L/E235T/R342L、T201R/F226L/L268I/R346I、V203A/F226L、V203A/F226L/K234H/E235T/R346I、V203A/F226L/K234R/E235T、V203A/F226L/E235T/L268V/R346I、V203A/F226L/E235T/R342L、V203A/F226L/E235T/R346I、V203A/F226L/R342V/R346I、V203A/F226L/R346I、L207E、L207E/R233S/D237R/L344M/V387I、L207E/V387L、F226L、F226L/E235T/L268I、F226L/E235T/L268V/R342L/R346I、F226L/E235T/L268V/R346I、F226L/E235T/R342V、F226L/L268I/R342L/R346I、F226L/L268I/R342V、F226L/L268I/R346I、F226L/L268V/R346I、F226L/R342V、F226L/R342V/R346I、F226L/R346I、K259R/M276L/V387L和R346I。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、201/203/226/234/342/346、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、203/226、203/226/234/235、203/226/235/268/346、203/226/235/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/342、226/235/268、226/235/268/346、226/235/346、226/268/342、226/268/346、226/342/346、226/346和259/276/387。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75V/233S/344T、75V/233S/366E、104L/200A/207E/237R/344M/373A/387L、104L/207E/344T/387L、182G/201R/203A/226L/234H/235T/346I、182G/201R/203A/226L/234R/235T/346I、182G/201R/203A/226L/234R/342V/346I、182G/201R/203A/226L/235T、182G/201R/203A/226L/235T/346I、182G/201R/203A/226L/342V/346I、182G/201R/203A/268I/346I、182G/201R/226L/234H/342V/346I、182G/201R/226L/235T/346I、182G/201R/226L/268V/346I、182G/201R/342V、182G/203A/226L、182G/226L/234H/346I、182G/226L/234R/268I/342V/346I、182G/226L/234R/346I、182G/226L/235T、182G/226L/235T/268V/346I、182G/226L/235T/342L、182G/226L/235T/346I、182G/226L/268I/342V/346I、182G/226L/342V、182G/226L/346I、201R/203A/226L/234H/342V/346I、201R/203A/226L/346I、201R/203A/268I/346I、201R/203A/268V/342V、201R/226L/234H/346I、201R/226L/234R/342L/346I、201R/226L/235T/342L、201R/226L/268I/346I、203A/226L、203A/226L/234R/235T、203A/226L/235T/268V/346I、203A/226L/235T/346I、203A/226L/346I、207E、207E/233S/237R/344M/387I、207E/387L、226L、226L/234R/342V、226L/235T/268I、226L/235T/268V/346I、226L/235T/346I、226L/268I/342V、226L/268I/346I、226L/268V/346I、226L/342V/346I、226L/346I和259R/276L/387L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:A75V/R233S/L344T、A75V/R233S/K366E、V104L/R200A/L207E/D237R/L344M/G373A/V387L、V104L/L207E/L344T/V387L、M182G/T201R/V203A/F226L/K234H/E235T/R346I、M182G/T201R/V203A/F226L/K234R/E235T/R346I、M182G/T201R/V203A/F226L/K234R/R342V/R346I、M182G/T201R/V203A/F226L/E235T、M182G/T201R/V203A/F226L/E235T/R346I、M182G/T201R/V203A/F226L/R342V/R346I、M182G/T201R/V203A/L268I/R346I、M182G/T201R/F226L/K234H/R342V/R346I、M182G/T201R/F226L/E235T/R346I、M182G/T201R/F226L/L268V/R346I、M182G/T201R/R342V、M182G/V203A/F226L、M182G/F226L/K234H/R346I、M182G/F226L/K234R/L268I/R342V/R346I、M182G/F226L/K234R/R346I、M182G/F226L/E235T、M182G/F226L/E235T/L268V/R346I、M182G/F226L/E235T/R342L、M182G/F226L/E235T/R346I、M182G/F226L/L268I/R342V/R346I、M182G/F226L/R342V、M182G/F226L/R346I、T201R/V203A/F226L/K234H/R342V/R346I、T201R/V203A/F226L/R346I、T201R/V203A/L268I/R346I、T201R/V203A/L268V/R342V、T201R/F226L/K234H/R346I、T201R/F226L/K234R/R342L/R346I、T201R/F226L/E235T/R342L、T201R/F226L/L268I/R346I、V203A/F226L、V203A/F226L/K234R/E235T、V203A/F226L/E235T/L268V/R346I、V203A/F226L/E235T/R346I、V203A/F226L/R346I、L207E、L207E/R233S/D237R/L344M/V387I、L207E/V387L、F226L、F226L/K234R/R342V、F226L/E235T/L268I、F226L/E235T/L268V/R346I、F226L/E235T/R346I、F226L/L268I/R342V、F226L/L268I/R346I、F226L/L268V/R346I、F226L/R342V/R346I、F226L/R346I和K259R/M276L/V387L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75/207/373/378、104/200/207/237/344/373/387、104/207/344/387、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、201/203/226/234、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/268/346、201/226/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/235/346、226/235/268、226/235/268/346、226/235/342、226/235/346、226/268/342、226/268/346、226/342、226/342/346、226/346和259/276/387。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75V/207E/373A/378V、104L/200A/207E/237R/344M/373A/387L、104L/207E/344T/387L、182G/201R/203A/226L/234H/235T/346I、182G/201R/203A/226L/234R/235T/346I、182G/201R/203A/226L/234R/342V/346I 、 182G/201R/203A/226L/235T 、182G/201R/203A/226L/235T/346I 、 182G/201R/203A/226L/342V/346I 、182G/201R/203A/268I/346I、182G/201R/226L/234H/342V/346I、182G/201R/226L/235T/346I、182G/201R/226L/268V/346I、182G/203A/226L、182G/226L/234H/346I、182G/226L/234R/268I/342V/346I、182G/226L/234R/346I、182G/226L/235T、182G/226L/235T/268V/346I、182G/226L/235T/342L、182G/226L/235T/346I、182G/226L/268I/342V/346I、182G/226L/342V、182G/226L/346I、201R/203A/226L/234H、201R/203A/226L/346I、201R/203A/268I/346I、201R/203A/268V/342V、201R/226L/234R/342L/346I、201R/226L/268I/346I、201R/226L/346I、203A/226L、203A/226L/234H/235T/346I、203A/226L/234R/235T、203A/226L/235T/268V/346I、203A/226L/235T/346I、203A/226L/346I、207E、207E/233S/237R/344M/387I、207E/387L、226L、226L/234R/235T/346I、226L/235T/268I、226L/235T/268V/346I、226L/235T/342V、226L/235T/346I、226L/268I/342V、226L/268I/346I、226L/268V/346I、226L/342V、226L/342V/346I、226L/346I和259R/276L/387L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:A75V/L207E/G373A/I378V、V104L/R200A/L207E/D237R/L344M/G373A/V387L、V104L/L207E/L344T/V387L、M182G/T201R/V203A/F226L/K234H/E235T/R346I、M182G/T201R/V203A/F226L/K234R/E235T/R346I、M182G/T201R/V203A/F226L/K234R/R342V/R346I、M182G/T201R/V203A/F226L/E235T、M182G/T201R/V203A/F226L/E235T/R346I、M182G/T201R/V203A/F226L/R342V/R346I、M182G/T201R/V203A/L268I/R346I、M182G/T201R/F226L/K234H/R342V/R346I、M182G/T201R/F226L/E235T/R346I、M182G/T201R/F226L/L268V/R346I、M182G/V203A/F226L、M182G/F226L/K234H/R346I、M182G/F226L/K234R/L268I/R342V/R346I、M182G/F226L/K234R/R346I、M182G/F226L/E235T、M182G/F226L/E235T/L268V/R346I、M182G/F226L/E235T/R342L、M182G/F226L/E235T/R346I、M182G/F226L/L268I/R342V/R346I、M182G/F226L/R342V、M182G/F226L/R346I、T201R/V203A/F226L/K234H、T201R/V203A/F226L/R346I、T201R/V203A/L268I/R346I、T201R/V203A/L268V/R342V、T201R/F226L/K234R/R342L/R346I、T201R/F226L/L268I/R346I、T201R/F226L/R346I、V203A/F226L、V203A/F226L/K234H/E235T/R346I、V203A/F226L/K234R/E235T、V203A/F226L/E235T/L268V/R346I、V203A/F226L/E235T/R346I、V203A/F226L/R346I、L207E、L207E/R233S/D237R/L344M/V387I、L207E/V387L、F226L、F226L/K234R/E235T/R346I、F226L/E235T/L268I、F226L/E235T/L268V/R346I、F226L/E235T/R342V、F226L/E235T/R346I、F226L/L268I/R342V、F226L/L268I/R346I、F226L/L268V/R346I、F226L/R342V、F226L/R342V/R346I、F226L/R346I和K259R/M276L/V387L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、106/182/203/226/235/342/346、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/342/346、201/203/226/268/342、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/235/342、201/226/268/346、201/226/346、201/235/268/342/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/346、203/226/342/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/235/346、226/234/342、226/235/268、226/235/268/346、226/235/342、226/235/346、226/268/342、226/268/346、226/342、226/342/346、226/346和259/276/387。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:75V/233S/344T、75V/233S/366E、104L/200A/207E/237R/344M/373A/387L、104L/207E/344T/387L、106D/182G/203A/226L/235T/342L/346I、182G/201R/203A/226L/234H/235T/346I、182G/201R/203A/226L/234R/235T/346I、182G/201R/203A/226L/234R/342V/346I 、 182G/201R/203A/226L/235T 、182G/201R/203A/226L/235T/346I 、 182G/201R/203A/226L/342V/346I、182G/201R/203A/268I/346I、182G/201R/226L/234H/342V/346I、182G/201R/226L/235T/346I、182G/201R/226L/268V/346I、182G/201R/342V、182G/203A/226L、182G/226L/234H/346I、182G/226L/234R/268I/342V/346I、182G/226L/234R/346I、182G/226L/235T、182G/226L/235T/268V/346I、182G/226L/235T/342L、182G/226L/235T/346I、182G/226L/268I/342V/346I、182G/226L/342V、182G/226L/346I、182G/342L/346I、201R/203A/226L/268I/342V、201R/203A/226L/346I、201R/203A/268I/346I、201R/203A/268V/342V、201R/226L/234R/342L/346I、201R/226L/235T/342L、201R/226L/268I/346I、201R/226L/346I、201R/235T/268V/342V/346I、203A/226L、203A/226L/234H/235T/346I、203A/226L/234R/235T、203A/226L/235T/268V/346I、203A/226L/235T/346I、203A/226L/342V/346I、203A/226L/346I、207E、207E/233S/237R/344M/387I、207E/387L、226L、226L/234H/342L、226L/234R/235T/346I、226L/234R/342V、226L/235T/268I、226L/235T/268V/346I、226L/235T/342V、226L/235T/346I、226L/268I/342V、226L/268I/346I、226L/268V/342L、226L/268V/346I、226L/342V、226L/342V/346I、226L/346I和259R/276L/387L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3302具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3302相比选自以下的一个或更多个残基差异或残基差异集:A75V/R233S/L344T、A75V/R233S/K366E、V104L/R200A/L207E/D237R/L344M/G373A/V387L、V104L/L207E/L344T/V387L、E106D/M182G/V203A/F226L/E235T/R342L/R346I、M182G/T201R/V203A/F226L/K234H/E235T/R346I、M182G/T201R/V203A/F226L/K234R/E235T/R346I、M182G/T201R/V203A/F226L/K234R/R342V/R346I、M182G/T201R/V203A/F226L/E235T、M182G/T201R/V203A/F226L/E235T/R346I、M182G/T201R/V203A/F226L/R342V/R346I、M182G/T201R/V203A/L268I/R346I、M182G/T201R/F226L/K234H/R342V/R346I、M182G/T201R/F226L/E235T/R346I、M182G/T201R/F226L/L268V/R346I、M182G/T201R/R342V、M182G/V203A/F226L、M182G/F226L/K234H/R346I、M182G/F226L/K234R/L268I/R342V/R346I、M182G/F226L/K234R/R346I、M182G/F226L/E235T、M182G/F226L/E235T/L268V/R346I、M182G/F226L/E235T/R342L、M182G/F226L/E235T/R346I、M182G/F226L/L268I/R342V/R346I、M182G/F226L/R342V、M182G/F226L/R346I、M182G/R342L/R346I、T201R/V203A/F226L/L268I/R342V、T201R/V203A/F226L/R346I、T201R/V203A/L268I/R346I、T201R/V203A/L268V/R342V、T201R/F226L/K234R/R342L/R346I、T201R/F226L/E235T/R342L、T201R/F226L/L268I/R346I、T201R/F226L/R346I、T201R/E235T/L268V/R342V/R346I、V203A/F226L、V203A/F226L/K234H/E235T/R346I、V203A/F226L/K234R/E235T、V203A/F226L/E235T/L268V/R346I、V203A/F226L/E235T/R346I、V203A/F226L/R342V/R346I、V203A/F226L/R346I、L207E、L207E/R233S/D237R/L344M/V387I、L207E/V387L、F226L、F226L/K234H/R342L、F226L/K234R/E235T/R346I、F226L/K234R/R342V、F226L/E235T/L268I、F226L/E235T/L268V/R346I、F226L/E235T/R342V、F226L/E235T/R346I、F226L/L268I/R342V、F226L/L268I/R346I、F226L/L268V/R342L、F226L/L268V/R346I、F226L/R342V、F226L/R342V/R346I、F226L/R346I和K259R/M276L/V387L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3398具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3398相比选自以下的一个或更多个残基差异或残基差异集:29/77/104/234/271、29/77/104/234/271/279/380、29/77/182/207/271、29/77/207/234/279/380、29/77/234/271/279/368、29/77/271、29/104/234/271/279/380、29/182/207/380、29/182/234/271/380、29/182/271/279/380、29/234/279/380、29/271/279、29/271/279/368/380、32/78/106/200/226/272/373、32/78/106/200/226/373、32/78/106/226、32/78/200/226、32/78/200/226/235/272、32/78/200/226/235/321/373、32/78/226、32/78/226/321、32/78/226/373、32/106/200/226、32/106/200/226/235/373、32/200/226、32/200/226/321/373、32/226、77/182/279/380、77/182/368、77/234/271/279/380、78/106、78/106/226/321/373、78/106/235/321/373、78/200/226/321/373、78/226/321、104/182、106/200/226/373、106/226/235/373、182/207/279/368、182/234/380、182/279/368/380、200/226、200/226/321/373、200/226/373、207/271/368/380、207/380、226、226/235/272/373、226/272/373和271/380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3398具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3398相比选自以下的一个或更多个残基差异或残基差异集:29H/77V/104L/234P/271P、29H/77V/104L/234R/271P/279H/380G、29H/77V/182G/207E/271Q、29H/77V/207E/234H/279H/380G、29H/77V/234H/271P/279H/368Q、29H/77V/271P、29H/104L/234R/271Q/279H/380G、29H/182G/207E/380G、29H/182G/234P/271P/380G、29H/182G/271Q/279H/380G、29H/234H/279H/380G、29H/271Q/279H、29H/271Q/279H/368Q/380G、32C/78L/106R/200A/226L/373N、32C/78L/200A/226L、32C/78L/200A/226L/235T/272D、32C/78L/226L/321M、32C/78L/226L/373N、32C/106Q/200A/226L/235T/373N、32C/106R/200A/226L、32P/78L/106Q/226L、32P/78L/106R/200A/226L/272D/373N、32P/78L/106R/200A/226L/373A、32P/78L/200A/226L/235T/321M/373N、32P/78L/226L、32P/78L/226L/373N、32P/200A/226L、32P/200A/226L/321M/373N、32P/226L、77V/182G/279H/380G、77V/182G/368Q、77V/234H/271Q/279H/380G、78L/106Q、78L/106R/226L/321M/373A、78L/106R/226L/321M/373N、78L/106R/235T/321M/373N、78L/200A/226L/321M/373N、78L/226L/321M、104L/182G、106R/200A/226L/373A、106R/226L/235T/373A、182G/207E/279H/368Q、182G/234R/380G、182G/279H/368Q/380G、200A/226L、200A/226L/321M/373N、200A/226L/373A、207E/271Q/368Q/380G、207E/380G、226L、226L/235T/272D/373A、226L/272D/373N和271P/380G。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3398具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3398相比选自以下的一个或更多个残基差异或残基差异集:P29H/I77V/V104L/K234P/H271P、P29H/I77V/V104L/K234R/H271P/F279H/A380G、P29H/I77V/M182G/L207E/H271Q、P29H/I77V/L207E/K234H/F279H/A380G、P29H/I77V/K234H/H271P/F279H/I368Q、P29H/I77V/H271P、P29H/V104L/K234R/H271Q/F279H/A380G、P29H/M182G/L207E/A380G、P29H/M182G/K234P/H271P/A380G、P29H/M182G/H271Q/F279H/A380G、P29H/K234H/F279H/A380G、P29H/H271Q/F279H、P29H/H271Q/F279H/I368Q/A380G、Q32C/F78L/E106R/R200A/F226L/G373N、Q32C/F78L/R200A/F226L、Q32C/F78L/R200A/F226L/E235T/K272D、Q32C/F78L/F226L/I321M、Q32C/F78L/F226L/G373N、Q32C/E106Q/R200A/F226L/E235T/G373N、Q32C/E106R/R200A/F226L、Q32P/F78L/E106Q/F226L、Q32P/F78L/E106R/R200A/F226L/K272D/G373N、Q32P/F78L/E106R/R200A/F226L/G373A、Q32P/F78L/R200A/F226L/E235T/I321M/G373N、Q32P/F78L/F226L、Q32P/F78L/F226L/G373N、Q32P/R200A/F226L、Q32P/R200A/F226L/I321M/G373N、Q32P/F226L、I77V/M182G/F279H/A380G、I77V/M182G/I368Q、I77V/K234H/H271Q/F279H/A380G、F78L/E106Q、F78L/E106R/F226L/I321M/G373A、F78L/E106R/F226L/I321M/G373N、F78L/E106R/E235T/I321M/G373N、F78L/R200A/F226L/I321M/G373N、F78L/F226L/I321M、V104L/M182G、E106R/R200A/F226L/G373A、E106R/F226L/E235T/G373A、M182G/L207E/F279H/I368Q、M182G/K234R/A380G、M182G/F279H/I368Q/A380G、R200A/F226L、R200A/F226L/I321M/G373N、R200A/F226L/G373A、L207E/H271Q/I368Q/A380G、L207E/A380G、F226L、F226L/E235T/K272D/G373A、F226L/K272D/G373N和H271P/A380G。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16、201、203、230、231、234、235、238、271、273、275、279、321、344、349、368、373和380。在一些实施方案中,工程化TdT多肽包含与参考序列SEQID NO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:16M、201V、203G、203I、230E、231I、234A、234L、234P、234Q、235C、235V、238V、271P、271Q、273D、275E、279H、321M、344C、349C、368Q、373N、380G和380S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:3074具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3074相比选自以下的一个或更多个残基差异或残基差异集:N16M、T201V、V203G、V203I、N230E、P231I、K234A、K234L、K234P、K234Q、M235C、M235V、E238V、H271P、H271Q、I273D、A275E、F279H、I321M、L344C、E349C、I368Q、G373N、A380G和A380S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:14/15/77/78、14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/77/200/226/230、14/15/78、14/15/78/226/230、14/15/200/230、14/77/78/200/226/230/257、14/77/78/226/230/257、14/77/201/230、14/78/200/201/226/290、14/78/200/201/339、14/78/200/226/230/339、14/78/200/226/290/339、14/78/200/230/339、14/200/203/226/230、14/200/203/226/230/257/339、14/200/203/230/339、14/201/203/226、15/77、15/77/78、15/77/78/200/201/203/226/230、15/77/200/201/203/226/230/290/339、15/77/200/230、15/77/200/230/290/339、15/77/201/226/230/339、15/77/226/230/290/339、15/78/201、15/78/201/203/230、15/78/201/230/290、15/78/203/226/230、15/200、15/201/203/226/230/257/339、15/226/230/339、15/230、32、32/103、32/103/106/207/210/235/321/368、32/103/207/228/232/373、32/103/210/273/321/373、32/103/273、32/106、32/106/207/210/232、32/106/210、32/106/210/373、32/106/235/321、32/106/235/368、32/106/273/321/373、32/207/210/273、32/207/210/368/373、32/207/235、32/210/232/235/368、32/210/273、32/235/273、77/78/200/226/339、77/78/201/226/257/339、77/78/203、77/78/203/230/339、77/200/201、77/200/201/226/230/339、77/200/203/230/257/339、77/200/230、78、78/200/230、78/203/230/290、78/226/230、78/226/290、103/106/207/321、103/106/210、103/207/210/235/321、103/210/232/235、103/232/273、106、106/207/210/232/235/321/368/373、106/207/235/321/368、106/235/273/373、106/273、200、200/203/226/230/339、200/230/257、201、201/203、201/230/257、201/230/290、203、203/226/230、203/226/230/257、207/235、207/235/368、207/368/373、207/373、232/235、232/235/273/368、232/235/321、235、235/273和273。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:14E/15G/77V/78L、14E/15G/77V/78L/200A/201L/226L/230P/290R、14E/15G/77V/78L/200A/203S/230I/290H、14E/15G/77V/78L/203S/226L/230I/290R、14E/15G/77V/200A/226L/230P、14E/15G/78L、14E/15G/78L/226L/230P、14E/15G/200A/230I、14E/77V/78L/200A/226L/230P/257T、14E/77V/78L/226L/230P/257T、14E/77V/201L/230I、14E/78L/200A/201L/226L/290R、14E/78L/200A/201L/339I、14E/78L/200A/226L/230P/339I、14E/78L/200A/226L/290R/339I、14E/78L/200A/230I/339I、14E/200A/203S/226L/230I、14E/200A/203S/226L/230P/257T/339I、14E/200A/203S/230P/339I、14E/201L/203S/226L、15G/77V、15G/77V/78L、15G/77V/78L/200A/201L/203S/226L/230P、15G/77V/200A/201L/203S/226L/230P/290R/339I、15G/77V/200A/230P、15G/77V/200A/230P/290R/339I、15G/77V/201L/226L/230I/339I、15G/77V/226L/230P/290R/339I、15G/78L/201L、15G/78L/201L/203S/230P、15G/78L/201L/230P/290R、15G/78L/203S/226L/230I、15G/200A、15G/201L/203S/226L/230P/257T/339I、15G/226L/230I/339I、15G/230I、15G/230P、32P、32P/103P、32P/103P/106R/207E/210L/235T/321M/368Q、32P/103P/207E/228V/232I/373D、32P/103P/210L/273P/321M/373D、32P/103P/273P、32P/106R、32P/106R/207E/210L/232I、32P/106R/210L、32P/106R/210L/373D、32P/106R/235T/321M、32P/106R/235T/368Q、32P/106R/273Q/321M/373D、32P/207E/210L/273Q、32P/207E/210L/368Q/373D、32P/207E/235T、32P/210L/232I/235T/368Q、32P/210L/273P、32P/235T/273Q、77V/78L/200A/226L/339I、77V/78L/201L/226L/257T/339I、77V/78L/203S、77V/78L/203S/230P/339I、77V/200A/201L、77V/200A/201L/226L/230P/339I、77V/200A/203S/230P/257T/339I、77V/200A/230P、78L、78L/200A/230P、78L/203S/230P/290R、78L/226L/230I、78L/226L/230P、78L/226L/290R、103P/106R/207E/321M、103P/106R/210L、103P/207E/210L/235T/321M、103P/210L/232N/235T、103P/232I/273Q、106R、106R/207E/210L/232I/235T/321M/368Q/373D、106R/207E/235T/321M/368Q、106R/235T/273P/373D、106R/273Q、200A、200A/203S/226L/230P/339I、200A/230I/257T、201L、201L/203S、201L/230P/257T、201L/230P/290R、203S、203S/226L/230I/257T、203S/226L/230P、207E/235T、207E/235T/368Q、207E/368Q/373D、207E/373D、232I/235T/321M、232N/235T、232N/235T/273Q/368Q、232N/235T/321M、235T、235T/273P和273P。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:P14E/S15G/I77V/F78L、P14E/S15G/I77V/F78L/R200A/T201L/F226L/N230P/Q290R、P14E/S15G/I77V/F78L/R200A/V203S/N230I/Q290H、P14E/S15G/I77V/F78L/V203S/F226L/N230I/Q290R、P14E/S15G/I77V/R200A/F226L/N230P、P14E/S15G/F78L、P14E/S15G/F78L/F226L/N230P、P14E/S15G/R200A/N230I、P14E/I77V/F78L/R200A/F226L/N230P/D257T、P14E/I77V/F78L/F226L/N230P/D257T、P14E/I77V/T201L/N230I、P14E/F78L/R200A/T201L/F226L/Q290R、P14E/F78L/R200A/T201L/Q339I、P14E/F78L/R200A/F226L/N230P/Q339I、P14E/F78L/R200A/F226L/Q290R/Q339I、P14E/F78L/R200A/N230I/Q339I、P14E/R200A/V203S/F226L/N230I、P14E/R200A/V203S/F226L/N230P/D257T/Q339I、P14E/R200A/V203S/N230P/Q339I、P14E/T201L/V203S/F226L、S15G/I77V、S15G/I77V/F78L、S15G/I77V/F78L/R200A/T201L/V203S/F226L/N230P、S15G/I77V/R200A/T201L/V203S/F226L/N230P/Q290R/Q339I、S15G/I77V/R200A/N230P、S15G/I77V/R200A/N230P/Q290R/Q339I、S15G/I77V/T201L/F226L/N230I/Q339I、S15G/I77V/F226L/N230P/Q290R/Q339I、S15G/F78L/T201L、S15G/F78L/T201L/V203S/N230P、S15G/F78L/T201L/N230P/Q290R、S15G/F78L/V203S/F226L/N230I、S15G/R200A、S15G/T201L/V203S/F226L/N230P/D257T/Q339I、S15G/F226L/N230I/Q339I、S15G/N230I、S15G/N230P、Q32P、Q32P/D103P、Q32P/D103P/E106R/L207E/I210L/E235T/I321M/I368Q、Q32P/D103P/L207E/I228V/G232I/G373D、Q32P/D103P/I210L/I273P/I321M/G373D、Q32P/D103P/I273P、Q32P/E106R、Q32P/E106R/L207E/I210L/G232I、Q32P/E106R/I210L、Q32P/E106R/I210L/G373D、Q32P/E106R/E235T/I321M、Q32P/E106R/E235T/I368Q、Q32P/E106R/I273Q/I321M/G373D、Q32P/L207E/I210L/I273Q、Q32P/L207E/I210L/I368Q/G373D、Q32P/L207E/E235T、Q32P/I210L/G232I/E235T/I368Q、Q32P/I210L/I273P、Q32P/E235T/I273Q、I77V/F78L/R200A/F226L/Q339I、I77V/F78L/T201L/F226L/D257T/Q339I、I77V/F78L/V203S、I77V/F78L/V203S/N230P/Q339I、I77V/R200A/T201L、I77V/R200A/T201L/F226L/N230P/Q339I、I77V/R200A/V203S/N230P/D257T/Q339I、I77V/R200A/N230P、F78L、F78L/R200A/N230P、F78L/V203S/N230P/Q290R、F78L/F226L/N230I、F78L/F226L/N230P、F78L/F226L/Q290R、D103P/E106R/L207E/I321M、D103P/E106R/I210L、D103P/L207E/I210L/E235T/I321M、D103P/I210L/G232N/E235T、D103P/G232I/I273Q、E106R、E106R/L207E/I210L/G232I/E235T/I321M/I368Q/G373D、E106R/L207E/E235T/I321M/I368Q、E106R/E235T/I273P/G373D、E106R/I273Q、R200A、R200A/V203S/F226L/N230P/Q339I、R200A/N230I/D257T、T201L、T201L/V203S、T201L/N230P/D257T、T201L/N230P/Q290R、V203S、V203S/F226L/N230I/D257T、V203S/F226L/N230P、L207E/E235T、L207E/E235T/I368Q、L207E/I368Q/G373D、L207E/G373D、G232I/E235T/I321M、G232N/E235T、G232N/E235T/I273Q/I368Q、G232N/E235T/I321M、E235T、E235T/I273P和I273P。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/77/200/226/230、14/15/78/226/230、14/15/200/230、14/77/78/200/226/230/257、14/77/201/230、14/78/200/226/230/339、14/78/200/226/290/339、14/200/203/226/230、14/201/203/226、15/77、15/77/78/200/201/203/226/230、15/77/200/230、15/77/201/226/230/339、15/78/201/203/230、15/78/203/226/230、15/230、32、32/103/106/207/210/235/321/368、32/103/210/273/321/373、32/103/273、32/106/207/210/232、32/106/210、32/106/235/368、32/207/210/368/373、32/207/235、32/210/232/273/321、32/210/232/273/368/373、32/210/273、32/235/273、77/78/200/226/339、77/200/230、78/203/230/290、78/226/230、78/226/290、103/106/207/321、103/106/210、103/207/210/235/321、103/210/232/235、103/232/273、106/207/235/321/368、106/235/273/373、201/203、203/226/230、207/235/368、232/235、232/235/321、235和235/273。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:14E/15G/77V/78L/200A/201L/226L/230P/290R、14E/15G/77V/78L/200A/203S/230I/290H、14E/15G/77V/78L/203S/226L/230I/290R、14E/15G/77V/200A/226L/230P、14E/15G/78L/226L/230P、14E/15G/200A/230I、14E/77V/78L/200A/226L/230P/257T、14E/77V/201L/230I、14E/78L/200A/226L/230P/339I、14E/78L/200A/226L/290R/339I、14E/200A/203S/226L/230I、14E/201L/203S/226L、15G/77V、15G/77V/78L/200A/201L/203S/226L/230P、15G/77V/200A/230P、15G/77V/201L/226L/230I/339I、15G/78L/201L/203S/230P、15G/78L/203S/226L/230I、15G/230I、32P、32P/103P/106R/207E/210L/235T/321M/368Q、32P/103P/210L/273P/321M/373D、32P/103P/273P、32P/106R/207E/210L/232I、32P/106R/210L、32P/106R/235T/368Q、32P/207E/210L/368Q/373D、32P/207E/235T、32P/210L/232I/273P/321M、32P/210L/232N/273Q/368Q/373D、32P/210L/273P、32P/235T/273Q、77V/78L/200A/226L/339I、77V/200A/230P、78L/203S/230P/290R、78L/226L/230I、78L/226L/230P、78L/226L/290R、103P/106R/207E/321M、103P/106R/210L、103P/207E/210L/235T/321M、103P/210L/232N/235T、103P/232I/273Q、106R/207E/235T/321M/368Q、106R/235T/273P/373D、201L/203S、203S/226L/230P、207E/235T/368Q、232N/235T、232N/235T/321M、235T和235T/273P。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3488具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3488相比选自以下的一个或更多个残基差异或残基差异集:P14E/S15G/I77V/F78L/R200A/T201L/F226L/N230P/Q290R、P14E/S15G/I77V/F78L/R200A/V203S/N230I/Q290H、P14E/S15G/I77V/F78L/V203S/F226L/N230I/Q290R、P14E/S15G/I77V/R200A/F226L/N230P、P14E/S15G/F78L/F226L/N230P、P14E/S15G/R200A/N230I、P14E/I77V/F78L/R200A/F226L/N230P/D257T、P14E/I77V/T201L/N230I、P14E/F78L/R200A/F226L/N230P/Q339I、P14E/F78L/R200A/F226L/Q290R/Q339I、P14E/R200A/V203S/F226L/N230I、P14E/T201L/V203S/F226L、S15G/I77V、S15G/I77V/F78L/R200A/T201L/V203S/F226L/N230P、S15G/I77V/R200A/N230P、S15G/I77V/T201L/F226L/N230I/Q339I、S15G/F78L/T201L/V203S/N230P、S15G/F78L/V203S/F226L/N230I、S15G/N230I、Q32P、Q32P/D103P/E106R/L207E/I210L/E235T/I321M/I368Q、Q32P/D103P/I210L/I273P/I321M/G373D、Q32P/D103P/I273P、Q32P/E106R/L207E/I210L/G232I、Q32P/E106R/I210L、Q32P/E106R/E235T/I368Q、Q32P/L207E/I210L/I368Q/G373D、Q32P/L207E/E235T、Q32P/I210L/G232I/I273P/I321M、Q32P/I210L/G232N/I273Q/I368Q/G373D、Q32P/I210L/I273P、Q32P/E235T/I273Q、I77V/F78L/R200A/F226L/Q339I、I77V/R200A/N230P、F78L/V203S/N230P/Q290R、F78L/F226L/N230I、F78L/F226L/N230P、F78L/F226L/Q290R、D103P/E106R/L207E/I321M、D103P/E106R/I210L、D103P/L207E/I210L/E235T/I321M、D103P/I210L/G232N/E235T、D103P/G232I/I273Q、E106R/L207E/E235T/I321M/I368Q、E106R/E235T/I273P/G373D、T201L/V203S、V203S/F226L/N230P、L207E/E235T/I368Q、G232N/E235T、G232N/E235T/I321M、E235T和E235T/I273P。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:53、262、264、265、266、267、270、271、272、273、275、277、321、322、324、325、339、346、347、350、355、360、370、371、376、380、383、386和388。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:53T、262R、264E、264S、265P、266D、266T、267G、267S、270N、271G、272R、273P、273V、275G、275K、275Q、275R、277S、321C、321S、321V、322A、324A、324E、324L、324P、324R、325A、325H、325K、325T、325V、339M、346L、347F、347W、350W、355P、360N、360S、370Y、371E、371G、376A、380S、380T、383D、383E、383V、386W和388H。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:E53T、T262R、V264E、V264S、E265P、G266D、G266T、Q267G、Q267S、S270N、P271G、K272R、I273P、I273V、A275G、A275K、A275Q、A275R、D277S、I321C、I321S、I321V、T322A、F324A、F324E、F324L、F324P、F324R、E325A、E325H、E325K、E325T、E325V、Q339M、R346L、Y347F、Y347W、E350W、L355P、R360N、R360S、L370Y、S371E、S371G、E376A、G380S、G380T、G383D、G383E、G383V、Y386W和E388H。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:53、219、229、262、264、265、266、267、270、271、272、273、275、277、278、280、321、322、324、325、339、346、347、350、355、360、370、371、376、380、383、386、387、388和390。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:53T、219T、229V、262R、264E、265P、266D、266T、267E、267G、267S、270N、271G、271T、272R、273P、273V、275G、275K、275Q、275R、275S、277S、278G、278P、280S、321C、321S、321V、322A、324A、324D、324E、324L、324P、324R、324V、325A、325G、325H、325K、325P、325R、325V、339M、346L、346Q、347F、347W、350W、355P、360N、360S、370Y、371E、371G、376A、376R、376T、380S、380T、383D、383E、383T、383V、386W、387I、388H和390A。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:E53T、P219T、T229V、T262R、V264E、E265P、G266D、G266T、Q267E、Q267G、Q267S、S270N、P271G、P271T、K272R、I273P、I273V、A275G、A275K、A275Q、A275R、A275S、D277S、N278G、N278P、Q280S、I321C、I321S、I321V、T322A、F324A、F324D、F324E、F324L、F324P、F324R、F324V、E325A、E325G、E325H、E325K、E325P、E325R、E325V、Q339M、R346L、R346Q、Y347F、Y347W、E350W、L355P、R360N、R360S、L370Y、S371E、S371G、E376A、E376R、E376T、G380S、G380T、G383D、G383E、G383T、G383V、Y386W、L387I、E388H和W390A。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:72、264、267、270、271、272、273、280、321、322、324、325、339、346、347、349、355、360、371和383。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:3958相比选自以下的一个或更多个残基差异或残基差异集:72R、264E、264Q、264S、267M、270N、271G、272R、273P、273V、280S、321S、321V、322A、324D、324E、324L、324R、324V、325K、325R、339M、346S、347F、349A、349S、349V、355P、360G、360S、360T、371R、383D和383E。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3958具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3958相比选自以下的一个或更多个残基差异或残基差异集:K72R、V264E、V264Q、V264S、Q267M、S270N、P271G、K272R、I273P、I273V、Q280S、I321S、I321V、T322A、F324D、F324E、F324L、F324R、F324V、E325K、E325R、Q339M、R346S、Y347F、E349A、E349S、E349V、L355P、R360G、R360S、R360T、S371R、G383D和G383E。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:32/103/207/210/344/349、32/103/207/321/344、32/207/210/279、32/273/344/373、32/279、32/279/321、104/106、104/106/111/200/201/235/268/368、104/106/200/201/268、106/111/200/235/368、106/200/201、106/200/201/209/368、106/200/201/368、106/201/235、111、200/235/368、201/368、207/210/273/279/344、207/210/273/321/344/349、207/273、210、210/273/279、210/279、273/279和273/279/373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:32P/103P/207E/210L/344T/349S、32P/103P/207E/321M/344T、32P/207E/210L/279H、32P/273P/344T/373D、32P/279H、32P/279H/321M、104L/106Q/111V/200A/201L/235T/268I/368Q、104L/106R、104L/106R/200A/201R/268I、106Q/200A/201R/368Q、106Q/201L/235T、106R/111V/200A/235T/368Q、106R/200A/201L、106R/200A/201R/209A/368Q、111V、200A/235T/368Q、201L/368Q、207E/210L/273P/279H/344T、207E/210L/273P/321M/344T/349S、207E/273P、210L、210L/273P/279H、210L/279H、273P/279H和273P/279H/373D。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:Q32P/D103P/L207E/I210L/L344T/E349S、Q32P/D103P/L207E/I321M/L344T、Q32P/L207E/I210L/F279H、Q32P/I273P/L344T/G373D、Q32P/F279H、Q32P/F279H/I321M、V104L/E106Q/E111V/R200A/T201L/E235T/L268I/I368Q、V104L/E106R、V104L/E106R/R200A/T201R/L268I、E106Q/R200A/T201R/I368Q、E106Q/T201L/E235T、E106R/E111V/R200A/E235T/I368Q、E106R/R200A/T201L、E106R/R200A/T201R/T209A/I368Q、E111V、R200A/E235T/I368Q、T201L/I368Q、L207E/I210L/I273P/F279H/L344T、L207E/I210L/I273P/I321M/L344T/E349S、L207E/I273P、I210L、I210L/I273P/F279H、I210L/F279H、I273P/F279H和I273P/F279H/G373D。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:32/103/207/210/344/349、32/103/207/321/344、32/103/321/344、32/207/210/279、32/207/273/279/321、32/207/279、32/207/344、32/273/279/344/349、32/273/344/373、32/279、32/279/321、104/106、104/106/111/200/201/235/268/368、104/106/111/200/201/268、104/106/111/201/235/368、106、106/111/200/201、106/111/200/201/268/368、106/111/200/235/368、106/111/201、106/111/201/368、106/200/201、106/200/201/235、106/201/235、106/201/268、111、111/200/201/268、111/200/368、200/235/368、200/368、207/210/273/279/344、207/210/273/279/344/349/373、207/210/273/321/344/349、207/273、207/279/349、210、210/273/279、210/273/279/349、210/279、273/279和273/279/373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:32P/103P/207E/210L/344T/349S、32P/103P/207E/321M/344T、32P/103P/321M/344T、32P/207E/210L/279H、32P/207E/273P/279H/321M、32P/207E/279H、32P/207E/344T、32P/273P/279H/344T/349S、32P/273P/344T/373D、32P/279H、32P/279H/321M、104L/106Q/111V/200A/201L/235T/268I/368Q、104L/106R、104L/106R/111V/200A/201L/268I、104L/106R/111V/201R/235T/368Q、106Q/200A/201R/235T、106Q/201L/235T、106R、106R/111V/200A/201L、106R/111V/200A/201L/268I/368Q、106R/111V/200A/201R/268I/368Q、106R/111V/200A/235T/368Q、106R/111V/201L、106R/111V/201R/368Q、106R/200A/201L、106R/201R/268I、111V、111V/200A/201R/268I、111V/200A/368Q、200A/235T/368Q、200A/368Q、207E/210L/273P/279H/344T、207E/210L/273P/279H/344T/349S/373D、207E/210L/273P/321M/344T/349S、207E/273P、207E/279H/349S、210L、210L/273P/279H、210L/273P/279H/349S、210L/279H、273P/279H和273P/279H/373D。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:3788具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:3788相比选自以下的一个或更多个残基差异或残基差异集:Q32P/D103P/L207E/I210L/L344T/E349S、Q32P/D103P/L207E/I321M/L344T、Q32P/D103P/I321M/L344T、Q32P/L207E/I210L/F279H、Q32P/L207E/I273P/F279H/I321M、Q32P/L207E/F279H、Q32P/L207E/L344T、Q32P/I273P/F279H/L344T/E349S、Q32P/I273P/L344T/G373D、Q32P/F279H、Q32P/F279H/I321M、V104L/E106Q/E111V/R200A/T201L/E235T/L268I/I368Q、V104L/E106R、V104L/E106R/E111V/R200A/T201L/L268I、V104L/E106R/E111V/T201R/E235T/I368Q、E106Q/R200A/T201R/E235T、E106Q/T201L/E235T、E106R、E106R/E111V/R200A/T201L、E106R/E111V/R200A/T201L/L268I/I368Q、E106R/E111V/R200A/T201R/L268I/I368Q、E106R/E111V/R200A/E235T/I368Q、E106R/E111V/T201L、E106R/E111V/T201R/I368Q、E106R/R200A/T201L、E106R/T201R/L268I、E111V、E111V/R200A/T201R/L268I、E111V/R200A/I368Q、R200A/E235T/I368Q、R200A/I368Q、L207E/I210L/I273P/F279H/L344T、L207E/I210L/I273P/F279H/L344T/E349S/G373D、L207E/I210L/I273P/I321M/L344T/E349S、L207E/I273P、L207E/F279H/E349S、I210L、I210L/I273P/F279H、I210L/I273P/F279H/E349S、I210L/F279H、I273P/F279H和I273P/F279H/G373D。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:32、32/111/235、32/111/235/271/272/339、32/111/235/339、32/111/235/386、32/235、32/235/271/339、32/235/272、32/235/272/339、32/235/272/386、32/235/339/386、32/271/339、32/272、68/106/200、68/344/383、74/106/270/344、103/324、106/200/321/322/383、106/270/344、111/235、111/235/271/339、111/235/272/339/386、111/235/339、111/272/339/386、200、200/270、200/270/322/383、200/344、235、235/271/272/339/386、235/271/339、235/271/339/386、235/272、235/272/339、235/272/386、235/339、235/339/386、270/322/344/383、324、325、344、344/370和370。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:32P、32P/111V/235T、32P/111V/235T/271G/272R/339T、32P/111V/235T/339M、32P/111V/235T/339N、32P/111V/235T/386W、32P/235T、32P/235T/271G/339T、32P/235T/272R、32P/235T/272R/339M、32P/235T/272R/386W、32P/235T/339M/386W、32P/235T/339N/386W、32P/271G/339M、32P/272R、68G/106R/200A、68G/344T/383D、74V/106R/270N/344T、103P/324E、106R/200A/321V/322A/383D、106R/270N/344T、111V/235T、111V/235T/271G/339N、111V/235T/272R/339N/386W、111V/235T/339T、111V/272R/339N/386W、200A、200A/270N、200A/270N/322A/383D、200A/344T、235T、235T/271G/272R/339M/386W、235T/271G/339M/386W、235T/271G/339N、235T/272R、235T/272R/339M、235T/272R/339T、235T/272R/386W、235T/339M、235T/339M/386W、235T/339N、235T/339N/386W、270N/322A/344T/383D、324R、325H、344T、344T/370Y和370Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:4124相比选自以下的一个或更多个残基差异或残基差异集:Q32P、Q32P/E111V/E235T、Q32P/E111V/E235T/P271G/K272R/Q339T、Q32P/E111V/E235T/Q339M、Q32P/E111V/E235T/Q339N、Q32P/E111V/E235T/Y386W、Q32P/E235T、Q32P/E235T/P271G/Q339T、Q32P/E235T/K272R、Q32P/E235T/K272R/Q339M、Q32P/E235T/K272R/Y386W、Q32P/E235T/Q339M/Y386W、Q32P/E235T/Q339N/Y386W、Q32P/P271G/Q339M、Q32P/K272R、C68G/E106R/R200A、C68G/L344T/G383D、A74V/E106R/S270N/L344T、D103P/F324E、E106R/R200A/I321V/T322A/G383D、E106R/S270N/L344T、E111V/E235T、E111V/E235T/P271G/Q339N、E111V/E235T/K272R/Q339N/Y386W、E111V/E235T/Q339T、E111V/K272R/Q339N/Y386W、R200A、R200A/S270N、R200A/S270N/T322A/G383D、R200A/L344T、E235T、E235T/P271G/K272R/Q339M/Y386W、E235T/P271G/Q339M/Y386W、E235T/P271G/Q339N、E235T/K272R、E235T/K272R/Q339M、E235T/K272R/Q339T、E235T/K272R/Y386W、E235T/Q339M、E235T/Q339M/Y386W、E235T/Q339N、E235T/Q339N/Y386W、S270N/T322A/L344T/G383D、F324R、E325H、L344T、L344T/L370Y和L370Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:32/111/235、32/111/235/339、32/111/235/339/386、32/111/235/386、32/235、32/235/272/339、32/235/272/386、32/235/339/386、32/339、68/106/200、68/106/321/322、68/200、68/200/270/321、68/270/321/322、68/344、68/344/383、74/106/270/344、103/324、106/200/321/322/383、106/270/344、111/235、111/235/272/339/386、111/235/339、111/272/339/386、200、200/270、200/270/322/383、200/344、229、229/325、235、235/271/272/339、235/272、235/272/339、235/272/386、235/339、235/339/386、262、262/325/349、270/322/344/383、278、324、325、344、344/370、349和370。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:32P/111V/235T、32P/111V/235T/339M、32P/111V/235T/339N、32P/111V/235T/339T/386W、32P/111V/235T/386W、32P/235T、32P/235T/272R/339M、32P/235T/272R/386W、32P/235T/339M/386W、32P/235T/339N/386W、32P/235T/339T/386W、32P/339N、68G/106R/200A、68G/106R/321V/322A、68G/200A、68G/200A/270N/321V、68G/270N/321V/322A、68G/344T、68G/344T/383D、74V/106R/270N/344T、103P/324E、106R/200A/321V/322A/383D、106R/270N/344T、111V/235T、111V/235T/272R/339N/386W、111V/235T/339T、111V/272R/339N/386W、200A、200A/270N、200A/270N/322A/383D、200A/344T、229V、229V/325H、235T、235T/271G/272R/339N、235T/272R、235T/272R/339M、235T/272R/339T、235T/272R/386W、235T/339M、235T/339M/386W、235T/339N、235T/339N/386W、262R、262R/325H/349N、270N/322A/344T/383D、278R、324R、325H、344T、344T/370Y、349N和370Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:Q32P/E111V/E235T、Q32P/E111V/E235T/Q339M、Q32P/E111V/E235T/Q339N、Q32P/E111V/E235T/Q339T/Y386W、Q32P/E111V/E235T/Y386W、Q32P/E235T、Q32P/E235T/K272R/Q339M、Q32P/E235T/K272R/Y386W、Q32P/E235T/Q339M/Y386W、Q32P/E235T/Q339N/Y386W、Q32P/E235T/Q339T/Y386W、Q32P/Q339N、C68G/E106R/R200A、C68G/E106R/I321V/T322A、C68G/R200A、C68G/R200A/S270N/I321V、C68G/S270N/I321V/T322A、C68G/L344T、C68G/L344T/G383D、A74V/E106R/S270N/L344T、D103P/F324E、E106R/R200A/I321V/T322A/G383D、E106R/S270N/L344T、E111V/E235T、E111V/E235T/K272R/Q339N/Y386W、E111V/E235T/Q339T、E111V/K272R/Q339N/Y386W、R200A、R200A/S270N、R200A/S270N/T322A/G383D、R200A/L344T、T229V、T229V/E325H、E235T、E235T/P271G/K272R/Q339N、E235T/K272R、E235T/K272R/Q339M、E235T/K272R/Q339T、E235T/K272R/Y386W、E235T/Q339M、E235T/Q339M/Y386W、E235T/Q339N、E235T/Q339N/Y386W、T262R、T262R/E325H/E349N、S270N/T322A/L344T/G383D、N278R、F324R、E325H、L344T、L344T/L370Y、E349N和L370Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:9/302、26、44/193、47、54、58、62、63、64、70、89、99、110、144、153、154、155、159、161、162、163、164、170、174、181、184、189、190、192、193、194、220、237、238、241、243、244、245、246、248、249、250、252、258、260、275/291、284、289、291、293、294、295、296、300、301、302、303、304、305、306、307、308和309。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:9D/302S、26A、26F、26Q、26T、44C/193D、47L、54R、54V、58D、58S、62A、62G、63S、64Y、70S、89M、89T、99G、99N、99Q、99V、110M、110N、110S、110V、144I、153C、153M、154L、155Y、159R、159W、161P、162A、162F、162G、162I、162P、163V、164C、164M、170F、174R、181L、184T、189G、189R、190I、192L、193A、193C、193D、193G、193K、193Y、194L、220S、220Y、237C、237P、237S、237T、237Y、238S、241P、243A、244C、244I、245G、246I、246M、248R、249N、250R、252S、258C、258V、260N、275S/291N、284S、289D、291N、291R、293A、293G、293I、293S、293T、294A、294K、294V、295L、295P、295S、296R、300M、300P、300S、300V、301G、301T、302C、302G、302L、303G、303N、303Q、303Y、304V、304W、305P、305S、305T、305V、306C、306T、307E、307R、307S、308F、308I、308L、308R、308S、309C、309D、309L、309N、309Q、309R、309T和309Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:G9D/K302S、I26A、I26F、I26Q、I26T、Y44C/L193D、K47L、I54R、I54V、N58D、N58S、K62A、K62G、E63S、N64Y、E70S、K89M、K89T、D99G、D99N、D99Q、D99V、E110M、E110N、E110S、E110V、E144I、T153C、T153M、V154L、E155Y、A159R、A159W、K161P、S162A、S162F、S162G、S162I、S162P、L163V、K164C、K164M、K170F、L174R、S181L、S184T、D189G、D189R、A190I、T192L、L193A、L193C、L193D、L193G、L193K、L193Y、I194L、M220S、M220Y、D237C、D237P、D237S、D237T、D237Y、E238S、H241P、V243A、V244C、V244I、D245G、L246I、L246M、K248R、K249N、Q250R、L252S、I258C、I258V、E260N、A275S/P291N、A284S、Y289D、P291N、P291R、V293A、V293G、V293I、V293S、V293T、D294A、D294K、D294V、N295L、N295P、N295S、S296R、T300M、T300P、T300S、T300V、S301G、S301T、K302C、K302G、K302L、K303G、K303N、K303Q、K303Y、S304V、S304W、D305P、D305S、D305T、D305V、M306C、M306T、A307E、A307R、A307S、E308F、E308I、E308L、E308R、E308S、V309C、V309D、V309L、V309N、V309Q、V309R、V309T和V309Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:9/302、26、55、58、62、91、110、143、148、154、162、163、173、174、184、190、192、193、194、196、205、206、220、232、237、238、245、246、248、249、253、275/291、284、286、287、289、291、293、295、296、300、301、302、303、304、305、306、307、308和309。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:9D/302S、26A、26G、26Q、26T、55V、58D、62R、62W、91L、110L、110M、110N、110T、110V、110Y、143A、148M、154L、162A、162C、162F、162T、162V、163I、173M、174E、184L、184Q、184T、190C、190G、192D、193A、193C、193D、193G、193V、193Y、194C、194L、196A、205A、205E、206P、220S、232N、237C、237L、237P、237S、237T、237Y、238S、245C、245S、246I、248R、249G、249L、249S、253M、275S/291N、284S、286C、287R、289M、289V、291N、291R、291Y、293I、293S、293T、295L、296C、296R、300F、300M、300P、300V、301A、301G、301T、301V、302A、302C、302L、303A、303G、303M、303N、303P、303R、304G、304L、304V、305G、305S、306A、306G、306L、306P、306T、306W、307S、308L、309A、309D、309F、309L、309N和309Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4124具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4124相比选自以下的一个或更多个残基差异或残基差异集:G9D/K302S、I26A、I26G、I26Q、I26T、M55V、N58D、K62R、K62W、I91L、E110L、E110M、E110N、E110T、E110V、E110Y、S143A、R148M、V154L、S162A、S162C、S162F、S162T、S162V、L163I、F173M、L174E、S184L、S184Q、S184T、A190C、A190G、T192D、L193A、L193C、L193D、L193G、L193V、L193Y、I194C、I194L、K196A、D205A、D205E、A206P、M220S、G232N、D237C、D237L、D237P、D237S、D237T、D237Y、E238S、D245C、D245S、L246I、K248R、K249G、K249L、K249S、L253M、A275S/P291N、A284S、L286C、K287R、Y289M、Y289V、P291N、P291R、P291Y、V293I、V293S、V293T、N295L、S296C、S296R、T300F、T300M、T300P、T300V、S301A、S301G、S301T、S301V、K302A、K302C、K302L、K303A、K303G、K303M、K303N、K303P、K303R、S304G、S304L、S304V、D305G、D305S、M306A、M306G、M306L、M306P、M306T、M306W、A307S、E308L、V309A、V309D、V309F、V309L、V309N和V309Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:32/103/106/111/322/324、32/106/280、32/235、32/235/386、32/321/324/360、32/324、60/106/111/235/360、60/280/360、74/200/339、103、103/106/360、103/111/235/280/360、103/111/235/321/324、106、106/111、106/111/322/383/386、106/235、106/235/383/386、106/324、111、111/235/280、111/322/360、200/270/275/339、235、235/280、235/280/321/322/324、235/280/321/324/383/386、267/270/275/339/347、267/272/275、280、280/383、321/324和360/383。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:32P/103P/106R/111V/322T/324E、32P/106R/280S、32P/235T、32P/235T/386W、32P/321V/324D/360S、32P/324D、60R/106R/111V/235T/360S、60R/280S/360S、74V/200A/339M、103P、103P/106R/360S、103P/111V/235T/280S/360S、103P/111V/235T/321V/324D、106R、106R/111V、106R/111V/322T/383E/386W、106R/235T、106R/235T/383E/386W、106R/324D、111V、111V/235T/280S、111V/322T/360S、200A/270S/275K/339M、235T、235T/280S、235T/280S/321V/322T/324D、235T/280S/321V/324E/383E/386W、267M/270S/275K/339M/347F、267M/272R/275K、280S、280S/383E、321V/324R和360S/383E。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:Q32P/D103P/E106R/E111V/A322T/F324E、Q32P/E106R/Q280S、Q32P/E235T、Q32P/E235T/Y386W、Q32P/I321V/F324D/R360S、Q32P/F324D、K60R/E106R/E111V/E235T/R360S、K60R/Q280S/R360S、A74V/R200A/Q339M、D103P、D103P/E106R/R360S、D103P/E111V/E235T/Q280S/R360S、D103P/E111V/E235T/I321V/F324D、E106R、E106R/E111V、E106R/E111V/A322T/D383E/Y386W、E106R/E235T、E106R/E235T/D383E/Y386W、E106R/F324D、E111V、E111V/E235T/Q280S、E111V/A322T/R360S、R200A/N270S/A275K/Q339M、E235T、E235T/Q280S、E235T/Q280S/I321V/A322T/F324D、E235T/Q280S/I321V/F324E/D383E/Y386W、Q267M/N270S/A275K/Q339M/Y347F、Q267M/K272R/A275K、Q280S、Q280S/D383E、I321V/F324R和R360S/D383E。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:32/103/106/111/322/324、32/235、32/235/386、32/321/324/360、32/322/324/383/386、32/324、60/106/111/235/360、72/74/200/272/339/347、103、103/106/360、103/111/235/280/360、103/111/235/321/324、106、106/111、106/111/322/324/386、106/111/322/383/386、106/235、106/235/383/386、106/324、111、111/235/280、111/322/360、200/270/275/339、235、235/280、235/280/321/322/324、267/270/275/339/347、267/272/275、280、280/383、321/324和360/383。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:32P/103P/106R/111V/322T/324E、32P/235T、32P/235T/386W、32P/321V/324D/360S、32P/322T/324R/383E/386W、32P/324D、60R/106R/111V/235T/360S、72R/74V/200A/272R/339N/347F、103P、103P/106R/360S、103P/111V/235T/280S/360S、103P/111V/235T/321V/324D、106R、106R/111V、106R/111V/322T/324E/386W、106R/111V/322T/383E/386W、106R/235T、106R/235T/383E/386W、106R/324D、111V、111V/235T/280S、111V/322T/360S、200A/270S/275K/339M、235T、235T/280S、235T/280S/321V/322T/324D、267M/270S/275K/339M/347F、267M/272R/275K、280S、280S/383E、321V/324R和360S/383E。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:Q32P/D103P/E106R/E111V/A322T/F324E、Q32P/E235T、Q32P/E235T/Y386W、Q32P/I321V/F324D/R360S、Q32P/A322T/F324R/D383E/Y386W、Q32P/F324D、K60R/E106R/E111V/E235T/R360S、K72R/A74V/R200A/K272R/Q339N/Y347F、D103P、D103P/E106R/R360S、D103P/E111V/E235T/Q280S/R360S、D103P/E111V/E235T/I321V/F324D、E106R、E106R/E111V、E106R/E111V/A322T/F324E/Y386W、E106R/E111V/A322T/D383E/Y386W、E106R/E235T、E106R/E235T/D383E/Y386W、E106R/F324D、E111V、E111V/E235T/Q280S、E111V/A322T/R360S、R200A/N270S/A275K/Q339M、E235T、E235T/Q280S、E235T/Q280S/I321V/A322T/F324D、Q267M/N270S/A275K/Q339M/Y347F、Q267M/K272R/A275K、Q280S、Q280S/D383E、I321V/F324R和R360S/D383E。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:48、50、53、57、58、63、65、68、69、73、75、85、94、104、105、123、135、140、141、166、167、180、184、185、187、192、209、210、217、220、239、244、253、256、260、261、265/346、266、267、268、273、274、275、282、284、325、344、349、350、352、353、360、361、365、371、378和386。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:48I、50E、53D、57L、58D、63D、63G、65G、65N、65R、65V、65W、68M、68R、69A、69H、69M、69T、73K、75G、75I、75V、85I、94V、104I、105L、123N、135I、140I、141R、166N、167R、180G、180R、180V、184D、185F、185R、187D、192L、192Q、209A、210L、210T、210V、217R、220I、220Q、220R、239V、244L、253I、256G、256Q、260N、261A、261K、261R、265K/346M、266R、267K、268I、273G、274W、275K、275R、275V、282M、284C、284S、325S、344I、344M、349A、349H、349R、349V、349W、349Y、350I、350R、350V、350Y、352K、353C、360G、360Q、361C、365Q、371G、371K、371M、371T、371V、378V和386F。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:F48I、D50E、E53D、E57L、N58D、E63D、E63G、L65G、L65N、L65R、L65V、L65W、C68M、C68R、L69A、L69H、L69M、L69T、R73K、A75G、A75I、A75V、V85I、L94V、V104I、I105L、D123N、V135I、V140I、K141R、S166N、K167R、A180G、A180R、A180V、S184D、K185F、K185R、E187D、T192L、T192Q、T209A、I210L、I210T、I210V、G217R、M220I、M220Q、M220R、L239V、V244L、L253I、E256G、E256Q、E260N、S261A、S261K、S261R、E265K/R346M、G266R、Q267K、L268I、P273G、D274W、A275K、A275R、A275V、C282M、A284C、A284S、E325S、T344I、T344M、E349A、E349H、E349R、E349V、E349W、E349Y、E350I、E350R、E350V、E350Y、R352K、D353C、R360G、R360Q、L361C、K365Q、S371G、S371K、S371M、S371T、S371V、I378V和Y386F。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:48、50、53、56、57、58、63、65、68、69、70、73、75、105、135、140、141、166、167、175、176、180、185、187、192、210、217、220、239、244、256、260、261、266、268、271、274、275、280、282、284、325、330、344、346、349、350、352、358、360、361、369、371、378、384和386。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:48I、48L、50E、53D、56V、57L、58D、63D、63G、65A、65G、65N、65R、65V、68M、68Q、68R、68V、69A、69G、69H、69M、69T、70K、70N、70R、73K、75G、75I、75M、75V、105L、135I、140I、141R、166N、167R、175H、176H、180G、180R、180V、185F、185M、185R、187D、192L、192Q、210L、210V、217R、220I、220Q、220R、239V、244L、256G、256Q、256S、260N、261A、261H、261K、261R、266R、268I、271R、274G、275K、275R、275V、280G、282M、284C、284S、325S、330T、344I、346K、349A、349R、349V、349W、349Y、350C、350I、350R、350V、350Y、352K、358A、360G、360K、360Q、361C、369L、371G、371K、371V、378V、384V和386F。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4226具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4226相比选自以下的一个或更多个残基差异或残基差异集:F48I、F48L、D50E、E53D、A56V、E57L、N58D、E63D、E63G、L65A、L65G、L65N、L65R、L65V、C68M、C68Q、C68R、C68V、L69A、L69G、L69H、L69M、L69T、E70K、E70N、E70R、R73K、A75G、A75I、A75M、A75V、I105L、V135I、V140I、K141R、S166N、K167R、Y175H、Y176H、A180G、A180R、A180V、K185F、K185M、K185R、E187D、T192L、T192Q、I210L、I210V、G217R、M220I、M220Q、M220R、L239V、V244L、E256G、E256Q、E256S、E260N、S261A、S261H、S261K、S261R、G266R、L268I、P271R、D274G、A275K、A275R、A275V、Q280G、C282M、A284C、A284S、E325S、A330T、T344I、R346K、E349A、E349R、E349V、E349W、E349Y、E350C、E350I、E350R、E350V、E350Y、R352K、N358A、R360G、R360K、R360Q、L361C、F369L、S371G、S371K、S371V、I378V、L384V和Y386F。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:32、32/161/193/237/360、32/162、32/162/193/267、32/162/237/265/266、32/162/302、32/302、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、154、154/166、154/166/210/296、154/339、156/210/339、161/162、161/237、162、162/193/232/267/302/360、162/237/265/266/267/302、162/265、162/267/360、166/210、166/296、166/346/347、167/210/346/349、193/267、201/371、210/339、237、237/265、237/266/360、237/360、339和371。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:32P、32P/161R/193A/237P/360S、32P/162F、32P/162F/193A/267M、32P/162F/237P/265P/266Q、32P/162F/302L、32P/302L、53T/163M/201R/325H/329F、53T/200A/201R/325H/329F、53T/201R、53T/201R/275K/280S、154R、154R/166N、154R/166T/210L/296R、154R/339M、156V/210L/339M、161G/162F、161G/237P、161R/162F、162F/193A/232N/267M/302L/360S、162F/265P、162F/267M/360S、162R、162R/237P/265P/266Q/267M/302L、166N/210L、166N/296R、166N/346W/347F、167R/210L/346W/349S、193A/267M、201R/371R、210L/339M、237P、237P/265P、237P/266Q/360S、237P/360S、339M和371R。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:Q32P、Q32P/K161R/L193A/D237P/R360S、Q32P/S162F、Q32P/S162F/L193A/Q267M、Q32P/S162F/D237P/E265P/G266Q、Q32P/S162F/K302L、Q32P/K302L、E53T/L163M/T201R/E325H/Y329F、E53T/R200A/T201R/E325H/Y329F、E53T/T201R、E53T/T201R/A275K/Q280S、V154R、V154R/S166N、V154R/S166T/I210L/S296R、V154R/Q339M、E156V/I210L/Q339M、K161G/S162F、K161G/D237P、K161R/S162F、S162F/L193A/G232N/Q267M/K302L/R360S、S162F/E265P、S162F/Q267M/R360S、S162R、S162R/D237P/E265P/G266Q/Q267M/K302L、S166N/I210L、S166N/S296R、S166N/R346W/Y347F、K167R/I210L/R346W/E349S、L193A/Q267M、T201R/S371R、I210L/Q339M、D237P、D237P/E265P、D237P/G266Q/R360S、D237P/R360S、Q339M和S371R。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:32、32/162、32/162/193、32/162/193/267、32/162/237/265/266、32/162/302、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、53/201/371、82/154/296、154、154/166、154/166/210/296、154/166/346/347、154/166/347、154/167/210/347/349、154/296/347、154/339、154/347、156/166/167、161/162、161/237、162、162/193/232/267/302/360、162/237/265/266/267/302、162/265、162/267/360、163/201、164/275/280、166/210、166/296、166/346/347、193/267、201/371、210/339、237、237/265和339。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:32P、32P/162F、32P/162F/193A/267M、32P/162F/237P/265P/266Q、32P/162F/302L、32P/162R/193A、53T/163M/201R/325H/329F、53T/200A/201R/325H/329F、53T/201R、53T/201R/275K/280S、53T/201R/371R、82S/154R/296R、154R、154R/166N、154R/166N/346S/347F、154R/166N/347F、154R/166T/210L/296R、154R/167R/210L/347F/349S、154R/296R/347F、154R/339M、154R/347F、156V/166T/167R、161G/237P、161R/162F、162F/193A/232N/267M/302L/360S、162F/265P、162F/267M/360S、162R、162R/237P/265P/266Q/267M/302L、163M/201R、164M/275K/280S、166N/210L、166N/296R、166N/346W/347F、193A/267M、201R/371R、210L/339M、237P、237P/265P和339M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:4734具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:4734相比选自以下的一个或更多个残基差异或残基差异集:Q32P、Q32P/S162F、Q32P/S162F/L193A/Q267M、Q32P/S162F/D237P/E265P/G266Q、Q32P/S162F/K302L、Q32P/S162R/L193A、E53T/L163M/T201R/E325H/Y329F、E53T/R200A/T201R/E325H/Y329F、E53T/T201R、E53T/T201R/A275K/Q280S、E53T/T201R/S371R、P82S/V154R/S296R、V154R、V154R/S166N、V154R/S166N/R346S/Y347F、V154R/S166N/Y347F、V154R/S166T/I210L/S296R、V154R/K167R/I210L/Y347F/E349S、V154R/S296R/Y347F、V154R/Q339M、V154R/Y347F、E156V/S166T/K167R、K161G/D237P、K161R/S162F、S162F/L193A/G232N/Q267M/K302L/R360S、S162F/E265P、S162F/Q267M/R360S、S162R、S162R/D237P/E265P/G266Q/Q267M/K302L、L163M/T201R、K164M/A275K/Q280S、S166N/I210L、S166N/S296R、S166N/R346W/Y347F、L193A/Q267M、T201R/S371R、I210L/Q339M、D237P、D237P/E265P和Q339M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:32、32/72/339、32/72/339/360、32/140/141/261/360、32/140/339、32/140/360、32/141/180/244、32/180/261/339、32/244/261、32/339、53/73/75/237/239、69/220、69/339、70、70/72/180/360、70/140/141/339、70/360、72/256/360、72/360、75/237/350、140/141/256/261/339、140/180/244/261/339/360、141/244/261/360、141/244/360、141/256/339/360、141/261/339、141/360、155/220/325/339、180/339、220、220/339、256/360和261。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:32P、32P/72R/339M、32P/72R/339M/360G、32P/140I/141R/261R/360S、32P/140I/339M、32P/140I/360G、32P/141R/180R/244L、32P/180R/261R/339M、32P/244L/261R、32P/339M、53T/73K/75V/237P/239V、69A/220R、69A/339M、70R、70R/72R/180R/360G、70R/140I/141R/339M、70R/360S、72R/256Q/360S、72R/360G、75I/237P/350R、140I/141R/256Q/261R/339M、140I/180R/244L/261R/339M/360G、141R/244L/261R/360S、141R/244L/360S、141R/256Q/339M/360G、141R/261R/339M、141R/360S、155Y/220R/325S/339M、180R/339M、220R、220R/339M、256Q/360S和261R。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:Q32P、Q32P/K72R/Q339M、Q32P/K72R/Q339M/R360G、Q32P/V140I/K141R/S261R/R360S、Q32P/V140I/Q339M、Q32P/V140I/R360G、Q32P/K141R/A180R/V244L、Q32P/A180R/S261R/Q339M、Q32P/V244L/S261R、Q32P/Q339M、E53T/R73K/A75V/D237P/L239V、L69A/M220R、L69A/Q339M、E70R、E70R/K72R/A180R/R360G、E70R/V140I/K141R/Q339M、E70R/R360S、K72R/E256Q/R360S、K72R/R360G、A75I/D237P/E350R、V140I/K141R/E256Q/S261R/Q339M、V140I/A180R/V244L/S261R/Q339M/R360G、K141R/V244L/S261R/R360S、K141R/V244L/R360S、K141R/E256Q/Q339M/R360G、K141R/S261R/Q339M、K141R/R360S、E155Y/M220R/E325S/Q339M、A180R/Q339M、M220R、M220R/Q339M、E256Q/R360S和S261R。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:32/72/339、32/72/339/360、32/140/141/261/360、32/140/339、32/180/261/339、32/244/261、32/339、53/73/75/237/239、56/75/154/156/192/239/280/282、56/75/192/239、56/192/282/350、65/220/339、69/220、69/339、70/72、70/72/140/244/261/339、70/72/141/244、70/261/339/360、72/180/244/339、72/256/360、72/360、140/141/256/261/339、140/180/244/261/339/360、141/244/360、141/256/339/360、141/261/339、141/360、150/244/261/360、154/156/282/350、155/220/325/339、180/339、220、220/339、244/256/261/339/360、325、325/339和339。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:32P/72R/339M、32P/72R/339M/360G、32P/140I/141R/261R/360S、32P/140I/339M、32P/180R/261R/339M、32P/244L/261R、32P/339M、53T/73K/75V/237P/239V、56V/75I/154V/156V/192L/239V/280G/282M、56V/75V/192L/239V、56V/192Q/282M/350I、65R/220Q/339M、69A/220R、69A/339M、70R/72R、70R/72R/140I/244L/261R/339M、70R/72R/141R/244L、70R/261R/339M/360S、72R/180R/244L/339M、72R/256Q/360S、72R/360G、140I/141R/256Q/261R/339M、140I/180R/244L/261R/339M/360G、141R/244L/360S、141R/256Q/339M/360G、141R/261R/339M、141R/360S、150D/244L/261R/360S、154V/156V/282M/350I、155Y/220R/325S/339M、180R/339M、220R、220R/339M、244L/256Q/261R/339M/360S、325S、325S/339M和339M。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5052具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5052相比选自以下的一个或更多个残基差异或残基差异集:Q32P/K72R/Q339M、Q32P/K72R/Q339M/R360G、Q32P/V140I/K141R/S261R/R360S、Q32P/V140I/Q339M、Q32P/A180R/S261R/Q339M、Q32P/V244L/S261R、Q32P/Q339M、E53T/R73K/A75V/D237P/L239V、A56V/A75I/R154V/E156V/T192L/L239V/Q280G/C282M、A56V/A75V/T192L/L239V、A56V/T192Q/C282M/E350I、L65R/M220Q/Q339M、L69A/M220R、L69A/Q339M、E70R/K72R、E70R/K72R/V140I/V244L/S261R/Q339M、E70R/K72R/K141R/V244L、E70R/S261R/Q339M/R360S、K72R/A180R/V244L/Q339M、K72R/E256Q/R360S、K72R/R360G、V140I/K141R/E256Q/S261R/Q339M、V140I/A180R/V244L/S261R/Q339M/R360G、K141R/V244L/R360S、K141R/E256Q/Q339M/R360G、K141R/S261R/Q339M、K141R/R360S、G150D/V244L/S261R/R360S、R154V/E156V/C282M/E350I、E155Y/M220R/E325S/Q339M、A180R/Q339M、M220R、M220R/Q339M、V244L/E256Q/S261R/Q339M/R360S、E325S、E325S/Q339M和Q339M。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5152具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5152相比选自以下的一个或更多个残基差异或残基差异集:53、53/237、65/140、65/140/192/193、65/140/192/193/302、65/193、140/192/193/302、140/193/302、180、192/193、239和302。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5152具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5152相比选自以下的一个或更多个残基差异或残基差异集:53T、53T/237P、65R/140I、65R/140I/192L/193D、65R/140I/192L/193D/302L、65R/193D、140I/192L/193D/302L、140I/193D/302L、180V、192L/193D、239V和302L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5152具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5152相比选自以下的一个或更多个残基差异或残基差异集:E53T、E53T/D237P、L65R/V140I、L65R/V140I/T192L/L193D、L65R/V140I/T192L/L193D/K302L、L65R/L193D、V140I/T192L/L193D/K302L、V140I/L193D/K302L、A180V、T192L/L193D、L239V和K302L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5252具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5252相比选自以下的一个或更多个残基差异或残基差异集:48/53/237/239、48/256/261、140、141/261、162、220、220/349、261、302和350。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5252具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5252相比选自以下的一个或更多个残基差异或残基差异集:48I/53T/237P/239V、48I/256G/261R、140I、141R/261R、162F、220Q、220Q/349V、261R、302L和350Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5252具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5252相比选自以下的一个或更多个残基差异或残基差异集:F48I/E53T/D237P/L239V、F48I/E256G/S261R、V140I、K141R/S261R、S162F、M220Q、M220Q/E349V、S261R、K302L和E350Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:65、65/184/187、82/184/220/386、154、154/184、154/187/220/350/386、154/293、154/350、154/386、184/187、184/293、187/220/350、187/293、220、220/293、293、293/350、293/350/386、350和386。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:65R、65R/184T/187D、82S/184T/220Q/386F、154L、154L/184T、154L/187D/220Q/350I/386F、154L/293T、154L/350I、154L/386F、184T/187D、184T/293T、187D/220Q/350R、187D/293T、220Q、220Q/293T、293T、293T/350R、293T/350R/386F、350R和386F。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:L65R、L65R/S184T/E187D、P82S/S184T/M220Q/Y386F、R154L、R154L/S184T、R154L/E187D/M220Q/E350I/Y386F、R154L/V293T、R154L/E350I、R154L/Y386F、S184T/E187D、S184T/V293T、E187D/M220Q/E350R、E187D/V293T、M220Q、M220Q/V293T、V293T、V293T/E350R、V293T/E350R/Y386F、E350R和Y386F。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:157、160、186、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、206、209、210、211、227、229、230、233、234、235、236、237/381、238、241、242、243、247、253、258、260、267、272、278、282、286、288、290、292、297、298、299、327、331、368、373和381。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:157V、160F、160M、160V、160Y、186A、186L、186V、188K、188M、188V、189A、189L、189R、190I、190M、190S、191L、191M、192T、192V、192Y、193E、193G、193Q、193R、194F、194R、194T、194W、195I、195L、196G、196T、197Q、198V、199M、199W、200L、200M、200T、200W、201S、201Y、202W、203D、203I、203L、203R、204G、206H、209R、210A、210C、210T、211V、227V、229G、229R、230N、233L、233S、233W、234G、234Q、234R、234V、235H、235L、236P、237G/381W、238G、238L、238R、238W、241A、241E、241L、241R、241S、241W、242V、243M、243S、247V、253V、258C、258L、258V、260A、260G、260M、267T、272R、272S、278S、282T、286A、286C、286V、288A、288K、288Y、290P、292R、297F、297G、297P、297V、298F、298R、298T、299M、299N、299R、299S、299V、299Y、327H、331K、368G、368Q、368S、368T、368V、373Q、381L和381V。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:A157V、S160F、S160M、S160V、S160Y、E186A、E186L、E186V、A188K、A188M、A188V、D189A、D189L、D189R、A190I、A190M、A190S、V191L、V191M、L192T、L192V、L192Y、D193E、D193G、D193Q、D193R、I194F、I194R、I194T、I194W、V195I、V195L、K196G、K196T、E197Q、T198V、V199M、V199W、R200L、R200M、R200T、R200W、T201S、T201Y、V202W、S203D、S203I、S203L、S203R、P204G、A206H、T209R、I210A、I210C、I210T、A211V、L227V、T229G、T229R、I230N、R233L、R233S、R233W、P234G、P234Q、P234R、P234V、T235H、T235L、D236P、D237G/H381W、E238G、E238L、E238R、E238W、H241A、H241E、H241L、H241R、H241S、H241W、K242V、V243M、V243S、L247V、L253V、I258C、I258L、I258V、E260A、E260G、E260M、Q267T、K272R、K272S、N278S、C282T、L286A、L286C、L286V、L288A、L288K、L288Y、R290P、K292R、A297F、A297G、A297P、A297V、V298F、V298R、V298T、G299M、G299N、G299R、G299S、G299V、G299Y、F327H、L331K、I368G、I368Q、I368S、I368T、I368V、D373Q、H381L和H381V。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:160、186、188、189、190、191、192、193、194、195、196、197、199、200、201、202、203、204、209、210、211、229、230、233、234、235、236、237/381、238、241、243、244、247、253、260、278、286、288、292、297、298、299、327、331、368、373和381。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:160F、160V、160Y、186A、186L、186V、188K、188M、189A、189R、190I、190M、190Q、190S、191L、191M、192V、192Y、193E、193G、193Q、194F、195I、196E、196T、197S、199M、199W、200L、200T、200W、201M、202L、203G、204C、204L、209R、209S、210A、210C、210T、211V、229R、229V、230N、233L、234Q、234V、235H、236R、237G/381W、238L、238R、238W、241R、241S、243M、243S、244S、247F、253V、260A、260G、278S、286C、286V、288A、292R、297V、298F、298T、299N、299S、327H、331K、368E、368S、368T、373Q、373R和381L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5296具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5296相比选自以下的一个或更多个残基差异或残基差异集:S160F、S160V、S160Y、E186A、E186L、E186V、A188K、A188M、D189A、D189R、A190I、A190M、A190Q、A190S、V191L、V191M、L192V、L192Y、D193E、D193G、D193Q、I194F、V195I、K196E、K196T、E197S、V199M、V199W、R200L、R200T、R200W、T201M、V202L、S203G、P204C、P204L、T209R、T209S、I210A、I210C、I210T、A211V、T229R、T229V、I230N、R233L、P234Q、P234V、T235H、D236R、D237G/H381W、E238L、E238R、E238W、H241R、H241S、V243M、V243S、V244S、L247F、L253V、E260A、E260G、N278S、L286C、L286V、L288A、K292R、A297V、V298F、V298T、G299N、G299S、F327H、L331K、I368E、I368S、I368T、D373Q、D373R和H381L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:26、26/60/200、26/60/200/203/292、26/60/203/229/234/290、26/200/203、26/200/203/229、26/200/290、26/203/234/290/292、60、60/200/203/290、60/203、157/162、157/368、162/242/368、200、200/203/229/234、200/203/290、200/206、200/234/290、200/290/292/360、203、203/229、229/360和360。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:26T、26T/60R/200W、26T/60R/200W/203D/292R、26T/60R/203D/229R/234G/290N、26T/200W/203D、26T/200W/203D/229R、26T/200W/290N、26T/203D/234G/290N/292R、60R、60R/200W/203D/290N、60R/203D、157V/162F、157V/368Q、162F/242N/368T、200W、200W/203D/229R/234G、200W/203D/290N、200W/206P、200W/234G/290N、200W/290N/292R/360S、203D、203D/229R、229R/360S和360S。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:I26T、I26T/K60R/R200W、I26T/K60R/R200W/S203D/K292R、I26T/K60R/S203D/T229R/P234G/R290N、I26T/R200W/S203D、I26T/R200W/S203D/T229R、I26T/R200W/R290N、I26T/S203D/P234G/R290N/K292R、K60R、K60R/R200W/S203D/R290N、K60R/S203D、A157V/S162F、A157V/I368Q、S162F/K242N/I368T、R200W、R200W/S203D/T229R/P234G、R200W/S203D/R290N、R200W/A206P、R200W/P234G/R290N、R200W/R290N/K292R/G360S、S203D、S203D/T229R、T229R/G360S和G360S。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:26、26/60/200、26/60/200/203/229/234/267、26/60/200/203/229/267、26/60/200/203/229/267/290、26/60/200/203/234/267、26/60/200/203/292、26/60/200/234/290、26/60/203/229/234/290、26/60/229/267、26/60/290、26/200、26/200/203、26/200/203/229、26/200/290、26/229/234/360、53/157/278/327/331、53/162/327/331/368、60、60/200/203/290、60/200/229/234、60/200/234、60/200/234/267/290/292、60/200/234/290、60/203、157/162、157/162/241/242/260、157/162/241/242/327/331、157/162/241/278/331/368、157/162/241/331、157/162/242/260/331、157/162/331、157/327/331、162/241/278/327/331、162/241/331、162/242/368、200、200/203/229/234、200/203/290、200/206、200/234/290、200/290/292/360、210/211/242、229/360、241/242/368、242/331、260/327、260/331、260/368、331、360和368。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:26T、26T/60R/200W、26T/60R/200W/203D/229R/234G/267K、26T/60R/200W/203D/229R/267K、26T/60R/200W/203D/229R/267K/290N、26T/60R/200W/203D/234G/267K、26T/60R/200W/203D/292R、26T/60R/200W/234G/290N、26T/60R/203D/229R/234G/290N、26T/60R/229R/267K、26T/60R/290N、26T/200W、26T/200W/203D、26T/200W/203D/229R、26T/200W/290N、26T/229R/234G/360S、53T/157V/278G/327H/331K、53T/162F/327H/331N/368Q、60R、60R/200W/203D/290N、60R/200W/229R/234G、60R/200W/234G、60R/200W/234G/267K/290N/292R、60R/200W/234G/290N、60R/203D、157L/162F/241S/331K、157V/162F、157V/162F/241S/242N/260A、157V/162F/241S/242N/327H/331K、157V/162F/241S/278G/331K/368Q、157V/162F/242N/260A/331K、157V/162F/331K、157V/327H/331K、162F/241S/278G/327H/331K、162F/241S/331K、162F/242N/368T、200W、200W/203D/229R/234G、200W/203D/290N、200W/206P、200W/234G/290N、200W/290N/292R/360S、210T/211V/242N、229R/360S、241S/242N/368Q、242N/331K、260A/327H、260A/331K、260A/368Q、331K、360S和368Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:I26T、I26T/K60R/R200W、I26T/K60R/R200W/S203D/T229R/P234G/Q267K、I26T/K60R/R200W/S203D/T229R/Q267K、I26T/K60R/R200W/S203D/T229R/Q267K/R290N、I26T/K60R/R200W/S203D/P234G/Q267K、I26T/K60R/R200W/S203D/K292R、I26T/K60R/R200W/P234G/R290N、I26T/K60R/S203D/T229R/P234G/R290N、I26T/K60R/T229R/Q267K、I26T/K60R/R290N、I26T/R200W、I26T/R200W/S203D、I26T/R200W/S203D/T229R、I26T/R200W/R290N、I26T/T229R/P234G/G360S、E53T/A157V/N278G/F327H/L331K、E53T/S162F/F327H/L331N/I368Q、K60R、K60R/R200W/S203D/R290N、K60R/R200W/T229R/P234G、K60R/R200W/P234G、K60R/R200W/P234G/Q267K/R290N/K292R、K60R/R200W/P234G/R290N、K60R/S203D、A157L/S162F/H241S/L331K、A157V/S162F、A157V/S162F/H241S/K242N/E260A、A157V/S162F/H241S/K242N/F327H/L331K、A157V/S162F/H241S/N278G/L331K/I368Q、A157V/S162F/K242N/E260A/L331K、A157V/S162F/L331K、A157V/F327H/L331K、S162F/H241S/N278G/F327H/L331K、S162F/H241S/L331K、S162F/K242N/I368T、R200W、R200W/S203D/T229R/P234G、R200W/S203D/R290N、R200W/A206P、R200W/P234G/R290N、R200W/R290N/K292R/G360S、I210T/A211V/K242N、T229R/G360S、H241S/K242N/I368Q、K242N/L331K、E260A/F327H、E260A/L331K、E260A/I368Q、L331K、G360S和I368Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:217、226、239、256、264、273、275、315、325、328、339、342、342/363、344、345、346、350、351、352、353、361、363、364、365、366、367、371、374、376、380、383和388。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:217L、226M、226S、226T、239K、256S、264E、264L、264M、273S、275E、275R、275V、315A、325N、325T、328H、339F、342A、342C、342C/363S、342G、342L、342N、342S、342T、342W、342Y、344I、345W、346T、346V、346W、350Q、351I、351M、351V、352K、352Q、353C、353M、353N、361M、363H、364V、365S、366N、367K、367Y、371C、374A、374R、376L、376M、380R、380S、380V、383Q和388Q。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:G217L、L226M、L226S、L226T、L239K、G256S、V264E、V264L、V264M、P273S、Q275E、Q275R、Q275V、V315A、E325N、E325T、A328H、M339F、R342A、R342C、R342C/D363S、R342G、R342L、R342N、R342S、R342T、R342W、R342Y、T344I、R345W、R346T、R346V、R346W、E350Q、E351I、E351M、E351V、R352K、R352Q、D353C、D353M、D353N、L361M、D363H、L364V、K365S、K366N、G367K、G367Y、S371C、S374A、S374R、E376L、E376M、G380R、G380S、G380V、D383Q和E388Q。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:113/355、134、169/390、217、226、239、256、264、265、271、275、313、314、315、321、325、328、332、339、342、342/363、344、345、346、348、349、350、351、352、353、354、356、360、361、362、363、364、365、366、367、369、370、371、374、376、377、378、380、382、383、384、385、386、388和391。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:5628相比选自以下的一个或更多个残基差异或残基差异集:113G/355S、134N、169R/390P、217F、217H、217L、217S、217V、217Y、226S、226T、239Q、239Y、256S、264E、264L、264M、265A、265S、265Y、271S、275E、275R、275V、313G、314C、315A、315T、321E、321Q、325G、325P、325T、328E、328H、328V、332I、332T、339A、339F、339G、342C、342C/363S、342K、342L、342N、342T、342W、342Y、344S、345W、346T、346W、348S、349G、349T、350S、351A、351G、351I、351M、351R、351S、351T、351V、352G、352K、352Q、352S、352T、352V、353C、353I、353M、353N、353R、353Y、354A、354I、354Q、354S、356C、356V、360M、361A、361F、361M、362W、363H、363L、363S、364G、364P、365A、365C、365E、365G、365L、365S、365V、365Y、366E、366G、366N、366S、366T、367D、367K、367L、367Y、369L、369N、369S、370C、370F、370M、370Q、370R、370S、370V、370W、371C、371G、374A、374E、374L、374R、374W、376G、376L、376M、377A、377R、377T、378A、378C、378L、378V、380R、380S、380V、382V、383A、383E、383I、383K、383N、383Q、383T、383V、383W、383Y、384C、384M、384V、385H、385L、385R、385V、386I、386L、386T、386V、388D、388G、388Q、388Y、391G、391L、391V、391W和391Y。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5628具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5628相比选自以下的一个或更多个残基差异或残基差异集:E113G/L355S、S134N、Q169R/W390P、G217F、G217H、G217L、G217S、G217V、G217Y、L226S、L226T、L239Q、L239Y、G256S、V264E、V264L、V264M、E265A、E265S、E265Y、P271S、Q275E、Q275R、Q275V、K313G、A314C、V315A、V315T、V321E、V321Q、E325G、E325P、E325T、A328E、A328H、A328V、L332I、L332T、M339A、M339F、M339G、R342C、R342C/D363S、R342K、R342L、R342N、R342T、R342W、R342Y、T344S、R345W、R346T、R346W、A348S、E349G、E349T、E350S、E351A、E351G、E351I、E351M、E351R、E351S、E351T、E351V、R352G、R352K、R352Q、R352S、R352T、R352V、D353C、D353I、D353M、D353N、D353R、D353Y、M354A、M354I、M354Q、M354S、L356C、L356V、G360M、L361A、L361F、L361M、Y362W、D363H、D363L、D363S、L364G、L364P、K365A、K365C、K365E、K365G、K365L、K365S、K365V、K365Y、K366E、K366G、K366N、K366S、K366T、G367D、G367K、G367L、G367Y、F369L、F369N、F369S、L370C、L370F、L370M、L370Q、L370R、L370S、L370V、L370W、S371C、S371G、S374A、S374E、S374L、S374R、S374W、E376G、E376L、E376M、E377A、E377R、E377T、I378A、I378C、I378L、I378V、G380R、G380S、G380V、L382V、D383A、D383E、D383I、D383K、D383N、D383Q、D383T、D383V、D383W、D383Y、L384C、L384M、L384V、D385H、D385L、D385R、D385V、Y386I、Y386L、Y386T、Y386V、E388D、E388G、E388Q、E388Y、E391G、E391L、E391V、E391W和E391Y。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/189/297、184/200、184/206/242/290/297、184/211、184/242、184/242/297/368、184/290/297、184/290/368、188/211、188/211/242/290/297/368、192/193/211/242/297/368、192/193/290/297/368、193/194、194、194/242、194/242/290、200、200/203、200/203/290/368、203/206/368、203/242/290/297/368、203/297、206/290、211、211/368、242/290、242/290/297、297和368。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:184T/188K/200W/203D/211V/242N、184T/188K/200W/203D/242N/297F、184T/188K/200W/203D/290N/297F/368T、184T/188K/203D/290N/297F、184T/188K/211V/242N/290N/368T、184T/189A、184T/189A/206P/297F/368T、184T/189A/297F、184T/200W、184T/206P/242N/290N/297F、184T/211V、184T/242N、184T/242N/297F/368T、184T/290N/297F、184T/290N/368T、188K/211V、188K/211V/242N/290N/297F/368T、192V/193G/211V/242N/297F/368T、192V/193G/290N/297F/368T、193G/194F、194F、194F/242N、194F/242N/290N、200W、200W/203D、200W/203D/290N/368T、203D/206P/368T、203D/242N/290N/297F/368T、203D/297F、206P/290N、211V、211V/368T、242N/290N、242N/290N/297F、297F和368T。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:S184T/A188K/R200W/S203D/A211V/K242N、S184T/A188K/R200W/S203D/K242N/A297F、S184T/A188K/R200W/S203D/R290N/A297F/I368T、S184T/A188K/S203D/R290N/A297F、S184T/A188K/A211V/K242N/R290N/I368T、S184T/D189A、S184T/D189A/A206P/A297F/I368T、S184T/D189A/A297F、S184T/R200W、S184T/A206P/K242N/R290N/A297F、S184T/A211V、S184T/K242N、S184T/K242N/A297F/I368T、S184T/R290N/A297F、S184T/R290N/I368T、A188K/A211V、A188K/A211V/K242N/R290N/A297F/I368T、L192V/D193G/A211V/K242N/A297F/I368T、L192V/D193G/R290N/A297F/I368T、D193G/I194F、I194F、I194F/K242N、I194F/K242N/R290N、R200W、R200W/S203D、R200W/S203D/R290N/I368T、S203D/A206P/I368T、S203D/K242N/R290N/A297F/I368T、S203D/A297F、A206P/R290N、A211V、A211V/I368T、K242N/R290N、K242N/R290N/A297F、A297F和I368T。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:184、184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/200、184/242、184/242/297/368、184/290/297、184/290/368、188/211/242/290/297/368、189/200、192/193/211/242/297/368、192/193/290/297/368、194/242、200、200/203、200/203/290/368、203/206/368、203/297、206/290、206/297、211/368、242/290、242/290/297、297和368。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:184T、184T/188K/200W/203D/211V/242N、184T/188K/200W/203D/242N/297F、184T/188K/200W/203D/290N/297F/368T、184T/188K/203D/290N/297F、184T/188K/211V/242N/290N/368T、184T/189A、184T/189A/206P/297F/368T、184T/200W、184T/242N、184T/242N/297F/368T、184T/290N/297F、184T/290N/368T、188K/211V/242N/290N/297F/368T、189A/200W、192V/193G/211V/242N/297F/368T、192V/193G/290N/297F/368T、194F/242N、200W、200W/203D、200W/203D/290N/368T、203D/206P/368T、203D/297F、206P/290N、206P/297F、211V/368T、242N/290N、242N/290N/297F、297F和368T。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5630具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5630相比选自以下的一个或更多个残基差异或残基差异集:S184T、S184T/A188K/R200W/S203D/A211V/K242N、S184T/A188K/R200W/S203D/K242N/A297F、S184T/A188K/R200W/S203D/R290N/A297F/I368T、S184T/A188K/S203D/R290N/A297F、S184T/A188K/A211V/K242N/R290N/I368T、S184T/D189A、S184T/D189A/A206P/A297F/I368T、S184T/R200W、S184T/K242N、S184T/K242N/A297F/I368T、S184T/R290N/A297F、S184T/R290N/I368T、A188K/A211V/K242N/R290N/A297F/I368T、D189A/R200W、L192V/D193G/A211V/K242N/A297F/I368T、L192V/D193G/R290N/A297F/I368T、I194F/K242N、R200W、R200W/S203D、R200W/S203D/R290N/I368T、S203D/A206P/I368T、S203D/A297F、A206P/R290N、A206P/A297F、A211V/I368T、K242N/R290N、K242N/R290N/A297F、A297F和I368T。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5632相比选自以下的一个或更多个残基差异或残基差异集:56、57、59、63、65、66、73、128/296、140、144/220、149、151、159、209/211、210/211、219、219/300、230、261、272、273、275、278、292、324、327、331、345、364、371和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5632相比选自以下的一个或更多个残基差异或残基差异集:56G、57M、59H、59W、63G、65E、65M、65N、65P、66A、66G、66L、66N、73G、73M、128V/296G、140T、144G/220R、149E、149I、149L、151H、151K、151W、151Y、159E、159N、159Q、159R、159S、209E/211A、210V/211A、219E、219I、219N、219S、219S/300A、219T、219V、230V、261S、272A、272E、272N、272R、272T、273-、273E、273L、275E、275L、278G、292D、292G、292R、292T、292Y、324E、327A、327Y、331E、331T、345Q、345W、364R、371F、371K、371P、371T、373G、373K、373Q、373R和373T。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5632相比选自以下的一个或更多个残基差异或残基差异集:A56G、E57M、Y59H、Y59W、E63G、L65E、L65M、L65N、L65P、Q66A、Q66G、Q66L、Q66N、R73G、R73M、A128V/S296G、V140T、E144G/Q220R、M149E、M149I、M149L、L151H、L151K、L151W、L151Y、A159E、A159N、A159Q、A159R、A159S、T209E/V211A、I210V/V211A、P219E、P219I、P219N、P219S、P219S/T300A、P219T、P219V、I230V、R261S、K272A、K272E、K272N、K272R、K272T、P273-、P273E、P273L、Q275E、Q275L、N278G、K292D、K292G、K292R、K292T、K292Y、D324E、F327A、F327Y、K331E、K331T、R345Q、R345W、L364R、S371F、S371K、S371P、S371T、D373G、D373K、D373Q、D373R和D373T。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5632相比选自以下的一个或更多个残基差异或残基差异集:56、57、59、61、65、66、73、74/272、75、79、128、128/296、134、140、144、145、149、151、155、156、157、158、159、200/202/203、209/211、210/211、211、219、219/300、228、230、242、242/244、261、262、270、272、273、275、278、292、319、322、324、327、339、344、345、364、371、373和381。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5632相比选自以下的一个或更多个残基差异或残基差异集:56G、57A、57C、57M、59F、59H、59L、59Q、61M、61S、61W、61Y、65E、65M、65N、65P、65T、66N、66V、73G、74T/272G、75S、79R、128G、128K、128S、128T、128V/296G、134C、134L、134Q、140G、140L、140M、140S、144A、145L、149G、149L、149T、151I、151M、151P、151V、155A、155K、155L、155N、155P、155S、156H、157T、158A、158D、158G、158M、158P、158S、159E、159G、159H、159N、159Q、159R、159S、159T、200R/202T/203S、209A/211A、209E/211A、209H/211A、209S/211A、210V/211A、211A、219E、219G、219H、219N、219R、219S、219S/300A、219T、219V、228L、230A、230C、230M、230S、230V、242G、242K/244T、242S、261A、261G、261N、261S、262E、262S、270C、270Q、272A、272N、272T、273L、275E、275L、275V、278G、278S、292D、292G、292I、292R、292T、292Y、319F、322C、324E、324G、324K、324R、324S、327A、327S、327Y、339E、344L、345K、345Q、364R、371K、371P、371R、371T、373G、373K、373Q、373R、373T、373V和381L。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5632具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ IDNO:5632相比选自以下的一个或更多个残基差异或残基差异集:A56G、E57A、E57C、E57M、Y59F、Y59H、Y59L、Y59Q、F61M、F61S、F61W、F61Y、L65E、L65M、L65N、L65P、L65T、Q66N、Q66V、R73G、A74T/K272G、A75S、K79R、A128G、A128K、A128S、A128T、A128V/S296G、S134C、S134L、S134Q、V140G、V140L、V140M、V140S、E144A、K145L、M149G、M149L、M149T、L151I、L151M、L151P、L151V、E155A、E155K、E155L、E155N、E155P、E155S、E156H、V157T、K158A、K158D、K158G、K158M、K158P、K158S、A159E、A159G、A159H、A159N、A159Q、A159R、A159S、A159T、W200R/V202T/D203S、T209A/V211A、T209E/V211A、T209H/V211A、T209S/V211A、I210V/V211A、V211A、P219E、P219G、P219H、P219N、P219R、P219S、P219S/T300A、P219T、P219V、I228L、I230A、I230C、I230M、I230S、I230V、N242G、N242K/V244T、N242S、R261A、R261G、R261N、R261S、T262E、T262S、N270C、N270Q、K272A、K272N、K272T、P273L、Q275E、Q275L、Q275V、N278G、N278S、K292D、K292G、K292I、K292R、K292T、K292Y、L319F、A322C、D324E、D324G、D324K、D324R、D324S、F327A、F327S、F327Y、M339E、T344L、R345K、R345Q、L364R、S371K、S371P、S371R、S371T、D373G、D373K、D373Q、D373R、D373T、D373V和H381L。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:65、65/70/155/209/228、65/128/209/371/373、65/151、65/155/209、65/155/209/352/353、65/159、65/209/219/352/353、65/209/352/353/371、65/228/352/353/373、65/228/371/373、65/352/353/371、128/159/209/352/353、128/209、128/209/219、128/209/219/352/353/371、128/209/228/371、128/209/371、128/209/371/373、128/209/373、128/338/352/353/373、151/209、151/209/371、151/209/373、151/228/352/353/373、151/228/373、151/352/353、151/352/353/371/373、155、155/209、155/228/352/353、159/209/352/353、208/209、209、209/219/352/353/371、209/219/371、209/228、209/352/353/371、209/371、209/371/373、209/373、219/228、219/352/353/371/373、219/371/373、228、228/371、228/371/373、228/373、352/353、352/353/371、371、371/373和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:65M、65M/70Q/155K/209E/228L、65M/128K/209E/371P/373T、65M/151K、65M/155K/209E、65M/155K/209E/352K/353N、65M/159R、65M/209E/219T/352K/353N、65M/209E/352K/353N/371P、65M/228L/352K/353N/373T、65M/228L/371P/373T、65M/352K/353N/371P、128K/159R/209E/352K/353N、128K/209E、128K/209E/219T、128K/209E/219T/352K/353N/371P、128K/209E/228L/371P、128K/209E/371P、128K/209E/371P/373T、128K/209E/373T、128K/338D/352K/353N/373T、151K/209E、151K/209E/371P、151K/209E/373T、151K/228L/352K/353N/373T、151K/228L/373T、151K/352K/353N、151K/352K/353N/371P/373T、155K、155K/209E、155K/228L/352K/353N、159R/209E/352K/353N、208M/209E、209E、209E/219T/352K/353N/371P、209E/219T/371P、209E/228L、209E/352K/353N/371P、209E/371P、209E/371P/373T、209E/373T、219T/228L、219T/352K/353N/371P/373T、219T/371P/373T、228L、228L/371P、228L/371P/373T、228L/373T、352K/353N、352K/353N/371P、371P、371P/373T和373T。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:L65M、L65M/E70Q/E155K/T209E/I228L、L65M/A128K/T209E/S371P/D373T、L65M/L151K、L65M/E155K/T209E、L65M/E155K/T209E/R352K/D353N、L65M/A159R、L65M/T209E/P219T/R352K/D353N、L65M/T209E/R352K/D353N/S371P、L65M/I228L/R352K/D353N/D373T、L65M/I228L/S371P/D373T、L65M/R352K/D353N/S371P、A128K/A159R/T209E/R352K/D353N、A128K/T209E、A128K/T209E/P219T、A128K/T209E/P219T/R352K/D353N/S371P、A128K/T209E/I228L/S371P、A128K/T209E/S371P、A128K/T209E/S371P/D373T、A128K/T209E/D373T、A128K/G338D/R352K/D353N/D373T、L151K/T209E、L151K/T209E/S371P、L151K/T209E/D373T、L151K/I228L/R352K/D353N/D373T、L151K/I228L/D373T、L151K/R352K/D353N、L151K/R352K/D353N/S371P/D373T、E155K、E155K/T209E、E155K/I228L/R352K/D353N、A159R/T209E/R352K/D353N、V208M/T209E、T209E、T209E/P219T/R352K/D353N/S371P、T209E/P219T/S371P、T209E/I228L、T209E/R352K/D353N/S371P、T209E/S371P、T209E/S371P/D373T、T209E/D373T、P219T/I228L、P219T/R352K/D353N/S371P/D373T、P219T/S371P/D373T、I228L、I228L/S371P、I228L/S371P/D373T、I228L/D373T、R352K/D353N、R352K/D353N/S371P、S371P、S371P/D373T和D373T。
在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:55/65/151、65、65/70/155/209/228、65/70/228/373、65/128、65/128/155/209/371、65/128/159/209/371/373、65/128/209/371、65/128/209/371/373、65/128/219/373、65/128/373、65/151、65/155/209、65/155/209/352/353、65/159、65/209/219/352/353、65/209/352/353/371、65/219/371、65/228/352/353/373、65/228/371、65/228/371/373、65/352/353、65/352/353/371、65/373、70/155/352/353、128、128/155/209、128/159、128/159/209/352/353、128/209、128/209/219、128/209/219/352/353/371、128/209/228/371、128/209/371、128/209/371/373、128/209/373、128/219/352/353、128/219/371/373、128/228/352/353、128/228/371、128/228/373、128/352/353、128/352/353/373、128/371、128/371/373、128/373、151、151/155、151/155/209、151/155/209/219/228/371/373、151/155/209/373、151/155/219/352/353/371、151/155/352/353、151/155/352/353/371/373、151/155/352/353/373、151/209、151/209/371、151/209/371/373、151/209/373、151/219、151/219/371、151/228/352/353/373、151/228/373、151/352/353、151/352/353/371/373、151/371、151/373、155、155/209、155/219、155/228/352/353、155/228/371、155/228/371/373、155/352/353/373、155/371、155/371/373、155/373、159/209/352/353、209、209/219/352/353/371、209/219/371、209/228、209/352/353/371、209/371、209/371/373、209/373、219、219/228、219/352/353/371/373、219/352/353/373、219/371、219/371/373、228/352/353、228/371、228/371/373、228/373、352/353、352/353/371、352/353/373、371、371/373和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ IDNO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:55/65/151、65、65/70/155/209/228、65/70/228/373、65/128、65/128/155/209/371、65/128/159/209/371/373、65/128/209/371、65/128/209/371/373、65/128/219/373、65/128/373、65/151、65/155/209、65/155/209/352/353、65/159、65/209/219/352/353、65/209/352/353/371、65/219/371、65/228/352/353/373、65/228/371、65/228/371/373、65/352/353、65/352/353/371、65/373、70/155/352/353、128、128/155/209、128/159、128/159/209/352/353、128/209、128/209/219、128/209/219/352/353/371、128/209/228/371、128/209/371、128/209/371/373、128/209/373、128/219/352/353、128/219/371/373、128/228/352/353、128/228/371、128/228/373、128/352/353、128/352/353/373、128/371、128/371/373、128/373、151、151/155、151/155/209、151/155/209/219/228/371/373、151/155/209/373、151/155/219/352/353/371、151/155/352/353、151/155/352/353/371/373、151/155/352/353/373、151/209、151/209/371、151/209/371/373、151/209/373、151/219、151/219/371、151/228/352/353/373、151/228/373、151/352/353、151/352/353/371/373、151/371、151/373、155、155/209、155/219、155/228/352/353、155/228/371、155/228/371/373、155/352/353/373、155/371、155/371/373、155/373、159/209/352/353、209、209/219/352/353/371、209/219/371、209/228、209/352/353/371、209/371、209/371/373、209/373、219、219/228、219/352/353/371/373、219/352/353/373、219/371、219/371/373、228/352/353、228/371、228/371/373、228/373、352/353、352/353/371、352/353/373、371、371/373和373。在一些实施方案中,工程化TdT多肽包含与参考序列SEQ ID NO:5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与SEQ ID NO:5636相比选自以下的一个或更多个残基差异或残基差异集:M55T/L65M/L151K、L65M、L65M/E70Q/E155K/T209E/I228L、L65M/E70Q/I228L/D373T、L65M/A128K、L65M/A128K/E155K/T209E/S371P、L65M/A128K/A159Q/T209E/S371P/D373T、L65M/A128K/T209E/S371P、L65M/A128K/T209E/S371P/D373T、L65M/A128K/P219T/D373T、L65M/A128K/D373T、L65M/L151K、L65M/E155K/T209E、L65M/E155K/T209E/R352K/D353N、L65M/A159R、L65M/T209E/P219T/R352K/D353N、L65M/T209E/R352K/D353N/S371P、L65M/P219T/S371P、L65M/I228L/R352K/D353N/D373T、L65M/I228L/S371P、L65M/I228L/S371P/D373T、L65M/R352K/D353N、L65M/R352K/D353N/S371P、L65M/D373T、E70Q/E155K/R352K/D353N、A128K、A128K/E155K/T209E、A128K/A159Q、A128K/A159R、A128K/A159R/T209E/R352K/D353N、A128K/T209E、A128K/T209E/P219T、A128K/T209E/P219T/R352K/D353N/S371P、A128K/T209E/I228L/S371P、A128K/T209E/S371P、A128K/T209E/S371P/D373T、A128K/T209E/D373T、A128K/P219T/R352K/D353N、A128K/P219T/S371P/D373T、A128K/I228L/R352K/D353N、A128K/I228L/S371P、A128K/I228L/D373T、A128K/R352K/D353N、A128K/R352K/D353N/D373T、A128K/S371P、A128K/S371P/D373T、A128K/D373T、L151K、L151K/E155K、L151K/E155K/T209E、L151K/E155K/T209E/P219T/I228L/S371P/D373T、L151K/E155K/T209E/D373T、L151K/E155K/P219T/R352K/D353N/S371P、L151K/E155K/R352K/D353N、L151K/E155K/R352K/D353N/S371P/D373T、L151K/E155K/R352K/D353N/D373T、L151K/T209E、L151K/T209E/S371P、L151K/T209E/S371P/D373T、L151K/T209E/D373T、L151K/P219T、L151K/P219T/S371P、L151K/I228L/R352K/D353N/D373T、L151K/I228L/D373T、L151K/R352K/D353N、L151K/R352K/D353N/S371P/D373T、L151K/S371P、L151K/D373T、E155K、E155K/T209E、E155K/P219T、E155K/I228L/R352K/D353N、E155K/I228L/S371P、E155K/I228L/S371P/D373T、E155K/R352K/D353N/D373T、E155K/S371P、E155K/S371P/D373T、E155K/D373T、A159R/T209E/R352K/D353N、T209E、T209E/P219T/R352K/D353N/S371P、T209E/P219T/S371P、T209E/I228L、T209E/R352K/D353N/S371P、T209E/S371P、T209E/S371P/D373T、T209E/D373T、P219T、P219T/I228L、P219T/R352K/D353N/S371P/D373T、P219T/R352K/D353N/D373T、P219T/S371P、P219T/S371P/D373T、I228L/R352K/D353N、I228L/S371P、I228L/S371P/D373T、I228L/D373T、R352K/D353N、R352K/D353N/S371P、R352K/D353N/D373T、S371P、S371P/D373T和D373T。
在一些实施方案中,工程化TdT多肽包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列具有至少60%、70%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列相比在选自以下位置处的一个或更多个残基差异或残基差异集:9、10、11、12、14、15、16、17、18、19、20、21、22、23、24、26、27、28、29、30、32、34、36、38、40、42、44、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、77、78、79、80、82、84、85、86、87、89、91、92、93、94、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、115、116、117、118、119、120、122、123、124、125、127、131、133、134、135、136、140、141、143、144、145、147、148、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、170、173、174、175、176、177、180、181、182、184、185、186、187、189、190、192、193、194、196、197、198、200、201、202、203、204、205、206、207、209、210、211、217、219、220、224、226、228、229、230、231、232、233、234、235、236、237、238、239、241、242、243、244、245、246、248、249、250、252、253、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、282、284、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、315、319、321、322、323、324、325、326、327、328、329、330、332、338、339、340、341、342、344、345、346、347、349、350、351、352、353、355、358、360、361、364、365、366、367、368、369、370、371、372、373、374、376、377、378、380、383、384、386、387、388和390。
在一些实施方案中,工程化TdT多肽包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列具有至少60%、70%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列和与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列相比在选自以下位置处的一个或更多个残基差异或残基差异集:8、9、9/11、9/14/190/197/364、9/14/58、9/14/58/182/190/197/298、9/28/156/158/173/190/193/303/364、9/28/156/158/290/364、9/28/190/193/303/364、9/28/290/303/364、9/58/197、9/156/158/193/290/303/364、9/156/364、9/290/364、9/298、9/302、9/364、10、10/14/197/364、11、12、14、14/15/200/230、14/15/77/200/226/230、14/15/77/78、14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/78、14/15/78/226/230、14/28/224/296/298、14/28/58/162/190/193/224、14/28/58/224、14/28/58/84/173/297、14/58/147/162/190/193/224/296/303、14/58/158/224、14/58/162、14/58/182/197/298/364、14/58/84/147/162/224/296/297/298/299、14/58/84/147/162/224/296/297/299、14/58/84/224/298、14/77/201/230、14/77/78/200/226/230/257、14/77/78/226/230/257、14/78/200/201/226/290、14/78/200/201/339、14/78/200/226/230/339、14/78/200/226/290/339、14/78/200/230/339、14/84/147/193/197/224/296、14/84/162/224/297/299、14/84/224/296/299、14/147、14/147/158/162/224、14/147/173、14/147/224、14/158/162/197/224/296/298/299、14/162/224/298/299、14/173/193/197/296/297/298/299、14/190/197/298、14/193/197/224/297/298/299/300、14/197/298/364、14/200/203/226/230、14/200/203/226/230/257/339、14/200/203/230/339、14/201/203/226、14/224/296/298、14/224/296/303、14/298/364、15、15/77、15/77/200/201/203/226/230/290/339、15/77/200/230、15/77/200/230/290/339、15/77/201/226/230/339、15/77/226/230/290/339、15/77/78、15/77/78/200/201/203/226/230、15/78/201、15/78/201/203/230、15/78/201/230/290、15/78/203/226/230、15/200、15/201/203/226/230/257/339、15/226/230/339、15/230、16、17、18、18/28/147/303、19、20、20/21、20/21/103/233、20/21/111、20/21/111/157/315、20/21/111/160/200、20/21/111/200/238、20/21/111/246、20/21/180/297、20/21/233、20/21/315、20/21/52/67/68/87/111/157/160/173/180/200/235/246/315 、20/21/55/67/68/87/111/157/160/180/181/200/235/246/256/315/350 、20/21/55/67/68/87/111/157/160/180/200/246/256/315、20/21/60/72/160/180/200/246/259/338/358、20/21/67、20/21/67/160、20/21/67/68/87/111/157/160/180/200/235/246/315、20/21/67/68/87/111/157/160/180/200/246/315、20/21/67/87、20/21/67/87/111、20/21/67/87/111/200、20/21/67/87/111/315、20/21/67/87/157/180、20/21/67/87/246/315、20/21/68/103/200/238/297、20/21/68/111/235、20/21/68/160、20/21/68/160/180/200/246、20/21/68/160/246、20/21/68/180、20/21/68/180/235、20/21/68/200/235/297、20/21/68/233/246/297、20/21/87/111/246/315、20/21/87/157/200、20/21/87/180/246/315、20/21/87/315、20/67/87/111/180、20/67/87/157/160/180/315、20/68/103/160/200、20/68/103/180/200、20/68/111/157/160、20/68/160、20/68/160/180、20/68/160/180/233/235/246、20/68/160/200/246、20/68/160/235/297、20/68/160/246、20/68/200/238/246、20/68/235/297、20/87/111/180、20/87/157/160、20/100、20/100/104/111/242、20/100/104/120/197/367、20/100/104/197/203/242/292、20/100/104/203/350/353、20/100/111、20/100/120/197/232/235/315/366/367、20/100/197/292/315、20/100/203、20/100/232/292/366/367、20/100/235/315/367、20/103/160/180/200/235、20/103/233、20/104/111/120/203、20/111、20/111/180/235/246/297、20/120/197/292、20/120/235、20/160/315、20/200、20/292、21、21/67/180/315、21/67/200、21/67/87/111/200、21/67/87/157/246、21/68、21/68/103/111、21/68/111/200、21/68/160/180/200/205/297、21/68/160/180/200/297、21/68/160/238、21/68/160/238/246、21/68/180、21/68/180/235、21/68/180/246、21/68/200、21/68/235、21/87/157/160、21/87/160/200/315、21/87/160/315、21/87/200、21/87/246/315、21/103/233、21/111、21/157/160、21/160/315、21/200/315、21/233/297、21/246、22、23、23/28/156/158/190/193/290/364、23/186/256/309、24、26、26/60/200、26/60/200/203/229/234/267、26/60/200/203/229/267、26/60/200/203/229/267/290、26/60/200/203/234/267、26/60/200/203/292、26/60/200/234/290、26/60/203/229/234/290、26/60/229/267、26/60/29026/200、26/200/203、26/200/203/229、26/200/290、26/203/234/290/292、26/229/234/360、27、28、29、29/77/104/234/271、29/77/104/234/271/279/380、29/77/182/207/271、29/77/207/234/279/380、29/77/234/271/279/368、29/77/271、29/98/143/266、29/98/185/197/266、29/98/185/266/296/299、29/104/234/271/279/380、29/143、29/143/162、29/143/170/193/197/266、29/143/185/193/266、29/158/266、29/170/185/193/266/299、29/182/207/380、29/182/234/271/380、29/182/271/279/380、29/185/296、29/193/197/296/297、29/234/279/380、29/271/279、29/271/279/368/380、30、32、32/72/339、32/72/339/360、32/78/106/200/226/272/373、32/78/106/200/226/373、32/78/106/226、32/78/200/226、32/78/200/226/235/272、32/78/200/226/235/321/373、32/78/226、32/78/226/321、32/78/226/373、32/103、32/103/106/111/322/324、32/103/106/207/210/235/321/368、32/103/207/210/344/349、32/103/207/228/232/373、32/103/207/321/344、32/103/210/273/321/373、32/103/273、32/103/321/344、32/106、32/106/200/226、32/106/200/226/235/373、32/106/207/210/232、32/106/210、32/106/210/373、32/106/235/321、32/106/235/368、32/106/273/321/373、32/106/280、32/111/235、32/111/235/271/272/339、32/111/235/339、32/111/235/339/386、32/111/235/386、32/140/141/261/360、32/140/339、32/140/360、32/141/180/244、32/161/193/237/360、32/162、32/162/193、32/162/193/267、32/162/237/265/266、32/162/302、32/180/261/339、32/200/226、32/200/226/321/373、32/207/210/273、32/207/210/279、32/207/210/368/373、32/207/235、32/207/273/279/321、32/207/279、32/207/344、32/210/232/235/368、32/210/232/273/321、32/210/232/273/368/373、32/210/273、32/226、32/235、32/235/271/339、32/235/272、32/235/272/339、32/235/272/386、32/235/273、32/235/339/386、32/235/386、32/244/261、32/271/339、32/272、32/273/279/344/349、32/273/344/373、32/279、32/279/321、32/302、32/321/324/360、32/322/324/383/386、32/324、32/339、34、34/48/133/158/182/230/233/271/345、34/48/147、34/48/147/158/182/220/233/307、34/48/147/182/230/233/249/307、34/48/147/271、34/48/182/233/249、34/48/339、34/48/78/133/147/182、34/48/78/147/158、34/48/78/147/182/220/233/249/307/315/339、34/48/78/158/182/220/249/307、34/48/78/158/182/233/315/345、34/48/78/182/220/230/315、34/48/78/182/220/233、34/78、34/78/147/182/220/249、34/78/147/182/233/249/315、34/78/147/182/233/271/339、34/78/158、34/78/158/182/315/345、34/78/158/249、34/78/182/233/307、34/78/204/220/339、34/78/220/271、34/78/220/307/339、34/78/315、34/78/84/147/158/182/220、34/78/84/158/230、34/133/147/158/230/233/249、34/147、34/147/155/233/339、34/147/158、34/147/158/182/233、34/147/158/182/249/271、34/147/182、34/147/182/220、34/147/182/220/230/249/315/339、34/147/182/220/230/339、34/147/182/220/271/315、34/147/182/233/271/339、34/147/182/249/307/315/339、34/147/182/315、34/147/182/345、34/147/220/271、34/147/230/273/315/345、34/147/233、34/147/249、34/147/315/339、34/158/182/315/339/345、34/158/220、34/158/307、34/182、34/182/230/315、34/182/307/339、34/182/345、34/220、34/220/307、34/220/307/345、34/220/315/339、34/220/339、34/233、34/271/339、34/315/345、34/339、36、38、40、42、44、44/193、47、48、48/53/237/239、48/78/147/158/182/220/230/307、48/78/147/158/182/230/249/271/315、48/78/147/158/233/249、48/78/147/182/220/233/249/339/345、48/78/147/182/220/315、48/78/147/182/230/233/249、48/78/158/182/220/233/249、48/78/158/230/339、48/78/233/315/339、48/147/158/182/220/230/249/271/307/315/339、48/147/158/182/220/249/307/339、48/147/158/182/220/315、48/147/158/182/230/233、48/147/158/182/233/345、48/147/158/233、48/147/158/307/345、48/147/233、48/147/233/345、48/147/271/307/339、48/158/182/230/233/249、48/182、48/182/307/315、48/256/261、48/339、49、50、51、52、52/55/106/256、52/55/181/235/256、52/55/181/256、52/99/181/235、52/106/181/235/256、52/106/235/256、52/106/256、52/173/235、52/180、52/180/200/235/315/349、52/180/200/349、52/180/349、52/200、52/200/315、52/200/349、52/200/349/350、52/235、52/235/256、52/315、52/315/349、52/349、52/349/350、53、53/73/75/237/239、53/157/278/327/331、53/162/327/331/368、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、53/201/371、53/219/358、53/237、54、55、55/58、55/58/256、55/58/256/350/373、55/58/256/355、55/58/350/351、55/58/69/350/351、55/58/99/256/351/373、55/58/99/256/355、55/58/99/351、55/67、55/67/106/111/157、55/67/106/315、55/67/111、55/67/111/315、55/67/315、55/67/87、55/67/87/106/111/315、55/67/87/157/315、55/80/174/268/355/366、55/80/268/315/366、55/80/268/346、55/87、55/87/106、55/87/106/111/315、55/87/106/315、55/87/157、55/87/157/207、55/99/103、55/99/181/256、55/99/219/358/373、55/99/256/350、55/103/181、55/103/219、55/103/338、55/106/111、55/106/157、55/111、55/111/156/268/315/324/327/366/373、55/111/268/346/355、55/111/268/355/366、55/111/315、55/111/315/355/373、55/157、55/181/219、55/181/235/256/350、55/181/246、55/181/358、55/219/246/358、55/219/256/338、55/256、55/256/259、55/268、55/268/315/346、55/268/324/366、55/268/346/355、55/315、56、56/75/154/156/192/239/280/282、56/75/192/239、56/192/282/350、57、57/367、58、58/69/256/373、58/72/211/315、58/72/220/224、58/84/211/220/224、58/99、58/99/351/355、58/99/355、58/147/162/197/224/296/297/298/299、58/147/162/296/298、58/162/224/296/298、58/186/270、58/197、58/197/364、58/224、58/224/299、58/256、58/256/350/355、58/350/355、58/364、59、59/62/63/68、59/62/63/68/103/234、59/62/63/68/147、60、60/62/68/91/111/234/289、60/106/111/235/360、60/200/203/290、60/200/229/234、60/200/234、60/200/234/267/290/292、60/200/234/290、60/203、60/259、60/278、60/280/360、61、62、62/63/68、62/63/68/91/109/210、62/63/68/91/147/205/210/234、62/66/100/101/104/203/235/338、62/66/69/143/338/353、62/68/103、62/68/111、62/68/91/111/289、62/69/100/235/268/346、62/69/353、62/69/80/101/104/143/235/338、62/111/235/315/355、62/111/235/324/346、62/203/211/235/338/350、62/235/268/327/346/350/353/355、62/235/346/350/355、62/315/327/353、62/323/346/353/355、63、64、65、65/70/155/209/228、65/128/209/371/373、65/140、65/140/192/193、65/140/192/193/302、65/151、65/155/209、65/155/209/352/353、65/159、65/184/187、65/193、65/209/219/352/353、65/209/352/353/371、65/220/339、65/228/352/353/373、65/228/371/373、65/259、65/352/353/371、66、66/69/143/235/338、66/100/235/315/327/353/355、66/111/346/353/355、66/220/224、66/235/268/346、66/235/346、66/235/373、67、67/87、67/87/106/157、67/87/111/157/160/315、67/87/111/157/315、67/87/157、67/87/315、67/106、67/106/111、67/106/111/315、67/106/157、67/111、67/111/315、67/157、67/157/160/180、67/157/160/315、67/157/315、67/160、67/180/200、67/180/200/315、67/315、68、68/87、68/103/160/235、68/103/200/235/246/297、68/106/200、68/106/321/322、68/111/200/238、68/111/233/236/297、68/118、68/157/160/200/315、68/160/233/246、68/200、68/200/235/297、68/200/270/321、68/270/321/322、68/344、68/344/383、69、69/80/203/211/278/338、69/100、69/100/111/298/353/355、69/100/235、69/100/353/366、69/111/235、69/111/235/300/353/355、69/111/235/315、69/220、69/235/315、69/235/353、69/268、69/268/324/327/353/355、69/268/346、69/268/346/353、69/315/353、69/324/327/346、69/324/346/350、69/324/353、69/339、69/353/355、70、70/71、70/71/353、70/72、70/72/140/244/261/339、70/72/141/244、70/72/180/360、70/134/353、70/140/141/339、70/261/339/360、70/353、70/360、71、71/77/133/353、71/77/353、71/353、72、72/74/200/272/339/347、72/84/220/224/315、72/84/86/224、72/86/220、72/180/244/339、72/220/224、72/220/315、72/256/360、72/360、73、74、74/106/270/344、74/200/339、74/272、75、75/207/373/378、75/233/344、75/233/366、75/237/350、77、77/78/200/226/339、77/78/201/226/257/339、77/78/203、77/78/203/230/339、77/133/353、77/134/353、77/182/279/380、77/182/368、77/200/201、77/200/201/226/230/339、77/200/203/230/257/339、77/200/230、77/234/271/279/380、77/353、78、78/106、78/106/226/321/373、78/106/235/321/373、78/127、78/133/147/158/182/220/271/339、78/135/182/233/249/315/345、78/147/158/182、78/147/158/182/230/249、78/147/158/182/233/271/307/345、78/147/158/182/339/345、78/147/158/220/230/233/249/271/307/315/345、78/147/158/249/307/315、78/147/182/230/233/249、78/147/182/249/307、78/147/182/339/345、78/147/230/307、78/147/233、78/147/249/271/339、78/158/182、78/158/182/233/271/315、78/158/182/307/315/345、78/182/220/339、78/182/271/315/339、78/200/226/321/373、78/200/230、78/203/230/290、78/226/230、78/226/290、78/226/321、78/233、78/339、79、80、80/111/268/324/327/346/366/373、80/111/355/366、80/143/203/211/338、80/268/315/346/355、80/268/327/346/366、80/268/346、80/315/346/364/373、80/346/366、82、82/154/296、82/184/220/386、84、84/92/173、84/147、84/147/197/296/297、84/147/297/298/303、84/156/173/204、84/173/204/303、84/173/224、84/220/315、84/224/297/298/299、85、86、87、87/106、87/106/111/315、87/111、87/111/157/315、87/111/200、87/111/200/246、87/157、87/157/180/200、87/157/315、87/315、89、91、91/109/111、91/109/147/205/210/234、92、92/173/204/290/303、93、94、96、97、98、98/143/158/170/185/296/297、98/143/162/266、98/143/185/266、98/162/193、98/170/193/197、98/185、98/185/193/197/266/297、99、99/103/219、99/235、99/256/351/355、100、100/101/211/278/338/350/353、100/111、100/111/353、100/120/197/242、100/235/268/315/346、100/235/268/346/355、100/235/268/366/373、100/235/346/350/353、100/268/346、100/268/366、101、102、103、103/106/207/321、103/106/210、103/106/360、103/111/235/280/360、103/111/235/321/324、103/160/180、103/160/297、103/207/210/235/321、103/210/232/235、103/219/256、103/219/338/358、103/232/273、103/233、103/256、103/259、103/324、104、104/106、104/106/111/200/201/235/268/368、104/106/111/200/201/268、104/106/111/201/235/368、104/106/200/201/268、104/120/232/353、104/182、104/200/207/237/344/373/387、104/207/344/387、105、106、106/111、106/111/157、106/111/200/201、106/111/200/201/268/368、106/111/200/235/368、106/111/201、106/111/201/368、106/111/322/324/386、106/111/322/383/386、106/173/200/235/315、106/173/388、106/182/203/226/235/342/346、106/200/201、106/200/201/209/368、106/200/201/235、106/200/201/368、106/200/226/373、106/200/321/322/383、106/201/235、106/201/268、106/207/210/232/235/321/368/373、106/207/235/321/368、106/226/235/373、106/235、106/235/273/373、106/235/383/386、106/270/344、106/273、106/315、106/324、107、108、109、109/111/205/210/234/289、110、111、111/157/180/200/315、111/160/233/235/297、111/173、111/173/235/315、111/197/242、111/200/201/268、111/200/368、111/226、111/226/321/344/346/369/387、111/235、111/235/268/327/346、111/235/268/346、111/235/271/339、111/235/272/339/386、111/235/280、111/235/339、111/235/346/350、111/268、111/272/339/386、111/322/360、111/327、111/346、112、113、113/355、115、116、117、118、119、120、122、123、124、125、128、128/159/209/352/353、128/209、128/209/2、128/209/219、128/209/219/352/353/371、128/296、131、133、133/135/307/315、133/220/233/271、133/307、134、134/353、135、136、140、140/141/256/261/339、140/180/244/261/339/360、140/192/193/302、140/193/302、141、141/244/261/360、141/244/360、141/256/339/360、141/261、141/261/339、141/360、143、143/158/197/266、143/266/296/297、144、144/220、145、147、147/158/162/190/224/296/297/299/303、147/158/182/220/233、147/158/182/230/233/249/271/339、147/158/182/233/249、147/158/182/233/271/307/339、147/158/182/233/307/339、147/158/182/233/315/345、147/158/182/271/315、147/158/182/315、147/158/220/230/233/249/345、147/158/220/249/315、147/158/233/249、147/182/220/233/345、147/182/230/307/315/339、147/182/233、147/182/233/249、147/182/249/271/307、147/182/345、147/210/234、147/220、147/224、147/224/297/298、147/232/233/271/315/339、147/233/345、147/249、147/290/303/307、147/339、148、149、150/244/261/360、151、153、154、154/156/282/350、154/166、154/166/210/296、154/166/346/347、154/166/347、154/167/210/347/349、154/184、154/187/220/350/386、154/293、154/296/347、154/339、154/347、154/350、154/386、155、155/220/325/339、156、156/158/190/193/364、156/166/167、156/210/339、157、157/160、157/162、157/162/241/242/260、157/162/241/242/327/331、157/162/241/278/331/368、157/162/241/331、157/162/242/260/331、157/162/331、157/315、157/327/331、157/368、158、158/182/220/230/249/307/339、158/193/290/303、158/233、158/307、158/315、158/315/339、159、160、160/296、161、161/162、161/237、162、162/193/232/267/302/360、162/224、162/237/265/266/267/302、162/241/278/327/331、162/241/331、162/242/368、162/265、162/267/360、162/367/371、163、163/201、164、164/275/280、165、166、166/210、166/296、166/346/347、167、167/210/346/349、168、169/390、170、170/193/197、173、173/204、173/204/303、173/297、174、175、176、177、180、180/339、181、182、182/186/256/360、182/197、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/207/279/368、182/220/345、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/230、182/230/233、182/234/380、182/256、182/279/368/380、182/298/364、182/342/346、182/345、184、184/187、184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/189/297、184/200、184/206/242/290/297、184/211、184/242、184/242/297/368、184/290/297、184/290/368、184/293、185、186、186/256、186/256/270、187、187/220/350、187/293、188、188/211、188/211/242/290/297/368、189、189/200、190、190/193/197、191、192、192/193、192/193/211/242/297/368、192/193/290/297/368、193、193/194、193/197/296/303、193/267、193/290、194、194/242、194/242/290、195、196、197、197/298、198、198/289、199、200、200/202/203、200/203、200/203/226/230/339、200/203/229/234、200/203/290、200/203/290/368、200/206、200/226、200/226/321/373、200/226/373、200/230/257、200/234/290、200/235/368、200/270、200/270/275/339、200/270/322/383、200/271、200/290/292/360、200/344、200/368、201、201/202、201/202/272/360、201/203、201/203/226/234、201/203/226/234/342/346、201/203/226/234/346、201/203/226/268/342、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、201/226/346、201/230/257、201/230/290、201/235/268/342/346、201/368、201/371、202、202/233、202/235/360/367/371、203、203/206/368、203/226、203/226/230、203/226/230/257、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/342、203/226/235/346、203/226/342/346、203/226/346、203/229、203/242/290/297/368、203/297、204、204/264/340、205、206、206/290、206/297、207、207/210/273/279/344、207/210/273/279/344/349/373、207/210/273/321/344/349、207/233/237/344/387、207/235、207/235/327/360/371、207/235/368、207/271/368/380、207/273、207/279/349、207/368/373、207/373、207/380、207/387、209、209/211、210、210/211、210/211/242、210/273/279、210/273/279/349、210/279、210/339、211、211/368、217、219、219/300、219/358、220、220/224/315、220/249、220/293、220/307/339、220/315、220/339、220/349、224、224/296/298、224/297/299、224/298/299、226、226/234/235/346、226/234/342、226/235/268、226/235/268/342/346、226/235/268/346、226/235/272/373、226/235/342、226/235/346、226/268、226/268/342、226/268/342/346、226/268/346、226/272/373、226/321/369、226/342、226/342/346、226/346、226/366、226/366/369/387、227、228、229、229/325、229/360、230、231、232、232/235、232/235/273/368、232/235/321、232/346/350/355、233、233/271、233/315、233/367/371、233/371、234、235、235/268/327/346、235/268/346、235/271/272/339、235/271/272/339/386、235/271/339、235/271/339/386、235/272、235/272/339、235/272/386、235/273、235/280、235/280/321/322/324、235/280/321/324/383/386、235/315、235/315/353/355、235/339、235/339/386、235/346、235/346/350、235/353、235/353/355、236、237、237/265、237/266/360、237/271、237/360、237/381、238、239、241、241/242/368、242、242/244、242/290、242/290/297、242/331、243、244、244/256/261/339/360、245、246、247、248、249、249/315/339、250、252、253、256、256/259、256/360、257、258、259、259/276/387、260、260/327、260/331、260/368、261、262、262/325/349、263、264、265、265/346、266、266/297/299、267、267/270/275/339/347、267/272/275、268、268/315/327/346、268/315/346、268/315/346/366、268/315/355、268/324、268/324/327/346、268/327/346、268/346、268/346/350/353/355、268/346/355、268/353、268/355/366、269、270、270/309、270/322/344/383、271、271/339、271/380、272、273、273/279、273/279/373、274、275、275/291、276、277、278、279、280、280/383、282、284、286、287、288、289、290、290/303/364、291、292、293、293/350、293/350/386、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、313、314、315、315/324/327/355/366、315/327/346、319、321、321/324、322、324、324/327/346、324/346/350、324/346/355/366、324/355、325、325/339、326、327、327/346、328、330、331、332、338、339、341、342、342/363、344、344/370、345、346、347、348、349、350、351、352、353、353/355、355/373、354、355、356、358、360、360/383、361、362、363、364、365、366、367、367/371、368、369、370、371、372、373、374、376、377、378、380、381、382、383、384、385、386、387、388、390和391。
如技术人员将理解的,在一些实施方案中,所选择的以上残基差异之一或其组合可以作为核心特征在工程化TdT中保持恒定(即维持),并且在其他残基位置处的另外的残基差异可以被掺入到序列中以产生具有改进的性质的另外的工程化TdT多肽。因此,应当理解,对于包含上述残基差异的一个或子集的任何工程化TdT,本发明设想了其他工程化TdT,其包含所述残基差异或残基差异集的一个或子集和在本文公开的其他残基位置处的另外一个或更多个残基差异或残基差异集。
如上所述,工程化TdT多肽也能够将底物(例如,NTP-3’-O-RBG和寡核苷酸受体底物)转化为产物(例如,添加了NTP-3'-O-RBG的寡核苷酸受体底物)。在一些实施方案中,工程化TdT多肽能够以相对于SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考多肽活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更高的活性将底物化合物转化为产物化合物。
在一些实施方案中,能够以相对于SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636至少2倍的活性将底物化合物转化为产物化合物的工程化TdT包含选自SEQ ID NO:4-3592和3698-6766中偶数编号序列的氨基酸序列。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异或残基差异集,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其增加工程化TdT在细菌宿主细胞中,特别是在大肠杆菌中的可溶性表达。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其增加工程化TdT的热稳定性。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其增加工程化TdT的热稳定性。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其使工程化TdT的热稳定性增加2倍、5倍、10倍、15倍或更多,其中所述一个或更多个残基差异位于选自80、87、203、111、143、147、157、160、180、203、209、226、256、261、266、279、327、339、349、353和364的一个或更多个位置处。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其使工程化TdT的热稳定性增加2倍、5倍、10倍、15倍或更多,其中所述一个或更多个残基差异包括80S、87S、103P、111V、143A、147Y、157A、157V、160S、180A、203D、209E、226L、256G、261R、266G、279H、327F、339M、349E、353N和364L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其使工程化TdT的热稳定性增加2倍、5倍、10倍、15倍或更多,其中所述一个或更多个残基差异包括Y80S、R87S、D103P、E111V、S143A、F147Y、L157A、L157V、D160S、V180A、L203D、T209E、F226L、C256G、S261R、E266G、F279H、Y327F、E339M、S349E、K353N、R364L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其增加工程化TdT在高温的活性。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其使工程化TdT在40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃的活性增加2倍、5倍、10倍、15倍或更多。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其使工程化TdT在40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃的活性增加2倍、5倍、10倍、15倍或更多,其中所述一个或更多个残基差异位于选自80、87、203、111、143、147、157、160、180、203、209、226、256、261、266、279、327、339、349、353和364的一个或更多个位置处。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其增加工程化TdT在40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃的活性,其中所述一个或更多个残基差异包括80S、87S、103P、111V、143A、147Y、157A、157V、160S、180A、203D、209E、226L、256G、261R、266G、279H、327F、339M、349E、353N和364L的残基差异。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其增加工程化TdT在40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃的活性,其中所述一个或更多个残基差异包括Y80S、R87S、D103P、E111V、S143A、F147Y、L157A、L157V、D160S、V180A、L203D、T209E、F226L、C256G、S261R、E266G、F279H、Y327F、E339M、S349E、K353N、R364L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其减少工程化TdT的副产物形成。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其减少工程化TdT的副产物形成。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其减少工程化TdT的副产物形成,其中所述一个或更多个残基差异位于选自53、65、68、159、211、217、224、271、272、273、275,278、331、341、391的一个或更多个位置处。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其减少工程化TdT的副产物形成,其中所述一个或更多个残基差异包括53T、65L、68R、159R、211V、217R、224V、271H、271P、272A、273P、275Q、278G、331K、341R、391L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其减少工程化TdT的副产物形成,其中所述一个或更多个残基差异包括E53T、E65L、C68R、A159R、T211V、G217R、I224V、R271H、R271P、K272A、I273P、A275Q、N278G、L331K、G341R、E391L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其增加工程化TdT对一种或更多种NTP-3’-O-RBG底物的比活性。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异,与野生型或工程化参考TdT(包括选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列)相比,其增加工程化TdT对一种或更多种寡核苷酸受体底物的比活性。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其将工程化TdT将底物转化为产物的比率增加至5%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其将工程化TdT将底物转化为产物的比率增加至5%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多,其中所述一个或更多个残基差异位于选自53、65、68、159、211、217、224、271、272、273、275,278、331、341、391的一个或更多个位置处。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其将工程化TdT将底物转化为产物的比率增加至5%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多,其中所述一个或更多个残基差异包括53T、65L、68R、159R、211V、217R、224V、271H、271P、272A、273P、275Q、278G、331K、341R、391L。
在一些实施方案中,工程化TdT具有这样的氨基酸序列,该氨基酸序列包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的序列的至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,并且包含一个或更多个残基差异,与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的野生型或工程化参考TdT相比,其将工程化TdT将底物转化为产物的比率增加至5%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多,其中所述一个或更多个残基差异包括E53T、E65L、C68R、A159R、T211V、G217R、I224V、R271H、R271P、K272A、I273P、A275Q、N278G、L331K、G341R、E391L。
在一些实施方案中,具有改进的性质的工程化TdT具有这样的氨基酸序列,该氨基酸序列包含选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636范围内的偶数编号序列的序列。
在一些实施方案中,具有改进的性质的工程化TdT具有这样的氨基酸序列,该氨基酸序列包含选自SEQ ID NO:4-3592和3698-6766中的偶数编号序列的序列。
在一些实施方案中,工程化TdT包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636范围内的偶数编号序列之一具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,如实施例中提供的。
除了以上指定的残基位置之外,本文公开的任何工程化TdT多肽还可以在其他残基位置(即,除了本文包括的残基位置之外的残基位置)包含相对于SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的其他残基差异或残基差异集。这些其他残基位置处的残基差异或残基差异集可以提供氨基酸序列的另外的变化,而不会不利地影响多肽进行底物向产物的转化的能力。因此,在一些实施方案中,除了存在于选自SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列的任何一个工程化TdT多肽中的氨基酸残基差异或残基差异集之外,该序列还可以在其它氨基酸残基位置处与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比包含1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个、1-50个、1-100个或1-150个残基差异。在一些实施方案中,与参考序列相比氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、100个或150个残基位置。在一些实施方案中,与参考序列相比的氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个残基位置。在这些其他位置处的残基差异可以是保守变化或非保守变化。在一些实施方案中,残基差异可以包括与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的TdT多肽相比的保守取代和非保守取代。
在一些实施方案中,本发明还提供了包含保持本文描述的任何工程化TdT的功能活性和/或改进的性质的该工程化TdT多肽的片段的工程化多肽。因此,在一些实施方案中,本发明提供了能够在合适的反应条件下将底物转化为产物的多肽片段,其中该片段包含至少约90%、95%、96%、97%、98%或99%的本发明工程化TdT(诸如选自SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列的示例性TdT多肽)的全长或截短氨基酸序列。在一些实施方案中,工程化TdT可以具有在本文描述的TdT多肽序列(诸如SEQ ID NO:4-3592和3698-6766范围内偶数编号序列的示例性工程化多肽)的任何一个中包含缺失的氨基酸序列。
因此,对于本发明的工程化TdT多肽的各种和每一种实施方案,氨基酸序列可以包含1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达TdT多肽的氨基酸总数的10%、多达氨基酸总数的20%、或多达氨基酸总数的30%的缺失,其中本文描述的工程化TdT的相关的功能活性和/或改进的性质被保持。在一些实施方案中,缺失可以包含1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基。在一些实施方案中,缺失可以包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基的缺失。
在一些实施方案中,本文的工程化TdT多肽可以具有与本文描述的工程化TdT多肽的任何一个相比包含插入的氨基酸序列,本文描述的工程化TdT多肽诸如在SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列的示例性工程化多肽。因此,对于本发明的TdT多肽的各个和每一个实施方案,插入可以包含1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸或50个或更多个氨基酸,其中本文描述的工程化TdT的相关功能活性和/或改进的性质被保持。插入可以是插入到TdT多肽的氨基末端或羧基末端,或内部部分。
在一些实施方案中,本文的工程化TdT可以具有包含选自SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列的序列和任选地一个或数个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的氨基酸序列。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-75个、1-100个或1-150个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个、60个、65个、70个、80个、90个、100个、110个、120个、130个、140个或150个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在以上实施方案中,工程化多肽的合适反应条件在表7.1、8.1、9.1、10.1、11.1、12.1、13.1、14.1、15.1、16.1、17.1、18.1、19.1、20.1、21.1、22.1、23.1、24.1、25.1、26.1、27.1、28.1、29.1、30.1、31.1、32.1、33.1、34.1、35.1、36.1、37.1、38.1、39.1、40.1、41.1、42.1、43.1、44.1、45.1、46.1、47.1、48.1、49.1、50.1、51.1、52.1、53.1、54.1、55.1、56.1、57.1、58.1、59.1、60.1、61.1、62.1、63.1、64.1、65.1、66.1、74.1、75.1、76.1、77.1、78.1、79.1、80.1、81.1、82.1、83.1、84.1、85.1、86.1、87.1、88.1、89.1、90.1、91.1、92.1、93.1、94.1、95.1、96.1、97.1、98.1、99.1、100.1、101.1、102.1、103.1、104.1、105.1、106.1、107.1和/或108.1中提供,并且如本文实施例中描述的。
在一些实施方案中,本发明的多肽是融合多肽,其中工程化多肽与其他多肽,诸如,以举例且非限制的方式,抗体标签(例如,myc表位)、纯化序列(例如,用于与金属结合的His标签)和细胞定位信号(例如,分泌信号)融合。因此,本文描述的工程化多肽可以与其他多肽融合或不融合使用。
要理解,本文描述的多肽不局限于遗传编码的氨基酸。除了遗传编码氨基酸之外,本文描述的多肽可以全部或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘代苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(styrylkalanine)(sAla);蒽基丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(pipecolic acid,PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aGly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰基赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可以包含的另外的非编码氨基酸对于本领域技术人员将是明显的(参见例如以下中提供的各种氨基酸:Fasman,CRC Practical Handbook ofBiochemistry and Molecular Biology,CRC Press,Boca Raton,FL,第3-70页[1989]以及其中引用的参考文献,其全部通过引用并入)。这些氨基酸可以是L-构型或D-构型的。
本领域技术人员将认识到,具有侧链保护基团的氨基酸或残基还可以构成本文描述的多肽。这样的受保护氨基酸(在本情况中属于芳族类别)的非限制性实例包括(保护基团在括号中列出),但不限于:Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶硫酰基(nitropyridinesulfenyl))、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象约束的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro)和1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽可以是各种形式,例如诸如分离的制品、作为基本上纯化的酶、用编码酶的基因转化的全细胞和/或作为这样的细胞的细胞提取物和/或裂解物。酶可以是冻干的、喷雾干燥的、沉淀的或是粗的糊状物的形式,如以下进一步讨论的。
在一些实施方案中,工程化多肽可以呈生物催化组合物的形式。在一些实施方案中,生物催化组合物包含(a)用于通过与TdT接触将NTP-3-O-RBG和寡核苷酸受体化合物转化为由一个NTP延伸的寡核苷酸受体产物的装置和(b)合适的辅因子。合适的辅因子可以是钴、锰或任何其它合适的辅因子。
在一些实施方案中,工程化多肽可以提供于固体支持物诸如膜、树脂、固体载体或其他固相材料上。固体支持物可以包含有机聚合物诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的构型可以呈珠、球、粒子(particle)、颗粒(granule)、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。
在一些实施方案中,本发明的工程化TdT多肽可以固定在固体支持物上,使得它们相对于SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考多肽保持其改进的活性和/或其他改进的性质。在这样的实施方案中,固定的多肽可以促进底物化合物或其他合适的底物向产物的生物催化转化,并且反应完成后容易保留(例如通过保留固定有多肽的珠)并且然后在随后的反应中重新使用或再循环。这样的固定化酶方法允许进一步提高效率和降低成本。因此,还设想,使用本发明的TdT多肽的任何方法可以使用结合或固定在固体支持物上的TdT多肽进行。
酶固定化的方法是本领域熟知的。工程化多肽可以被非共价地或共价地结合。用于将酶缀合和固定到固体支持物(例如树脂、膜、珠、玻璃等)的各种方法是本领域熟知的(参见例如Yi等人,Proc.Biochem.,42(5):895-898[2007];Martin等人,Appl.Microbiol.Biotechnol.,76(4):843-851[2007];Koszelewski等人,J.Mol.Cat.B:Enzymatic,63:39-44[2010];Truppo等人,Org.Proc.Res.Dev.,在线发表:dx.doi.org/10.1021/op200157c;Hermanson,Bioconjugate Techniques,第二版,Academic Press,Cambridge,MA[2008];Mateo等人,Biotechnol.Prog.,18(3):629-34[2002];和“Bioconjugation Protocols:Strategies and Methods,”,In Methods in MolecularBiology,Niemeyer(ed.),Humana Press,New York,NY[2004];其每个的公开内容通过引用并入本文)。可用于固定本发明的工程化TdT的固体支持物包括但不限于,包括具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯的珠或树脂。可用于固定本发明的工程化TdT多肽的示例性固体支持物包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,本文描述的多肽以试剂盒的形式提供。试剂盒中的酶可单独地存在或作为多于一个酶存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评价酶活性的底物、以及用于检测产物的试剂。试剂盒还可以包括试剂分配器和试剂盒的使用说明。
在一些实施方案中,本发明的试剂盒包括在不同的可寻址位置处包含多于一个不同TdT多肽的阵列,其中不同多肽是参考序列的不同变体,所述变体各自具有至少一种不同的改进的酶性质。在一些实施方案中,固定在固体支持物上的多于一个多肽被配置在阵列的多个位置上,所述位置是试剂的自动递送或通过检测方法和/或仪器可寻址的。阵列可被用来测试用于被多肽转化的各种底物化合物。包含多种工程化多肽的这样的阵列及其使用方法是本领域已知的(参见例如WO2009/008908A2)。
编码工程化末端脱氧核苷酸转移酶的多核苷酸、表达载体和宿主细胞
在另一方面,本发明提供了编码本文描述的工程化TdT多肽的多核苷酸。可以将多核苷酸可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。将包含编码工程化TdT的异源多核苷酸的表达构建体引入适当的宿主细胞,以表达对应的TdT多肽。
如对技术人员将是明显的,蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供了能够编码主题多肽的所有多核苷酸的描述。其中相同氨基酸由可选择的或同义密码子编码的遗传密码的简并性允许产生极大数目的核酸,所有这些核酸编码改进的TdT酶。因此,知道了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单改变一个或更多个密码子的序列来制备任何数目的不同核酸。在这方面,本发明特别设想了可以通过基于可能的密码子选择来选择组合以制备编码本文描述的多肽的多核苷酸的每种和每一种可能的改变,并且对于本文描述的任何多肽,所有这样的改变被认为具体地公开,包括表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2中呈现的和通过引用并入本文的序列表中如SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列公开的氨基酸序列。
在各种实施方案中,密码子被优选地选择为适应在其中产生蛋白的宿主细胞。例如,在细菌中使用的偏好密码子被用于在细菌中表达基因;在酵母中使用的偏好密码子被用于酵母中的表达;并且在哺乳动物中使用的偏好密码子被用于在哺乳动物细胞中表达。在一些实施方案中,不是所有的密码子需要被替代来优化TdT的密码子使用,因为天然序列将包括优选的密码子并且由于优选的密码子的使用可能不是所有氨基酸残基所需要的。因此,编码TdT酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,多核苷酸包含编码如由SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636表示的TdT多肽氨基酸序列的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包含与编码SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列的密码子优化的核酸序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核酸序列。在一些实施方案中,多核苷酸具有包含与SEQ ID NO:5-3591和3697-6765范围内的奇数编号序列的密码子优化的核酸序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核酸序列。在一些实施方案中,SEQ ID NO:5-3591和3697-6765范围内的奇数编号序列的密码子优化的序列增强了编码的TdT的表达,提供能够将底物转化为产物的酶的制品。
在一些实施方案中,多核苷酸能够在高严格的条件下与选自SEQ ID NO:5-3591和3697-6765中奇数编号序列的参考序列或其互补序列杂交,并编码TdT。
在一些实施方案中,如上所述,多核苷酸编码与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比具有改进的性质的工程化TdT多肽,其中该多肽包含与选自SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列和与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异或残基差异集,其中所述序列选自SEQID NO:4-3591和3698-6766范围内的偶数编号序列。在一些实施方案中,参考氨基酸序列选自SEQ ID NO:4-3592和3698-6766范围内的偶数编号序列。在一些实施方案中,参考氨基酸序列是SEQ ID NO:4,而在一些其他实施方案中,参考序列是SEQ ID NO:580,而在一些其他实施方案中,参考序列是SEQ ID NO:692。在一些实施方案中,参考氨基酸序列是SEQ IDNO:882,而在一些其他实施方案中,参考序列是SEQ ID NO:914,而在一些其他实施方案中,参考序列是SEQ ID NO:1034。在一些实施方案中,参考氨基酸序列是SEQ ID NO:1270,而在一些其他实施方案中,参考序列是SEQ ID NO:1344,而在一些其他实施方案中,参考序列是SEQ ID NO:1346。在一些实施方案中,参考氨基酸序列是SEQ ID NO:1678,而在一些其他实施方案中,参考序列是SEQ ID NO:1700,而在一些其他实施方案中,参考序列是SEQ ID NO:1750。在一些实施方案中,参考氨基酸序列是SEQ ID NO:1932,而在一些其他实施方案中,参考序列是SEQ ID NO:2164,而在一些其他实施方案中,参考序列是SEQ ID NO:2666。在一些实施方案中,参考氨基酸序列是SEQ ID NO:2794,而在一些其他实施方案中,参考序列是SEQ ID NO:2978,而在一些其他实施方案中,参考序列是SEQ ID NO:3074。在一些实施方案中,参考氨基酸序列是SEQ ID NO:3302,而在一些其他实施方案中,参考序列是SEQ ID NO:3398。在一些实施方案中,参考氨基酸序列是SEQ ID NO:3488,而在一些其他实施方案中,参考序列是SEQ ID NO:3958。在一些实施方案中,参考氨基酸序列是SEQ ID NO:3788,而在一些其他实施方案中,参考序列是SEQ ID NO:4124,而在一些其他实施方案中,参考序列是SEQ ID NO:4226。在一些实施方案中,参考氨基酸序列是SEQ ID NO:4734,而在一些其他实施方案中,参考序列是SEQ ID NO:5052,而在一些其他实施方案中,参考序列是SEQ ID NO:5152。在一些实施方案中,参考氨基酸序列是SEQ ID NO:5252,而在一些其他实施方案中,参考序列是SEQ ID NO:5296,而在一些其他实施方案中,参考序列是SEQ ID NO:5628。在一些实施方案中,参考氨基酸序列是SEQ ID NO:5630,而在一些其他实施方案中,参考序列是SEQ ID NO:5632,而在一些其他实施方案中,参考序列是SEQ ID NO:5636。
在一些实施方案中,多核苷酸编码与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比具有改进的性质的能够将一种或更多种底物转化为产物的TdT多肽,其中该多肽包含与参考序列SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。
在一些实施方案中,编码工程化TdT的多核苷酸包含选自SEQ ID NO:5-3591和5-3592以及3697-6765范围内的奇数编号序列的多核苷酸序列。
在一些实施方案中,多核苷酸能够在高严格的条件下与选自SEQ ID NO:5-3592和3697-6765范围内的奇数编号序列或其互补序列的参考多核苷酸序列杂交,并编码具有本文描述的一种或更多种改进的性质的TdT多肽。在一些实施方案中,能够在高严格的条件下杂交的多核苷酸编码包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列的TdT,其具有包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比的一个或更多个残基差异或残基差异集的氨基酸序列,如上文和以下实施例中描述的。
在一些实施方案中,能够在高严格的条件下杂交的多核苷酸编码具有改进的性质的工程化TdT多肽,该工程化TdT多肽包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化TdT的参考多核苷酸具有至少约60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:5-3591和3697-6765。
在一些实施方案中,能够在高严格的条件下杂交的多核苷酸编码具有改进的性质的工程化TdT多肽,该工程化TdT多肽包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化TdT的参考多核苷酸具有至少约60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更高的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:3-3591和3697-6765。
在一些实施方案中,编码本文提供的任一种工程化TdT多肽的分离的多核苷酸以各种方式被操作,以提供该多肽的表达。在一些实施方案中,编码多肽的多核苷酸以表达载体提供,表达载体中存在一个或更多个控制序列,以调控多核苷酸和/或多肽的表达。取决于表达载体,在将分离的多核苷酸插入到载体中之前对其进行操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除了其他序列以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。如本领域已知的,合适的启动子可以基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本申请的核酸构建体的转录的合适的启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(参见,例如,Villa-Kamaroff等人,Proc.NatlAcad.Sci.USA 75:3727-3731[1978]),以及tac启动子(参见例如DeBoer等人,Proc.NatlAcad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等,上文)。
在一些实施方案中,控制序列是合适的前导序列,前导序列是对由宿主细胞的翻译重要的mRNA的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是一种可操作地连接至核酸序列的3’末端的序列,并且其在转录时被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号。在本发明中可以使用在所选择的宿主细胞中有功能的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于从以下的基因获得的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡萄糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。
在一些实施方案中,控制序列是信号肽编码区,信号肽编码区编码连接至多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5’末端可以固有地包含信号肽编码区,信号肽编码区符合翻译阅读框地(in translationreading frame)与编码分泌的多肽的编码区的区段天然地连接。可选地,编码序列的5’末端可以包含对编码序列是外来的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区可用于本文提供的工程化TdT多肽的表达。用于细菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:芽孢杆菌NClB11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。用于丝状真菌宿主细胞的有效信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质霉(Humicolalanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些:酿酒酵母α-因子和酿酒酵母转化酶。
在一些实施方案中,控制序列是前肽编码区,前肽编码区编码定位在多肽的氨基末端处的氨基酸序列。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在某些情况下称为“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区域包括但不限于以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见,例如WO95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达调节。调节系统的实例是引起基因的表达响应于化学或物理刺激(包括调节性化合物的存在)被开启或关闭的那些。在原核宿主细胞中,合适的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括但不限于TAKAαA淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
本发明还提供了重组表达载体,所述重组表达载体包含编码工程化TdT多肽的多核苷酸以及取决于它们将被引入的宿主的类型的一个或更多个表达调节区域,诸如启动子和终止子、复制起点等。在一些实施方案中,上文描述的各种核酸和控制序列可以被组合在一起以产生重组表达载体,该重组表达载体包含一个或更多个方便的限制性位点,以允许在这样的位点插入或取代编码变体TdT多肽的核酸序列。可选地,本发明的多核苷酸序列通过将多核苷酸序列或包含该多核苷酸序列的核酸构建体插入到用于表达的适当的载体中来表达。在创建表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以导致变体TdT多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体为自主复制载体(即,作为染色体外的实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选的实施方案中,载体可以是当被引入到宿主细胞中时,被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒,或转座子。
在一些实施方案中,表达载体优选地包含一个或更多个选择标记(selectablemarker),其允许容易选择经转化的细胞。“选择标记”是其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等的基因。细菌的选择标记的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。用于酵母宿主细胞的适合的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合酶),以及其等效物。在另一方面,本发明提供了宿主细胞,宿主细胞包含编码本发明的至少一种工程化TdT多肽的多核苷酸,多核苷酸被可操作地连接至一个或更多个控制序列用于在宿主细胞中表达工程化TdT酶。用于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)[ATCC保藏号201178]);昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞为大肠杆菌菌株(诸如,W3110(ΔfhuA)和BL21)。
在一些实施方案中,宿主细胞株包含一个或更多个基因的敲除,特别是磷酸酶基因的敲除。在一些实施方案中,宿主细胞包含大肠杆菌基因aphA、surE、phoA和/或cpdB的敲除或单基因缺失,如下面实施例中描述的。在一些实施方案中,包含一种或更多种磷酸酶基因敲除的宿主细胞增加了产物的产生和/或减少了产物或底物的去磷酸化。
因此,在另一方面,本发明提供了用于产生工程化TdT多肽的方法,其中该方法包括将能够表达编码工程化TdT多肽的多核苷酸的宿主细胞在适用于表达该多肽的条件下培养。在一些实施方案中,方法还包括分离和/或纯化如本文描述的TdT多肽的步骤。
用于以上描述的宿主细胞的适合的培养基和生长条件是本领域熟知的。用于表达TdT多肽的多核苷酸可以通过本领域已知的各种方法引入到细胞中。技术包括,除了其他以外,电穿孔、生物弹射粒子轰击(biolistic particle bombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的性质的工程化TdT可以通过使编码天然存在或工程化TdT多肽的多核苷酸经历本领域已知的和如本文所描述的诱变和/或定向演化方法来获得。示例性的定向进化技术为诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA 91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746)。可以使用的其他定向进化程序包括,尤其是,交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,16:258-261[1998])、诱变PCR(参见例如,Caldwell等人,PCR Methods Appl.,3:S136-S140[1994])和盒式诱变(参见如,Black等人,Proc.Natl.Acad.Sci.USA 93:3525-3529[1996])。
例如,诱变和定向进化的方法可以容易地应用于多核苷酸,以产生可以被表达、筛选和测定的变体文库。诱变和定向演化方法是本领域熟知的(参见例如,美国专利第5,605,793号、第5,811,238号、第5,830,721号、第5,834,252号、第5,837,458号、第5,928,905号、第6,096,548号、第6,117,679号、第6,132,970号、第6,165,793号、第6,180,406号、第6,251,674号、第6,265,201号、第6,277,638号、第6,287,861号、第6,287,862号、第6,291,242号、第6,297,053号、第6,303,344号、第6,309,883号、第6,319,713号、第6,319,714号、第6,323,030号、第6,326,204号、第6,335,160号、第6,335,198号、第6,344,356号、第6,352,859号、第6,355,484号、第6,358,740号、第6,358,742号、第6,365,377号、第6,365,408号、第6,368,861号、第6,372,497号、第6,337,186号、第6,376,246号、第6,379,964号、第6,387,702号、第6,391,552号、第6,391,640号、第6,395,547号、第6,406,855号、第6,406,910号、第6,413,745号、第6,413,774号、第6,420,175号、第6,423,542号、第6,426,224号、第6,436,675号、第6,444,468号、第6,455,253号、第6,479,652号、第6,482,647号、第6,483,011号、第6,484,105号、第6,489,146号、第6,500,617号、第6,500,639号、第6,506,602号、第6,506,603号、第6,518,065号、第6,519,065号、第6,521,453号、第6,528,311号、第6,537,746号、第6,573,098号、第6,576,467号、第6,579,678号、第6,586,182号、第6,602,986号、第6,605,430号、第6,613,514号、第6,653,072号、第6,686,515号、第6,703,240号、第6,716,631号、第6,825,001号、第6,902,922号、第6,917,882号、第6,946,296号、第6,961,664号、第6,995,017号、第7,024,312号、第7,058,515号、第7,105,297号、第7,148,054号、第7,220,566号、第7,288,375号、第7,384,387号、第7,421,347号、第7,430,477号、第7,462,469号、第7,534,564号、第7,620,500号、第7,620,502号、第7,629,170号、第7,702,464号、第7,747,391号、第7,747,393号、第7,751,986号、第7,776,598号、第7,783,428号、第7,795,030号、第7,853,410号、第7,868,138号、第7,783,428号、第7,873,477号、第7,873,499号、第7,904,249号、第7,957,912号、第7,981,614号、第8,014,961号、第8,029,988号、第8,048,674号、第8,058,001号、第8,076,138号、第8,108,150号、第8,170,806号、第8,224,580号、第8,377,681号、第8,383,346号、第8,457,903号、第8,504,498号、第8,589,085号、第8,762,066号、第8,768,871号、第9,593,326号和所有相关的美国、以及PCT和非美国对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625、WO 97/0078、WO 97/35966、WO 98/27230、WO 00/42651、WO 01/75767和WO 2009/152336,所有这些都通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过以下来筛选:使酶经历指定的温度(或其他测定条件,诸如测试酶对宽范围的底物的活性),并测量热处理或其他测定条件之后剩余的酶活性的量。然后包含编码TdT多肽的多核苷酸的克隆被测序以鉴定核苷酸序列的改变(如果有),并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何适合的方法(例如,标准生物化学技术,诸如HPLC分析)进行。
在一些实施方案中,可以对在诱变处理后获得的克隆筛选具有一种或更多种期望的改进的酶性质(例如,改进的区域选择性(regioselectivity))的工程化TdT。可以使用标准生物化学技术诸如HPLC分析、LC-MS分析、RapidFire-MS分析和/或毛细管电泳分析来进行从表达文库测量酶活性。
当已知工程化多肽的序列时,根据已知的合成方法可以通过标准固相方法制备编码该酶的多核苷酸。在一些实施方案中,多达约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶促或化学连接方法(chemical ligation method)或聚合酶介导的方法)以形成任何期望的连续序列。例如,编码TdT的部分的多核苷酸和寡核苷酸可以通过本领域已知的化学合成来制备(例如,Beaucage等人的经典亚磷酰胺法,Tet.Lett.22:1859-69[1981],或由Matthes等人,EMBO J.3:801-05[1984]描述的方法),如通常在自动合成方法中实施的。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆到适当的载体中。此外,可以从各种商业来源中的任一个获得基本上任何核酸。在一些实施方案中,通过合成含有缺失、插入和/或取代的寡核苷酸并且以各种排列组合寡核苷酸可以产生另外的变化,以产生具有改进性质的工程化TdT。
因此,在一些实施方案中,制备工程化TdT多肽的方法包括:(a)合成编码多肽的多核苷酸,该多肽包含与选自SEQ ID NO:4-3592和3698-6766的偶数编号序列的氨基酸序列具有至少约60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性的氨基酸序列,并且与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636相比具有一个或更多个残基差异或残基差异集;和(b)表达由该多核苷酸编码的TdT多肽。
在该方法的一些实施方案中,多核苷酸编码任选地具有一个或更多个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的工程化TdT。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、1-50个、1-75个、1-100个或1-150个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有约1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个、60个、65个、70个、80个、90个、100个、110个、120个、130个、140个或150个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在一些实施方案中,在宿主细胞中表达的任何工程化TdT酶可以使用用于蛋白纯化的熟知技术中的任一种或更多种从细胞和/或培养基回收,蛋白纯化的熟知技术包括,除了其他以外,溶菌酶处理、超声、过滤、盐析、超速离心和色谱。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是商业上可获得的(例如,CelLytic BTM,Sigma-Aldrich,St.Louis MO)。
分离TdT多肽的色谱技术,包括但不限于反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定的酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对本领域技术人员将是明显的。
在一些实施方案中,亲和技术可以用于分离改进的TdT酶。对于亲和色谱纯化,可以使用特异性结合TdT多肽的任何抗体。对于抗体的产生,包括但不局限于兔、小鼠、大鼠等的多种宿主动物可通过用TdT多肽或其片段注射来免疫。可通过侧链官能团或附接至侧链官能团的接头的方法来使TdT多肽或片段附接至合适的载体诸如BSA上。在一些实施方案中,亲和纯化可以使用结合TdT的特异性配体或染料亲和柱(参见例如,EP0641862;Stellwagen,“Dye Affinity Chromatography,”于Current Protocols in ProteinScience,Unit9.2-9.2.16[2001])。
使用工程化TdT酶的方法
在一些实施方案中,本文所述的TdT酶可用于将一种或更多种合适的底物转化为产物的方法中。
在一些实施方案中,本文公开的工程化TdT多肽可用于将寡核苷酸受体底物和NTP-3’-O-RBG底物转化为包含延伸一个核苷酸的寡核苷酸受体底物的产物的过程中。
在本文提供且在实施例中说明的实施方案中,可以在该方法中使用的合适的反应条件的各种范围包括但不限于底物载量、共底物载量、pH、温度、缓冲剂、溶剂体系、辅因子、多肽载量和反应时间。用于使用本文描述的工程化TdT进行底物化合物向产物化合物的生物催化转化的另外的合适反应条件可以根据本文提供的指导通过常规实验容易地优化,其包括但不限于使工程化TdT多肽和一种或更多种底物化合物在浓度、pH、温度和溶剂条件的实验反应条件下接触,并检测产物化合物。
寡核苷酸受体底物可以是具有暴露的3'-OH的任何核苷酸链或类似部分。在一些实施方案中,受体底物可以是单链的。在又其他实施方案中,受体底物可以是双链的或部分双链的。在一些实施方案中,受体底物可以包含由1-10个NTP、5-20个NTP、15-50个NTP、30-100个NTP或大于100个NTP组成的核苷酸链。在一些实施方案中,受体底物可以包含不是核苷酸链但含有能够被野生型或工程化TdT识别为底物的游离-OH的化学部分。
在一些实施方案中,寡核苷酸受体底物包含重复NTP的核苷酸链。在其他实施方案中,寡核苷酸受体底物包含不重复的各种NTP的核苷酸链。在一些实施方案中,寡核苷酸受体底物包含具有奇数个NTP的核苷酸链。在一些实施方案中,寡核苷酸受体底物包含具有偶数个NTP的核苷酸。
在一些实施方案中,寡核苷酸受体底物被固定到固体支持物。合适的固体支持物是本领域人员已知的,并在本公开内容上文中描述。
在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TAATT。在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TAATC。在又其他实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTATC。在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTATG。在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTACA。在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTCCG。在一些实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTTCTG。在其他实施方案中,寡核苷酸受体底物包含核苷酸序列TTTTTTCGA。在又其他实施方案中,受体底物包含核苷酸序列TTTTTTCGG。这些实施方案意图是非限制性的。任何合适的寡核苷酸受体底物都可用于本发明。
在一些实施方案中,NTP-3'-O-RBG底物包含具有3'-O-RBG的脱氧核糖核苷三磷酸。在其他实施方案中,NTP-3'-O-RBG底物可以包含具有3'-O-RBG的核糖核苷三磷酸。在又其他实施方案中,NTP-3’-O-RBG底物可以包含具有3’-O-RBG的合成核苷三磷酸。在一些实施方案中,NTP-3'-O-RBG底物可以包含具有不是五个碳的数量的糖环。其非限制性实例是苏糖核苷三磷酸。
在一些实施方案中,NTP-3’-O-RBG底物可以包含选自由NTP-3’-O-NH2、NTP-3’-O-NO2、或NTP-3’-O-PO3组成的组的可去除封闭基团。在一些实施方案中,NTP-3'-O-RBG底物包含在去除来自第一轮添加的可去除封闭之前,在空间上阻止第二个NTP-3'-O-RBG底物添加到生长中的寡核苷酸受体底物链的3'端的另一个封闭基团。
在一些实施方案中,具有3’-O-RBG的脱氧核糖核苷三磷酸或具有3’-O-RBG的核糖核苷三磷酸可以具有天然嘌呤或嘧啶碱基,诸如腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶或尿苷。在一些实施方案中,如本领域已知的,具有3’-O-RBG的脱氧核糖核苷三磷酸或具有3’-O-RBG的核糖核苷三磷酸可以具有非天然的碱类似物,诸如肌苷、黄嘌呤、次黄嘌呤或另一种碱类似物。在一些实施方案中,如本领域已知的,具有3’-O-RBG的脱氧核糖核苷三磷酸或具有3’-O-RBG的核糖核苷三磷酸可以具有含有修饰的碱基。
考虑到例如产物化合物的期望量、每种底物浓度对酶活性的影响、酶在反应条件下的稳定性和每种底物向产物的转化百分比,反应混合物中的底物化合物可以变化。在一些实施方案中,合适的反应条件包括对于每种寡核苷酸受体底物,至少约0.1uM至1uM、1uM至2uM、2uM至3uM、3uM至5uM、5uM至10uM或10uM或更大的底物化合物载量。在一些实施方案中,合适的反应条件包括对于每种寡核苷酸受体底物,至少约0.5g/L至约25g/L、1g/L至约25g/L、5g/L至约25g/L、约10g/L至约25g/L或20g/L至约25g/L的底物化合物载量。在一些实施方案中,合适的反应条件包括对于每种寡核苷酸受体底物,至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L或至少约30g/L或甚至更大的底物化合物载量。
在一些实施方案中,合适的反应条件包括对于每种NTP-3’-O-RBG,至少约1uM至5uM、5uM至10uM、10uM至25uM、25uM至50uM、50uM至100uM、100uM至200uM、200uM至300uM或300uM至500uM的底物化合物载量。在一些实施方案中,合适的反应条件包括对于每种寡核苷酸受体底物,至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L或至少约30g/L或甚至更大的底物化合物载量。
在进行本文描述的TdT介导的合成方法中,工程化多肽可以以纯化的酶、部分纯化的酶、用编码该酶的一种或更多种基因转化的全细胞、作为这样的细胞的细胞提取物和/或裂解物、和/或作为固定在固体支持物上的酶的形式添加到反应混合物中。用编码工程化TdT酶的一种或更多种基因转化的全细胞,或其细胞提取物、其裂解物,以及分离的酶可以以多种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的等)或半固体(例如,粗制糊状物)。细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)部分地纯化,随后进行脱盐程序(例如,超滤、透析等),然后冻干。任何酶制品(包括全细胞制品)可以通过使用已知的交联剂(诸如例如戊二醛)交联或固定至固相(例如,Eupergit C等)而被稳定。
编码工程化TdT多肽的一种或更多种基因可以被分别转化到宿主细胞中或一起转化到同一宿主细胞中。例如,在一些实施方案中,可以用编码一种工程化TdT多肽的一种或更多种基因转化一组宿主细胞,并且可以用编码另一种TdT的一种或更多种基因转化另一组宿主细胞。两组转化的宿主细胞均可以全细胞的形式,或以源自其的裂解物或提取物的形式一起用于反应混合物。在其他实施方案中,宿主细胞可以用编码多种工程化TdT多肽的一种或更多种基因转化。在一些实施方案中,工程化多肽可以以分泌多肽的形式被表达并且含有该分泌多肽的培养基可被用于TdT反应。
在一些实施方案中,本文公开的工程化TdT多肽的改进的活性提供了其中可以用较低浓度的工程化多肽实现较高转化百分比的方法。在该方法的一些实施方案中,合适的反应条件包括底物化合物载量的约1%(w/w)、2%(w/w)、5%(w/w)、10%(w/w)、20%(w/w)、30%(w/w)、40%(w/w)、50%(w/w)、75%(w/w)、100%(w/w)或更多的工程化多肽量。
在一些实施方案中,工程化多肽以约50比1、25比1、10比1、5比1、1比1、1比5、1比10、1比25或1比50的工程化多肽与底物的摩尔比存在。在一些实施方案中,工程化多肽以范围为约50比1至约1比50的工程化多肽与底物的摩尔比存在。
在一些实施方案中,工程化多肽以约0.01g/L至约50g/L;0.01g/L至约0.1g/L;约0.05g/L至约50g/L;约0.1g/L至约40g/L;约1g/L至约40g/L;约2g/L至约40g/L;约5g/L至约40g/L;约5g/L至约30g/L;约0.1g/L至约10g/L;约0.5g/L至约10g/L;约1g/L至约10g/L;约0.1g/L至约5g/L;约0.5g/L至约5g/L或约0.1g/L至约2g/L存在。在一些实施方案中,TdT多肽以约0.01g/L、0.05g/L、0.1g/L、0.2g/L、0.5g/L、1g/L、2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L或50g/L存在。
在一些实施方案中,合适的反应条件包括二价金属辅因子。在一些实施方案中,二价金属辅因子是钴。在一些实施方案中,钴以氯化钴(II)的形式存在于反应混合物中。在一些实施方案中,氯化钴(II)以约1uM至500uM;约50uM到400uM;约100uM到300uM;或约200uM到300uM的浓度存在。在一些实施方案中,氯化钴(II)以约150uM;约200uM;约250uM,或约300uM的浓度存在。
在一些实施方案中,合适的反应条件包括乙酸钾。在一些实施方案中,乙酸钾以1mM至100mM;25mM至75mM;或30mM至60mM的浓度存在。在一些实施方案中,乙酸钾以约25mM;约50mM;或约75mM的浓度存在。
在该反应的一些实施方案中,磷酸酶用于降解无机磷酸盐,并将反应平衡转向寡核苷酸受体延伸产物。在一些实施方案中,磷酸酶是大肠杆菌焦磷酸酶。在一些实施方案中,磷酸酶以约0.0001单位/uL至0.01单位/uL;约0.001单位/uL至0.005单位/uL;或约0.002单位/uL至0.003单位/uL的浓度存在。在一些实施方案中,磷酸酶以约0.001单位/uL;约0.002单位/uL;或约0.003单位/uL的浓度存在。
在反应过程期间,反应混合物的pH可以变化。反应混合物的pH可以保持在期望的pH或在期望的pH范围内。这可以通过在反应过程之前和/或反应过程期间添加酸或碱来实现。可选地,pH可以通过使用缓冲剂来控制。相应地,在一些实施方案中,反应条件包括缓冲剂。用于维持期望pH范围的合适缓冲剂是本领域已知的,并且通过示例而非限制包括硼酸盐、磷酸盐、2-(N-吗啉基)乙磺酸(MES)、3-(N-吗啉基)丙磺酸(MOPS)、乙酸盐、三乙醇胺和2-氨基-2-羟甲基-丙-1,3-二醇(Tris)等。在一些实施方案中,反应条件包括作为合适溶剂的水,而不存在缓冲剂。
在方法的实施方案中,反应条件包括合适的pH。期望的pH或期望的pH范围可以通过使用酸或碱、适合的缓冲剂、或缓冲和添加酸或碱的组合来保持。反应混合物的pH可以在反应过程之前和/或反应过程期间进行控制。在一些实施方案中,合适的反应条件包括约4至约10的溶液pH、约5至约10的pH、约5至约9的pH、约6至约9的pH、约6至约8的pH。在一些实施方案中,反应条件包括约4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10的溶液pH。
在本文的方法的实施方案中,使用合适的温度用于反应条件,例如考虑到反应速率在较高温度的增加和反应时间段期间酶的活性。相应地,在一些实施方案中,合适的反应条件包括约10℃至约95℃、约10℃至约75℃、约15℃至约95℃、约20℃至约95℃、约20℃至约65℃、约25℃至约70℃、或约50℃至约70℃的温度。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、90℃或95℃的温度。在一些实施方案中,酶促反应期间的温度可以在整个反应过程中保持在特定的温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间随着温度曲线进行调整。
在一些实施方案中,本发明的方法在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂、聚合物溶剂和/或共溶剂体系,其通常包含水性溶剂、有机溶剂和/或聚合物溶剂。水性溶剂(水或水性共溶剂体系)可以是pH缓冲的或非缓冲的。在一些实施方案中,使用工程化TdT多肽的方法可以在包含以下的水性共溶剂体系中进行:有机溶剂(例如乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)、离子或极性溶剂(例如1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基3-甲基咪唑鎓六氟磷酸盐、甘油、聚乙二醇等)。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元醇、二甲基亚砜(DMSO)或低级醇。水性共溶剂体系的非水性共溶剂组分可以与水性组分混溶,从而提供单一液相,或者可以与水性组分部分地混溶或不混溶,从而提供两个液相。示例性的水性共溶剂体系可以包含水和选自有机溶剂、极性溶剂和多元醇溶剂的一种或更多种共溶剂。通常,选择水性共溶剂体系的共溶剂组分以使在反应条件下不会不利地使TdT酶失活。通过利用酶活性测定,诸如本文描述的那些,在候选溶剂体系中测量指定的工程化TdT酶对限定的感兴趣的底物的酶活性,可以容易地鉴定适当的共溶剂体系。
在方法的一些实施方案中,合适的反应条件包括水性共溶剂,其中共溶剂包含约1%至约50%(v/v)、约1%至约40%(v/v)、约2%至约40%(v/v)、约5%至约30%(v/v)、约10%至约30%(v/v)或约10%至约20%(v/v)的DMSO。在方法的一些实施方案中,合适的反应条件可以包括包含约1%(v/v)、约5%(v/v)、约10%(v/v)、约15%(v/v)、约20%(v/v)、约25%(v/v)、约30%(v/v)、约35%(v/v)、约40%(v/v)、约45%(v/v)或约50%(v/v)的乙醇的水性共溶剂。
在一些实施方案中,反应条件包括用于稳定或增强反应的表面活性剂。表面活性剂可以包括非离子表面活性剂、阳离子表面活性剂、阴离子表面活性剂和/或两亲性表面活性剂。示例性的表面活性剂包括,例如但不限于,壬基苯氧基聚乙氧基乙醇(NP40)、TRITONTMX-100聚乙二醇叔辛基苯基醚、聚氧乙烯-硬脂酰胺、十六烷基三甲基溴化铵、油烯基酰氨基硫酸钠、聚氧乙烯脱水山梨糖醇单硬脂酸酯、十六烷基二甲基胺等。可以使用任何可以稳定或增强反应的表面活性剂。反应中待使用的表面活性剂的浓度一般可以为0.1mg/ml至50mg/ml,特别是1mg/ml至20mg/ml。
在一些实施方案中,反应条件包括消泡剂,其有助于减少或防止在反应溶液中形成泡沫,诸如当反应溶液被混合或喷洒时。消泡剂包括非极性油(例如,矿物油、硅酮等)、极性油(例如,脂肪酸、烷基胺、烷基酰胺、烷基硫酸酯等)和疏水物(例如,经处理的二氧化硅、聚丙烯等),其中一些也起表面活性剂的作用。示例性的消泡剂包括(Dow Corning)、聚二醇共聚物、氧基/乙氧基化醇和聚二甲基硅氧烷。在一些实施方案中,消泡剂可以以约0.001%(v/v)至约5%(v/v)、约0.01%(v/v)至约5%(v/v)、约0.1%(v/v)至约5%(v/v)或约0.1%(v/v)至约2%(v/v)存在。在一些实施方案中,消泡剂可以以约0.001%(v/v)、约0.01%(v/v)、约0.1%(v/v)、约0.5%(v/v)、约1%(v/v)、约2%(v/v)、约3%(v/v)、约4%(v/v)或约5%(v/v)或更多存在,如促进反应所需的。
在TdT反应中使用的反应物的量通常将根据期望的产物的量以及伴随的使用的底物的量而变化。本领域普通技术人员将容易地理解如何改变这些量以将它们定制到期望的生产率和生产规模的水平。
在一些实施方案中,添加反应物的顺序并不关键。反应物可以一起同时添加至溶剂(例如,单相溶剂、双相水性共溶剂体系等)中,或者可选地,一些反应物可以单独添加,并且一些可以在不同的时间点一起添加。例如,辅因子、共底物和底物可以首先添加到溶剂中。
固体反应物(例如,酶、盐等)可以以多种不同形式包括粉末(例如,冻干的、喷雾干燥的等)、溶液、乳液、悬浮液等提供至反应。使用本领域普通技术人员已知的方法和设备,可以容易地将反应物冻干或喷雾干燥。例如,蛋白溶液可以以小的等分试样冷冻于-80℃,然后添加至预冷却的冻干室内,随后应用真空。
当使用水性共溶剂体系时,为了提高混合效率,可以首先将TdT和共底物添加并混合到水相中。底物可以被添加并混合进去,然后是有机相,或者底物可以被溶解在有机相中并混合进去。可选地,底物可以在有机相中预混合,然后添加到水相中。
通常允许本发明的方法进行,直到底物向产物的进一步转化不随反应时间显著变化(例如少于10%的底物被转化或少于5%的底物被转化)。在一些实施方案中,允许反应继续进行,直至有底物向产物的完全或接近完全的转化。底物向产物的转化可以使用已知的方法通过检测底物和/或产物(进行或不进行衍生化)来监测。合适的分析方法包括气相色谱、HPLC、MS等。在一些实施方案中,在适当转化为产物后,将反应物从寡核苷酸受体底物延伸产物中分离,并将另外的反应物添加到寡核苷酸受体底物延伸产物中,以进一步延伸生长中的多核苷酸链。本发明的方法可用于迭代延伸寡核苷酸受体延伸产物,直到合成限定序列和长度的多核苷酸。
本文公开的使用工程化多肽制备产物的任何方法可以在一系列合适的反应条件(包括但不限于底物、温度、pH、溶剂体系、底物载量、多肽载量、辅因子载量和反应时间的范围)下进行。在一个实例中,合适的反应条件包括:(a)约0.1-20uM底物化合物的寡核苷酸受体底物载量;(b)约1-1000uM底物化合物的NTP-3’-O-RBG底物载量;(c)约0.01g/L至5g/L的工程化多肽;(d)100uM至400uM氯化钴(II);(e)25mM至75mM乙酸钾;(f)5mM至100mM MOPS缓冲液;(g)0.0001单位/uL至0.03单位/uL焦磷酸酶;(h)pH值为5-9;和(i)约15℃至70℃的温度。在一些实施方案中,合适的反应条件包括:(a)约1uM底物化合物的寡核苷酸受体底物载量;(b)约50uM底物化合物的NTP-3’-O-RBG底物载量;(c)约0.04g/L工程化多肽;(d)250uM氯化钴(II);(e)50mM乙酸钾;(f)20mM MOPS缓冲液;(g)0.001单位/uL至0.003单位/uL焦磷酸酶;(h)pH值为7.2;和(i)约60℃的温度。在一些实施方案中,进行另外的反应组分或另外的技术来补充反应条件。这些可以包括采取措施以稳定酶或防止酶失活、减少产物抑制、使反应平衡向期望产物的形成移动。
在一些实施方案中,合适的反应条件包括:(a)1μM工程化TdT多肽,(b)1μM寡核苷酸受体底物,(c)1-10μM NTP-3’-O-RBG,和(d)60℃,其中90秒后实现大于99.5%的转化。在一些实施方案中,本公开内容提供了一种工程化TdT,其能够在合适的反应条件下将1μM寡核苷酸受体底物和1-10μM NTP-3’-O-RBG转化99.5%,以在60℃90秒后形成N+1延伸产物。在一些实施方案中,能够在合适的反应条件下将1μM寡核苷酸受体底物和1-10μMNTP-3’-O-RBG转化99.5%以在60℃90秒后形成N+1延伸产物的工程化TdT是包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列的工程化TdT多肽。
在一些实施方案中,本公开内容提供了一种工程化TdT,其中所述工程化TdT对NTP-3’-RBG具有改进的活性,使得与另一种野生型或工程化TdT相比,NTP-3'-RBG以与天然NTP相当的效率掺入。在一些实施方案中,对dNTP-3’-O-PO3具有改进的活性使得dNTP-3’-O-PO3以与天然dNTP相当的效率掺入的工程化TdT是包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636具有至少60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列的工程化TdT多肽。
在另外的实施方案中,用于将一种或更多种底物化合物转化为产物化合物的任何上文描述的方法还可以包括一个或更多个选自以下的步骤:产物化合物的提取、分离、纯化和结晶。用于从通过以上公开的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶产物的方法、技术和方案是普通技术人员已知的和/或可通过常规实验获得的。另外地,在下文的实施例中提供了说明性方法。
本发明的各种特征和实施方案在以下代表性实施方案中进行了说明,这些实施方案意图说明而非限制。
实验
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。事实上,下文描述的许多试剂和设备有各种合适的来源。不意图将本发明限于任何试剂和设备项目的任何特定来源。
在以下的实验公开内容中,应用以下缩写:M(摩尔/升);mM(毫摩尔/升)、uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(分钟);h和hr(小时);U(单位);MW(分子量);rpm(每分钟转数);psi和PSI(每平方英寸磅数);℃(摄氏度);RT和rt(室温);CV(变异系数);CAM和cam(氯霉素);PMBS(硫酸多粘菌素B);IPTG(异丙基β-D-L-硫代吡喃半乳糖苷);LB(溶原性肉汤);TB(terrific肉汤);SFP(摇瓶粉末);CDS(编码序列);DNA (脱氧核糖核酸);RNA(核糖核酸);nt(核苷酸;多核苷酸);aa(氨基酸;多肽);大肠杆菌W3110(常用实验室大肠杆菌菌株,从Coli Genetic Stock Center[CGSC],New Haven,CT可得);HTP(高通量);HPLC(高压液相色谱);HPLC-UV(HPLC-紫外可见检测器);1H NMR(质子核磁共振波谱);FIOPC(相比于阳性对照的改进倍数);Sigma和Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Microfluidics(Microfluidics,Westwood,MA);Life Technologies(LifeTechnologies,Fisher Scientific,Waltham,MA的一部分);Amresco(Amresco,LLC,Solon,OH);Carbosynth(Carbosynth,Ltd.,Berkshire,UK);Varian(Varian Medical Systems,Palo Alto,CA);Agilent(Agilent Technologies,Inc.,Santa Clara,CA);Infors(InforsUSAInc.,Annapolis Junction,MD);和Thermotron(Thermotron,Inc.,Holland,MI)。
实施例1
末端脱氧核苷酸转移酶(TdT)基因的获取及表达载体的构建
野生型(WT)末端脱氧核苷酸转移酶(TdT)酶(SEQ ID NO:2)是由物种纹霸鹟的基因组编码的预测剪接变体。编码WT TdT在氨基酸位置131处截短的N-末端加6-组氨酸标签的版本(SEQ ID NO:4)的合成基因(SEQ ID NO:3)被设计为具有用于大肠杆菌表达的密码子优化,合成并亚克隆到大肠杆菌表达载体pCK100900i中(参见例如美国专利第7,629,157号和美国专利申请公布2016/0244787,其两者通过引用特此并入)。将该质粒构建体转化进源自W3110的大肠杆菌菌株中。使用本领域技术人员通常已知的定向进化技术从这些质粒产生基因变体的文库(参见例如,美国专利第8,383,346号和WO 2010/144103,这两篇文献都通过引用特此并入)。本文描述的酶变体中的取代参考WT TdT酶的截短的和N-末端加6-组氨酸标签的版本(即SEQ ID NO:4)或其变体来指示,如指示的。
实施例2
TdT的高通量(HTP)表达及纯化
TdT酶和变体的高通量(HTP)生长
经转化的大肠杆菌细胞通过铺板到含有l%葡萄糖和30μg/ml氯霉素的LB琼脂板上来选择。在37℃孵育过夜之后,将菌落置于96孔浅平底NUNCTM(Thermo-Scientific)板的孔中,该板填充有180μl/孔的补充有l%葡萄糖和30μg/ml氯霉素的LB培养基。允许培养物在振荡器(200rpm,30℃和85%相对湿度;Kuhner)中生长过夜持续18-20小时。过夜生长样品(20μL)转移至Costar 96孔深板中,该板填充有380μL的补充有30μg/ml氯霉素的Terrific肉汤。板在振荡器(250rpm,30℃,和85%相对湿度;Kuhner)中孵育120分钟,直到OD600达到0.4-0.8之间。然后细胞用40μL的在无菌水中的10mM IPTG诱导,并且在振荡器(250rpm,30℃和85%相对湿度;Kuhner)中孵育过夜持续18-20小时。使细胞沉淀(4000rpmx 20min),弃去上清液,并且细胞在分析之前在-80℃冷冻。
用溶菌酶裂解HTP细胞沉淀
对于裂解,将含有50mM Tris缓冲液pH 8.0、0.2g/L溶菌酶和0-300mM NaCl(按指定)的300-400μl裂解缓冲液(按指定)添加到每个孔中的细胞沉淀中。伴随在台式振荡器(bench top shaker)上震荡,使细胞在室温裂解2小时。然后将板在4000rpm和4℃离心15min。然后将澄清的上清液用于生物催化反应,以确定其活性水平。
HTP细胞沉淀的裂解用于从粗裂解物中纯化TdT
将细胞沉淀以300μl/孔重悬。将裂解混合物[50mM Tris缓冲液pH 8.0、75%(v/v)B-Per试剂(Thermo Fisher)、0.2mg/ml溶菌酶、300mM NaCl、10mM咪唑和0.2%(v/v)TritonX-100]添加到细胞悬浮液中。将混合物在室温搅拌2小时,沉淀(4000rpm x 20min),并保留上清液用于纯化。
根据制造商的说明,使用高容量(HC)镍涂层板(Sigma)通过金属亲和层析从粗大肠杆菌提取物中纯化TdT。每孔用总共800μl洗涤缓冲液(50mM Tris-HCl、300mMNaCl、20mM咪唑、0.02%v/v Triton X-100试剂)平衡HIS-Select板。然后,将含有TdT的200μl HTP裂解物加载到板上,并在2000相对离心力(rcf)和4℃离心1min。用400μl洗涤缓冲液/孔洗涤板两次,每次洗涤在3000rcf和4℃离心3min。添加100μl洗脱缓冲液(50mM Tris-HCl、300mM NaCl、350mM咪唑、0.02%v/v Triton X-100试剂),通过在4℃以3000rcf离心1min洗脱TdT样品。
使用ZebaTM旋转脱盐板(Thermo Fisher)对洗脱物进行缓冲液交换。简而言之,每孔用375μl 2x TdT储存缓冲液(40mM Tris-HCl pH 7.5、200mM KCl和0.2mM EDTA)来平衡板两次,并在4℃以1100xg离心2min。在脱盐板上加载80μl HIS-Select样品洗脱物,并在4℃以1100x g离心2min。保留来自脱盐板的洗脱物,并与等体积的甘油混合,最终储存缓冲液浓度为20mM Tris-HCl pH 7.5、100mM KCl、0.1mM EDTA和50%甘油。
实施例3
TdT的摇瓶表达及纯化
摇瓶表达
将如上所述生长的选择的HTP培养物铺到含有1%葡萄糖和30μg/ml氯霉素的LB琼脂板上并在37℃生长过夜。将来自每种培养物的单个菌落转移至含有1%葡萄糖和30μg/ml氯霉素的5ml LB肉汤中。使培养物在30℃、250rpm生长20h,并以约1:50稀释到250ml含有30μg/ml氯霉素的Terrific肉汤中来继代培养,至最终OD600为约0.05。将培养物在30℃、250rpm孵育大约195min,至OD600为约0.6,并且然后添加最终浓度为1mM的IPTG进行诱导。将诱导的培养物在30℃、250rpm孵育20h。孵育期后,将培养物以4000rpm x 10min离心。弃去培养上清液,并将沉淀重悬于35ml的20mM三乙醇胺,pH 7.5中。将该细胞悬浮液在冰浴中冷却,并使用微流体化细胞破碎器(Microfluidics M-110L)裂解。通过离心(11,000rpm,在4℃下60min)沉淀粗裂解物,并且然后通过0.2μm PES膜过滤上清液,以进一步澄清裂解物。
TdT从摇瓶裂解物中的纯化
每孔向TdT裂解物补充1/10体积的SF洗脱缓冲液(50mM Tris-HCl、500mM NaCl、250mM咪唑、0.02%v/v Triton X-100试剂)。然后使用AKTAStart纯化系统和5ml HisTrapFF柱(GE Healthcare)使用AC Step HiF设置(运行参数如下提供)纯化裂解物。SF洗涤缓冲液包含50mM Tris-HCl、300mM NaCl、20mM咪唑、0.02%v/v Triton X-100试剂。
通过UV吸光度(A280)鉴定单一最浓缩的3ml级分,并在3.5K Slide-A-LyzerTM透析盒(Thermo Fisher)中的透析缓冲液(20mM Tris-HCl pH 7.4、100mM KCl、0.1mM EDTA和50%甘油)中透析过夜,用于缓冲液交换。通过在280nm处的吸光度来测量制剂中的TdT浓度。
实施例4
寡核苷酸的HPLC-MS/MS分析-方法A(Ultivo)
如每个实施例中所述地猝灭反应。然后将经猝灭和澄清的反应上清液(50μL)转移到BioRad PCR板上进行LCMS分析。根据表4.1中总结的Ultivo分析方法分析样品。
实施例5
寡核苷酸的HPLC-MS/MS分析-方法B(LTQ)
如每个实施例中所述地猝灭反应。然后将经猝灭和澄清的反应上清液(50μL)转移到BioRad PCR板上进行LCMS分析。根据表5.1中总结的LTQ分析方法分析样品。
实施例6
寡核苷酸的RapidFire SPE-MS/MS分析
传统的高通量分析技术,诸如反相HPLC-MS/MS,是分析寡核苷酸的有力工具;然而,分析速度慢,并且需要使用离子配对剂和电喷雾改性剂。已知使用离子配对剂诸如TEA(三乙胺)、DBA(二乙胺)、DIPEA(二异丙基乙胺)和电喷雾改性剂诸如HFIP(1,1,1,3,3,3-六氟-2-丙醇)、HFMIP(1,1,1,3,3,3-六氟-2-甲基-2-丙醇)在正模式分析中产生主要的离子抑制。开发了一种使用亲水相互作用液相色谱(HILIC)小柱的超高通量固相萃取方法RapidFire,来纯化用于快速MS分析的反应样品。与反相色谱不同,在反相色谱中,疏水固定相对非极性化合物具有很强的亲和力,而HILIC使用极性固定相联合低极性和非极性溶剂的组合来保留亲水性、极性或带电化合物。在RapidFire中不存在色谱分离;感兴趣的寡核苷酸可以在HILIC条件下保留和检测,使用上样缓冲液中的pH 5.5至pH 5.8之间的2.5-12.5mM乙酸铵缓冲液,延长平衡时间,额外洗涤,并结合70% ACN 30%水性缓冲液pH 8-8.5洗脱,这允许在18-22秒内在Rapid-Fire系统上保留和检测5-11个寡核苷酸,并且不必使用任何离子配对试剂。
寡核苷酸保留和检测的评价:
制备了大批量50uM 3P-dTTP、1x MOP缓冲液pH 7.2、0.0002U无机焦磷酸酶、25%高通量澄清阴性裂解物和0.25mM钴的阴性反应基质。通过添加12uM的5mer寡核苷酸,TAATC标准品加标到阴性反应基质中,产生模拟阳性样品。模拟阳性和阴性样品用5.5x(4.5体积的90%乙腈10MEOH)猝灭,并在4℃以4,000rpm离心10分钟。收集上清液,并在下表6.1示出的各种固相萃取条件下,将交替的阳性和阴性样品一式三份注射到HILIC小柱上。寡核苷酸在HILIC小柱上的保留由阳性和阴性样品之间的信号差异来指示。如图4中的E行所示,在pH5.7的2.5mM乙酸铵添加剂和乙腈并结合更长的上样时间,观察到HILIC小柱中寡核苷酸保留的初始检测。Rapid Fire参数参见表6.2。延长的上样时间和pH 5.7的上样缓冲液中的乙酸铵添加剂的组合允许感兴趣的寡核苷酸结合到HILIC小柱上,而非特异性信号在上样期间被洗去。额外的上样时间减少了阴性对照中的非特异性信号,因为在固相萃取中,样品通常在上样到小柱中的同时被洗涤。
寡核苷酸保留和检测的优化:
通过优化提取方法的上样、洗涤和洗脱步骤,可以提高寡核苷酸5-11mer的保留。用纯化的TdT聚合酶、4uM TTTTTTATC(底物)、50uM 3P-dTTP、1x MOP缓冲液pH 7.2、0.002U无机焦磷酸酶和0.25mM钴产生阳性反应样品。用相同的组分制备阴性反应样品,除了裂解物不包含TdT聚合酶。阳性和阴性样品都用两倍体积的90%乙腈与10% MEOH的混合物猝灭,并以4000rpm离心10分钟。收集阳性和阴性样品的上清液,并以交替模式注射到HILIC小柱上。下表6.3示出了测试的各种固相萃取条件。当上样缓冲液组成从10%的25mM乙酸铵pH5.8(条件2)变化到15%的25mM乙酸铵pH5.8(条件3)时,Tx7ATC的信号显著增加。有机和水性溶剂含量的变化增强了Tx7ATC的溶解度、结合和电离,并且因此显著加强了阳性样品的信号。此外,样品上样的速率,样品洗涤,上样、洗涤和洗脱缓冲液中的有机物含量会显著影响总体信号。类似的寡核苷酸序列可以用10%-30%的50mM水性乙酸铵缓冲液(pH5.5-5.8之间)保留和检测。下表6.4示出了用于T7ATC的最终改进的Rapidfire条件。
方法验证:
生成了产生T7ATC-G3’Phos的TdT文库反应板的重复组。一组根据RapidFire方法猝灭,并且另一组根据HPLC MS/MS Ultivo方法猝灭。对应于猝灭方法的仪器运行反应样品。RapidFire与HPLC MS/MS Thermo之间的相关值为0.82。
用于文库筛选的RapidFire SPE MS/MS方法:
如每个实施例中所述地猝灭反应。然后将经猝灭和澄清的反应上清液(70μL)转移到384孔微量滴定PCR板上进行MS分析。用表6.5中提供的仪器和参数,通过RapidFire SPE-MS/MS检测产物。
实施例7
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽在HTP中产生,并如表7.1所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表7.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表7.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表7.2中。
实施例8
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表8.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表8.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表8.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表8.2中。
实施例9
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表9.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表9.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表9.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表9.2中。
实施例10
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表10.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表10.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表10.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表10.2中。
实施例11
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表11.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表11.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表11.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表11.2中。
实施例12
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:580的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:580作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表12.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表12.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表12.1中所述。
相对于SEQ ID NO:580的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQ ID NO:580的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表12.2中。
实施例13
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:580的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:580作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表13.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表13.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表13.1中所述。
相对于SEQ ID NO:580的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQ ID NO:580的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表13.2中。
实施例14
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:692的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:692作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表14.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表14.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表14.1中所述。
相对于SEQ ID NO:692的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQ ID NO:692的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表14.2中。
实施例15
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表15.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表15.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表15.1中所述。
相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQID NO:4的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表15.2中。
实施例16
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:882的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:882作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表16.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表16.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表16.1中所述。
相对于SEQ ID NO:882的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQ ID NO:882的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表16.2中。
实施例17
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:882的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:882作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表17.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表17.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表17.1中所述。
相对于SEQ ID NO:882的活性(活性FIOP)计算为变体的产物峰面积与通过使用SEQ ID NO:882的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表17.2中。
实施例18
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:914的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:914作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表18.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表18.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表18.1中所述。
相对于SEQ ID NO:914的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:914的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表18.2中。
实施例19
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1034的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1034作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表19.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表19.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表19.1中所述。
相对于SEQ ID NO:1034的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1034的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表19.2中。
实施例20
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1034的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1034作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表20.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表20.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表20.1中所述。
相对于SEQ ID NO:1034的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1034的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表20.2中。
实施例21
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1034的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1034作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表21.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表21.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表21.1中所述。
相对于SEQ ID NO:1034的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1034的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表21.2中。
实施例22
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1270的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1270作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表22.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表22.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表22.1中所述。
相对于SEQ ID NO:1270的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1270的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表22.2中。
实施例23
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1270的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1270作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表23.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表23.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表23.1中所述。
相对于SEQ ID NO:1270的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1270的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表23.2中。
实施例24
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1270的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1270作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表24.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表24.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表24.1中所述。
相对于SEQ ID NO:1270的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1270的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表24.2中。
实施例25
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1344的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1344作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表25.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表25.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表25.1中所述。
相对于SEQ ID NO:1344的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1344的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表25.2中。
实施例26
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1344的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1344作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表26.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表26.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表26.1中所述。
相对于SEQ ID NO:1344的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1344的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表26.2中。
实施例27
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1344的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1344作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表27.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表27.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表27.1中所述。
相对于SEQ ID NO:1344的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1344的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表27.2中。
实施例28
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1344的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1344作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表28.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表28.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表28.1中所述。
对于SEQ ID NO:1344的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1344的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表28.2中。
实施例29
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1346的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1346作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表29.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表29.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表29.1中所述。
相对于SEQ ID NO:1346的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1346的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表29.2中。
实施例30
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1346的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1346作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表30.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表30.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表30.1中所述。
相对于SEQ ID NO:1346的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1346的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表30.2中。
实施例31
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1346的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1346作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表31.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表31.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表31.1中所述。
相对于SEQ ID NO:1346的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1346的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表31.2中。
实施例32
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1678的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1678作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表32.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表32.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表32.1中所述。
相对于SEQ ID NO:1678的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1678的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表32.2中。
实施例33
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1678的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1678作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表33.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表33.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表33.1中所述。
相对于SEQ ID NO:1678的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1678的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表33.2中。
实施例34
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1700的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1700作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表34.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表34.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表34.1中所述。
相对于SEQ ID NO:1700的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1700的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表34.2中。
实施例35
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1700的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1700作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表35.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表35.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表35.1中所述。
相对于SEQ ID NO:1700的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1700的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表35.2中。
实施例36
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1750的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1750作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表36.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表36.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表36.1中所述。
相对于SEQ ID NO:1750的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1750的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表36.2中。
实施例37
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1750的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1750作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表37.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表37.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表37.1中所述。
相对于SEQ ID NO:1750的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1750的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表37.2中。
实施例38
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1932的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1932作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表38.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表38.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表38.1中所述。
相对于SEQ ID NO:1932的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1932的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表38.2中。
实施例39
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:1932的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:1932作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表39.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表39.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表39.1中所述。
相对于SEQ ID NO:1932的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:1932的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表39.2中。
实施例40
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表40.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表40.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表40.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表40.2中。
实施例41
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表41.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表41.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表41.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表41.2中。
实施例42
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表42.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表42.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表42.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表42.2中。
实施例43
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表43.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表43.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表43.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表43.2中。
实施例44
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表44.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表44.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表44.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表44.2中。
实施例45
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表45.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表45.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表45.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表45.2中。
实施例46
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2164的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2164作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表46.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表46.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表46.1中所述。
相对于SEQ ID NO:2164的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2164的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表46.2中。
实施例47
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表47.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表47.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表47.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表47.2中。
实施例48
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表48.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表48.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表48.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表48.2中。
实施例49
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表49.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表49.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表49.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表49.2中。
实施例50
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表50.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表50.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表50.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表50.2中。
实施例51
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表51.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表51.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表51.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表51.2中。
实施例52
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2666的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2666作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表52.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表52.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表52.1中所述。
相对于SEQ ID NO:2666的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2666的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表52.2中。
实施例53
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2794的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2794作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表53.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表53.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表53.1中所述。
相对于SEQ ID NO:2794的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2794的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表53.2中。
实施例54
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2794的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2794作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表54.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表54.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表54.1中所述。
相对于SEQ ID NO:2794的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2794的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表54.2中。
实施例55
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2794的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2794作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表55.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表55.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表55.1中所述。
相对于SEQ ID NO:2794的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2794的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表55.2中。
实施例56
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2794的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2794作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表56.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表56.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表56.1中所述。
相对于SEQ ID NO:2794的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2794的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表56.2中。
实施例57
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2794的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:2794作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表57.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表57.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表57.1中所述。
相对于SEQ ID NO:2794的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2794的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表57.2中。
实施例58
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:2978的改进改进的TdT变体的HTP筛选选择SEQ ID NO:2978作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表58.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表58.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表58.1中所述。
相对于SEQ ID NO:2978的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:2978的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表58.2中。
实施例59
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3074的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3074作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表59.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表59.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表59.1中所述。
相对于SEQ ID NO:3074的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQIDNO:3074的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表59.2中。
实施例60
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3074的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3074作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表60.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表60.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表60.1中所述。
相对于SEQ ID NO:3074的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3074的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表60.2中。
实施例61
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3074的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3074作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表61.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表61.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表61.1中所述。
相对于SEQ ID NO:3074的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3074的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表61.2中。
实施例62
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3302的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3302作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表62.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表62.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表62.1中所述。
相对于SEQ ID NO:3302的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3302的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表62.2中。
实施例63
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3302的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3302作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表63.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表63.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表63.1中所述。
相对于SEQ ID NO:3302的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3302的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表63.2中。
实施例64
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3302的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3302作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表64.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表64.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表64.1中所述。
相对于SEQ ID NO:3302的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3302的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表64.2中。
实施例65
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3302的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3302作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表65.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表65.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表65.1中所述。
相对于SEQ ID NO:3302的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3302的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表65.2中。
实施例66
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3398的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3398作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表66.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、25-200μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表66.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表66.1中所述。
相对于SEQ ID NO:3398的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3398的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表66.2中。
实施例67
筛选摇瓶纯化的TdT以减少TdT依赖性焦磷酸解反应生成的副产物
筛选G341X TdT变体以获得改进的副产物概况
从实施例32的文库中选择TdT,用于摇瓶纯化并针对形成的副产物(包括例如通过TdT依赖性焦磷酸解反应形成的副产物)进行筛选。如实施例3所述,培养、裂解和纯化摇瓶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含2μM寡核苷酸、50μM核苷酸三磷酸、TdT溶液、0.002单位/μL大肠杆菌焦磷酸酶(New England Biolabs)、20mM MOPS、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mMMOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表67.1中指定。然后将上清液转移到新的HTP板中进行分析性分析,如
表67.2中所述。
产物和副产物的百分比计算为产物的峰面积或副产物的总峰面积除以所有分析物的总面积乘以100。计算每个变体的产物百分比与副产物百分比的比率,并与针对SEQ IDNO:1678观察到的等效产物/副产物比率进行比较(其中相对于亲本的倍数改进或FIOP等于变体的产物/副产物比率除以SEQ ID NO:1678的产物/副产物比率)。结果示于表67.3和67.4中。
实施例68
筛选摇瓶纯化的TdT以减少TdT依赖性焦磷酸解反应生成的副产物
筛选K338G TdT变体以获得改进的副产物概况
从实施例35的文库中选择TdT SEQ ID NO:1882,用于摇瓶纯化并针对副产物(包括例如通过TdT依赖性焦磷酸解反应形成的副产物)进行筛选。如实施例3所述,培养、裂解和纯化表达TdT SEQ ID NO:1882的摇瓶。针对活性和副产物形成筛选纯化的TdT酶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含2μM寡核苷酸、50μM核苷酸三磷酸、TdT溶液、0.002单位/μL大肠杆菌焦磷酸酶(New England Biolabs)、20mM MOPS、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mMMOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表68.1中指定。然后将上清液转移到新的HTP板中进行分析性分析,如
表68.2中所述。
产物和副产物的百分比计算为产物的峰面积或副产物的总峰面积除以所有分析物的总面积乘以100。计算每个变体的产物百分比与副产物百分比的比率,并与针对SEQ IDNO:1700观察到的等效产物/副产物比率进行比较(其中相对于亲本的倍数改进或FIOP等于变体的产物/副产物比率除以SEQ ID NO:1700的产物/副产物比率)。结果示于表68.5-68.8中。
实施例69
大肠杆菌磷酸酶(aphA、surE、cpdB)敲除菌株的裂解物中3’-磷酸化寡核苷酸的稳定性
针对裂解物中3’-磷酸化寡核苷酸标准品的稳定性进行筛选
将携带aphA、surE和cpdB单基因缺失的大肠杆菌菌株(来源:大肠杆菌全基因组敲除文库(E.Coli Keio Knockout collection))在摇瓶中培养,并如实施例3中所述裂解,具有以下变化:摇瓶培养物在含有10μg/ml卡那霉素且不含氯霉素的培养基中培养,并且机械裂解的裂解物不进一步纯化,而是如表69.1中所述处理。
反应在96孔形式200μL BioRad PCR板中进行。反应包含2.7μM 3’-磷酸化寡核苷酸、大肠杆菌裂解物、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM Tris-乙酸盐、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除裂解物外的所有反应组分预混合在单一溶液中,将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL经热处理和澄清的大肠杆菌裂解物添加到孔中。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表69.1中指定。然后将上清液转移到新的HTP板中进行分析性分析,如表69.1中所述。
检测的寡核苷酸产物标准品与去磷酸化寡核苷酸的比率计算为对应测量的峰面积的比率。结果示于表69.2中(其中小于1的“峰面积寡核苷酸标准品/峰面积去磷酸化寡核苷酸”对应于导致去磷酸化寡核苷酸多于磷酸化寡核苷酸的条件)。
实施例70
大肠杆菌酸性磷酸酶敲除的裂解物中进行的TdT反应中副产物的减少
筛选以获得裂解物中进行的反应的改进的副产物概况
使用标准分子生物学技术从实施例17中描述的菌株中分离编码TdT SEQ ID NO:908的质粒。携带aphA单基因缺失的大肠杆菌菌株(来源:大肠杆菌全基因组敲除文库)和野生型大肠杆菌W3110用该质粒转化。将这些培养物在摇瓶中培养,并如实施例3所述裂解,具有以下变化:机械裂解的裂解物不进一步纯化,而是如表70.1中所述处理。此外,如实施例3所述,在摇瓶中培养、裂解和纯化TdT SEQ ID NO:908。如下所述,用补充有纯化的TdT SEQID NO:908的经热处理和澄清的WT或ΔaphA裂解物进行反应。监测在存在WT或ΔaphA裂解物的情况下由TdT SEQ ID NO:908形成的产物和副产物,以确定裂解物如何影响反应中的副产物形成。
反应在96孔形式200μL BioRad PCR板中进行。反应包含4μM寡核苷酸、50μM核苷酸三磷酸、大肠杆菌裂解物、TdT溶液、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM Tris-乙酸盐、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT和裂解物溶液以外的所有反应组分预混合在单一溶液中,并将10μL该溶液等分到96孔板的每个孔中;(ii)然后将5μL经热处理和澄清的大肠杆菌裂解物添加孔中;(iii)然后将5μL TdT SEQID NO:908溶液添加孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表70.1中指定。然后将上清液转移到新的HTP板中进行分析性分析,如表70.1中所述。
产物和副产物的百分比计算为产物的峰面积或副产物的总峰面积除以所有分析物的总面积乘以100。对于每种反应条件确定产物百分比与副产物百分比的比率。结果示于表70.2中。
实施例71
纯化的TdT变异体在用3’-磷酸化核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4的改进
筛选摇瓶纯化的TdT变体以获得改进的3’磷酸化核苷酸的掺入
从第一轮和前二十轮进化中选择七个进化的TdT变体,用于摇瓶纯化并筛选以获得在45℃或61℃两个反应温度的改进的与3’-磷酸化核苷酸的活性。如实施例3所述,培养、裂解和纯化摇瓶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含2μM寡核苷酸、50μM核苷酸三磷酸、TdT溶液、0.002单位/μL大肠杆菌焦磷酸酶(New England Biolabs)、20mM MOPS、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mMMOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表71.1中指定。然后将上清液转移到新的HTP板中进行分析性分析,如表71.2中所述。
产物百分比计算为产物的峰面积除以所有分析物的总面积乘以100。结果示于表71.4-71.9中。
实施例72
全长和截短的野生型TdT变体的表达
多种野生型(WT)末端脱氧核苷酸转移酶(TdT)的编码序列(这些全长TdT与SEQ IDNO:2相关的系统发育树在图1中示出)被密码子优化以在大肠杆菌中表达并合成。将合成构建体亚克隆在大肠杆菌表达载体pCK100900i中的BglI裂解位点之间(参见例如美国专利第7,629,157号和美国专利申请公布2016/0244787,两者通过引用特此并入)。在一些情况下,TdT酶以其全长编码序列克隆和/或以截短形式克隆,其中N末端6xHis标签后的第一个氨基酸对应于SEQ ID NO:2中的残基131(这些截短变体与SEQ ID NO:4相关的系统发育树在图2中示出)。将全长和截短的TdT构建体转化到来源于W3110的大肠杆菌菌株中。
如实施例3中所述,用TdT表达构建体转化的细胞在摇瓶规模下生长、裂解、纯化并透析到储存缓冲液(20mM Tris-HCl pH 7.4、100mM KCl、0.1mM EDTA和50%甘油)中。过夜透析后,取出蛋白质样品,并使用NanoDropTM1000分光光度计通过在280nm处的吸光度测量TdT浓度。下表72.1总结了最高表达全长和截短的TdT样品的可溶性蛋白质浓度。
实施例73
通过进化的TdT变体与聚(乙二醇)3350和甲酰胺辅助剂增加3’-磷酸化核苷酸三磷酸供体的掺入
在存在PEG 3350和甲酰胺辅助剂的情况下,针对3’-磷酸化核苷酸的掺入筛选摇
瓶纯化TdT变体
在摇瓶中产生TdT变体SEQ ID NO:3488,并如实施例3中所述纯化。在存在PEG3350或甲酰胺的情况下,筛选纯化的TdT酶以获得改进的对3’-磷酸化核苷酸和多种寡核苷酸的活性。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1μM寡核苷酸、25μM核苷酸三磷酸、TdT溶液、0.002单位/μL大肠杆菌焦磷酸酶(New England Biolabs)、20mM MOPS、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT和辅助剂以外的所有反应组分预混合在单一溶液中,并将10μL该溶液等分到96孔板的每个孔中;(ii)添加5μL水或4x辅助剂水溶液;(iii)然后将5μL TdT溶液(在20mM MOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表73.1中指定。然后将上清液转移到新的HTP板中进行分析性分析。
为了分析反应样品,使用ABI 3500xl Genetic Analyzer(ThermoFisher)进行毛细管电泳。猝灭的反应在不含核酸酶的水中以1:200稀释,然后在包含适当尺寸标准品(LIZ或Alexa633)的Hi-DiTM甲酰胺(ThermoFisher)中以1:10稀释。ABI3500xl配置有POP6聚合物、50cm毛细管和45℃烘箱温度。运行前设置为18KV,持续180秒。注入电压为5KV,持续5秒,并且运行设置为19.5KV,持续600秒。底物和产物通过它们相对于尺寸梯状物的大小来鉴定,底物寡核苷酸峰在20bp,并且3’-磷酸化的单核苷酸延伸产物出现在~16-17bp的区域。
产物百分比计算为产物的峰面积除以所有分析物的总面积乘以100。相对于不含辅助剂的对照反应的活性计算为含辅助剂的反应中的产物百分比与三次重复对照反应平均值的产物百分比的比率。结果示于表73.2中。
实施例74
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3074的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3074作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表74.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表74.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表74.1中所述。
相对于SEQ ID NO:3074的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3074的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表74.2中。
实施例75
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3488的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3488作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表75.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表75.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表75.1中所述。
相对于SEQ ID NO:3488的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3488的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表75.2中。
实施例76
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3488的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3488作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表76.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表76.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表76.1中所述。
相对于SEQ ID NO:3488的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3488的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表76.2中。
实施例77
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3958的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3958作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表77.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表77.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表77.1中所述。
相对于SEQ ID NO:3958的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3958的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表77.2中。
实施例78
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3958的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3958作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表78.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表78.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表78.1中所述。
相对于SEQ ID NO:3958的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3958的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表78.2中。
实施例79
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3958的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3958作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表79.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表79.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表79.1中所述。
相对于SEQ ID NO:3958的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3958的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表79.2中。
实施例80
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3788的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3788作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表80.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表80.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表80.1中所述。
相对于SEQ ID NO:3788的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3788的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表80.2中。
实施例81
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:3788的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:3788作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表81.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表81.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表81.1中所述。
相对于SEQ ID NO:3788的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:3788的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表81.2中。
实施例82
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4124的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4124作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表82.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表82.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表82.1中所述。
相对于SEQ ID NO:4124的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4124的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表82.2中。
实施例83
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4124的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4124作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表83.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表83.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表83.1中所述。
相对于SEQ ID NO:4124的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4124的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表83.2中。
实施例84
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4124的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4124作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表84.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表84.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表84.1中所述。
相对于SEQ ID NO:4124的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4124的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表84.2中。
实施例85
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4124的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4124作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表85.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表85.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表85.1中所述。
相对于SEQ ID NO:4124的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4124的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表85.2中。
实施例86
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4226的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4226作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表86.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表86.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表86.1中所述。
相对于SEQ ID NO:4226的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4226的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表86.2中。
实施例87
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4226的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4226作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表87.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表87.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表87.1中所述。
相对于SEQ ID NO:4226的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4226的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表87.2中。
实施例88
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4226的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4226作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表88.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表88.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表88.1中所述。
相对于SEQ ID NO:4226的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4226的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表88.2中。
实施例89
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4226的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4226作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表89.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表89.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表89.1中所述。
相对于SEQ ID NO:4226的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4226的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表89.2中。
实施例90
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4734的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4734作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表90.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表90.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表90.1中所述。
相对于SEQ ID NO:4734的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4734的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表90.2中。
实施例91
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:4734的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:4734作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表91.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表91.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表91.1中所述。
相对于SEQ ID NO:4734的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:4734的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表91.2中。
实施例92
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5052的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5052作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表92.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表92.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表92.1中所述。
相对于SEQ ID NO:5052的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5052的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表92.2中。
实施例93
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5052的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5052作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表93.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表93.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表93.1中所述。
相对于SEQ ID NO:5052的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5052的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表93.2中。
实施例94
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5152的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5152作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表94.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表94.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表94.1中所述。
相对于SEQ ID NO:5152的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5152的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表94.2中。
实施例95
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5252的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5252作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表95.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表95.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表95.1中所述。
相对于SEQ ID NO:5252的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5252的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表95.2中。
实施例96
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5296的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5296作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表96.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表96.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表96.1中所述。
相对于SEQ ID NO:5296的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5296的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表96.2中。
实施例97
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5296的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5296作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表97.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表97.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表97.1中所述。
相对于SEQ ID NO:5296的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5296的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表97.2中。
实施例98
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5296的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5296作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表98.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表98.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表98.1中所述。
相对于SEQ ID NO:5296的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5296的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表98.2中。
实施例99
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5628的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5628作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表99.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表99.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表99.1中所述。
相对于SEQ ID NO:5628的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5628的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表99.2中。
实施例100
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5628的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5628作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表100.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表100.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表100.1中所述。
相对于SEQ ID NO:5628的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5628的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表100.2中。
实施例101
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5628的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5628作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表101.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表101.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表101.1中所述。
相对于SEQ ID NO:5628的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5628的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表101.2中。
实施例102
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5628的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5628作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表102.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表102.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表102.1中所述。
相对于SEQ ID NO:5628的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5628的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表102.2中。
实施例103
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5630的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5630作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表103.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表103.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表103.1中所述。
相对于SEQ ID NO:5630的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5630的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表103.2中。
实施例104
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5630的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5630作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表104.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表104.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表104.1中所述。
相对于SEQ ID NO:5630的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5630的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表104.2中。
实施例105
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5632的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5632作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表105.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表105.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表105.1中所述。
相对于SEQ ID NO:5632的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5632的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表105.2中。
实施例106
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5632的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5632作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表106.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表106.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表106.1中所述。
相对于SEQ ID NO:5632的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5632的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表106.2中。
实施例107
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5636的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5636作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表107.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表107.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表107.1中所述。
相对于SEQ ID NO:5636的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5636的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表107.2中。
实施例108
在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5636的改进
改进的TdT变体的HTP筛选
选择SEQ ID NO:5636作为亲本TdT酶。使用良好建立的技术(例如,饱和诱变和先前鉴定的有益突变的重组)从亲本基因产生工程化基因的文库。由每个基因编码的多肽以HTP产生,并如表108.1中所述制备。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1-4μM寡核苷酸、5-50μM核苷酸三磷酸、0.002单位/μL酵母焦磷酸酶(Thermo Scientific)、20mM缓冲液、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,然后保持在4℃直到反应被猝灭。反应和猝灭细节在表108.1中指定。将猝灭的反应在4℃以4000rpm离心10min,以沉淀任何沉淀物。然后将上清液转移到新的HTP板中进行分析性分析,如表108.1中所述。
相对于SEQ ID NO:5636的活性(活性FIOP)计算为变体的产物峰面积与通过与SEQID NO:5636的反应观察到的产物峰面积相比(其中峰面积可设置为重复样品的平均值,也可酌情设置为最高的单个样品)。结果示于表108.2中。
实施例109
筛选摇瓶纯化的TdT以减少TdT依赖性焦磷酸解反应生成的副产物
筛选F279H TdT变体以获得改进的副产物概况
选择TdT SEQ ID NO:3958用于摇瓶纯化并针对副产物(包括例如通过TdT依赖性焦磷酸解反应形成的副产物)进行筛选。如实施例3所述,培养、裂解和纯化表达SEQ ID NO:3488和SEQ ID NO:3958的摇瓶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1μM寡核苷酸、25μM核苷酸三磷酸、20mM MOPS、50mM乙酸钾和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mM MOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,随后在95℃热杀灭2分钟,并且然后保持在4℃直到反应被猝灭。反应和猝灭细节在表109.1中指定。然后将上清液转移到新的HTP板中进行分析性分析。为了分析反应样品,使用ABI 3500xl GeneticAnalyzer(ThermoFisher)进行毛细管电泳。方法细节参见实施例73。
产物和副产物的百分比计算为产物的峰面积或副产物的总峰面积除以电泳图中高于25的峰振幅阈值的所有峰的总面积乘以100。计算每个变体的产物百分比与副产物百分比的比率,并与针对SEQ ID NO:3488观察到的等效产物/副产物比率进行比较(其中相对于亲本的倍数改进或FIOP等于变体的产物/副产物比率除以SEQ ID NO:3488的产物/副产物比率)。结果示于表109.2-109.3中。
实施例110
筛选摇瓶纯化的TdT以获得在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5296的改进
筛选纯化的TdT以获得改进的变体
选择TdT SEQ ID NO:5624和SEQ ID NO:5300用于摇瓶纯化,并针对活性改进进行筛选。如实施例3所述,培养、裂解和纯化表达SEQ ID NO:5296、SEQ ID NO:5624和TdT SEQID NO:5300的摇瓶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1μM寡核苷酸、10μM核苷酸三磷酸、20mM MOPS、50mM乙酸钾、5%甲酰胺、0.6%PEG 3350和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mM MOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,随后在95℃热杀灭2分钟,并且然后保持在4℃直到反应被猝灭。反应和猝灭细节在表110.1中指定。然后将上清液转移到新的HTP板中进行分析性分析。为了分析反应样品,使用ABI 3500xl Genetic Analyzer(ThermoFisher)进行毛细管电泳。方法细节参见实施例73。
产物百分比计算为产物的峰面积除以电泳图中高于25的峰振幅阈值的所有峰的总面积乘以100。结果示于表110.2-110.4中。
实施例111
筛选摇瓶纯化的TdT以获得在用核苷酸三磷酸供体延伸寡核苷酸受体分子方面相对于SEQ ID NO:5624的改进
筛选纯化的TdT以获得改进的变体
选择TdT SEQ ID NO:5624、SEQ ID NO:5626、SEQ ID NO:5628、SEQ ID NO:5630、SEQ ID NO:5632、SEQ ID NO:5634、SEQ ID NO:5636、SEQ ID NO:5638用于摇瓶纯化,并针对活性改进进行筛选。如实施例3所述,培养、裂解和纯化表达SEQ ID NO:5624、SEQ ID NO:5626、SEQ ID NO:5628、SEQ ID NO:5630、SEQ ID NO:5632、SEQ ID NO:5634、SEQ ID NO:5636、SEQ ID NO:5638的摇瓶。
反应在96孔形式200μL BioRad PCR板中进行。反应包含1μM寡核苷酸、5μM核苷酸三磷酸、20mM MOPS、50mM乙酸钾、5%甲酰胺、0.6%PEG 3350和250μM氯化钴(II)。反应设置如下:(i)将除TdT以外的所有反应组分预混合在单一溶液中,并将15μL该溶液等分到96孔板的每个孔中,(ii)然后将5μL TdT溶液(在20mM MOPS中的4x浓度,pH 7.2)添加到孔中以启动反应。将反应板用可剥离的铝密封件热密封,并在热循环仪中以指示的温度和反应时间孵育,随后在95℃热杀灭2分钟,并且然后保持在4℃直到反应被猝灭。反应和猝灭细节在表111.1中指定。然后将上清液转移到新的HTP板中进行分析性分析。为了分析反应样品,使用ABI 3500xl Genetic Analyzer(ThermoFisher)进行毛细管电泳。方法细节参见实施例73。
产物百分比计算为产物的峰面积除以电泳图中高于25的峰振幅阈值的所有峰的总面积乘以100。结果示于表111.2-111.3中。
虽然已经参考特定实施方案描述了本发明,但可以进行各种改变并且可以替换等同物,以适应特定的情况、材料、物质的组成、方法、一个方法步骤或多于一个方法步骤,从而实现本发明的益处,而不偏离所要求保护的范围。
出于在美国的所有目的,本公开内容中引用的每个和每一个出版物和专利文件通过引用被并入本文,如同每个这样的出版物或文件被明确且单独指出通过引用并入本文。对出版物和专利文件的引用不意图为指示任何这样的文件是相关的现有技术,也不构成对其内容或日期的承认。
Claims (130)
1.一种工程化末端脱氧核苷酸转移酶,包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列或其功能片段具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性的多肽序列,其中所述工程化末端脱氧核苷酸转移酶在其多肽序列中包含至少一个残基差异或残基差异集,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号。
2.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自14、17、19、20、21、22、24、27、28/304、55、66、67、68、80、99、103、111、113、115、140、158、159、160、161、167、170、180、192、197、200、201、219、233、235、238、246、249、256、258、267、268、273、295、296、297、300、303、304、306、322、350、353、367和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:4编号。
3.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自10、17、20、27、28、55、62、63、66、67、68、68/118、87、103、106、111、131、155、157、160、160/296、177、181、200、219、246、256、263、292、295、296、297、315和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQID NO:4编号。
4.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自8、10、11、15、16、20、21、22、24、26、28、30、34、42、44、47、48、52、54、55、62、63、66、67、68、72、77、80、84、87、89、91、92、99、101、102、103、106、109、111、111/346、113、115、116、118、122、123、131、140、144、147、156、157、160、160/296、161、162、163、164、170、173、174、175、180、181、185、189、192、193、194、197、198、198/289、200、201、207、219、230、234、235、237、238、241、245、246、249、256、257、258、262、263、264、267、268、272、273、280、284、286、289、290、291、292、295、296、297、299、300、302、304、307、308、310、311、321、322、325、350、353、355、365、366、368、371、373和388,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4编号。
5.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自60、60/259、60/278和65/259,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4编号。
6.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自20、20/21/68/103/200/238/297、20/21/68/111/235、20/21/68/160、20/21/68/160/180/200/246、20/21/68/160/246、20/21/68/180、20/21/68/180/235、20/21/68/200/235/297、20/21/68/233/246/297、20/21/103/233、20/21/111、20/21/111/160/200、20/21/111/200/238、20/21/180/297、20/21/233、20/68/103/160/200、20/68/103/180/200、20/68/160、20/68/160/180、20/68/160/180/233/235/246、20/68/160/235/297、20/68/160/246、20/68/200/238/246、20/68/235/297、20/103/160/180/200/235、20/103/233、20/111、20/111/180/235/246/297、21、21/68、21/68/103/111、21/68/111/200、21/68/160/180/200/205/297、21/68/160/180/200/297、21/68/160/238、21/68/160/238/246、21/68/180、21/68/180/235、21/68/180/246、21/68/200、21/68/235、21/103/233、21/233/297、68、68/103/160/235、68/103/200/235/246/297、68/111/200/238、68/111/233/236/297、68/160/233/246、68/200/235/297、103、103/160/180、103/160/297、103/233、111和111/160/233/235/297,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4编号。
7.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自55、55/67、55/67/87、55/67/87/106/111/315、55/67/87/157/315、55/67/106/111/157、55/67/106/315、55/67/111、55/67/111/315、55/67/315、55/87、55/87/106、55/87/106/111/315、55/87/106/315、55/87/157、55/87/157/207、55/106/111、55/106/157、55/111、55/111/315、55/157、55/315、67、67/87、67/87/106/157、67/87/111/157/315、67/87/157、67/87/315、67/106、67/106/111、67/106/111/315、67/106/157、67/111、67/111/315、67/157、67/157/315、87、87/106、87/106/111/315、87/111/157/315、87/157、87/157/315、87/315、106、106/111/157、106/315、157、157/315和315,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:580编号。
8.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自59/62/63/68、59/62/63/68/103/234、59/62/63/68/147、60/62/68/91/111/234/289、62/63/68、62/63/68/91/109/210、62/63/68/91/147/205/210/234、62/68/91/111/289、62/68/103、62/68/111、91、91/109/111、91/109/147/205/210/234、109/111/205/210/234/289、111和147/210/234,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:580编号。
9.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自52/55/106/256、52/55/181/235/256、52/55/181/256、52/99/181/235、52/106/181/235/256、52/106/235/256、52/106/256、52/173/235、52/235、52/235/256、55/99/181/256、55/99/256/350、55/181/235/256/350、55/256、99/235、106、173和235,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:692编号。
10.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自20/21/52/67/68/87/111/157/160/173/180/200/235/246/315、20/21/55/67/68/87/111/157/160/180/181/200/235/246/256/315/350、20/21/55/67/68/87/111/157/160/180/200/246/256/315、20/21/60/72/160/180/200/246/259/338/358、20/21/67/68/87/111/157/160/180/200/235/246/315、20/21/67/68/87/111/157/160/180/200/246/315和20/21/68/160/180/200/246,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4编号。
11.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自63、68、72、211、220、275、349和350,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:882编号。
12.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自20/21、20/21/67、20/21/67/87、20/21/67/87/111、20/21/67/87/111/200、20/21/67/87/111/315、20/21/67/87/157/180、20/21/67/87/246/315、20/21/67/160、20/21/87/111/246/315、20/21/87/157/200、20/21/87/180/246/315、20/21/87/315、20/21/111/157/315、20/21/111/246、20/21/315、20/67/87/111/180、20/67/87/157/160/180/315、20/68/111/157/160、20/68/160/200/246、20/87/111/180、20/87/157/160、20/160/315、20/200、21、21/67/87/111/200、21/67/87/157/246、21/67/180/315、21/67/200、21/87/157/160、21/87/160/200/315、21/87/160/315、21/87/200、21/87/246/315、21/111、21/157/160、21/160/315、21/200/315、21/246、67、67/87、67/87/111/157/160/315、67/111、67/157/160/180、67/157/160/315、67/160、67/180/200、67/180/200/315、67/315、68/87、68/157/160/200/315、87、87/111、87/111/200、87/111/200/246、87/157、87/157/180/200、111/157/180/200/315、157、157/160、246和315,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:882编号。
13.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自52、52/180、52/180/200/235/315/349、52/180/200/349、52/180/349、52/200、52/200/315、52/200/349、52/200/349/350、52/315、52/315/349、52/349、52/349/350、180和349,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:914编号。
14.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自53/219/358、55、55/99/103、55/99/219/358/373、55/103/181、55/103/219、55/103/338、55/181/219、55/181/246、55/181/358、55/219/246/358、55/219/256/338、55/256/259、99/103/219、103/219/256、103/219/338/358、103/256、103/259、106/173/200/235/315、106/173/388、111/173、111/173/235/315、173、173/297、181、219、219/358、256、256/259和358,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1034编号。
15.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自48、52、53/219/358、55、55/99/219/358/373、55/181/358、55/219/246/358、55/256、56、58、62、65、66、70、71、74、77、78、79、103/219/338/358、219、219/358、328、345、350、353、355和358,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1034编号。
16.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自47、48、51、52、54、55、57、58、59、61、62、63、64、65、66、69、70、71、73、74、77、79、131、133、134、219、319、321、322、325、328、332、345、350、351、352、353和355,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:1034编号。
17.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自23、32、36、40、49、93、98、107、117、124、165、182、186、269、288、309、374、377和386,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1270编号。
18.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自23、40、49、107、112、120、186、271、309、374和377,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1270编号。
19.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自23、182、186、269、270、293、360、372和378,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1270编号。
20.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自55/58/256/350/373、58、58/69/256/373、58/99/351/355、58/256、70/71、70/71/353、70/134/353、70/353、71/77/353、71/353、77、77/134/353、77/353、99/256/351/355、134/353、256、350和353,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1344编号。
21.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自55/58、55/58/69/350/351、55/58/99/256/351/373、55/58/99/256/355、55/58/99/351、55/58/256、55/58/256/355、55/58/350/351、58/99、58/99/355、58/256/350/355、58/350/355、70、70/353、71/77/133/353、71/353、77/133/353、77/353、133、353和355/373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1344编号。
22.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自8、9、14、15、16、28、29、42、89、100、116、125、190、197、201、233、237、289、298、302、364、368和380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1344编号。
23.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9、14、28、86、89、91、92、104、116、125、196、197、198、201、230、234、248、266、272、278、298、304、307、308、341、364、365和380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1344编号。
24.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自27、28、29、84、92、98、110、143、147、158、162、170、173、174、181、185、193、197、204、204/264/340、290、297和303,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1346编号。
25.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自38、44、57/367、66、92、101、102、111、143、147、154、156、158、160、167、173、184、185、196、197、224、233、248、324和352,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1346编号。
26.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自23/186/256/309、58/186/270、182/186/256/360、182/256、186/256、186/256/270、256和270/309,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1346编号。
27.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括位置341,和/或其任何组合处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1678编号。
28.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9/14/58、9/14/58/182/190/197/298、9/14/190/197/364、9/58/197、9/298、10/14/197/364、14/58/182/197/298/364、14/190/197/298、14/197/298/364、14/298/364、58/197、58/197/364、58/364、182、182/197、182/298/364、197/298和298,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:1678编号。
29.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自918/28/147/303、28、28/84、28/84/92/147/204、28/84/147/204、28/84/156/173/204/290/303、28/84/173/204/303、28/84/173/303、28/84/303、28/92/147、28/92/147/204/290/303、28/92/156/204/290、28/92/204、28/147/303、28/156/204、28/204、28/290、28/303、29、29/98/143/266、29/98/185/197/266、29/98/185/266/296/299、29/143、29/143/162、29/143/170/193/197/266、29/143/185/193/266、29/158/266、29/170/185/193/266/299、29/185/296、29/193/197/296/297、72、84、84/92/173、84/156/173/204、84/173/204/303、92/173/204/290/303、98、98/143/158/170/185/296/297、98/143/162/266、98/143/185/266、98/162/193、98/170/193/197、98/185、98/185/193/197/266/297、143、143/158/197/266、143/266/296/297、147/290/303/307、170/193/197、173、173/204、173/204/303、182、204、266/297/299和303,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1700编号。
30.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自29、60、72、84、147、182、211、220、224、266、290、338、339、342和345,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQID NO:1700编号。
31.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9、9/28/156/158/173/190/193/303/364、9/28/156/158/290/364、9/28/190/193/303/364、9/28/290/303/364、9/156/158/193/290/303/364、9/156/364、9/290/364、9/364、14、14/58/84/147/162/224/296/297/298/299、14/58/84/147/162/224/296/297/299、14/58/84/224/298、14/84/147/193/197/224/296、14/84/162/224/297/299、14/84/224/296/299、14/162/224/298/299、14/224/296/298、23/28/156/158/190/193/290/364、28/156/173/364、28/158/173/190/193/290/364、28/190/193、28/296/303/364、28/364、58/147/162/197/224/296/297/298/299、58/162/224/296/298、58/224、58/224/299、84/147、147/224、147/224/297/298、156/158/190/193/364、158/193/290/303、193/290、224/296/298、224/297/299、290/303/364、303和364,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1750编号。
32.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9、34、48、69、78、237/271、249、302、309、315、353、364和365,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:1750编号。
33.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自12、14、14/28/58/84/173/297、14/28/58/162/190/193/224、14/28/58/224、14/28/224/296/298、14/58/147/162/190/193/224/296/303、14/58/158/224、14/58/162、14/147、14/147/158/162/224、14/147/173、14/147/224、14/158/162/197/224/296/298/299、14/173/193/197/296/297/298/299、14/193/197/224/297/298/299/300、14/224/296/303、28、28/58/84/158/162/193/224/296/298/299、28/58/147/224/296/297/298/299/303、28/58/162/224/298/299、28/84、28/84/147/297/298、28/224/296/297/298/303、28/296/298、58/72/211/315、58/72/220/224、58/84/211/220/224、58/147/162/296/298、66/220/224、72、72/84/86/224、72/84/220/224/315、72/86/220、72/220/224、72/220/315、75、77、84/147/197/296/297、84/147/297/298/303、84/173/224、84/220/315、84/224/297/298/299、100、104、120、147、147/158/162/190/224/296/297/299/303、162/224、173、190/193/197、193/197/296/303、197、220/224/315、220/315、224、224/298/299、233、292、297、315、353和367,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1932编号。
34.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自12、75、77、100、104、120、197、233、292、353和367,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:1932编号。
35.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自51、52、66和71,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
36.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9/11、20、52、74、78、80、96、101、108、111、116、145、147、173、200、203、206、232、235、242、249、264、267、288、293、304、306、308、324、326、328、350、352、361、368、374、378和380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
37.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自97、168、259、273和276,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
38.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自97、135、259、273、276和278,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
39.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自97、135、166、273和278,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
40.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自97、135、140、166、167、168、230、259、273、276和278,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2164编号。
41.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自34、34/48/78/133/147/182、34/48/78/147/158、34/48/78/147/182/220/233/249/307/315/339、34/48/78/158/182/220/249/307、34/48/78/158/182/233/315/345、34/48/78/182/220/230/315、34/48/78/182/220/233、34/48/133/158/182/230/233/271/345、34/48/147、34/48/147/158/182/220/233/307、34/48/147/182/230/233/249/307、34/48/147/271、34/48/182/233/249、34/48/339、34/78、34/78/84/147/158/182/220、34/78/84/158/230、34/78/147/182/220/249、34/78/147/182/233/249/315、34/78/147/182/233/271/339、34/78/158、34/78/158/182/315/345、34/78/158/249、34/78/182/233/307、34/78/204/220/339、34/78/220/271、34/78/220/307/339、34/78/315、34/133/147/158/230/233/249、34/147、34/147/155/233/339、34/147/158、34/147/158/182/233、34/147/158/182/249/271、34/147/182、34/147/182/220、34/147/182/220/230/249/315/339、34/147/182/220/230/339、34/147/182/220/271/315、34/147/182/233/271/339、34/147/182/249/307/315/339、34/147/182/315、34/147/182/345、34/147/220/271、34/147/230/273/315/345、34/147/233、34/147/249、34/147/315/339、34/158/182/315/339/345、34/158/220、34/158/307、34/182、34/182/230/315、34/182/307/339、34/182/345、34/220、34/220/307、34/220/307/345、34/220/315/339、34/220/339、34/233、34/271/339、34/315/345、34/339、48/78/147/158/182/220/230/307、48/78/147/158/182/230/249/271/315、48/78/147/158/233/249、48/78/147/182/220/233/249/339/345、48/78/147/182/220/315、48/78/147/182/230/233/249、48/78/158/182/220/233/249、48/78/158/230/339、48/78/233/315/339、48/147/158/182/220/230/249/271/307/315/339、48/147/158/182/220/249/307/339、48/147/158/182/220/315、48/147/158/182/230/233、48/147/158/182/233/345、48/147/158/233、48/147/158/307/345、48/147/233、48/147/233/345、48/147/271/307/339、48/158/182/230/233/249、48/182、48/182/307/315、48/339、78/133/147/158/182/220/271/339、78/135/182/233/249/315/345、78/147/158/182、78/147/158/182/230/249、78/147/158/182/233/271/307/345、78/147/158/182/339/345、78/147/158/220/230/233/249/271/307/315/345、78/147/158/249/307/315、78/147/182/230/233/249、78/147/182/249/307、78/147/182/339/345、78/147/230/307、78/147/233、78/147/249/271/339、78/158/182、78/158/182/233/271/315、78/158/182/307/315/345、78/182/220/339、78/182/271/315/339、78/233、78/339、133/135/307/315、133/220/233/271、133/307、147、147/158/182/220/233、147/158/182/230/233/249/271/339、147/158/182/233/249、147/158/182/233/271/307/339、147/158/182/233/307/339、147/158/182/233/315/345、147/158/182/271/315、147/158/182/315、147/158/220/230/233/249/345、147/158/220/249/315、147/158/233/249、147/182/220/233/345、147/182/230/307/315/339、147/182/233、147/182/233/249、147/182/249/271/307、147/182/345、147/220、147/232/233/271/315/339、147/233/345、147/249、147/339、158/182/220/230/249/307/339、158/233、158/307、158/315、158/315/339、182、182/220/345、182/230、182/230/233、182/345、220、220/249、220/307/339、233、233/271、233/315、249、249/315/339、271/339、315和339,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:2164编号。
42.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自162、167、259、272、273、345、346和365,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
43.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自260、272、273、280、345和346,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
44.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自167、170、259、260、272、325、346、365、367、368、371和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
45.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自162、259、272、273、325、345、346、367和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
46.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自136、162、164、167、170、200/271、259、262、267、268、272、278、284、321、324、327、328、345、346、352、353、355、364、365、366、368、370、371和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
47.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自20、20/100、20/100/104/111/242、20/100/104/120/197/367、20/100/104/197/203/242/292、20/100/104/203/350/353、20/100/111、20/100/120/197/232/235/315/366/367、20/100/197/292/315、20/100/203、20/100/232/292/366/367、20/100/235/315/367、20/104/111/120/203、20/120/197/292、20/120/235、20/292、100、100/111、100/120/197/242、104/120/232/353和111/197/242,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2666编号。
48.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自200、201、202、203、226、229、230、234、235、236、237、238、324、326、342、344、352、355、360、366、369、371、373、374、377、378、383、388和390,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2794编号。
49.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自200、203、226、234、237、342、350、360、366、369、373、377、378、380和390,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2794编号。
50.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自200、201、203、207、226、230、233、234、235、322、342、344、352、355、360、366、371、373、374、378和387,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2794编号。
51.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自15、200、202、203、205、206、207、226、229、230、231、233、234、237、321、324、326、327、330、342、344、349、352、353、360、366、369、371、373、374、378、380、386、387、388和390,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2794编号。
52.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自55/80/174/268/355/366、55/80/268/315/366、55/80/268/346、55/111/156/268/315/324/327/366/373、55/111/268/346/355、55/111/268/355/366、55/111/315/355/373、55/268、55/268/315/346、55/268/324/366、55/268/346/355、62/66/69/143/338/353、62/66/100/101/104/203/235/338、62/69/80/101/104/143/235/338、62/203/211/235/338/350、66/69/143/235/338、69/80/203/211/278/338、80/111/268/324/327/346/366/373、80/111/355/366、80/143/203/211/338、80/268/315/346/355、80/268/327/346/366、80/268/346、80/315/346/364/373、80/346/366、100/101/211/278/338/350/353、111/268、268、268/315/327/346、268/315/346、268/315/346/366、268/315/355、268/324、268/324/327/346、268/327/346、268/346、268/346/355、268/355/366、315/324/327/355/366、324/346/355/366和327/346,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:2794编号。
53.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自62/69/100/235/268/346、62/69/353、62/111/235/315/355、62/111/235/324/346、62/235/268/327/346/350/353/355、62/235/346/350/355、62/315/327/353、62/323/346/353/355、66、66/100/235/315/327/353/355、66/111/346/353/355、66/235/268/346、66/235/346、66/235/373、69、69/100、69/100/111/298/353/355、69/100/235、69/100/353/366、69/111/235、69/111/235/300/353/355、69/111/235/315、69/235/315、69/235/353、69/268、69/268/324/327/353/355、69/268/346、69/268/346/353、69/315/353、69/324/327/346、69/324/346/350、69/324/353、69/353/355、100、100/111/353、100/235/268/315/346、100/235/268/346/355、100/235/268/366/373、100/235/346/350/353、100/268/346、100/268/366、111/235/268/327/346、111/235/268/346、111/235/346/350、111/268、111/327、232/346/350/355、235/268/327/346、235/268/346、235/315、235/315/353/355、235/346、235/346/350、235/353、235/353/355、268/346、268/346/350/353/355、268/353、315/327/346、324/327/346、324/346/350、324/355、327/346、346和353/355,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQID NO:2978编号。
54.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自16、17、210、234、373和380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3074编号。
55.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自16、17、18、20、21、22、24、27、28、29、32、38、44、48、77、78、78/127、79、80、103、106、111、115、117、119、210、232、238、272和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3074编号。
56.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自111/226、111/226/321/344/346/369/387、162/367/371、201/202、201/202/272/360、202/233、202/235/360/367/371、207/235/327/360/371、226、226/268、226/321/369、226/366、226/366/369/387、233/367/371、233/371和367/371,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3074编号。
57.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自75、75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、106/182/203/226/235/342/346、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/342/346、201/203/226/234/342/346、201/203/226/234/346、201/203/226/268/342、201/203/226/346、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/342、203/226/235/346、203/226/342/346、203/226/346、207、207/233/237/344/387、207/387、226、226/235/268、226/235/268/342/346、226/235/268/346、226/235/342、226/268/342、226/268/342/346、226/268/346、226/342、226/342/346、226/346、259/276/387和346,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:3302编号。
58.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、201/203/226/234/342/346、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、203/226、203/226/234/235、203/226/235/268/346、203/226/235/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/342、226/235/268、226/235/268/346、226/235/346、226/268/342、226/268/346、226/342/346、226/346和259/276/387,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3302编号。
59.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自75/207/373/378、104/200/207/237/344/373/387、104/207/344/387、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、201/203/226/234、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/268/346、201/226/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/235/346、226/235/268、226/235/268/346、226/235/342、226/235/346、226/268/342、226/268/346、226/342、226/342/346、226/346和259/276/387,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3302编号。
60.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自75/233/344、75/233/366、104/200/207/237/344/373/387、104/207/344/387、106/182/203/226/235/342/346、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/342/346、201/203/226/268/342、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/235/342、201/226/268/346、201/226/346、201/235/268/342/346、203/226、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/346、203/226/342/346、203/226/346、207、207/233/237/344/387、207/387、226、226/234/235/346、226/234/342、226/235/268、226/235/268/346、226/235/342、226/235/346、226/268/342、226/268/346、226/342、226/342/346、226/346和259/276/387,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3302编号。
61.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自29/77/104/234/271、29/77/104/234/271/279/380、29/77/182/207/271、29/77/207/234/279/380、29/77/234/271/279/368、29/77/271、29/104/234/271/279/380、29/182/207/380、29/182/234/271/380、29/182/271/279/380、29/234/279/380、29/271/279、29/271/279/368/380、32/78/106/200/226/272/373、32/78/106/200/226/373、32/78/106/226、32/78/200/226、32/78/200/226/235/272、32/78/200/226/235/321/373、32/78/226、32/78/226/321、32/78/226/373、32/106/200/226、32/106/200/226/235/373、32/200/226、32/200/226/321/373、32/226、77/182/279/380、77/182/368、77/234/271/279/380、78/106、78/106/226/321/373、78/106/235/321/373、78/200/226/321/373、78/226/321、104/182、106/200/226/373、106/226/235/373、182/207/279/368、182/234/380、182/279/368/380、200/226、200/226/321/373、200/226/373、207/271/368/380、207/380、226、226/235/272/373、226/272/373和271/380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3398编号。
62.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自16、201、203、230、231、234、235、238、271、273、275、279、321、344、349、368、373和380,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3074编号。
63.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自14/15/77/78、14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/77/200/226/230、14/15/78、14/15/78/226/230、14/15/200/230、14/77/78/200/226/230/257、14/77/78/226/230/257、14/77/201/230、14/78/200/201/226/290、14/78/200/201/339、14/78/200/226/230/339、14/78/200/226/290/339、14/78/200/230/339、14/200/203/226/230、14/200/203/226/230/257/339、14/200/203/230/339、14/201/203/226、15/77、15/77/78、15/77/78/200/201/203/226/230、15/77/200/201/203/226/230/290/339、15/77/200/230、15/77/200/230/290/339、15/77/201/226/230/339、15/77/226/230/290/339、15/78/201、15/78/201/203/230、15/78/201/230/290、15/78/203/226/230、15/200、15/201/203/226/230/257/339、15/226/230/339、15/230、32、32/103、32/103/106/207/210/235/321/368、32/103/207/228/232/373、32/103/210/273/321/373、32/103/273、32/106、32/106/207/210/232、32/106/210、32/106/210/373、32/106/235/321、32/106/235/368、32/106/273/321/373、32/207/210/273、32/207/210/368/373、32/207/235、32/210/232/235/368、32/210/273、32/235/273、77/78/200/226/339、77/78/201/226/257/339、77/78/203、77/78/203/230/339、77/200/201、77/200/201/226/230/339、77/200/203/230/257/339、77/200/230、78、78/200/230、78/203/230/290、78/226/230、78/226/290、103/106/207/321、103/106/210、103/207/210/235/321、103/210/232/235、103/232/273、106、106/207/210/232/235/321/368/373、106/207/235/321/368、106/235/273/373、106/273、200、200/203/226/230/339、200/230/257、201、201/203、201/230/257、201/230/290、203、203/226/230、203/226/230/257、207/235、207/235/368、207/368/373、207/373、232/235、232/235/273/368、232/235/321、235、235/273和273,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3488编号。
64.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/77/200/226/230、14/15/78/226/230、14/15/200/230、14/77/78/200/226/230/257、14/77/201/230、14/78/200/226/230/339、14/78/200/226/290/339、14/200/203/226/230、14/201/203/226、15/77、15/77/78/200/201/203/226/230、15/77/200/230、15/77/201/226/230/339、15/78/201/203/230、15/78/203/226/230、15/230、32、32/103/106/207/210/235/321/368、32/103/210/273/321/373、32/103/273、32/106/207/210/232、32/106/210、32/106/235/368、32/207/210/368/373、32/207/235、32/210/232/273/321、32/210/232/273/368/373、32/210/273、32/235/273、77/78/200/226/339、77/200/230、78/203/230/290、78/226/230、78/226/290、103/106/207/321、103/106/210、103/207/210/235/321、103/210/232/235、103/232/273、106/207/235/321/368、106/235/273/373、201/203、203/226/230、207/235/368、232/235、232/235/321、235和235/273,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3488编号。
65.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自53、262、264、265、266、267、270、271、272、273、275、277、321、322、324、325、339、346、347、350、355、360、370、371、376、380、383、386和388,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3958编号。
66.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自53、219、229、262、264、265、266、267、270、271、272、273、275、277、278、280、321、322、324、325、339、346、347、350、355、360、370、371、376、380、383、386、387、388和390,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3958编号。
67.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自72、264、267、270、271、272、273、280、321、322、324、325、339、346、347、349、355、360、371和383,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3958编号。
68.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/103/207/210/344/349、32/103/207/321/344、32/207/210/279、32/273/344/373、32/279、32/279/321、104/106、104/106/111/200/201/235/268/368、104/106/200/201/268、106/111/200/235/368、106/200/201、106/200/201/209/368、106/200/201/368、106/201/235、111、200/235/368、201/368、207/210/273/279/344、207/210/273/321/344/349、207/273、210、210/273/279、210/279、273/279和273/279/373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3788编号。
69.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/103/207/210/344/349、32/103/207/321/344、32/103/321/344、32/207/210/279、32/207/273/279/321、32/207/279、32/207/344、32/273/279/344/349、32/273/344/373、32/279、32/279/321、104/106、104/106/111/200/201/235/268/368、104/106/111/200/201/268、104/106/111/201/235/368、106、106/111/200/201、106/111/200/201/268/368、106/111/200/235/368、106/111/201、106/111/201/368、106/200/201、106/200/201/235、106/201/235、106/201/268、111、111/200/201/268、111/200/368、200/235/368、200/368、207/210/273/279/344、207/210/273/279/344/349/373、207/210/273/321/344/349、207/273、207/279/349、210、210/273/279、210/273/279/349、210/279、273/279和273/279/373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:3788编号。
70.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32、32/111/235、32/111/235/271/272/339、32/111/235/339、32/111/235/386、32/235、32/235/271/339、32/235/272、32/235/272/339、32/235/272/386、32/235/339/386、32/271/339、32/272、68/106/200、68/344/383、74/106/270/344、103/324、106/200/321/322/383、106/270/344、111/235、111/235/271/339、111/235/272/339/386、111/235/339、111/272/339/386、200、200/270、200/270/322/383、200/344、235、235/271/272/339/386、235/271/339、235/271/339/386、235/272、235/272/339、235/272/386、235/339、235/339/386、270/322/344/383、324、325、344、344/370和370,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4124编号。
71.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/111/235、32/111/235/339、32/111/235/339/386、32/111/235/386、32/235、32/235/272/339、32/235/272/386、32/235/339/386、32/339、68/106/200、68/106/321/322、68/200、68/200/270/321、68/270/321/322、68/344、68/344/383、74/106/270/344、103/324、106/200/321/322/383、106/270/344、111/235、111/235/272/339/386、111/235/339、111/272/339/386、200、200/270、200/270/322/383、200/344、229、229/325、235、235/271/272/339、235/272、235/272/339、235/272/386、235/339、235/339/386、262、262/325/349、270/322/344/383、278、324、325、344、344/370、349和370,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4124编号。
72.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9/302、26、44/193、47、54、58、62、63、64、70、89、99、110、144、153、154、155、159、161、162、163、164、170、174、181、184、189、190、192、193、194、220、237、238、241、243、244、245、246、248、249、250、252、258、260、275/291、284、289、291、293、294、295、296、300、301、302、303、304、305、306、307、308和309,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4124编号。
73.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自9/302、26、55、58、62、91、110、143、148、154、162、163、173、174、184、190、192、193、194、196、205、206、220、232、237、238、245、246、248、249、253、275/291、284、286、287、289、291、293、295、296、300、301、302、303、304、305、306、307、308和309,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4124编号。
74.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/103/106/111/322/324、32/106/280、32/235、32/235/386、32/321/324/360、32/324、60/106/111/235/360、60/280/360、74/200/339、103、103/106/360、103/111/235/280/360、103/111/235/321/324、106、106/111、106/111/322/383/386、106/235、106/235/383/386、106/324、111、111/235/280、111/322/360、200/270/275/339、235、235/280、235/280/321/322/324、235/280/321/324/383/386、267/270/275/339/347、267/272/275、280、280/383、321/324和360/383,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4226编号。
75.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/103/106/111/322/324、32/235、32/235/386、32/321/324/360、32/322/324/383/386、32/324、60/106/111/235/360、72/74/200/272/339/347、103、103/106/360、103/111/235/280/360、103/111/235/321/324、106、106/111、106/111/322/324/386、106/111/322/383/386、106/235、106/235/383/386、106/324、111、111/235/280、111/322/360、200/270/275/339、235、235/280、235/280/321/322/324、267/270/275/339/347、267/272/275、280、280/383、321/324和360/383,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4226编号。
76.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自48、50、53、57、58、63、65、68、69、73、75、85、94、104、105、123、135、140、141、166、167、180、184、185、187、192、209、210、217、220、239、244、253、256、260、261、265/346、266、267、268、273、274、275、282、284、325、344、349、350、352、353、360、361、365、371、378和386,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4226编号。
77.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自48、50、53、56、57、58、63、65、68、69、70、73、75、105、135、140、141、166、167、175、176、180、185、187、192、210、217、220、239、244、256、260、261、266、268、271、274、275、280、282、284、325、330、344、346、349、350、352、358、360、361、369、371、378、384和386,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4226编号。
78.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32、32/161/193/237/360、32/162、32/162/193/267、32/162/237/265/266、32/162/302、32/302、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、154、154/166、154/166/210/296、154/339、156/210/339、161/162、161/237、162、162/193/232/267/302/360、162/237/265/266/267/302、162/265、162/267/360、166/210、166/296、166/346/347、167/210/346/349、193/267、201/371、210/339、237、237/265、237/266/360、237/360、339和371,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4734编号。
79.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32、32/162、32/162/193、32/162/193/267、32/162/237/265/266、32/162/302、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、53/201/371、82/154/296、154、154/166、154/166/210/296、154/166/346/347、154/166/347、154/167/210/347/349、154/296/347、154/339、154/347、156/166/167、161/162、161/237、162、162/193/232/267/302/360、162/237/265/266/267/302、162/265、162/267/360、163/201、164/275/280、166/210、166/296、166/346/347、193/267、201/371、210/339、237、237/265和339,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:4734编号。
80.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32、32/72/339、32/72/339/360、32/140/141/261/360、32/140/339、32/140/360、32/141/180/244、32/180/261/339、32/244/261、32/339、53/73/75/237/239、69/220、69/339、70、70/72/180/360、70/140/141/339、70/360、72/256/360、72/360、75/237/350、140/141/256/261/339、140/180/244/261/339/360、141/244/261/360、141/244/360、141/256/339/360、141/261/339、141/360、155/220/325/339、180/339、220、220/339、256/360和261,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5052编号。
81.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自32/72/339、32/72/339/360、32/140/141/261/360、32/140/339、32/180/261/339、32/244/261、32/339、53/73/75/237/239、56/75/154/156/192/239/280/282、56/75/192/239、56/192/282/350、65/220/339、69/220、69/339、70/72、70/72/140/244/261/339、70/72/141/244、70/261/339/360、72/180/244/339、72/256/360、72/360、140/141/256/261/339、140/180/244/261/339/360、141/244/360、141/256/339/360、141/261/339、141/360、150/244/261/360、154/156/282/350、155/220/325/339、180/339、220、220/339、244/256/261/339/360、325、325/339和339,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5052编号。
82.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自53、53/237、65/140、65/140/192/193、65/140/192/193/302、65/193、140/192/193/302、140/193/302、180、192/193、239和302,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5152编号。
83.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自48/53/237/239、48/256/261、140、141/261、162、220、220/349、261、302和350,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5252编号。
84.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自65、65/184/187、82/184/220/386、154、154/184、154/187/220/350/386、154/293、154/350、154/386、184/187、184/293、187/220/350、187/293、220、220/293、293、293/350、293/350/386、350和386,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5296编号。
85.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自157、160、186、188、189、190、191、192、193、194、195、196、197、198、199、200、201、202、203、204、206、209、210、211、227、229、230、233、234、235、236、237/381、238、241、242、243、247、253、258、260、267、272、278、282、286、288、290、292、297、298、299、327、331、368、373和381,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5296编号。
86.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自160、186、188、189、190、191、192、193、194、195、196、197、199、200、201、202、203、204、209、210、211、229、230、233、234、235、236、237/381、238、241、243、244、247、253、260、278、286、288、292、297、298、299、327、331、368、373和381,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5296编号。
87.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自26、26/60/200、26/60/200/203/292、26/60/203/229/234/290、26/200/203、26/200/203/229、26/200/290、26/203/234/290/292、60、60/200/203/290、60/203、157/162、157/368、162/242/368、200、200/203/229/234、200/203/290、200/206、200/234/290、200/290/292/360、203、203/229、229/360和360,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5628编号。
88.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自26、26/60/200、26/60/200/203/229/234/267、26/60/200/203/229/267、26/60/200/203/229/267/290、26/60/200/203/234/267、26/60/200/203/292、26/60/200/234/290、26/60/203/229/234/290、26/60/229/267、26/60/290、26/200、26/200/203、26/200/203/229、26/200/290、26/229/234/360、53/157/278/327/331、53/162/327/331/368、60、60/200/203/290、60/200/229/234、60/200/234、60/200/234/267/290/292、60/200/234/290、60/203、157/162、157/162/241/242/260、157/162/241/242/327/331、157/162/241/278/331/368、157/162/241/331、157/162/242/260/331、157/162/331、157/327/331、162/241/278/327/331、162/241/331、162/242/368、200、200/203/229/234、200/203/290、200/206、200/234/290、200/290/292/360、210/211/242、229/360、241/242/368、242/331、260/327、260/331、260/368、331、360和368,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5628编号。
89.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自217、226、239、256、264、273、275、315、325、328、339、342、342/363、344、345、346、350、351、352、353、361、363、364、365、366、367、371、374、376、380、383和388,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQID NO:5628编号。
90.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自113/355、134、169/390、217、226、239、256、264、265、271、275、313、314、315、321、325、328、332、339、342、342/363、344、345、346、348、349、350、351、352、353、354、356、360、361、362、363、364、365、366、367、369、370、371、374、376、377、378、380、382、383、384、385、386、388和391,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5628编号。
91.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/189/297、184/200、184/206/242/290/297、184/211、184/242、184/242/297/368、184/290/297、184/290/368、188/211、188/211/242/290/297/368、192/193/211/242/297/368、192/193/290/297/368、193/194、194、194/242、194/242/290、200、200/203、200/203/290/368、203/206/368、203/242/290/297/368、203/297、206/290、211、211/368、242/290、242/290/297、297和368,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5630编号。
92.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自184、184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/200、184/242、184/242/297/368、184/290/297、184/290/368、188/211/242/290/297/368、189/200、192/193/211/242/297/368、192/193/290/297/368、194/242、200、200/203、200/203/290/368、203/206/368、203/297、206/290、206/297、211/368、242/290、242/290/297、297和368,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5630编号。
93.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自56、57、59、63、65、66、73、128/296、140、144/220、149、151、159、209/211、210/211、219、219/300、230、261、272、273、275、278、292、324、327、331、345、364、371和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5632编号。
94.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自56、57、59、61、65、66、73、74/272、75、79、128、128/296、134、140、144、145、149、151、155、156、157、158、159、200/202/203、209/211、210/211、211、219、219/300、228、230、242、242/244、261、262、270、272、273、275、278、292、319、322、324、327、339、344、345、364、371、373和381,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5632编号。
95.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自65、65/70/155/209/228、65/128/209/371/373、65/151、65/155/209、65/155/209/352/353、65/159、65/209/219/352/353、65/209/352/353/371、65/228/352/353/373、65/228/371/373、65/352/353/371、128/159/209/352/353、128/209、128/209/219、128/209/219/352/353/371、128/209/228/371、128/209/371、128/209/371/373、128/209/373、128/338/352/353/373、151/209、151/209/371、151/209/373、151/228/352/353/373、151/228/373、151/352/353、151/352/353/371/373、155、155/209、155/228/352/353、159/209/352/353、208/209、209、209/219/352/353/371、209/219/371、209/228、209/352/353/371、209/371、209/371/373、209/373、219/228、219/352/353/371/373、219/371/373、228、228/371、228/371/373、228/373、352/353、352/353/371、371、371/373和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ IDNO:5636编号。
96.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自55/65/151、65、65/70/155/209/228、65/70/228/373、65/128、65/128/155/209/371、65/128/159/209/371/373、65/128/209/371、65/128/209/371/373、65/128/219/373、65/128/373、65/151、65/155/209、65/155/209/352/353、65/159、65/209/219/352/353、65/209/352/353/371、65/219/371、65/228/352/353/373、65/228/371、65/228/371/373、65/352/353、65/352/353/371、65/373、70/155/352/353、128、128/155/209、128/159、128/159/209/352/353、128/209、128/209/219、128/209/219/352/353/371、128/209/228/371、128/209/371、128/209/371/373、128/209/373、128/219/352/353、128/219/371/373、128/228/352/353、128/228/371、128/228/373、128/352/353、128/352/353/373、128/371、128/371/373、128/373、151、151/155、151/155/209、151/155/209/219/228/371/373、151/155/209/373、151/155/219/352/353/371、151/155/352/353、151/155/352/353/371/373、151/155/352/353/373、151/209、151/209/371、151/209/371/373、151/209/373、151/219、151/219/371、151/228/352/353/373、151/228/373、151/352/353、151/352/353/371/373、151/371、151/373、155、155/209、155/219、155/228/352/353、155/228/371、155/228/371/373、155/352/353/373、155/371、155/371/373、155/373、159/209/352/353、209、209/219/352/353/371、209/219/371、209/228、209/352/353/371、209/371、209/371/373、209/373、219、219/228、219/352/353/371/373、219/352/353/373、219/371、219/371/373、228/352/353、228/371、228/371/373、228/373、352/353、352/353/371、352/353/373、371、371/373和373,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQ ID NO:5636编号。
97.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶包含与表7.2、8.2、9.2、10.2、11.2、12.2、13.2、14.2、15.2、16.2、17.2、18.2、19.2、20.2、21.2、22.2、23.2、24.2、25.2、26.2、27.2、28.2、29.2、30.2、31.2、32.2、33.2、34.2、35.2、36.2、37.2、38.2、39.2、40.2、41.2、42.2、43.2、44.2、45.2、46.2、47.2、48.2、49.2、50.2、51.2、52.2、53.2、54.2、55.2、56.2、57.2、58.2、59.2、60.2、61.2、62.2、63.2、64.2、65.2、66.2、74.2、75.2、76.2、77.2、78.2、79.2、80.2、81.2、82.2、83.2、84.2、85.2、86.2、87.2、88.2、89.2、90.2、91.2、92.2、93.2、94.2、95.2、96.2、97.2、98.2、99.2、100.2、101.2、102.2、103.2、104.2、105.2、106.2、107.2和108.2中列出的至少一种工程化末端脱氧核苷酸转移酶变体的序列至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。
98.一种工程化末端脱氧核苷酸转移酶,包含与SEQ ID NO:2-3592和3698-6766的参考序列或其功能片段具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的多肽序列,其中所述工程化末端脱氧核苷酸转移酶在其多肽序列中包含至少一个残基差异或残基差异集,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号。
99.一种工程化末端脱氧核苷酸转移酶,包含选自SEQ ID NO:2-3592和3698-6766的偶数编号序列的多肽序列。
100.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自8、9、10、11、12、14、15、16、17、18、19、20、21、22、23、24、26、27、28、29、30、32、34、36、38、40、42、44、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、77、78、79、80、82、84、85、86、87、89、91、92、93、94、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、115、116、117、118、119、120、122、123、124、125、127、131、133、134、135、136、140、141、143、144、145、147、148、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、170、173、174、175、176、177、180、181、182、184、185、186、187、189、190、192、193、194、196、197、198、200、201、202、203、204、205、206、207、209、210、211、217、219、220、224、226、228、229、230、231、232、233、234、235、236、237、238、239、241、242、243、244、245、246、248、249、250、252、253、256、257、258、259、260、261、262、263、264、265、266、267、268、269、270、271、272、273、274、275、276、277、278、279、280、282、284、286、287、288、289、290、291、292、293、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、315、319、321、322、323、324、325、326、327、328、329、330、332、338、339、340、341、342、344、345、346、347、349、350、351、352、353、355、358、360、361、364、365、366、367、368、369、370、371、372、373、374、376、377、378、380、383、384、386、387、388和390,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号。
101.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自8、9、9/11、9/14/190/197/364、9/14/58、9/14/58/182/190/197/298、9/28/156/158/173/190/193/303/364、9/28/156/158/290/364、9/28/190/193/303/364、9/28/290/303/364、9/58/197、9/156/158/193/290/303/364、9/156/364、9/290/364、9/298、9/302、9/364、10、10/14/197/364、11、12、14、14/15/200/230、14/15/77/200/226/230、14/15/77/78、14/15/77/78/200/201/226/230/290、14/15/77/78/200/203/230/290、14/15/77/78/203/226/230/290、14/15/78、14/15/78/226/230、14/28/224/296/298、14/28/58/162/190/193/224、14/28/58/224、14/28/58/84/173/297、14/58/147/162/190/193/224/296/303、14/58/158/224、14/58/162、14/58/182/197/298/364、14/58/84/147/162/224/296/297/298/299、14/58/84/147/162/224/296/297/299、14/58/84/224/298、14/77/201/230、14/77/78/200/226/230/257、14/77/78/226/230/257、14/78/200/201/226/290、14/78/200/201/339、14/78/200/226/230/339、14/78/200/226/290/339、14/78/200/230/339、14/84/147/193/197/224/296、14/84/162/224/297/299、14/84/224/296/299、14/147、14/147/158/162/224、14/147/173、14/147/224、14/158/162/197/224/296/298/299、14/162/224/298/299、14/173/193/197/296/297/298/299、14/190/197/298、14/193/197/224/297/298/299/300、14/197/298/364、14/200/203/226/230、14/200/203/226/230/257/339、14/200/203/230/339、14/201/203/226、14/224/296/298、14/224/296/303、14/298/364、15、15/77、15/77/200/201/203/226/230/290/339、15/77/200/230、15/77/200/230/290/339、15/77/201/226/230/339、15/77/226/230/290/339、15/77/78、15/77/78/200/201/203/226/230、15/78/201、15/78/201/203/230、15/78/201/230/290、15/78/203/226/230、15/200、15/201/203/226/230/257/339、15/226/230/339、15/230、16、17、18、18/28/147/303、19、20、20/21、20/21/103/233、20/21/111、20/21/111/157/315、20/21/111/160/200、20/21/111/200/238、20/21/111/246、20/21/180/297、20/21/233、20/21/315、20/21/52/67/68/87/111/157/160/173/180/200/235/246/315、20/21/55/67/68/87/111/157/160/180/181/200/235/246/256/315/350、20/21/55/67/68/87/111/157/160/180/200/246/256/315、20/21/60/72/160/180/200/246/259/338/358、20/21/67、20/21/67/160、20/21/67/68/87/111/157/160/180/200/235/246/315、20/21/67/68/87/111/157/160/180/200/246/315、20/21/67/87、20/21/67/87/111、20/21/67/87/111/200、20/21/67/87/111/315、20/21/67/87/157/180、20/21/67/87/246/315、20/21/68/103/200/238/297、20/21/68/111/235、20/21/68/160、20/21/68/160/180/200/246、20/21/68/160/246、20/21/68/180、20/21/68/180/235、20/21/68/200/235/297、20/21/68/233/246/297、20/21/87/111/246/315、20/21/87/157/200、20/21/87/180/246/315、20/21/87/315、20/67/87/111/180、20/67/87/157/160/180/315、20/68/103/160/200、20/68/103/180/200、20/68/111/157/160、20/68/160、20/68/160/180、20/68/160/180/233/235/246、20/68/160/200/246、20/68/160/235/297、20/68/160/246、20/68/200/238/246、20/68/235/297、20/87/111/180、20/87/157/160、20/100、20/100/104/111/242、20/100/104/120/197/367、20/100/104/197/203/242/292、20/100/104/203/350/353、20/100/111、20/100/120/197/232/235/315/366/367、20/100/197/292/315、20/100/203、20/100/232/292/366/367、20/100/235/315/367、20/103/160/180/200/235、20/103/233、20/104/111/120/203、20/111、20/111/180/235/246/297、20/120/197/292、20/120/235、20/160/315、20/200、20/292、21、21/67/180/315、21/67/200、21/67/87/111/200、21/67/87/157/246、21/68、21/68/103/111、21/68/111/200、21/68/160/180/200/205/297、21/68/160/180/200/297、21/68/160/238、21/68/160/238/246、21/68/180、21/68/180/235、21/68/180/246、21/68/200、21/68/235、21/87/157/160、21/87/160/200/315、21/87/160/315、21/87/200、21/87/246/315、21/103/233、21/111、21/157/160、21/160/315、21/200/315、21/233/297、21/246、22、23、23/28/156/158/190/193/290/364、23/186/256/309、24、26、26/60/200、26/60/200/203/229/234/267、26/60/200/203/229/267、26/60/200/203/229/267/290、26/60/200/203/234/267、26/60/200/203/292、26/60/200/234/290、26/60/203/229/234/290、26/60/229/267、26/60/29026/200、26/200/203、26/200/203/229、26/200/290、26/203/234/290/292、26/229/234/360、27、28、29、29/77/104/234/271、29/77/104/234/271/279/380、29/77/182/207/271、29/77/207/234/279/380、29/77/234/271/279/368、29/77/271、29/98/143/266、29/98/185/197/266、29/98/185/266/296/299、29/104/234/271/279/380、29/143、29/143/162、29/143/170/193/197/266、29/143/185/193/266、29/158/266、29/170/185/193/266/299、29/182/207/380、29/182/234/271/380、29/182/271/279/380、29/185/296、29/193/197/296/297、29/234/279/380、29/271/279、29/271/279/368/380、30、32、32/72/339、32/72/339/360、32/78/106/200/226/272/373、32/78/106/200/226/373、32/78/106/226、32/78/200/226、32/78/200/226/235/272、32/78/200/226/235/321/373、32/78/226、32/78/226/321、32/78/226/373、32/103、32/103/106/111/322/324、32/103/106/207/210/235/321/368、32/103/207/210/344/349、32/103/207/228/232/373、32/103/207/321/344、32/103/210/273/321/373、32/103/273、32/103/321/344、32/106、32/106/200/226、32/106/200/226/235/373、32/106/207/210/232、32/106/210、32/106/210/373、32/106/235/321、32/106/235/368、32/106/273/321/373、32/106/280、32/111/235、32/111/235/271/272/339、32/111/235/339、32/111/235/339/386、32/111/235/386、32/140/141/261/360、32/140/339、32/140/360、32/141/180/244、32/161/193/237/360、32/162、32/162/193、32/162/193/267、32/162/237/265/266、32/162/302、32/180/261/339、32/200/226、32/200/226/321/373、32/207/210/273、32/207/210/279、32/207/210/368/373、32/207/235、32/207/273/279/321、32/207/279、32/207/344、32/210/232/235/368、32/210/232/273/321、32/210/232/273/368/373、32/210/273、32/226、32/235、32/235/271/339、32/235/272、32/235/272/339、32/235/272/386、32/235/273、32/235/339/386、32/235/386、32/244/261、32/271/339、32/272、32/273/279/344/349、32/273/344/373、32/279、32/279/321、32/302、32/321/324/360、32/322/324/383/386、32/324、32/339、34、34/48/133/158/182/230/233/271/345、34/48/147、34/48/147/158/182/220/233/307、34/48/147/182/230/233/249/307、34/48/147/271、34/48/182/233/249、34/48/339、34/48/78/133/147/182、34/48/78/147/158、34/48/78/147/182/220/233/249/307/315/339、34/48/78/158/182/220/249/307、34/48/78/158/182/233/315/345、34/48/78/182/220/230/315、34/48/78/182/220/233、34/78、34/78/147/182/220/249、34/78/147/182/233/249/315、34/78/147/182/233/271/339、34/78/158、34/78/158/182/315/345、34/78/158/249、34/78/182/233/307、34/78/204/220/339、34/78/220/271、34/78/220/307/339、34/78/315、34/78/84/147/158/182/220、34/78/84/158/230、34/133/147/158/230/233/249、34/147、34/147/155/233/339、34/147/158、34/147/158/182/233、34/147/158/182/249/271、34/147/182、34/147/182/220、34/147/182/220/230/249/315/339、34/147/182/220/230/339、34/147/182/220/271/315、34/147/182/233/271/339、34/147/182/249/307/315/339、34/147/182/315、34/147/182/345、34/147/220/271、34/147/230/273/315/345、34/147/233、34/147/249、34/147/315/339、34/158/182/315/339/345、34/158/220、34/158/307、34/182、34/182/230/315、34/182/307/339、34/182/345、34/220、34/220/307、34/220/307/345、34/220/315/339、34/220/339、34/233、34/271/339、34/315/345、34/339、36、38、40、42、44、44/193、47、48、48/53/237/239、48/78/147/158/182/220/230/307、48/78/147/158/182/230/249/271/315、48/78/147/158/233/249、48/78/147/182/220/233/249/339/345、48/78/147/182/220/315、48/78/147/182/230/233/249、48/78/158/182/220/233/249、48/78/158/230/339、48/78/233/315/339、48/147/158/182/220/230/249/271/307/315/339、48/147/158/182/220/249/307/339、48/147/158/182/220/315、48/147/158/182/230/233、48/147/158/182/233/345、48/147/158/233、48/147/158/307/345、48/147/233、48/147/233/345、48/147/271/307/339、48/158/182/230/233/249、48/182、48/182/307/315、48/256/261、48/339、49、50、51、52、52/55/106/256、52/55/181/235/256、52/55/181/256、52/99/181/235、52/106/181/235/256、52/106/235/256、52/106/256、52/173/235、52/180、52/180/200/235/315/349、52/180/200/349、52/180/349、52/200、52/200/315、52/200/349、52/200/349/350、52/235、52/235/256、52/315、52/315/349、52/349、52/349/350、53、53/73/75/237/239、53/157/278/327/331、53/162/327/331/368、53/163/201/325/329、53/200/201/325/329、53/201、53/201/275/280、53/201/371、53/219/358、53/237、54、55、55/58、55/58/256、55/58/256/350/373、55/58/256/355、55/58/350/351、55/58/69/350/351、55/58/99/256/351/373、55/58/99/256/355、55/58/99/351、55/67、55/67/106/111/157、55/67/106/315、55/67/111、55/67/111/315、55/67/315、55/67/87、55/67/87/106/111/315、55/67/87/157/315、55/80/174/268/355/366、55/80/268/315/366、55/80/268/346、55/87、55/87/106、55/87/106/111/315、55/87/106/315、55/87/157、55/87/157/207、55/99/103、55/99/181/256、55/99/219/358/373、55/99/256/350、55/103/181、55/103/219、55/103/338、55/106/111、55/106/157、55/111、55/111/156/268/315/324/327/366/373、55/111/268/346/355、55/111/268/355/366、55/111/315、55/111/315/355/373、55/157、55/181/219、55/181/235/256/350、55/181/246、55/181/358、55/219/246/358、55/219/256/338、55/256、55/256/259、55/268、55/268/315/346、55/268/324/366、55/268/346/355、55/315、56、56/75/154/156/192/239/280/282、56/75/192/239、56/192/282/350、57、57/367、58、58/69/256/373、58/72/211/315、58/72/220/224、58/84/211/220/224、58/99、58/99/351/355、58/99/355、58/147/162/197/224/296/297/298/299、58/147/162/296/298、58/162/224/296/298、58/186/270、58/197、58/197/364、58/224、58/224/299、58/256、58/256/350/355、58/350/355、58/364、59、59/62/63/68、59/62/63/68/103/234、59/62/63/68/147、60、60/62/68/91/111/234/289、60/106/111/235/360、60/200/203/290、60/200/229/234、60/200/234、60/200/234/267/290/292、60/200/234/290、60/203、60/259、60/278、60/280/360、61、62、62/63/68、62/63/68/91/109/210、62/63/68/91/147/205/210/234、62/66/100/101/104/203/235/338、62/66/69/143/338/353、62/68/103、62/68/111、62/68/91/111/289、62/69/100/235/268/346、62/69/353、62/69/80/101/104/143/235/338、62/111/235/315/355、62/111/235/324/346、62/203/211/235/338/350、62/235/268/327/346/350/353/355、62/235/346/350/355、62/315/327/353、62/323/346/353/355、63、64、65、65/70/155/209/228、65/128/209/371/373、65/140、65/140/192/193、65/140/192/193/302、65/151、65/155/209、65/155/209/352/353、65/159、65/184/187、65/193、65/209/219/352/353、65/209/352/353/371、65/220/339、65/228/352/353/373、65/228/371/373、65/259、65/352/353/371、66、66/69/143/235/338、66/100/235/315/327/353/355、66/111/346/353/355、66/220/224、66/235/268/346、66/235/346、66/235/373、67、67/87、67/87/106/157、67/87/111/157/160/315、67/87/111/157/315、67/87/157、67/87/315、67/106、67/106/111、67/106/111/315、67/106/157、67/111、67/111/315、67/157、67/157/160/180、67/157/160/315、67/157/315、67/160、67/180/200、67/180/200/315、67/315、68、68/87、68/103/160/235、68/103/200/235/246/297、68/106/200、68/106/321/322、68/111/200/238、68/111/233/236/297、68/118、68/157/160/200/315、68/160/233/246、68/200、68/200/235/297、68/200/270/321、68/270/321/322、68/344、68/344/383、69、69/80/203/211/278/338、69/100、69/100/111/298/353/355、69/100/235、69/100/353/366、69/111/235、69/111/235/300/353/355、69/111/235/315、69/220、69/235/315、69/235/353、69/268、69/268/324/327/353/355、69/268/346、69/268/346/353、69/315/353、69/324/327/346、69/324/346/350、69/324/353、69/339、69/353/355、70、70/71、70/71/353、70/72、70/72/140/244/261/339、70/72/141/244、70/72/180/360、70/134/353、70/140/141/339、70/261/339/360、70/353、70/360、71、71/77/133/353、71/77/353、71/353、72、72/74/200/272/339/347、72/84/220/224/315、72/84/86/224、72/86/220、72/180/244/339、72/220/224、72/220/315、72/256/360、72/360、73、74、74/106/270/344、74/200/339、74/272、75、75/207/373/378、75/233/344、75/233/366、75/237/350、77、77/78/200/226/339、77/78/201/226/257/339、77/78/203、77/78/203/230/339、77/133/353、77/134/353、77/182/279/380、77/182/368、77/200/201、77/200/201/226/230/339、77/200/203/230/257/339、77/200/230、77/234/271/279/380、77/353、78、78/106、78/106/226/321/373、78/106/235/321/373、78/127、78/133/147/158/182/220/271/339、78/135/182/233/249/315/345、78/147/158/182、78/147/158/182/230/249、78/147/158/182/233/271/307/345、78/147/158/182/339/345、78/147/158/220/230/233/249/271/307/315/345、78/147/158/249/307/315、78/147/182/230/233/249、78/147/182/249/307、78/147/182/339/345、78/147/230/307、78/147/233、78/147/249/271/339、78/158/182、78/158/182/233/271/315、78/158/182/307/315/345、78/182/220/339、78/182/271/315/339、78/200/226/321/373、78/200/230、78/203/230/290、78/226/230、78/226/290、78/226/321、78/233、78/339、79、80、80/111/268/324/327/346/366/373、80/111/355/366、80/143/203/211/338、80/268/315/346/355、80/268/327/346/366、80/268/346、80/315/346/364/373、80/346/366、82、82/154/296、82/184/220/386、84、84/92/173、84/147、84/147/197/296/297、84/147/297/298/303、84/156/173/204、84/173/204/303、84/173/224、84/220/315、84/224/297/298/299、85、86、87、87/106、87/106/111/315、87/111、87/111/157/315、87/111/200、87/111/200/246、87/157、87/157/180/200、87/157/315、87/315、89、91、91/109/111、91/109/147/205/210/234、92、92/173/204/290/303、93、94、96、97、98、98/143/158/170/185/296/297、98/143/162/266、98/143/185/266、98/162/193、98/170/193/197、98/185、98/185/193/197/266/297、99、99/103/219、99/235、99/256/351/355、100、100/101/211/278/338/350/353、100/111、100/111/353、100/120/197/242、100/235/268/315/346、100/235/268/346/355、100/235/268/366/373、100/235/346/350/353、100/268/346、100/268/366、101、102、103、103/106/207/321、103/106/210、103/106/360、103/111/235/280/360、103/111/235/321/324、103/160/180、103/160/297、103/207/210/235/321、103/210/232/235、103/219/256、103/219/338/358、103/232/273、103/233、103/256、103/259、103/324、104、104/106、104/106/111/200/201/235/268/368、104/106/111/200/201/268、104/106/111/201/235/368、104/106/200/201/268、104/120/232/353、104/182、104/200/207/237/344/373/387、104/207/344/387、105、106、106/111、106/111/157、106/111/200/201、106/111/200/201/268/368、106/111/200/235/368、106/111/201、106/111/201/368、106/111/322/324/386、106/111/322/383/386、106/173/200/235/315、106/173/388、106/182/203/226/235/342/346、106/200/201、106/200/201/209/368、106/200/201/235、106/200/201/368、106/200/226/373、106/200/321/322/383、106/201/235、106/201/268、106/207/210/232/235/321/368/373、106/207/235/321/368、106/226/235/373、106/235、106/235/273/373、106/235/383/386、106/270/344、106/273、106/315、106/324、107、108、109、109/111/205/210/234/289、110、111、111/157/180/200/315、111/160/233/235/297、111/173、111/173/235/315、111/197/242、111/200/201/268、111/200/368、111/226、111/226/321/344/346/369/387、111/235、111/235/268/327/346、111/235/268/346、111/235/271/339、111/235/272/339/386、111/235/280、111/235/339、111/235/346/350、111/268、111/272/339/386、111/322/360、111/327、111/346、112、113、113/355、115、116、117、118、119、120、122、123、124、125、128、128/159/209/352/353、128/209、128/209/2、128/209/219、128/209/219/352/353/371、128/296、131、133、133/135/307/315、133/220/233/271、133/307、134、134/353、135、136、140、140/141/256/261/339、140/180/244/261/339/360、140/192/193/302、140/193/302、141、141/244/261/360、141/244/360、141/256/339/360、141/261、141/261/339、141/360、143、143/158/197/266、143/266/296/297、144、144/220、145、147、147/158/162/190/224/296/297/299/303、147/158/182/220/233、147/158/182/230/233/249/271/339、147/158/182/233/249、147/158/182/233/271/307/339、147/158/182/233/307/339、147/158/182/233/315/345、147/158/182/271/315、147/158/182/315、147/158/220/230/233/249/345、147/158/220/249/315、147/158/233/249、147/182/220/233/345、147/182/230/307/315/339、147/182/233、147/182/233/249、147/182/249/271/307、147/182/345、147/210/234、147/220、147/224、147/224/297/298、147/232/233/271/315/339、147/233/345、147/249、147/290/303/307、147/339、148、149、150/244/261/360、151、153、154、154/156/282/350、154/166、154/166/210/296、154/166/346/347、154/166/347、154/167/210/347/349、154/184、154/187/220/350/386、154/293、154/296/347、154/339、154/347、154/350、154/386、155、155/220/325/339、156、156/158/190/193/364、156/166/167、156/210/339、157、157/160、157/162、157/162/241/242/260、157/162/241/242/327/331、157/162/241/278/331/368、157/162/241/331、157/162/242/260/331、157/162/331、157/315、157/327/331、157/368、158、158/182/220/230/249/307/339、158/193/290/303、158/233、158/307、158/315、158/315/339、159、160、160/296、161、161/162、161/237、162、162/193/232/267/302/360、162/224、162/237/265/266/267/302、162/241/278/327/331、162/241/331、162/242/368、162/265、162/267/360、162/367/371、163、163/201、164、164/275/280、165、166、166/210、166/296、166/346/347、167、167/210/346/349、168、169/390、170、170/193/197、173、173/204、173/204/303、173/297、174、175、176、177、180、180/339、181、182、182/186/256/360、182/197、182/201/203/226/234/235/346、182/201/203/226/234/342/346、182/201/203/226/235、182/201/203/226/235/346、182/201/203/226/342/346、182/201/203/268/346、182/201/226/234/342/346、182/201/226/235/346、182/201/226/268/346、182/201/342、182/203/226、182/207/279/368、182/220/345、182/226/234/268/342/346、182/226/234/346、182/226/235、182/226/235/268/346、182/226/235/342、182/226/235/346、182/226/268/342/346、182/226/342、182/226/346、182/230、182/230/233、182/234/380、182/256、182/279/368/380、182/298/364、182/342/346、182/345、184、184/187、184/188/200/203/211/242、184/188/200/203/242/297、184/188/200/203/290/297/368、184/188/203/290/297、184/188/211/242/290/368、184/189、184/189/206/297/368、184/189/297、184/200、184/206/242/290/297、184/211、184/242、184/242/297/368、184/290/297、184/290/368、184/293、185、186、186/256、186/256/270、187、187/220/350、187/293、188、188/211、188/211/242/290/297/368、189、189/200、190、190/193/197、191、192、192/193、192/193/211/242/297/368、192/193/290/297/368、193、193/194、193/197/296/303、193/267、193/290、194、194/242、194/242/290、195、196、197、197/298、198、198/289、199、200、200/202/203、200/203、200/203/226/230/339、200/203/229/234、200/203/290、200/203/290/368、200/206、200/226、200/226/321/373、200/226/373、200/230/257、200/234/290、200/235/368、200/270、200/270/275/339、200/270/322/383、200/271、200/290/292/360、200/344、200/368、201、201/202、201/202/272/360、201/203、201/203/226/234、201/203/226/234/342/346、201/203/226/234/346、201/203/226/268/342、201/203/226/346、201/203/268/342、201/203/268/346、201/226/234/342/346、201/226/234/346、201/226/235/342、201/226/268/346、201/226/346、201/230/257、201/230/290、201/235/268/342/346、201/368、201/371、202、202/233、202/235/360/367/371、203、203/206/368、203/226、203/226/230、203/226/230/257、203/226/234/235、203/226/234/235/346、203/226/235/268/346、203/226/235/342、203/226/235/346、203/226/342/346、203/226/346、203/229、203/242/290/297/368、203/297、204、204/264/340、205、206、206/290、206/297、207、207/210/273/279/344、207/210/273/279/344/349/373、207/210/273/321/344/349、207/233/237/344/387、207/235、207/235/327/360/371、207/235/368、207/271/368/380、207/273、207/279/349、207/368/373、207/373、207/380、207/387、209、209/211、210、210/211、210/211/242、210/273/279、210/273/279/349、210/279、210/339、211、211/368、217、219、219/300、219/358、220、220/224/315、220/249、220/293、220/307/339、220/315、220/339、220/349、224、224/296/298、224/297/299、224/298/299、226、226/234/235/346、226/234/342、226/235/268、226/235/268/342/346、226/235/268/346、226/235/272/373、226/235/342、226/235/346、226/268、226/268/342、226/268/342/346、226/268/346、226/272/373、226/321/369、226/342、226/342/346、226/346、226/366、226/366/369/387、227、228、229、229/325、229/360、230、231、232、232/235、232/235/273/368、232/235/321、232/346/350/355、233、233/271、233/315、233/367/371、233/371、234、235、235/268/327/346、235/268/346、235/271/272/339、235/271/272/339/386、235/271/339、235/271/339/386、235/272、235/272/339、235/272/386、235/273、235/280、235/280/321/322/324、235/280/321/324/383/386、235/315、235/315/353/355、235/339、235/339/386、235/346、235/346/350、235/353、235/353/355、236、237、237/265、237/266/360、237/271、237/360、237/381、238、239、241、241/242/368、242、242/244、242/290、242/290/297、242/331、243、244、244/256/261/339/360、245、246、247、248、249、249/315/339、250、252、253、256、256/259、256/360、257、258、259、259/276/387、260、260/327、260/331、260/368、261、262、262/325/349、263、264、265、265/346、266、266/297/299、267、267/270/275/339/347、267/272/275、268、268/315/327/346、268/315/346、268/315/346/366、268/315/355、268/324、268/324/327/346、268/327/346、268/346、268/346/350/353/355、268/346/355、268/353、268/355/366、269、270、270/309、270/322/344/383、271、271/339、271/380、272、273、273/279、273/279/373、274、275、275/291、276、277、278、279、280、280/383、282、284、286、287、288、289、290、290/303/364、291、292、293、293/350、293/350/386、294、295、296、297、298、299、300、301、302、303、304、305、306、307、308、309、310、311、313、314、315、315/324/327/355/366、315/327/346、319、321、321/324、322、324、324/327/346、324/346/350、324/346/355/366、324/355、325、325/339、326、327、327/346、328、330、331、332、338、339、341、342、342/363、344、344/370、345、346、347、348、349、350、351、352、353、353/355、355/373、354、355、356、358、360、360/383、361、362、363、364、365、366、367、367/371、368、369、370、371、372、373、374、376、377、378、380、381、382、383、384、385、386、387、388、390和391,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号。
102.根据权利要求1-101中任一项所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶具有末端脱氧核苷酸转移酶活性。
103.根据权利要求1-102中任一项所述的工程化末端脱氧核苷酸转移酶,与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶具有至少一种改进的性质。
104.根据权利要求103所述的工程化末端脱氧核苷酸转移酶,与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶具有至少一种改进的性质,其中所述改进的性质选自增加的热稳定性、增加的在高温的活性、增加的可溶性表达、减少的副产物形成和增加的底物向产物的转化。
105.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶包含增加的可溶性表达。
106.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶包含增加的在高温的活性。
107.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶包含减少的副产物形成。
108.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶包含增加的底物向产物的转化。
109.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中与野生型末端脱氧核苷酸转移酶或参考工程化末端脱氧核苷酸转移酶相比,所述工程化末端脱氧核苷酸转移酶包含增加的热稳定性。
110.根据权利要求109所述的工程化末端脱氧核苷酸转移酶,其中与参考末端脱氧核苷酸转移酶相比,所述改进的性质是增加2倍、5倍、10倍、15倍或更多的热稳定性。
111.根据权利要求106所述的工程化末端脱氧核苷酸转移酶,其中与参考末端脱氧核苷酸转移酶相比,所述改进的性质是工程化TdT在40℃、45℃、50℃、55℃、60℃、65℃、70℃或75℃增加2倍、5倍、10倍、15倍或更多的活性。
112.根据权利要求105和109-111中任一项所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶包含在选自80、87、203、111、143、147、157、160、180、203、209、226、256、261、266、279、327、339、349、353和364的氨基酸位置处的至少一个残基差异。
113.根据权利要求112所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶包含选自80S、87S、103P、111V、143A、147Y、157A、157V、160S、180A、203D、209E、226L、256G、261R、266G、279H、327F、339M、349E、353N和364L的至少一个残基差异。
114.根据权利要求104所述的工程化末端脱氧核苷酸转移酶,其中所述改进的性质是工程化TdT将底物转化为产物的比率增加至5%、20%、30%、40%、50%、60%、70%、80%、90%、95%或更多。
115.根据权利要求107、108和114中任一项所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶包含在选自53、65、68、159、211、217、224、271、272、273、275、278、331、341和391的氨基酸位置处的至少一个残基差异。
116.根据权利要求115所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶包含选自53T、65L、68R、159R、211V、217R、224V、271H、271P、272A、273P、275Q、278G、331K、341R和391L的至少一个残基差异。
117.根据权利要求1所述的工程化末端脱氧核苷酸转移酶,其中所述至少一个残基差异或残基差异集包括选自53、65、68、80、87、111、143、147、157,159、160、180、203、209、211、217、224、226、256、261、266、271、272、273、275、278、279、327、331、339、341、349、364和391,和/或其任何组合的氨基酸位置处的残基差异或残基差异集,其中所述氨基酸位置参考SEQID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636编号。
118.根据权利要求1-117中任一项所述的工程化末端脱氧核苷酸转移酶,其中所述工程化末端脱氧核苷酸转移酶是纯化的。
119.一种多核苷酸序列,所述多核苷酸序列编码至少一种根据权利要求1-118中任一项所述的工程化末端脱氧核苷酸转移酶。
120.一种多核苷酸序列,所述多核苷酸序列包含与SEQ ID NO:1、3、579、691、881、913、1033、1269、1343、1345、1677、1699、1749、1931、2163、2665、2793、2977、3073、3301、3397、3487、3957、3787、4123、4425、4733、5051、5151、5251、5295、5627、5629、5631和/或5635的参考序列,和/或其功能片段的至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述多核苷酸序列编码包含在一个或更多个氨基酸位置处的至少一个残基差异的工程化多肽。
121.根据权利要求119所述的多核苷酸序列,其中所述多核苷酸序列编码至少一种工程化末端脱氧核苷酸转移酶,所述工程化末端脱氧核苷酸转移酶包含与SEQ ID NO:2、4、580、692、882、914、1034、1270、1344、1346、1678、1700、1750、1932、2164、2666、2794、2978、3074、3302、3398、3488、3958、3788、4124、4226、4734、5052、5152、5252、5296、5628、5630、5632和/或5636的参考序列具有至少60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的序列。
122.根据权利要求121所述的多核苷酸序列,其中所述序列包含SEQ ID NO:1、3、579、691、881、913、1033、1269、1343、1345、1677、1699、1749、1931、2163、2665、2793、2977、3073、3301、3397、3487、3957、3787、4123、4425、4733、5051、5151、5251、5295、5627、5629、5631和/或5635。
123.根据权利要求119所述的多核苷酸序列,其中所述多核苷酸序列可操作地连接到控制序列。
124.根据权利要求123所述的多核苷酸序列,其中所述多核苷酸序列是密码子优化的。
125.一种表达载体,所述表达载体包含至少一种根据权利要求119所述的多核苷酸序列。
126.一种宿主细胞,所述宿主细胞用至少一种根据权利要求125所述的表达载体转化。
127.一种在宿主细胞中产生工程化末端脱氧核苷酸转移酶多肽的方法,包括在合适的培养条件下培养根据权利要求126所述的宿主细胞,使得产生至少一种工程化末端脱氧核苷酸转移酶。
128.根据权利要求127所述的方法,还包括从培养物和/或宿主细胞回收至少一种工程化末端脱氧核苷酸转移酶。
129.根据权利要求127或权利要求128所述的方法,还包括纯化所述至少一种工程化末端脱氧核苷酸转移酶的步骤。
130.一种组合物,包含至少一种根据权利要求1-118中任一项所述的工程化末端脱氧核苷酸转移酶。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US63/256,353 | 2021-10-15 | ||
US202263329777P | 2022-04-11 | 2022-04-11 | |
US63/329,777 | 2022-04-11 | ||
PCT/US2022/078071 WO2023069865A1 (en) | 2021-10-15 | 2022-10-13 | Engineered terminal deoxynucleotidyl transferase variants |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118284690A true CN118284690A (zh) | 2024-07-02 |
Family
ID=91636372
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202280069586.XA Pending CN118284690A (zh) | 2021-10-15 | 2022-10-13 | 工程化末端脱氧核苷酸转移酶变体 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118284690A (zh) |
-
2022
- 2022-10-13 CN CN202280069586.XA patent/CN118284690A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104428313B (zh) | 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法 | |
CN109715817B (zh) | 用于化合物的羟基化的生物催化剂和方法 | |
CN109863162B (zh) | 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 | |
CN114127272A (zh) | 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 | |
US20230183663A1 (en) | Engineered terminal deoxynucleotidyl transferase variants | |
CN118284690A (zh) | 工程化末端脱氧核苷酸转移酶变体 | |
JP2023502779A (ja) | 化合物のヒドロキシル化のための生体触媒および方法 | |
JP6486835B2 (ja) | カルバペネム合成に有用な人口生体触媒 | |
JP2024538095A (ja) | 操作された末端デオキシヌクレオチジルトランスフェラーゼバリアント | |
US20240209408A1 (en) | Engineered 3-o-kinase variants and methods of use | |
WO2024081770A2 (en) | Engineered terminal deoxynucleotidyl transferase variants | |
CN118369421A (zh) | 工程化苏氨酸醛缩酶和氨基酸脱羧酶 | |
WO2023150568A2 (en) | Engineered enone reductase and ketoreductase variant enzymes | |
WO2023240083A2 (en) | Engineered nitroaldolases | |
JP2022518212A (ja) | 操作されたトランスアミナーゼポリペプチド | |
CA3137734A1 (en) | Engineered glucose dehydrogenases and methods for the reductive amination of ketone and amine compounds |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |